JPWO2010032419A1 - 画像復号装置、画像符号化装置、画像復号方法、画像符号化方法およびプログラム - Google Patents

画像復号装置、画像符号化装置、画像復号方法、画像符号化方法およびプログラム Download PDF

Info

Publication number
JPWO2010032419A1
JPWO2010032419A1 JP2010503295A JP2010503295A JPWO2010032419A1 JP WO2010032419 A1 JPWO2010032419 A1 JP WO2010032419A1 JP 2010503295 A JP2010503295 A JP 2010503295A JP 2010503295 A JP2010503295 A JP 2010503295A JP WO2010032419 A1 JPWO2010032419 A1 JP WO2010032419A1
Authority
JP
Japan
Prior art keywords
view
decoding
image
views
frame
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2010503295A
Other languages
English (en)
Other versions
JP5568465B2 (ja
Inventor
遠間 正真
正真 遠間
西 孝啓
孝啓 西
泰治 佐々木
泰治 佐々木
洋 矢羽田
洋 矢羽田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Priority to JP2010503295A priority Critical patent/JP5568465B2/ja
Publication of JPWO2010032419A1 publication Critical patent/JPWO2010032419A1/ja
Application granted granted Critical
Publication of JP5568465B2 publication Critical patent/JP5568465B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • H04N19/423Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation characterised by memory arrangements
    • H04N19/426Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation characterised by memory arrangements using memory downsizing methods
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/597Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • H04N19/423Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation characterised by memory arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • H04N19/423Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation characterised by memory arrangements
    • H04N19/426Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation characterised by memory arrangements using memory downsizing methods
    • H04N19/427Display on the fly, e.g. simultaneous writing to and reading from decoding memory
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/44Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Television Signal Processing For Recording (AREA)
  • Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)

Abstract

復号が瞬時に完了されない場合であっても、ビュー間予測を用いて符号化された複数のビューを復号することができる画像復号装置を提供する。画像復号装置は、符号化された第1ビュー、および、第1ビューを参照して符号化された第2ビューを復号する復号処理部(100)と、復号処理部(100)の前段に配置されたバッファメモリ(900)とを備え、復号処理部(100)は、第1ビューおよび第2ビューに付与された復号時刻が同一の場合において、第2ビューに付与された復号時刻に第1ビューのピクチャの復号が完了するまでに要する遅延時間を加算して得られた時刻に第2ビューのピクチャを復号する。

Description

本発明は、ビュー間予測を用いて符号化された映像を復号する画像復号装置、ビュー間予測を用いて映像を符号化する画像符号化装置に関する。
映画作品などの動画コンテンツを頒布するには、DVDおよびBlu−ray Disc等の光ディスクが広く用いられている。特にBlu−ray Discは、これまでのDVDがSD(Standard Definition)であるのに対して、最大1920x1080であるHD(High Definition)まで扱えるため、より高画質の映像を格納することができる。光ディスクには、これまで通常の2D(2次元)映像が格納されてきたが、近年では立体表示を行える3D(3次元)映像を楽しめる映画館が増加していることに伴い、3D映像を高画質のまま光ディスクに格納することが求められてきている。
3D映像が格納された光ディスクは、2D映像が格納された光ディスクのみを再生できる再生装置(以下、「2D再生装置」と呼ぶ。)との再生互換性が求められる。3D映像が格納された光ディスクを、2D再生装置が2D映像として再生できない場合、同じコンテンツに対して「3D映像用光ディスク」と「2D映像用光ディスク」の2種類を製作する必要があり、コスト高になってしまう。よって、3D映像が格納された光ディスクは、2D再生装置では2D映像として再生し、2D映像と3D映像を再生できる再生装置(以下、「2D/3D再生装置」と呼ぶ。)では、2D映像もしくは3D映像として再生できることが求められる。
3D映像が格納された光ディスクで、再生互換性を確保するための光ディスクと再生装置の従来例としては、図39に示すような方法が知られている。
光ディスク1801には、左目用の画面が格納された左目用映像ストリームと右目用の画面が格納された右目用映像ストリームが多重化されて格納されている。左目用映像ストリームと右目用映像ストリームのフレームレートは同じで、再生表示時刻は交互になっている。例えば、各映像ストリームが1秒間に24フレームのフレームレートの場合は、左目用映像ストリームと右目用映像ストリームが1/48秒ごとに交互に表示されることになる。各映像ストリームは多重化され、光ディスク1801には1GOP以上の画像情報の記録単位でインターリーブ、つまり交互にディスク上に配置されている。
図39では、ストリーム1802A、ストリーム1802Bおよびストリーム1802Cに左目用映像ストリームが、ストリーム1803A、ストリーム1803Bおよびストリーム1803Cに右目用映像ストリームが光ディスク1801上にインターリーブ配置される。左目用映像ストリームが配置されたストリーム1802A、ストリーム1802Bおよびストリーム1802Cは、それぞれを順次再生した場合に、再生が途切れないように光ディスク1801のシーク性能および読み込み速度等を元に配置されている。
光ディスク1801は、2D再生装置1804に装填されると、左目用映像ストリームであるストリーム1802A、ストリーム1802Bおよびストリーム1802Cが再生され2D映像を出力する。
一方で、光ディスク1801が3D映像を再生できる3D再生装置1805に装填された場合、または、光ディスク1801が2D/3D再生装置に装填され、ユーザが3D再生を選択した場合は、左目用映像ストリームと右目用映像ストリームがインターリーブブロック単位で交互に読み込まれる。つまり、ストリーム1802A、ストリーム1803A、ストリーム1802B、ストリーム1803B、ストリーム1802Cおよびストリーム1803Cの順で、ドライブのシークが発生しないように連続的に読み込まれる。
読み込まれた映像ストリームは、左目用映像ストリームは左目用映像デコーダに、右目用映像ストリームは右目用映像デコーダに入力され、それぞれ両方のストリームを復号して左目画面および右目画面が交互にテレビに出力される。左目用映像ストリームと右目用映像ストリームの復号は同一のデコーダで実施してもよい。この出力画像は、1/48秒毎に右目と左目のシャッタが切り替わる立体メガネ1806で見ると立体映像に見える。
このような構成にすることで、3D映像が格納されたディスクが、2D再生装置で2D映像を再生し、3D再生装置または2D/3D再生装置では3D映像を再生することができる。この3D映像が格納された光ディスクでの再生互換性を確保するための技術についての先行技術としては、以下の特許文献1に記載されたものがある。
ISO/IEC MPEGとITU−T VCEGの共同プロジェクトであるJoint Video Team(JVT)は、2008年7月にMultiview Video Coding(MVC)と呼ばれるMPEG−4 AVC/H.264の修正規格の策定を完了した。MVCは、複数視点(ビュー)の映像をまとめて符号化する規格であり、映像の時間方向の類似性だけでなくビュー間の類似性も予測符号化に利用することで、複数ビューの独立した圧縮に比べて圧縮効率を向上している。
図40は、2視点の場合の予測参照の例を示す図である。ベースビュー(以下、第1ビューと呼ぶ場合がある。)と呼ばれるビューからは他のビューを参照することが禁止されており、ベースビューは単独で復号することができるため、2D再生装置との親和性が高い。また、MVCの多重化方式についても、MPEG−2システム規格の追補版の規格化が進行中であり、以下の非特許文献1に記載されたドラフトが発行済である。
非特許文献1では、MVCの映像ストリームをパケット多重化する方法、および、パケット多重化されたMVCのデータを読み込み、逆多重化してMVCのビットストリームを取り出し、デコーダに入力するまでの一連の動作を定めたシステム・ターゲット・デコーダなどについて規定している。
規定に基づく再生装置は、システム・ターゲット・デコーダに規定されたサイズのバッファを備える。非特許文献1に記載の通り、バッファには、デコーダに近い順に、エレメンタリ・ストリーム・バッファ(EB)、マルチプレクシング・バッファ(MB)、および、トランスポート・バッファ(TB)が含まれる。以下、これらバッファを総称してSTD(System Target Decoder)バッファと呼ぶ。規定に基づく再生装置は、規定されたデータの読み込みタイミングと読み込みレートに従って動作すれば、STDバッファをオーバーフローおよびアンダーフローさせることなく、所定の復号時刻において各フレームを復号できると考えられている。
国際公開第97/032437号
Text of ISO/IEC 13818−1:2007/FPDAM 4 − Transport of Multiview Video over ITU−T Rec H.222.0 | ISO/IEC 13818−1
従来例の課題を述べる。
図39の従来の再生装置において、MVCのようなビュー間の予測を使用する画像符号化方法を用いて2視点画像の符号化効率の向上を図る場合、ビュー間の予測に使用する第1ビューのフレームが、他方のビュー(以下、第2ビューと呼ぶ。)から参照される前に復号されている必要がある。これは、第1ビューと第2ビューの復号を同一のデコーダで実施する場合でも同様である。
また、光ディスク1801に格納された従来の多重化ストリームにおいては、第1ビューと第2ビューに対して同一の復号時刻(デコーディング・タイム・スタンプ。以下、DTSと呼ぶ。)が付与されており、第1ビューの復号を瞬時に完了することを前提としていた。なお、DTS、および、表示時刻(プレゼンテーション・タイム・スタンプ。以下、PTSと呼ぶ。)は、MPEG−2システム規格のPES(Packetized Elementary Stream)パケットのヘッダ、MVCのビットストリーム内のパラメータ、あるいは、Blu−ray Discなどの応用規格において再生時に参照されるデータベース情報から取得できる。
しかしながら、実際の再生装置において第1ビューの復号を瞬時に完了することは不可能であり、以下の課題があった。
従来の再生装置では、DTSに基づいて各ビューの復号時刻を決定していたが、実際には、第1ビューの復号開始時刻において第2ビューの復号を開始できないため、第2ビューの復号時刻を決定できない。すなわち、複数のビューがビュー間予測を含む方法で符号化されている場合、付与されているDTSに基づく復号時刻に復号できないという本質的な第1の課題があった。
また、従来のシステム・ターゲット・デコーダでは、第1ビューの復号が瞬時に完了することを前提にSTDバッファのサイズが規定されていたため、第1ビューの復号が瞬時に完了しない場合、その間に、STDバッファがオーバーフローしてSTDバッファにデータを読み込むことができず、後続フレームのデータがDTSまでに揃わないという第2の課題があった。
以下、第2の課題について、図41および図42を参照して説明する。図41は復号が瞬時に完了するケース、図42は第1ビューの復号にT_decの時間を要するケースにおける、エレメンタリ・ストリーム・バッファの占有量を示す。
図41では、DTS1、DTS2およびDTS3において、それぞれ、フレーム1、フレーム2およびフレーム3の第1ビューと第2ビューのストリームデータが同時に引き抜かれて、瞬時に復号される。
一方、図42では、DTS1においてフレーム1の第1ビューのストリームデータが、DTS1からT_dec遅れた時刻においてフレーム1の第2ビューのストリームデータが引き抜かれ、フレーム2以降も同様に処理される。このとき、エレメンタリ・ストリーム・バッファは、時刻Tfullにおいてオーバーフローしてしまい、時刻Tfullから第2ビューの復号時刻(DTS1+T_dec)までの間、データが読み込めない。結果として、DTS3においてフレーム3の第1ビューのデータが揃わず、エレメンタリ・ストリーム・バッファがアンダーフローしてしまう。
本発明は、上記の課題を解決するものであり、復号が瞬時に完了されない場合であっても、ビュー間予測を用いて符号化された複数のビューを復号することができる画像復号装置、または、復号することができるようにビュー間予測を用いて複数のビューを符号化する画像符号化装置を提供することを目的とする。
上記従来の課題を解決するために、本発明の画像復号装置は、ビュー間予測を含む方法で符号化された、各ビューにピクチャを含む複数のビューを有するビットストリームを復号する画像復号装置であって、符号化された第1ビューのビットストリーム、および、前記第1ビューを参照して符号化された第2ビューのビットストリームを復号する復号処理部と、前記復号処理部に入力されるビットストリームを保持するために前記復号処理部の前段に配置されたバッファメモリとを備え、前記復号処理部は、前記第1ビューおよび前記第2ビューに付与された復号時刻が同一の場合において、前記第2ビューに付与された復号時刻に前記第1ビューのピクチャの復号が完了するまでに要する遅延時間を加算して得られた時刻に前記第2ビューのピクチャを復号する。
これにより、第1ビューのピクチャが復号された後に、第1ビューのピクチャを参照して第2ビューのピクチャが復号される。よって、ビュー間予測を用いて符号化された複数のビューを復号することができる。
また、前記バッファメモリには、前記ビットストリームに付与されたデータ読み込みレートに従って前記ビットストリームが読み込まれ、前記復号処理部は、前記複数のビューに含まれる各ビューのビットストリームを復号するときに、前記バッファメモリから、復号する前記各ビューのビットストリームを引き抜き、前記バッファメモリのサイズは、前記復号処理部が前記遅延時間を加算して得られた時刻に前記第2ビューのビットストリームを引き抜いた場合において、前記復号処理部が前記各ビューのビットストリームを引き抜くときに、前記バッファメモリがアンダーフローしない最小のサイズ以上であってもよい。
これにより、復号遅延に起因するアンダーフローを起こすことなく、符号化されたデータが読み込まれる。したがって、画像復号装置は、より確実にデータを復号できる。
また、前記バッファメモリのサイズは、前記各ビューに付与された復号時刻に前記各ビューのビットストリームが引き抜かれることを前提に定められる規定サイズに、前記遅延時間中において前記データ読み込みレートに従って読み込まれるビットストリームのサイズを加算したサイズ以上であってもよい。
これにより、バッファメモリのサイズを定めることができる。
また、前記復号処理部は、前記複数のビューのビットストリームを逐次復号し、前記バッファメモリのサイズは、前記複数のビューに含まれるビューの数をn、前記複数のビューに含まれる各ピクチャの復号に要する時間の最大値をT、前記データ読み込みレートをR、および、前記規定サイズをDとした場合、D+R×T×(n−1)以上のサイズであってもよい。
これにより、複数のビューのビットストリームが逐次復号される場合において、より具体的に、バッファメモリのサイズが定められる。
また、前記復号処理部は、前記複数のビューのビットストリームを並列に復号し、前記バッファメモリのサイズは、ビュー間予測により参照されるビューの階層の最大値をm、前記複数のビューに含まれる各ピクチャの復号に要する時間の最大値をT、前記データ読み込みレートをR、および、前記規定サイズをDとした場合、D+R×T×(m−1)以上のサイズであってもよい。
これにより、複数のビューのビットストリームが並列に復号される場合において、より具体的に、バッファメモリのサイズが定められる。
また、前記復号処理部は、さらに、前記複数のビューに含まれるピクチャを記憶するための外部メモリと、前記第1ビューのビットストリームを復号し、ビュー間予測に使用されるピクチャを前記外部メモリに記憶させる第1デコーダと、前記ピクチャの保持されている前記外部メモリ内の位置を示す管理情報を参照して、前記外部メモリからビュー間予測に使用されるピクチャを取得することにより、前記第2ビューのビットストリームを復号する第2デコーダとを備えてもよい。
これにより、2つのデコーダを備える画像復号装置であっても、それぞれのデコーダは、ビュー間予測に用いられる参照画像を共有できる。
また、前記バッファメモリには、前記遅延時間により読み込まれなかったビットストリームがある場合、前記ビットストリームに付与されたデータ読み込みレートよりも高速に前記ビットストリームが読み込まれてもよい。
これにより、復号遅延が発生している間に読み込まれなかったデータが読み込まれる。したがって、画像復号装置は、より確実にデータを復号できる。
また、前記復号処理部は、さらに、前記複数のビューに含まれるピクチャを記憶するための外部メモリと、前記第1ビューのビットストリームを復号し、ビュー間予測に使用されるピクチャを前記外部メモリに記憶させる第1デコーダと、前記ピクチャの保持されている前記外部メモリ内の位置を示す管理情報を参照して、前記外部メモリからビュー間予測に使用されるピクチャを取得することにより、前記第2ビューのビットストリームを復号する第2デコーダとを備えてもよい。
これにより、2つのデコーダを備える画像復号装置であっても、それぞれのデコーダは、ビュー間予測に用いられる参照画像を共有できる。そして、このような共有は、高速にビットストリームが読み込まれる場合にも、適用されうる。
また、本発明の画像符号化装置は、ビュー間予測を含む方法で、各ビューにピクチャを含む複数のビューを符号化する画像符号化装置であって、前記複数のビューを符号化し、前記複数のビューに同一の復号時刻を付与する符号化処理部と、符号化された前記複数のビューを読み込む画像復号装置のバッファメモリのサイズが、前記復号時刻に復号が瞬時に完了することを想定して定められる規定サイズより、ビュー間予測により参照されるビューの復号が完了するまでに要する遅延時間中に読み込まれる符号化された前記複数のビューのデータサイズを減算して得られるサイズ以下であるとして、符号化処理部に符号化させるレート制御部とを備える画像符号化装置でもよい。
これにより、複数のビューは、画像復号装置でアンダーフローしないように符号化される。
また、前記レート制御部は、前記画像復号装置のバッファメモリのサイズが、符号化された前記複数のビューの数をn、前記複数のビューに含まれる各ピクチャの復号に要する時間の最大値をT、符号化された前記複数のビューを読み込むときのデータ読み込みレートをR、および、前記規定サイズをDとした場合、D−R×T×(n−1)以下のサイズであるとして、符号化処理部に符号化させてもよい。
これにより、より具体的に、符号化における制限を設けることができる。
また、前記符号化処理部は、さらに、前記複数のビューに含まれるピクチャを記憶するための外部メモリと、前記複数のビューに含まれる第1ビューの符号化し、ビュー間予測に使用されるピクチャを外部メモリに記憶させる第1エンコーダと、前記ピクチャの保持されている前記外部メモリ内の位置を示す管理情報を参照して、前記外部メモリからビュー間予測に使用される前記第1ビューのピクチャを取得することにより、ビュー間予測を使用して前記複数のビューに含まれる第2ビューを符号化する第2エンコーダとを備えてもよい。
これにより、2つのエンコーダを備える画像符号化装置であっても、それぞれのエンコーダは、ビュー間予測に用いられる参照画像を共有できる。
また、本発明の画像復号方法は、ビュー間予測を含む方法で符号化された、各ビューにピクチャを含む複数のビューを有するビットストリームを復号する画像復号方法であって、符号化された第1ビューのビットストリーム、および、前記第1ビューを参照して符号化された第2ビューのビットストリームを復号する復号処理ステップと、前記復号処理ステップの前に、復号処理ステップに入力されるビットストリームを保持するデータ保持ステップとを含み、前記復号処理ステップでは、前記第1ビューおよび前記第2ビューに付与された復号時刻が同一の場合において、前記第2ビューに付与された復号時刻に前記第1ビューのピクチャの復号が完了するまでに要する遅延時間を加算して得られた時刻に前記第2ビューのピクチャを復号する画像復号方法でもよい。
これにより、第1ビューのピクチャが復号された後に、第1ビューのピクチャを参照して第2ビューのピクチャが復号される。よって、ビュー間予測を用いて符号化された複数のビューを復号することができる。
また、本発明の画像符号化方法は、ビュー間予測を含む方法で、各ビューにピクチャを含む複数のビューを符号化する画像符号化方法であって、前記複数のビューを符号化し、前記複数のビューに同一の復号時刻を付与する符号化処理ステップと、符号化された前記複数のビューを読み込む画像復号装置のバッファメモリのサイズが、前記復号時刻に復号が瞬時に完了することを想定して定められる規定サイズより、ビュー間予測により参照されるビューの復号が完了するまでに要する遅延時間中に読み込まれる符号化された前記複数のビューのデータサイズを減算して得られるサイズ以下であるとして、符号化処理ステップに符号化させるレート制御ステップとを含む画像符号化方法でもよい。
これにより、複数のビューは、画像復号装置でアンダーフローしないように符号化される。
また、前記画像復号方法に含まれるステップをコンピュータに実行させるプログラムでもよい。
これにより、前記画像復号方法がプログラムとして実現される。
また、前記画像符号化方法に含まれるステップをコンピュータに実行させるプログラムでもよい。
これにより、前記画像符号化方法がプログラムとして実現される。
本発明により、復号が瞬時に完了されない場合であっても、ビュー間予測を含む方法で符号化されたビットストリームが復号される。
図1は、本発明の実施の形態1に係る3D画像復号装置のブロック図である。 図2は、本発明の実施の形態1における各ビューの実際の復号時刻および表示時刻の例を示す図である。 図3は、本発明の実施の形態1における各ビューの実際の復号時刻の決定方法を示すフローチャートである。 図4は、図3に示す各ビューの実際の復号時刻の決定方法の変形例を示すフローチャートである。 図5は、本発明の実施の形態1に係る3D画像復号装置における補償バッファの説明図である。 図6は、本発明の実施の形態1に係る補償バッファの効果を示す図である。 図7は、図5に示す補償バッファの配置の変形例を示す図である。 図8は、図5に示す補償バッファの配置の変形例を示す図である。 図9は、2つ以上のビューを有する場合の動作を説明する図である。 図10は、高速読み込みの場合の動作を説明する図である。 図11は、本発明の実施の形態1に係る構成要素を示す図である。 図12は、本発明の実施の形態1に係る3D画像復号装置の変形例のブロック図である。 図13は、本発明の実施の形態1の変形例における各ビューの実際の復号時刻および表示時刻の例を示す図である。 図14は、本発明の実施の形態2に係る3D画像復号装置のブロック図である。 図15は、本発明の実施の形態2における各ビューの実際の復号時刻および表示時刻の例を示す図である。 図16は、図15に示す各ビューの実際の復号時刻および表示時刻の変形例を示す図である。 図17は、複数のビューの参照関係の例を示す図である。 図18は、本発明の実施の形態3に係る3D画像符号化装置のブロック図である。 図19は、本発明の実施の形態3に係る3D画像符号化装置の効果を示す図である。 図20は、本発明の実施の形態3に係る3D画像符号化装置の変形例のブロック図である。 図21は、本発明の実施の形態4に係る3D画像復号装置のブロック図である。 図22は、2つのデコーダを備える3D画像復号装置で再生できるPTSおよびDTSの一例を示す図である。 図23は、本発明の実施の形態4に係る3D画像符号化装置のブロック図である。 図24は、図22に示すPTSおよびDTSの決定方法の一例を示すフローチャートである。 図25は、2つのデコーダを備える3D画像復号装置で再生できるPTSおよびDTSの一例を示す図である。 図26は、図25に示すPTSおよびDTSの決定方法の一例を示すフローチャートである。 図27は、本発明の実施の形態4に係る3D画像復号装置の変形例のブロック図である。 図28は、本発明の実施の形態4に係る3D画像復号装置の変形例のブロック図である。 図29は、本発明の実施の形態5に係る3D画像復号装置のブロック図である。 図30は、倍性能デコーダを備える3D画像復号装置で再生できるPTSおよびDTSの一例を示す図である。 図31は、本発明の実施の形態5に係る3D画像符号化装置のブロック図である。 図32は、図30に示すPTSおよびDTSの決定方法の一例を示すフローチャートである。 図33は、倍性能デコーダを備える3D画像復号装置で再生できるPTSおよびDTSの一例を示す図である。 図34は、図33に示すPTSおよびDTSの決定方法の一例を示すフローチャートである。 図35は、本発明の実施の形態6に係る3D画像復号装置における復号処理切替え判定フローチャートである。 図36は、本発明の実施の形態6に係る3D画像復号装置のブロック図である。 図37は、本発明の実施の形態6に係る3D画像復号装置における復号処理切替え判定フローチャートである。 図38は、本発明の実施の形態6に係る3D画像復号装置のブロック図である。 図39は、従来の3D映像再生装置の説明図である。 図40は、MVCにおける2視点画像符号化の予測参照の例を示す図である。 図41は、3D画像再生時のバッファ管理を示す図である。 図42は、3D画像再生時のバッファ管理の課題を示す図である。
以下、本発明の実施の形態について、図面を参照しながら説明する。
(実施の形態1)
まず、本発明に係る実施の形態1について、図面を参照して説明する。
図1は、実施の形態1の3D画像復号装置001のブロック図である。図1の3D画像復号装置001は、3D映像の片側ビューの映像を3D映像のフレームレートの2倍の速度で復号する能力を有するデコーダ112eを備える。そして、デコーダ112eは、第1ビューおよび第2ビューの両ビューを復号する。第2ビューは、第1ビューを参照して符号化されているため、3D画像復号装置001は、第2ビューの復号中に第1ビューの復号画像を参照できるように構成されている。
3D画像復号装置001は、第1ビューの復号が瞬時に完了しない場合でも、各ビューを実際に復号する時刻において、各ビューのストリームデータを復号できる点で従来の再生装置と異なる。
3D画像復号装置001の動作について説明する。入力された多重化ビットストリーム101は、STDバッファ902に入力される。そして、逆多重化されることにより、ビットストリームが分離される。その後、第1ビューについてのビットストリームはDTSに従い、第2ビューについてのビットストリームは第1ビューの復号に要する時間を考慮した復号時刻(以下、DTS_MODと呼ぶ。)に従ってデコーダ112eへと入力される。
ここで、多重化方式としては、MPEG−2システムのトランスポート・ストリームを用いる。そして、逆多重化時、図示しない逆多重化手段によって、トランスポート・パケット列からPESパケットが分離され、PESパケットのペイロードに格納されたビットストリームが取得される。
なお、多重化方式は、MPEG−2システムのトランスポート・ストリームに限定されるものではない。例えば、多重化方式は、応用規格において機能拡張したトランスポート・ストリーム、あるいは、MPEGで規定するMP4ファイルフォーマット、更には、IETF(Internet Engineering Task Force)で規定するRTP(Real Time streaming Protocol)など、ネットワーク経由でのストリーミング配信で使用する方式であってもよい。
デコーダ112eは、入力された多重化ビットストリーム101を復号し、PTSに従って復号画像を出力する。スイッチ903は、出力された画像を第1ビューの復号画像114および第2ビューの復号画像115に分離する。そして、分離された画像は、ビデオ出力インターフェース116を介して、3Dディスプレイ117に、3D画像として表示される。
デコーダ112eは、復号処理において、画面間予測符号化で参照される復号済みのフレームを、外部メモリ109上の第1フレームメモリ110cおよび第2フレームメモリ121へコピーし、参照されなくなるまで第1フレームメモリ110cおよび第2フレームメモリ121に保持する。ここで、第1フレームメモリ110cには、第1ビューのフレームが格納され、第2フレームメモリ121には、第2ビューのフレームが格納される。
各フレームメモリには複数のフレームが保持される。そのため、デコーダ112eは、第1フレームメモリ管理情報108gおよび第2フレームメモリ管理情報120を保持することにより、どの時刻のフレームが第1フレームメモリ110cおよび第2フレームメモリ121上のどの位置に保持されているかを管理する。
ここで、第2ビューの符号化には、第1ビューのフレームを用いて予測するビュー間予測符号化が用いられている。そのため、デコーダ112eは、第2ビューの復号に、第1ビューの復号画像を参照する必要がある。そこで、デコーダ112eは、第1ビューのフレームの復号が終わる度に、第1フレームメモリ管理情報108gを更新する。そして、第2ビューの復号中も、第1フレームメモリ管理情報108gを保持する。デコーダ112eは、第1フレームメモリ管理情報108gに基づいて、第1フレームメモリ110cに保持された第1ビューの所望のフレームの復号画像を参照する。そして、デコーダ112eは、ビュー間予測符号化を含む符号化方式で符号化された第2ビューのビットストリームを復号する。
なお、第1ビューのビットストリームは、他のビューを参照しておらず単独での復号が可能である。よって、デコーダ112eが第2ビューのビットストリームを読み飛ばすことで、3D画像復号装置001は、2D画像復号装置としても使用することが可能である。
また、デコーダ112eにおける第2ビューの復号処理において、ビットストリームSyntax異常など何らかの異常が検出された場合、ビットストリームのランダムアクセスポイント(飛び込み再生可能ポイント)などに到達することにより正常復号を再開できるまでの間、3D画像復号装置001は、第1ビューの復号画像のみを表示してもよい。また、上記の異常が検出された場合、3D画像復号装置001は、第1ビューの復号画像を第2ビューの復号画像として表示してもよい。このような表示等により、3D画像復号装置001は、視聴者の不快感を軽減させることが可能である。
また、デコーダ112eにおける第1ビューの復号処理において、ビットストリームSyntax異常など何らかの異常が検出された場合は、第1ビューを参照する第2ビューも正常に復号できなくなる。そのため、3D画像復号装置001は、上位システムにデコーダ112eの異常を通知して、ビットストリームのランダムアクセスポイント(飛び込み再生可能ポイント)などに到達して正常復号を再開できるまでの間、第1ビューおよび第2ビュー共に最後に正常復号できたフレームを出力し続けてもよい。このような出力等により、3D画像復号装置001は、視聴者の不快感を軽減させることが可能である。
図2は、3D画像復号装置001の復号処理における、各ビューのPTSおよびDTSの関係の一例を示す図である。図2の例においては、各ビューのフレームは、表示順でI、B、BおよびPタイプ(Pタイプは一方向の予測のみを行う。Bタイプは双方向の予測を含む。)、符号化順でI、P、BおよびBタイプとして符号化されている。ビュー間予測による第2ビューからの第1ビューの参照は、直前に表示される第1ビューのフレームのみである。また第1ビューおよび第2ビューは交互に表示される。
本例では、第1ビューの先頭フレームI1がまず復号される。そして、第2ビューの先頭フレームP1は、第1ビューの先頭フレームI1を参照している。そのため、第1ビューの先頭フレームI1の復号が完了するまで、第2ビューの先頭フレームP1の復号が、開始できない。3D画像復号装置001は、表示フレームレートの倍の速度のデコーダ112eを用いているため、第1ビューの先頭フレームI1の復号にフレーム周期Δt/2(Δt=1/フレームレート)を要する。
ここで、PESパケットのヘッダ、および、MVCストリーム内のHRD(Hypothetical Reference Decoder)関連のパラメータ等から得られるDTS値は、第1ビューと第2ビューで同一である。そのため、第2ビューの先頭フレームP1の実際の復号時刻DTS_MODは、第1ビューの先頭フレームI1のDTSからΔt/2後と決定される。
また、第1ビューのフレームP4は、第1ビューのフレームI1を予測で使用するため、本来は第1ビューのフレームI1の復号完了後に、第1ビューのフレームP4の復号が開始できる。しかしながら、3D画像復号装置001においては、第1ビューと第2ビューの復号を1つのデコーダで実施するため、第2ビューのフレームP1と同時に復号できない。そこで、第1ビューのフレームP4のDTSは、第2ビューのフレームP1のDTS_MODからΔt/2後となる。以降、第1ビューと第2ビューのフレームの復号がΔt/2間隔で交互に開始される。
次に、PTSについて説明する。表示順に対して復号順が最も遅いのは第2ビューのBフレームである。そのため、第2ビューのBフレームを表示できる時刻を基準に、第1ビューおよび第2ビューのフレームのPTSは、決定される。具体的には、第2ビューのフレームB2のPTSは、デコーダ112eが1フレームの復号にΔt/2を要するため、DTS_MODのΔt/2後となる。この時刻を基準にして、第1ビューの先頭フレームI1のPTSは、DTSの3Δt/2後となり、第2ビューの先頭フレームP1のPTSは、DTS_MODの3Δt/2後となる。
ここで、3D画像の表示方式としては、第1ビューと第2ビューを同時に表示する方式と、3D画像復号装置001のように第1ビューと第2ビューを交互に表示する方式とがある。
前者の方式への対応を想定すると、多重化ビットストリーム101において、第1ビューと第2ビューのPTSが、同一値に設定されることが考えられる。このような多重化ストリームが3D画像復号装置001に入力される場合、すなわち、PESパケットのヘッダ、および、MVCストリーム内のHRD(Hypothetical Reference Decoder)関連のパラメータ等から得られるPTSが第1ビューと第2ビューで同一である場合には、図2の例のように、第1ビューと第2ビューが交互に表示できるように第2ビューの実際のPTSを決定してもよい。
さらに、他の例として、PESパケットのヘッダから取得できるPTSは第1ビューのPTSのみとし、第2ビューのPTSは第1ビューのPTSに基づいて決定することとして、第2ビューのPTSをPESパケットのヘッダに格納しないことが考えられる。あるいは、PESパケットのヘッダに格納される第2ビューのPTSは、所定の値に固定することが考えられる。例えば、格納されるPTSは常に0に固定し、実際のPTSは第1ビューのPTSに基づいて決定することも考えられる。このような場合でも、図2の例のように、第1ビューと第2ビューが交互に表示できるように第2ビューの実際のPTSを決定してもよい。
図3は、3D画像復号装置001において第1ビューと第2ビューの復号時刻を決定する動作を示すフローチャートである。
まず、デコーダ112eは、PESパケットヘッダにおいて示される各ビューのDTSを取得する(S1000)。ここで、PESパケットヘッダには全フレームのビューについてのDTSが必ずしも格納されない。そのため、PESパケットヘッダにDTSが示されない場合は、デコーダ112eは、別途取得したフレームレート情報等からDTSを決定してもよい。また、PESパケットに格納されたMVCストリームのHRD関連情報からDTSを決定してもよい。
次に、デコーダ112eは、処理対象が第1ビューであるかどうか判定する(S1001)。ここで、第1ビューであれば(S1001でYes)、デコーダ112eは、取得されたDTSに基づいて復号を開始すると決定する(S1002)。一方、第1ビューでなければ(S1001でNo)、デコーダ112eは、第1ビューの復号に要する時間を考慮して、DTSにフレーム周期Δtの1/2の時間を加算して第2ビューの復号時刻DTS_MODを決定する(S1003)。
図4は、図3の動作の変形例を示すフローチャートである。
この例において、デコーダ112eは、処理対象が第1ビューであるかどうか判定する(S1001)。ここで、第1ビューでない場合(S1001でNo)、デコーダ112eは、DTS変更用の補助情報を参照して、DTSの加算値DTS_DELTAを取得する(S1004)。次に、デコーダ112eは、DTSにDTS_DELTAを加算して、第2ビューの復号時刻DTS_MODを決定する(S1005)。
DTS_DELTAは、例えば、MVCストリーム内の補助情報格納用のデータ格納単位を用いて、ランダムアクセス単位の先頭毎など所定の位置において伝送可能である。ここで、第1ビューと第2ビューのデータを合わせて1つのアクセスユニットが定義される場合、補助情報格納用の格納単位、および、画素データ格納用の格納単位などの格納単位の種類に応じて、アクセスユニット内での配置順が制限されることがある。
このとき、アクセスユニットを作成する際に格納単位の並び替えが起こらないように、補助情報格納用の格納単位を配置してもよい。例えば、補助情報用の格納単位は、画素データ用の格納単位の前に配置する必要がある場合がある。このとき、補助情報を第2ビューのデータとして格納すると、第1ビューと第2ビューのデータを結合した際に、補助情報が第1ビューの画素データの後となってしまい、格納単位の並び替えが発生する。従って、予め補助情報を第1ビューのデータとして、第1ビューの画素データの前に配置しておいてもよい。
また、MPEG−2システム規格におけるトランスポート・ストリーム内(例えば、デスクリプタなどを用いることができる。)、または、Blu−ray Discなどの応用規格において再生時に参照されるデータベース情報内に、DTS_DELTAを示す補助情報を格納してもよい。また、補助情報は、DTS_DELTAの絶対値を示すものであってもよいし、フレーム間隔またはその他の基準時間間隔の整数倍、あるいは、整数分の1倍、など、DTS_DELTAの値を間接的に示してもよい。更には、DTS_MODを補助情報として伝送してもよい。なお、第2ビューの実際のPTSを決定するための補助情報も、同様にして伝送可能である。
上記では、2つのビューから構成されるストリームの3D表示を想定したが、3つ以上のビューから2つのビューを選択して、復号および表示するような場合には、複数ビューから2つのビューを選択するステップを追加すればよい。
また、3D表示ではなく、複数のビューを切り替えながら、あるいは、同時に画面を分割して表示するという用途も想定される。これらのケースでも、単独で復号できる第1ビューを基準として、後続ビューのDTS_MODを決定する。例えば、3つのビューを表示する場合、フレーム周期Δtの1/3の時間で各ビューの復号を完了できるとすると、第2ビューのDTS_MODは、DTS+(1/3)×Δt、第3ビューのDTS_MODは、DTS+(2/3)×Δtと決定できる。
なお、ここで説明されたフレームには、フレームを構成するフィールドも含まれる。そして、本方法は、プログレッシブ映像と共に、インタレース映像にも適用できる。
次に、3D画像復号装置001が備えるSTDバッファ902について説明する。従来の再生装置について、上記第2の課題で述べたように、3D画像復号装置001が第1ビューの復号に要する時間を考慮して第2ビューの復号時刻を決定する場合、第1ビューの復号期間に第2ビューのビットストリームデータをデコーダ112eが読み込めない。したがって、STDバッファ902がオーバーフローしてしまう。そして、結果として、後続フレームデータがDTSまでに揃わないという課題が発生する。
従って、3D画像復号装置001では、第1ビューの復号期間に第2ビューのビットストリームデータの読み込みが停止することに起因するSTDバッファのオーバーフローを回避するために、従来のシステム・ターゲット・デコーダで規定していたSTDバッファに加えて、補償バッファを新規に備える。
図5は、3D画像復号装置001のSTDバッファ902の構成を示す図である。図示しない制御部により、入力された多重化ビットストリーム101は、まず、トランスポート・バッファ902aに入力され、トランスポート・パケットからPESパケットが分離された後、マルチプレクシング・バッファ902bに入力される。続いて、PESパケットのペイロードから取得されたビットストリームデータは、エレメンタリ・ストリーム・バッファ902cに入力される。STDバッファ902は、ビットストリームデータを格納するバッファとして、エレメンタリ・ストリーム・バッファ902cに加えて、補償バッファ902dを備える。
図5の例では、エレメンタリ・ストリーム・バッファ902cと補償バッファ902dを分けて示したが、両者の役割は共に、PESパケットのペイロードから分離したビットストリームデータを格納することである。したがって、STDバッファ902は、これら2つのバッファのサイズを加算したサイズを持つ単一のバッファを、ビットストリームデータ格納用のバッファとして備えてもよい。
そして、エレメンタリ・ストリーム・バッファ902cおよび補償バッファ902dのいずれかのバッファから、第1ビューと第2ビューの復号時刻に従って、それぞれのビューのビットストリームデータが、デコーダ112eへと入力される。
図6は、図42に例示した従来の再生装置において課題が発生するビットストリームデータを、3D画像復号装置001では、STDバッファ902のオーバーフローおよびアンダーフローを発生させることなく復号できることを示す図である。図6のグラフ内の実線と点線は、それぞれ3D画像復号装置001と従来の再生装置におけるバッファ占有量の遷移を示す。従来の再生装置では時刻T1においてオーバーフローしていたが、STDバッファ902では、補償バッファ902dを備えたことにより、オーバーフローが発生せずビットストリームデータを継続して読み込むことができる。その結果、フレーム3の第1ビューのデータは、DTS3において揃っており、3D画像復号装置001は、途切れることのない連続した復号を実現できる。
図7および図8は、第1ビューと第2ビューのデータを別チャネルで処理する際の、STDバッファ902の変形例を示す図である。
まず、図7について説明する。多重化ビットストリーム101は、スイッチ913により、PID(Packet Indicator)などのトランスポート・ストリーム・パケットの識別情報に基づいて、第1ビューのパケット101bと第2ビューのパケット101eに分離される。第1ビューのみ再生する場合には、スイッチ913において、第1ビューのトランスポート・パケットのみを選択し、第2ビューのトランスポート・パケットは破棄する。
第1ビューのパケットは、トランスポート・バッファ9021a、マルチプレクシング・バッファ9021bおよびエレメンタリ・ストリーム・バッファ9021cを通る。第2ビューのパケットは、トランスポート・バッファ9022a、マルチプレクシング・バッファ9022b、エレメンタリ・ストリーム・バッファ9022c、および、補償バッファ9022dを通る。第1ビューと第2ビューのビットストリームデータは、それぞれの復号時刻に従ってスイッチ914を介してデコーダ112eに入力される。
図7に示されたSTDバッファ902は、第1ビューについて、従来のSTDバッファと互換性のある構成を備える。そして、第2ビューに対応する補償バッファ9022dを備える。このような構成により、2つのビューの復号に起因するSTDバッファの課題が解決される。
図8に示されたSTDバッファ902は、補償バッファ9022dをスイッチ914の後段に備える。なお、ビュー数が3つ以上であっても、図7および図8に示された変形例と同様に、スイッチ913とスイッチ914がビューの選択をすることにより、STDバッファ902は、各ビューを別チャネルで処理することができる。さらに、図7と同様の構成とする際には、補償バッファは、第2ビューと第3ビュー以降のビューで共用してもよい。
次に、補償バッファ9022dのサイズについて説明する。
まず、マルチプレクシング・バッファからエレメンタリ・ストリーム・バッファへのデータの流入レートの最大値をRinとした場合、最大流入レートRinに、第1ビューの復号時間(フレーム周期Δtの1/2に等しい)を乗じて得られるデータ量DATA_INが、第1ビューの復号期間内にエレメンタリ・ストリーム・バッファ902cに流入されうる。このときの計算式を式1に示す。
DATA_IN = (1/2)×Δt×Rin (式1)
最大流入レートRinは、非特許文献1で規定されるように、多重化ビットストリーム101におけるMVCストリームの最大ビットレート、あるいは、MVCストリームが属するレベルにおいて規定された最大レートに基づいて決定される。ここでレベルとは、ビットレート、バッファサイズ、画像サイズおよびフレームレート等のパラメータ上限値を規定する情報であり、レベル毎にパラメータ上限値が異なる。また、レベルおよびMVCストリームのビットレートなどの情報は、MVCのビットストリーム内に符号化できるため、3D画像復号装置001は、これら情報を取得して、最大流入レートRinを決定できる。但し、DATA_INの上限値は、エレメンタリ・ストリーム・バッファのサイズEB_SIZEにより制限される。
さらに、図42の例などで示されたエレメンタリ・ストリーム・バッファのオーバーフローは、第1ビューの復号時刻において第2ビューのデータを引き抜けないことに起因する。従って、補償バッファのサイズは、第2ビューのデータサイズの上限値(以下、View2_MAXと呼ぶ。)以上であればよい。そして、View2_MAXの値はMVCなどの符号化規格により規定されている。例えば、各ビュー画像において、原画像と符号化画像とのビット量の比は、MinCR(Minimum Compression Ratio)と呼ばれるパラメータにより規定されている。そして、MinCRが2であれば、符号化画像のデータサイズは、原画像のビット量の1/2以下に制限される。原画像のデータサイズは、画像サイズや色差情報のサンプリング方法などに基づいて決定できる。なお、全ビューの合計データサイズの上限値に基づいてView2_MAXを決定してもよい。
以上より、DATA_IN、EB_SIZEおよびView2_MAXの3つのパラメータ値のうち、サイズが最小となるパラメータ値(以下、COMP_BUF_SIZEと呼ぶ。)を補償バッファのサイズとしてもよい。または、単に3つのパラメータ値のうち、いずれかを選択して、補償バッファのサイズとしてもよい。このように設定した補償バッファのサイズはワーストケースを仮定して決定したものである。実際のビットストリームにおいて必要な補償バッファのサイズは、COMP_BUF_SIZE以下となり、その値は符号化条件に依存して変動する。
従って、3D画像符号化装置は、ビットストリームの符号化時に、各ビューの復号に要する時間を設定し、設定した時間に基づいて実際に必要な補償バッファのサイズを決定し、決定したサイズを示す情報をビットストリーム内のパラメータ情報として符号化してもよい。3D画像復号装置では、このパラメータ情報を取得して、補償バッファのサイズを決定し、確保できる。
なお、各ビューの復号に要する時間として設定した値も、パラメータ情報として含めてもよい。さらに、3D画像符号化装置は、各ビューの復号に要する時間として複数の候補を想定し、各々の候補に対応した補償バッファのサイズをパラメータ情報に含めることも可能である。このとき、3D画像復号装置では、自身の処理速度に対応する候補を選択し、補償バッファのサイズを決定する。
図5に示された補償バッファ902dは、ビットストリーム格納用のバッファである。これにより、PESパケットのオーバーヘッドを含むマルチプレクシング・バッファ、あるいは、PESパケットに加えてトランスポート・パケットのオーバーヘッドを含むトランスポート・バッファの段階で補償バッファを設けるよりも、バッファサイズを削減できる。
一方で、例えば、エレメンタリ・ストリーム・バッファを内蔵したデコーダを再生装置に組み込む場合において、エレメンタリ・ストリーム・バッファの段階で補償バッファを設けることができない場合がある。その場合、補償バッファをマルチプレクシング・バッファなどと同一の段階に設けても良い。このとき、マルチプレクシング・バッファではビットストリームがPESパケット化された状態で格納されるため、補償バッファのサイズは、COMP_BUF_SIZEに、PESパケットのヘッダ、および、その他の多重化に係るオーバーヘッドを加えた値とする。オーバーヘッドのサイズは、マルチプレクシング・バッファに保持されるデータにおいて、オーバーヘッドが占める割合を規定し、その規定に基づいて決定できる。
なお、補償バッファのサイズは、COMP_BUF_SIZE以上の任意の値に設定してもよい。このように定められる補償バッファをSTDバッファに加えることにより、課題が解決される。
図9は、2つ以上のビューの復号する際のCOMP_BUF_SIZEの決定方法を説明する図である。ここで、2つ以上のビューの復号が必要なケースとは、復号したビュー全てを表示する場合だけでなく、例えば、10個のビューから2つのビューを選択して表示する場合に、選択したビューが他の2つのビューを参照しており、結果として4つのビューの復号が必要となる場合なども含む。
図9は、4つのビューを復号する際のエレメンタリ・ストリーム・バッファの占有量の遷移を示している。1番目のビューView1から3番目のビューView3までの符号量が小さいため、各ビューの復号中に、それぞれ、時刻Tfull1、時刻Tfull2、時刻Tfull3においてバッファがオーバーフローしている。そして、ビットストリームデータが入力されなくなっている。
各ビューの復号には、それぞれフレーム周期Δtの1/4だけ時間がかかるとすると、1番目から3番目のビューの復号に起因してバッファへ入力できなくなるデータサイズの最大値は、(3/4)×Rinとなる。この値がDATA_INに相当する。
なお、同様に、ビューの数をn、および、各ビューに含まれる各フレームの復号に要する時間の最大値をTmaxとした場合、DATA_INに相当する値は、式2によって得られる。
DATA_IN = Rin×Tmax×(n−1) (式2)
そして、View2_MAXに相当する値は、View2からView4までの3つのビューのデータサイズ上限値の和とする。最後に、EB_SIZEを含めた3種類の値を比較してCOMP_BUF_SIZEを決定してもよい。または、単に3つのパラメータ値のうち、いずれかを選択して、補償バッファのサイズとしても良い。このように定められる補償バッファをSTDバッファに加えることにより、課題が解決される。
しかしながら、本方法では、復号するビューの数の増加に伴い補償バッファのサイズが増加する可能性がある。そこで、補償バッファのサイズを、例えば、ビューのデータサイズの上限値の2倍などに制限し、符号化時に、3D画像符号化装置が制限値を満たすように符号化してもよい。
なお、最大流入レートを上げることにより、補償バッファを不要とすることもできる。第2ビューの復号期間内に、エレメンタリ・ストリーム・バッファには、COMP_BUF_SIZE分のデータが、追加で読み込まれるようにするとよい。例えば、第2ビューの復号期間内は、データ読み込みレートをRin+COMP_BUF_SIZE/(Δt/2)として、データが読み込まれるようにする。あるいは、簡略化して、Rinの2倍のレートで読み込まれるようにしてもよい。
図10は、図42と同一のビットストリームを復号する際の動作例を示す図である。グラフ内の実線が本方法の動作を示し、点線が従来の再生装置の動作を示す。フレーム1の第2ビューの復号期間内では、Rinよりも高速にデータが読み込まれるため、DTS3において、フレーム3の第1ビューのデータが揃っている。図10の動作のように、第1ビューの復号期間内において、エレメンタリ・ストリーム・バッファがオーバーフローした場合にのみ、第2ビューの復号期間内において、データが高速に読み込まれるようにしてもよい。
図11は、実施の形態1における3D画像復号装置の特徴的な構成要素を示す図である。実施の形態1における3D画像復号装置は、STDバッファ902等により実装されるバッファメモリ900、および、デコーダ112e等により実装される復号処理部100を備える。
バッファメモリ900は、復号処理部100に入力されるビットストリームを保持する。そして、復号処理部100は、第1ビューのビットストリームおよび第2ビューのビットストリームを復号する。ここで、復号処理部100は、第1ビューのフレームを復号した後に、復号したフレームを参照して、第2ビューのフレームを復号する。これにより、ビュー間予測を用いて符号化された複数のビューが復号される。
さらに、バッファメモリ900のサイズを大きくすること、あるいは、高速にデータがバッファメモリ900に読み込まれるようにすることにより、より確実に、ビュー間予測を用いて符号化された複数のビューが復号される。
図12は、本発明の実施の形態1に係る3D画像復号装置のブロック図であって、図1で示された3D画像復号装置001の変形例を示す図である。
図1で示された3D画像復号装置001に加えて、第1ビューの復号画像の経路に、遅延バッファ904が設けられている。これにより、第1ビューの表示タイミングを調整することができる。
図13は、図12で示された3D画像復号装置001における各ビューの実際の復号時刻および表示時刻の例を示す図である。図2で示された復号時刻および表示時刻と比較して、第1ビューと第2ビューが同一時刻に表示されるように調整されている。図12で示された3D画像復号装置001は、このように、遅延バッファ904により、第1ビューと第2ビューを同一時刻に表示することができる。
以上のように、実施の形態1における3D画像復号装置001は、復号が瞬時に完了されない場合であっても、ビュー間予測を用いて符号化された複数のビューを復号することができる。また、適切なバッファメモリのサイズ、または、高速読み込みにより、より確実に、ビュー間予測を用いて符号化された複数のビューが復号される。
(実施の形態2)
次に、実施の形態2について説明する。実施の形態2における3D画像復号装置は、2つのデコーダを備える。そして、各デコーダは、それぞれ表示フレームレートと同じ速度で復号する。
図14は、本発明の実施の形態2に係る3D画像復号装置のブロック図である。図14に示された3D画像復号装置001は、図7に示されたSTDバッファ902と同様のSTDバッファ902を備える。そして、STDバッファ902は、図7に示されたスイッチ914を介することなく、2つのデコーダに接続される。第1デコーダ107aは、第1ビューを復号し、第2デコーダ112aは、第2ビューを復号する。
第1デコーダ107aは、復号されたフレームを外部メモリ109の第1フレームメモリ110aにコピーし、フレームの位置を示す第1フレームメモリ管理情報108aを外部メモリ109の第1フレームメモリ管理情報108bにコピーする。
第2デコーダ112aは、外部メモリ109の第1フレームメモリ管理情報108bを第2デコーダ112aの第1フレームメモリ管理情報108cにコピーする。そして、第2デコーダ112aは、第1フレームメモリ管理情報108cを参照することにより、第1ビューのフレームを参照して、第2ビューを復号する。また、第2デコーダ112aは、画面間予測に利用するため、復号されたフレームを外部メモリ109の第2フレームメモリ111にコピーし、フレームの位置を示す第2フレームメモリ管理情報113を保持する。
復号されたフレームである第1ビューの復号画像114および第2ビューの復号画像115は、ビデオ出力インターフェース116を介して、3Dディスプレイ117に表示される。ここで、第1ビューの経路には、遅延バッファ904が配置される。これにより、第1ビューの表示タイミングが調整される。
図15は、図14に示された3D画像復号装置001における各ビューの実際の復号時刻および表示時刻の例を示す図である。
図14で示された3D画像復号装置001は、2つのデコーダを備えるため、2つのビューを並列に復号できる。したがって、交互に復号する必要はない。一方、図14で示された3D画像復号装置001では、フレーム周期Δtと同じ時間の復号遅延が発生する。そして、第2ビューのフレームは、第1ビューのフレームを参照しているため、第1ビューのフレームが復号された後に、復号される。結果として、第2ビューのフレームは、フレーム周期Δtの時間分遅れて、第1ビューのフレームと同時に復号される。
図16は、図14に示された3D画像復号装置001における各ビューの実際の復号時刻および表示時刻の例を示す図であって、図15で示された例とは異なる例を示す図である。
図16に示された復号時刻および表示時刻は、図15に示された復号時刻および表示時刻と比較して、第1ビューと第2ビューが同一時刻に表示されるように調整されている。図14で示された3D画像復号装置001は、このように、遅延バッファ904により、第1ビューと第2ビューを同一時刻に表示することもできる。
なお、実施の形態2における3D画像復号装置001は、2つのデコーダを備えるが、3以上のデコーダを備えてもよい。また、この場合、3D画像復号装置001では、ビュー間予測を用いて符号化された複数のビューを復号するときに、参照されるビューの階層分の遅延が発生する。
図17は、5つのビューにおけるビュー間予測の参照関係の例を示す図である。階層2のビューは、階層1のビューを参照し、階層3のビューは、階層2を参照する。この場合、同じDTSが付与されたフレームであっても、2つ分のフレームの復号遅延が発生する。つまり、複数のビューに含まれるビューの数よりも少ない、参照されるビューの階層の数に応じた遅延期間が発生する。
したがって、最大流入レートをRin、各フレームの復号に要する時間の最大値をTmax、および、ビュー間予測により参照されるビューの階層の最大値をmとした場合に、遅延期間中に読み込まれるデータ量であるDATA_INに相当する値は、式3によって得られる。
DATA_IN = Rin×Tmax×(m−1) (式3)
このように定められる補償バッファをSTDバッファに加えてもよい。
以上のように、実施の形態2における3D画像復号装置001は、複数のデコーダを備える場合であっても、ビュー間予測に用いられる参照画像を共有することにより、ビュー間予測を用いて符号化された複数のビューを復号することができる。
(実施の形態3)
次に、実施の形態3について説明する。実施の形態3における3D画像符号化装置は、3D画像復号装置において復号遅延が発生する場合であっても、復号できるように符号化する。
図18は、本発明の実施の形態3に係る3D画像符号化装置のブロック図である。第1ビューの画像601および第2ビューの画像611は、スイッチ701を介して、符号化処理部200のエンコーダ607bに入力される。ここで、第2ビューの画像611は、フレームバッファ621を経由して入力されるものとしてもよい。これにより、符号化処理部200は、第1ビューの画像601の符号化完了まで、第2ビューの画像611の符号化開始を遅らせるができる。
エンコーダ607bは、第1ビューおよび第2ビューを符号化する。また、エンコーダ607bは、画面間予測に使用する第1ビューおよび第2ビューのフレームを局所復号して、それぞれ、外部メモリ604の第1フレームメモリ605bおよび第2フレームメモリ606にコピーする。さらに、フレームの位置を示す第1フレームメモリ管理情報603dおよび第2フレームメモリ管理情報608を保持する。そして、エンコーダ607bは、第1フレームメモリ管理情報603dを用いて、第1フレームメモリ605bを参照することにより、第2ビューを符号化する。
レート制御部201は、符号化されたビットストリームが3D画像復号装置に所定の割合で読み込まれるように、エンコーダ607bに符号化させる。例えば、圧縮率、フレームレートおよび画素数などを調整する。これにより、3D画像復号装置におけるオーバーフローの発生が抑制される。
そして、符号化された第1ビューおよび第2ビューは、多重化ビットストリーム101として、システムエンコーダ610を介して出力される。
図19は、本発明の実施の形態3に係る3D画像符号化装置の効果を示す図である。
図18に示された3D画像符号化装置は、図19で示された想定サイズのエレメンタリ・ストリーム・バッファが、3D画像復号装置に備えられていると想定して符号化する。すなわち、3D画像符号化装置は、実際に3D画像復号装置に備えられているエレメンタリ・ストリーム・バッファのサイズから、復号遅延が発生している間に読み込まれるビットストリームのサイズを減算して得られた結果を制限値として、符号化する。これにより、復号遅延が発生している間も、確実にビットストリームが読み込まれる。
なお、復号遅延が発生している間に読み込まれるビットストリームのサイズは、実施の形態1において示されたDATA_INと同様であって、例えば、実施の形態1における式2により得られる。符号化するときの制限値は、復号が瞬時に完了することを想定して定められる規定サイズから、復号遅延が発生している間に読み込まれるビットストリームのサイズを減算して得られる値とすることができる。
図20は、本発明の実施の形態3の変形例に係る3D画像符号化装置のブロック図である。図20に示された3D画像符号化装置は、第1エンコーダ602aおよび第2エンコーダ607aの2つのエンコーダを備える。また、3D画像符号化装置は、第1エンコーダ602aおよび第2エンコーダ607aに接続されたレート制御部202を備える。
2つのエンコーダは、図14に示された2つのデコーダと同様に、フレームを共有する。すなわち、第1エンコーダ602aは、第1ビューのフレームを符号化した後、局所復号することにより、第1ビューのフレームを第1フレームメモリ605aに格納する。そして、フレームの位置を示す第1フレームメモリ管理情報603aを第1フレームメモリ管理情報603bにコピーする。第2エンコーダ607aは、第1フレームメモリ管理情報603bを第1フレームメモリ管理情報603cにコピーする。そして、第1フレームメモリ管理情報603cを参照することにより、第1ビューのフレームを参照し、ビュー間予測を用いて、第2ビューを符号化する。
レート制御部202は、図18におけるレート制御部201と同様に、符号化の制御を行う。すなわち、レート制御部202は、符号化されたビットストリームが3D画像復号装置に所定の割合で読み込まれるように、第1エンコーダ602aおよび第2エンコーダ607aに符号化させる。そして、2つのエンコーダにより符号化されたビットストリームは、スイッチ609を介して出力される。
このように構成することにより、2つのエンコーダを備える3D画像符号化装置であっても、3D画像復号装置に読み込まれるビットストリームのサイズを制限することができる。さらに、ビュー間予測を用いる画像を共有することにより、効率的に符号化できる。
なお、図18に示された3D画像符号化装置と同様に、第2ビューの画像611は、フレームバッファ621を経由して入力されるものとしてもよい。これにより、符号化処理部200は、第1ビューの画像601の符号化完了まで、第2ビューの画像611の符号化開始を遅らせることができる。
さらに、第1エンコーダ602aにより符号化された第1ビューのビットストリーム103は、ストリームバッファ622を介して出力されるものとしてもよい。これにより、第1ビューのビットストリーム103は、第2ビューの同一時刻におけるフレームの符号化が完了したタイミングで重畳される。よって、同一時刻のフレームが同一のタイミングで重畳される。
以上のように、実施の形態3における3D画像符号化装置は、ビュー間予測を用いて、画像復号装置でアンダーフローしないように、複数のビューを符号化する。また、複数のエンコーダを備える場合であっても、ビュー間予測に用いる参照画像を共有することにより、ビュー間予測を用いて、複数のビューを符号化することができる。
(実施の形態4)
次に、本発明に係る画像符号化方法および画像復号方法を用いる実施の形態4について、図面を参照して説明する。実施の形態4では、DTSおよびPTSの値は、それぞれのビューに対して異なる値を設定することができることを前提としている。なお、規格によりDTSおよびPTSが、それぞれ同一の値に設定される場合であっても、実際に復号および表示される時刻として、実施の形態4で示されるDTSおよびPTSを用いてもよい。
図21は、実施の形態4の3D画像復号装置のブロック図である。図21の3D画像復号装置は、3D映像の片側ビューの映像を3D映像のフレームレートと同じ速度で復号する能力を有する2つのデコーダとして、第1デコーダ107aおよび第2デコーダ112aを備える。そして、第1デコーダ107aは、第1ビューを復号し、第2デコーダ112aは、第2ビューを復号する。第2ビューは、第1ビューを参照して符号化されているため、第2デコーダ112aは、第1ビューの復号画像を参照できるように構成されている。
図21の3D画像復号装置の動作について説明する。入力された多重化ビットストリーム101は、スイッチ102において、第1ビューのビットストリーム103と第2ビューのビットストリーム104に分離される。そして、分離された各ビットストリームは、それぞれ第1入力バッファ105または第2入力バッファ106に入力される。さらに、入力された各ビットストリームは、DTSに従って第1デコーダ107aまたは第2デコーダ112aへと入力される。
第1デコーダ107aおよび第2デコーダ112aでは、それぞれ、入力された第1ビューのビットストリーム103および第2ビューのビットストリーム104を復号する。そして、各デコーダは、PTSに従って第1ビューの復号画像114または第2ビューの復号画像115を出力する。各復号画像は、ビデオ出力インターフェース116を介して3Dディスプレイ117にて3D画像として、表示される。
第1デコーダ107aおよび第2デコーダ112aは、復号処理において、画面間予測符号化で参照される復号済みのフレームを、外部メモリ109上の第1フレームメモリ110aまたは第2フレームメモリ111へコピーする。そして、コピーされたフレームは、参照されなくなるまで第1フレームメモリ110aおよび第2フレームメモリ111に保持される。
各フレームメモリには複数のフレームが保持されるため、第1デコーダ107aおよび第2デコーダ112aは、それぞれ、第1フレームメモリ管理情報108aおよび第2フレームメモリ管理情報113を保持することにより、どの時刻のフレームが第1フレームメモリ110aまたは第2フレームメモリ111上のどの位置に保持されているかを管理する。
ここで、第2ビューの符号化には、第1ビューのフレームを用いて予測するビュー間予測符号化が用いられている。そのため、第2デコーダ112aは、第2ビューの復号に、第1ビューの復号画像を参照する必要がある。そこで、第1デコーダ107aは、フレームの復号が終わる度に、第1フレームメモリ管理情報108aを外部メモリ109上に第1フレームメモリ管理情報108bとしてコピーする。そして、第2デコーダ112aは、フレームの復号開始前に、第1フレームメモリ管理情報108bを内部にコピーし、第1フレームメモリ管理情報108cとして保持する。
第2デコーダ112aは、第1フレームメモリ管理情報108cに基づいて、第1フレームメモリ110aに保持された第1ビューの所望のフレームの復号画像を参照する。そして、第2デコーダ112aは、ビュー間予測符号化を含む符号化方式で符号化された第2ビューのビットストリーム104を復号する。
なお、第1ビューのビットストリーム103は、他のビューを参照しておらず単独での復号が可能である。よって、実施の形態4における3D画像復号装置は、第1デコーダ107aのみを動作させ、第2デコーダ112aを動作させないことで、2D画像復号装置としても使用することが可能である。
また、第2デコーダ112aにおける第2ビューの復号処理において、ビットストリームSyntax異常など何らかの異常が検出された場合、3D画像復号装置は、上位システムに第2デコーダ112aの異常を通知してもよい。そして、3D画像復号装置は、ビットストリームのランダムアクセスポイント(飛び込み再生可能ポイント)などに到達することにより正常復号を再開できるまでの間、第1ビューの復号画像のみを表示してもよい。また、第1ビューの復号画像を第2ビューの復号画像として表示してもよい。このような表示等により、視聴者の不快感を軽減させることが可能である。
また、第1デコーダ107aにおける第1ビューの復号処理において、ビットストリームSyntax異常など何らかの異常が検出された場合は、第1ビューを参照する第2ビューも正常に復号できなくなる。そのため、3D画像復号装置は、上位システムに第1デコーダ107aの異常を通知してもよい。そして、3D画像復号装置は、ビットストリームのランダムアクセスポイント(飛び込み再生可能ポイント)などに到達することにより正常復号を再開できるまでの間、第1ビューおよび第2ビュー共に最後に正常復号できたフレームを出力し続けてもよい。このような出力等により、視聴者の不快感を軽減させることが可能である。
図22は、図21の3D画像復号装置の復号処理における、各ビューのPTSおよびDTSの関係の一例を示す図である。図22の例においては、各ビューのフレームは、表示順でI、B、BおよびPタイプ(Pタイプは一方向の予測のみを行う。Bタイプは双方向の予測を含む。)、符号化順でI、P、BおよびBタイプとして符号化されている。ビュー間予測による第2ビューからの第1ビューの参照は、直前に表示される第1ビューのフレームのみとしている。また第1ビューおよび第2ビューは交互に表示される。
本例では、第1ビューの先頭フレームI1がまず復号される。そして、第2ビューの先頭フレームP1は、第1ビューの先頭フレームI1を参照している。そのため、第1ビューの先頭フレームI1の復号が完了するまで、第2ビューの先頭フレームP1の復号が、開始できない。
図21の3D画像復号装置では、表示フレームレートと同じ速度の第1デコーダ107aを用いている。そのため、第1ビューの先頭フレームI1の復号にはフレーム周期Δt(=1/フレームレート)を要する。従って、第2ビューの先頭フレームP1のDTSは、第1ビューの先頭フレームI1のDTSからΔt後となる。第1ビューのフレームP4は、第1ビューのフレームI1を予測で使用する。そのため、第1ビューのフレームI1の復号完了後に復号を開始できる。
図21の3D画像復号装置においては、第1ビューと第2ビューの復号は別々のデコーダで実施する。そのため、第1ビューのフレームP4は、第2ビューのフレームP1と同時に復号できる。よって、第1ビューのフレームP4のDTSは、第2ビューのフレームP1のDTSと同じとなる。以降、第1ビューと第2ビューのフレームB2とP4、B3とB2、P7とB3、そして、B5とP7の順に、Δt間隔で、2つのビューのフレームの復号が同時に開始される。
次に、PTSについて説明する。表示順に対して復号順が最も遅いのは第2ビューのBフレームである。そのため、第2ビューのBフレームを表示できる時刻を基準に、第1ビューおよび第2ビューのフレームのPTSは、決定される。具体的には、第2ビューのフレームB2のPTSは、1フレームの復号にΔtを要するため、DTSのΔt後となる。この時刻を基準にして、第1ビューの先頭フレームI1のPTSは、DTSの5Δt/2後となり、第2ビューの先頭フレームP1のPTSは、DTSの2Δt後となる。
図23は、図21の3D画像復号装置で復号可能なビットストリームを作成する3D画像符号化装置の一例である。図23の3D画像符号化装置は、3D映像の片側ビューの映像を3D映像のフレームレートと同じ速度で符号化する能力を有する2つのエンコーダとして、第1エンコーダ602aおよび第2エンコーダ607aを備える。第1エンコーダ602aは、第1ビューを符号化し、第2エンコーダ607aは、第2ビューを符号化する。第1ビューを参照して第2ビューを符号化するため、第2エンコーダ607aは、第1ビューの局所復号画像を参照できるように構成されている。
局所復号画像を参照するための構成は、図21で示された3D画像復号装置と同様である。すなわち、第2エンコーダ607aは、第1フレームメモリ管理情報603cに基づいて、第1フレームメモリ605aに保持された第1ビューの所望のフレームの局所復号画像を参照する。そして、第2エンコーダ607aは、ビュー間予測符号化を含む符号化方式で第2ビューの画像611を符号化する。
図24は、図23の3D画像符号化装置のシステムエンコーダ610において、図22に示す符号化順に従って、第1ビューのフレームと第2ビューのフレームとを交互に、DTSおよびPTSを付与する手順を示すフローチャートである。図23の3D画像符号化装置において、図24のフローチャートに従ってDTSおよびPTSを付与することにより、図22に示すDTSおよびPTSを付与することができる。これにより、図21の3D画像復号装置において途切れることなく3D映像を再生できるビットストリームを作成することができる。作成されたビットストリームは、光ディスクやハードディスクに記録して持ち運ぶことができる。さらに、無線LANおよび光ファイバなどの通信手段を介して遠隔地へ伝送することができる。
図25は、図21の3D画像復号装置の復号処理における、各ビューのPTSおよびDTSの関係の一例を示す図である。図22とは、第1ビューおよび第2ビューが同時に表示される点が異なる以外は共通である。
図26は、図23の3D画像符号化装置のシステムエンコーダ610において、図25に示す符号化順に従って第1ビューと第2ビューのフレームに対して交互にDTSおよびPTSを付与する手順を示すフローチャートである。図23の3D画像符号化装置において、図26のフローチャートに従ってDTSおよびPTSを付与することにより、図25に示すDTSおよびPTSを付与することができる。これにより、図21の3D画像復号装置において途切れることなく3D映像を再生できるビットストリームを作成することができる。
図27は、図21の3D画像復号装置の第1の変形例を示す図である。第2ビューを復号する第2デコーダ112bは、第1ビューを復号する第1デコーダ107bの第1フレームメモリ管理情報108dを直接参照できるように構成されている。この構成により、外部メモリ109上および第2デコーダ112b内に第1ビューのフレームメモリ管理情報を保持する領域の確保が不要となり、回路面積を削減することが可能となる。
図28は、図21の3D画像復号装置の第2の変形例を示す図である。第2ビューを復号する第2デコーダ112cは、第1ビューを復号する第1デコーダ107cの第1フレームメモリ管理情報108aの管理手順をエミュレートすることにより、第1フレームメモリ管理情報108aと一致する第1フレームメモリ管理情報108eを保持するように構成されている。第2デコーダ112cにおいて、管理手順のエミュレートに必要な第1ビューのヘッダ情報(フレームの符号化タイプおよび時間情報など)は、多重化ビットストリーム101作成時に第2ビューのビットストリーム内に埋め込んでもよい。あるいは、図28の3D画像復号装置の上位システムから第2デコーダ112cへ通知するなどの手段により、ヘッダ情報が第2デコーダ112cへ通知されるようにしてもよい。
以上のように、実施の形態4における3D画像符号化装置は、複数のエンコーダを備える場合であっても、ビュー間予測に用いる参照画像を共有することにより、ビュー間予測を用いて、複数のビューを符号化することができる。また、実施の形態4における3D画像復号装置は、複数のデコーダを備える場合であっても、ビュー間予測に用いられる参照画像を共有することにより、ビュー間予測を用いて符号化された複数のビューを復号することができる。
(実施の形態5)
本発明に係る画像符号化方法および画像復号方法を用いる実施の形態5について、図面を参照して説明する。実施の形態5では、DTSおよびPTSの値は、それぞれのビューに対して異なる値を設定することができることを前提としている。なお、規格によりDTSおよびPTSが、それぞれ同一の値に設定される場合であっても、実際に復号および表示される時刻として、実施の形態5で示されるDTSおよびPTSを用いてもよい。
図29は、実施の形態5の3D画像復号装置のブロック図である。図29の3D画像復号装置は、3D映像の片側ビューの映像を3D映像のフレームレートの2倍の速度で復号する能力を有するデコーダ112dを備える。デコーダ112dは、第1ビューおよび第2ビューの両ビューを復号する。第2ビューは、第1ビューを参照して符号化されているため、図29の3D画像復号装置は、第2ビューの復号中に第1ビューの復号画像を参照できるように構成されている。
図29の3D画像復号装置の動作について説明する。入力された多重化ビットストリーム101は、入力バッファ901に入力され、DTSに従ってデコーダ112dへと入力される。デコーダ112dでは、入力された多重化ビットストリーム101を復号し、PTSに従って復号画像を出力する。スイッチ903は、出力されたビットストリームを第1ビューの復号画像114および第2ビューの復号画像115に分離する。各復号画像は、ビデオ出力インターフェース116を介して3Dディスプレイ117にて3D画像として、表示される。
デコーダ112dは、復号処理において、画面間予測符号化で参照される復号済みのフレームを、外部メモリ109上の第1フレームメモリ110bおよび第2フレームメモリ111へコピーする。そして、コピーされたフレームは、参照されなくなるまで第1フレームメモリ110bおよび第2フレームメモリ111に保持される。フレームメモリには複数のフレームが保持されるため、デコーダ112dは、第1フレームメモリ管理情報108fおよび第2フレームメモリ管理情報113を保持し、どの時刻のフレームが第1フレームメモリ110bおよび第2フレームメモリ111上のどの位置に保持されているかを管理する。
ここで、第2ビューの符号化には、第1ビューのフレームを用いて予測するビュー間予測符号化が用いられている。そのため、デコーダ112dは、第2ビューの復号に、第1ビューの復号画像を参照する必要がある。そこで、デコーダ112dは、第1ビューのフレームの復号が終わる度に、第1フレームメモリ管理情報108fを更新する。そして、第2ビューの復号中も、第1フレームメモリ管理情報108fを保持する。デコーダ112dは、第1フレームメモリ管理情報108fに基づいて、第1フレームメモリ110bに保持された第1ビューの所望のフレームの復号画像を参照する。そして、デコーダ112dは、ビュー間予測符号化を含む符号化方式で符号化された第2ビューのビットストリームを復号する。
なお、第1ビューのビットストリームは、他のビューを参照しておらず単独での復号が可能である。よって、デコーダ112dが第2ビューのビットストリームを読み飛ばすことで、3D画像復号装置は、2D画像復号装置としても使用することが可能である。
また、デコーダ112dにおける第2ビューの復号処理において、ビットストリームSyntax異常など何らかの異常が検出された場合は、ビットストリームのランダムアクセスポイント(飛び込み再生可能ポイント)などに到達することにより正常復号を再開できるまでの間、3D画像復号装置は、第1ビューの復号画像のみを表示してもよい。また、第1ビューの復号画像を第2ビューの復号画像として表示してもよい。このような表示等により、視聴者の不快感を軽減させることが可能である。
また、デコーダ112dにおける第1ビューの復号処理において、ビットストリームSyntax異常など何らかの異常が検出された場合は、第1ビューを参照する第2ビューも正常に復号できなくなる。そのため、3D画像復号装置は、上位システムにデコーダ112dの異常を通知して、ビットストリームのランダムアクセスポイント(飛び込み再生可能ポイント)などに到達して正常復号を再開できるまでの間、第1ビューおよび第2ビュー共に最後に正常復号できたフレームを出力し続けてもよい。このような出力等により、視聴者の不快感を軽減させることが可能である。
図30は、図29の3D画像復号装置の復号処理における、各ビューのPTSおよびDTSの関係の一例を示す図である。図30の例においては、各ビューのフレームは、表示順でI、B、BおよびPタイプ(Pタイプは一方向の予測のみを行う。Bタイプは双方向の予測を含む。)、符号化順でI、P、BおよびBタイプとして符号化されている。ビュー間予測による第2ビューからの第1ビューの参照は、直前に表示される第1ビューのフレームのみである。また第1ビューおよび第2ビューは交互に表示される。
本例では、第1ビューの先頭フレームI1がまず復号される。そして、第2ビューの先頭フレームP1は、第1ビューの先頭フレームI1を参照している。そのため、第1ビューの先頭フレームI1の復号が完了するまで、第2ビューの先頭フレームP1の復号が開始できない。図29の3D画像復号装置は、表示フレームレートの倍の速度のデコーダ112dを用いているため、第1ビューの先頭フレームI1の復号にはフレーム周期Δt/2(Δt=1/フレームレート)を要する。
従って、第2ビューの先頭フレームP1のDTSは、第1ビューの先頭フレームI1のDTSからΔt/2後となる。第1ビューのフレームP4は、第1ビューのフレームI1を予測で使用するため、本来は第1ビューのフレームI1の復号完了後に復号を開始できる。しかしながら、図29の3D画像復号装置においては、第1ビューと第2ビューの復号を1つのデコーダで実施するため、第2ビューのフレームP1と同時に復号できない。そこで、第1ビューのフレームP4のDTSは、第2ビューのフレームP1のDTSからΔt/2後となる。以降、第1ビューと第2ビューのフレームがΔt/2間隔で交互に復号が開始される。
次に、PTSについて説明する。表示順に対して復号順が最も遅いのは第2ビューのBフレームである。そのため、第2ビューのBフレームを表示できる時刻を基準に、第1ビューおよび第2ビューのフレームのPTSは、決定される。具体的には、第2ビューのフレームB2のPTSは、1フレームの復号にΔt/2を要するため、DTSのΔt/2後となる。この時刻を基準にして、第1ビューの先頭フレームI1のPTSは、DTSの3Δt/2後となり、第2ビューの先頭フレームP1のPTSは、DTSの2Δt後となる。
図31は、図29の3D画像復号装置で復号可能なビットストリームを作成する3D画像符号化装置の一例である。図31の3D画像符号化装置は、3D映像の片側ビューの映像を3D映像のフレームレートの倍の速度で符号化する能力を有するエンコーダ607bを備える。エンコーダ607bは、第1ビューおよび第2ビューを符号化する。第2ビューは、第1ビューを参照して第2ビューを符号化するため、エンコーダ607bは、第2ビューの符号化中においても第1ビューの局所復号画像を参照できるように構成されている。
図32は、図31の3D画像符号化装置のシステムエンコーダ610において、図30に示す符号化順に従って、第1ビューのフレームと第2ビューのフレームとを交互に、DTSおよびPTSを付与する手順を示すフローチャートである。図31の3D画像符号化装置において、図32のフローチャートに従ってDTSおよびPTSを付与することにより、図30に示すDTSおよびPTSを付与することができる。これにより、図29の3D画像復号装置において途切れることなく3D映像を再生できるビットストリームを作成することができる。作成されたビットストリームは、光ディスクやハードディスクに記録して持ち運ぶことができる。さらに、無線LANおよび光ファイバなどの通信手段を介して遠隔地へ伝送することができる。
図33は、図29の3D画像復号装置の復号処理における、各ビューのPTSおよびDTSの関係の一例を示す図である。図30とは、第1ビューおよび第2ビューが同時に表示される点が異なる以外は共通である。
図34は、図31の3D画像符号化装置のシステムエンコーダ610において、図33に示す符号化順に従って、第1ビューのフレームと第2ビューのフレームとを交互に、DTSおよびPTSを付与する手順を示すフローチャートである。図31の3D画像符号化装置において、図34のフローチャートに従ってDTSおよびPTSを付与することにより、図33に示すDTSおよびPTSを付与することができる。これにより、図29の3D画像復号装置において途切れることなく3D映像を再生できるビットストリームを作成することができる。
以上のように、実施の形態5における3D画像符号化装置は、ビュー間予測を用いて、複数のビューを符号化することができる。また、実施の形態5における3D画像復号装置は、ビュー間予測を用いて符号化された複数のビューを復号することができる。
(実施の形態6)
図22および図30に示されるように、3D画像復号装置の構成(等速性能を有する2デコーダまたは倍速性能を有する1デコーダ)によって、DTSとPTSの付与方法が異なってしまうことが分かる。そこで、実施の形態6では、ビットストリーム作成時に想定した3D画像復号装置の構成と、実際の3D画像復号装置の構成の組合せに応じて、復号処理を切替える方法について説明する。
図35は、実際の3D画像復号装置が等速性能を有する2デコーダであった場合に、ビットストリーム作成時に3D画像符号化装置により想定された3D画像復号装置の構成に応じて、3D画像復号装置が処理を切替える手順を示すフローチャートである。図36は、図35に示された手順に従って、処理を切替える3D画像復号装置の例を示す図である。
実際の構成と想定の構成が異なる場合、図36に示される3D画像復号装置は、遅延バッファ1601により第2ビューのビットストリームをΔt/2遅らせ、遅延バッファ1602および遅延バッファ1603により、それぞれ第1ビューおよび第2ビューの表示をΔt遅らせる。これにより、途切れることなく3D映像を再生することができる。
図37は、実際の3D画像復号装置が倍速性能を有する1デコーダであった場合に、ビットストリーム作成時に3D画像符号化装置により想定された3D画像復号装置の構成に応じて、3D画像復号装置が処理を切替える手順を示すフローチャートである。図38は、図37に示された手順に従って、処理を切替える3D画像復号装置の例を示す図である。
実際の構成と想定の構成が異なる場合、図38に示される3D画像復号装置は、スイッチ1701により多重化ビットストリーム101を第1ビューと第2ビューのビットストリームに分離する。そして、第1ビューのビットストリームを遅延バッファ1702によりΔt遅らせ、第2ビューのビットストリームを遅延バッファ1704によりΔt/2遅らせる。その後、第1ビューおよび第2ビューのビットストリームは、それぞれ、第1入力バッファ1703および第2入力バッファ1705に入力され、スイッチを介して、復号処理部100に入力される。その後の処理は、図29に示された3D画像復号装置と同様である。
これにより、途切れることなく3D映像を再生することができる。
以上のように、実施の形態6における3D画像復号装置は、ビュー間予測を用いて符号化された複数のビューを復号するとき、バッファを使用することにより復号時刻および表示時刻を調整する。
(その他の変形例)
なお、本発明を上記の実施の形態に基づいて説明してきたが、本発明は、上記の実施の形態に限定されないのはもちろんである。以下のような場合も本発明に含まれる。
(1)上記の各装置は、具体的には、マイクロプロセッサ、ROM(Read Only Memory)、RAM(Random Access Memory)、ハードディスクユニット、ディスプレイユニット、キーボードおよびマウスなどから構成されるコンピュータシステムである。前記RAMまたはハードディスクユニットには、コンピュータプログラムが記憶されている。前記マイクロプロセッサが、前記コンピュータプログラムにしたがって動作することにより、各装置は、その機能を達成する。ここでコンピュータプログラムは、所定の機能を達成するために、コンピュータに対する指令を示す命令コードが複数個組み合わされて構成されたものである。
(2)上記の各装置を構成する構成要素の一部または全部は、1個のシステムLSI(Large Scale Integration:大規模集積回路)から構成されているとしてもよい。システムLSIは、複数の構成要素を1個のチップ上に集積して製造された超多機能LSIであり、具体的には、マイクロプロセッサ、ROM、RAMなどを含んで構成されるコンピュータシステムである。前記RAMには、コンピュータプログラムが記憶されている。前記マイクロプロセッサが、前記コンピュータプログラムにしたがって動作することにより、システムLSIは、その機能を達成する。
(3)上記の各装置を構成する構成要素の一部または全部は、各装置に脱着可能なIC(Integrated Circuit)カードまたは単体のモジュールから構成されているとしてもよい。前記ICカードまたは前記モジュールは、マイクロプロセッサ、ROM、RAMなどから構成されるコンピュータシステムである。前記ICカードまたは前記モジュールは、上記の超多機能LSIを含むとしてもよい。マイクロプロセッサが、コンピュータプログラムにしたがって動作することにより、前記ICカードまたは前記モジュールは、その機能を達成する。このICカードまたはこのモジュールは、耐タンパ性を有するとしてもよい。
(4)本発明は、上記に示す方法であるとしてもよい。また、これらの方法をコンピュータにより実現するコンピュータプログラムであるとしてもよいし、前記コンピュータプログラムからなるデジタル信号であるとしてもよい。
また、本発明は、前記コンピュータプログラムまたは前記デジタル信号をコンピュータ読み取り可能な記録媒体、例えば、フレキシブルディスク、ハードディスク、CD−ROM、MO、DVD、DVD−ROM、DVD−RAM、BD(Blu−ray Disc)、半導体メモリなどに記録したものとしてもよい。また、これらの記録媒体に記録されている前記デジタル信号であるとしてもよい。
また、本発明は、前記コンピュータプログラムまたは前記デジタル信号を、電気通信回線、無線または有線通信回線、インターネットを代表とするネットワーク、あるいは、データ放送等を経由して伝送するものとしてもよい。
また、本発明は、マイクロプロセッサとメモリを備えたコンピュータシステムであって、前記メモリは、上記コンピュータプログラムを記憶しており、前記マイクロプロセッサは、前記コンピュータプログラムにしたがって動作するとしてもよい。
また、前記プログラムまたは前記デジタル信号を前記記録媒体に記録して移送することにより、または、前記ネットワーク等を経由して前記プログラムまたは前記デジタル信号を移送することにより、独立した他のコンピュータシステムにより実施するとしてもよい。
(5)上記実施の形態、上記変形例、および、それらにおいて示された構成要素をそれぞれ組み合わせるとしてもよい。
なお、複数のビューから選択される第1ビューは、ベースビューでなくてもよい。第1ビューがベースビューではない場合であっても、本発明により同様の効果が得られる。
また、3D画像復号装置および3D画像符号化装置における例を中心に説明したが、本発明は、3D画像復号装置および3D画像符号化装置に限らず、ビュー間予測を用いる画像復号装置および画像符号化装置に適用できる。
本発明に係る画像復号装置および画像符号化装置によれば、MVC等のビュー間の予測を用いた高性能な画像符号化方式により、要求性能の増加を最小限に抑えて、3D映像を復号および符号化することが可能となる。よって、より高品位な3D映像の映画タイトルなどの動画コンテンツを市場に供給することができ、映画市場や民生機器市場を活性化させることができる。したがって、本発明に係る画像復号装置および画像符号化装置は、映画産業や民生機器産業において高い利用可能性をもつ。
001 3D画像復号装置
100 復号処理部
101 多重化ビットストリーム
101b、101e パケット
102、609、701、903、913、914、1701 スイッチ
103、104 ビットストリーム
105、1703 第1入力バッファ
106、1705 第2入力バッファ
107a、107b、107c 第1デコーダ
108a、108b、108c、108d、108e、108f、108g、603a、603b、603c、603d 第1フレームメモリ管理情報
109、604 外部メモリ
110a、110b、110c、605a、605b 第1フレームメモリ
111、121、606 第2フレームメモリ
112a、112b、112c 第2デコーダ
112d、112e デコーダ
113、120、608 第2フレームメモリ管理情報
114、115 復号画像
116 ビデオ出力インターフェース
117 3Dディスプレイ
200 符号化処理部
201、202 レート制御部
601、611 画像
602a 第1エンコーダ
607a 第2エンコーダ
607b エンコーダ
610 システムエンコーダ
621 フレームバッファ
622 ストリームバッファ
900 バッファメモリ
901 入力バッファ
902 STDバッファ
902a、9021a、9022a トランスポート・バッファ(TB)
902b、9021b、9022b マルチプレクシング・バッファ(MB)
902c、9021c、9022c エレメンタリ・ストリーム・バッファ(EB)
902d、9022d 補償バッファ
904、1601、1602、1603、1702、1704 遅延バッファ
1801 光ディスク
1802A、1802B、1802C、1803A、1803B、1803C ストリーム
1804 2D再生装置
1805 3D再生装置
1806 立体メガネ
本発明は、ビュー間予測を用いて符号化された映像を復号する画像復号装置、ビュー間予測を用いて映像を符号化する画像符号化装置に関する。
映画作品などの動画コンテンツを頒布するには、DVDおよびBlu−ray Disc等の光ディスクが広く用いられている。特にBlu−ray Discは、これまでのDVDがSD(Standard Definition)であるのに対して、最大1920x1080であるHD(High Definition)まで扱えるため、より高画質の映像を格納することができる。光ディスクには、これまで通常の2D(2次元)映像が格納されてきたが、近年では立体表示を行える3D(3次元)映像を楽しめる映画館が増加していることに伴い、3D映像を高画質のまま光ディスクに格納することが求められてきている。
3D映像が格納された光ディスクは、2D映像が格納された光ディスクのみを再生できる再生装置(以下、「2D再生装置」と呼ぶ。)との再生互換性が求められる。3D映像が格納された光ディスクを、2D再生装置が2D映像として再生できない場合、同じコンテンツに対して「3D映像用光ディスク」と「2D映像用光ディスク」の2種類を製作する必要があり、コスト高になってしまう。よって、3D映像が格納された光ディスクは、2D再生装置では2D映像として再生し、2D映像と3D映像を再生できる再生装置(以下、「2D/3D再生装置」と呼ぶ。)では、2D映像もしくは3D映像として再生できることが求められる。
3D映像が格納された光ディスクで、再生互換性を確保するための光ディスクと再生装置の従来例としては、図39に示すような方法が知られている。
光ディスク1801には、左目用の画面が格納された左目用映像ストリームと右目用の画面が格納された右目用映像ストリームが多重化されて格納されている。左目用映像ストリームと右目用映像ストリームのフレームレートは同じで、再生表示時刻は交互になっている。例えば、各映像ストリームが1秒間に24フレームのフレームレートの場合は、左目用映像ストリームと右目用映像ストリームが1/48秒ごとに交互に表示されることになる。各映像ストリームは多重化され、光ディスク1801には1GOP以上の画像情報の記録単位でインターリーブ、つまり交互にディスク上に配置されている。
図39では、ストリーム1802A、ストリーム1802Bおよびストリーム1802Cに左目用映像ストリームが、ストリーム1803A、ストリーム1803Bおよびストリーム1803Cに右目用映像ストリームが光ディスク1801上にインターリーブ配置される。左目用映像ストリームが配置されたストリーム1802A、ストリーム1802Bおよびストリーム1802Cは、それぞれを順次再生した場合に、再生が途切れないように光ディスク1801のシーク性能および読み込み速度等を元に配置されている。
光ディスク1801は、2D再生装置1804に装填されると、左目用映像ストリームであるストリーム1802A、ストリーム1802Bおよびストリーム1802Cが再生され2D映像を出力する。
一方で、光ディスク1801が3D映像を再生できる3D再生装置1805に装填された場合、または、光ディスク1801が2D/3D再生装置に装填され、ユーザが3D再生を選択した場合は、左目用映像ストリームと右目用映像ストリームがインターリーブブロック単位で交互に読み込まれる。つまり、ストリーム1802A、ストリーム1803A、ストリーム1802B、ストリーム1803B、ストリーム1802Cおよびストリーム1803Cの順で、ドライブのシークが発生しないように連続的に読み込まれる。
読み込まれた映像ストリームは、左目用映像ストリームは左目用映像デコーダに、右目用映像ストリームは右目用映像デコーダに入力され、それぞれ両方のストリームを復号して左目画面および右目画面が交互にテレビに出力される。左目用映像ストリームと右目用映像ストリームの復号は同一のデコーダで実施してもよい。この出力画像は、1/48秒毎に右目と左目のシャッタが切り替わる立体メガネ1806で見ると立体映像に見える。
このような構成にすることで、3D映像が格納されたディスクが、2D再生装置で2D映像を再生し、3D再生装置または2D/3D再生装置では3D映像を再生することができる。この3D映像が格納された光ディスクでの再生互換性を確保するための技術についての先行技術としては、以下の特許文献1に記載されたものがある。
ISO/IEC MPEGとITU−T VCEGの共同プロジェクトであるJoint Video Team(JVT)は、2008年7月にMultiview Video Coding(MVC)と呼ばれるMPEG−4 AVC/H.264の修正規格の策定を完了した。MVCは、複数視点(ビュー)の映像をまとめて符号化する規格であり、映像の時間方向の類似性だけでなくビュー間の類似性も予測符号化に利用することで、複数ビューの独立した圧縮に比べて圧縮効率を向上している。
図40は、2視点の場合の予測参照の例を示す図である。ベースビュー(以下、第1ビューと呼ぶ場合がある。)と呼ばれるビューからは他のビューを参照することが禁止されており、ベースビューは単独で復号することができるため、2D再生装置との親和性が高い。また、MVCの多重化方式についても、MPEG−2システム規格の追補版の規格化が進行中であり、以下の非特許文献1に記載されたドラフトが発行済である。
非特許文献1では、MVCの映像ストリームをパケット多重化する方法、および、パケット多重化されたMVCのデータを読み込み、逆多重化してMVCのビットストリームを取り出し、デコーダに入力するまでの一連の動作を定めたシステム・ターゲット・デコーダなどについて規定している。
規定に基づく再生装置は、システム・ターゲット・デコーダに規定されたサイズのバッファを備える。非特許文献1に記載の通り、バッファには、デコーダに近い順に、エレメンタリ・ストリーム・バッファ(EB)、マルチプレクシング・バッファ(MB)、および、トランスポート・バッファ(TB)が含まれる。以下、これらバッファを総称してSTD(System Target Decoder)バッファと呼ぶ。規定に基づく再生装置は、規定されたデータの読み込みタイミングと読み込みレートに従って動作すれば、STDバッファをオーバーフローおよびアンダーフローさせることなく、所定の復号時刻において各フレームを復号できると考えられている。
国際公開第97/032437号
Text of ISO/IEC 13818−1:2007/FPDAM 4 − Transport of Multiview Video over ITU−T Rec H.222.0 | ISO/IEC 13818−1
従来例の課題を述べる。
図39の従来の再生装置において、MVCのようなビュー間の予測を使用する画像符号化方法を用いて2視点画像の符号化効率の向上を図る場合、ビュー間の予測に使用する第1ビューのフレームが、他方のビュー(以下、第2ビューと呼ぶ。)から参照される前に復号されている必要がある。これは、第1ビューと第2ビューの復号を同一のデコーダで実施する場合でも同様である。
また、光ディスク1801に格納された従来の多重化ストリームにおいては、第1ビューと第2ビューに対して同一の復号時刻(デコーディング・タイム・スタンプ。以下、DTSと呼ぶ。)が付与されており、第1ビューの復号を瞬時に完了することを前提としていた。なお、DTS、および、表示時刻(プレゼンテーション・タイム・スタンプ。以下、PTSと呼ぶ。)は、MPEG−2システム規格のPES(Packetized Elementary Stream)パケットのヘッダ、MVCのビットストリーム内のパラメータ、あるいは、Blu−ray Discなどの応用規格において再生時に参照されるデータベース情報から取得できる。
しかしながら、実際の再生装置において第1ビューの復号を瞬時に完了することは不可能であり、以下の課題があった。
従来の再生装置では、DTSに基づいて各ビューの復号時刻を決定していたが、実際には、第1ビューの復号開始時刻において第2ビューの復号を開始できないため、第2ビューの復号時刻を決定できない。すなわち、複数のビューがビュー間予測を含む方法で符号化されている場合、付与されているDTSに基づく復号時刻に復号できないという本質的な第1の課題があった。
また、従来のシステム・ターゲット・デコーダでは、第1ビューの復号が瞬時に完了することを前提にSTDバッファのサイズが規定されていたため、第1ビューの復号が瞬時に完了しない場合、その間に、STDバッファがオーバーフローしてSTDバッファにデータを読み込むことができず、後続フレームのデータがDTSまでに揃わないという第2の課題があった。
以下、第2の課題について、図41および図42を参照して説明する。図41は復号が瞬時に完了するケース、図42は第1ビューの復号にT_decの時間を要するケースにおける、エレメンタリ・ストリーム・バッファの占有量を示す。
図41では、DTS1、DTS2およびDTS3において、それぞれ、フレーム1、フレーム2およびフレーム3の第1ビューと第2ビューのストリームデータが同時に引き抜かれて、瞬時に復号される。
一方、図42では、DTS1においてフレーム1の第1ビューのストリームデータが、DTS1からT_dec遅れた時刻においてフレーム1の第2ビューのストリームデータが引き抜かれ、フレーム2以降も同様に処理される。このとき、エレメンタリ・ストリーム・バッファは、時刻Tfullにおいてオーバーフローしてしまい、時刻Tfullから第2ビューの復号時刻(DTS1+T_dec)までの間、データが読み込めない。結果として、DTS3においてフレーム3の第1ビューのデータが揃わず、エレメンタリ・ストリーム・バッファがアンダーフローしてしまう。
本発明は、上記の課題を解決するものであり、復号が瞬時に完了されない場合であっても、ビュー間予測を用いて符号化された複数のビューを復号することができる画像復号装置、または、復号することができるようにビュー間予測を用いて複数のビューを符号化する画像符号化装置を提供することを目的とする。
上記従来の課題を解決するために、本発明の画像復号装置は、ビュー間予測を含む方法で符号化された、各ビューにピクチャを含む複数のビューを有するビットストリームを復号する画像復号装置であって、符号化された第1ビューのビットストリーム、および、前記第1ビューを参照して符号化された第2ビューのビットストリームを復号する復号処理部と、前記復号処理部に入力されるビットストリームを保持するために前記復号処理部の前段に配置されたバッファメモリとを備え、前記復号処理部は、前記第1ビューおよび前記第2ビューに付与された復号時刻が同一の場合において、前記第2ビューに付与された復号時刻に前記第1ビューのピクチャの復号が完了するまでに要する遅延時間を加算して得られた時刻に前記第2ビューのピクチャを復号する。
これにより、第1ビューのピクチャが復号された後に、第1ビューのピクチャを参照して第2ビューのピクチャが復号される。よって、ビュー間予測を用いて符号化された複数のビューを復号することができる。
また、前記バッファメモリには、前記ビットストリームに付与されたデータ読み込みレートに従って前記ビットストリームが読み込まれ、前記復号処理部は、前記複数のビューに含まれる各ビューのビットストリームを復号するときに、前記バッファメモリから、復号する前記各ビューのビットストリームを引き抜き、前記バッファメモリのサイズは、前記復号処理部が前記遅延時間を加算して得られた時刻に前記第2ビューのビットストリームを引き抜いた場合において、前記復号処理部が前記各ビューのビットストリームを引き抜くときに、前記バッファメモリがアンダーフローしない最小のサイズ以上であってもよい。
これにより、復号遅延に起因するアンダーフローを起こすことなく、符号化されたデータが読み込まれる。したがって、画像復号装置は、より確実にデータを復号できる。
また、前記バッファメモリのサイズは、前記各ビューに付与された復号時刻に前記各ビューのビットストリームが引き抜かれることを前提に定められる規定サイズに、前記遅延時間中において前記データ読み込みレートに従って読み込まれるビットストリームのサイズを加算したサイズ以上であってもよい。
これにより、バッファメモリのサイズを定めることができる。
また、前記復号処理部は、前記複数のビューのビットストリームを逐次復号し、前記バッファメモリのサイズは、前記複数のビューに含まれるビューの数をn、前記複数のビューに含まれる各ピクチャの復号に要する時間の最大値をT、前記データ読み込みレートをR、および、前記規定サイズをDとした場合、D+R×T×(n−1)以上のサイズであってもよい。
これにより、複数のビューのビットストリームが逐次復号される場合において、より具体的に、バッファメモリのサイズが定められる。
また、前記復号処理部は、前記複数のビューのビットストリームを並列に復号し、前記バッファメモリのサイズは、ビュー間予測により参照されるビューの階層の最大値をm、前記複数のビューに含まれる各ピクチャの復号に要する時間の最大値をT、前記データ読み込みレートをR、および、前記規定サイズをDとした場合、D+R×T×(m−1)以上のサイズであってもよい。
これにより、複数のビューのビットストリームが並列に復号される場合において、より具体的に、バッファメモリのサイズが定められる。
また、前記復号処理部は、さらに、前記複数のビューに含まれるピクチャを記憶するための外部メモリと、前記第1ビューのビットストリームを復号し、ビュー間予測に使用されるピクチャを前記外部メモリに記憶させる第1デコーダと、前記ピクチャの保持されている前記外部メモリ内の位置を示す管理情報を参照して、前記外部メモリからビュー間予測に使用されるピクチャを取得することにより、前記第2ビューのビットストリームを復号する第2デコーダとを備えてもよい。
これにより、2つのデコーダを備える画像復号装置であっても、それぞれのデコーダは、ビュー間予測に用いられる参照画像を共有できる。
また、前記バッファメモリには、前記遅延時間により読み込まれなかったビットストリームがある場合、前記ビットストリームに付与されたデータ読み込みレートよりも高速に前記ビットストリームが読み込まれてもよい。
これにより、復号遅延が発生している間に読み込まれなかったデータが読み込まれる。したがって、画像復号装置は、より確実にデータを復号できる。
また、前記復号処理部は、さらに、前記複数のビューに含まれるピクチャを記憶するための外部メモリと、前記第1ビューのビットストリームを復号し、ビュー間予測に使用されるピクチャを前記外部メモリに記憶させる第1デコーダと、前記ピクチャの保持されている前記外部メモリ内の位置を示す管理情報を参照して、前記外部メモリからビュー間予測に使用されるピクチャを取得することにより、前記第2ビューのビットストリームを復号する第2デコーダとを備えてもよい。
これにより、2つのデコーダを備える画像復号装置であっても、それぞれのデコーダは、ビュー間予測に用いられる参照画像を共有できる。そして、このような共有は、高速にビットストリームが読み込まれる場合にも、適用されうる。
また、本発明の画像符号化装置は、ビュー間予測を含む方法で、各ビューにピクチャを含む複数のビューを符号化する画像符号化装置であって、前記複数のビューを符号化し、前記複数のビューに同一の復号時刻を付与する符号化処理部と、符号化された前記複数のビューを読み込む画像復号装置のバッファメモリのサイズが、前記復号時刻に復号が瞬時に完了することを想定して定められる規定サイズより、ビュー間予測により参照されるビューの復号が完了するまでに要する遅延時間中に読み込まれる符号化された前記複数のビューのデータサイズを減算して得られるサイズ以下であるとして、符号化処理部に符号化させるレート制御部とを備える画像符号化装置でもよい。
これにより、複数のビューは、画像復号装置でアンダーフローしないように符号化される。
また、前記レート制御部は、前記画像復号装置のバッファメモリのサイズが、符号化された前記複数のビューの数をn、前記複数のビューに含まれる各ピクチャの復号に要する時間の最大値をT、符号化された前記複数のビューを読み込むときのデータ読み込みレートをR、および、前記規定サイズをDとした場合、D−R×T×(n−1)以下のサイズであるとして、符号化処理部に符号化させてもよい。
これにより、より具体的に、符号化における制限を設けることができる。
また、前記符号化処理部は、さらに、前記複数のビューに含まれるピクチャを記憶するための外部メモリと、前記複数のビューに含まれる第1ビューの符号化し、ビュー間予測に使用されるピクチャを外部メモリに記憶させる第1エンコーダと、前記ピクチャの保持されている前記外部メモリ内の位置を示す管理情報を参照して、前記外部メモリからビュー間予測に使用される前記第1ビューのピクチャを取得することにより、ビュー間予測を使用して前記複数のビューに含まれる第2ビューを符号化する第2エンコーダとを備えてもよい。
これにより、2つのエンコーダを備える画像符号化装置であっても、それぞれのエンコーダは、ビュー間予測に用いられる参照画像を共有できる。
また、本発明の画像復号方法は、ビュー間予測を含む方法で符号化された、各ビューにピクチャを含む複数のビューを有するビットストリームを復号する画像復号方法であって、符号化された第1ビューのビットストリーム、および、前記第1ビューを参照して符号化された第2ビューのビットストリームを復号する復号処理ステップと、前記復号処理ステップの前に、復号処理ステップに入力されるビットストリームを保持するデータ保持ステップとを含み、前記復号処理ステップでは、前記第1ビューおよび前記第2ビューに付与された復号時刻が同一の場合において、前記第2ビューに付与された復号時刻に前記第1ビューのピクチャの復号が完了するまでに要する遅延時間を加算して得られた時刻に前記第2ビューのピクチャを復号する画像復号方法でもよい。
これにより、第1ビューのピクチャが復号された後に、第1ビューのピクチャを参照して第2ビューのピクチャが復号される。よって、ビュー間予測を用いて符号化された複数のビューを復号することができる。
また、本発明の画像符号化方法は、ビュー間予測を含む方法で、各ビューにピクチャを含む複数のビューを符号化する画像符号化方法であって、前記複数のビューを符号化し、前記複数のビューに同一の復号時刻を付与する符号化処理ステップと、符号化された前記複数のビューを読み込む画像復号装置のバッファメモリのサイズが、前記復号時刻に復号が瞬時に完了することを想定して定められる規定サイズより、ビュー間予測により参照されるビューの復号が完了するまでに要する遅延時間中に読み込まれる符号化された前記複数のビューのデータサイズを減算して得られるサイズ以下であるとして、符号化処理ステップに符号化させるレート制御ステップとを含む画像符号化方法でもよい。
これにより、複数のビューは、画像復号装置でアンダーフローしないように符号化される。
また、前記画像復号方法に含まれるステップをコンピュータに実行させるプログラムでもよい。
これにより、前記画像復号方法がプログラムとして実現される。
また、前記画像符号化方法に含まれるステップをコンピュータに実行させるプログラムでもよい。
これにより、前記画像符号化方法がプログラムとして実現される。
本発明により、復号が瞬時に完了されない場合であっても、ビュー間予測を含む方法で符号化されたビットストリームが復号される。
図1は、本発明の実施の形態1に係る3D画像復号装置のブロック図である。 図2は、本発明の実施の形態1における各ビューの実際の復号時刻および表示時刻の例を示す図である。 図3は、本発明の実施の形態1における各ビューの実際の復号時刻の決定方法を示すフローチャートである。 図4は、図3に示す各ビューの実際の復号時刻の決定方法の変形例を示すフローチャートである。 図5は、本発明の実施の形態1に係る3D画像復号装置における補償バッファの説明図である。 図6は、本発明の実施の形態1に係る補償バッファの効果を示す図である。 図7は、図5に示す補償バッファの配置の変形例を示す図である。 図8は、図5に示す補償バッファの配置の変形例を示す図である。 図9は、2つ以上のビューを有する場合の動作を説明する図である。 図10は、高速読み込みの場合の動作を説明する図である。 図11は、本発明の実施の形態1に係る構成要素を示す図である。 図12は、本発明の実施の形態1に係る3D画像復号装置の変形例のブロック図である。 図13は、本発明の実施の形態1の変形例における各ビューの実際の復号時刻および表示時刻の例を示す図である。 図14は、本発明の実施の形態2に係る3D画像復号装置のブロック図である。 図15は、本発明の実施の形態2における各ビューの実際の復号時刻および表示時刻の例を示す図である。 図16は、図15に示す各ビューの実際の復号時刻および表示時刻の変形例を示す図である。 図17は、複数のビューの参照関係の例を示す図である。 図18は、本発明の実施の形態3に係る3D画像符号化装置のブロック図である。 図19は、本発明の実施の形態3に係る3D画像符号化装置の効果を示す図である。 図20は、本発明の実施の形態3に係る3D画像符号化装置の変形例のブロック図である。 図21は、本発明の実施の形態4に係る3D画像復号装置のブロック図である。 図22は、2つのデコーダを備える3D画像復号装置で再生できるPTSおよびDTSの一例を示す図である。 図23は、本発明の実施の形態4に係る3D画像符号化装置のブロック図である。 図24は、図22に示すPTSおよびDTSの決定方法の一例を示すフローチャートである。 図25は、2つのデコーダを備える3D画像復号装置で再生できるPTSおよびDTSの一例を示す図である。 図26は、図25に示すPTSおよびDTSの決定方法の一例を示すフローチャートである。 図27は、本発明の実施の形態4に係る3D画像復号装置の変形例のブロック図である。 図28は、本発明の実施の形態4に係る3D画像復号装置の変形例のブロック図である。 図29は、本発明の実施の形態5に係る3D画像復号装置のブロック図である。 図30は、倍性能デコーダを備える3D画像復号装置で再生できるPTSおよびDTSの一例を示す図である。 図31は、本発明の実施の形態5に係る3D画像符号化装置のブロック図である。 図32は、図30に示すPTSおよびDTSの決定方法の一例を示すフローチャートである。 図33は、倍性能デコーダを備える3D画像復号装置で再生できるPTSおよびDTSの一例を示す図である。 図34は、図33に示すPTSおよびDTSの決定方法の一例を示すフローチャートである。 図35は、本発明の実施の形態6に係る3D画像復号装置における復号処理切替え判定フローチャートである。 図36は、本発明の実施の形態6に係る3D画像復号装置のブロック図である。 図37は、本発明の実施の形態6に係る3D画像復号装置における復号処理切替え判定フローチャートである。 図38は、本発明の実施の形態6に係る3D画像復号装置のブロック図である。 図39は、従来の3D映像再生装置の説明図である。 図40は、MVCにおける2視点画像符号化の予測参照の例を示す図である。 図41は、3D画像再生時のバッファ管理を示す図である。 図42は、3D画像再生時のバッファ管理の課題を示す図である。
以下、本発明の実施の形態について、図面を参照しながら説明する。
(実施の形態1)
まず、本発明に係る実施の形態1について、図面を参照して説明する。
図1は、実施の形態1の3D画像復号装置001のブロック図である。図1の3D画像復号装置001は、3D映像の片側ビューの映像を3D映像のフレームレートの2倍の速度で復号する能力を有するデコーダ112eを備える。そして、デコーダ112eは、第1ビューおよび第2ビューの両ビューを復号する。第2ビューは、第1ビューを参照して符号化されているため、3D画像復号装置001は、第2ビューの復号中に第1ビューの復号画像を参照できるように構成されている。
3D画像復号装置001は、第1ビューの復号が瞬時に完了しない場合でも、各ビューを実際に復号する時刻において、各ビューのストリームデータを復号できる点で従来の再生装置と異なる。
3D画像復号装置001の動作について説明する。入力された多重化ビットストリーム101は、STDバッファ902に入力される。そして、逆多重化されることにより、ビットストリームが分離される。その後、第1ビューについてのビットストリームはDTSに従い、第2ビューについてのビットストリームは第1ビューの復号に要する時間を考慮した復号時刻(以下、DTS_MODと呼ぶ。)に従ってデコーダ112eへと入力される。
ここで、多重化方式としては、MPEG−2システムのトランスポート・ストリームを用いる。そして、逆多重化時、図示しない逆多重化手段によって、トランスポート・パケット列からPESパケットが分離され、PESパケットのペイロードに格納されたビットストリームが取得される。
なお、多重化方式は、MPEG−2システムのトランスポート・ストリームに限定されるものではない。例えば、多重化方式は、応用規格において機能拡張したトランスポート・ストリーム、あるいは、MPEGで規定するMP4ファイルフォーマット、更には、IETF(Internet Engineering Task Force)で規定するRTP(Real Time streaming Protocol)など、ネットワーク経由でのストリーミング配信で使用する方式であってもよい。
デコーダ112eは、入力された多重化ビットストリーム101を復号し、PTSに従って復号画像を出力する。スイッチ903は、出力された画像を第1ビューの復号画像114および第2ビューの復号画像115に分離する。そして、分離された画像は、ビデオ出力インターフェース116を介して、3Dディスプレイ117に、3D画像として表示される。
デコーダ112eは、復号処理において、画面間予測符号化で参照される復号済みのフレームを、外部メモリ109上の第1フレームメモリ110cおよび第2フレームメモリ121へコピーし、参照されなくなるまで第1フレームメモリ110cおよび第2フレームメモリ121に保持する。ここで、第1フレームメモリ110cには、第1ビューのフレームが格納され、第2フレームメモリ121には、第2ビューのフレームが格納される。
各フレームメモリには複数のフレームが保持される。そのため、デコーダ112eは、第1フレームメモリ管理情報108gおよび第2フレームメモリ管理情報120を保持することにより、どの時刻のフレームが第1フレームメモリ110cおよび第2フレームメモリ121上のどの位置に保持されているかを管理する。
ここで、第2ビューの符号化には、第1ビューのフレームを用いて予測するビュー間予測符号化が用いられている。そのため、デコーダ112eは、第2ビューの復号に、第1ビューの復号画像を参照する必要がある。そこで、デコーダ112eは、第1ビューのフレームの復号が終わる度に、第1フレームメモリ管理情報108gを更新する。そして、第2ビューの復号中も、第1フレームメモリ管理情報108gを保持する。デコーダ112eは、第1フレームメモリ管理情報108gに基づいて、第1フレームメモリ110cに保持された第1ビューの所望のフレームの復号画像を参照する。そして、デコーダ112eは、ビュー間予測符号化を含む符号化方式で符号化された第2ビューのビットストリームを復号する。
なお、第1ビューのビットストリームは、他のビューを参照しておらず単独での復号が可能である。よって、デコーダ112eが第2ビューのビットストリームを読み飛ばすことで、3D画像復号装置001は、2D画像復号装置としても使用することが可能である。
また、デコーダ112eにおける第2ビューの復号処理において、ビットストリームSyntax異常など何らかの異常が検出された場合、ビットストリームのランダムアクセスポイント(飛び込み再生可能ポイント)などに到達することにより正常復号を再開できるまでの間、3D画像復号装置001は、第1ビューの復号画像のみを表示してもよい。また、上記の異常が検出された場合、3D画像復号装置001は、第1ビューの復号画像を第2ビューの復号画像として表示してもよい。このような表示等により、3D画像復号装置001は、視聴者の不快感を軽減させることが可能である。
また、デコーダ112eにおける第1ビューの復号処理において、ビットストリームSyntax異常など何らかの異常が検出された場合は、第1ビューを参照する第2ビューも正常に復号できなくなる。そのため、3D画像復号装置001は、上位システムにデコーダ112eの異常を通知して、ビットストリームのランダムアクセスポイント(飛び込み再生可能ポイント)などに到達して正常復号を再開できるまでの間、第1ビューおよび第2ビュー共に最後に正常復号できたフレームを出力し続けてもよい。このような出力等により、3D画像復号装置001は、視聴者の不快感を軽減させることが可能である。
図2は、3D画像復号装置001の復号処理における、各ビューのPTSおよびDTSの関係の一例を示す図である。図2の例においては、各ビューのフレームは、表示順でI、B、BおよびPタイプ(Pタイプは一方向の予測のみを行う。Bタイプは双方向の予測を含む。)、符号化順でI、P、BおよびBタイプとして符号化されている。ビュー間予測による第2ビューからの第1ビューの参照は、直前に表示される第1ビューのフレームのみである。また第1ビューおよび第2ビューは交互に表示される。
本例では、第1ビューの先頭フレームI1がまず復号される。そして、第2ビューの先頭フレームP1は、第1ビューの先頭フレームI1を参照している。そのため、第1ビューの先頭フレームI1の復号が完了するまで、第2ビューの先頭フレームP1の復号が、開始できない。3D画像復号装置001は、表示フレームレートの倍の速度のデコーダ112eを用いているため、第1ビューの先頭フレームI1の復号にフレーム周期Δt/2(Δt=1/フレームレート)を要する。
ここで、PESパケットのヘッダ、および、MVCストリーム内のHRD(Hypothetical Reference Decoder)関連のパラメータ等から得られるDTS値は、第1ビューと第2ビューで同一である。そのため、第2ビューの先頭フレームP1の実際の復号時刻DTS_MODは、第1ビューの先頭フレームI1のDTSからΔt/2後と決定される。
また、第1ビューのフレームP4は、第1ビューのフレームI1を予測で使用するため、本来は第1ビューのフレームI1の復号完了後に、第1ビューのフレームP4の復号が開始できる。しかしながら、3D画像復号装置001においては、第1ビューと第2ビューの復号を1つのデコーダで実施するため、第2ビューのフレームP1と同時に復号できない。そこで、第1ビューのフレームP4のDTSは、第2ビューのフレームP1のDTS_MODからΔt/2後となる。以降、第1ビューと第2ビューのフレームの復号がΔt/2間隔で交互に開始される。
次に、PTSについて説明する。表示順に対して復号順が最も遅いのは第2ビューのBフレームである。そのため、第2ビューのBフレームを表示できる時刻を基準に、第1ビューおよび第2ビューのフレームのPTSは、決定される。具体的には、第2ビューのフレームB2のPTSは、デコーダ112eが1フレームの復号にΔt/2を要するため、DTS_MODのΔt/2後となる。この時刻を基準にして、第1ビューの先頭フレームI1のPTSは、DTSの3Δt/2後となり、第2ビューの先頭フレームP1のPTSは、DTS_MODの3Δt/2後となる。
ここで、3D画像の表示方式としては、第1ビューと第2ビューを同時に表示する方式と、3D画像復号装置001のように第1ビューと第2ビューを交互に表示する方式とがある。
前者の方式への対応を想定すると、多重化ビットストリーム101において、第1ビューと第2ビューのPTSが、同一値に設定されることが考えられる。このような多重化ストリームが3D画像復号装置001に入力される場合、すなわち、PESパケットのヘッダ、および、MVCストリーム内のHRD(Hypothetical Reference Decoder)関連のパラメータ等から得られるPTSが第1ビューと第2ビューで同一である場合には、図2の例のように、第1ビューと第2ビューが交互に表示できるように第2ビューの実際のPTSを決定してもよい。
さらに、他の例として、PESパケットのヘッダから取得できるPTSは第1ビューのPTSのみとし、第2ビューのPTSは第1ビューのPTSに基づいて決定することとして、第2ビューのPTSをPESパケットのヘッダに格納しないことが考えられる。あるいは、PESパケットのヘッダに格納される第2ビューのPTSは、所定の値に固定することが考えられる。例えば、格納されるPTSは常に0に固定し、実際のPTSは第1ビューのPTSに基づいて決定することも考えられる。このような場合でも、図2の例のように、第1ビューと第2ビューが交互に表示できるように第2ビューの実際のPTSを決定してもよい。
図3は、3D画像復号装置001において第1ビューと第2ビューの復号時刻を決定する動作を示すフローチャートである。
まず、デコーダ112eは、PESパケットヘッダにおいて示される各ビューのDTSを取得する(S1000)。ここで、PESパケットヘッダには全フレームのビューについてのDTSが必ずしも格納されない。そのため、PESパケットヘッダにDTSが示されない場合は、デコーダ112eは、別途取得したフレームレート情報等からDTSを決定してもよい。また、PESパケットに格納されたMVCストリームのHRD関連情報からDTSを決定してもよい。
次に、デコーダ112eは、処理対象が第1ビューであるかどうか判定する(S1001)。ここで、第1ビューであれば(S1001でYes)、デコーダ112eは、取得されたDTSに基づいて復号を開始すると決定する(S1002)。一方、第1ビューでなければ(S1001でNo)、デコーダ112eは、第1ビューの復号に要する時間を考慮して、DTSにフレーム周期Δtの1/2の時間を加算して第2ビューの復号時刻DTS_MODを決定する(S1003)。
図4は、図3の動作の変形例を示すフローチャートである。
この例において、デコーダ112eは、処理対象が第1ビューであるかどうか判定する(S1001)。ここで、第1ビューでない場合(S1001でNo)、デコーダ112eは、DTS変更用の補助情報を参照して、DTSの加算値DTS_DELTAを取得する(S1004)。次に、デコーダ112eは、DTSにDTS_DELTAを加算して、第2ビューの復号時刻DTS_MODを決定する(S1005)。
DTS_DELTAは、例えば、MVCストリーム内の補助情報格納用のデータ格納単位を用いて、ランダムアクセス単位の先頭毎など所定の位置において伝送可能である。ここで、第1ビューと第2ビューのデータを合わせて1つのアクセスユニットが定義される場合、補助情報格納用の格納単位、および、画素データ格納用の格納単位などの格納単位の種類に応じて、アクセスユニット内での配置順が制限されることがある。
このとき、アクセスユニットを作成する際に格納単位の並び替えが起こらないように、補助情報格納用の格納単位を配置してもよい。例えば、補助情報用の格納単位は、画素データ用の格納単位の前に配置する必要がある場合がある。このとき、補助情報を第2ビューのデータとして格納すると、第1ビューと第2ビューのデータを結合した際に、補助情報が第1ビューの画素データの後となってしまい、格納単位の並び替えが発生する。従って、予め補助情報を第1ビューのデータとして、第1ビューの画素データの前に配置しておいてもよい。
また、MPEG−2システム規格におけるトランスポート・ストリーム内(例えば、デスクリプタなどを用いることができる。)、または、Blu−ray Discなどの応用規格において再生時に参照されるデータベース情報内に、DTS_DELTAを示す補助情報を格納してもよい。また、補助情報は、DTS_DELTAの絶対値を示すものであってもよいし、フレーム間隔またはその他の基準時間間隔の整数倍、あるいは、整数分の1倍、など、DTS_DELTAの値を間接的に示してもよい。更には、DTS_MODを補助情報として伝送してもよい。なお、第2ビューの実際のPTSを決定するための補助情報も、同様にして伝送可能である。
上記では、2つのビューから構成されるストリームの3D表示を想定したが、3つ以上のビューから2つのビューを選択して、復号および表示するような場合には、複数ビューから2つのビューを選択するステップを追加すればよい。
また、3D表示ではなく、複数のビューを切り替えながら、あるいは、同時に画面を分割して表示するという用途も想定される。これらのケースでも、単独で復号できる第1ビューを基準として、後続ビューのDTS_MODを決定する。例えば、3つのビューを表示する場合、フレーム周期Δtの1/3の時間で各ビューの復号を完了できるとすると、第2ビューのDTS_MODは、DTS+(1/3)×Δt、第3ビューのDTS_MODは、DTS+(2/3)×Δtと決定できる。
なお、ここで説明されたフレームには、フレームを構成するフィールドも含まれる。そして、本方法は、プログレッシブ映像と共に、インタレース映像にも適用できる。
次に、3D画像復号装置001が備えるSTDバッファ902について説明する。従来の再生装置について、上記第2の課題で述べたように、3D画像復号装置001が第1ビューの復号に要する時間を考慮して第2ビューの復号時刻を決定する場合、第1ビューの復号期間に第2ビューのビットストリームデータをデコーダ112eが読み込めない。したがって、STDバッファ902がオーバーフローしてしまう。そして、結果として、後続フレームデータがDTSまでに揃わないという課題が発生する。
従って、3D画像復号装置001では、第1ビューの復号期間に第2ビューのビットストリームデータの読み込みが停止することに起因するSTDバッファのオーバーフローを回避するために、従来のシステム・ターゲット・デコーダで規定していたSTDバッファに加えて、補償バッファを新規に備える。
図5は、3D画像復号装置001のSTDバッファ902の構成を示す図である。図示しない制御部により、入力された多重化ビットストリーム101は、まず、トランスポート・バッファ902aに入力され、トランスポート・パケットからPESパケットが分離された後、マルチプレクシング・バッファ902bに入力される。続いて、PESパケットのペイロードから取得されたビットストリームデータは、エレメンタリ・ストリーム・バッファ902cに入力される。STDバッファ902は、ビットストリームデータを格納するバッファとして、エレメンタリ・ストリーム・バッファ902cに加えて、補償バッファ902dを備える。
図5の例では、エレメンタリ・ストリーム・バッファ902cと補償バッファ902dを分けて示したが、両者の役割は共に、PESパケットのペイロードから分離したビットストリームデータを格納することである。したがって、STDバッファ902は、これら2つのバッファのサイズを加算したサイズを持つ単一のバッファを、ビットストリームデータ格納用のバッファとして備えてもよい。
そして、エレメンタリ・ストリーム・バッファ902cおよび補償バッファ902dのいずれかのバッファから、第1ビューと第2ビューの復号時刻に従って、それぞれのビューのビットストリームデータが、デコーダ112eへと入力される。
図6は、図42に例示した従来の再生装置において課題が発生するビットストリームデータを、3D画像復号装置001では、STDバッファ902のオーバーフローおよびアンダーフローを発生させることなく復号できることを示す図である。図6のグラフ内の実線と点線は、それぞれ3D画像復号装置001と従来の再生装置におけるバッファ占有量の遷移を示す。従来の再生装置では時刻T1においてオーバーフローしていたが、STDバッファ902では、補償バッファ902dを備えたことにより、オーバーフローが発生せずビットストリームデータを継続して読み込むことができる。その結果、フレーム3の第1ビューのデータは、DTS3において揃っており、3D画像復号装置001は、途切れることのない連続した復号を実現できる。
図7および図8は、第1ビューと第2ビューのデータを別チャネルで処理する際の、STDバッファ902の変形例を示す図である。
まず、図7について説明する。多重化ビットストリーム101は、スイッチ913により、PID(Packet Indicator)などのトランスポート・ストリーム・パケットの識別情報に基づいて、第1ビューのパケット101bと第2ビューのパケット101eに分離される。第1ビューのみ再生する場合には、スイッチ913において、第1ビューのトランスポート・パケットのみを選択し、第2ビューのトランスポート・パケットは破棄する。
第1ビューのパケットは、トランスポート・バッファ9021a、マルチプレクシング・バッファ9021bおよびエレメンタリ・ストリーム・バッファ9021cを通る。第2ビューのパケットは、トランスポート・バッファ9022a、マルチプレクシング・バッファ9022b、エレメンタリ・ストリーム・バッファ9022c、および、補償バッファ9022dを通る。第1ビューと第2ビューのビットストリームデータは、それぞれの復号時刻に従ってスイッチ914を介してデコーダ112eに入力される。
図7に示されたSTDバッファ902は、第1ビューについて、従来のSTDバッファと互換性のある構成を備える。そして、第2ビューに対応する補償バッファ9022dを備える。このような構成により、2つのビューの復号に起因するSTDバッファの課題が解決される。
図8に示されたSTDバッファ902は、補償バッファ9022dをスイッチ914の後段に備える。なお、ビュー数が3つ以上であっても、図7および図8に示された変形例と同様に、スイッチ913とスイッチ914がビューの選択をすることにより、STDバッファ902は、各ビューを別チャネルで処理することができる。さらに、図7と同様の構成とする際には、補償バッファは、第2ビューと第3ビュー以降のビューで共用してもよい。
次に、補償バッファ9022dのサイズについて説明する。
まず、マルチプレクシング・バッファからエレメンタリ・ストリーム・バッファへのデータの流入レートの最大値をRinとした場合、最大流入レートRinに、第1ビューの復号時間(フレーム周期Δtの1/2に等しい)を乗じて得られるデータ量DATA_INが、第1ビューの復号期間内にエレメンタリ・ストリーム・バッファ902cに流入されうる。このときの計算式を式1に示す。
DATA_IN = (1/2)×Δt×Rin (式1)
最大流入レートRinは、非特許文献1で規定されるように、多重化ビットストリーム101におけるMVCストリームの最大ビットレート、あるいは、MVCストリームが属するレベルにおいて規定された最大レートに基づいて決定される。ここでレベルとは、ビットレート、バッファサイズ、画像サイズおよびフレームレート等のパラメータ上限値を規定する情報であり、レベル毎にパラメータ上限値が異なる。また、レベルおよびMVCストリームのビットレートなどの情報は、MVCのビットストリーム内に符号化できるため、3D画像復号装置001は、これら情報を取得して、最大流入レートRinを決定できる。但し、DATA_INの上限値は、エレメンタリ・ストリーム・バッファのサイズEB_SIZEにより制限される。
さらに、図42の例などで示されたエレメンタリ・ストリーム・バッファのオーバーフローは、第1ビューの復号時刻において第2ビューのデータを引き抜けないことに起因する。従って、補償バッファのサイズは、第2ビューのデータサイズの上限値(以下、View2_MAXと呼ぶ。)以上であればよい。そして、View2_MAXの値はMVCなどの符号化規格により規定されている。例えば、各ビュー画像において、原画像と符号化画像とのビット量の比は、MinCR(Minimum Compression Ratio)と呼ばれるパラメータにより規定されている。そして、MinCRが2であれば、符号化画像のデータサイズは、原画像のビット量の1/2以下に制限される。原画像のデータサイズは、画像サイズや色差情報のサンプリング方法などに基づいて決定できる。なお、全ビューの合計データサイズの上限値に基づいてView2_MAXを決定してもよい。
以上より、DATA_IN、EB_SIZEおよびView2_MAXの3つのパラメータ値のうち、サイズが最小となるパラメータ値(以下、COMP_BUF_SIZEと呼ぶ。)を補償バッファのサイズとしてもよい。または、単に3つのパラメータ値のうち、いずれかを選択して、補償バッファのサイズとしてもよい。このように設定した補償バッファのサイズはワーストケースを仮定して決定したものである。実際のビットストリームにおいて必要な補償バッファのサイズは、COMP_BUF_SIZE以下となり、その値は符号化条件に依存して変動する。
従って、3D画像符号化装置は、ビットストリームの符号化時に、各ビューの復号に要する時間を設定し、設定した時間に基づいて実際に必要な補償バッファのサイズを決定し、決定したサイズを示す情報をビットストリーム内のパラメータ情報として符号化してもよい。3D画像復号装置では、このパラメータ情報を取得して、補償バッファのサイズを決定し、確保できる。
なお、各ビューの復号に要する時間として設定した値も、パラメータ情報として含めてもよい。さらに、3D画像符号化装置は、各ビューの復号に要する時間として複数の候補を想定し、各々の候補に対応した補償バッファのサイズをパラメータ情報に含めることも可能である。このとき、3D画像復号装置では、自身の処理速度に対応する候補を選択し、補償バッファのサイズを決定する。
図5に示された補償バッファ902dは、ビットストリーム格納用のバッファである。これにより、PESパケットのオーバーヘッドを含むマルチプレクシング・バッファ、あるいは、PESパケットに加えてトランスポート・パケットのオーバーヘッドを含むトランスポート・バッファの段階で補償バッファを設けるよりも、バッファサイズを削減できる。
一方で、例えば、エレメンタリ・ストリーム・バッファを内蔵したデコーダを再生装置に組み込む場合において、エレメンタリ・ストリーム・バッファの段階で補償バッファを設けることができない場合がある。その場合、補償バッファをマルチプレクシング・バッファなどと同一の段階に設けても良い。このとき、マルチプレクシング・バッファではビットストリームがPESパケット化された状態で格納されるため、補償バッファのサイズは、COMP_BUF_SIZEに、PESパケットのヘッダ、および、その他の多重化に係るオーバーヘッドを加えた値とする。オーバーヘッドのサイズは、マルチプレクシング・バッファに保持されるデータにおいて、オーバーヘッドが占める割合を規定し、その規定に基づいて決定できる。
なお、補償バッファのサイズは、COMP_BUF_SIZE以上の任意の値に設定してもよい。このように定められる補償バッファをSTDバッファに加えることにより、課題が解決される。
図9は、2つ以上のビューの復号する際のCOMP_BUF_SIZEの決定方法を説明する図である。ここで、2つ以上のビューの復号が必要なケースとは、復号したビュー全てを表示する場合だけでなく、例えば、10個のビューから2つのビューを選択して表示する場合に、選択したビューが他の2つのビューを参照しており、結果として4つのビューの復号が必要となる場合なども含む。
図9は、4つのビューを復号する際のエレメンタリ・ストリーム・バッファの占有量の遷移を示している。1番目のビューView1から3番目のビューView3までの符号量が小さいため、各ビューの復号中に、それぞれ、時刻Tfull1、時刻Tfull2、時刻Tfull3においてバッファがオーバーフローしている。そして、ビットストリームデータが入力されなくなっている。
各ビューの復号には、それぞれフレーム周期Δtの1/4だけ時間がかかるとすると、1番目から3番目のビューの復号に起因してバッファへ入力できなくなるデータサイズの最大値は、(3/4)×Rinとなる。この値がDATA_INに相当する。
なお、同様に、ビューの数をn、および、各ビューに含まれる各フレームの復号に要する時間の最大値をTmaxとした場合、DATA_INに相当する値は、式2によって得られる。
DATA_IN = Rin×Tmax×(n−1) (式2)
そして、View2_MAXに相当する値は、View2からView4までの3つのビューのデータサイズ上限値の和とする。最後に、EB_SIZEを含めた3種類の値を比較してCOMP_BUF_SIZEを決定してもよい。または、単に3つのパラメータ値のうち、いずれかを選択して、補償バッファのサイズとしても良い。このように定められる補償バッファをSTDバッファに加えることにより、課題が解決される。
しかしながら、本方法では、復号するビューの数の増加に伴い補償バッファのサイズが増加する可能性がある。そこで、補償バッファのサイズを、例えば、ビューのデータサイズの上限値の2倍などに制限し、符号化時に、3D画像符号化装置が制限値を満たすように符号化してもよい。
なお、最大流入レートを上げることにより、補償バッファを不要とすることもできる。第2ビューの復号期間内に、エレメンタリ・ストリーム・バッファには、COMP_BUF_SIZE分のデータが、追加で読み込まれるようにするとよい。例えば、第2ビューの復号期間内は、データ読み込みレートをRin+COMP_BUF_SIZE/(Δt/2)として、データが読み込まれるようにする。あるいは、簡略化して、Rinの2倍のレートで読み込まれるようにしてもよい。
図10は、図42と同一のビットストリームを復号する際の動作例を示す図である。グラフ内の実線が本方法の動作を示し、点線が従来の再生装置の動作を示す。フレーム1の第2ビューの復号期間内では、Rinよりも高速にデータが読み込まれるため、DTS3において、フレーム3の第1ビューのデータが揃っている。図10の動作のように、第1ビューの復号期間内において、エレメンタリ・ストリーム・バッファがオーバーフローした場合にのみ、第2ビューの復号期間内において、データが高速に読み込まれるようにしてもよい。
図11は、実施の形態1における3D画像復号装置の特徴的な構成要素を示す図である。実施の形態1における3D画像復号装置は、STDバッファ902等により実装されるバッファメモリ900、および、デコーダ112e等により実装される復号処理部100を備える。
バッファメモリ900は、復号処理部100に入力されるビットストリームを保持する。そして、復号処理部100は、第1ビューのビットストリームおよび第2ビューのビットストリームを復号する。ここで、復号処理部100は、第1ビューのフレームを復号した後に、復号したフレームを参照して、第2ビューのフレームを復号する。これにより、ビュー間予測を用いて符号化された複数のビューが復号される。
さらに、バッファメモリ900のサイズを大きくすること、あるいは、高速にデータがバッファメモリ900に読み込まれるようにすることにより、より確実に、ビュー間予測を用いて符号化された複数のビューが復号される。
図12は、本発明の実施の形態1に係る3D画像復号装置のブロック図であって、図1で示された3D画像復号装置001の変形例を示す図である。
図1で示された3D画像復号装置001に加えて、第1ビューの復号画像の経路に、遅延バッファ904が設けられている。これにより、第1ビューの表示タイミングを調整することができる。
図13は、図12で示された3D画像復号装置001における各ビューの実際の復号時刻および表示時刻の例を示す図である。図2で示された復号時刻および表示時刻と比較して、第1ビューと第2ビューが同一時刻に表示されるように調整されている。図12で示された3D画像復号装置001は、このように、遅延バッファ904により、第1ビューと第2ビューを同一時刻に表示することができる。
以上のように、実施の形態1における3D画像復号装置001は、復号が瞬時に完了されない場合であっても、ビュー間予測を用いて符号化された複数のビューを復号することができる。また、適切なバッファメモリのサイズ、または、高速読み込みにより、より確実に、ビュー間予測を用いて符号化された複数のビューが復号される。
(実施の形態2)
次に、実施の形態2について説明する。実施の形態2における3D画像復号装置は、2つのデコーダを備える。そして、各デコーダは、それぞれ表示フレームレートと同じ速度で復号する。
図14は、本発明の実施の形態2に係る3D画像復号装置のブロック図である。図14に示された3D画像復号装置001は、図7に示されたSTDバッファ902と同様のSTDバッファ902を備える。そして、STDバッファ902は、図7に示されたスイッチ914を介することなく、2つのデコーダに接続される。第1デコーダ107aは、第1ビューを復号し、第2デコーダ112aは、第2ビューを復号する。
第1デコーダ107aは、復号されたフレームを外部メモリ109の第1フレームメモリ110aにコピーし、フレームの位置を示す第1フレームメモリ管理情報108aを外部メモリ109の第1フレームメモリ管理情報108bにコピーする。
第2デコーダ112aは、外部メモリ109の第1フレームメモリ管理情報108bを第2デコーダ112aの第1フレームメモリ管理情報108cにコピーする。そして、第2デコーダ112aは、第1フレームメモリ管理情報108cを参照することにより、第1ビューのフレームを参照して、第2ビューを復号する。また、第2デコーダ112aは、画面間予測に利用するため、復号されたフレームを外部メモリ109の第2フレームメモリ111にコピーし、フレームの位置を示す第2フレームメモリ管理情報113を保持する。
復号されたフレームである第1ビューの復号画像114および第2ビューの復号画像115は、ビデオ出力インターフェース116を介して、3Dディスプレイ117に表示される。ここで、第1ビューの経路には、遅延バッファ904が配置される。これにより、第1ビューの表示タイミングが調整される。
図15は、図14に示された3D画像復号装置001における各ビューの実際の復号時刻および表示時刻の例を示す図である。
図14で示された3D画像復号装置001は、2つのデコーダを備えるため、2つのビューを並列に復号できる。したがって、交互に復号する必要はない。一方、図14で示された3D画像復号装置001では、フレーム周期Δtと同じ時間の復号遅延が発生する。そして、第2ビューのフレームは、第1ビューのフレームを参照しているため、第1ビューのフレームが復号された後に、復号される。結果として、第2ビューのフレームは、フレーム周期Δtの時間分遅れて、第1ビューのフレームと同時に復号される。
図16は、図14に示された3D画像復号装置001における各ビューの実際の復号時刻および表示時刻の例を示す図であって、図15で示された例とは異なる例を示す図である。
図16に示された復号時刻および表示時刻は、図15に示された復号時刻および表示時刻と比較して、第1ビューと第2ビューが同一時刻に表示されるように調整されている。図14で示された3D画像復号装置001は、このように、遅延バッファ904により、第1ビューと第2ビューを同一時刻に表示することもできる。
なお、実施の形態2における3D画像復号装置001は、2つのデコーダを備えるが、3以上のデコーダを備えてもよい。また、この場合、3D画像復号装置001では、ビュー間予測を用いて符号化された複数のビューを復号するときに、参照されるビューの階層分の遅延が発生する。
図17は、5つのビューにおけるビュー間予測の参照関係の例を示す図である。階層2のビューは、階層1のビューを参照し、階層3のビューは、階層2を参照する。この場合、同じDTSが付与されたフレームであっても、2つ分のフレームの復号遅延が発生する。つまり、複数のビューに含まれるビューの数よりも少ない、参照されるビューの階層の数に応じた遅延期間が発生する。
したがって、最大流入レートをRin、各フレームの復号に要する時間の最大値をTmax、および、ビュー間予測により参照されるビューの階層の最大値をmとした場合に、遅延期間中に読み込まれるデータ量であるDATA_INに相当する値は、式3によって得られる。
DATA_IN = Rin×Tmax×(m−1) (式3)
このように定められる補償バッファをSTDバッファに加えてもよい。
以上のように、実施の形態2における3D画像復号装置001は、複数のデコーダを備える場合であっても、ビュー間予測に用いられる参照画像を共有することにより、ビュー間予測を用いて符号化された複数のビューを復号することができる。
(実施の形態3)
次に、実施の形態3について説明する。実施の形態3における3D画像符号化装置は、3D画像復号装置において復号遅延が発生する場合であっても、復号できるように符号化する。
図18は、本発明の実施の形態3に係る3D画像符号化装置のブロック図である。第1ビューの画像601および第2ビューの画像611は、スイッチ701を介して、符号化処理部200のエンコーダ607bに入力される。ここで、第2ビューの画像611は、フレームバッファ621を経由して入力されるものとしてもよい。これにより、符号化処理部200は、第1ビューの画像601の符号化完了まで、第2ビューの画像611の符号化開始を遅らせることができる。
エンコーダ607bは、第1ビューおよび第2ビューを符号化する。また、エンコーダ607bは、画面間予測に使用する第1ビューおよび第2ビューのフレームを局所復号して、それぞれ、外部メモリ604の第1フレームメモリ605bおよび第2フレームメモリ606にコピーする。さらに、フレームの位置を示す第1フレームメモリ管理情報603dおよび第2フレームメモリ管理情報608を保持する。そして、エンコーダ607bは、第1フレームメモリ管理情報603dを用いて、第1フレームメモリ605bを参照することにより、第2ビューを符号化する。
レート制御部201は、符号化されたビットストリームが3D画像復号装置に所定の割合で読み込まれるように、エンコーダ607bに符号化させる。例えば、圧縮率、フレームレートおよび画素数などを調整する。これにより、3D画像復号装置におけるオーバーフローの発生が抑制される。
そして、符号化された第1ビューおよび第2ビューは、多重化ビットストリーム101として、システムエンコーダ610を介して出力される。
図19は、本発明の実施の形態3に係る3D画像符号化装置の効果を示す図である。
図18に示された3D画像符号化装置は、図19で示された想定サイズのエレメンタリ・ストリーム・バッファが、3D画像復号装置に備えられていると想定して符号化する。すなわち、3D画像符号化装置は、実際に3D画像復号装置に備えられているエレメンタリ・ストリーム・バッファのサイズから、復号遅延が発生している間に読み込まれるビットストリームのサイズを減算して得られた結果を制限値として、符号化する。これにより、復号遅延が発生している間も、確実にビットストリームが読み込まれる。
なお、復号遅延が発生している間に読み込まれるビットストリームのサイズは、実施の形態1において示されたDATA_INと同様であって、例えば、実施の形態1における式2により得られる。符号化するときの制限値は、復号が瞬時に完了することを想定して定められる規定サイズから、復号遅延が発生している間に読み込まれるビットストリームのサイズを減算して得られる値とすることができる。
図20は、本発明の実施の形態3の変形例に係る3D画像符号化装置のブロック図である。図20に示された3D画像符号化装置は、第1エンコーダ602aおよび第2エンコーダ607aの2つのエンコーダを備える。また、3D画像符号化装置は、第1エンコーダ602aおよび第2エンコーダ607aに接続されたレート制御部202を備える。
2つのエンコーダは、図14に示された2つのデコーダと同様に、フレームを共有する。すなわち、第1エンコーダ602aは、第1ビューのフレームを符号化した後、局所復号することにより、第1ビューのフレームを第1フレームメモリ605aに格納する。そして、フレームの位置を示す第1フレームメモリ管理情報603aを第1フレームメモリ管理情報603bにコピーする。第2エンコーダ607aは、第1フレームメモリ管理情報603bを第1フレームメモリ管理情報603cにコピーする。そして、第1フレームメモリ管理情報603cを参照することにより、第1ビューのフレームを参照し、ビュー間予測を用いて、第2ビューを符号化する。
レート制御部202は、図18におけるレート制御部201と同様に、符号化の制御を行う。すなわち、レート制御部202は、符号化されたビットストリームが3D画像復号装置に所定の割合で読み込まれるように、第1エンコーダ602aおよび第2エンコーダ607aに符号化させる。そして、2つのエンコーダにより符号化されたビットストリームは、スイッチ609を介して出力される。
このように構成することにより、2つのエンコーダを備える3D画像符号化装置であっても、3D画像復号装置に読み込まれるビットストリームのサイズを制限することができる。さらに、ビュー間予測を用いる画像を共有することにより、効率的に符号化できる。
なお、図18に示された3D画像符号化装置と同様に、第2ビューの画像611は、フレームバッファ621を経由して入力されるものとしてもよい。これにより、符号化処理部200は、第1ビューの画像601の符号化完了まで、第2ビューの画像611の符号化開始を遅らせることができる。
さらに、第1エンコーダ602aにより符号化された第1ビューのビットストリーム103は、ストリームバッファ622を介して出力されるものとしてもよい。これにより、第1ビューのビットストリーム103は、第2ビューの同一時刻におけるフレームの符号化が完了したタイミングで重畳される。よって、同一時刻のフレームが同一のタイミングで重畳される。
以上のように、実施の形態3における3D画像符号化装置は、ビュー間予測を用いて、画像復号装置でアンダーフローしないように、複数のビューを符号化する。また、複数のエンコーダを備える場合であっても、ビュー間予測に用いる参照画像を共有することにより、ビュー間予測を用いて、複数のビューを符号化することができる。
(実施の形態4)
次に、本発明に係る画像符号化方法および画像復号方法を用いる実施の形態4について、図面を参照して説明する。実施の形態4では、DTSおよびPTSの値は、それぞれのビューに対して異なる値を設定することができることを前提としている。なお、規格によりDTSおよびPTSが、それぞれ同一の値に設定される場合であっても、実際に復号および表示される時刻として、実施の形態4で示されるDTSおよびPTSを用いてもよい。
図21は、実施の形態4の3D画像復号装置のブロック図である。図21の3D画像復号装置は、3D映像の片側ビューの映像を3D映像のフレームレートと同じ速度で復号する能力を有する2つのデコーダとして、第1デコーダ107aおよび第2デコーダ112aを備える。そして、第1デコーダ107aは、第1ビューを復号し、第2デコーダ112aは、第2ビューを復号する。第2ビューは、第1ビューを参照して符号化されているため、第2デコーダ112aは、第1ビューの復号画像を参照できるように構成されている。
図21の3D画像復号装置の動作について説明する。入力された多重化ビットストリーム101は、スイッチ102において、第1ビューのビットストリーム103と第2ビューのビットストリーム104に分離される。そして、分離された各ビットストリームは、それぞれ第1入力バッファ105または第2入力バッファ106に入力される。さらに、入力された各ビットストリームは、DTSに従って第1デコーダ107aまたは第2デコーダ112aへと入力される。
第1デコーダ107aおよび第2デコーダ112aでは、それぞれ、入力された第1ビューのビットストリーム103および第2ビューのビットストリーム104を復号する。そして、各デコーダは、PTSに従って第1ビューの復号画像114または第2ビューの復号画像115を出力する。各復号画像は、ビデオ出力インターフェース116を介して3Dディスプレイ117にて3D画像として、表示される。
第1デコーダ107aおよび第2デコーダ112aは、復号処理において、画面間予測符号化で参照される復号済みのフレームを、外部メモリ109上の第1フレームメモリ110aまたは第2フレームメモリ111へコピーする。そして、コピーされたフレームは、参照されなくなるまで第1フレームメモリ110aおよび第2フレームメモリ111に保持される。
各フレームメモリには複数のフレームが保持されるため、第1デコーダ107aおよび第2デコーダ112aは、それぞれ、第1フレームメモリ管理情報108aおよび第2フレームメモリ管理情報113を保持することにより、どの時刻のフレームが第1フレームメモリ110aまたは第2フレームメモリ111上のどの位置に保持されているかを管理する。
ここで、第2ビューの符号化には、第1ビューのフレームを用いて予測するビュー間予測符号化が用いられている。そのため、第2デコーダ112aは、第2ビューの復号に、第1ビューの復号画像を参照する必要がある。そこで、第1デコーダ107aは、フレームの復号が終わる度に、第1フレームメモリ管理情報108aを外部メモリ109上に第1フレームメモリ管理情報108bとしてコピーする。そして、第2デコーダ112aは、フレームの復号開始前に、第1フレームメモリ管理情報108bを内部にコピーし、第1フレームメモリ管理情報108cとして保持する。
第2デコーダ112aは、第1フレームメモリ管理情報108cに基づいて、第1フレームメモリ110aに保持された第1ビューの所望のフレームの復号画像を参照する。そして、第2デコーダ112aは、ビュー間予測符号化を含む符号化方式で符号化された第2ビューのビットストリーム104を復号する。
なお、第1ビューのビットストリーム103は、他のビューを参照しておらず単独での復号が可能である。よって、実施の形態4における3D画像復号装置は、第1デコーダ107aのみを動作させ、第2デコーダ112aを動作させないことで、2D画像復号装置としても使用することが可能である。
また、第2デコーダ112aにおける第2ビューの復号処理において、ビットストリームSyntax異常など何らかの異常が検出された場合、3D画像復号装置は、上位システムに第2デコーダ112aの異常を通知してもよい。そして、3D画像復号装置は、ビットストリームのランダムアクセスポイント(飛び込み再生可能ポイント)などに到達することにより正常復号を再開できるまでの間、第1ビューの復号画像のみを表示してもよい。また、第1ビューの復号画像を第2ビューの復号画像として表示してもよい。このような表示等により、視聴者の不快感を軽減させることが可能である。
また、第1デコーダ107aにおける第1ビューの復号処理において、ビットストリームSyntax異常など何らかの異常が検出された場合は、第1ビューを参照する第2ビューも正常に復号できなくなる。そのため、3D画像復号装置は、上位システムに第1デコーダ107aの異常を通知してもよい。そして、3D画像復号装置は、ビットストリームのランダムアクセスポイント(飛び込み再生可能ポイント)などに到達することにより正常復号を再開できるまでの間、第1ビューおよび第2ビュー共に最後に正常復号できたフレームを出力し続けてもよい。このような出力等により、視聴者の不快感を軽減させることが可能である。
図22は、図21の3D画像復号装置の復号処理における、各ビューのPTSおよびDTSの関係の一例を示す図である。図22の例においては、各ビューのフレームは、表示順でI、B、BおよびPタイプ(Pタイプは一方向の予測のみを行う。Bタイプは双方向の予測を含む。)、符号化順でI、P、BおよびBタイプとして符号化されている。ビュー間予測による第2ビューからの第1ビューの参照は、直前に表示される第1ビューのフレームのみとしている。また第1ビューおよび第2ビューは交互に表示される。
本例では、第1ビューの先頭フレームI1がまず復号される。そして、第2ビューの先頭フレームP1は、第1ビューの先頭フレームI1を参照している。そのため、第1ビューの先頭フレームI1の復号が完了するまで、第2ビューの先頭フレームP1の復号が、開始できない。
図21の3D画像復号装置では、表示フレームレートと同じ速度の第1デコーダ107aを用いている。そのため、第1ビューの先頭フレームI1の復号にはフレーム周期Δt(=1/フレームレート)を要する。従って、第2ビューの先頭フレームP1のDTSは、第1ビューの先頭フレームI1のDTSからΔt後となる。第1ビューのフレームP4は、第1ビューのフレームI1を予測で使用する。そのため、第1ビューのフレームI1の復号完了後に復号を開始できる。
図21の3D画像復号装置においては、第1ビューと第2ビューの復号は別々のデコーダで実施する。そのため、第1ビューのフレームP4は、第2ビューのフレームP1と同時に復号できる。よって、第1ビューのフレームP4のDTSは、第2ビューのフレームP1のDTSと同じとなる。以降、第1ビューと第2ビューのフレームB2とP4、B3とB2、P7とB3、そして、B5とP7の順に、Δt間隔で、2つのビューのフレームの復号が同時に開始される。
次に、PTSについて説明する。表示順に対して復号順が最も遅いのは第2ビューのBフレームである。そのため、第2ビューのBフレームを表示できる時刻を基準に、第1ビューおよび第2ビューのフレームのPTSは、決定される。具体的には、第2ビューのフレームB2のPTSは、1フレームの復号にΔtを要するため、DTSのΔt後となる。この時刻を基準にして、第1ビューの先頭フレームI1のPTSは、DTSの5Δt/2後となり、第2ビューの先頭フレームP1のPTSは、DTSの2Δt後となる。
図23は、図21の3D画像復号装置で復号可能なビットストリームを作成する3D画像符号化装置の一例である。図23の3D画像符号化装置は、3D映像の片側ビューの映像を3D映像のフレームレートと同じ速度で符号化する能力を有する2つのエンコーダとして、第1エンコーダ602aおよび第2エンコーダ607aを備える。第1エンコーダ602aは、第1ビューを符号化し、第2エンコーダ607aは、第2ビューを符号化する。第1ビューを参照して第2ビューを符号化するため、第2エンコーダ607aは、第1ビューの局所復号画像を参照できるように構成されている。
局所復号画像を参照するための構成は、図21で示された3D画像復号装置と同様である。すなわち、第2エンコーダ607aは、第1フレームメモリ管理情報603cに基づいて、第1フレームメモリ605aに保持された第1ビューの所望のフレームの局所復号画像を参照する。そして、第2エンコーダ607aは、ビュー間予測符号化を含む符号化方式で第2ビューの画像611を符号化する。
図24は、図23の3D画像符号化装置のシステムエンコーダ610において、図22に示す符号化順に従って、第1ビューのフレームと第2ビューのフレームとを交互に、DTSおよびPTSを付与する手順を示すフローチャートである。図23の3D画像符号化装置において、図24のフローチャートに従ってDTSおよびPTSを付与することにより、図22に示すDTSおよびPTSを付与することができる。これにより、図21の3D画像復号装置において途切れることなく3D映像を再生できるビットストリームを作成することができる。作成されたビットストリームは、光ディスクやハードディスクに記録して持ち運ぶことができる。さらに、無線LANおよび光ファイバなどの通信手段を介して遠隔地へ伝送することができる。
図25は、図21の3D画像復号装置の復号処理における、各ビューのPTSおよびDTSの関係の一例を示す図である。図22とは、第1ビューおよび第2ビューが同時に表示される点が異なる以外は共通である。
図26は、図23の3D画像符号化装置のシステムエンコーダ610において、図25に示す符号化順に従って第1ビューと第2ビューのフレームに対して交互にDTSおよびPTSを付与する手順を示すフローチャートである。図23の3D画像符号化装置において、図26のフローチャートに従ってDTSおよびPTSを付与することにより、図25に示すDTSおよびPTSを付与することができる。これにより、図21の3D画像復号装置において途切れることなく3D映像を再生できるビットストリームを作成することができる。
図27は、図21の3D画像復号装置の第1の変形例を示す図である。第2ビューを復号する第2デコーダ112bは、第1ビューを復号する第1デコーダ107bの第1フレームメモリ管理情報108dを直接参照できるように構成されている。この構成により、外部メモリ109上および第2デコーダ112b内に第1ビューのフレームメモリ管理情報を保持する領域の確保が不要となり、回路面積を削減することが可能となる。
図28は、図21の3D画像復号装置の第2の変形例を示す図である。第2ビューを復号する第2デコーダ112cは、第1ビューを復号する第1デコーダ107cの第1フレームメモリ管理情報108aの管理手順をエミュレートすることにより、第1フレームメモリ管理情報108aと一致する第1フレームメモリ管理情報108eを保持するように構成されている。第2デコーダ112cにおいて、管理手順のエミュレートに必要な第1ビューのヘッダ情報(フレームの符号化タイプおよび時間情報など)は、多重化ビットストリーム101作成時に第2ビューのビットストリーム内に埋め込んでもよい。あるいは、図28の3D画像復号装置の上位システムから第2デコーダ112cへ通知するなどの手段により、ヘッダ情報が第2デコーダ112cへ通知されるようにしてもよい。
以上のように、実施の形態4における3D画像符号化装置は、複数のエンコーダを備える場合であっても、ビュー間予測に用いる参照画像を共有することにより、ビュー間予測を用いて、複数のビューを符号化することができる。また、実施の形態4における3D画像復号装置は、複数のデコーダを備える場合であっても、ビュー間予測に用いられる参照画像を共有することにより、ビュー間予測を用いて符号化された複数のビューを復号することができる。
(実施の形態5)
本発明に係る画像符号化方法および画像復号方法を用いる実施の形態5について、図面を参照して説明する。実施の形態5では、DTSおよびPTSの値は、それぞれのビューに対して異なる値を設定することができることを前提としている。なお、規格によりDTSおよびPTSが、それぞれ同一の値に設定される場合であっても、実際に復号および表示される時刻として、実施の形態5で示されるDTSおよびPTSを用いてもよい。
図29は、実施の形態5の3D画像復号装置のブロック図である。図29の3D画像復号装置は、3D映像の片側ビューの映像を3D映像のフレームレートの2倍の速度で復号する能力を有するデコーダ112dを備える。デコーダ112dは、第1ビューおよび第2ビューの両ビューを復号する。第2ビューは、第1ビューを参照して符号化されているため、図29の3D画像復号装置は、第2ビューの復号中に第1ビューの復号画像を参照できるように構成されている。
図29の3D画像復号装置の動作について説明する。入力された多重化ビットストリーム101は、入力バッファ901に入力され、DTSに従ってデコーダ112dへと入力される。デコーダ112dでは、入力された多重化ビットストリーム101を復号し、PTSに従って復号画像を出力する。スイッチ903は、出力されたビットストリームを第1ビューの復号画像114および第2ビューの復号画像115に分離する。各復号画像は、ビデオ出力インターフェース116を介して3Dディスプレイ117にて3D画像として、表示される。
デコーダ112dは、復号処理において、画面間予測符号化で参照される復号済みのフレームを、外部メモリ109上の第1フレームメモリ110bおよび第2フレームメモリ111へコピーする。そして、コピーされたフレームは、参照されなくなるまで第1フレームメモリ110bおよび第2フレームメモリ111に保持される。フレームメモリには複数のフレームが保持されるため、デコーダ112dは、第1フレームメモリ管理情報108fおよび第2フレームメモリ管理情報113を保持し、どの時刻のフレームが第1フレームメモリ110bおよび第2フレームメモリ111上のどの位置に保持されているかを管理する。
ここで、第2ビューの符号化には、第1ビューのフレームを用いて予測するビュー間予測符号化が用いられている。そのため、デコーダ112dは、第2ビューの復号に、第1ビューの復号画像を参照する必要がある。そこで、デコーダ112dは、第1ビューのフレームの復号が終わる度に、第1フレームメモリ管理情報108fを更新する。そして、第2ビューの復号中も、第1フレームメモリ管理情報108fを保持する。デコーダ112dは、第1フレームメモリ管理情報108fに基づいて、第1フレームメモリ110bに保持された第1ビューの所望のフレームの復号画像を参照する。そして、デコーダ112dは、ビュー間予測符号化を含む符号化方式で符号化された第2ビューのビットストリームを復号する。
なお、第1ビューのビットストリームは、他のビューを参照しておらず単独での復号が可能である。よって、デコーダ112dが第2ビューのビットストリームを読み飛ばすことで、3D画像復号装置は、2D画像復号装置としても使用することが可能である。
また、デコーダ112dにおける第2ビューの復号処理において、ビットストリームSyntax異常など何らかの異常が検出された場合は、ビットストリームのランダムアクセスポイント(飛び込み再生可能ポイント)などに到達することにより正常復号を再開できるまでの間、3D画像復号装置は、第1ビューの復号画像のみを表示してもよい。また、第1ビューの復号画像を第2ビューの復号画像として表示してもよい。このような表示等により、視聴者の不快感を軽減させることが可能である。
また、デコーダ112dにおける第1ビューの復号処理において、ビットストリームSyntax異常など何らかの異常が検出された場合は、第1ビューを参照する第2ビューも正常に復号できなくなる。そのため、3D画像復号装置は、上位システムにデコーダ112dの異常を通知して、ビットストリームのランダムアクセスポイント(飛び込み再生可能ポイント)などに到達して正常復号を再開できるまでの間、第1ビューおよび第2ビュー共に最後に正常復号できたフレームを出力し続けてもよい。このような出力等により、視聴者の不快感を軽減させることが可能である。
図30は、図29の3D画像復号装置の復号処理における、各ビューのPTSおよびDTSの関係の一例を示す図である。図30の例においては、各ビューのフレームは、表示順でI、B、BおよびPタイプ(Pタイプは一方向の予測のみを行う。Bタイプは双方向の予測を含む。)、符号化順でI、P、BおよびBタイプとして符号化されている。ビュー間予測による第2ビューからの第1ビューの参照は、直前に表示される第1ビューのフレームのみである。また第1ビューおよび第2ビューは交互に表示される。
本例では、第1ビューの先頭フレームI1がまず復号される。そして、第2ビューの先頭フレームP1は、第1ビューの先頭フレームI1を参照している。そのため、第1ビューの先頭フレームI1の復号が完了するまで、第2ビューの先頭フレームP1の復号が開始できない。図29の3D画像復号装置は、表示フレームレートの倍の速度のデコーダ112dを用いているため、第1ビューの先頭フレームI1の復号にはフレーム周期Δt/2(Δt=1/フレームレート)を要する。
従って、第2ビューの先頭フレームP1のDTSは、第1ビューの先頭フレームI1のDTSからΔt/2後となる。第1ビューのフレームP4は、第1ビューのフレームI1を予測で使用するため、本来は第1ビューのフレームI1の復号完了後に復号を開始できる。しかしながら、図29の3D画像復号装置においては、第1ビューと第2ビューの復号を1つのデコーダで実施するため、第2ビューのフレームP1と同時に復号できない。そこで、第1ビューのフレームP4のDTSは、第2ビューのフレームP1のDTSからΔt/2後となる。以降、第1ビューと第2ビューのフレームがΔt/2間隔で交互に復号が開始される。
次に、PTSについて説明する。表示順に対して復号順が最も遅いのは第2ビューのBフレームである。そのため、第2ビューのBフレームを表示できる時刻を基準に、第1ビューおよび第2ビューのフレームのPTSは、決定される。具体的には、第2ビューのフレームB2のPTSは、1フレームの復号にΔt/2を要するため、DTSのΔt/2後となる。この時刻を基準にして、第1ビューの先頭フレームI1のPTSは、DTSの3Δt/2後となり、第2ビューの先頭フレームP1のPTSは、DTSの2Δt後となる。
図31は、図29の3D画像復号装置で復号可能なビットストリームを作成する3D画像符号化装置の一例である。図31の3D画像符号化装置は、3D映像の片側ビューの映像を3D映像のフレームレートの倍の速度で符号化する能力を有するエンコーダ607bを備える。エンコーダ607bは、第1ビューおよび第2ビューを符号化する。第2ビューは、第1ビューを参照して第2ビューを符号化するため、エンコーダ607bは、第2ビューの符号化中においても第1ビューの局所復号画像を参照できるように構成されている。
図32は、図31の3D画像符号化装置のシステムエンコーダ610において、図30に示す符号化順に従って、第1ビューのフレームと第2ビューのフレームとを交互に、DTSおよびPTSを付与する手順を示すフローチャートである。図31の3D画像符号化装置において、図32のフローチャートに従ってDTSおよびPTSを付与することにより、図30に示すDTSおよびPTSを付与することができる。これにより、図29の3D画像復号装置において途切れることなく3D映像を再生できるビットストリームを作成することができる。作成されたビットストリームは、光ディスクやハードディスクに記録して持ち運ぶことができる。さらに、無線LANおよび光ファイバなどの通信手段を介して遠隔地へ伝送することができる。
図33は、図29の3D画像復号装置の復号処理における、各ビューのPTSおよびDTSの関係の一例を示す図である。図30とは、第1ビューおよび第2ビューが同時に表示される点が異なる以外は共通である。
図34は、図31の3D画像符号化装置のシステムエンコーダ610において、図33に示す符号化順に従って、第1ビューのフレームと第2ビューのフレームとを交互に、DTSおよびPTSを付与する手順を示すフローチャートである。図31の3D画像符号化装置において、図34のフローチャートに従ってDTSおよびPTSを付与することにより、図33に示すDTSおよびPTSを付与することができる。これにより、図29の3D画像復号装置において途切れることなく3D映像を再生できるビットストリームを作成することができる。
以上のように、実施の形態5における3D画像符号化装置は、ビュー間予測を用いて、複数のビューを符号化することができる。また、実施の形態5における3D画像復号装置は、ビュー間予測を用いて符号化された複数のビューを復号することができる。
(実施の形態6)
図22および図30に示されるように、3D画像復号装置の構成(等速性能を有する2デコーダまたは倍速性能を有する1デコーダ)によって、DTSとPTSの付与方法が異なってしまうことが分かる。そこで、実施の形態6では、ビットストリーム作成時に想定した3D画像復号装置の構成と、実際の3D画像復号装置の構成の組合せに応じて、復号処理を切替える方法について説明する。
図35は、実際の3D画像復号装置が等速性能を有する2デコーダであった場合に、ビットストリーム作成時に3D画像符号化装置により想定された3D画像復号装置の構成に応じて、3D画像復号装置が処理を切替える手順を示すフローチャートである。図36は、図35に示された手順に従って、処理を切替える3D画像復号装置の例を示す図である。
実際の構成と想定の構成が異なる場合、図36に示される3D画像復号装置は、遅延バッファ1601により第2ビューのビットストリームをΔt/2遅らせ、遅延バッファ1602および遅延バッファ1603により、それぞれ第1ビューおよび第2ビューの表示をΔt遅らせる。これにより、途切れることなく3D映像を再生することができる。
図37は、実際の3D画像復号装置が倍速性能を有する1デコーダであった場合に、ビットストリーム作成時に3D画像符号化装置により想定された3D画像復号装置の構成に応じて、3D画像復号装置が処理を切替える手順を示すフローチャートである。図38は、図37に示された手順に従って、処理を切替える3D画像復号装置の例を示す図である。
実際の構成と想定の構成が異なる場合、図38に示される3D画像復号装置は、スイッチ1701により多重化ビットストリーム101を第1ビューと第2ビューのビットストリームに分離する。そして、第1ビューのビットストリームを遅延バッファ1702によりΔt遅らせ、第2ビューのビットストリームを遅延バッファ1704によりΔt/2遅らせる。その後、第1ビューおよび第2ビューのビットストリームは、それぞれ、第1入力バッファ1703および第2入力バッファ1705に入力され、スイッチを介して、復号処理部100に入力される。その後の処理は、図29に示された3D画像復号装置と同様である。
これにより、途切れることなく3D映像を再生することができる。
以上のように、実施の形態6における3D画像復号装置は、ビュー間予測を用いて符号化された複数のビューを復号するとき、バッファを使用することにより復号時刻および表示時刻を調整する。
(その他の変形例)
なお、本発明を上記の実施の形態に基づいて説明してきたが、本発明は、上記の実施の形態に限定されないのはもちろんである。以下のような場合も本発明に含まれる。
(1)上記の各装置は、具体的には、マイクロプロセッサ、ROM(Read Only Memory)、RAM(Random Access Memory)、ハードディスクユニット、ディスプレイユニット、キーボードおよびマウスなどから構成されるコンピュータシステムである。前記RAMまたはハードディスクユニットには、コンピュータプログラムが記憶されている。前記マイクロプロセッサが、前記コンピュータプログラムにしたがって動作することにより、各装置は、その機能を達成する。ここでコンピュータプログラムは、所定の機能を達成するために、コンピュータに対する指令を示す命令コードが複数個組み合わされて構成されたものである。
(2)上記の各装置を構成する構成要素の一部または全部は、1個のシステムLSI(Large Scale Integration:大規模集積回路)から構成されているとしてもよい。システムLSIは、複数の構成要素を1個のチップ上に集積して製造された超多機能LSIであり、具体的には、マイクロプロセッサ、ROM、RAMなどを含んで構成されるコンピュータシステムである。前記RAMには、コンピュータプログラムが記憶されている。前記マイクロプロセッサが、前記コンピュータプログラムにしたがって動作することにより、システムLSIは、その機能を達成する。
(3)上記の各装置を構成する構成要素の一部または全部は、各装置に脱着可能なIC(Integrated Circuit)カードまたは単体のモジュールから構成されているとしてもよい。前記ICカードまたは前記モジュールは、マイクロプロセッサ、ROM、RAMなどから構成されるコンピュータシステムである。前記ICカードまたは前記モジュールは、上記の超多機能LSIを含むとしてもよい。マイクロプロセッサが、コンピュータプログラムにしたがって動作することにより、前記ICカードまたは前記モジュールは、その機能を達成する。このICカードまたはこのモジュールは、耐タンパ性を有するとしてもよい。
(4)本発明は、上記に示す方法であるとしてもよい。また、これらの方法をコンピュータにより実現するコンピュータプログラムであるとしてもよいし、前記コンピュータプログラムからなるデジタル信号であるとしてもよい。
また、本発明は、前記コンピュータプログラムまたは前記デジタル信号をコンピュータ読み取り可能な記録媒体、例えば、フレキシブルディスク、ハードディスク、CD−ROM、MO、DVD、DVD−ROM、DVD−RAM、BD(Blu−ray Disc)、半導体メモリなどに記録したものとしてもよい。また、これらの記録媒体に記録されている前記デジタル信号であるとしてもよい。
また、本発明は、前記コンピュータプログラムまたは前記デジタル信号を、電気通信回線、無線または有線通信回線、インターネットを代表とするネットワーク、あるいは、データ放送等を経由して伝送するものとしてもよい。
また、本発明は、マイクロプロセッサとメモリを備えたコンピュータシステムであって、前記メモリは、上記コンピュータプログラムを記憶しており、前記マイクロプロセッサは、前記コンピュータプログラムにしたがって動作するとしてもよい。
また、前記プログラムまたは前記デジタル信号を前記記録媒体に記録して移送することにより、または、前記ネットワーク等を経由して前記プログラムまたは前記デジタル信号を移送することにより、独立した他のコンピュータシステムにより実施するとしてもよい。
(5)上記実施の形態、上記変形例、および、それらにおいて示された構成要素をそれぞれ組み合わせるとしてもよい。
なお、複数のビューから選択される第1ビューは、ベースビューでなくてもよい。第1ビューがベースビューではない場合であっても、本発明により同様の効果が得られる。
また、3D画像復号装置および3D画像符号化装置における例を中心に説明したが、本発明は、3D画像復号装置および3D画像符号化装置に限らず、ビュー間予測を用いる画像復号装置および画像符号化装置に適用できる。
本発明に係る画像復号装置および画像符号化装置によれば、MVC等のビュー間の予測を用いた高性能な画像符号化方式により、要求性能の増加を最小限に抑えて、3D映像を復号および符号化することが可能となる。よって、より高品位な3D映像の映画タイトルなどの動画コンテンツを市場に供給することができ、映画市場や民生機器市場を活性化させることができる。したがって、本発明に係る画像復号装置および画像符号化装置は、映画産業や民生機器産業において高い利用可能性をもつ。
001 3D画像復号装置
100 復号処理部
101 多重化ビットストリーム
101b、101e パケット
102、609、701、903、913、914、1701 スイッチ
103、104 ビットストリーム
105、1703 第1入力バッファ
106、1705 第2入力バッファ
107a、107b、107c 第1デコーダ
108a、108b、108c、108d、108e、108f、108g、603a、603b、603c、603d 第1フレームメモリ管理情報
109、604 外部メモリ
110a、110b、110c、605a、605b 第1フレームメモリ
111、121、606 第2フレームメモリ
112a、112b、112c 第2デコーダ
112d、112e デコーダ
113、120、608 第2フレームメモリ管理情報
114、115 復号画像
116 ビデオ出力インターフェース
117 3Dディスプレイ
200 符号化処理部
201、202 レート制御部
601、611 画像
602a 第1エンコーダ
607a 第2エンコーダ
607b エンコーダ
610 システムエンコーダ
621 フレームバッファ
622 ストリームバッファ
900 バッファメモリ
901 入力バッファ
902 STDバッファ
902a、9021a、9022a トランスポート・バッファ(TB)
902b、9021b、9022b マルチプレクシング・バッファ(MB)
902c、9021c、9022c エレメンタリ・ストリーム・バッファ(EB)
902d、9022d 補償バッファ
904、1601、1602、1603、1702、1704 遅延バッファ
1801 光ディスク
1802A、1802B、1802C、1803A、1803B、1803C ストリーム
1804 2D再生装置
1805 3D再生装置
1806 立体メガネ

Claims (15)

  1. ビュー間予測を含む方法で符号化された、各ビューにピクチャを含む複数のビューを有するビットストリームを復号する画像復号装置であって、
    符号化された第1ビューのビットストリーム、および、前記第1ビューを参照して符号化された第2ビューのビットストリームを復号する復号処理部と、
    前記復号処理部に入力されるビットストリームを保持するために前記復号処理部の前段に配置されたバッファメモリとを備え、
    前記復号処理部は、前記第1ビューおよび前記第2ビューに付与された復号時刻が同一の場合において、前記第2ビューに付与された復号時刻に前記第1ビューのピクチャの復号が完了するまでに要する遅延時間を加算して得られた時刻に前記第2ビューのピクチャを復号する
    画像復号装置。
  2. 前記バッファメモリには、前記ビットストリームに付与されたデータ読み込みレートに従って前記ビットストリームが読み込まれ、
    前記復号処理部は、前記複数のビューに含まれる各ビューのビットストリームを復号するときに、前記バッファメモリから、復号する前記各ビューのビットストリームを引き抜き、
    前記バッファメモリのサイズは、前記復号処理部が前記遅延時間を加算して得られた時刻に前記第2ビューのビットストリームを引き抜いた場合において、前記復号処理部が前記各ビューのビットストリームを引き抜くときに、前記バッファメモリがアンダーフローしない最小のサイズ以上である
    請求項1に記載の画像復号装置。
  3. 前記バッファメモリのサイズは、前記各ビューに付与された復号時刻に前記各ビューのビットストリームが引き抜かれることを前提に定められる規定サイズに、前記遅延時間中において前記データ読み込みレートに従って読み込まれるビットストリームのサイズを加算したサイズ以上である
    請求項2に記載の画像復号装置。
  4. 前記復号処理部は、前記複数のビューのビットストリームを逐次復号し、
    前記バッファメモリのサイズは、前記複数のビューに含まれるビューの数をn、前記複数のビューに含まれる各ピクチャの復号に要する時間の最大値をT、前記データ読み込みレートをR、および、前記規定サイズをDとした場合、D+R×T×(n−1)以上のサイズである
    請求項3に記載の画像復号装置。
  5. 前記復号処理部は、前記複数のビューのビットストリームを並列に復号し、
    前記バッファメモリのサイズは、ビュー間予測により参照されるビューの階層の最大値をm、前記複数のビューに含まれる各ピクチャの復号に要する時間の最大値をT、前記データ読み込みレートをR、および、前記規定サイズをDとした場合、D+R×T×(m−1)以上のサイズである
    請求項3に記載の画像復号装置。
  6. 前記復号処理部は、さらに、
    前記複数のビューに含まれるピクチャを記憶するための外部メモリと、
    前記第1ビューのビットストリームを復号し、ビュー間予測に使用されるピクチャを前記外部メモリに記憶させる第1デコーダと、
    前記ピクチャの保持されている前記外部メモリ内の位置を示す管理情報を参照して、前記外部メモリからビュー間予測に使用されるピクチャを取得することにより、前記第2ビューのビットストリームを復号する第2デコーダとを備える
    請求項2に記載の画像復号装置。
  7. 前記バッファメモリには、前記遅延時間により読み込まれなかったビットストリームがある場合、前記ビットストリームに付与されたデータ読み込みレートよりも高速に前記ビットストリームが読み込まれる
    請求項1に記載の画像復号装置。
  8. 前記復号処理部は、さらに、
    前記複数のビューに含まれるピクチャを記憶するための外部メモリと、
    前記第1ビューのビットストリームを復号し、ビュー間予測に使用されるピクチャを前記外部メモリに記憶させる第1デコーダと、
    前記ピクチャの保持されている前記外部メモリ内の位置を示す管理情報を参照して、前記外部メモリからビュー間予測に使用されるピクチャを取得することにより、前記第2ビューのビットストリームを復号する第2デコーダとを備える
    請求項7に記載の画像復号装置。
  9. ビュー間予測を含む方法で、各ビューにピクチャを含む複数のビューを符号化する画像符号化装置であって、
    前記複数のビューを符号化し、前記複数のビューに同一の復号時刻を付与する符号化処理部と、
    符号化された前記複数のビューを読み込む画像復号装置のバッファメモリのサイズが、前記復号時刻に復号が瞬時に完了することを想定して定められる規定サイズより、ビュー間予測により参照されるビューの復号が完了するまでに要する遅延時間中に読み込まれる符号化された前記複数のビューのデータサイズを減算して得られるサイズ以下であるとして、符号化処理部に符号化させるレート制御部とを備える
    画像符号化装置。
  10. 前記レート制御部は、前記画像復号装置のバッファメモリのサイズが、符号化された前記複数のビューの数をn、前記複数のビューに含まれる各ピクチャの復号に要する時間の最大値をT、符号化された前記複数のビューを読み込むときのデータ読み込みレートをR、および、前記規定サイズをDとした場合、D−R×T×(n−1)以下のサイズであるとして、符号化処理部に符号化させる
    請求項9に記載の画像符号化装置。
  11. 前記符号化処理部は、さらに、
    前記複数のビューに含まれるピクチャを記憶するための外部メモリと、
    前記複数のビューに含まれる第1ビューの符号化し、ビュー間予測に使用されるピクチャを外部メモリに記憶させる第1エンコーダと、
    前記ピクチャの保持されている前記外部メモリ内の位置を示す管理情報を参照して、前記外部メモリからビュー間予測に使用される前記第1ビューのピクチャを取得することにより、ビュー間予測を使用して前記複数のビューに含まれる第2ビューを符号化する第2エンコーダとを備える
    請求項9に記載の画像符号化装置。
  12. ビュー間予測を含む方法で符号化された、各ビューにピクチャを含む複数のビューを有するビットストリームを復号する画像復号方法であって、
    符号化された第1ビューのビットストリーム、および、前記第1ビューを参照して符号化された第2ビューのビットストリームを復号する復号処理ステップと、
    前記復号処理ステップの前に、復号処理ステップに入力されるビットストリームを保持するデータ保持ステップとを含み、
    前記復号処理ステップでは、前記第1ビューおよび前記第2ビューに付与された復号時刻が同一の場合において、前記第2ビューに付与された復号時刻に前記第1ビューのピクチャの復号が完了するまでに要する遅延時間を加算して得られた時刻に前記第2ビューのピクチャを復号する
    画像復号方法。
  13. ビュー間予測を含む方法で、各ビューにピクチャを含む複数のビューを符号化する画像符号化方法であって、
    前記複数のビューを符号化し、前記複数のビューに同一の復号時刻を付与する符号化処理ステップと、
    符号化された前記複数のビューを読み込む画像復号装置のバッファメモリのサイズが、前記復号時刻に復号が瞬時に完了することを想定して定められる規定サイズより、ビュー間予測により参照されるビューの復号が完了するまでに要する遅延時間中に読み込まれる符号化された前記複数のビューのデータサイズを減算して得られるサイズ以下であるとして、符号化処理ステップに符号化させるレート制御ステップとを含む
    画像符号化方法。
  14. 請求項12に記載の画像復号方法に含まれるステップをコンピュータに実行させる
    プログラム。
  15. 請求項13に記載の画像符号化方法に含まれるステップをコンピュータに実行させる
    プログラム。
JP2010503295A 2008-09-18 2009-09-14 画像復号装置、画像符号化装置、画像復号方法、画像符号化方法およびプログラム Expired - Fee Related JP5568465B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010503295A JP5568465B2 (ja) 2008-09-18 2009-09-14 画像復号装置、画像符号化装置、画像復号方法、画像符号化方法およびプログラム

Applications Claiming Priority (6)

Application Number Priority Date Filing Date Title
US9794008P 2008-09-18 2008-09-18
US61/097,940 2008-09-18
JP2009077415 2009-03-26
JP2009077415 2009-03-26
PCT/JP2009/004566 WO2010032419A1 (ja) 2008-09-18 2009-09-14 画像復号装置、画像符号化装置、画像復号方法、画像符号化方法およびプログラム
JP2010503295A JP5568465B2 (ja) 2008-09-18 2009-09-14 画像復号装置、画像符号化装置、画像復号方法、画像符号化方法およびプログラム

Publications (2)

Publication Number Publication Date
JPWO2010032419A1 true JPWO2010032419A1 (ja) 2012-02-02
JP5568465B2 JP5568465B2 (ja) 2014-08-06

Family

ID=42039269

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010503295A Expired - Fee Related JP5568465B2 (ja) 2008-09-18 2009-09-14 画像復号装置、画像符号化装置、画像復号方法、画像符号化方法およびプログラム

Country Status (7)

Country Link
US (1) US8885709B2 (ja)
EP (1) EP2326092A4 (ja)
JP (1) JP5568465B2 (ja)
KR (1) KR101609890B1 (ja)
CN (1) CN101861735B (ja)
TW (1) TWI514856B (ja)
WO (1) WO2010032419A1 (ja)

Families Citing this family (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110080948A1 (en) * 2009-10-05 2011-04-07 Xuemin Chen Method and system for 3d video decoding using a tier system framework
US8731053B2 (en) * 2009-11-18 2014-05-20 Tektronix, Inc. Method of multiplexing H.264 elementary streams without timing information coded
US9247286B2 (en) 2009-12-31 2016-01-26 Broadcom Corporation Frame formatting supporting mixed two and three dimensional video data communication
US8964013B2 (en) * 2009-12-31 2015-02-24 Broadcom Corporation Display with elastic light manipulator
US8823782B2 (en) 2009-12-31 2014-09-02 Broadcom Corporation Remote control with integrated position, viewer identification and optical and audio test
US8854531B2 (en) 2009-12-31 2014-10-07 Broadcom Corporation Multiple remote controllers that each simultaneously controls a different visual presentation of a 2D/3D display
US20110310956A1 (en) * 2010-06-22 2011-12-22 Jian-Liang Lin Methods for controlling video decoder to selectively skip one or more video frames and related signal processing apparatuses thereof
CN103081465B (zh) * 2010-08-18 2016-05-18 松下电器产业株式会社 3d编码装置
US8965139B2 (en) 2010-09-29 2015-02-24 Panasonic Intellectual Property Corporation Of America Image decoding method, image coding method, image decoding apparatus, image coding apparatus and integrated circuit for generating a code stream with a hierarchical code structure
AU2011310239B2 (en) 2010-09-30 2015-12-03 Sun Patent Trust Image decoding method, image encoding method, image decoding device, image encoding device, programme, and integrated circuit
MX2013005402A (es) * 2010-11-15 2013-07-03 Lg Electronics Inc Metodo para transformar formato de trama y aparatos que utiliza el mismo metodo.
US8548263B2 (en) 2011-01-19 2013-10-01 Microsoft Corporation Delayed image decoding
US8484391B2 (en) 2011-06-20 2013-07-09 Intel Corporation Configurable buffer allocation for multi-format video processing
WO2013146507A1 (ja) * 2012-03-30 2013-10-03 ソニー株式会社 画像処理装置および方法、並びに記録媒体
JP6046923B2 (ja) * 2012-06-07 2016-12-21 キヤノン株式会社 画像符号化装置、画像符号化方法及びプログラム
US10021388B2 (en) 2012-12-26 2018-07-10 Electronics And Telecommunications Research Institute Video encoding and decoding method and apparatus using the same
US9374581B2 (en) 2013-01-07 2016-06-21 Qualcomm Incorporated Signaling of picture order count to timing information relations for video timing in video coding
US20140211843A1 (en) * 2013-01-31 2014-07-31 Kabushiki Kaisha Toshiba Moving image encoding device and moving image encoding method
KR102218735B1 (ko) * 2014-01-21 2021-02-23 삼성전자주식회사 불휘발성 메모리 장치를 포함하는 메모리 시스템 및 그것의 소거 방법
US10298931B2 (en) * 2014-09-25 2019-05-21 Microsoft Technology Licensing, Llc Coupling sample metadata with media samples
JP6649212B2 (ja) * 2016-09-06 2020-02-19 株式会社東芝 符号化装置、復号装置、および画像処理システム
US10944971B1 (en) * 2017-05-22 2021-03-09 Cinova Media Method and apparatus for frame accurate field of view switching for virtual reality
US10567703B2 (en) * 2017-06-05 2020-02-18 Cisco Technology, Inc. High frame rate video compatible with existing receivers and amenable to video decoder implementation
CN113574568A (zh) * 2019-03-26 2021-10-29 松下电器(美国)知识产权公司 三维数据编码方法、三维数据解码方法、三维数据编码装置、以及三维数据解码装置

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08191461A (ja) * 1995-01-10 1996-07-23 Canon Inc 画像符号化装置および画像復号装置
EP2101496B1 (en) 1996-02-28 2013-01-23 Panasonic Corporation High-resolution optical disk for recording stereoscopic video, optical disk reproducing device and optical disk recording device
JPH1023375A (ja) * 1996-07-04 1998-01-23 Matsushita Electric Ind Co Ltd 順次ディジタルビデオ復号化装置
JP3709721B2 (ja) * 1997-10-03 2005-10-26 ソニー株式会社 符号化ストリームスプライシング装置及び符号化ストリームスプライシング方法、符号化ストリーム生成装置及び符号化ストリーム生成方法、並びに情報処理装置及び方法
JP3642550B2 (ja) * 1998-03-12 2005-04-27 株式会社日立国際電気 映像信号伝送方法及びその装置
EP2403262A3 (en) * 2002-04-26 2012-01-25 Sony Corporation Encoding device and method, decoding device and method, editing device and method, recoding medium, and program
KR100504471B1 (ko) * 2002-08-08 2005-08-03 엘지전자 주식회사 비디오 디코딩 시스템
US7042943B2 (en) * 2002-11-08 2006-05-09 Apple Computer, Inc. Method and apparatus for control of rate-distortion tradeoff by mode selection in video encoders
CN101409835B (zh) * 2002-11-08 2014-09-17 苹果公司 利用拉格朗日乘子和视觉掩蔽来控制速率-失真折中的方法和装置
ES2383276T3 (es) * 2004-08-17 2012-06-19 Panasonic Corporation Dispositivo y procedimiento de codificación de imágenes
CN103179400B (zh) * 2004-10-07 2016-10-05 日本电信电话株式会社 视频编码方法及装置、视频解码方法及装置
JP2007180982A (ja) * 2005-12-28 2007-07-12 Victor Co Of Japan Ltd 画像復号装置、画像復号方法、及び画像復号プログラム
JP2008034893A (ja) * 2006-03-28 2008-02-14 Victor Co Of Japan Ltd 多視点画像復号装置
JP2008034892A (ja) 2006-03-28 2008-02-14 Victor Co Of Japan Ltd 多視点画像符号化装置
JP4793366B2 (ja) 2006-10-13 2011-10-12 日本ビクター株式会社 多視点画像符号化装置、多視点画像符号化方法、多視点画像符号化プログラム、多視点画像復号装置、多視点画像復号方法、及び多視点画像復号プログラム
KR101101965B1 (ko) * 2006-10-16 2012-01-02 노키아 코포레이션 멀티뷰 비디오 코딩에 대한 병렬 디코딩가능 슬라이스들을 이용하기 위한 시스템 및 방법
CA3006093C (en) * 2006-10-16 2022-07-19 Nokia Technologies Oy System and method for implementing efficient decoded buffer management in multi-view video coding
MX2011001210A (es) * 2009-02-27 2011-03-04 Panasonic Corp Medio de grabacion, dispositivo de reproduccion, y circuito integrado.
JP4962525B2 (ja) * 2009-04-08 2012-06-27 ソニー株式会社 再生装置、再生方法、およびプログラム

Also Published As

Publication number Publication date
US20100272174A1 (en) 2010-10-28
JP5568465B2 (ja) 2014-08-06
TW201018248A (en) 2010-05-01
TWI514856B (zh) 2015-12-21
KR101609890B1 (ko) 2016-04-06
US8885709B2 (en) 2014-11-11
KR20110068946A (ko) 2011-06-22
WO2010032419A1 (ja) 2010-03-25
CN101861735A (zh) 2010-10-13
EP2326092A4 (en) 2012-11-21
EP2326092A1 (en) 2011-05-25
CN101861735B (zh) 2013-08-21

Similar Documents

Publication Publication Date Title
JP5568465B2 (ja) 画像復号装置、画像符号化装置、画像復号方法、画像符号化方法およびプログラム
KR101215615B1 (ko) 동일 채널 내에서 서로 다른 코덱을 이용하여 부호화된 비디오 및 오디오 데이터 스트림의 재생을 위한 코덱 변경 방법 및 장치
US11172205B2 (en) Image encoding method, image decoding method, image encoding apparatus, and image decoding apparatus
JP4769717B2 (ja) 画像復号化方法
JP4311570B2 (ja) 再生装置、ビデオ復号装置および同期再生方法
DK2230844T3 (en) REGISTRATION MEDIUM, WHICH 3D VIDEO IS REGISTERED, REGISTRATION MEDIUM FOR REGISTERING 3D VIDEO AND REPLACEMENT DEVICE AND METHOD OF REPRESENTING 3D VIDEO
JP4823349B2 (ja) 三次元映像復号装置及び三次元映像復号方法
US20160080755A1 (en) Method for decoding data, data decoding device, and method for transmitting data
TWI801883B (zh) 視訊編碼器、視訊解碼器、用於編碼與解碼之方法及用以實現進階視訊寫碼概念之視訊資料串流
WO2012111325A1 (ja) 映像符号化装置、映像符号化方法、映像符号化プログラム、映像再生装置、映像再生方法及び映像再生プログラム
JPWO2010001609A1 (ja) 符号化ストリーム再生装置及び符号化ストリーム再生方法
US20080159636A1 (en) Encoding apparatus and encoding method
WO2012169204A1 (ja) 送信装置、受信装置、送信方法及び受信方法
US11671605B2 (en) Image encoding method, image decoding method, image encoding apparatus, and image decoding apparatus
JP6008292B2 (ja) ビデオストリームの映像のデータ作成装置及び再生装置
JP2008035294A (ja) 画像データ記録装置及び画像データ符号化装置
JP2010252151A (ja) 再生装置、及び同期再生方法
JP2008258858A (ja) 動画像符号化装置
JP2010206463A (ja) 動画像符号化方法、動画像符号化装置及び動画像符号化プログラム
JP2006311135A (ja) 動画像符号化装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120329

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130625

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130826

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140325

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140508

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140603

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140623

R151 Written notification of patent or utility model registration

Ref document number: 5568465

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

LAPS Cancellation because of no payment of annual fees