WO2013121823A1

WO2013121823A1 - 送信装置、送信方法および受信装置

Info

Publication number: WO2013121823A1
Application number: PCT/JP2013/050723
Authority: WO
Inventors: 塚越　郁夫
Original assignee: ソニー株式会社
Priority date: 2012-02-16
Filing date: 2013-01-17
Publication date: 2013-08-22
Also published as: JP6090168B2; US9596449B2; CN103597823B; KR101981813B1; US9860511B2; EP2683168B1; JP2017099000A; JP6365697B2; CN103597823A; KR20140134212A; JPWO2013121823A1; US20170134707A1; BR112013026086A2; US20140028798A1; EP2683168A4; EP2683168A1

Abstract

　立体画像の表示を良好に行い得るようにする。　画像データの所定のピクチャ毎に取得された第１の視差情報（ピクチャ表示画面の所定領域における最も手前のオブジェクト再生位置に対応した視差情報）と第２の視差情報（ピクチャ表示画面の所定領域における最も奥のオブジェクト再生位置に対応した視差情報）をビデオストリームに挿入して送信する。受信側では、これら第１の視差情報および第２の視差情報に基づいて、同側方向および交差方向の視差角が視聴上健康を害さない所定の範囲内にあるか否かをチェックでき、必要に応じて、立体画像を構成する左眼画像データおよび右眼画像データを再構成できる。

Description

送信装置、送信方法および受信装置

　本技術は、送信装置、送信方法および受信装置に関し、特に立体画像の表示あるいは立体画像へのグラフィクスの重畳表示を良好に行い得るようにするための送信装置等に関する。

　例えば、特許文献１には、立体画像データのテレビ放送電波を用いた伝送方式について提案されている。この場合、立体画像を構成する左眼画像データおよび右眼画像データが送信され、テレビ受信機において、両眼視差を利用した立体画像表示が行われる。

　図７７は、両眼視差を利用した立体画像表示において、スクリーン上におけるオブジェクト（物体）の左右像の表示位置と、その立体像の再生位置との関係を示している。例えば、スクリーン上に図示のように左像Ｌａが右側に右像Ｒａが左側にずれて表示されているオブジェクトＡに関しては、左右の視線がスクリーン面より手前で交差するため、その立体像の再生位置はスクリーン面より手前となる。

　また、例えば、スクリーン上に図示のように左像Ｌｂおよび右像Ｒｂが同一位置に表示されているオブジェクトＢに関しては、左右の視線がスクリーン面で交差するため、その立体像の再生位置はスクリーン面上となる。さらに、例えば、スクリーン上に図示のように左像Ｌｃが左側に右像Ｒｃが右側にずれて表示されているオブジェクトＣに関しては、左右の視線がスクリーン面より奥で交差するため、その立体像の再生位置はスクリーン面より奥となる。

特開２００５－６１１４号公報

　上述したように、立体画像表示において、視聴者は、両眼視差を利用して、立体画像の遠近感を認知する。ここで、最も手前のオブジェクト再生位置に対する視差角（交差方向の視差角）および最も奥のオブジェクト再生位置に対する視差角（同側方向の視差角）が、視聴上健康を害さないように所定の範囲内にある必要がある。つまり、受信機側で、視差角をチェックし、この視差角が所定の範囲内に収まっていない場合には、所定の範囲内に収まるように左眼画像および右眼画像を再構成することが期待される。

　また、受信機（セットトップボックス、テレビ受信機など）において画像に重畳表示されるＯＳＤ（On-Screen Display）あるいはアプリケーションなどのグラフィクスに関しても、２次元空間的のみならず、３次元の奥行き感としても、立体画像表示と連動してレンダリングされることが期待される。受信機においてグラフィクスを画像に重畳表示する場合、画像内の各物体の遠近感に応じて視差調整を施し、遠近感の整合性を維持することが期待される。

　本技術の目的は、立体画像の表示あるいは立体画像へのグラフィクスの重畳表示を良好に行い得るようにすることにある。

　本技術の概念は、
　立体画像を構成する左眼画像データおよび右眼画像データを取得する画像データ取得部と、
　上記取得された画像データの所定のピクチャ毎に、左眼画像および右眼画像の一方に対する他方の視差情報であって、ピクチャ表示画面の所定領域における最も手前のオブジェクト再生位置に対応した第１の視差情報と、ピクチャ表示画面の所定領域における最も奥のオブジェクト再生位置に対応した第２の視差情報を取得する視差情報取得部と、
　上記取得された画像データが符号化されて得られたビデオストリームに、上記取得された視差情報を挿入する視差情報挿入部と、
　上記視差情報が挿入されたビデオストリームを含む所定フォーマットのコンテナを送信する画像データ送信部とを備える
　送信装置にある。

　本技術において、画像データ取得部により、立体画像を構成する左眼画像データおよび右眼画像データが取得される。この場合の画像データは、例えば、カメラで撮像されて得られたもの、あるいは記憶媒体から読み出されて得られたものなどである。

　視差情報取得部により、画像データの所定のピクチャ毎に、左眼画像および右眼画像の一方に対する他方の視差情報であって、第１の視差情報および第２の視差情報が取得される。この場合、視差情報の取得は、少なくとも視差情報を送信すべきピクチャで行われればよく、必ずしも全てのピクチャで行う必要はない。第１の視差情報は、ピクチャ表示画面の所定領域における最も手前のオブジェクト再生位置に対応した視差情報である。また、第２の視差情報は、ピクチャ表示画面の所定領域における最も奥のオブジェクト再生位置に対応した視差情報である。

　例えば、視差情報取得部は、ピクチャ表示画面を分割情報で分割して得られた各分割領域における第１の視差情報を取得すると共に、ピクチャ表示画面全体における第２の視差情報を取得する、ようにされてもよい。また、例えば、視差情報取得部は、ピクチャ表示画面を分割情報で分割して得られた各分割領域における第１の視差情報および第２の視差情報を取得する、ようにされてもよい。さらに、例えば、視差情報取得部は、ピクチャ表示画面を第１の分割情報で分割して得られた各分割領域における第１の視差情報を取得すると共に、ピクチャ表示画面を第２の分割情報で分割して得られた各分割領域における第２の視差情報を取得する、ようにされてもよい。

　視差情報挿入部により、取得された画像データが符号化されて得られたビデオストリームに、取得された第１の視差情報および第２の視差情報が挿入される。例えば、視差情報は、ビデオストリームに、ピクチャ単位、あるいはＧＯＰ（Group of Picture）単位で挿入される。さらには、その他の単位、例えばシーン単位で挿入されてもよい。

　この場合、視差情報挿入部は、視差情報に対して、圧縮符号化処理を行った後に、ビデオストリームに挿入する、ようにされてもよい。例えば、圧縮符号化処理においては、可変長符号を用いてデータ圧縮を行うことが考えられ、また、ピクチャ間の視差情報の差分データをとってそれに対して可変長符号を適用してさらに圧縮率を高めることが考えられる。

　また、この場合、視差情報挿入部は、ビデオストリームの所定のピクチャに視差情報を挿入する際に、この視差情報がピクチャ表示画面全体における視差情報であるか、所定数に分割された各分割領域における視差情報であるかを識別する識別情報をさらに挿入する、ようにされてもよい。この識別情報により、受信側では、送信されてくる視差情報がピクチャ表示画面全体に対応するものであるか複数の分割領域毎のものであるのかを容易に把握可能となる。

　画像データ送信部により、視差情報が挿入されたビデオストリームを含む所定フォーマットのコンテナが送信される。例えば、コンテナは、デジタル放送規格で採用されているトランスポートストリーム（ＭＰＥＧ－２　ＴＳ）であってもよい。また、例えば、コンテナは、インターネットの配信などで用いられるＭＰ４、あるいはそれ以外のフォーマットのコンテナであってもよい。

　識別情報挿入部により、コンテナのレイヤに、ビデオストリームに視差情報の挿入があるか否かを識別するための識別情報が挿入される。例えば、コンテナはトランスポートストリームであり、識別情報挿入部は、識別情報をプログラム・マップ・テーブル、あるいはイベント・インフォメーション・テーブルの配下に挿入する、ようにされてもよい。例えば、識別情報挿入部は、プログラム・マップ・テーブル、あるいはイベント・インフォメーション・テーブルの配下に挿入されるデスクリプタに、識別情報を記述する、ようにされる。

　このように本技術においては、画像データの所定のピクチャ毎に取得された第１の視差情報（ピクチャ表示画面の所定領域における最も手前のオブジェクト再生位置に対応した視差情報）と第２の視差情報（ピクチャ表示画面の所定領域における最も奥のオブジェクト再生位置に対応した視差情報）がビデオストリームに挿入されて送信される。そのため、受信側では、これら第１の視差情報および第２の視差情報に基づいて、最も手前のオブジェクト再生位置に対する視差角（交差方向の視差角）および最も奥のオブジェクト再生位置に対する視差角（同側方向の視差角）が視聴上健康を害さない所定の範囲内にあるか否かをチェックすることが可能となる。

　また、本技術の他の概念は、
　ビデオストリームを含む所定フォーマットのコンテナを受信する画像データ受信部を備え、
　上記ビデオストリームは、立体画像を構成する左眼画像データおよび右眼画像データが符号化されて得られたものであり、
　上記ビデオストリームには、上記画像データの所定のピクチャ毎に、左眼画像および右眼画像の一方に対する他方の視差情報であって、ピクチャ表示画面の所定領域における最も手前のオブジェクト再生位置に対応した第１の視差情報と、ピクチャ表示画面の所定領域における最も奥のオブジェクト再生位置に対応した第２の視差情報が挿入されており、
　上記コンテナに含まれるビデオストリームから上記左眼画像データおよび右眼画像データを取得すると共に、上記第１の視差情報および第２の視差情報を取得する情報取得部と、
　上記取得された第１の視差情報および第２の視差情報に基づいて、視差角が所定範囲内に入るように、少なくとも上記左眼画像データおよび右眼画像データの再構成を指示する制御部とをさらに備える
　受信装置にある。

　本技術において、画像データ受信部により、ビデオストリームを含む所定フォーマットのコンテナが受信される。このビデオストリームは、立体画像を構成する左眼画像データおよび右眼画像データが符号化されて得られたものである。また、このビデオストリームには、画像データの所定のピクチャ毎に、左眼画像および右眼画像の一方に対する他方の視差情報であって、第１の視差情報および第２の視差情報が挿入されている。第１の視差情報は、ピクチャ表示画面の所定領域における最も手前のオブジェクト再生位置に対応した視差情報である。また、第２の視差情報は、ピクチャ表示画面の所定領域における最も奥のオブジェクト再生位置に対応した視差情報である。

　情報取得部により、コンテナに含まれるビデオストリームから、左眼画像データおよび右眼画像データが取得されると共に、この画像データの所定のピクチャに挿入されている第１の視差情報および第２の視差情報が取得される。そして、制御部により、取得された第１の視差情報および第２の視差情報に基づいて、視差角が所定範囲内に入るように左眼画像データおよび右眼画像データの再構成が指示される。

　このように本技術においては、第１の視差情報および第２の視差情報に基づいて、視差角が所定範囲内に入るように左眼画像データおよび右眼画像データの再構成が指示される。そのため、最も手前のオブジェクト再生位置に対する視差角（交差方向の視差角）および最も奥のオブジェクト再生位置に対する視差角（同側方向の視差角）が視聴上健康を害さない所定の範囲内に収まるように、左眼画像データおよび右眼画像データを再構成できる。

　また、本技術のさらに他の概念は、
　立体画像を構成する左眼画像データおよび右眼画像データを取得する画像データ取得部と、
　上記取得された画像データの所定のピクチャ毎に、左眼画像および右眼画像の一方に対する他方の視差情報を取得する視差情報取得部と、
　上記取得された視差情報に対して圧縮符号化処理を行う圧縮符号化部と、
　上記取得された画像データが符号化されて得られたビデオストリームに、上記圧縮符号化された視差情報を挿入する視差情報挿入部と、
　上記視差情報が挿入されたビデオストリームを含む所定フォーマットのコンテナを送信する画像データ送信部とを備える
　送信装置にある。

　視差情報取得部により、画像データの所定のピクチャ毎に、左眼画像および右眼画像の一方に対する他方の視差情報が取得される。この場合の視差情報は、例えば、左眼画像データおよび右眼画像データに基づいて生成されたもの、あるいは記憶媒体から読み出されて得られたものなどである。

　圧縮符号化部により、取得された視差情報に対して圧縮符号化処理が行われる。例えば、圧縮符号化部は、圧縮符号化処理として、取得された各ピクチャの視差情報に対して可変長符号を用いた処理を行う、ようにされてもよい。また、例えば、圧縮符号化部は、圧縮符号化処理として、取得された各ピクチャのうち、参照ピクチャでは、被参照ピクチャとの間の差分データを取得し、この差分データに可変長符号化の処理を行う、ようにされてもよい。この場合、例えば、圧縮符号化部は、表示順で先行するピクチャを被参照ピクチャとして差分データを取得する、ようにされてもよい。また、この場合、例えば、圧縮符号化部は、デコード順で先行するピクチャを被参照ピクチャとして差分データを取得する、ようにされてもよい。

　視差情報挿入部により、取得された画像データが符号化されて得られたビデオストリームに、圧縮符号化された視差情報が挿入される。例えば、視差情報は、ビデオストリームに、ピクチャ単位、あるいはＧＯＰ（Group of Picture）単位で挿入される。さらには、その他の単位、例えばシーン単位で挿入されてもよい。

　例えば、視差情報挿入部は、ビデオストリームの所定のピクチャに視差情報を挿入する際に、この挿入される視差情報がイントラデータであるか差分データであるかを識別する識別情報をさらに挿入する、ようにされてもよい。この場合、受信側では、挿入されている視差情報がイントラデータであるか差分データであるかを容易に把握可能となる。

　また、例えば、視差情報挿入部は、ビデオストリームのＩピクチャ、Ｐピクチャおよび被参照Ｂピクチャに対応して視差情報を挿入し、挿入される視差情報が差分データであるとき、被参照ピクチャまでのピクチャ数の情報をさらに挿入する、ようにされてもよい。この場合、受信側では被参照ピクチャを容易に把握可能となる。

　このように本技術においては、画像データの所定のピクチャ毎に取得された視差情報がビデオストリームに挿入されて送信されるものであり、受信側における立体画像に重畳表示されるグラフィクスの奥行き制御をピクチャ（フレーム）精度で良好に行うことができる。また、本技術においては、ビデオストリームに挿入される視差情報は、圧縮符号化されたものであり、データ量の低減を図ることができる。

　また、本技術の別の概念は、
　ビデオストリームを含む所定フォーマットのコンテナを受信する画像データ受信部を備え、
　上記ビデオストリームは、立体画像を構成する左眼画像データおよび右眼画像データが符号化されて得られたものであり、
　上記ビデオストリームには、上記画像データの所定のピクチャ毎に、左眼画像および右眼画像の一方に対する他方の視差情報が挿入されており、
　上記コンテナに含まれるビデオストリームから上記左眼画像データおよび右眼画像データを取得すると共に、上記視差情報を取得する情報取得部と、
　上記情報取得部で取得される視差情報が存在しないピクチャの視差情報を、上記取得された前後のピクチャの視差情報から補間により生成する視差情報補間部とをさらに備える
　受信装置にある。

　本技術において、画像データ受信部により、ビデオストリームを含む所定フォーマットのコンテナが受信される。このビデオストリームは、立体画像を構成する左眼画像データおよび右眼画像データが符号化されて得られたものである。また、このビデオストリームには、画像データの所定のピクチャ毎に、左眼画像および右眼画像の一方に対する他方の視差情報が挿入されている。

　情報取得部により、コンテナに含まれるビデオストリームから、左眼画像データおよび右眼画像データが取得されると共に、画像データの所定のピクチャに挿入されている視差情報が取得される。そして、視差情報補間部により、視差情報が存在しないピクチャの視差情報は、取得された前後のピクチャの視差情報から補間により生成される。

　このように本技術においては、視差情報が存在しないピクチャの視差情報は、取得された前後のピクチャの視差情報から補間により生成されるものである。そのため、例えば、立体画像に重畳表示されるグラフィクスの奥行き制御を、ピクチャ（フレーム）精度で良好に行うことができる。この場合、補間生成されるピクチャの視差情報が小数精度で生成されるとき、サブピクセルの視差情報に対応していれば、グラフィクスの奥行きの動的なアップデートをよりスムーズに行うことが可能となる。

　また、本技術のさらに別の概念は、
　ビデオストリームを含む所定フォーマットのコンテナを受信する画像データ受信部を備え、
　上記ビデオストリームは、立体画像を構成する左眼画像データおよび右眼画像データが符号化されて得られたものであり、
　上記ビデオストリームには、上記画像データの所定のピクチャ毎に、左眼画像および右眼画像の一方に対する他方の視差情報であって、ピクチャ表示画面の所定領域における最も手前のオブジェクト再生位置に対応した第１の視差情報と、ピクチャ表示画面の所定領域における最も奥のオブジェクト再生位置に対応した第２の視差情報が挿入されており、
　上記コンテナに含まれるビデオストリームから上記左眼画像データおよび右眼画像データを取得すると共に、上記第１の視差情報および第２の視差情報を取得する情報取得部と、
　上記取得された上記左眼画像データおよび上記右眼画像データと、上記取得された上記第１の視差情報および第２の視差情報とを、対応付けて、外部機器に送信する送信部とをさらに備える
　受信装置にある。

　本技術において、画像データ受信部により、ビデオストリームを含む所定フォーマットのコンテナが受信される。例えば、コンテナは、デジタル放送規格で採用されているトランスポートストリーム（ＭＰＥＧ－２　ＴＳ）であってもよい。また、例えば、コンテナは、インターネットの配信などで用いられるＭＰ４、あるいはそれ以外のフォーマットのコンテナであってもよい。

　このビデオストリームは、立体画像を構成する左眼画像データおよび右眼画像データが符号化されて得られたものである。また、このビデオストリームには、画像データの所定のピクチャ毎に、左眼画像および右眼画像の一方に対する他方の視差情報であって、第１の視差情報および第２の視差情報が挿入されている。第１の視差情報は、ピクチャ表示画面の所定領域における最も手前のオブジェクト再生位置に対応した視差情報である。また、第２の視差情報は、ピクチャ表示画面の所定領域における最も奥のオブジェクト再生位置に対応した視差情報である。

　情報取得部により、コンテナに含まれるビデオストリームから、左眼画像データおよび右眼画像データが取得されると共に、この画像データの所定のピクチャに挿入されている第１の視差情報および第２の視差情報が取得される。送信部により、取得された左眼画像データおよび右眼画像データと、取得された第１の視差情報および第２の視差情報とが、対応付けられて、外部機器に送信される。

　例えば、送信部は、画像データを、所定数のチャネルで、差動信号により、外部機器に送信し、画像データのブランキング期間に視差情報を挿入することで、この視差情報を外部機器に送信する、ようにされる。この場合、例えば、送信部は、画像データのブランキング期間に配置される所定フォーマットの情報パケットに、視差情報を挿入する、ようにされる。

　例えば、取得された第１の視差情報および第２の視差情報に基づいて、視差角が所定範囲内に入るように画像データおよび視差情報の再構成を行う情報再構成部をさらに備え、送信部は、再構成された左眼画像データおよび右眼画像データと、再構成された第１の視差情報および第２の視差情報とを、対応付けて、外部機器に送信する、ようにされてもよい。

　このように、本技術においては、受信コンテナに含まれるビデオストリームから取得された左眼画像データおよび右眼画像データと、第１の視差情報および第２の視差情報とが、対応付けられて、外部機器に送信される。そのため、外部機器においては、これら第１の視差情報および第２の視差情報に基づいて、最も手前のオブジェクト再生位置に対する視差角（交差方向の視差角）および最も奥のオブジェクト再生位置に対する視差角（同側方向の視差角）が視聴上健康を害さない所定の範囲内にあるか否かをチェックすることが可能となる。

　なお、本技術において、例えば、送信部は、２ピクチャ単位で、連続する第１のピクチャおよび第２のピクチャの視差情報を送信し、少なくとも、第１のピクチャまたは第２のピクチャの視差情報は、１つ前のピクチャの視差情報との間の差分データとされてもよい。このように、送信部から送信される第１のピクチャおよび第２のピクチャの視差情報のうちいずれかは差分データとされるので、伝送データ量の低減が可能となる。

　また、本技術において、例えば、第１のピクチャの視差情報と上記第２のピクチャの視差情報との差分データに基づいて、上記第１のピクチャの視差情報を差分データとするか第２のピクチャの視差情報を差分データとするかを決定する決定部をさらに備える、ようにされてもよい。この場合、例えば、シーンチェンジなどで第１のピクチャの視差情報と第２のピクチャの視差情報との間の差分が大きくなるとき、第１のピクチャの視差情報を差分データとするように決定でき、伝送データ量のさらなる低減が可能となる。

　また、本技術において、例えば、送信部が送信する視差情報には、第１のピクチャの視差情報が差分データであるか第２のピクチャの視差情報が差分データであるかを示す識別情報が付加されてもよい。この場合、第１のピクチャの視差情報が差分データであるか第２のピクチャの視差情報が差分データであるかを容易に判別可能となる。

　本技術によれば、立体画像の表示あるいは立体画像へのグラフィクスの重畳表示を良好に行うことができる。

実施の形態としての画像送受信システムの構成例を示すブロック図である。ブロック（Block）毎の視差情報（視差ベクトル）の一例を示す図である。ブロック単位の視差情報の生成方法の一例を説明するための図である。ブロック毎の視差情報から所定の分割領域の視差情報を得るためのダウンサイジング処理の一例を説明するための図である。符号化ブロック境界を跨がないようにピクチャ表示画面が分割されることを説明するための図である。ピクチャ毎の各分割領域の視差情報の推移例を模式的に示す図である。画像データのピクチャ毎に取得された視差情報のビデオストリームへの挿入タイミングを説明するための図である。放送局においてトランスポートストリームを生成する送信データ生成部の構成例を示すブロック図である。トランスポートストリームの構成例を示す図である。ＡＶＣ・ビデオ・デスクリプタ（AVC video descriptor）の構造例（Syntax）および主要な規定内容（semantics）を示す図である。ＭＶＣ・エクステンション・デスクリプタ（MVC extension descriptor）の構造例（Syntax）および主要な規定内容（semantics）を示す図である。グラフィクス・デプス・インフォ・デスクリプタ（graphics_depth_info_descriptor）の構造例（Syntax）および主要な規定内容（semantics）を示す図である。符号化方式がＡＶＣである場合におけるＧＯＰの先頭のアクセスユニットおよびＧＯＰの先頭以外のアクセスユニットの一例を示している。「depth_information_for_graphics SEI message」の構造例(Syntax)および「depth_information_for_graphics_data()」の構造例(Syntax)を示す図である。ピクチャ毎の視差情報をピクチャ単位で挿入する場合における「depth_information_for_graphics()」の構造例(Syntax)を示す図である。ピクチャ毎の視差情報をピクチャ単位で挿入する場合における「depth_information_for_graphics()」の構造例(Syntax)を示す図である。ピクチャ毎の視差情報をピクチャ単位で挿入する場合における「depth_information_for_graphics()」の構造例(Syntax)を示す図である。「depth_information_for_graphics()」の構造例(Syntax)における主要な情報の内容（Semantics）を示す図である。ピクチャ表示画面の分割例を示す図である。ピクチャ毎の視差情報を複数のピクチャをまとめて符号化する場合における、「depth_information_for_graphics()」の構造例(Syntax)を示す図である。ピクチャ毎の視差情報を複数のピクチャをまとめて符号化する場合における、「depth_information_for_graphics()」の構造例(Syntax)を示す図である。ピクチャ毎の視差情報を複数のピクチャをまとめて符号化する場合における、「depth_information_for_graphics()」の構造例(Syntax)を示す図である。「user_data()」の構造例(Syntax)および「depth_information_for_graphics_data()」の構造例(Syntax)を示す図である。放送局においてトランスポートストリームを生成する送信データ生成部の他の構成例を示すブロック図である。圧縮符号化部の概略構成例を示すブロック図である。可変長符号としての「Exp-Golomb 符号 se(v)」の構成を示す図である。非予測タイプ（Non-Prediction Type）の圧縮符号化を説明するための図である。予測タイプ０（Non-Prediction Type 0）の圧縮符号化を説明するための図である。予測タイプ１（Non-Prediction Type 1）の圧縮符号化を説明するための図である。予測タイプ２（Non-Prediction Type 2）の圧縮符号化を説明するための図である。予測タイプ３（Non-Prediction Type 3）の圧縮符号化を説明するための図である。ピクチャ毎の圧縮符号化された視差情報をピクチャ単位で挿入する場合における「depth_information_sei()」の構造例(Syntax)を示す図である。ピクチャ毎の圧縮符号化された視差情報をピクチャ単位で挿入する場合における「depth_information_sei()」の構造例(Syntax)を示す図である。ピクチャ毎の圧縮符号化された視差情報をピクチャ単位で挿入する場合における「depth_information_sei()」の構造例(Syntax)を示す図である。ピクチャ毎の圧縮符号化された視差情報を複数のピクチャをまとめて符号化する場合における「depth_information_sei()」の構造例(Syntax)を示す図である。ピクチャ毎の圧縮符号化された視差情報を複数のピクチャをまとめて符号化する場合における「depth_information_sei()」の構造例(Syntax)を示す図である。ピクチャ毎の圧縮符号化された視差情報を複数のピクチャをまとめて符号化する場合における「depth_information_sei()」の構造例(Syntax)を示す図である。「depth_information_sei()」の他の構造例(Syntax)を示す図である。可変長符号としての「Exp-Golomb 符号 ue(v)」の構成を示す図である。「depth_information_sei()」の他の構造例(Syntax)を示す図である。視差情報によるグラフィクスの奥行き制御の概念を示す図である。ビデオストリームにピクチャ単位で視差情報が挿入されている場合に画像データのピクチャタイミングで順次視差情報が取得されることを示す図である。ビデオストリームにＧＯＰ単位で視差情報が挿入されている場合に画像データのＧＯＰの先頭タイミングで、ＧＯＰ内の各ピクチャの視差情報がまとめて取得されることを示す図である。画像上における字幕（サブタイトル）およびＯＳＤグラフィクスの表示例を示す図である。セットトップボックスの構成例を示すブロック図である。圧縮復号化部の概略構成例を示すブロック図である。視差角のチェックおよび画像データの再構成を説明するための図である。視差情報制御部の構成例を示すブロック図である。奥行き制御部の制御を説明するためのブロック図である。奥行き制御部の制御処理の手順の一例を示すフローチャート（１／２）である。奥行き制御部の制御処理の手順の一例を示すフローチャート（２／２）である。セットトップボックスにおけるグラフィクスの奥行き制御例を示す図である。セットトップボックスにおけるグラフィクスの他の奥行き制御例を示す図である。テレビ受信機（ＨＤＭＩ入力系）の構成例を示すブロック図である。奥行き制御部の制御を説明するためのブロック図である。奥行き制御部の制御処理の手順の一例を示すフローチャートである。テレビ受信機におけるグラフィクスの奥行き制御例を示す図である。ソース機器のＨＤＭＩ送信部とシンク機器のＨＤＭＩ受信部の構成例を示すブロック図である。ＴＭＤＳ伝送データの構造例（横×縦が１９２０ピクセル×１０８０ラインの画像データが伝送される場合）を示す図である。ソース機器およびシンク機器のＨＤＭＩケーブルが接続されるＨＤＭＩ端子のピン配列（タイプＡ）を示す図である。視差情報の送信にＨＤＭＩ Vendor Specific InfoFrame を利用する場合における、ＨＤＭＩVendor Specific InfoFrame のパケット構造例を示す図である。ＨＤＭＩ Vendor Specific InfoFrame のパケット構造例における主要な情報の内容を示す図である。シングルピクチャのモードであり、分割領域が「１６」である場合における VS_Info の構造例を示す図である。ダブルピクチャのモードであり、分割領域が「１６」である場合における VS_Info の構造例を示す図である。ピクチャ単位受信かつシングルピクチャモード送信を行う場合を概略的に示す図である。ピクチャ単位受信かつダブルピクチャモード送信を行う場合を概略的に示す図である。ＧＯＰ単位（複数ピクチャ単位）受信かつシングルピクチャモード送信を行う場合を概略的に示す図である。ＧＯＰ単位（複数ピクチャ単位）受信かつダブルピクチャモード送信を行う場合を概略的に示す図である。 VS_Info（ＨＤＭＩ Vendor Specific InfoFrame）の他のパケット構造例を示す図である。 VS_Info（ＨＤＭＩ Vendor Specific InfoFrame）の他のパケット構造例を示す図である。ＨＤＭＩ Vendor Specific InfoFrame のパケット構造例における主要な情報の内容を示す図である。ＮピクチャとＮ＋１ピクチャの順番決定を行うための構成例を示すブロック図である。｜Ｄ（N+1）－Ｄ（N）｜≦Ｔｈとなる場合の視差情報（Disparity値）の時間推移例を示す図である。｜Ｄ（N+1）－Ｄ（N）｜＞Ｔｈとなる場合の視差情報（Disparity値）の時間推移例を示す図である。画像送受信システムの他の構成例を示すブロック図である。テレビ受信機の構成例を示すブロック図である。両眼視差を利用した立体画像表示において、スクリーン上におけるオブジェクトの左右像の表示位置と、その立体像の再生位置との関係を示す図である。

　以下、発明を実施するための形態（以下、「実施の形態」とする）について説明する。なお、説明は以下の順序で行う。
　１．実施の形態
　２．変形例

　＜１．実施の形態＞
　［画像送受信システム］
　図１は、実施の形態としての画像送受信システム１０の構成例を示している。この画像送受信システム１０は、放送局１００と、セットトップボックス（ＳＴＢ）２００と、モニタとしてのテレビ受信機３００を有している。セットトップボックス２００およびテレビ受信機（ＴＶ）３００は、ＨＤＭＩ(High Definition Multimedia Interface)ケーブル４００を介して接続されている。

　「放送局の説明」
　放送局１００は、コンテナとしてのトランスポートストリームＴＳを放送波に載せて送信する。このトランスポートストリームＴＳには、立体画像を構成する左眼画像データおよび右眼画像データが符号化されて得られたビデオストリームが含まれる。例えば、左眼画像データおよび右眼画像データは、１つのビデオストリームにより伝送される。この場合、例えば、左眼画像データおよび右眼画像データは、インターリーブ処理され、サイド・バイ・サイド方式あるいはトップ・アンド・ボトム方式の画像データとして構成され、１つのビデオストリームに含まれる。

　また、例えば、左眼画像データおよび右眼画像データは、それぞれ、別個のビデオストリームにより伝送される。この場合、例えば、左眼画像データはＭＶＣのベースビュー(base view)のストリームに含まれ、右眼画像データはＭＶＣのノンベースビュー（Nonbase view）のストリームに含まれる。

　ビデオストリームには、画像データの所定のピクチャ毎に取得された、左眼画像および右眼画像の一方に対する他方の視差情報（Disparity data）が挿入される。この場合、視差情報の取得は、少なくとも視差情報を送信すべきピクチャで行われることを前提とする。

　ここで、ピクチャ毎の視差情報は、第１の視差情報および第２の視差情報からなっている。第１の視差情報は、ピクチャ表示画面の所定領域における最も手前のオブジェクト再生位置に対応した視差情報である。また、第２の視差情報は、ピクチャ表示画面の所定領域における最も奥のオブジェクト再生位置に対応した視差情報である。

　スクリーン位置を視差ゼロとすると、オブジェクト再生位置がスクリーンより手前にある場合、この視差情報はマイナス値で得られる（図７１のＤＰａ参照）。一方、オブジェクトの再生位置がスクリーンより奥にある場合、この視差情報はプラス値で得られる（図７１のＤＰｃ参照）。そのため、第１の視差情報として、例えば、所定領域における視差情報のうち、最小値の視差情報が用いられる。また、第２の視差情報として、例えば、所定領域における視差情報のうち、最大値の視差情報が用いられる。

　この場合、第１の視差情報および第２の視差情報として、例えば、以下のような取得方法が考えられる。

　（１）ピクチャ表示画面を分割情報で分割して得られた各分割領域における第１の視差情報を取得し、ピクチャ表示画面全体における第２の視差情報を取得する。
　（２）ピクチャ表示画面を分割情報で分割して得られた各分割領域における第１の視差情報および第２の視差情報を取得する。

　（３）ピクチャ表示画面を第１の分割情報で分割して得られた各分割領域における第１の視差情報を取得し、ピクチャ表示画面を第２の分割情報で分割して得られた各分割領域における第２の視差情報を取得する。
　（４）ピクチャ表示画面全体における第１の視差情報を取得し、ピクチャ表示画面全体における第２の視差情報を取得する。

　ピクチャ表示画面全体、あるいは各分割領域の視差情報は、ブロック（Block）毎の視差情報に対して、ダウンサイジング処理を施すことで、取得される。図２は、ブロック（Block）毎の視差情報（視差ベクトル）の一例を示している。

　図３は、ブロック単位の視差情報の生成方法の一例を示している。この例は、左眼ビュー（Left-View）から右眼ビュー（Right-View）を指し示す視差情報を求める例である。この場合、左眼ビューのピクチャに、例えば４＊４、８＊８あるいは１６＊１６などの画素ブロック（視差検出ブロック）が設定される。

　図示のように、左眼ビューのピクチャが検出画像とされ、右眼ビューのピクチャが参照画像とされて、左眼ビューのピクチャのブロック毎に、画素間の差分絶対値和が最小となるように、右眼ビューのピクチャのブロック探索がされて、視差データが求められる。

　すなわち、Ｎ番目のブロックの視差情報ＤＰｎは、例えば、以下の（１）式に示すように、このＮ番目のブロックにおける差分絶対値和が最小となるようにブロック探索されて求められる。なお、この（１）式において、Ｄｊは右眼ビューのピクチャにおける画素値、Ｄｉは左眼ビューのピクチャにおける画素値を示している。
　ＤＰｎ＝ min ( Σ abs( differ (Dj - Di)))　　・・・（１）

　図４は、ダウンサイジング処理の一例を示している。図４（ａ）は、上述したように求められたブロック毎の視差情報を示している。このブロック毎の視差情報に基づいて、図４（ｂ）に示すように、グループ（Group Of Block）毎の第１の視差情報および第２の視差情報が求められる。グループは、ブロックの上位層に当たり、複数個の近接するブロックをまとめてグループ化することで得られる。図４（ｂ）の例では、各グループは、破線枠で括られる４個のブロックにより構成されている。そして、各グループの第１の視差情報は、例えば、そのグループ内の全ブロックの視差情報から最小の値の視差情報が選択されることで得られる。また、各グループの第２の視差情報は、例えば、そのグループ内の全ブロックの視差情報から最大の値の視差情報が選択されることで得られる。

　次に、このグループ毎の視差ベクトルに基づいて、図４（ｃ）に示すように、パーティション(partition)毎の第１の視差情報および第２の視差情報が求められる。パーティションは、グループの上位層に当たり、複数個の近接するグループをまとめてグループ化することで得られる。図４（ｃ）の例では、各パーティションは、破線枠で括られる２個のグループにより構成されている。そして、各パーティションの第１の視差情報は、例えば、そのパーティション内の全グループの第１の視差情報から、最小の値の第１の視差情報が選択されることで得られる。また、各パーティションの第２の視差情報は、例えば、そのパーティション内の全グループの第２の視差情報から、最大の値の第２の視差情報が選択されることで得られる。

　次に、このパーティション毎の視差情報に基づいて、図４（ｄ）に示すように、最上位層に位置するピクチャ全体（ピクチャ表示画面全体）の第１の視差情報および第２の視差情報が求められる。図４（ｄ）の例では、ピクチャ全体には、破線枠で括られる４個のパーティションが含まれている。そして、ピクチャ全体の第１の視差情報は、例えば、ピクチャ全体に含まれる全パーティションの第１の視差情報から、最小の値の第１の視差情報が選択されることで得られる。また、ピクチャ全体の第２の視差情報は、例えば、ピクチャ全体に含まれる全パーティションの第２の視差情報から、最大の値の第２の視差情報が選択されることで得られる。

　ピクチャ表示画面は分割情報に基づいて分割され、上述したように各分割領域の視差情報が取得される。この場合、符号化ブロック境界を跨がないようにピクチャ表示画面が分割される。図５は、ピクチャ表示画面の分割詳細例を示している。この例は、１９２０＊１０８０のピクセルフォーマットの例であって、水平、垂直にそれぞれ２分割され、Partition A，Partition B，Partition C，Partition Dの４つの分割領域が得られる例である。送信側では、１６×１６のブロック毎に符号化が行われるために、ブランクデータからなる８ラインが付加されて、１９２０画素＊１０８８ラインの画像データとして符号化が行われる。そこで、垂直方向に関しては、１０８８ラインを元に２分割されている。

　上述したように、ビデオストリームには、画像データの所定のピクチャ（フレーム）毎に取得された、ピクチャ表示画面全体あるいは各分割領域（Partition）の視差情報（第１の視差情報、第２の視差情報）が挿入される。図６は、各分割領域の視差情報の推移例を模式的に示している。この例は、水平、垂直にそれぞれ４分割され、Partition 0 ～ Partition 15 までの１６個の分割領域が存在する例である。この例では、図面の簡単化のため、Partition 0，Partition 3，Partition 9，Partition 15の視差情報Ｄ0，Ｄ3，Ｄ9，Ｄ15の推移のみを示している。各視差情報の値は、時間と共に値が変化する場合（Ｄ0，Ｄ3，Ｄ9）と固定である場合（Ｄ15）とがある。

　画像データの所定のピクチャ毎に取得された視差情報は、ビデオストリームに、ピクチャ単位、あるいはＧＯＰ単位などの単位で挿入される。図７（ａ）は、ピクチャの符号化に同期させる例、つまりビデオストリームに視差情報をピクチャ単位で挿入する例を示している。この例においては、画像データを送信する際の遅延が少なくて済み、カメラで撮像した画像データを送信するライブ放送に適するものとなる。

　図７（ｂ）は、符号化ビデオのＩピクチャ(Intra picture)、またはＧＯＰ（Group Of Pictures）に同期させる例、つまりビデオストリームに視差情報をＧＯＰ単位で挿入する例を示している。この例においては、図７（ａ）の例に比べて、画像データを送信する際の遅延が大きくなるが、複数のピクチャ（フレーム）の視差情報がまとめて送信されるので、受信側における視差情報の取得処理の回数を低減できる。図７（ｃ）は、ビデオのシーンに同期させる例、つまりビデオストリームに視差情報をシーン単位で挿入する例を示している。なお、図７（ａ）～（ｃ）は一例であって、その他の単位で挿入することも考えられる。

　また、トランスポートストリームＴＳのレイヤに、ビデオストリームに視差情報（第１の視差情報、第２の視差情報）の挿入があるか否かを識別するための識別情報が挿入されるようにしてもよい。この識別情報は、例えば、トランスポートストリームＴＳに含まれるプログラム・マップ・テーブル（ＰＭＴ：Program Map Table）の配下、あるいはイベント・インフォメーション・テーブル（ＥＩＴ：Event Information Table）の配下に挿入される。この識別情報により、受信側では、ビデオストリームに視差情報の挿入があるか否かを容易に識別可能となる。この識別情報の詳細については後述する。

　「送信データ生成部の構成例」
　図８は、放送局１００において、上述したトランスポートストリームＴＳを生成する送信データ生成部１１０の構成例を示している。この送信データ生成部１１０は、画像データ出力部１１１Ｌ，１１１Ｒと、スケーラ１１２Ｌ，１１２Ｒと、ビデオエンコーダ１１３と、マルチプレクサ１１４と、視差データ生成部１１５を有している。また、この送信データ生成部１１０は、サブタイトルデータ出力部１１６と、サブタイトルエンコーダ１１７と、音声データ出力部１１８と、オーディオエンコーダ１１９を有している。

　画像データ出力部１１１Ｌ，１１１Ｒは、それぞれ、立体画像を構成する左眼画像データＶＬ、右眼画像データＶＲを出力する。画像データ出力部１１１Ｌ，１１１Ｒは、例えば、被写体を撮像して画像データを出力するカメラ、あるいは記憶媒体から画像データを読み出して出力する画像データ読み出し部などにより構成される。画像データＶＬ，ＶＲは、例えば、１９２０＊１０８０のフルＨＤのサイズの画像データである。

　スケーラ１１２Ｌ，１１２Ｒは、それぞれ、画像データＶＬ，ＶＲに対して、必要に応じて、水平方向や垂直方向のスケーリング処理を行う。例えば、画像データＶＬ，ＶＲを１つのビデオストリームで伝送するために、サイド・バイ・サイド方式あるいはトップ・アンド・ボトム方式の画像データを構成する場合には、水平方向あるいは垂直方向に１／２にスケールダウンして出力する。また、例えば、画像データＶＬ，ＶＲを、ＭＶＣのベースビューストリーム、ノンベースビューストリームのように、それぞれ、別個のビデオストリームで伝送する場合には、スケーリング処理を行うことなく、画像データＶＬ，ＶＲをそのまま出力する。

　ビデオエンコーダ１１３は、スケーラ１１２Ｌ，１１２Ｒから出力される左眼画像データ、右眼画像データに対して、例えば、ＭＰＥＧ４－ＡＶＣ（ＭＶＣ）、ＭＰＥＧ２ｖｉｄｅｏ、あるいはＨＥＶＣ（High Efficiency Video Coding）などの符号化を施して、符号化ビデオデータを得る。また、このビデオエンコーダ１１３は、後段に備えるストリームフォーマッタ（図示せず）により、この符号化データを含むビデオストリームを生成する。この場合、ビデオエンコーダ１１３は、左眼画像データ、右眼画像データの符号化ビデオデータを含む１つあるいは２つのビデオストリーム（ビデオエレメンタリストリーム）を生成する。

　視差データ生成部１１５は、画像データ出力部１１１Ｌ，１１１Ｒから出力される左眼画像データＶＬ、右眼画像データＶＲに基づいて、ピクチャ（フレーム）毎に、視差情報を生成する。視差データ生成部１１５は、ピクチャ毎に、上述したようにブロック（Block）毎の視差情報を取得する。なお、視差データ生成部１１５は、画像データ出力部１１１Ｌ，１１１Ｒが記憶媒体を有する画像データ読み出し部である場合、ブロック（Block）毎の視差情報を、画像データと共に記憶媒体から読み出して取得する構成も考えられる。また、ビデオエンコーダ１１３の中の右眼画像データと左眼画像データとの間で行われるブロックマッチングの結果を利用して視差情報を検出する方法も考えられる。

　また、視差情報生成部１１５は、ブロック（Block）毎の視差情報に対してダウンサイジング処理を行って、ピクチャ表示画面全体、あるいはピクチャ表示画面を分割して得られる各分割領域（Partition）の第１の視差情報および第２の視差情報を生成する。なお、視差情報生成部１１５には、例えばユーザ操作により、第１の視差情報および第２の視差情報の取得方法の情報が与えられる。すなわち、ピクチャ表示画面全体における視差情報を生成する、あるいはピクチャ表示画面を所定数に分割して得られた各分割領域における視差情報を生成する、などの情報が与えられる。

　ビデオエンコーダ１１３は、視差データ生成部１１５で生成されたピクチャ毎の第１の視差情報および第２の視差情報を、ビデオストリームに挿入する。この場合、例えば、ピクチャ毎の視差情報は、ビデオストリームに、ピクチャ単位、あるいはＧＯＰ単位で挿入される（図７参照）。なお、左眼画像データおよび右眼画像データがそれぞれ別個のビデオデータで伝送されるには、いずれかのビデオストリームにのみ挿入されてもよい。

　サブタイトルデータ出力部１１６は、画像に重畳するサブタイトル（字幕）のデータを出力する。このサブタイトルデータ出力部１１６は、例えば、パーソナルコンピュータなどにより構成される。サブタイトルエンコーダ１１７は、サブタイトルデータ出力部１１６から出力されたサブタイトルデータを含むサブタイトルストリーム（サブタイトルエレメンタリストリーム）を生成する。なお、サブタイトルエンコーダ１１７は、視差データ生成部１１５で生成されるブロック毎の視差情報を参照し、サブタイトルデータに、サブタイトルの表示位置に対応した視差情報を付加する。すなわち、サブタイトルストリームに含まれるサブタイトルデータは、サブタイトルの表示位置に対応した視差情報を持つものとなる。

　音声データ出力部１１８は、画像データに対応した音声データを出力する。この音声データ出力部１１８は、例えば、マイクロホン、あるいは記憶媒体から音声データを読み出して出力する音声データ読み出し部などにより構成される。オーディオエンコーダ１１９は、音声データ出力部１１８から出力される音声データに対して、ＭＰＥＧ－２Ａｕｄｉｏ、ＡＡＣ等の符号化を施し、オーディオストリーム（オーディオエレメンタリストリーム）を生成する。

　マルチプレクサ１１４は、ビデオエンコーダ１１３、サブタイトルエンコーダ１１７およびオーディオエンコーダ１１９で生成された各エレメンタリストリームをＰＥＳパケット化して多重し、トランスポートストリームＴＳを生成する。この場合、それぞれのＰＥＳ(Packetized Elementary Stream)パケットのヘッダには、受信側における同期再生のために、ＰＴＳ（Presentation Time Stamp）が挿入される。

　マルチプレクサ１１４は、トランスポートストリームＴＳのレイヤに、上述した識別情報を挿入する。この識別情報は、ビデオストリームに視差情報（第１の視差情報、第２の視差情報）の挿入があるか否かを識別するための情報である。この識別情報は、例えば、トランスポートストリームＴＳに含まれるプログラム・マップ・テーブル（ＰＭＴ：Program Map Table）の配下、あるいはイベント・インフォメーション・テーブル（ＥＩＴ：Event Information Table）の配下などに挿入される。

　図８に示す送信データ生成部１１０の動作を簡単に説明する。画像データ出力部１１１Ｌ，１１１Ｒから出力される立体画像を構成する左眼画像データＶＬ、右眼画像データＶＲは、それぞれ、スケーラ１１２Ｌ，１１２Ｒに供給される。スケーラ１１２Ｌ，１１２Ｒは、それぞれ、画像データＶＬ，ＶＲに対して、必要に応じて、水平方向や垂直方向のスケーリング処理が行われる。スケーラ１１２Ｌ，１１２Ｒから出力される左眼画像データ、右眼画像データは、ビデオエンコーダ１１３に供給される。

　ビデオエンコーダ１１３では、左眼画像データ、右眼画像データに対して、例えば、ＭＰＥＧ４－ＡＶＣ（ＭＶＣ）、ＭＰＥＧ２ｖｉｄｅｏ、あるいはＨＥＶＣなどの符号化が施されて、符号化ビデオデータが得られる。また、このビデオエンコーダ１１３では、後段に備えるストリームフォーマッタにより、この符号化データを含むビデオストリームが生成される。この場合、左眼画像データ、右眼画像データの符号化ビデオデータを含む１つあるいは２つのビデオストリームが生成される。

　また、画像データ出力部１１１Ｌ，１１１Ｒから出力される立体画像を構成する左眼画像データＶＬ、右眼画像データＶＲは、視差データ生成部１１５に供給される。この視差データ生成部１１５では、ピクチャ毎に、ブロック（Block）毎の視差情報が取得される。そして、この視差データ生成部１１５では、さらに、ブロック（Block）毎の視差情報に対してダウンサイジング処理が行われて、ピクチャ表示画面全体、あるいはピクチャ表示画面を分割して得られた各分割領域における第１の視差情報および第２の視差情報が生成される。

　視差データ生成部１１５で生成されるピクチャ毎の第１の視差情報および第２の視差情報は、ビデオエンコーダ１１３に供給される。ビデオエンコーダ１１３では、ビデオストリームに、ピクチャ毎の第１の視差情報および第２の視差情報が、ピクチャ単位、あるいはＧＯＰ単位で挿入される。

　また、サブタイトルデータ出力部１１６では、画像に重畳するサブタイトル（字幕）のデータが出力される。このサブタイトルデータは、サブタイトルエンコーダ１１７に供給される。サブタイトルエンコーダ１１７では、サブタイトルデータを含むサブタイトルストリームが生成される。この場合、サブタイトルエンコーダ１１７では、視差データ生成部１１５で生成されるブロック毎の視差情報が参照され、サブタイトルデータに、表示位置に対応した視差情報が付加される。

　また、音声データ出力部１１８では、画像データに対応した音声データが出力される。この音声データは、オーディオエンコーダ１１９に供給される。このオーディオエンコーダ１１９では、音声データに対して、ＭＰＥＧ－２Ａｕｄｉｏ、ＡＡＣ等の符号化が施され、オーディオストリームが生成される。

　ビデオエンコーダ１１３で得られるビデオストリーム、サブタイトルエンコーダ１１７で得られるサブタイトルストリームおよびオーディオエンコーダ１１９で得られるオーディオストリームは、それぞれ、マルチプレクサ１１４に供給される。マルチプレクサ１１４では、各エンコーダから供給されるエレメンタリストリームがＰＥＳパケット化されて多重され、トランスポートストリームＴＳが生成される。この場合、それぞれのＰＥＳヘッダには、受信側における同期再生のために、ＰＴＳが挿入される。また、マルチプレクサ１１４では、ＰＭＴの配下、あるいはＥＩＴの配下などに、ビデオストリームに視差情報の挿入があるか否かを識別するための識別情報が挿入される。

　［識別情報、視差情報の構造、ＴＳ構成］
　図９は、トランスポートストリームＴＳの構成例を示している。この構成例では、左眼画像データおよび右眼画像データがそれぞれ別個のビデオストリームで伝送される例を示している。すなわち、左眼画像データが符号化されているビデオストリームのＰＥＳパケット「video PES1」および右眼画像データが符号化されているビデオストリームのＰＥＳパケット「video PES2」が含まれている。また、この構成例では、サブタイトルデータ（視差情報を含む）が符号化されているサブタイトルストリームのＰＥＳパケット「subtitle PES3」および音声データが符号化されているオーディオストリームのＰＥＳパケット「audio PES4」が含まれている。

　ビデオストリームのユーザデータ領域には、ピクチャ毎の第１の視差情報および第２の視差情報を含むデプス・インフォメーション・ＳＥＩ（depth_information_sei()）が挿入されている。例えば、ピクチャ毎の視差情報がピクチャ単位で挿入される場合、このデプス・インフォメーション・ＳＥＩは、ビデオストリームの各ピクチャのユーザデータ領域に挿入される。また、例えば、ピクチャ毎の視差情報がＧＯＰ単位で挿入される場合、このデプス・インフォメーション・ＳＥＩは、ビデオストリームのＧＯＰの先頭あるいはシーケンス・パラメータ情報が挿入される位置に相当するピクチャのユーザデータ領域に挿入される。なお、この構成例では、２つのビデオストリームの双方にデプス・インフォメーション・ＳＥＩが挿入されるように示しているが、一方のビデオストリームのみに挿入されてもよい。

　トランスポートストリームＴＳには、ＰＳＩ（Program Specific Information）として、ＰＭＴ（Program Map Table）が含まれている。このＰＳＩは、トランスポートストリームＴＳに含まれる各エレメンタリストリームがどのプログラムに属しているかを記した情報である。また、トランスポートストリームＴＳには、イベント単位の管理を行うＳＩ（Serviced Information）としてのＥＩＴ(Event Information Table)が含まれている。

　ＰＭＴの配下に、各エレメンタリストリームに関連した情報を持つエレメンタリ・ループが存在する。このエレメンタリ・ループには、ストリーム毎に、パケット識別子（PID）などの情報が配置されると共に、そのエレメンタリストリームに関連する情報を記述するデスクリプタも配置される。

　上述したビデオストリームに視差情報（第１の視差情報、第２の視差情報）が挿入されているか否かを示す識別情報を挿入する場合、例えば、プログラム・マップ・テーブルのビデオエレメンタリ・ループの配下に挿入されるデスクリプタ（descriptor）に記述される。このデスクリプタは、例えば、既存のＡＶＣ・ビデオ・デスクリプタ（AVC video descriptor）あるいはＭＶＣ・エクステンション・デスクリプタ（MVC_extension_descriptor）、または、新規に定義されるデプス・インフォ・デスクリプタ（Depth_info_descriptor）である。なお、デプス・インフォ・デスクリプタに関しては、破線図示するように、ＥＩＴの配下に挿入することも考えられる。

　図１０（ａ）は、識別情報が記述されたＡＶＣ・ビデオ・デスクリプタ（AVC video descriptor）の構造例（Syntax）を示している。このデスクリプタは、ビデオがＭＰＥＧ４－ＡＶＣ Frame compatible フォーマットの場合に適用できる。このデスクリプタ自体は、既にＨ．２６４／ＡＶＣの規格に入っている。ここでは、このデスクリプタに、「depth_info_not_existed_flag[0]」の１ビットのフラグ情報が、新たに、定義される。

　このフラグ情報は、図１０（ｂ）の規定内容（semantics）に示すように、対応するビデオストリームに、ピクチャ毎の視差情報を含むデプス・インフォメーション・ＳＥＩ（depth_information_sei()）が挿入されているか否かを示す。このフラグ情報が“０”であるときは挿入されていることを示す。一方、このフラグ情報が“１”であるときは挿入されていないことを示す。

　図１１（ａ）は、識別情報が記述されたＭＶＣ・エクステンション・デスクリプタ（MVC extension descriptor）の構造例（Syntax）を示している。このデスクリプタは、ビデオがＭＰＥＧ４－ＡＶＣＡｎｎｅｘＨＭＶＣフォーマットの場合に適用できる。このデスクリプタ自体は、既にＨ．２６４／ＡＶＣの規格に入っている。ここでは、このデスクリプタに、「depth_info_not_existed_flag」の１ビットのフラグ情報が、新たに、定義される。

　このフラグ情報は、図１１（ｂ）の規定内容（semantics）に示すように、対応するビデオストリームに、ピクチャ毎の視差情報を含むデプス・インフォメーション・ＳＥＩ（depth_information_sei()）が挿入されているか否かを示す。このフラグ情報が“０”であるときは挿入されていることを示す。一方、このフラグ情報が“１”であるときは挿入されていないことを示す。

　図１２（ａ）は、デプス・インフォ・デスクリプタ（depth_info_descriptor）の構造例（Syntax）を示している。「descriptor_tag」の８ビットフィールドは、このデスクリプタが「depth_info_descriptor」であることを示す。「descriptor_length」の８ビットフィールドは、以降のデータバイト数を示す。そして、このデスクリプタに、「depth_info_not_existed_flag」の１ビットのフラグ情報が記述されている。

　このフラグ情報は、図１２（ｂ）の規定内容（semantics）に示すように、対応するビデオストリームに、ピクチャ毎の視差情報を含むデプス・インフォメーション・ＳＥＩ（depth_information_sei()）が挿入されているか否かを示す。このフラグ情報が“０”であるときは挿入されていることを示す。一方、このフラグ情報が“１”であるときは挿入されていないことを示す。

　次に、ピクチャ毎の視差情報を含むデプス・インフォメーション・ＳＥＩ（depth_information_sei()）を、ビデオストリームのユーザデータ領域に挿入する場合について説明する。

　例えば、符号化方式がＡＶＣである場合、「depth_information_sei()」は、アクセスユニットの“ＳＥＩｓ”の部分に、「depth_information SEI message」として、挿入される。図１３（ａ）は、ＧＯＰ（Group Of Pictures）の先頭のアクセスユニットを示しており、図１３（ｂ）は、ＧＯＰの先頭以外のアクセスユニットを示している。ピクチャ毎の視差情報がＧＯＰ単位で挿入される場合には、ＧＯＰの先頭のアクセスユニットにのみ「depth_information SEI message」が挿入される。

　図１４（ａ）は、「depth_information SEI message」の構造例(Syntax)を示している。「uuid_iso_iec_11578」は、“ISO/IEC 11578:1996AnnexA.”で示されるUUID値をもつ。「user_data_payload_byte」のフィールドに、「depth_information_sei_data()」が挿入される。図１４（ｂ）は、「depth_information_sei_data()」の構造例(Syntax)を示している。この中に、デプス・インフォメーション・ＳＥＩ（depth_information_sei()）が挿入される。「userdata_id」は、符号なし１６ビットで示される「depth_information_sei()」の識別子である。

　図１５、図１６および図１７は、それぞれ、ピクチャ毎の視差情報をピクチャ単位で挿入する場合における「depth_information_sei()」の構造例(Syntax)を示している。図１８には、これらの構造例における主要な情報の内容（Semantics）が示されている。

　図１５は、上述の（１）「ピクチャ表示画面を分割情報で分割して得られた各分割領域における第１の視差情報を取得し、ピクチャ表示画面全体における第２の視差情報を取得する」という取得方法に対応した構造例(Syntax)を示している。

　「partition_type」の３ビットフィールドは、ピクチャ表示画面の分割タイプを示す。“０００”は分割なしを示し、“００１”は水平、垂直を各々２等分することを示し、“０１０”は水平、垂直を各々４等分することを示す。

　「partition_count」の４ビットフィールドは、分割領域（Partition）の総数を示し、上述の「partition_type」に依存した値となる。例えば、「partition_type=000」であるとき、図１９（ａ）に示すように、分割領域（Partition）の総数は「１」である。また、例えば、「partition_type=001」であるとき、図１９（ｂ）に示すように、分割領域（Partition）の総数は「４」である。また、例えば、「partition_type=010」であるとき、図１９（ｃ）に示すように、分割領域（Partition）の総数は「１６」である。

　「max_disparity_in_picture」の８ビットフィールドは、ピクチャ表示画面全体の第２の視差情報、つまりピクチャ全体の最大の視差情報（disparity値）を示す。「min_disparity_in_partition」の８ビットフィールドは、各分割領域（Partition）の第１の視差情報、つまり各分割領域における最小の視差情報（disparity値）を示す。

　図１６は、上述の（２）「ピクチャ表示画面を分割情報で分割して得られた各分割領域における第１の視差情報および第２の視差情報を取得する」という取得方法に対応した構造例(Syntax)を示している。この図１６において、図１５と対応する部分は、適宜、その説明を省略する。

　「partition_type」の３ビットフィールドは、ピクチャ表示画面の分割タイプを示す。「partition_count」の４ビットフィールドは、分割領域（Partition）の総数を示し、上述の「partition_type」に依存した値となる。「max_disparity_in_partition」の８ビットフィールドは、各分割領域（Partition）の第２の視差情報、つまり各分割領域における最大の視差情報（disparity値）を示す。「min_disparity_in_partition」の８ビットフィールドは、各分割領域（Partition）の第１の視差情報、つまり各分割領域における最小の視差情報（disparity値）を示す。

　図１７は、上述の（３）「ピクチャ表示画面を第１の分割情報で分割して得られた各分割領域における第１の視差情報を取得し、ピクチャ表示画面を第２の分割情報で分割して得られた各分割領域における第２の視差情報を取得するという取得方法に対応した構造例(Syntax)を示している。この図１７において、図１５、図１６と対応する部分は、適宜、その説明を省略する。

　「partition_type」の３ビットフィールドは、第１の視差情報の取得に係るピクチャ表示画面の分割タイプを示す。「min_partition_count」の４ビットフィールドは、第１の視差情報が取得される分割領域（Partition）の総数を示し、上述の「partition_type」に依存した値となる。「min_disparity_in_partition」の８ビットフィールドは、各分割領域（Partition）の第１の視差情報、つまり各分割領域における最小の視差情報（disparity値）を示す。

　「max_partition_count」の４ビットフィールドは、第２の視差情報が取得される分割領域（Partition）の総数を示す。「max_disparity_in_partition」の８ビットフィールドは、各分割領域（Partition）の第２の視差情報、つまり各分割領域における最大の視差情報（disparity値）を示す。

　図２０、図２１および図２２は、それぞれ、ピクチャ毎の視差情報をＧＯＰ単位で挿入する場合のように、複数のピクチャをまとめて符号化する場合における、「depth_information_sei()」の構造例(Syntax)を示している。図１８には、これらの構造例における主要な情報の内容（Semantics）が示されている。

　図２０は、上述の（１）「ピクチャ表示画面を分割情報で分割して得られた各分割領域における第１の視差情報を取得し、ピクチャ表示画面全体における第２の視差情報を取得する」という取得方法に対応した構造例(Syntax)を示している。この図２０において、上述の図１５と対応する部分は、適宜、その詳細説明を省略する。

　「picture_count」の６ビットフィールドは、ピクチャ数を示す。この「depth_information_sei()」には、ピクチャ数分の第１の視差情報および第２の視差情報が含まれる。「partition_count」の４ビットフィールドは、分割領域（Partition）の総数を示す。「max_disparity_in_picture」の８ビットフィールドは、ピクチャ表示画面全体の第２の視差情報、つまりピクチャ全体の最大の視差情報（disparity値）を示す。「min_disparity_in_partition」の８ビットフィールドは、各分割領域（Partition）の第１の視差情報、つまり各分割領域における最小の視差情報（disparity値）を示す。詳細説明は省略するが、図２０の構造例のその他は、図１５に示す構造例と同様である。

　図２１は、上述の（２）「ピクチャ表示画面を分割情報で分割して得られた各分割領域における第１の視差情報および第２の視差情報を取得する」という取得方法に対応した構造例(Syntax)を示している。この図２１において、図１６、図２０と対応する部分は、適宜、その説明を省略する。

　「picture_count」の６ビットフィールドは、ピクチャ数を示す。この「depth_information_sei()」には、ピクチャ数分の第１の視差情報および第２の視差情報が含まれる。「partition_count」の４ビットフィールドは、分割領域（Partition）の総数を示す。「max_disparity_in_partition」の８ビットフィールドは、各分割領域（Partition）の第２の視差情報、つまり各分割領域における最大の視差情報（disparity値）を示す。「min_disparity_in_partition」の８ビットフィールドは、各分割領域（Partition）の第１の視差情報、つまり各分割領域における最小の視差情報（disparity値）を示す。詳細説明は省略するが、図２１の構造例のその他は、図１６に示す構造例と同様である。

　図２２は、上述の（３）「ピクチャ表示画面を第１の分割情報で分割して得られた各分割領域における第１の視差情報を取得し、ピクチャ表示画面を第２の分割情報で分割して得られた各分割領域における第２の視差情報を取得するという取得方法に対応した構造例(Syntax)を示している。この図２２において、図１７、図２０、図２１と対応する部分は、適宜、その説明を省略する。

　「picture_count」の６ビットフィールドは、ピクチャ数を示す。この「depth_information_sei()」には、ピクチャ数分の第１の視差情報および第２の視差情報が含まれる。「min_partition_count」の４ビットフィールドは、第１の視差情報が取得される分割領域（Partition）の総数を示し、「max_partition_count」の４ビットフィールドは、第２の視差情報が取得される分割領域（Partition）の総数を示す。

　「min_disparity_in_partition」の８ビットフィールドは、各分割領域（Partition）の第１の視差情報、つまり各分割領域における最小の視差情報（disparity値）を示す。「max_disparity_in_partition」の８ビットフィールドは、各分割領域（Partition）の第２の視差情報、つまり各分割領域における最大の視差情報（disparity値）を示す。詳細説明は省略するが、図２２の構造例のその他は、図１７に示す構造例と同様である。

　なお、上述では符号化方式がＡＶＣである場合について説明した。例えば、符号化方式がＭＰＥＧ２ｖｉｄｅｏである場合、「depth_information_sei()」は、ピクチャヘッダ部のユーザデータ領域に、ユーザデータ「user_data()」として挿入される。図２３（ａ）は、「user_data()」の構造例(Syntax)を示している。「user_data_start_code」の３２ビットフィールドは、ユーザデータ（user_data）の開始コードであり、“0x000001B2”の固定値とされる。

　この開始コードに続く３２ビットフィールドは、ユーザデータの内容を識別する識別子である。ここでは、「depth_information_sei_data_identifier」とされ、ユーザデータが、「depth_information_sei_data」であることを識別可能とする。この識別子の後のデータ本体として、「depth_information_sei_data()」が挿入される。図２３（ｂ）は、「depth_information_sei_data()」の構造例(Syntax)を示している。この中に、「depth_information_sei()」が挿入される（図１５～図１７、図２０～図２２参照）。

　なお、符号化方式がＡＶＣあるいはＭＰＥＧ２ｖｉｄｅｏである場合におけるビデオストリームへの視差情報の挿入例について説明した。詳細説明は省略するが、その他の同様の構造の符号化方式、例えばＨＥＶＣなどにあっても、ビデオストリームへの視差情報の挿入を同様の構造で行うことができる。

　「送信データ生成部の他の構成例」
　上述の図８に示す送信データ生成部１１０においては、視差データ生成部１１５で生成されたピクチャ毎の視差情報（第１の視差情報、第２の視差情報）をそのままの状態でビデオストリームに挿入する例を示した。しかし、このピクチャ毎の視差情報を、圧縮符号化処理を施してデータ量を低減した後に、ビデオストリームに挿入することも考えられる。

　図２４は、その場合における送信データ生成部１１０Ａの構成例を示している。この図２４において、図８と対応する部分には同一符号を付し、その詳細説明は省略する。この送信データ生成部１１０Ａは、圧縮符号化部１２０を有している。この圧縮符号化部１２０は、視差データ生成部１１５で生成されたピクチャ毎の視差情報（第１の視差情報、第２の視差情報）に圧縮符号化処理を施し、データ量の低減を図る。

　この圧縮符号化部１２０は、例えば、圧縮符号化処理として可変長符号を用いた処理を行う。ビデオエンコーダ１１３は、圧縮符号化部１２０で圧縮符号化された後の各ピクチャの視差情報（第１の視差情報、第２の視差情報）をビデオストリームに挿入する。この図２４に示す送信データ生成部１１０Ａのその他は、図８に示す送信データ生成部１１０と同様に構成され、同様に動作する。

　図２５は、圧縮符号化部１２０の概略構成例を示している。この圧縮符号化部１２０は、バッファ１２１と、減算器１２２と、可変長符号化部１２２を有している。バッファ１２１は、入力されるピクチャ毎の視差情報を一時的に記憶する。減算器１２２は、ピクチャ間の差分データを取得する。可変長符号化部１２２は、可変長符号化を行う。この可変長符号化部１２０は、可変長符号として、例えば、図２６に示す「Exp-Golomb 符号 se(v)」を用いるが、その他の可変長符号を用いることも考えられる。

　この圧縮符号化部１２０は、非予測タイプ（Non-Prediction Type）あるいは予測タイプ（Prediction Type）のいずれかで圧縮符号化の処理を行う。最初に非予測タイプの圧縮符号化処理について説明する。この場合、符号化処理部１２０では、入力される各ピクチャの視差情報そのものに対して、可変長符号化が行われる。したがって、この非予測タイプでの圧縮符号化処理では、図２５に示す圧縮符号化部１２０において、入力される各ピクチャの視差情報はそのまま可変長符号化部１２３に供給される。

　図２７は、予測を行わない、非予測タイプ（Non-Prediction Type）のみの場合を示している。図２７（ａ）は、Ｉピクチャ、Ｐピクチャ、Ｂピクチャのビデオスライス（Video Slice）の表示順の一例を示している。各ビデオスライスに対応して各ピクチャの視差情報（「SEI」で図示）が存在する。図２７（ｂ）は、各ピクチャのデコード順（エンコード順）を示している。各ピクチャの視差情報はそのまま、つまりイントラデータ（「Intra」で図示）の状態で可変長符号化される。

　この非予測タイプの場合、ＳＥＩ予測をしないのでアクセスユニット単位のＳＥＩバッファリングが不要となるが、ＳＥＩ予測をしないので、予測を行う場合と比較して符号化効率が劣る。

　次に、予測タイプの圧縮符号化処理について説明する。この場合、符号化処理部１２０では、入力される各ピクチャの視差情報のうち、参照ピクチャでは、被参照ピクチャとの間の差分データが取得され、その差分データに対して可変長符号化が行われる。したがって、この予測タイプでの圧縮符号化処理では、図２５に示す圧縮符号化部１２０において、参照ピクチャでは、減算器１２２において、被参照ピクチャとの間の差分データが取られて可変長符号化部１２３に供給される。

　この予測タイプ（Prediction Type）として、表示順にＳＥＩを予測参照するタイプ（予測タイプ０：Prediction Type 0）が考えられる。図２８は、予測タイプ０（PredictionType 0）の場合を示している。図２８（ａ）は、Ｉピクチャ、Ｐピクチャ、Ｂピクチャのビデオスライス（VideoSlice）の表示順の一例を示している。図中、矢印は予測をおこなう時の予測対象を示す。各ビデオスライスに対応して各ピクチャの視差情報（「SEI」で図示）が存在する。

　図２８（ｂ）は、各ピクチャのデコード順（エンコード順）を示している。各ピクチャの視差情報は、Ｉピクチャの視差情報は、そのまま、つまりイントラデータ（「Intra」で図示）の状態で可変長符号化される。そして、Ｉピクチャに続く、Ｂピクチャ、Ｐピクチャの視差情報に関しては、表示順で直前のピクチャが被参照ピクチャとされて差分データ（「Delta」で図示）がとられ、この差分データが可変長符号化される。この図２８（ｂ）において、各ピクチャからの矢印の先は、そのピクチャが参照する被参照ピクチャを示している。

　この予測タイプ０（Prediction Type 0）の場合、表示順でＳＥＩ予測をするので、差分データの値を小さく抑えることができ、符号化効率が最も高くなる。しかし、ＳＥＩ予測順がビデオエンコード順と一致しないので、ＳＥＩをバッファに溜める必要がある。また、Ｂスキップ（B skip）などの特殊再生に不向きである。

　また、予測タイプ（Prediction Type）として、デコード順にＳＥＩを予測参照するタイプが考えられる。そして、この予測タイプとして、ビデオピクチャタイプと合わせたＳＥＩ予測を行うタイプ（予測タイプ１：Prediction Type 1）が考えられる。図２９は、予測タイプ１（Prediction Type 1）の場合を示している。図２９（ａ）は、Ｉピクチャ、Ｐピクチャ、Ｂピクチャのビデオスライス（VideoSlice）の表示順の一例を示している。各ビデオスライスに対応して各ピクチャの視差情報（「SEI」で図示）が存在する。

　図２９（ｂ）は、各ピクチャのデコード順を示している。Ｉピクチャの視差情報は、そのまま、つまりイントラデータ（「Intra」で図示）の状態で可変長符号化される。そして、Ｉピクチャに続く、Ｂピクチャ、Ｐピクチャの視差情報に関しては、デコード順で、ビデオピクチャタイプと合わせたピクチャが被参照ピクチャとされて差分データ（「Delta」で図示）がとられ、この差分データが可変長符号化される。この図２９（ｂ）において、各ピクチャからの矢印の先は、そのピクチャが参照する被参照ピクチャを示している。

　この予測タイプ１（Prediction Type 1）の場合、ＳＥＩ予測順は、ビデオのピクチャタイプを含め、ビデオ符号化順に一致する。ライブエンコーディング向きであり、Ｂスキップ（B skip）などの特殊再生にも対応可能である。しかし、ＳＥＩ予測が複数フレームを跨ぐので、上述の予測タイプ０（Prediction Type 0）に比べて符号化効率が劣る可能性がある。

　また、予測タイプ（Prediction Type）として、デコード順にＳＥＩを予測参照するタイプで、直前にデコードしたＳＥＩを参照するタイプ（予測タイプ２：Prediction Type 2）が考えられる。図３０は、予測タイプ２（Prediction Type 2）の場合を示している。図３０（ａ）は、Ｉピクチャ、Ｐピクチャ、Ｂピクチャのビデオスライス（VideoSlice）の表示順の一例を示している。各ビデオスライスに対応して各ピクチャの視差情報（「SEI」で図示）が存在する。

　図３０（ｂ）は、各ピクチャのデコード順（エンコード順）を示している。Ｉピクチャの視差情報は、そのまま、つまりイントラデータ（「Intra」で図示）の状態で可変長符号化される。そして、Ｉピクチャに続く、Ｂピクチャ、Ｐピクチャの視差情報に関しては、デコード順で、直前のピクチャが被参照ピクチャとされて差分データ（「Delta」で図示）がとられ、この差分データが可変長符号化される。この図３０（ｂ）において、各ピクチャからの矢印の先は、そのピクチャが参照する被参照ピクチャを示している。

　この予測タイプ２（Prediction Type 2）の場合、ＳＥＩ予測順は、ビデオ符号化順に一致するが。ＳＥＩ予測はビデオのピクチャタイプに依存しない。ライブエンコーディング向きではあるが、ＳＥＩ予測が複数フレームを跨ぐので、上述の予測タイプ０（Prediction Type 0）に比べて符号化効率が劣る可能性がある。

　また、予測タイプ（Prediction Type）として、デコード順にＳＥＩを予測参照するタイプで、ビデオピクチャタイプと合わせたＳＥＩ予測を行うと共に、Ｉピクチャ、Ｐピクチャ等の被参照ピクチャのみで視差情報を伝送するタイプ（予測タイプ３：Prediction Type 3）が考えられる。図３１は、予測タイプ３（Prediction Type 3）の場合を示している。図３１（ａ）は、Ｉピクチャ、Ｐピクチャ、Ｂピクチャのビデオスライス（VideoSlice）の表示順の一例を示している。各ビデオスライスに対応して各ピクチャの視差情報（「SEI」で図示）が存在する。

　図３１（ｂ）は、各ピクチャのデコード順を示している。Ｉピクチャの視差情報は、そのまま、つまりイントラデータ（「Intra」で図示）の状態で可変長符号化される。そして、Ｉピクチャに続く、Ｐピクチャ、さらには図示しない被参照Ｂピクチャの視差情報に関しては、デコード順で、ビデオピクチャタイプと合わせたピクチャが被参照ピクチャとされて差分データ（「Delta」で図示）がとられ、この差分データが可変長符号化される。この図３１（ｂ）において、各ピクチャからの矢印の先は、そのピクチャが参照する被参照ピクチャを示している。ＳＥＩ情報が符号化されないピクチャ（Ｂピクチャ）のＳＥＩ情報は、デコーダにおいて、表示順で前後の被参照ピクチャに符号化される２つのＳＥＩの情報から補間される。

　この予測タイプ３（Prediction Type 3）の場合、ＳＥＩ予測順は、ビデオのピクチャタイプを含め、ビデオ符号化順に一致する。ライブエンコーディング向きであり、Ｂスキップ（B skip）などの特殊再生にも対応可能である。Ｉピクチャ、Ｐピクチャ、被参照Ｂピクチャなどの被参照ピクチャのみで視差情報が符号化されて伝送されるので、符号化効率が向上する。しかし、ＳＥＩ予測が複数フレームを跨ぐので、上述の予測タイプ０（Prediction Type 0）に比べて符号化効率が劣る。また、非符号化ＳＥＩ情報を補間して各ピクチャに割り当てるので、視差情報（disparity）の予測先までの時間的距離としてのピクチャ数を明示する必要がある。

　ＡＶＣのビデオストリーム( Frame Compatible、あるいはＭＶＣ) をＭＰＥＧ２－ＴＳコンテナで伝送する場合、アクセスユニット（Access Unit）ごとに、その先頭にＡＵＤ（Access Unit Delimiter) が付される。ＡＵＤの情報は、「primary_pic_type」として、I or P の場合、「primary_pic_type = 1 」いう値で示される。これは、該当するアクセスユニット(通常　1 picture) が被参照ピクチャであることを意味する。ビデオのパケット順は、「AUD 」-「SPS」-「PPS」-「SEI」-「Slice 」で構成される。そのため、デコーダは、「Slice」をデコードするよりも早く、ＳＥＩの中身の情報を正しくデコードするために、ＡＵＤの情報を用いる。なお、被参照ピクチャには、ＡＶＣの場合は、上述したように、Ｉピクチャ、Ｐピクチャに、被参照Ｂピクチャも加えられる。

　なお、上述の予測タイプ３（Prediction Type 3）の場合、Ｉピクチャ、Ｐピクチャ、被参照Ｂピクチャなどの被参照ピクチャのみで視差情報が符号化されて伝送される。そのため、デコーダ側（受信側）では、視差情報の送信のないピクチャでは、例えば、前後のピクチャの視差情報から補間で求めるようにされる。例えば、図３１（ｂ）において、“SEI0”と“SEI3”とで伝送される視差情報に基づいて、B1, B2に相当するピクチャに対する視差情報が求められる。補間値が小数になる場合、「subpixel disparity」に対応したデコーダ（受信機）では、グラフィクス表示位置の動的なアップデータをよりスムーズに行うことが可能となる。

　図３２、図３３および図３４は、それぞれ、ピクチャ毎の圧縮符号化された視差情報をピクチャ単位で挿入する場合における「depth_information_sei()」の構造例(Syntax)を示している。図１８には、これらの構造例における主要な情報の内容（Semantics）が示されている。詳細説明は省略するが、これらの構造例は、視差情報が圧縮符号化されたものであることを除き、上述した図１５、図１６および図１７に示す構造例(Syntax)と同様である。

　図３５、図３６および図３７は、それぞれ、ピクチャ毎の圧縮符号化された視差情報をＧＯＰ単位で挿入する場合のように、複数のピクチャをまとめて符号化する場合における、「depth_information_sei()」の構造例(Syntax)を示している。図１８には、これらの構造例における主要な情報の内容（Semantics）が示されている。詳細説明は省略するが、これらの構造例は、視差情報が圧縮符号化されたものであることを除き、上述した図２０、図２１および図２２に示す構造例(Syntax)と同様である。

　図３８は、予測タイプ３（Prediction Type 3）の場合に適用可能な「depth_information_sei()」の構造例(Syntax)を示している。図１８には、これらの構造例における主要な情報の内容（Semantics）が示されている。「picture_count_for_skipping」のフィールドは、視差情報（disparity）の予測先としての以前の被参照ピクチャまでのピクチャ数を示す。なお、このフィールドの情報は、例えば、図３９に示す「Exp-Golomb 符号 ue(v)」等を用いて、ピクチャ数を可変長符号化した後に挿入することも考えられる。

　「partition_enabled_flag」の１ビットのフラグ情報は、画面が分割されているか否かを示す。このフラグ情報が“１”であるときはピクチャ表示画面が分割されていることを示し、このフラグ情報が“０”であるときは画面が分割されていないことを示す。このフラグ情報により、受信側では、送信されてくる視差情報がピクチャ表示画面全体に対応するものであるか複数の分割領域毎のものであるのかを容易に把握可能となる。

　なお、上述の図１５～図１７、図２０～図２２、図３２～図３７に示す各構造例(Syntax)において、「partition_type」の３ビットフィールドを、この「partition_enabled_flag」の１ビットのフラグ情報で置き換えることも可能である。あるいは、「partition_type」の３ビットフィールドを、この「partition_enabled_flag」と同様のフラグ情報として扱うことも可能である。その場合、３ビットのうちのいずれかのビットが“１”であるときはピクチャ表示画面が分割されていることを示し、３ビットの全てが“０”であるときは画面が分割されていないことを示すものとする。

　図３８に戻って、「Intra_disparity_flag」の１ビットのフラグ情報は、視差情報（disparity）の値が非予測値（イントラデータ）であるか否かを示す。このフラグ情報が“１”であるときは非予測値（イントラデータ）であることを示し、このフラグ情報が“０”であるときは予測値（差分データ）であることを示す。なお、上述の図３２～図３７に示す各構造例(Syntax)においても、この「Intra_disparity_flag」の１ビットのフラグ情報をさらに付加するようにしてもよい。この場合、受信側では、挿入されている視差情報がイントラデータであるか差分データであるかを容易に把握可能となる。

　「partition_count」の４ビットフィールドは、分割領域（Partition）の総数を示す。「max_disparity_in_partition」のフィールドは、各分割領域（Partition）の第２の視差情報、つまり各分割領域における最大の視差情報（disparity値）を示す。「min_disparity_in_partition」のフィールドは、各分割領域（Partition）の第１の視差情報、つまり各分割領域における最小の視差情報（disparity値）を示す。

　図３８に示す「depth_information_sei()」の構造例(Syntax)は、図３２に示す「depth_information_sei()」の構造例(Syntax)に対応したものである。図示は省略するが、その他の図３３～図３７に示す「depth_information_sei()」の構造例(Syntax)に対応したものも同様に考えられる。なお、図３８に示す「depth_information_sei()」の構造例(Syntax)の代わりに、図４０に示す「depth_information_sei()」の構造例(Syntax)も考えられる。この場合、「partition_type」の３ビットフィールドは、例えば、「partition_enabled_flag」と同様のフラグ情報として扱われる。

　「セットトップボックスの説明」
　セットトップボックス２００は、放送局１００から放送波に載せて送られてくるトランスポートストリームＴＳを受信する。また、セットトップボックス２００は、このトランスポートストリームＴＳに含まれるビデオストリームをデコードして、立体画像を構成する左眼画像データおよび右眼画像データを生成する。また、セットトップボックス２００は、ビデオストリームに挿入されている、画像データのピクチャ毎の視差情報（第１の視差情報、第２の視差情報）を抽出する。

　セットトップボックス２００は、第１の視差情報および第２の視差情報に基づいて、例えば、最も手前のオブジェクト再生位置に対する視差角（交差方向の視差角）および最も奥のオブジェクト再生位置に対する視差角（同側方向の視差角）が視聴上健康を害さない所定の範囲内にあるか否かをチェックする。そして、セットトップボックス２００は、所定の範囲内に収まっていない場合には、収まるによう左眼画像データおよび右眼画像データを再構成すると共に、第１の視差情報および第２の視差情報を修正する。

　また、セットトップボックス２００は、画像にグラフィクス（ＳＴＢグラフィクス）を重畳表示する際には、画像データおよび視差情報（第１の視差情報）と、グラフィクスデータとを用いて、グラフィクスが重畳された左眼画像および右眼画像のデータを得る。この場合、セットトップボックス２００は、左眼画像および右眼画像に重畳されるグラフィクスに、ピクチャ毎に、このグラフィクスの表示位置に対応した視差を付与し、グラフィクスが重畳された左眼画像のデータおよびグラフィクスが重畳された右眼画像のデータを得る。

　上述のようにグラフィクスに視差を付与することで、立体画像に重畳表示されるグラフィクス（ＳＴＢグラフィクス）を、その表示位置における立体画像のオブジェクトよりも手前に表示させることができる。これにより、ＯＳＤあるいはアプリケーションあるいは番組情報のＥＰＧなどのグラフィクスを画像に重畳表示する場合に、画像内の各オブジェクトに対する遠近感の整合性を維持できる。

　図４１は、視差情報によるグラフィクスの奥行き制御の概念を示している。視差情報がマイナス値である場合、スクリーン上において左眼表示用のグラフィクスが右側に、右眼表示用のグラフィクスが左側にずれるように視差が付与される。この場合、グラフィクスの表示位置はスクリーンよりも手前となる。また、視差情報がプラス値である場合、スクリーン上において左眼表示用のグラフィクスが左側に、右眼表示用のグラフィクスが右側にずれるように視差が付与される。この場合、グラフィクスの表示位置はスクリーンよりも奥となる。

　上述したように、ビデオストリームには、画像データのピクチャ毎に取得された視差情報が挿入されている。そのため、セットトップボックス２００は、視差情報によるグラフィクスの奥行き制御を、グラフィクスの表示タイミングに合った視差情報を用いて精度よく行うことができる。

　また、図４１は、同側方向の視差角（θ0－θ2）と、交差方向の視差角（θ0－θ1）を示している。セットトップボックス２００においては、ビデオストリームに挿入されてくるピクチャ毎の第１の視差情報および第２の視差情報に基づいて、これらの視差角が視聴上健康を害さない所定の範囲内にあるか否かがチェックされる。

　図４２は、ビデオストリームにピクチャ単位で視差情報が挿入されている場合の例であって、セットトップボックス２００では、画像データのピクチャタイミングで順次視差情報が取得される。グラフィクスの表示に当たっては、グラフィクスの表示タイミングに合った視差情報（第１の視差情報）が使用され、グラフィクスに適切な視差が付与される。また、図４３は、例えば、ビデオストリームにＧＯＰ単位で視差情報が挿入されている場合の例であって、セットトップボックス２００では、画像データのＧＯＰの先頭タイミングで、ＧＯＰ内の各ピクチャの視差情報（視差情報セット）がまとめて取得される。グラフィクス（ＳＴＢグラフィクス）の表示に当たっては、グラフィクスの表示タイミングに合った視差情報（第１の視差情報）が使用され、グラフィクスに適切な視差が付与される。

　図４４（ａ）の「Side View」は、画像上における字幕（サブタイトル）およびＯＳＤグラフィクスの表示例を示している。この表示例では、背景、中景オブジェクトおよび近景オブジェクトとからなる画像上に、字幕およびグラフィクスが重畳された例である。図４４（ｂ）の「Top View」は、背景、中景オブジェクト、近景オブジェクト、字幕およびグラフィクスの遠近感を示している。字幕およびグラフィクスは、表示位置に対応するオブジェクトよりも手前にあるように認識されることを示している。なお、図示していないが、字幕とグラフィクスの表示位置が重なる場合には、例えば、グラフィクスが字幕よりも手前に認識されるように、グラフィクスに適切な視差が付与される。

　「セットトップボックスの構成例」
　図４５は、セットトップボックス２００の構成例を示している。セットトップボックス２００は、コンテナバッファ２１１と、デマルチプレクサ２１２と、コーデッドバッファ２１３と、ビデオデコーダ２１４と、デコーデッドバッファ２１５と、スケーラ２１６と、Ｌ／Ｒ再構成部２６３と、重畳部２１７を有している。また、セットトップボックス２００は、圧縮復号化部２６１と、視差情報バッファ２１８と、視差情報制御部２６２と、セットトップボックス（ＳＴＢ）グラフィクス発生部２１９と、奥行き制御部２２０と、グラフィクスバッファ２２１を有している。

　また、セットトップボックス２００は、コーデッドバッファ２３１と、サブタイトルデコーダ２３２と、ピクセルバッファ２３３と、サブタイトル視差情報バッファ２３４と、サブタイトル表示制御部２３５を有している。さらに、セットトップボックス２００は、コーデッドバッファ２４１と、オーディオデコーダ２４２と、オーディオバッファ２４３と、チャネルミキシング部２４４と、ＨＤＭＩ送信部２５１を有している。

　コンテナバッファ２１１は、図示しないデジタルチューナ等で受信されたトランスポートストリームＴＳを一時的に記憶する。このトランスポートストリームＴＳには、ビデオストリーム、サブタイトルストリームおよびオーディオストリームが含まれている。ビデオストリームとして、左眼画像データおよび右眼画像データが符号化されて得られた１つあるいは２つのビデオストリームが含まれている。

　例えば、左眼画像データおよび右眼画像データによりサイド・バイ・サイド方式あるいはトップ・アンド・ボトム方式の画像データが構成されて１つのビデオストリームで送られてくることがある。また、例えば、左眼画像データおよび右眼画像データが、ＭＶＣのベースビューストリーム、ノンベースビューストリームのように、それぞれ、別個のビデオストリームで送られてくることがある。

　デマルチプレクサ２１２は、コンテナバッファ２１１に一時的に記憶されたトランスポートストリームＴＳから、ビデオ、サブタイトルおよびオーディオの各ストリームを抽出する。また、デマルチプレクサ２１２は、このトランスポートストリームＴＳから、ビデオストリームに視差情報が挿入されているか否かを示す識別情報（「graphics_depth_info_not_existed_flag[0]」のフラグ情報）を抽出し、図示しない制御部（ＣＰＵ）に送る。ビデオデコーダ２１４は、制御部（ＣＰＵ）の制御のもと、識別情報が視差情報の挿入を示すとき、後述するように、ビデオストリームから視差情報（第１の視差情報、第２の視差情報）を取得する。

　コーデッドバッファ２１３は、デマルチプレクサ２１２で抽出されるビデオストリームを一時的に記憶する。ビデオデコーダ２１４は、コーデッドバッファ２１３に記憶されているビデオストリームにデコード処理を行って、左眼画像データおよび右眼画像データを取得する。また、ビデオデコーダ２１４は、ビデオストリームに挿入されている画像データのピクチャ毎の視差情報（第１の視差情報、第２の視差情報）を取得する。デコーデッドバッファ２１５は、ビデオデコーダ２１４で取得された左眼画像データおよび右眼画像データを一時的に記憶する。

　圧縮復号化部２６１は、ビデオデコーダ２１４で取得された画像データのピクチャ毎の視差情報（第１の視差情報、第２の視差情報）を入力し、この入力視差情報が圧縮符号化されたものであるとき、復号化処理を行う。入力視差情報が圧縮符号化されていないものであるとき、圧縮復号化部２６１は、その入力視差情報をそのまま出力視差情報とする。

　この圧縮復号化部２６１は、図２４に示す送信データ生成部１１０Ａにおける圧縮符号化部１２０とは逆の処理を行う。図４６は、圧縮復号化部２６１の概略構成例を示している。この圧縮復号化部２６１は、可変長復号化部２６４と、バッファ２６５と、加算部２６６を有している。可変長復号化部２６４は、圧縮符号化された入力視差情報に対して可変長復号化を行う。バッファ２６５は、復号化された出力視差情報を一時的に記憶する。加算部２６６は、参照ピクチャの差分データを被参照ピクチャの視差情報に加算して、参照ピクチャの出力視差情報を得る。

　図４５に戻って、視差情報バッファ２１８は、圧縮復号化された視差情報（第１の視差情報、第２の視差情報）を、一時的に記憶する。視差情報制御部２６２は、視差情報バッファ２１８に記憶されているピクチャ毎の第１の視差情報および第２の視差情報に基づいて、最も手前のオブジェクト再生位置に対する視差角（交差方向の視差角）および最も奥のオブジェクト再生位置に対する視差角（同側方向の視差角）が視聴上健康を害さない所定の範囲内にあるか否かをチェックする。

　また、この視差情報制御部２６２は、視差角が所定の範囲内に収まっていない場合には、視差角が所定の範囲内に収まるように、Ｌ／Ｒ再構成部２６３に左眼画像データおよび右眼画像データの再構成を指示する。また、視差情報制御部２６２は、再構成される左眼画像データおよび右眼画像データに合わせて第１の視差情報および／または第２の視差情報を修正して出力する。なお、視差情報制御部２６２は、視差角が所定の範囲内に収まっている場合には、Ｌ／Ｒ再構成部２６３に左眼画像データおよび右眼画像データの再構成を指示することはなく、また、第１の視差情報および第２の視差情報を修正することなくそのまま出力する。

　図４７の上部は、受信データ（左眼画像データおよび右眼画像データ）における手前（near）側と奥（far）側の視差角の時間推移の一例を示している。範囲ｄは、視聴上健康に害を及ばさない視差角の範囲を示している。この例では、奥（far）側の視差角に範囲ｄに収まらない区間がある。

　図４７の下部は、再構成後のデータ（左眼画像データおよび右眼画像データ）における手前（near）側と奥（far）側の視差角の時間推移の一例を示している。（ａ）は、範囲ｄを越えた際にリミット制御をした場合の例である。（ｂ）は、範囲ｄを越えないように、全体の奥行き量（depth volume）を低減した場合の例である。

　図４８は、視差情報制御部２６２の構成例を示している。この視差情報制御部２６２は、最大値取得部２７１と、最小値取得部２７２と、視差角チェック部２７２と、視差情報補正部２７４を有している。最大値取得部２７１は、受信された第２の視差情報（Max disparity）から最大値のものを選択して、視差角チェック部２７３に供給する。受信された第２の視差情報は、ピクチャ画面全体のものである場合には一個であり、複数の分割領域毎のものであれば複数個となる。最小値取得部２７２は、受信された第１の視差情報（Min disparity）から最小値のものを選択して、視差角チェック部２７３に供給する。受信された第１の視差情報は、ピクチャ画面全体のものである場合には一個であり、複数の分割領域毎のものであれば複数個となる。

　視差角チェック部２７３は、第１の視差情報および第２の視差情報に基づいて、手前側の視差角と奥側の視差角が、視聴上健康に害を及ばさない視差角の範囲ｄ（図４７参照）に収まっているか否かをチェックし、そのチェック結果を視差情報補正部２７４に供給する。視差情報補正部２７４は、視差角が範囲ｄに収まっていないとき、視差角が範囲ｄに収まるように、Ｌ／Ｒ再構成部２６３に、受信された左眼画像データおよび右眼画像データの再構成を指示する。

　また、視差情報補正部２７４には、受信された第１の視差情報（Min disparity）および第２の視差情報（Max disparity）が供給されている。視差情報補正部２７４は、上述の左眼画像データおよび右眼画像データの再構成指示に合わせて第１の視差情報および第２の視差情報に対して修正処理を行って、修正後の第１の視差情報（Corrected Min disparity）および第２の視差情報(Corrected Max disparity）を出力する。なお、視差情報補正部２７４は、視差角が範囲ｄに収まっているときには、Ｌ／Ｒ再構成部２６３に左眼画像データおよび右眼画像データの再構成を指示することはなく、また、第１の視差情報および第２の視差情報を修正することなくそのまま出力する。

　図４５に戻って、スケーラ２１６は、デコーデッドバッファ２１５から出力される左眼画像データおよび右眼画像データに対して、必要に応じて、水平方向や垂直方向のスケーリング処理を行う。例えば、左眼画像データおよび右眼画像データがサイド・バイ・サイド方式あるいはトップ・アンド・ボトム方式の画像データとして１つのビデオストリームで送られてくる場合には、水平方向あるいは垂直方向に２倍にスケールアップして出力する。また、例えば、左眼画像データおよび右眼画像データがＭＶＣのベースビューストリーム、ノンベースビューストリームのように、それぞれ、別個のビデオストリームで送られてくる場合には、スケーリング処理を行うことなく、左眼画像データおよび右眼画像データをそのまま出力する。

　Ｌ／Ｒ再構成部２６３は、左眼画像データおよび右眼画像データを再構成する。すなわち、Ｌ／Ｒ再構成部２６３は、同側方向または交差方向の視差角のいずれかが視聴上健康を害さない所定の範囲内からはみ出るとき、上述の視差情報制御部２６２からの再構成指示に基づいて、所定の範囲内に収まるように左眼画像データおよび右眼画像データを再構成する。

　コーデッドバッファ２３１は、デマルチプレクサ２１４で抽出されるサブタイトルストリームを一時的に記憶する。サブタイトルデコーダ２３２は、上述の送信データ生成部１１０のサブタイトルエンコーダ１１７（図８参照）とは逆の処理を行う。すなわち、サブタイトルデコーダ２３２は、コーデッドバッファ２３１に記憶されているサブタイトルストリームのデコード処理を行って、サブタイトルデータを得る。

　このサブタイトルデータには、サブタイトル（字幕）のビットマップデータと、このサブタイトルの表示位置情報「Subtitle rendering position (x2,y2）」と、サブタイトル（字幕）の視差情報「Subtitle disparity」が含まれている。ピクセルバッファ２３３は、サブタイトルデコーダ２３２で得られるサブタイトル（字幕）のビットマップデータおよびサブタイトル（字幕）の表示位置情報「Subtitle rendering position (x2,y2）」を一時的に記憶する。サブタイトル視差情報バッファ２３４は、サブタイトルデコーダ２３２で得られるサブタイトル（字幕）の視差情報「Subtitle disparity」を一時的に記憶する。

　サブタイトル表示制御部２３５は、サブタイトル（字幕）のビットマップデータと、このサブタイトル（字幕）の表示位置情報および視差情報に基づいて、視差が付与された左眼表示用および右眼表示用のサブタイトルのビットマップデータ「Subtitle data」を生成する。セットトップボックス（ＳＴＢ）グラフィクス発生部２１９は、ＯＳＤあるいはアプリケーション、あるいはＥＰＧなどのグラフィクスデータを発生する。このグラフィクスデータには、グラフィクスビットマップデータ「Graphics data」と、このグラフィクスの表示位置情報「Graphics rendering position (x1,y1）」が含まれている。

　グラフィクスバッファ２２１は、セットトップボックスグラフィクス発生部２１９で発生されたグラフィクスビットマップデータ「Graphics data」を一時的に記憶する。重畳部２１７は、左眼画像データおよび右眼画像データに、それぞれ、サブタイトル表示制御部２３５で生成された左眼表示用および右眼表示用のサブタイトルのビットマップデータ「Subtitle data」を重畳する。

　また、重畳部２１７は、左眼画像データおよび右眼画像データに、それぞれ、グラフィクスバッファ２２１に記憶されているグラフィクスビットマップデータ「Graphics data」を重畳する。この際、左眼画像データおよび右眼画像データのそれぞれに重畳されるグラフィクスビットマップデータ「Graphics data」には、後述する奥行き制御部２２０により、視差が付与される。ここで、グラフィクスビットマップデータ「Graphics data」がサブタイトルのビットマップデータ「Subtitle data」と同一画素を共有する場合、重畳部２１７は、サブタイトルデータの上にグラフィクスデータを上書きする。

　奥行き制御部２２０は、左眼画像データおよび右眼画像データのそれぞれに重畳されるグラフィクスビットマップデータ「Graphics data」に視差を付与する。そのため、奥行き制御部２２０は、画像データのピクチャ毎に、左眼表示用および右眼表示用のグラフィクスの表示位置情報「Rendering position」を生成し、グラフィクスバッファ２２１に記憶されているグラフィクスビットマップデータ「Graphics data」の左眼画像データおよび右眼画像データへの重畳位置のシフト制御を行う。

　奥行き制御部２２０は、図４９に示すように、以下の情報を用いて、表示位置情報「Rendering position」を生成する。すなわち、奥行き制御部２２０は、視差情報制御部２６２から出力されるピクチャ毎の第１の視差情報（Min disparity）を用いる。また、奥行き制御部２２０は、ピクセルバッファ２３３に記憶されているサブタイトル（字幕）の表示位置情報「Subtitle rendering position (x2,y2）」を用いる。

　また、奥行き制御部２２０は、サブタイトル視差情報バッファ２３４に記憶されているサブタイトル（字幕）の視差情報「Subtitle disparity」を用いる。また、奥行き制御部２２０は、セットトップボックスグラフィクス発生部２１９で発生されるグラフィクスの表示位置情報「Graphics rendering position (x1,y1）」を用いる。また、奥行き制御部２２０は、ビデオストリームに視差情報が挿入されているか否かを示す識別情報を用いる。

　また、奥行き制御部２２０は、視差情報制御部２６２から出力されるピクチャ毎の第１の視差情報（Min disparity）を、字幕あるいはグラフィクスの画像への重畳に応じて更新する。この場合、奥行き制御部２２０は、サブタイトル（字幕）の表示位置およびグラフィクスの表示位置に対応した分割領域（Partition）の視差情報（Disparity）の値を、例えば、サブタイトル（字幕）あるいはグラフィクスの視差付与に用いられた視差情報（Disparity）の値に更新する。

　図５０、図５１のフローチャートは、奥行き制御部２２０の制御処理の手順の一例を示している。奥行き制御部２２０は、この制御処理を、グラフィクス表示を行う各ピクチャ（フレーム）で実行する。奥行き制御部２２０は、ステップＳＴ１において、制御処理を開始する。その後に、ステップＳＴ２において、識別情報に基づいて、ビデオストリームにグラフィクス向けの視差情報の挿入があるか否かを判断する。

　ビデオストリームに視差情報の挿入があるとき、奥行き制御部２２０は、ステップＳＴ３の処理に移る。このステップＳＴ３において、グラフィクスを重畳表示（overlay）する座標が含まれる分割領域（partition）を全て検査する。そして、奥行き制御部２２０は、ステップＳＴ４において、対象となる分割領域（partition）の視差情報（disparity）を比較し、最適な値、例えば最小値を選択して、グラフィクス視差情報（disparity）の値（graphics_disparity）とする。

　次に、奥行き制御部２２０は、ステップＳＴ５の処理に移る。上述のステップＳＴ２でビデオストリームに視差情報の挿入がないとき、奥行き制御部２２０は、直ちに、ステップＳＴ５の処理に移る。このステップＳＴ５において、奥行き制御部２２０は、視差情報（disparity）を持ったサブタイトルストリーム（Subtitle stream）があるか否かを判断する。

　視差情報（disparity）を持ったサブタイトルストリーム（Subtitle stream）があるとき、奥行き制御部２２０は、ステップＳＴ６において、サブタイトル用の視差情報（disparity）の値（subtitle_disparity）と、グラフィクス用の視差情報の値（graphics_disparity）とを比較する。なお、グラフィクス用の視差情報の値（graphics_disparity）は、ビデオストリームにグラフィクス用の視差情報（disparity）の挿入がないときは、例えば、「０」とされる。

　次に、奥行き制御部２２０は、ステップＳＴ７において、「subtitle_disparity＞（graphics_disparity）の条件を満足するか否かを判断する。この条件を満足するとき、奥行き制御部２２０は、ステップＳＴ８において、グラフィクスバッファ２２１に記憶されているグラフィクスビットマップデータ「Graphics data」に対して、グラフィクス用の視差情報（disparity）の値（graphics_disparity）と同等の値を用いて、表示位置がシフトされた左眼表示用および右眼表示用のグラフィクスビットマップデータを得て、それぞれ、左眼画像データおよび右眼画像データに重畳する。

　次に、奥行き制御部２２０は、ステップＳＴ９において、サブタイトルあるいはグラフィクスを重畳させた画面位置に相当する分割領域（Partition）の視差情報（disparity）の値を更新する。奥行き制御部２２０は、ステップＳＴ９の処理の後、ステップＳＴ１０において、制御処理を終了する。

　一方、ステップＳＴ７で条件を満足しないとき、奥行き制御部２２０は、ステップＳＴ１０において、グラフィクスバッファ２２１に記憶されているグラフィクスビットマップデータ「Graphics data」に対して、サブタイトル用の視差情報（disparity）よりも小さい値を用いて、表示位置がシフトされた左眼表示用および右眼表示用のグラフィクスビットマップデータを得て、それぞれ、左眼画像データおよび右眼画像データに重畳する。奥行き制御部２２０は、ステップＳＴ１１の処理の後、ステップＳＴ９の処理を経て、ステップＳＴ１０において、制御処理を終了する。

　また、ステップＳＴ５で視差情報（disparity）を持ったサブタイトルストリーム（Subtitle stream）がないとき、奥行き制御部２２０は、ステップＳＴ１２の処理に移る。このステップＳＴ１２において、奥行き制御部２２０は、ステップＳＴ４において得られるグラフィクス用の視差情報の値（graphics_disparity）を用いるか、あるいはセットトップボックス２００で算出される視差情報（disparity）の値を用いて、グラフィクスの奥行き制御を行う。

　すなわち、奥行き制御部２２０は、グラフィクスバッファ２２１に記憶されているグラフィクスビットマップデータ「Graphics data」に対して、グラフィクス用の視差情報の値（graphics_disparity）あるいは算出される視差情報（disparity）の値を用いて、表示位置がシフトされた左眼表示用および右眼表示用のグラフィクスビットマップデータを得て、それぞれ、左眼画像データおよび右眼画像データに重畳する。奥行き制御部２２０は、ステップＳＴ１２の処理の後、ステップＳＴ９の処理を経て、ステップＳＴ１０において、制御処理を終了する。

　図５２は、セットトップボックス２００におけるグラフィクスの奥行き制御例を示している。この例において、グラフィクス（ＳＴＢグラフィクス）は、右側の８つの分割領域（Partition 2,3,6,7,10,11,14,15）の視差情報のうち最小の値の視差情報に基づいて、左眼表示用のグラフィクスおよび右眼表示用のグラフィクスに視差が付与される。その結果、グラフィクスは、これら８つの分割領域の画像（ビデオ）オブジェクトより手前に表示されるようになる。

　図５３も、セットトップボックス２００におけるグラフィクスの奥行き制御例を示している。この例において、グラフィクス（ＳＴＢグラフィクス）は、右側の８つの分割領域（Partition 2,3,6,7,10,11,14,15）の視差情報のうち最小の値の視差情報、さらにはサブタイトル（字幕）の視差情報に基づいて、左眼表示用のグラフィクスおよび右眼表示用のグラフィクスに視差が付与される。

　その結果、グラフィクスは、これら８つの分割領域の画像（ビデオ）オブジェクトより手前で、さらに、サブタイトル（字幕）よりも手前に表示されるようになる。なお、この場合、サブタイトル（字幕）も、サブタイトル（字幕）の視差情報に基づいて、サブタイトルの表示位置に対応した４つの分割領域（Partition 8,9,10,11）の画像（ビデオ）オブジェクトより手前に表示されるようになる。

　なお、この図５３の奥行き制御例の場合の視差情報の更新処理は、例えば、以下のように行われる。すなわち、最初に、サブタイトルの表示位置に対応した４つの分割領域（Partition 8,9,10,11）の視差情報（Disparity）の値が、サブタイトルへの視差付与に使用された視差情報値（subtitle_disparity）で更新される。その後、８つの分割領域（Partition2,3,6,7,10,11,14,15）の視差情報（Disparity）の値が、グラフィクスへの視差付与に使用された視差情報値（graphics_disparity）で更新される。

　図４５に戻って、コーデッドバッファ２４１は、デマルチプレクサ２１２で抽出されるオーディオストリームを一時的に記憶する。オーディオデコーダ２４２は、上述の送信データ生成部１１０のオーディオエンコーダ１１９（図８参照）とは逆の処理を行う。すなわち、オーディオデコーダ２４２は、コーデッドバッファ２４１に記憶されているオーディオストリームの復号化処理を行って、復号化された音声データを得る。オーディオバッファ２４３は、オーディオデコーダ２４２で得られる音声データを一時的に記憶する。チャネルミキシング部２４４は、オーディオバッファ２４３に記憶されている音声データに対して、例えば５．１chサラウンド等を実現するための各チャネルの音声データを生成して出力する。

　なお、デコーデッドバッファ２１５、視差情報バッファ２１８、ピクセルバッファ２３３、サブタイトル視差情報バッファ２３４およびオーディオバッファ２４３からの情報（データ）の読み出しは、ＰＴＳに基づいて行われ、転送同期が取られる。

　ＨＤＭＩ送信部２５１は、ＨＤＭＩに準拠した通信により、重畳部２１７でサブタイトルおよびグラフィクスの重畳処理がされて得られた左眼画像データおよび右眼画像データと、チャネルミキシング部２４４で得られた各チャネルの音声データを、ＨＤＭＩのシンク機器、この実施の形態ではテレビ受信機３００に送信する。ここで、重畳部２１７で得られる左眼画像データは、左眼表示用のサブタイトル（字幕）およびＳＴＢグラフィクスが重畳された左眼画像のデータである。また、重畳部２１７で得られる右眼画像データは、右眼表示用のサブタイトル（字幕）およびＳＴＢグラフィクスが重畳された右眼画像のデータである。

　また、このＨＤＭＩ送信部２５１は、奥行き制御部２２０で更新された各ピクチャの第１の視差情報（Min disparity）、および視差情報制御部２６２から出力される各ピクチャの第２の視差情報（Max disparity）を、ＨＤＭＩインタフェースで、テレビ受信機３００に送信する。この実施の形態において、これら第１の視差情報および第２の視差情報は、画像データのブランキング期間に挿入されて、送信される。このＨＤＭＩ送信部２５１の詳細は後述する。

　図４５に示すセットトップボックス２００の動作を簡単に説明する。デジタルチューナ等で受信されたトランスポートストリームＴＳは、コンテナバッファ２１１に一時的に記憶される。このトランスポートストリームＴＳには、ビデオストリーム、サブタイトルストリームおよびオーディオストリームが含まれている。ビデオストリームとしては、左眼画像データおよび右眼画像データが符号化されて得られた１つあるいは２つのビデオストリームが含まれている。

　デマルチプレクサ２１２では、コンテナバッファ２１１に一時的に記憶されたトランスポートストリームＴＳから、ビデオ、サブタイトルおよびオーディオの各ストリームが抽出される。また、デマルチプレクサ２１２では、このトランスポートストリームＴＳから、ビデオストリームに視差情報が挿入されているか否かを示す識別情報（「graphics_depth_info_not_existed_flag[0]」のフラグ情報）が抽出され、図示しない制御部（ＣＰＵ）に送られる。

　デマルチプレクサ２１２で抽出されるビデオストリームはコーデッドバッファ２１３に供給されて一時的に記憶される。そして、ビデオデコーダ２１４では、コーデッドバッファ２１３に記憶されているビデオストリームのデコード処理が行われて、左眼画像データおよび右眼画像データが取得される。この左眼画像データおよび右眼画像データは、デコーデッドバッファ２１５に一時的に記憶される。

　また、ビデオデコーダ２１４では、ビデオストリームに挿入されている、画像データのピクチャ毎の視差情報（第１の視差情報、第２の視差情報）が取得される。この視差情報は、圧縮復号化部２６１で適宜圧縮復号化が行われた後に、視差情報バッファ２１８に一時的に記憶される。視差情報制御部２６２では、視差情報バッファ２１８に記憶されているピクチャ毎の第１の視差情報および第２の視差情報に基づいて、最も手前のオブジェクト再生位置に対する視差角（交差方向の視差角）および最も奥のオブジェクト再生位置に対する視差角（同側方向の視差角）が視聴上健康を害さない範囲ｄ（図４７参照）に収まっているか否かがチェックされる。

　そして、この視差情報制御部２６２では、視差角が所定の範囲内に収まっていない場合、視差角が範囲ｄに収まるように、Ｌ／Ｒ再構成部２６３に左眼画像データおよび右眼画像データの再構成を指示することが行われる。また、その場合、この視差情報制御部２６２では、再構成される左眼画像データおよび右眼画像データに合わせて、第１の視差情報および／または第２の視差情報を修正して出力することが行われる。なお、視差情報制御部２６２では、視差角が所定の範囲ｄに収まっている場合には、Ｌ／Ｒ再構成部２６３に左眼画像データおよび右眼画像データの再構成を指示することは行われず、また、第１の視差情報および第２の視差情報は修正されずに出力される。

　スケーラ２１６では、デコーデッドバッファ２１５から出力される左眼画像データおよび右眼画像データに対して、必要に応じて、水平方向や垂直方向のスケーリング処理が行われる。このスケーラ２１６からは、例えば、１９２０＊１０８０のフルＨＤのサイズの左眼画像データおよび右眼画像データが得られる。この左眼画像データおよび右眼画像データは、Ｌ／Ｒ再構成部２６３を介して、重畳部２１７に供給される。

　Ｌ／Ｒ再構成部２６３では、必要に応じて、左眼画像データおよび右眼画像データの再構成を行う。すなわち、Ｌ／Ｒ再構成部２６３では、同側方向または交差方向の視差角のいずれかが視聴上健康を害さない範囲ｄ（図４７参照）に収まっていないとき、視差情報制御部２６２からの再構成指示に基づいて、その視差角が所定の範囲内に収まるように左眼画像データおよび右眼画像データを再構成することが行われる。

　また、デマルチプレクサ２１２で抽出されるサブタイトルストリームは、コーデッドバッファ２３１に供給されて一時的に記憶される。サブタイトルデコーダ２３２では、コーデッドバッファ２３１に記憶されているサブタイトルストリームのデコード処理が行われて、サブタイトルデータが得られる。このサブタイトルデータには、サブタイトル（字幕）のビットマップデータと、このサブタイトルの表示位置情報「Subtitle rendering position (x2,y2）」と、サブタイトル（字幕）の視差情報「Subtitle disparity」が含まれている。

　サブタイトルデコーダ２３２で得られるサブタイトル（字幕）のビットマップデータおよびサブタイトル（字幕）の表示位置情報「Subtitle rendering position (x2,y2）」は、ピクセルバッファ２３３に一時的に記憶される。また、サブタイトルデコーダ２３２で得られるサブタイトル（字幕）の視差情報「Subtitle disparity」はサブタイトル視差情報バッファ２３４に一時的に記憶される。

　サブタイトル表示制御部２３５では、サブタイトル（字幕）のビットマップデータと、このサブタイトル（字幕）の表示位置情報および視差情報に基づいて、視差が付与された左眼表示用および右眼表示用のサブタイトルのビットマップデータ「Subtitle data」が生成される。このように生成された左眼表示用および右眼表示用のサブタイトルのビットマップデータ「Subtitle data」は、重畳部２１７に供給され、それぞれ、左眼画像データおよび右眼画像データに重畳される。

　セットトップボックス（ＳＴＢ）グラフィクス発生部２１９では、ＯＳＤあるいはアプリケーション、あるいはＥＰＧなどのグラフィクスデータが発生される。このグラフィクスデータには、グラフィクスのビットマップデータ「Graphics data」と、このグラフィクスの表示位置情報「Graphics rendering position (x1,y1）」が含まれている。グラフィクスバッファ２２１には、セットトップボックス（ＳＴＢ）グラフィクス発生部２１９で発生されたグラフィクスデータが一時的に記憶される。

　重畳部２１７では、左眼画像データおよび右眼画像データにグラフィクスバッファ２２１に記憶されているグラフィクスビットマップデータ「Graphics data」が重畳される。この際、左眼画像データおよび右眼画像データのそれぞれに重畳されるグラフィクスビットマップデータ「Graphics data」には、奥行き制御部２２０により、視差情報制御部２６２から出力される画像データの各ピクチャの分割領域毎の第１の視差情報のうち、グラフィクスの表示位置に対応した視差情報に基づいて視差が付与される。この場合、グラフィクスビットマップデータ「Graphics data」がサブタイトルのビットマップデータ「Subtitle data」と同一画素を共有する場合、重畳部２１７では、サブタイトルデータの上にグラフィクスデータが上書きされる。

　重畳部２１７からは、左眼表示用のサブタイトル（字幕）およびＳＴＢグラフィクスが重畳された左眼画像のデータが得られると共に、右眼表示用のサブタイトル（字幕）およびＳＴＢグラフィクスが重畳された右眼画像のデータが得られる。この左眼画像データおよび右眼画像データは、ＨＤＭＩ送信部２５１に供給される。

　また、デマルチプレクサ２１２で抽出されるオーディオストリームは、コーデッドバッファ２４１に供給されて一時的に記憶される。オーディオデコーダ２４２では、コーデッドバッファ２４１に記憶されているオーディオスストリームのデコード処理が行われて、復号化された音声データが得られる。この音声データはオーディオバッファ２４３を介してチャネルミキシング部２４４に供給される。チャネルミキシング部２４４では、音声データに対して、例えば５．１chサラウンド等を実現するための各チャネルの音声データが生成される。この音声データは、ＨＤＭＩ送信部２５１に供給される。

　また、奥行き制御部２２０では、視差情報制御部２６２から出力される画像データの各ピクチャの分割領域毎の第１の視差情報が、字幕あるいはグラフィクスの画像への重畳に応じて更新される。この場合、サブタイトル（字幕）の表示位置およびグラフィクスの表示位置に対応した分割領域（Partition）の視差情報（Disparity）の値が、例えば、サブタイトル（字幕）あるいはグラフィクスの視差付与に用いられた視差情報（Disparity）の値に更新される。この更新された視差情報は、ＨＤＭＩ送信部２５１に供給される。また、視差情報制御部２６２から出力される画像データの各ピクチャの第２の視差情報も、ＨＤＭＩ送信部２５１に供給される。

　ＨＤＭＩ送信部２５１により、ＨＤＭＩに準拠した通信により、左眼画像データおよび右眼画像データ、音声データ、さらには、画像データの各ピクチャの視差情報（第１の視差情報、第２の視差情報）が、テレビ受信機３００に送信される。ここで、視差情報は、画像データのブランキング期間に配置される情報パケット、この実施の形態においては、ＨＤＭＩ・ベンダー・スペシフィック・インフォフレーム（HDMI Vendor Specific InfoFrame）に挿入されて送信される。

　［テレビ受信機の説明］
　図１に戻って、テレビ受信機３００は、セットトップボックス２００からＨＤＭＩケーブル４００を介して送られてくる左眼画像データおよび右眼画像データ、音声データ、さらには画像データの各ピクチャの視差情報（第１の視差情報、第２の視差情報）を受信する。

　テレビ受信機３００は、例えば、画像にグラフィクス（ＴＶグラフィクス）を重畳表示する際には、画像データおよび第１の視差情報と、グラフィクスデータとを用いて、グラフィクスが重畳された左眼画像および右眼画像のデータを得る。この場合、テレビ受信機３００は、左眼画像および右眼画像に重畳されるグラフィクスに、ピクチャ毎に、このグラフィクスの表示位置に対応した視差を付与し、グラフィクスが重畳された左眼画像のデータおよびグラフィクスが重畳された右眼画像のデータを得る。

　上述のようにグラフィクスに視差を付与することで、立体画像に重畳表示されるグラフィクス（ＴＶグラフィクス）を、その表示位置における立体画像のオブジェクトよりも手前に表示させることができる。これにより、ＯＳＤあるいはアプリケーションあるいは番組情報のＥＰＧなどのグラフィクスを画像に重畳表示する場合に、画像内の各オブジェクトに対する遠近感の整合性を維持できる。

　また、テレビ受信機３００は、第１の視差情報および第２の視差情報に基づいて、最も手前のオブジェクト再生位置に対する視差角（交差方向の視差角）および最も奥のオブジェクト再生位置に対する視差角（同側方向の視差角）が視聴上健康を害さない範囲ｄ（図４７参照）に収まっているか否かをチェックでき、収まっていない場合は、左眼画像データおよび右眼画像データを再構成できる。

　［テレビ受信機の構成例］
　図５４は、テレビ受信機３００のＨＤＭＩ入力系の構成例を示している。なお、視差角のチェック系に関しては省略している。テレビ受信機３００は、ＨＤＭＩ受信部３１１と、スケーラ３１２と、重畳部３１３と、奥行き制御部３１４と、グラフィクスバッファ３１５と、テレビ（ＴＶ）グラフィクス発生部３１６と、オーディオ処理部３１７を有している。

　ＨＤＭＩ受信部３１１は、ＨＤＭＩに準拠した通信により、ＨＤＭＩのソース機器、この実施の形態ではセットトップボックス２００から、立体画像を構成する左眼画像データおよび右眼画像データと、音声データを受信する。また、このＨＤＭＩ受信部３１１は、画像データの各ピクチャの視差情報（第１の視差情報、第２の視差情報）を、ＨＤＭＩインタフェースで、セットトップボックス２００から受信する。このＨＤＭＩ受信部３１１の詳細は後述する。

　スケーラ３１２は、ＨＤＭＩ受信部３１１で受信された左眼画像データおよび右眼画像データを、必要に応じてスケーリング処理を行う。例えば、スケーラ３１２は、左眼画像データおよび右眼画像データのサイズを表示サイズに合致させる。テレビ（ＴＶ）グラフィクス発生部３１６は、ＯＳＤあるいはアプリケーション、あるいはＥＰＧなどのグラフィクスデータを発生する。このグラフィクスデータには、グラフィクスビットマップデータ「Graphics data」と、このグラフィクスの表示位置情報「Graphics rendering position (x1,y1）」が含まれている。

　グラフィクスバッファ３１５は、テレビグラフィクス発生部３１６で発生されたグラフィクスビットマップデータ「Graphics data」を一時的に記憶する。重畳部３１３は、左眼画像データおよび右眼画像データに、それぞれ、グラフィクスバッファ３１５に記憶されているグラフィクスビットマップデータ「Graphics data」を重畳する。この際、左眼画像データおよび右眼画像データのそれぞれに重畳されるグラフィクスビットマップデータ「Graphics data」には、後述する奥行き制御部３１４により、視差が付与される。

　奥行き制御部３１４は、左眼画像データおよび右眼画像データのそれぞれに重畳されるグラフィクスビットマップデータ「Graphics data」に視差を付与する。そのため、奥行き制御部３１４は、画像データのピクチャ毎に、左眼表示用および右眼表示用のグラフィクスの表示位置情報「Rendering position」を生成し、グラフィクスバッファ３１５に記憶されているグラフィクスビットマップデータ「Graphics data」の左眼画像データおよび右眼画像データへの重畳位置のシフト制御を行う。

　奥行き制御部３１４は、図５５に示すように、以下の情報を用いて、表示位置情報「Rendering position」を生成する。すなわち、奥行き制御部３１４は、ＨＤＭＩ受信部３１１で受信された、画像データのピクチャ毎の各分割領域（Partition）の第１の視差情報（Min disparity）を用いる。また、奥行き制御部３１４は、テレビグラフィクス発生部３１６で発生されるグラフィクスの表示位置情報「Graphics rendering position (x1,y1）」を用いる。また、奥行き制御部３１４は、ＨＤＭＩ受信部３１１で視差情報が受信されているか否かを示す受信情報を用いる。

　図５６のフローチャートは、奥行き制御部３１４の制御処理の手順の一例を示している。奥行き制御部３１４は、この制御処理を、グラフィクス表示を行う各ピクチャ（フレーム）で実行する。奥行き制御部３１４は、ステップＳＴ２１において、制御処理を開始する。その後に、ステップＳＴ２２において、受信情報に基づいて、ＨＤＭＩ受信部３１１でグラフィクス向けの視差情報の受信があるか否かを判断する。なお、ＨＤＭＩ受信部３１１は、後述するHDMI Vendor Specific InfoFrame のパケットの「PRTY」の識別情報が、参照すべき情報としての視差情報の存在を示すとき、当該パケットから視差情報を抽出し、使用に備える。この場合、受信情報は、「受信あり」となる。

　視差情報（disparity）の受信があるとき、奥行き制御部３１４は、ステップＳＴ２３の処理に移る。このステップＳＴ２３において、グラフィクスを重畳表示（overlay）する座標が含まれる分割領域（partition）を全て検査する。そして、奥行き制御部３１４は、ステップＳＴ２４において、対象となる分割領域（partition）の第１の視差情報（Min disparity）を比較し、最適な値、例えば最小値を選択して、グラフィクス視差情報（disparity）の値（graphics_disparity）とする。

　次に、奥行き制御部３１４は、ステップＳＴ２５において、グラフィクスバッファ３１５に記憶されているグラフィクスビットマップデータ「Graphics data」に対して、グラフィクス用の視差情報（disparity）の値（graphics_disparity）と同等の値を用いて、表示位置がシフトされた左眼表示用および右眼表示用のグラフィクスビットマップデータを得て、それぞれ、左眼画像データおよび右眼画像データに重畳する。奥行き制御部３１４は、ステップＳＴ２５の処理の後、ステップＳＴ２６において、制御処理を終了する。

　また、ステップＳＴ２２で視差情報（disparity）の受信がないとき、奥行き制御部３１４は、ステップＳＴ２７において、グラフィクスバッファ３１５に記憶されているグラフィクスビットマップデータ「Graphics data」に対して、テレビ受信機３００で算出される視差情報（disparity）の値を用いて、表示位置がシフトされた左眼表示用および右眼表示用のグラフィクスビットマップデータを得て、それぞれ、左眼画像データおよび右眼画像データに重畳する。奥行き制御部３１４は、ステップＳＴ２７の処理の後、ステップＳＴ２６において、制御処理を終了する。

　図５７は、テレビ受信機３００におけるグラフィクスの奥行き制御例を示している。この例において、ＴＶグラフィクスに関しては、右側の４つの分割領域（Partition 10,11,14,15）の第１の視差情報のうち最小の値の視差情報に基づいて、左眼表示用のグラフィクスおよび右眼表示用のグラフィクスに視差が付与される。その結果、ＴＶグラフィクスは、これら４つの分割領域の画像（ビデオ）オブジェクトより手前に表示される。なお、この場合、サブタイトル（字幕）、さらには、ＳＴＢグラフィクスは、セットトップボックス２００において既に画像（ビデオ）に重畳されている。

　図５４に示すテレビ受信機３００の動作を簡単に説明する。ＨＤＭＩ受信部３１１により、ＨＤＭＩに準拠した通信により、左眼画像データおよび右眼画像データ、音声データ、さらには、画像データの各ピクチャの視差情報（第１の視差情報、第２の視差情報）が、セットトップボックス２００から受信される。

　ＨＤＭＩ受信部３１１で受信された左眼画像データおよび右眼画像データは、スケーラ３１２で必要に応じてスケーリング処理が施された後に、重畳部３１３に供給される。テレビＴＶ）グラフィクス発生部３１６では、ＯＳＤあるいはアプリケーション、あるいはＥＰＧなどのグラフィクスデータが発生される。このグラフィクスデータには、グラフィクスのビットマップデータ「Graphics data」と、このグラフィクスの表示位置情報「Graphicsrendering position (x1,y1）」が含まれている。グラフィクスバッファ３１５には、テレビグラフィクス発生部３１５で発生されたグラフィクスデータが一時的に記憶される。

　重畳部３１３では、左眼画像データおよび右眼画像データにグラフィクスバッファ３１５に記憶されているグラフィクスビットマップデータ「Graphics data」が重畳される。この際、左眼画像データおよび右眼画像データのそれぞれに重畳されるグラフィクスビットマップデータ「Graphics data」には、奥行き制御部３１４により、グラフィクスの表示位置に対応した第１の視差情報（Min disparity）に基づいて視差が付与される。

　奥行き制御部３１４では、その制御のために、ＨＤＭＩ受信部３１１で受信された、画像データのピクチャ毎の各分割領域（Partition）の第１の視差情報と、テレビグラフィクス発生部３１６で発生されるグラフィクスの表示位置情報「Graphics rendering position (x1,y1）」とが用いられる。

　重畳部３１３からは、左眼表示用のＴＶグラフィクスが重畳された左眼画像のデータが得られると共に、右眼表示用のＴＶグラフィクスが重畳された右眼画像のデータが得られる。これらの画像データは、立体画像表示のための処理部に送られ、立体画像表示が行われる

　また、ＨＤＭＩ受信部３１１で受信された各チャネルの音声データは、音質や音量の調整を行うオーディオ処理部３１７を介してスピーカに供給され、立体画像表示に合わせた音声出力がなされる。

　［ＨＤＭＩ送信部、ＨＤＭＩ受信部の構成例］
　図５８は、図１の画像送受信システム１０における、セットトップボックス２００のＨＤＭＩ送信部２５１と、テレビ受信機３００のＨＤＭＩ受信部３１１の構成例を示している。

　ＨＤＭＩ送信部２５１は、有効画像区間（以下、適宜、アクティブビデオ区間ともいう）において、非圧縮の１画面分の画像の画素データに対応する差動信号を、複数のチャネルで、ＨＤＭＩ受信部３１１に一方向に送信する。ここで、有効画像区間は、一の垂直同期信号から次の垂直同期信号までの区間から、水平帰線区間及び垂直帰線区間を除いた区間である。また、ＨＤＭＩ送信部２５１は、水平帰線区間または垂直帰線区間において、少なくとも画像に付随する音声データや制御データ、その他の補助データ等に対応する差動信号を、複数のチャネルで、ＨＤＭＩ受信部３１１に一方向に送信する。

　ＨＤＭＩ送信部２５１とＨＤＭＩ受信部３１１とからなるＨＤＭＩシステムの伝送チャネルには、以下の伝送チャネルがある。すなわち、ＨＤＭＩ送信部２５１からＨＤＭＩ受信部３１１に対して、画素データおよび音声データを、ピクセルクロックに同期して、一方向にシリアル伝送するための伝送チャネルとしての、３つのＴＭＤＳチャネル＃０乃至＃２がある。また、ピクセルクロックを伝送する伝送チャネルとしての、ＴＭＤＳクロックチャネルがある。

　ＨＤＭＩ送信部２５１は、ＨＤＭＩトランスミッタ８１を有する。トランスミッタ８１は、例えば、非圧縮の画像の画素データを対応する差動信号に変換し、複数のチャネルである３つのＴＭＤＳチャネル＃０，＃１，＃２で、ＨＤＭＩケーブル４００を介して接続されているＨＤＭＩ受信部３１１に、一方向にシリアル伝送する。

　また、トランスミッタ８１は、非圧縮の画像に付随する音声データ、さらには、必要な制御データその他の補助データ等を、対応する差動信号に変換し、３つのＴＭＤＳチャネル＃０，＃１，＃２でＨＤＭＩ受信部３１１に、一方向にシリアル伝送する。

　さらに、トランスミッタ８１は、３つのＴＭＤＳチャネル＃０，＃１，＃２で送信する画素データに同期したピクセルクロックを、ＴＭＤＳクロックチャネルで、ＨＤＭＩケーブル４００を介して接続されているＨＤＭＩ受信部３１１に送信する。ここで、１つのＴＭＤＳチャネル＃ｉ（ｉ＝０，１，２）では、ピクセルクロックの１クロックの間に、１０ビットの画素データが送信される。

　ＨＤＭＩ受信部３１１は、アクティブビデオ区間において、複数のチャネルで、ＨＤＭＩ送信部２５１から一方向に送信されてくる、画素データに対応する差動信号を受信する。また、このＨＤＭＩ受信部３１１は、水平帰線区間または垂直帰線区間において、複数のチャネルで、ＨＤＭＩ送信部２５１から一方向に送信されてくる、音声データや制御データに対応する差動信号を受信する。

　すなわち、ＨＤＭＩ受信部３１１は、ＨＤＭＩレシーバ８２を有する。このＨＤＭＩレシーバ８２は、ＴＭＤＳチャネル＃０，＃１，＃２で、ＨＤＭＩ送信部２５１から一方向に送信されてくる、画素データに対応する差動信号と、音声データや制御データに対応する差動信号を受信する。この場合、ＨＤＭＩ送信部２５１からＴＭＤＳクロックチャネルで送信されてくるピクセルクロックに同期して受信する。

　ＨＤＭＩシステムの伝送チャネルには、上述のＴＭＤＳチャネル＃０乃至＃２およびＴＭＤＳクロックチャネルの他に、ＤＤＣ（Display Data Channel）８３やＣＥＣライン８４と呼ばれる伝送チャネルがある。ＤＤＣ８３は、ＨＤＭＩケーブル４００に含まれる図示しない２本の信号線からなる。ＤＤＣ８３は、ＨＤＭＩ送信部２５１が、ＨＤＭＩ受信部３１１から、Ｅ－ＥＤＩＤ（Enhanced Extended Display Identification Data）を読み出すために使用される。

　すなわち、ＨＤＭＩ受信部３１１は、ＨＤＭＩレシーバ８１の他に、自身の性能（Configuration/capability）に関する性能情報であるＥ－ＥＤＩＤを記憶している、ＥＤＩＤ　ＲＯＭ(Read Only Memory)８５を有している。ＨＤＭＩ送信部２５１は、例えば、図示しない制御部（ＣＰＵ）からの要求に応じて、ＨＤＭＩケーブル４００を介して接続されているＨＤＭＩ受信部３１１から、Ｅ－ＥＤＩＤを、ＤＤＣ８３を介して読み出す。

　ＨＤＭＩ送信部２５１は、読み出したＥ－ＥＤＩＤを制御部（ＣＰＵ）に送る。制御部（ＣＰＵ）は、このＥ－ＥＤＩＤに基づき、ＨＤＭＩ受信部３１１の性能の設定を認識できる。例えば、制御部（ＣＰＵ）は、ＨＤＭＩ受信部３１１を有するテレビ受信機３００が立体画像データの取り扱いが可能か否か、可能である場合はさらにいかなるＴＭＤＳ伝送データ構造に対応可能であるか等を認識する。

　ＣＥＣライン８４は、ＨＤＭＩケーブル４００に含まれる図示しない１本の信号線からなり、ＨＤＭＩ送信部２５１とＨＤＭＩ受信部３１１との間で、制御用のデータの双方向通信を行うために用いられる。このＣＥＣライン８４は、制御データラインを構成している。

　また、ＨＤＭＩケーブル４００には、ＨＰＤ(Hot Plug Detect)と呼ばれるピンに接続されるライン（ＨＰＤライン）８６が含まれている。ソース機器は、当該ライン８６を利用して、シンク機器の接続を検出することができる。なお、このＨＰＤライン８６は双方向通信路を構成するＨＥＡＣ－ラインとしても使用される。また、ＨＤＭＩケーブル４００には、ソース機器からシンク機器に電源を供給するために用いられるライン（電源ライン）８７が含まれている。さらに、ＨＤＭＩケーブル４００には、ユーティリティライン８８が含まれている。このユーティリティライン８８は双方向通信路を構成するＨＥＡＣ＋ラインとしても使用される。

　図５９は、ＴＭＤＳ伝送データの構造例を示している。この図５９は、ＴＭＤＳチャネル＃０，＃１，＃２において、横×縦が１９２０ピクセル×１０８０ラインの画像データが伝送される場合の、各種の伝送データの区間を示している。

　ＨＤＭＩの３つのＴＭＤＳチャネル＃０，＃１，＃２で伝送データが伝送されるビデオフィールド（Video Field）には、伝送データの種類に応じて、３種類の区間が存在する。この３種類の区間は、ビデオデータ区間（Video Data period）、データアイランド区間（Data Island period）、およびコントロール区間（Control period）である。

　ここで、ビデオフィールド区間は、ある垂直同期信号の立ち上がりエッジ（active edge）から次の垂直同期信号の立ち上がりエッジまでの区間である。このビデオフィールド区間は、水平ブランキング期間（horizontal blanking）、垂直ブランキング期間（vertical blanking）、並びに、アクティブビデオ区間（Active Video）に分けられる。このアクティブビデオ区間は、ビデオフィールド区間から、水平ブランキング期間および垂直ブランキング期間を除いた区間である

　ビデオデータ区間は、アクティブビデオ区間に割り当てられる。このビデオデータ区間では、非圧縮の１画面分の画像データを構成する１９２０ピクセル（画素）×１０８０ライン分の有効画素（Active pixel）のデータが伝送される。

　データアイランド区間およびコントロール区間は、水平ブランキング期間および垂直ブランキング期間に割り当てられる。このデータアイランド区間およびコントロール区間では、補助データ（Auxiliary data）が伝送される。すなわち、データアイランド区間は、水平ブランキング期間と垂直ブランキング期間の一部分に割り当てられている。このデータアイランド区間では、補助データのうち、制御に関係しないデータである、例えば、音声データのパケット等が伝送される。

　コントロール区間は、水平ブランキング期間と垂直ブランキング期間の他の部分に割り当てられている。このコントロール区間では、補助データのうちの、制御に関係するデータである、例えば、垂直同期信号および水平同期信号、制御パケット等が伝送される。

　図６０は、ＨＤＭＩ端子のピン配列の一例を示している。この図６０に示すピン配列はタイプＡ（type-A）と呼ばれている。ＴＭＤＳチャネル＃ｉの差動信号であるＴＭＤＳ　Ｄａｔａ＃ｉ＋とＴＭＤＳ　Ｄａｔａ＃ｉ－は差動線である２本のラインにより伝送される。この２本のラインは、ＴＭＤＳ　Ｄａｔａ＃ｉ＋が割り当てられているピン（ピン番号が１，４，７のピン）と、ＴＭＤＳ　Ｄａｔａ＃ｉ－が割り当てられているピン（ピン番号が３，６，９のピン）に接続される。

　また、制御用のデータであるＣＥＣ信号が伝送されるＣＥＣライン８４は、ピン番号が１３であるピンに接続される。また、Ｅ－ＥＤＩＤ等のＳＤＡ(Serial Data)信号が伝送されるラインは、ピン番号が１６であるピンに接続される。ＳＤＡ信号の送受信時の同期に用いられるクロック信号であるＳＣＬ(Serial Clock)信号が伝送されるラインは、ピン番号が１５であるピンに接続される。上述のＤＤＣ８３は、ＳＤＡ信号が伝送されるラインおよびＳＣＬ信号が伝送されるラインにより構成される。

　また、上述したようにソース機器がシンク機器の接続を検出するためのＨＰＤライン（ＨＥＡＣ－ライン）８６は、ピン番号が１９であるピンに接続される。また、ユーティリティライン（ＨＥＡＣ＋ライン）８８は、ピン番号が１４であるピンに接続される。また、上述したように電源を供給するためのライン８７は、ピン番号が１８であるピンに接続される。

　［ＨＤＭＩでの視差情報の送受信方法］
　画像データのピクチャ毎の各分割領域（Partition）の視差情報（Disparity）を、ＨＤＭＩインタフェースで送受信する方法について説明する。この方法として、画像データのブランキング期間に配置される情報パケット、例えば、ＨＤＭＩ・ベンダー・スペシフィック・インフォフレーム（VS_Info：HDMI Vendor Specific InfoFrame）を利用する方法が考えられる。

　この方法では、VS_Info において、「HDMI_Video_Format＝“０１０”」、かつ「3D_Meta_present＝１」とされて、「Vendor Specific InfoFrame extension」が指定される。その場合、「3D_Metadata_type」は、未使用の、例えば、“００１”と定義され、各分割領域（Partition）の視差情報（Disparity）が指定される。

　図６１は、VS_Infoのパケット構造例を示している。このVS_Info については、CEA-861-Dに定義されているので、詳細説明は省略する。図６２は、図６１に示すパケット構造例における主要な情報の内容を示している。

　第４バイト（ＰＢ４）の第７ビットから第５ビットに、画像データの種類を示す３ビットの情報「HDMI_Video_Format」が配置されている。画像データが３Ｄ画像データである場合、この３ビットの情報は「０１０」とされる。また、画像データが３Ｄ画像データである場合、第５バイト（ＰＢ５）の第７ビットから第４ビットに、ＴＭＤＳ伝送データ構造を示す４ビットの情報「3D_Structure」が配置される。例えば、フレームパッキング方式の場合、この４ビットの情報は、「００００」とされる。

　また、第５バイト（ＰＢ５）の第３ビットに、「3D_Meta_present」が配置され、Vendor Specific InfoFrame extensionを指定する場合、この１ビットは「１」とされる。また、第７バイト（ＰＢ７）の第７ビットから第５ビットに、「3D_Metadata_type」が配置されている。各分割領域（Partition）の視差情報（Disparity）を指定する場合、この３ビットの情報は、未使用の、例えば、“００１”とされる。

　また、第７バイト（ＰＢ７）の第４バイトから第０バイトに、「3D_Metadata_length」が配置されている。この５ビットの情報は、各分割領域（Partition）の視差情報（Disparity）のサイズを示す。この「3D_Metadata_length」の値は、0x00～0x1Fの値をとり、その値に２を加えたものが、このフィールドの後の視差情報（Disparity）の全体サイズを表す。例えば、“０００００”は２（１０進数で）を表し、“１１１１１”は３３（10進数で）を表す。

　また、第６バイト（ＰＢ６）の第０ビットに、「PRTY」の１ビットの識別情報が配置される。この識別情報は、この VS_Info に、ＨＤＭＩシンク側が参照すべき情報、ここでは視差情報（Disparity）が含まれているか否かを示す。“１”は、ＨＤＭＩシンクが参照すべき情報が必ず含まれていることを示す。“０”は、ＨＤＭＩシンクが参照すべき情報が必ず含まれているわけではないことを示す。

　この「PRTY」の１ビットの識別情報が配置されていることで、ＨＤＭＩシンク、この実施の形態においてテレビ受信機３００は、「3D_Metadata_type」以下を検査しなくても、VS_Info の中に、参照すべき情報が含まれているか否かを判定できる。したがって、ＨＤＭＩシンクでは、この識別情報により、 VS_Info から参照すべき情報の抽出処理を無駄なく行うことができ、処理負荷を軽減することが可能となる。

　また、第８バイト（ＰＢ８）の第７ビットから第５ビットに、「partition_type」が配置されている。この３ビットの情報は、対象ピクチャの表示画面の分割タイプを示す。“０００”は分割なしを示し、“００１”は水平、垂直を各々２等分することを示し、“０１０”は水平、垂直を各々４等分することを示す。

　また、第８バイト（ＰＢ８）の第４ビットに、「d_picture」の１ビットの識別情報が配置される。この識別情報は、シングルピクチャかダブルピクチャかを示す。“０”は、シングルピクチャであること、つまり、各分割領域（Partition）の視差情報（Disparity）として、１ピクチャ分を送信するモードであることを示す。“１”は、ダブルピクチャであること、つまり、各分割領域（Partition）の視差情報（Disparity）として、２ピクチャ分を送信するモードであることを示す。

　また、第８バイト（ＰＢ８）の第３ビットから第０ビットに、「partition_count」が配置される。この４ビットの情報は、分割領域（Partition）の総数を示し、上述の「partition_type」に依存した値となる。例えば、“００００”は総数「１」を示し、“１１１１”は総数「１６」を示す。

　そして、第８＋１バイト（ＰＢ８＋１）以降に、１ピクチャ分あるいは２ピクチャ分の、視差情報（第１の視差情報、第２の視差情報）が順次配置される。「max_disparity_in_picture」の８ビット情報は、ピクチャ表示画面全体（ピクチャ全体）の第２の視差情報、つまりピクチャ全体の最大の視差情報（disparity値）を示す。「disparity_in_partition」の８ビット情報は、各分割領域（Partition）の第１の視差情報、つまり各分割領域における最小の視差情報（disparity値）を示す。

　図６３は、「d_picture＝０」であってシングルピクチャのモードであり、「partition_type＝０１０」であって分割領域が「１６」である場合における VS_Info の構造例を示している。この場合、第８＋１バイト（ＰＢ８＋１）以降に、１ピクチャ分の各分割領域の視差情報が配置されている。また、図６４は、「d_picture＝１」であってダブルピクチャのモードであり、「partition_type＝０１０」であって分割領域が「１６」である場合における VS_Info の構造例を示している。この場合、第８＋１バイト（ＰＢ８＋１）以降に、２ピクチャ分の各分割領域の視差情報が配置されている。

　上述したように、セットトップボックス２００は、ビデオストリームにピクチャ単位で視差情報が挿入されている場合、画像データの各ピクチャのタイミングで１ピクチャ分の視差情報を取得する（図４２参照）。また、上述したように、セットトップボックス２００は、ビデオストリームにＧＯＰ単位で視差情報が挿入されている場合、画像データのＧＯＰの先頭タイミングで、ＧＯＰ内の各ピクチャの視差情報（視差情報セット）をまとめて取得する（図４３参照）。

　セットトップボックス２００は、いずれの場合にあっても、例えば、テレビ受信機３００との間のＣＥＣライン８４を使用したネゴシエーション、あるいはＥＤＩＤＲＯＭ８５での設定などに基づいて、シングルピクチャまたはダブルピクチャのいずれかのモードを任意に選択可能なようにする。この場合、セットトップボックス２００は、ピクチャ毎の視差情報を送信するための伝送帯域、あるいは、セットトップボックス２００やテレビ受信機３００における処理能力などに応じて、モードを選択でき、テレビ受信機３００への視差情報の送信を良好に行うことが可能となる。

　テレビ受信機３００においては、 VS_Info に配置された「d_picture」のモード識別情報と、上述した「PRTY」の参照情報の有無の識別情報に基づいて、いずれのモードの送信にあっても、全てのピクチャの視差情報（Disparity）を、的確に受信できる。

　図６５は、セットトップボックス２００が、画像データの各ピクチャのタイミングで１ピクチャ分の視差情報を取得し、テレビ受信機３００に、シングルピクチャのモードにより、各ピクチャの視差情報を順次送信する場合を、概略的に示している。また、図６６は、セットトップボックス２００が、画像データの各ピクチャのタイミングで１ピクチャ分の視差情報を取得し、テレビ受信機３００に、ダブルピクチャのモードにより、各ピクチャの視差情報を順次送信する場合を、概略的に示している。

　また、図６７は、セットトップボックス２００が、画像データのＧＯＰの先頭タイミングで、ＧＯＰ内の各ピクチャの視差情報をまとめて取得し、テレビ受信機３００に、シングルピクチャのモードにより、各ピクチャの視差情報を順次送信する場合を、概略的に示している。さらに、図６８は、セットトップボックス２００が、画像データのＧＯＰの先頭タイミングで、ＧＯＰ内の各ピクチャの視差情報をまとめて取得し、テレビ受信機３００に、ダブルピクチャのモードにより、各ピクチャの視差情報を順次送信する場合を、概略的に示している。

　なお、上述ではセットトップボックス２００がシングルピクチャあるいはダブルピクチャのモードを任意に選択し得るように説明した。しかし、例えば、画像データのＧＯＰの先頭タイミングでＧＯＰ内の各ピクチャの視差情報をまとめて取得するときには、シングルピクチャのモードで送信する、ようにされてもよい。この場合、ＧＯＰ内の各ピクチャの視差情報は単一のピクチャ分ずつに振り分けられ、各単一ピクチャ分の視差情報がピクチャ単位で順次送信される（図６７参照）。この場合、ピクチャ毎の視差情報を送信するための伝送帯域が小さい場合であっても、各ピクチャの視差情報を、テレビ受信機３００に良好に送信できる。

　一方、セットトップボックス２００が２ビデオフレーム周期に１度の割合でしかVS_InfoFrameを送れない場合、あるいはテレビ受信機３００が２ビデオフレーム周期に１度の割合でしかVS_InfoFrameを受け取れない場合には、図６６のように２ビデオフレーム分の視差情報を続けて一つのVS_InfoFrameで送ることも考えられる。

　なお、上述では、ダブルピクチャモードにあるとき、２ピクチャ（２フレーム）単位で、連続する第１のピクチャおよび第２のピクチャの視差情報をそのまま、つまりイントラデータのまま送信する例を示した。しかし、このダブルピクチャモードにおいて、第１のピクチャまたは第２のピクチャの視差情報を、１つ前のピクチャの視差情報との間の差分データとし、伝送データ量を低減することも考えられる。

　図６９、図７０は、VS_Info（HDMI Vendor Specific InfoFrame）の他のパケット構造例を示している。詳細説明は省略するが、第０バイト（ＰＢ０）～第６バイト（ＰＢ６）に関しては、上述の図６１に示すパケット構造例と同様である。図７１は、図６９、図７０に示すパケット構造例における主要な情報の内容を示している。

　第７バイト（ＰＢ７）の第７ビットから第５ビットに、「3D_Metadata_type」が配置されている。各分割領域（Partition）の視差情報（Disparity）を指定する場合、この３ビットの情報は、未使用の、例えば、“００１”とされる。

　また、第７バイト（ＰＢ７）の第４バイトから第０バイトに、「3D_Metadata_length」が配置されている。この５ビットの情報は、各分割領域（Partition）の視差情報（Disparity）のサイズを示す。この「3D_Metadata_length」の値は、０ｘ００～０ｘ１６の値をとる。例えば、“０００１１”は３（１０進数で）を表し、“１１０１０”は２６（10進数で）を表す。

　第８バイト（ＰＢ８）の第７ビットに、「d_picture」の１ビットの識別情報が配置される。この識別情報は、シングルピクチャかダブルピクチャかを示す。“０”は、シングルピクチャであること、つまり、各分割領域（Partition）の視差情報（Disparity）として、１ピクチャ分を送信するモードであることを示す。“１”は、ダブルピクチャであること、つまり、各分割領域（Partition）の視差情報（Disparity）として、２ピクチャ分を送信するモードであることを示す。

　第８バイト（ＰＢ８）の第５ビットに、「partition_enable」の１ビットの識別情報が配置される。この識別情報は、対象ピクチャが各分割領域（Partition）の視差情報（Disparity）を持つかどうかを示す。“１”は、水平、垂直方向に分割領域が指定されていて、各々が視差情報（Disparity）を持つことを示す。“０”は、画面全体が一つの視差情報（Disparity）を持つことを示す。

　第８バイト（ＰＢ８）の第６ビットに、「Picture_reorder」の１ビットの識別情報が配置される。ダブルピクチャを伝送する場合、２つのピクチャ（Ｎ，Ｎ＋１）の伝送が、時間的にＮが先でＮ＋１が後か、あるいはＮ＋１が先でＮが後かを示す。“１”は、（Ｎ＋１）ピクチャが先で視差情報（Disparity）の値を８ｂｉｔで表し、Ｎピクチャが後で、（Ｎ－１）ピクチャの視差情報（Disparity）からの差分値を４ｂｉｔで表すことを示す。“０”は、Ｎピクチャが先で視差情報（Disparity）の値を８ｂｉｔで表し、（Ｎ＋１）ピクチャが後で、Ｎピクチャの視差情報（Disparity）からの差分値を４ｂｉｔで表すことを示す。

　また、第８バイト（ＰＢ８）の第３ビットから第０ビットに、「partition_count」が配置される。この４ビットの情報は、分割領域（Partition）の総数を示す。例えば、“００００”は総数「１」を示し、“１１１１”は総数「１６」を示す。

　そして、第８＋１バイト（ＰＢ８＋１）以降に、１ピクチャ分あるいは２ピクチャ分の、視差情報（第１の視差情報、第２の視差情報）が順次配置される。「max_disparity_in_picture」の８ビット情報は、ピクチャ表示画面全体（ピクチャ全体）の第２の視差情報、つまりピクチャ全体の最大の視差情報（disparity値）を示す。「Min_disparity_in_partition」の８ビット情報は、各分割領域（Partition）の第１の視差情報、つまり各分割領域における最小の視差情報（disparity値）を示す。

　図６９のVS_Info の構造例は、「d_picture＝１」であってダブルピクチャのモードであり、「picture_reorder＝０」であって時間的にＮピクチャが先でＮ＋１ピクチャが後である場合におけるVS_Info の構造例を示している。なお、この例は、「partition_count＝１１１１」であって、分割領域が「１６」である場合を示している。

　この場合、第８＋１バイト（ＰＢ８＋１）に、Ｎピクチャにおけるピクチャ表示画面全体の第２の視差情報、つまりピクチャ全体の最大の視差情報（disparity値）である「Max_disparity_in_picture」が配置される。そして、第８＋２バイト（ＰＢ８＋２）から第８＋１６バイト（ＰＢ８＋１６）に、Ｎピクチャにおける各分割領域（Partition）の第１の視差情報、つまり各分割領域における最小の視差情報（disparity値）である「Min_disparity_in_partition」が配置される。

　また、この場合、第８＋１７バイト（ＰＢ８＋１７）の第３ビットから第０ビットに、Ｎ＋１ピクチャにおけるピクチャ表示画面全体の第２の視差情報、つまりピクチャ全体の最大の視差情報（disparity値）の差分データである「Differential_max_disparity_in_picture」が配置される。第８＋１８バイト（ＰＢ８＋１８）から第８＋２５バイト（ＰＢ８＋２５）に、Ｎ＋１ピクチャにおける各分割領域（Partition）の第１の視差情報、つまり各分割領域における最小の視差情報（disparity値）の差分値である「Differential_min_disparity_in_partition」が配置される。

　図７０のVS_Info の構造例は、「d_picture＝１」であってダブルピクチャのモードであり、「picture_reorder＝１」であって時間的にＮ＋１ピクチャが先でＮピクチャが後である場合におけるVS_Info の構造例を示している。なお、この例は、「partition_count＝１１１１」であって、分割領域が「１６」である場合を示している。

　この場合、第８＋１バイト（ＰＢ８＋１）に、Ｎ＋１ピクチャにおけるピクチャ表示画面全体の第２の視差情報、つまりピクチャ全体の最大の視差情報（disparity値）である「Max_disparity_in_picture」が配置される。そして、第８＋２バイト（ＰＢ８＋２）から第８＋１６バイト（ＰＢ８＋１６）に、Ｎ＋１ピクチャにおける各分割領域（Partition）の第１の視差情報、つまり各分割領域における最小の視差情報（disparity値）である「Min_disparity_in_partition」が配置される。

　また、この場合、第８＋１７バイト（ＰＢ８＋１７）の第３ビットから第０ビットに、Ｎピクチャにおけるピクチャ表示画面全体の第２の視差情報、つまりピクチャ全体の最大の視差情報（disparity値）の差分データである「Differential_max_disparity_in_picture」が配置される。第８＋１８バイト（ＰＢ８＋１８）から第８＋２５バイト（ＰＢ８＋２５）に、Ｎピクチャにおける各分割領域（Partition）の第１の視差情報、つまり各分割領域における最小の視差情報（disparity値）の差分値である「Differential_min_disparity_in_partition」が配置される。

　［Ｎピクチャと、Ｎ＋１ピクチャの順番決定］
　ここで、ＮピクチャとＮ＋１ピクチャの順番決定、つまり「picture_reorder」を“０”とするか“１”とするかの決定は、例えば、以下のように行われる。ＮピクチャとＮ＋１ピクチャの順番決定は、例えば、図７２に示すような構成で行われる。視差情報は、フレームメモリ２８１に供給され、１フレームだけ遅延される。減算器２８２では、Ｎ＋１ピクチャの視差情報Ｄ（N+1）とＮピクチャの視差情報Ｄ（N）との差分データ「Ｄ（N）－Ｄ（N+1）」が算出され、この差分データが順番決定部２８３に送られる。

　順番決定部２８３では、差分データの絶対値｜Ｄ（N）－Ｄ（N+1）｜と閾値Ｔｈが比較されて、ＮピクチャとＮ＋１ピクチャの順番決定が行われる。｜Ｄ（N）－Ｄ（N+1）｜≦Ｔｈであるとき、順番決定部２８３は、「Ｎピクチャが先、Ｎ＋１ピクチャが後」に決定し、VS_Info の「picture_reorder」を“０”にセットし、このVS_Infoに、ＮピクチャおよびＮ＋１ピクチャの視差情報を、上述の図６９に示すように配置する。この場合、Ｎ＋１ピクチャの視差情報は、Ｎピクチャの視差情報との間の差分データとされる。

　図７３は、｜Ｄ（N）－Ｄ（N+1）｜≦Ｔｈとなる場合の視差情報（Disparity値）の時間推移例を示している。この例では、Ｎ－１ピクチャとＮピクチャとの間で視差情報が大きく変化している。しかし、ＮピクチャとＮ＋１ピクチャとの間で視差情報の変化は小さい。そのため、｜Ｄ（N）－Ｄ（N+1）｜≦Ｔｈを満たすこととなる。この場合、Ｎ＋１ピクチャの視差情報は、Ｎピクチャの視差情報との間の差分データとなるので、その値は比較的小さくなる。

　一方、｜Ｄ（N）－Ｄ（N+1）｜＞Ｔｈであるとき、順番決定部２８３は、「Ｎ＋１ピクチャが先、Ｎピクチャが後」に決定し、VS_Info の「picture_reorder」を“１”にセットし、このVS_Infoに、Ｎ＋１ピクチャおよびＮピクチャの視差情報を、上述の図７０に示すように配置する。この場合、Ｎピクチャの視差情報は、Ｎ－１ピクチャの視差情報との間の差分データとされる。

　図７４は、｜Ｄ（N）－Ｄ（N+1）｜＞Ｔｈとなる場合の視差情報（Disparity値）の時間推移例を示している。この例では、Ｎ－１ピクチャとＮピクチャとの間で視差情報の変化は小さいが、ＮピクチャとＮ＋１ピクチャとの間で視差情報の変化は大きい。そのため、｜Ｄ（N）－Ｄ（N+1）｜＞Ｔｈを満たすこととなる。この場合、Ｎピクチャの視差情報は、Ｎ－１ピクチャの視差情報との間の差分データとなるので、その値は比較的小さくなる。

　ここで、「Min_disparity_in_partition」に関しては、Ｄ（N+1），Ｄ（N）として、それぞれ、以下の数式（２），（３）に示すように、各分割領域（Partition）の「Min_disparity_in_partition」の最小値Min_disparity(N+1),Min_disparity(N)が用いられる。

　Ｄ（N+1）＝Min_disparity (N+1)
　　　　　＝Minimum (Min_disparity_partition (N+1_0, N+1_1, - - , N+1_15) )
　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　・・・（２）
　Ｄ（N）　＝Min_disparity (N)
　　　　　＝Minimum (Min_disparity_partition (N_0, N_1, - - , N_15) )
　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　・・・（３）
　なお、Ｄ（N）に関しては、上述の数式（３）で求める代わりに、上述の数式（２）でＤ(N+1)として採用された、Min_disparity (N+1)となった「Min_disparity_partition」と同じ分割領域（Partition）のＮピクチャの「Min_disparity_partition」とすることも可能である。

　一方、「Max_disparity_in_picture」に関しては、Ｄ（N+1）として、Ｎ＋１ピクチャの「Max_disparity_in_picture」が用いられ、Ｄ（N）として、Ｎピクチャの「Max_disparity_in_picture」が用いられる。なお、｜Ｄ（N）－Ｄ（N+1）｜とＴｈとの比較判定結果について、「Min_disparity_in_partition」に関する結果と、「Max_disparity_in_picture」に関する結果とが一致しない場合は、「Min_disparity_in_partition」に関する結果を優先させるなどすることが可能である。

　なお、上述の図７０のVS_Info の構造例では、時間的にＮ＋１ピクチャが先でＮピクチャが後に配置されている。このようにすることで、第８＋１バイト（ＰＢ８＋１）から第８＋２５バイト（ＰＢ＋２５）までの構造が、時間的にＮピクチャが先でＮ＋１ピクチャが後に配置されている図６９のVS_Info の構造例と同じくなるので、受信側での読み取りの安定化が図られる。しかし、図７０に示すVS_Info の構造例において、Ｎ＋１ピクチャの視差情報とＮピクチャの視差情報との配置位置を逆にすることも考えられる。

　なお、上述では、セットトップボックス２００がシングルピクチャあるいはダブルピクチャのモードを選択可能な例を示した。しかし、ダブルピクチャのモードの代わりに複数ピクチャのモードとし、ピクチャ数を任意に選択可能とすることも考えられる。また、選択し得るモード数が３つ以上の場合も考えられる。その場合は、与えられた帯域で送信可能なように、ＨＤＭＩソース（HDMI Source）側において、分割領域（partition）の数を適切な数に変更することも可能である。

　以上説明したように、図１に示す画像送受信システム１０において、放送局１００は、画像データの所定のピクチャ毎に取得された第１の視差情報および第２の視差情報を、ビデオストリームに挿入して送信する。ここで、第１の視差情報はピクチャ表示画面の所定領域における最も手前のオブジェクト再生位置に対応した視差情報であり、第２の視差情報はピクチャ表示画面の所定領域における最も奥のオブジェクト再生位置に対応した視差情報である。そのため、受信側のセットトップボックス２００では、例えば、これら第１の視差情報および第２の視差情報に基づいて、視差角が視聴上健康を害さない所定の範囲内にあるか否かをチェックし、必要に応じて左眼画像データおよび右眼画像データを再構成できる。

　また、図１に示す画像送受信システム１０において、放送局１００は、画像データの所定のピクチャ毎に取得された視差情報をビデオストリームに挿入して送信する際に、視差情報に圧縮符号化の処理を行うものであり、データ量の低減を図ることができる。

　＜２．変形例＞
　なお、上述実施の形態においては、画像送受信システム１０が、放送局１００、セットトップボックス２００およびテレビ受信機３００で構成されているものを示した。しかし、図７５に示すように、放送局１００およびテレビ受信機３００Ａで構成される画像送受信システム１０Ａも考えられる。

　図７６は、テレビ受信機３００Ａの構成例を示している。この図７６において、図４５と対応する部分には同一符号を付し、その詳細説明は省略する。テレビ（ＴＶ）グラフィクス発生部２１９Ａは、図４５のセットトップボックス２００のセットトップボックス（ＳＴＢ）グラフィクス発生部２１９と同様のものであり、ＯＳＤあるいはアプリケーション、あるいはＥＰＧなどのグラフィクスデータを発生する。

　重畳部２１７からは、左眼表示用のサブタイトル（字幕）およびグラフィクスが重畳された左眼画像のデータが得られると共に、右眼表示用のサブタイトル（字幕）およびグラフィクスが重畳された右眼画像のデータが得られる。これらの画像データは、立体画像表示のための処理部に送られ、立体画像表示が行われる。また、チャネルミキシング部２４４では、音声データに対して、例えば５．１chサラウンド等を実現するための各チャネルの音声データが生成される。この音声データは例えばスピーカに供給され、立体画像表示に合わせた音声出力がなされる。

　詳細説明は省略るすが、図７６に示すテレビ受信機３００Ａのその他は、図４５のセットトップボックス２００と同様に構成され、同様に動作する。

　また、上述実施の形態においては、セットトップボックス２００と、テレビ受信機３００とが、ＨＤＭＩのデジタルインタフェースで接続されるものを示している。しかし、これらが、ＨＤＭＩのデジタルインタフェースと同様のデジタルインタフェース（有線の他に無線も含む）で接続される場合においても、本技術を同様に適用できることは勿論である。

　また、上述実施の形態においては、セットトップボックス２００からテレビ受信機３００に視差情報を送信する方法として、ＨＤＭＩ Vendor Specific InfoFrame を利用する方法を説明した。その他に、アクティブスペース（Active Space）を利用する方法、さらには、ＨＰＤライン８６（ＨＥＡＣ－ライン）およびユーティリティライン８８（ＨＥＡＣ＋ライン）で構成される双方向通信路を通じて送信することも考えられる。

　また、上述実施の形態においては、セットトップボックス２００からテレビ受信機３００に、視差情報を、ＨＤＭＩインタフェースにより送信する例を示した。しかし、このようにＨＤＭＩインタフェースを通じて視差情報を送信する技術に関しては、その他のソース機器およびシンク機器の組み合わせにも応用できることは勿論である。例えば、ソース機器としてはＢＤやＤＶＤ等のディスクプレーヤ、さらにはゲーム機なども考えられ、シンク機器としてはモニタ装置、プロジェクタ装置なども考えられる。

　また、上述実施の形態においては、コンテナがトランスポートストリーム（ＭＰＥＧ－２　ＴＳ）である例を示した。しかし、本技術は、インターネット等のネットワークを利用して受信端末に配信される構成のシステムにも同様に適用できる。インターネットの配信では、ＭＰ４やそれ以外のフォーマットのコンテナで配信されることが多い。

　つまり、コンテナとしては、デジタル放送規格で採用されているトランスポートストリーム（ＭＰＥＧ－２　ＴＳ）、インターネット配信で使用されているＭＰ４などの種々のフォーマットのコンテナが該当する。また、一つのサービス内容を供給する方法が複数に分割されていて、各々が別の伝送形態で行われるような応用、即ち、片方のビュー（view）が電波による伝送で、もう片方のビュー（view）がインターネットによる伝送であるような場合にも該当する。

　また、本技術は、以下のような構成を取ることもできる。
　（１）立体画像を構成する左眼画像データおよび右眼画像データを取得する画像データ取得部と、
　上記取得された画像データの所定のピクチャ毎に、左眼画像および右眼画像の一方に対する他方の視差情報であって、ピクチャ表示画面の所定領域における最も手前のオブジェクト再生位置に対応した第１の視差情報と、ピクチャ表示画面の所定領域における最も奥のオブジェクト再生位置に対応した第２の視差情報を取得する視差情報取得部と、
　上記取得された画像データが符号化されて得られたビデオストリームに、上記取得された視差情報を挿入する視差情報挿入部と、
　上記視差情報が挿入されたビデオストリームを含む所定フォーマットのコンテナを送信する画像データ送信部とを備える
　送信装置。
　（２）上記視差情報挿入部は、
　上記第１の視差情報および上記第２の視差情報を、ピクチャ単位、あるいはＧＯＰ単位で挿入する
　前記（１）に記載の送信装置。
　（３）上記視差情報挿入部は、
　上記取得された視差情報を、圧縮符号化処理を行った後に、上記ビデオストリームに挿入する
　前記（１）または（２）に記載の送信装置。
　（４）上記視差情報挿入部は、上記ビデオストリームの所定のピクチャに上記視差情報を挿入する際に、該視差情報がピクチャ表示画面全体における視差情報であるか、所定数に分割された各分割領域における視差情報であるかを識別する識別情報をさらに挿入する
　前記（１）から（３）のいずれかに記載の送信装置。
　（５）上記視差情報取得部は、
　ピクチャ表示画面を分割情報で分割して得られた各分割領域における上記第１の視差情報を取得すると共に、ピクチャ表示画面全体における上記第２の視差情報を取得する
　前記（１）から（４）のいずれかに記載の送信装置。
　（６）上記視差情報取得部は、
　ピクチャ表示画面を分割情報で分割して得られた各分割領域における上記第１の視差情報および上記第２の視差情報を取得する
　前記（１）から（４）のいずれかに記載の送信装置。
　（７）上記視差情報取得部は、
　ピクチャ表示画面を第１の分割情報で分割して得られた各分割領域における上記第１の視差情報を取得すると共に、ピクチャ表示画面を第２の分割情報で分割して得られた各分割領域における上記第２の視差情報を取得する
　前記（１）から（４）のいずれかに記載の送信装置。
　（８）立体画像を構成する左眼画像データおよび右眼画像データを取得するステップと、
　上記取得された画像データの所定のピクチャ毎に、左眼画像および右眼画像の一方に対する他方の視差情報であって、ピクチャ表示画面の所定領域における最も手前のオブジェクト再生位置に対応した第１の視差情報と、ピクチャ表示画面の所定領域における最も奥のオブジェクト再生位置に対応した第２の視差情報を取得するステップと、
　上記取得された画像データが符号化されて得られたビデオストリームに、上記取得された視差情報を挿入するステップと、
　上記視差情報が挿入されたビデオストリームを含む所定フォーマットのコンテナを送信するステップとを備える
　送信方法。
　（９）ビデオストリームを含む所定フォーマットのコンテナを受信する画像データ受信部を備え、
　上記ビデオストリームは、立体画像を構成する左眼画像データおよび右眼画像データが符号化されて得られたものであり、
　上記ビデオストリームには、上記画像データの所定のピクチャ毎に、左眼画像および右眼画像の一方に対する他方の視差情報であって、ピクチャ表示画面の所定領域における最も手前のオブジェクト再生位置に対応した第１の視差情報と、ピクチャ表示画面の所定領域における最も奥のオブジェクト再生位置に対応した第２の視差情報が挿入されており、
　上記コンテナに含まれるビデオストリームから上記左眼画像データおよび右眼画像データを取得すると共に、上記第１の視差情報および第２の視差情報を取得する情報取得部と、
　上記取得された第１の視差情報および第２の視差情報に基づいて、視差角が所定範囲内に入るように、上記左眼画像データおよび右眼画像データの再構成を指示する制御部とをさらに備える
　受信装置。
　（１０）立体画像を構成する左眼画像データおよび右眼画像データを取得する画像データ取得部と、
　上記取得された画像データの所定のピクチャ毎に、左眼画像および右眼画像の一方に対する他方の視差情報を取得する視差情報取得部と、
　上記取得された視差情報に対して圧縮符号化処理を行う圧縮符号化部と、
　上記取得された画像データが符号化されて得られたビデオストリームに、上記圧縮符号化された視差情報を挿入する視差情報挿入部と、
　上記視差情報が挿入されたビデオストリームを含む所定フォーマットのコンテナを送信する画像データ送信部とを備える
　送信装置。
　（１１）上記圧縮符号化部は、上記圧縮符号化処理として、上記取得された各ピクチャの視差情報に対して可変長符号を用いた処理を行う
　前記（１０）に記載の送信装置。
　（１２）上記圧縮符号化部は、上記圧縮符号化処理として、上記取得された各ピクチャのうち、参照ピクチャでは、被参照ピクチャとの間の差分データを取得し、該差分データに可変長符号化の処理を行う
　前記（１１）に記載の送信装置。
　（１３）上記圧縮符号化部は、表示順で先行するピクチャを被参照ピクチャとして差分データを取得する
　前記（１２）に記載の送信装置。
　（１４）上記圧縮符号化部は、デコード順で先行するピクチャを被参照ピクチャとして差分データを取得する
　前記（１２）に記載の送信装置。
　（１５）上記視差情報挿入部は、上記ビデオストリームの所定のピクチャに上記視差情報を挿入する際に、該挿入される視差情報がイントラデータであるか差分データであるかを識別する識別情報をさらに挿入する
　前記（１２）から（１４）のいずれかに記載の送信装置。
　（１６）上記視差情報挿入部は、
　上記ビデオストリームのＩピクチャ、Ｐピクチャおよび被参照Ｂピクチャに対応して上記視差情報を挿入し、
　上記挿入される視差情報が差分データであるとき、被参照ピクチャまでのピクチャ数の情報をさらに挿入する
　前記（１４）に記載の送信装置。
　（１７）立体画像を構成する左眼画像データおよび右眼画像データを取得するステップと、
　上記取得された画像データの所定のピクチャ毎に、左眼画像および右眼画像の一方に対する他方の視差情報を取得するステップと、
　上記取得された視差情報に対して圧縮符号化処理を行うステップと、
　上記取得された画像データが符号化されて得られたビデオストリームに、上記圧縮符号化された視差情報を挿入するステップと、
　上記視差情報が挿入されたビデオストリームを含む所定フォーマットのコンテナを送信するステップとを備える
　送信方法。
　（１８）ビデオストリームを含む所定フォーマットのコンテナを受信する画像データ受信部を備え、
　上記ビデオストリームは、立体画像を構成する左眼画像データおよび右眼画像データが符号化されて得られたものであり、
　上記ビデオストリームには、上記画像データの所定のピクチャ毎に、左眼画像および右眼画像の一方に対する他方の視差情報が挿入されており、
　上記コンテナに含まれるビデオストリームから上記左眼画像データおよび右眼画像データを取得すると共に、上記視差情報を取得する情報取得部と、
　上記情報取得部で取得される視差情報が存在しないピクチャの視差情報を、上記取得された前後のピクチャの視差情報から補間により生成する視差情報補間部とをさらに備える
　受信装置。
　（１９）ビデオストリームを含む所定フォーマットのコンテナを受信する画像データ受信部を備え、
　上記ビデオストリームは、立体画像を構成する左眼画像データおよび右眼画像データが符号化されて得られたものであり、
　上記ビデオストリームには、上記画像データの所定のピクチャ毎に、左眼画像および右眼画像の一方に対する他方の視差情報であって、ピクチャ表示画面の所定領域における最も手前のオブジェクト再生位置に対応した第１の視差情報と、ピクチャ表示画面の所定領域における最も奥のオブジェクト再生位置に対応した第２の視差情報が挿入されており、
　上記コンテナに含まれるビデオストリームから上記左眼画像データおよび右眼画像データを取得すると共に、上記第１の視差情報および第２の視差情報を取得する情報取得部と、
　上記取得された上記左眼画像データおよび上記右眼画像データと、上記取得された上記第１の視差情報および第２の視差情報とを、対応付けて、外部機器に送信する送信部とをさらに備える
　受信装置。
　（２０）上記取得された第１の視差情報および第２の視差情報に基づいて、視差角が所定範囲内に入るように画像データおよび視差情報の再構成を行う情報再構成部をさらに備え、
　上記送信部は、上記再構成された左眼画像データおよび右眼画像データと、上記再構成された第１の視差情報および第２の視差情報とを、対応付けて、外部機器に送信する
　前記（１９）に記載の受信装置。
　（２１）上記送信部は、２ピクチャ単位で、連続する第１のピクチャおよび第２のピクチャの視差情報を送信し、
　少なくとも、上記第１のピクチャまたは上記第２のピクチャの視差情報は、１つ前のピクチャの視差情報との間の差分データとされる
　前記（１）または（２０）に記載の受信装置。
　（２２）上記第１のピクチャの視差情報と上記第２のピクチャの視差情報との差分データに基づいて、上記第１のピクチャの視差情報を差分データとするか上記第２のピクチャの視差情報を差分データとするかを決定する決定部をさらに備える
　前記（２１）に記載の受信装置。
　（２３）上記送信部が送信する上記視差情報には、上記第１のピクチャの視差情報が差分データであるか上記第２のピクチャの視差情報が差分データであるかを示す識別情報が付加されている
　前記（２２）に記載の受信装置。

　本技術の主な特徴は、ピクチャ毎に取得された視差情報の最大値（第２の視差情報）と最小値（第１の視差情報）をビデオストリームに挿入して送信するようにしたことで、受信側で視差角が視聴上健康を害さない所定の範囲内にあるか否かをチェック可能にしたことである（図８、図１５参照）。また、ピクチャ毎に取得された視差情報をビデオストリームに挿入して送信する際に、視差情報に圧縮符号化の処理を行うようにしたことで、データ量の低減を図ったことである（図２４参照）。また、２ピクチャ単位で連続する２つのピクチャの視差情報をＨＤＭＩにより外部機器に送信する際に、一方のピクチャの視差情報を１つ前のピクチャとの間の差分データとしたことで、伝送データ量の低減を図ったことである（図６９参照）。

　１０，１０Ａ・・・画像送受信システム
　１００・・・放送局
　１１０，１１０Ａ・・・送信データ生成部
　１１１Ｌ，１１１Ｒ・・・画像データ出力部
　１１２Ｌ，１１２・・・スケーラ
　１１３・・・ビデオエンコーダ
　１１４・・・マルチプレクサ
　１１５・・・視差データ生成部
　１１６・・・サブタイトルデータ出力部
　１１７・・・サブタイトルエンコーダ
　１１８・・・音声データ出力部
　１１９・・・オーディオエンコーダ
　１２０・・・圧縮符号化部
　１２１・・・バッファ
　１２２・・・減算器
　１２３・・・可変長符号化部
　２００・・・セットトップボックス
　２１１・・・コンテナバッファ
　２１２・・・デマルチプレクサ
　２１３・・・コーデッドバッファ
　２１４・・・ビデオデコーダ
　２１５・・・デコーデッドバッファ
　２１６・・・スケーラ
　２１７・・・重畳部
　２１８・・・視差情報バッファ
　２１９・・・セットトップボックス（ＳＴＢ）グラフィクスバッファ
　２１９Ａ・・・テレビ（ＴＶ）グラフィクスバッファ
　２２０・・・奥行き制御部
　２２１・・・グラフィクスバッファ
　２３１・・・コーデッドバッファ
　２３２・・・サブタイトルデコーダ
　２３３・・・ピクセルバッファ
　２３４・・・サブタイトル視差情報バッファ
　２３５・・・サブタイトル表示制御部
　２４１・・・コーデッドバッファ
　２４２・・・オーディオデコーダ
　２４３・・・オーディオバッファ
　２４４・・・チャネルミキシング部
　２５１・・・ＨＤＭＩ送信部
　２６１・・・圧縮復号化部
　２６２・・・視差情報制御部
　２６３・・・Ｌ／Ｒ再構成部
　２６４・・・可変長復号化部
　２６５・・・バッファ
　２６６・・・加算器
　２７１・・・最大値取得部
　２７２・・・最小値取得部
　２７３・・・視差角チェック部
　２７４・・・視差情報補正部
　２８１・・・フレームメモリ
　２８２・・・減算器
　２８３・・・順番決定部
　３００，３００Ａ・・・テレビ受信機
　３１１・・・ＨＤＭＩ受信部
　３１２・・・スケーラ
　３１３・・・重畳部
　３１４・・・奥行き制御部
　３１５・・・グラフィクスバッファ
　３１６・・・テレビ（ＴＶ）グラフィクス発生部
　３１７・・・オーディオ処理部
　４００・・・ＨＤＭＩケーブル

Claims

　立体画像を構成する左眼画像データおよび右眼画像データを取得する画像データ取得部と、
　上記取得された画像データの所定のピクチャ毎に、左眼画像および右眼画像の一方に対する他方の視差情報であって、ピクチャ表示画面の所定領域における最も手前のオブジェクト再生位置に対応した第１の視差情報と、ピクチャ表示画面の所定領域における最も奥のオブジェクト再生位置に対応した第２の視差情報を取得する視差情報取得部と、
　上記取得された画像データが符号化されて得られたビデオストリームに、上記取得された視差情報を挿入する視差情報挿入部と、
　上記視差情報が挿入されたビデオストリームを含む所定フォーマットのコンテナを送信する画像データ送信部とを備える
　送信装置。
　上記視差情報挿入部は、
　上記第１の視差情報および上記第２の視差情報を、ピクチャ単位、あるいはＧＯＰ単位で挿入する
　請求項１に記載の送信装置。
　上記視差情報挿入部は、
　上記取得された視差情報を、圧縮符号化処理を行った後に、上記ビデオストリームに挿入する
　請求項１に記載の送信装置。
　上記視差情報挿入部は、上記ビデオストリームの所定のピクチャに上記視差情報を挿入する際に、該視差情報がピクチャ表示画面全体における視差情報であるか、所定数に分割された各分割領域における視差情報であるかを識別する識別情報をさらに挿入する
　請求項１に記載の送信装置。
　上記視差情報取得部は、
　ピクチャ表示画面を分割情報で分割して得られた各分割領域における上記第１の視差情報を取得すると共に、ピクチャ表示画面全体における上記第２の視差情報を取得する
　請求項１に記載の送信装置。
　上記視差情報取得部は、
　ピクチャ表示画面を分割情報で分割して得られた各分割領域における上記第１の視差情報および上記第２の視差情報を取得する
　請求項１に記載の送信装置。
　上記視差情報取得部は、
　ピクチャ表示画面を第１の分割情報で分割して得られた各分割領域における上記第１の視差情報を取得すると共に、ピクチャ表示画面を第２の分割情報で分割して得られた各分割領域における上記第２の視差情報を取得する
　請求項１に記載の送信装置。
　立体画像を構成する左眼画像データおよび右眼画像データを取得するステップと、
　上記取得された画像データの所定のピクチャ毎に、左眼画像および右眼画像の一方に対する他方の視差情報であって、ピクチャ表示画面の所定領域における最も手前のオブジェクト再生位置に対応した第１の視差情報と、ピクチャ表示画面の所定領域における最も奥のオブジェクト再生位置に対応した第２の視差情報を取得するステップと、
　上記取得された画像データが符号化されて得られたビデオストリームに、上記取得された視差情報を挿入するステップと、
　上記視差情報が挿入されたビデオストリームを含む所定フォーマットのコンテナを送信するステップとを備える
　送信方法。
　ビデオストリームを含む所定フォーマットのコンテナを受信する画像データ受信部を備え、
　上記ビデオストリームは、立体画像を構成する左眼画像データおよび右眼画像データが符号化されて得られたものであり、
　上記ビデオストリームには、上記画像データの所定のピクチャ毎に、左眼画像および右眼画像の一方に対する他方の視差情報であって、ピクチャ表示画面の所定領域における最も手前のオブジェクト再生位置に対応した第１の視差情報と、ピクチャ表示画面の所定領域における最も奥のオブジェクト再生位置に対応した第２の視差情報が挿入されており、
　上記コンテナに含まれるビデオストリームから上記左眼画像データおよび右眼画像データを取得すると共に、上記第１の視差情報および第２の視差情報を取得する情報取得部と、
　上記取得された第１の視差情報および第２の視差情報に基づいて、視差角が所定範囲内に入るように、上記左眼画像データおよび右眼画像データの再構成を指示する制御部とをさらに備える
　受信装置。
　立体画像を構成する左眼画像データおよび右眼画像データを取得する画像データ取得部と、
　上記取得された画像データの所定のピクチャ毎に、左眼画像および右眼画像の一方に対する他方の視差情報を取得する視差情報取得部と、
　上記取得された視差情報に対して圧縮符号化処理を行う圧縮符号化部と、
　上記取得された画像データが符号化されて得られたビデオストリームに、上記圧縮符号化された視差情報を挿入する視差情報挿入部と、
　上記視差情報が挿入されたビデオストリームを含む所定フォーマットのコンテナを送信する画像データ送信部とを備える
　送信装置。
　上記圧縮符号化部は、上記圧縮符号化処理として、上記取得された各ピクチャの視差情報に対して可変長符号を用いた処理を行う
　請求項１０に記載の送信装置。
　上記圧縮符号化部は、上記圧縮符号化処理として、上記取得された各ピクチャのうち、参照ピクチャでは、被参照ピクチャとの間の差分データを取得し、該差分データに可変長符号化の処理を行う
　請求項１１に記載の送信装置。
　上記圧縮符号化部は、表示順で先行するピクチャを被参照ピクチャとして差分データを取得する
　請求項１２に記載の送信装置。
　上記圧縮符号化部は、デコード順で先行するピクチャを被参照ピクチャとして差分データを取得する
　請求項１２に記載の送信装置。
　上記視差情報挿入部は、上記ビデオストリームの所定のピクチャに上記視差情報を挿入する際に、該挿入される視差情報がイントラデータであるか差分データであるかを識別する識別情報をさらに挿入する
　請求項１２に記載の送信装置。
　上記視差情報挿入部は、
　上記ビデオストリームのＩピクチャ、Ｐピクチャおよび被参照Ｂピクチャに対応して上記視差情報を挿入し、
　上記挿入される視差情報が差分データであるとき、被参照ピクチャまでのピクチャ数の情報をさらに挿入する
　請求項１４に記載の送信装置。
　立体画像を構成する左眼画像データおよび右眼画像データを取得するステップと、
　上記取得された画像データの所定のピクチャ毎に、左眼画像および右眼画像の一方に対する他方の視差情報を取得するステップと、
　上記取得された視差情報に対して圧縮符号化処理を行うステップと、
　上記取得された画像データが符号化されて得られたビデオストリームに、上記圧縮符号化された視差情報を挿入するステップと、
　上記視差情報が挿入されたビデオストリームを含む所定フォーマットのコンテナを送信するステップとを備える
　送信方法。
　ビデオストリームを含む所定フォーマットのコンテナを受信する画像データ受信部を備え、
　上記ビデオストリームは、立体画像を構成する左眼画像データおよび右眼画像データが符号化されて得られたものであり、
　上記ビデオストリームには、上記画像データの所定のピクチャ毎に、左眼画像および右眼画像の一方に対する他方の視差情報が挿入されており、
　上記コンテナに含まれるビデオストリームから上記左眼画像データおよび右眼画像データを取得すると共に、上記視差情報を取得する情報取得部と、
　上記情報取得部で取得される視差情報が存在しないピクチャの視差情報を、上記取得された前後のピクチャの視差情報から補間により生成する視差情報補間部とをさらに備える
　受信装置。
　ビデオストリームを含む所定フォーマットのコンテナを受信する画像データ受信部を備え、
　上記ビデオストリームは、立体画像を構成する左眼画像データおよび右眼画像データが符号化されて得られたものであり、
　上記ビデオストリームには、上記画像データの所定のピクチャ毎に、左眼画像および右眼画像の一方に対する他方の視差情報であって、ピクチャ表示画面の所定領域における最も手前のオブジェクト再生位置に対応した第１の視差情報と、ピクチャ表示画面の所定領域における最も奥のオブジェクト再生位置に対応した第２の視差情報が挿入されており、
　上記コンテナに含まれるビデオストリームから上記左眼画像データおよび右眼画像データを取得すると共に、上記第１の視差情報および第２の視差情報を取得する情報取得部と、
　上記取得された上記左眼画像データおよび上記右眼画像データと、上記取得された上記第１の視差情報および第２の視差情報とを、対応付けて、外部機器に送信する送信部とをさらに備える
　受信装置。
　上記取得された第１の視差情報および第２の視差情報に基づいて、視差角が所定範囲内に入るように画像データおよび視差情報の再構成を行う情報再構成部をさらに備え、
　上記送信部は、上記再構成された左眼画像データおよび右眼画像データと、上記再構成された第１の視差情報および第２の視差情報とを、対応付けて、外部機器に送信する
　請求項１９に記載の受信装置。
　上記送信部は、２ピクチャ単位で、連続する第１のピクチャおよび第２のピクチャの視差情報を送信し、
　少なくとも、上記第１のピクチャまたは上記第２のピクチャの視差情報は、１つ前のピクチャの視差情報との間の差分データとされる
　請求項１９に記載の受信装置。
　上記第１のピクチャの視差情報と上記第２のピクチャの視差情報との差分データに基づいて、上記第１のピクチャの視差情報を差分データとするか上記第２のピクチャの視差情報を差分データとするかを決定する決定部をさらに備える
　請求項２１に記載の受信装置。
　上記送信部が送信する上記視差情報には、上記第１のピクチャの視差情報が差分データであるか上記第２のピクチャの視差情報が差分データであるかを示す識別情報が付加されている
　請求項２２に記載の受信装置。