WO2018012355A1

WO2018012355A1 - サーバ装置、サーバ装置の送信処理方法、クライアント装置、クライアント装置の受信処理方法およびサーバシステム

Info

Publication number: WO2018012355A1
Application number: PCT/JP2017/024563
Authority: WO
Inventors: 塚越　郁夫
Original assignee: ソニー株式会社
Priority date: 2016-07-13
Filing date: 2017-07-04
Publication date: 2018-01-18
Also published as: US20190238898A1; CN109417643A; JPWO2018012355A1; EP3487180A4; US10965971B2; EP3487180A1

Abstract

クライアント装置がサーバ装置の撮像状態を適切に制御可能とする。　撮像部は、被写体を撮像して画像データを得る。送信部は、撮像されて得られた画像データにより構成されるビデオストリームを含む所定フォーマットのコンテナを、クライアント装置に送信する。ビデオストリームのレイヤおよび/またはコンテナのレイヤに、撮像部における撮像状態を示すキャプチャ情報を挿入して、送信する。キャプチャ情報は、撮像部の撮像方向の情報、撮像部のフォーカス距離の情報、撮像部のズーム比の情報等である。

Description

サーバ装置、サーバ装置の送信処理方法、クライアント装置、クライアント装置の受信処理方法およびサーバシステム

　本技術は、サーバ装置、サーバ装置の送信処理方法、クライアント装置、クライアント装置の受信処理方法およびサーバシステムに関し、特に、監視システム、画像配信システムなどに適用して好適なサーバ装置等に関する。

　例えば、特許文献１には、配信サーバ（コンテンツ提供サーバ）からインターネット等のネットワークを介して画像コンテンツをクライアント端末（ユーザ端末）に配信するシステムが記載されている。また、例えば、特許文献２には、監視カメラ（ネットワークカメラ）がネットワークを介して監視装置（コンピュータ）に接続され、監視画像データを監視カメラからネットワークを通じて監視装置に送信する監視カメラシステムが記載されている。

特開２００４－１１０２７７号公報特開２００５－１７５７５８号公報

　本技術の目的は、クライアント装置がサーバ装置の撮像状態を適切に制御可能とすることにある。

　本技術の概念は、
　被写体を撮像して画像データを得る撮像部と、
　上記画像データで構成されるビデオストリームを含む所定フォーマットのコンテナをクライアント装置に送信する送信部を備え、
　上記ビデオストリームのレイヤおよび/または上記コンテナのレイヤに、上記撮像部における撮像状態を示すキャプチャ情報が挿入されている
　サーバ装置にある。

　本技術において、撮像部により、被写体が撮像されて画像データが得られる。送信部により、撮像されて得られた画像データにより構成されるビデオストリームを含む所定フォーマットのコンテナがクライアント装置に送信される。例えば、コンテナは、インターネットの配信などで用いられるＭＰ４、あるいはそれ以外のフォーマットのコンテナであってもよい。

　ビデオストリームのレイヤおよび/またはコンテナのレイヤに、撮像部における撮像状態を示すキャプチャ情報が挿入されている。例えば、キャプチャ情報には、撮像部の撮像方向の情報が含まれる、ようにされてもよい。また、キャプチャ情報には、撮像部のフォーカス距離の情報が含まれる、ようにされてもよい。また、キャプチャ情報には、撮像部のズーム比の情報が含まれる、ようにされてもよい。

　このように本技術においては、ビデオストリームのレイヤおよび/またはコンテナのレイヤに、撮像部における撮像状態を示すキャプチャ情報を挿入するものである。そのため、クライアント装置では、このキャプチャ情報に基づいてサーバ装置の撮像部における撮像状態（撮像方向、フォーカス距離、ズーム比など）を容易に把握でき、サーバ装置の撮像状態を適切に制御することが可能となる。

　なお、本技術において、例えば、ビデオストリームのレイヤおよび/またはコンテナのレイヤに、自身のサーバ装置の位置を示す位置情報がさらに挿入されている、ようにされてもよい。例えば、位置情報は、ＧＰＳデータである、ようにされてもよい。この場合、クライアント装置では、この位置情報に基づいて、サーバ装置の位置、従って撮像位置の緯度、経度、高度、さらには撮像時刻などを容易に把握可能となる。

　また、本技術において、例えば、ビデオストリームのレイヤおよび/またはコンテナのレイヤに、キャプチャ情報および位置情報の組み合わせを識別する識別情報および自身のサーバ装置を識別する識別情報がさらに挿入されている、ようにされてもよい。この場合、クライアント装置では、サーバ装置から送られてくるビデオストリームを、これらの識別情報によって識別することが可能となる。

　また、本技術において、例えば、クライアント装置から撮像部における撮像状態を制御するための制御情報を受信する受信部と、この制御情報に基づいて撮像部の撮像状態を制御する制御部をさらに備える、ようにされてもよい。この場合、クライアント装置から撮像部における撮像状態（撮像方向、フォーカス距離、ズーム比など）をクライアント装置のユーザが意図する状態とすることが可能となる。

　また、本技術の他の概念は、
　サーバ装置からビデオストリームを含む所定フォーマットのコンテナを受信する受信部を備え、
　上記ビデオストリームは、被写体を撮像部で撮像して得られた画像データで構成されており、
　上記ビデオストリームのレイヤおよび/または上記コンテナのレイヤに、上記撮像部の撮像状態を示すキャプチャ情報が挿入されており、
　上記ビデオストリームから表示用画像データを得る処理と、上記キャプチャ情報に基づいて上記撮像部の撮像状態を表示する処理と、上記撮像状態の表示を用いたユーザ操作に応じて上記撮像部の撮像状態の制御情報を得る処理と、該制御情報を上記サーバ装置に送信する処理を制御する制御部をさらに備える
　クライアント装置にある。

　本技術において、受信部により、サーバ装置からビデオストリームを含む所定フォーマットのコンテナが受信される。例えば、コンテナは、インターネットの配信などで用いられるＭＰ４、あるいはそれ以外のフォーマットのコンテナであってもよい。ビデオストリームは、被写体を撮像部で撮像して得られた画像データで構成されており、ビデオストリームのレイヤおよび/またはコンテナのレイヤに、撮像部の撮像状態を示すキャプチャ情報が挿入されている。

　制御部より、ビデオストリームから表示用画像データを得る処理と、キャプチャ情報に基づいて撮像部の撮像状態を表示する処理と、この撮像状態の表示を用いたユーザ操作に応じて撮像部の撮像状態の制御情報を得る処理と、この制御情報をサーバ装置に送信する処理が制御される。

　このように本技術においては、ビデオストリームのレイヤおよび/またはコンテナのレイヤに挿入されているキャプチャ情報に基づく撮像部の撮像状態の表示を用いたユーザ操作に係る制御情報をサーバ装置に送信するものである。そのため、サーバ装置の撮像状態を適切に制御し、サーバ装置から所望の撮像状態で撮像して得られた画像データの提供を受けることが可能となる。

　なお、本技術において、例えば、ビデオストリームのレイヤおよび/またはコンテナのレイヤに、サーバ装置の位置を示す位置情報がさらに挿入されており、制御部は、ユーザ操作に基づいて、上記サーバ装置とは異なる他のサーバ装置にアクセスするためのアクセス情報を得る処理と、このアクセス情報に基づいて他のサーバ装置にアクセスする処理をさらに制御する、ようにされてもよい。

　例えば、アクセス情報は、他のサーバ装置のＵＲＬである、ようにされてもよい。この場合、他のサーバ装置へのアクセスは、当該ＵＲＬを用いて直接行われる。また、例えば、アクセス情報は、位置情報およびこの位置情報をＵＲＬに変換する変換サーバのＵＲＬである、ようにされてもよい。この場合、他のサーバ装置へのアクセスは、変換サーバへのアクセスを介して、間接的に行われる。

　このようにサーバ装置の位置を示す位置情報に基づいて他のサーバ装置にアクセスするためのアクセス情報を得ることで、他のサーバ装置へのアクセス処理を容易に行い得る。

　また、本技術の他の概念は、
　複数のサーバ装置とクライアント装置がネットワーク接続されてなるサーバシステムであって、
　上記サーバ装置は、
　被写体を撮像して画像データを得る撮像部と、
　上記画像データで構成されるビデオストリームを含む所定フォーマットのコンテナを上記クライアント装置に送信する送信部を備え、
　上記ビデオストリームのレイヤおよび/または上記コンテナのレイヤに、上記撮像部における撮像状態を示すキャプチャ情報が挿入されており、
　上記クライアント装置は、
　上記サーバ装置から上記所定フォーマットのコンテナを受信する受信部を備え、
　上記ビデオストリームから表示用画像データを得る処理と、上記キャプチャ情報に基づいて上記撮像部の撮像状態を表示する処理と、該撮像状態の表示を用いたユーザ操作に応じて上記撮像部の撮像状態の制御情報を得る処理と、該制御情報を上記サーバ装置に送信する処理を制御する制御部をさらに備える
　サーバシステムにある。

　例えば、ビデオストリームのレイヤおよび/またはコンテナのレイヤに、サーバ装置の位置を示す位置情報がさらに挿入されており、制御部は、ユーザ操作に基づいて、上記サーバ装置とは異なる他のサーバ装置にアクセスするためのアクセス情報を得る処理と、このアクセス情報に基づいて他のサーバ装置にアクセスする処理をさらに制御する、ようにされてもよい。

　また、本技術の他の概念は、
　撮像デバイスを識別するキャプチャデバイス識別情報と、上記撮像デバイスの時刻情報を含む位置情報および上記撮像デバイスの撮像状態情報の組み合わせを識別するキャプチャビュー識別情報とで識別される複数のビデオストリームを格納するストレージと、
　クライアント装置から上記キャプチャデバイス識別情報および上記キャプチャビュー識別情報で再生すべきビデオストリームが指定された再生要求を受信する受信部と、
　上記指定されたビデオストリームを上記ストレージから読み出し、該ビデオストリームを含む所定フォーマットのコンテナを上記クライアント装置に送信する送信部を備える
　サーバ装置にある。

　本技術において、ストレージには、複数のビデオストリーム（ビデオファイル）が格納されている。各ビデオストリームは、撮像デバイスを識別するキャプチャデバイス識別情報と、撮像デバイスの時刻情報を含む位置情報および撮像デバイスの撮像状態情報の組み合わせを識別するキャプチャビュー識別情報とで識別可能とされている。

　受信部により、クライアント装置からキャプチャデバイス識別情報およびキャプチャビュー識別情報で再生すべきビデオストリームが指定された再生要求が受信される。送信部により、指定されたビデオストリームがストレージから読み出され、このビデオストリームを含む所定フォーマットのコンテナがクライアント装置に送信される。

　このように本技術においては、クライアント装置はキャプチャデバイス識別情報とキャプチャビュー識別情報とで再生すべきビデオストリームを指定することが可能となり、当該所望のビデオストリームをクライアント装置に提供することが可能となる。

　また、本技術の他の概念は、
　撮像デバイスを識別するキャプチャデバイス識別情報と、上記撮像デバイスの位置情報および上記撮像デバイスの撮像状態情報の組み合わせを識別するキャプチャビュー識別情報とで再生すべきビデオストリームを指定した再生要求をサーバ装置に送信する送信部と、
　上記サーバ装置から上記再生要求に対応したビデオストリームを含む所定フォーマットのコンテナを受信する受信部と、
　上記コンテナに含まれるビデオストリームから表示用画像データを得る処理部を備える
　クライアント装置にある。

　本技術において、送信部により、再生すべきビデオストリームが指定された再生要求がサーバ装置に送信される。この場合、撮像デバイスを識別するキャプチャデバイス識別情報と、撮像デバイスの位置情報および撮像デバイスの撮像状態情報の組み合わせを識別するキャプチャビュー識別情報とで再生すべきビデオストリームが指定される。

　受信部により、サーバ装置から再生要求に対応したビデオストリームを含む所定フォーマットのコンテナが受信される。そして、処理部により、コンテナに含まれるビデオストリームから表示用画像データが得られる。

　このように本技術においては、キャプチャデバイス識別情報とキャプチャビュー識別情報とで再生すべきビデオストリームを指定した再生要求をサーバ装置に送信して、所望のビデオストリームをサーバ装置から提供を受けることが可能となる。

　本技術によれば、クライアント装置がサーバ装置の撮像状態を適切に制御可能となる。なお、本明細書に記載された効果はあくまで例示であって限定されるものではなく、また付加的な効果があってもよい。

第１の実施の形態としてのサーバシステムの構成例を示す図である。ＭＰ４のストリームの一例を示す図である。 “ｌｃｉｂ”ボックスに格納される情報例を示す図である。キャプチャ情報としての方角情報、フォーカス距離情報、水平アングル情報、垂直アングル情報を説明するための図である。ロケーション・キャプチャ、インフォメーションＳＥＩメッセージの構造例を示す図である。制御情報（制御メタ情報）の構造例を示す図である。制御情報（制御メタ情報）の構造例における主要な情報の内容を示す図である。トラッキング（自動追従）の動作を説明するための図である。撮像状態の制御の一例を説明するための図である。最初にアクセスすべきメディアキャプチャ・ロケーションサーバのＵＲＬの情報を含むＭＰＤファイルの記述例を示す図である。現在の撮像状態を示すと共に、その撮像状態の変更操作部を持つユーザインタフェース画面（ＵＩ画面）の一例を示す図である。他のメディアキャプチャ・ロケーションサーバを、あるメディアキャプチャ・ロケーションサーバに対して方向および距離の情報で指定する一例を示す図である。メディアキャプチャ・ロケーションサーバの構成例を示すブロック図である。クライアント装置の構成例を示すブロック図である。ＵＲＬの情報を含む第１のメッセージとしてのサーバアクセス・メッセージの構造例を示す図である。ＧＰＳ_ＵＲＬマッピングサーバのＵＲＬの情報とＧＰＳデータを含む第２のメッセージとしてのサーバアクセス・メッセージの構造例を示す図である。クライアント装置と各サーバとの間の通信の一例を示すシーケンス図である。第２の実施の形態としてのサーバシステムの構成例を示す図である。ストレージサーバに格納されている複数のビデオストリームの情報を含むＭＰＤファイルの記述例を示す図である。ストレージサーバの構成例を示すブロック図である。クライアント装置と各サーバとの間の通信の一例を示すシーケンス図である。

　以下、発明を実施するための形態（以下、「実施の形態」とする）について説明する。なお、説明を以下の順序で行う。
　１．第１の実施の形態
　２．第２の実施の形態
　３．変形例

　＜１．第１の実施の形態＞
　［サーバシステムの構成例］
　図１は、第１の実施の形態としてのサーバシステム１０の構成例を示している。このサーバシステム１０は、複数のサーバ装置とクライアント装置２００がネットワーク接続されて構成されている。

　複数のサーバ装置には、複数のメディアキャプチャ・ロケーションサーバ１０１と、初期アクセスサーバ１０２と、ＧＰＳ_ＵＲＬマッピングサーバ１０３が含まれる。メディアキャプチャ・ロケーションサーバ１０１は、クライアント装置２００からのアクセスがあるとき、カメラ（撮像部）で撮像されて得られた画像データで構成されるビデオストリームを含む所定フォーマットのコンテナ、この実施の形態ではＭＰ４の配信ストリームを、ネットワークを通じて当該クライアント装置２００に送信する。

　この場合、ビデオストリームのレイヤおよび/またはコンテナのレイヤに、カメラ（撮像部）における撮像状態（撮像方向、フォーカス距離、ズーム比など）を示すキャプチャ情報と、自身のサーバ装置の位置を示す位置情報、この実施の形態ではＧＰＳ（Global Positioning System）データと、キャプチャ情報と位置情報の組み合わせを識別する識別情報（キャプチャビューＩＤ）および自身のサーバ装置を識別する識別情報（キャプチャデバイスＩＤ）と、自身のサーバ装置のＵＲＬ（Uniform Resource Locator）などの情報が挿入される。

　コンテナのレイヤへの情報の挿入には、例えば、ＭＰ４のユーザデータボックス「“ｕｄｔａ”ボックス」が利用される。図２は、ＭＰ４のストリームの一例を示している。一般の放送など、送信の途中から画音が出るように、サービスストリーム全体がフラグメント化されて送信される。この場合、図示のように、イニシャライゼーション・セグメント（ＩＳ：initialization segment）から始まり、それに、“ｓｔｙｐ”、“ｓｉｄｘ（Segment index box）”、“ｓｓｉｘ（Sub-segment index box）”、“ｍｏｏｆ（Movie fragment box）”、“ｍｄａｔ（Media data box）”のボックスが続く。

　“ｕｄｔａ”のボックスは、図示のように、イニシャライゼーション・セグメント（ＩＳ）や“ｍｏｏｆ”のボックスに定義される。すなわち、イニシャライゼーション・セグメント（ＩＳ）には、“ｍｏｏｖ”ボックスが存在し、この“ｍｏｏｖ”ボックス内には“ｔｒａｋ”ボックスが存在し、この“ｔｒａｋ”ボックス内に“ｕｄｔａ”ボックスが定義される。

　ここでは、“ｕｄｔａ”ボックスに、新規定義する、ロケーション・キャプチャ・インフォメーションボックス「“ｌｃｉｂ”ボックス」が新たに定義される。図３は、“ｌｃｉｂ”ボックスに格納される情報例を示している。「latitude」、「longitude」、「elevation」、「time」は、ＧＰＳデータを構成している。「latitude」は緯度データ、「longitude」は経度データ、「elevation」は高度データ、「time」は時刻データである。

　「direction」、「H_angle」、「V_angle」、「focus_distance」、「zoom_ratio」は、キャプチャ情報を構成している。「direction」は、図４（ａ）に示すように、カメラ（撮像部）の東西南北などの方角情報である。「H_angle」は、図４（ｂ）に示すように、カメラ（撮像部）の上述の方角を基準（0 degree)とした場合の水平アングル情報である。「V_angle」は、図４（ｃ）に示すように、カメラ（撮像部）の水平を基準（0 degree)とした場合の垂直アングル情報である。「focus_distance」は、図４（ｄ）に示すように、カメラ（撮像部）のフォーカス距離情報である。「zoom_ratio」は、カメラ（撮像部）のズーム比情報である。

　「capture_device_id」は、キャプチャデバイスＩＤである。「capture_view_id」は、キャプチャビューＩＤである。「Server_url」は、自身のサーバ装置のＵＲＬである。

　また、ビデオストリームのレイヤへの情報の挿入には、例えば、ＳＥＩメッセージが利用される。ＳＥＩメッセージ群に、新規定義する、ロケーション・キャプチャ、インフォメーションＳＥＩメッセージ（Location_Capture_information SEI message）が配置される。

　図５は、ロケーション・キャプチャ、インフォメーションＳＥＩメッセージの構造例(Syntax)を示している。「byte_length」の８ビットフィールドは、このＳＥＩメッセージの以降のサイズ（バイト数）を示す。

　「latitude」、「longitude」、「elevation」、「time」の各１６ビットフィールドは、ＧＰＳデータを示す。ここで、「latitude」のフィールドは緯度を示し、「longitude」のフィールドは経度を示し、「elevation」のフィールドは高度を示し、「time」のフィールドは時刻を示す。

　「direction」、「H_angle」、「V_angle」、「focus_distance」、「zoom_ratio」の各１６ビットフィールドは、キャプチャ情報を示す。ここで、「direction」のフィールドは、カメラ（撮像部）の東西南北などの方角を示す。「H_angle」のフィールドは、カメラ（撮像部）の上述の方角を基準（0 degree)とした場合の水平アングルを示す。「V_angle」のフィールドは、カメラ（撮像部）の水平を基準（0 degree)とした場合の垂直アングルを示す。「focus_distance」のフィールドは、カメラ（撮像部）のフォーカス距離を示す。「zoom_ratio」のフィールドは、カメラ（撮像部）のズーム比を示す。

　「capture_device_id」の１６ビットフィールドは、キャプチャデバイスＩＤを示す。「capture_view_id」の１６ビットフィールドは、キャプチャビューＩＤを示す。「server_url_text_length」の８ビットフィールドは、以降のＵＲＬの文字列を示す文字コード部分の長さ（サイズ）をバイト数で示す。文字コードは、「url_text」のフィールドに配置される。

　また、メディアキャプチャ・ロケーションサーバ１０１は、クライアント装置２００からカメラ（撮像部）における撮像状態を制御するための制御情報（制御メタ情報）を受信し、この制御情報に基づいてカメラ（撮像部）の撮像状態を制御する。これにより、クライアント装置からメディアキャプチャ・ロケーションサーバ１０１のカメラ（撮像部）の撮像状態を制御することができる。

　図６は、制御情報（制御メタ情報）の構造例を示し、図７は、その構造例における主要な情報の内容（Semantics）を示している。「byte_length」の８ビットフィールドは、この制御情報の以降のサイズ（バイト数）を示す。

　「ROI_pointing_flag」の１ビットフィールドは、トラッキングさせる対象（ＲＯＩ：Region Of Interest）の矩形エリアの情報が存在することを示すフラグ情報である。「view_angle_shift_flag」の１ビットフィールドは、ビューアングルシフトの情報が存在することを示すフラグ情報である。「focus_distance_flag」の１ビットフィールドは、フォーカス距離の情報が存在することを示すフラグ情報である。「switch_view_flag」の１ビットフィールドは、キャプチャビューＩＤが存在することを示すフラグ情報である。「zoom_control_flag」の１ビットフィールドは、ズーム制御情報が存在することを示すフラグ情報である。

　「capture_device_ID」、「capture_view_ID」の各８ビットフィールドは、クライアント装置２００がビデオストリームのレイヤおよび/またはコンテナのレイヤの挿入情報（“ｌｃｉｂ”ボックスの情報、ロケーション・キャプチャ、インフォメーションＳＥＩメッセージ）から認識しているキャプチャデバイスＩＤ、キャプチャビューＩＤを示す。

　「ROI_pointing_flag」が“１”であるとき、「ROI_area_top_left_x」、「ROI_area_top_left_y」、「ROI_area_bottom_right_x」、「ROI_area_bottom_right_y」の各１６ビットフィールドが存在する。「ROI_area_top_left_x」のフィールドは、トラッキングさせる対象（ＲＯＩ)の矩形エリアのトップレフト（top-left）のｘ座標を示す。「ROI_area_top_left_y」のフィールドは、トラッキングさせる対象（ＲＯＩ)の矩形エリアのトップレフト（top-left）のｙ座標を示す。「ROI_area_bottom_right_x」のフィールドは、トラッキングさせる対象（ＲＯＩ)の矩形エリアのボトムライト（bottom-right）のｘ座標を示す。ROI_area_bottom_right_y」のフィールドは、トラッキングさせる対象（ＲＯＩ)の矩形エリアのボトムライト（bottom-right）のｙ座標を示す。

　メディアキャプチャ・ロケーションサーバ１０１は、クライアント装置２００から受信される制御情報（制御メタ情報）にトラッキング対象（ＲＯＩ）の矩形エリアの情報が存在するとき、カメラ（撮像部）が対象（ＲＯＩ）をトラッキング（自動追従）するように、その撮像状態（主には、方角、アングルの状態）を制御する。

　図８は、トラッキング例を示す。図８（ａ）は、クライアント装置２００のディスプレイに表示される画像を簡略的に示している。クライアント装置２００において、ユーザがディスプレイト上でトラッキング対象（ＲＯＩ）を囲む矩形エリアＥＲを図示のように指定すると、この矩形エリアＥＲの情報を持つ制御情報（制御メタ情報）がクライアント装置２００からメディアキャプチャ・ロケーションサーバ１０１に送られる。

　トラッキング対象（ＲＯＩ）が、例えば図示の移動方向に移動しているものとする。この場合、メディアキャプチャ・ロケーションサーバ１０１は、図８（ｂ）に示すように、移動後のトラッキング対象（ＲＯＩ）のオブジェクトをブロック分割し、各ブロックにおいて動き予測により動き判定を行い、各ブロックの動き判定結果からグローバルな動きベクトル（移動方向と移動量）を求め、この動きベクトルの情報に基づいてカメラ（撮像部）の向きを修正する。

　メディアキャプチャ・ロケーションサーバ１０１は、このようなカメラ（撮像部）の向きの修正動作を繰り返し行う。これにより、カメラ（撮像部）の向きはトラッキング対象（ＲＯＩ）に移動に従って随時修正され、トラッキング対象（ＲＯＩ）は常に画像内に含まれることとなり、トラッキング（自動追従）が行われる。

　図６に戻って、「view_angle_shift_flag」が“１”であるとき、「Right_shift_degree」、「Left_shift_degree」、「Upper_shift_degree」、「Lower_shift_degree」の各１６ビットフィールドが存在する。「Right_shift_degree」のフィールドは、カメラ（撮像部）の向きをカメラ位置からみて右方に変更させる度数を示す。「Left_shift_degree」のフィールドは、カメラ（撮像部）の向きをカメラ位置からみて左方に変更させる度数を示す。「Upper_shift_degree」のフィールドは、カメラ（撮像部）の向きをカメラ位置からみて上方に変更させる度数を示す。「Lower_shift_degree」のフィールドは、カメラ（撮像部）の向きをカメラ位置からみて下方に変更させる度数を示す。

　メディアキャプチャ・ロケーションサーバ１０１は、クライアント装置２００から受信される制御情報（制御メタ情報）にビューアングルシフトの情報が存在するとき、当該情報に基づいてカメラ（撮像部）のアングルを制御する。例えば、図９は、カメラ（撮像部）がある撮像状態において被写体全体のうちショット１（Shot 1）の部分を撮像している状態で、「Right_shift_degree」として“Ｘ”の情報が与えられた場合には、カメラ（撮像部）の向きが右方にＸ度（X degree）だけ変更され、ショット２（Shot 2）の部分を撮像する状態に制御されることを示している。

　「focus_distance_flag」が“１”であるとき、「Focus_distance」の１６ビットフィールドが存在する。「Focus_distance」のフィールドは、フォーカス距離をメータ（meter）単位で示す。メディアキャプチャ・ロケーションサーバ１０１は、クライアント装置２００から受信される制御情報（制御メタ情報）にフォーカス距離の情報が存在するとき、カメラ（撮像部）のフォーカス距離を当該情報に対応するように制御する。

　「switch_view_flag」が“１”であるとき、「switch_view」の１６ビットフィールドが存在する。「switch_view」のフィールドは、カメラ（撮像部）の撮像状態を変更させるキャプチャビューＩＤを示す。上述したように、キャプチャビューＩＤは、キャプチャ情報と位置情報の組み合わせを識別する識別情報である。「switch_view」は、クライアント装置２００が切り替え後のキャプチャビューＩＤ（capture_view_id）を明示的に示す場合に指定できるものである。メディアキャプチャ・ロケーションサーバ１０１は、クライアント装置２００から受信される制御情報（制御メタ情報）にこのキャプチャビューＩＤが存在するとき、カメラ（撮像部）の撮像状態を当該キャプチャビューＩＤで示されるキャプチャ情報に対応するように制御する。

　「zoom_control_flag」が“１”であるとき、「zoom_in_degree」、「zoom_out_degree」の各１６ビットフィールドが存在する。「zoom_in_degree」のフィールドは、拡大の比率(1 + x/100)のｘの値を示す。「zoom_out_degree」のフィールドは、縮小の比率(1 - x/100)のｘの値を示す。メディアキャプチャ・ロケーションサーバ１０１は、クライアント装置２００から受信される制御情報（制御メタ情報）にズーム比の拡大/縮小情報が存在するとき、カメラ（撮像部）のズーム比を当該ズーム比の拡大/縮小情報に応じて制御する。

　図１に戻って、初期アクセスサーバ１０２は、クライアントサ装置２００が最初にアクセスして、クライアント装置２００が最初にアクセスすべきメディアキャプチャ・ロケーションサーバ１０１のＵＲＬを取得するためのサーバ装置である。なお、クライアント装置２００が最初にアクセスすべきメディアキャプチャ・ロケーションサーバ１０１のＵＲＬを予め認識する場合には、この初期アクセスサーバ１０２はなくてもよい。

　初期アクセスサーバ１０２は、クライアント装置２００からアクセスがあるとき、当該クライアント装置２００に、最初にアクセスすべきメディアキャプチャ・ロケーションサーバ１０１のＵＲＬの情報を含むＭＰＤ（Media Presentation Description）ファイルを送る。

　図１０は、ＭＰＤファイルの記述例を示している。ここでは、説明の簡単化のためにビデオストリームに関する情報のみが記述されている例を示しているが、実際にはビデオストリームの他のメディアストリームに関する情報も記述されている。

　「<AdaptationSet mimeType=“video/mp4” codecs=“hev1.xx.xx.L153”」の記述により、ビデオストリームに対するアダプテーションセット（AdaptationSet）が存在し、そのビデオストリームはＭＰ４ファイル構造で供給され、１５３のレベルのＨＥＶＣの符号化画像データが存在することが示されている。

　「<SupplementaryDescriptor schemeIdUri=“urn:rmtcst:video:captureinformation”direction=SE　H_angle=“10” V_angle=“-15”　focus_distance=“5” /> 」の記述により、方角が「ＳＥ」、水平アングルが１０度、垂直アングルが－１５度、フォーカス距離が５ｍであることが示されている。

　「<SupplementaryDescriptor schemeIdUri=“urn:rmtcst:video:captureserve”capturedevice_id=“1”captureview_id=“1” />」の記述により、キャプチャデバイスＩＤが「１」で、キャプチャビューＩＤが「１」であることが示されている。「<SupplementaryDescriptor schemeIdUri=“urn:rmtcst:video:captureserverurl”serverurl /> 」の記述により、最初にアクセスすべきメディアキャプチャ・ロケーションサーバ１０１のＵＲＬが「serverurl」で示されている。

　このＭＰＤファイルには、リプレゼンテーションＩＤ（Representation id = 1）で示されるビデオストリームのリプレゼンテーション（Representation）が存在する。「<BaseURL>videostream.mp4</BaseURL>」の記述により、ビデオストリームのロケーション先が、「videostream.mp4」として示されている。

　このリプレゼンテーションの中のサブリプレゼンテーション（SubRepresentation）において、「width=“3840" height=“2160" frameRate=“60"」、「codecs="hev1.xx.xx.L153,xx"」、「level=“0”」の記述が存在する。これにより、４Ｋ６０Ｐのストリームを実現することが示され、タグ情報としてレベル“０”が付与されることが示され、この画像データの符号化画像データのレベルが“１５３”であることが示されている。

　図１に戻って、ＧＰＳ_ＵＲＬマッピングサーバ１０３は、クライアント装置２００から送られてくるＧＰＳデータを、これに対応するメディアキャプチャ・ロケーションサーバ１０１のＵＲＬに変換し、このＵＲＬを用いて、クライアント装置２００に代わって、クライアント装置２００が接続すべきメディアキャプチャ・ロケーションサーバ１０１にアクセスする。

　後述するように、クライアント装置２００では、あるメディアキャプチャ・ロケーションサーバ１０１に接続された状態で、その位置から所望の方向、距離の位置にある他のメディアキャプチャ・ロケーションサーバ１０１に接続を切り替えようとする場合、他のメディアキャプチャ・ロケーションサーバ１０１の位置近傍のＧＰＳデータを算出し、このＧＰＳデータをＧＰＳ_ＵＲＬマッピングサーバ１０３に送信する。

　なお、クライアント装置２００がＧＰＳデータを、これに対応するメディアキャプチャ・ロケーションサーバ１０１のＵＲＬに変換する機能を有する場合には、このＧＰＳ_ＵＲＬマッピングサーバ１０３はなくてもよい。この場合、クライアント装置２００は、変換して得られたＵＲＬを用いて、クライアント装置２００が接続すべきメディアキャプチャ・ロケーションサーバ１０１に直接アクセスする。

　クライアント装置２００は、初期アクセスサーバ１０２にアクセスして、最初にアクセスすべきメディアキャプチャ・ロケーションサーバ１０１のＵＲＬを取得する。クライアント装置２００は、例えば、初期アクセスサーバ１０２から、最初にアクセスすべきメディアキャプチャ・ロケーションサーバ１０１のＵＲＬが記述されたＭＰＤファイル（図１０参照）を受信する。

　クライアント装置２００は、最初にアクセスすべきメディアキャプチャ・ロケーションサーバ１０１のＵＲＬに基づいて、当該メディアキャプチャ・ロケーションサーバ１０１にアクセスする。そして、クライアント装置２００は、当該メディアキャプチャ・ロケーションサーバ１０１から、撮像部で撮像されて得られた画像データで構成されるビデオストリームを含む所定フォーマットのコンテナ、この実施の形態ではＭＰ４の配信ストリームを、ネットワークを通じて受信する。

　クライアント装置２００は、ＭＰ４の配信ストリームからビデオストリームを抽出し、このビデオストリームを処理して表示用画像データを得て、ディスプレイに、この表示用画像データによる画像（ディアキャプチャ・ロケーションサーバ１０１によるキャプチャ画像）を表示する。

　クライアント装置２００は、ビデオストリームのレイヤおよび/またはコンテナのレイヤの挿入情報（“ｌｃｉｂ”ボックスの情報、ロケーション・キャプチャ、インフォメーションＳＥＩメッセージ）から、メディアキャプチャ・ロケーションサーバ１０１におけるカメラ（撮像部）の撮像状態（撮像方向、フォーカス距離、ズーム比など）を認識する。そして、クライアント装置２００は、ユーザ操作に基づき、現在の撮像状態を示すと共に、その撮像状態の変更操作部を持つ、ユーザインタフェース画面（ＵＩ画面）を、ディスプレイに表示できる。

　図１１は、ＵＩ画面の一例を示している。矢印Ｐは、ズーム比（Zoom_ratio）の表示とその調整のためのズーム比表示・調整部を示している。図示の例では、黒色と白色の境界位置で現在のズーム比が示される。例えば、ユーザは、「＋」の箇所を指でタップ操作することでズームイン操作を行うことができ、一方「－」の箇所を指でタップ操作することでズームアウト操作を行うことができる。また、例えば、ユーザは、境界位置に指をおいてドラッグ操作で境界位置を変更することでズーム比の調整操作を行うことができる。

　矢印Ｑは、水平アングル（H_degree）、垂直アングル（V_degree）、フォーカス距離（Focus_distance）の調整のための調整部を示している。図示の例では、水平アングル（H_degree）に関しては、ユーザは、「＋」の箇所を指でタップ操作することでカメラ（撮像部）の向きをカメラ位置からみて右方に変更する操作を行うことができ、「－」の箇所を指でタップ操作することでカメラ（撮像部）の向きをカメラ位置からみて左方に変更する操作を行うことができる。

　また、垂直アングル（V_degree）に関しては、ユーザは、「＋」の箇所を指でタップ操作することでカメラ（撮像部）の向きをカメラ位置からみて上方に変更する操作を行うことができ、「－」の箇所を指でタップ操作することでカメラ（撮像部）の向きをカメラ位置からみて下方に変更する操作を行うことができる。また、フォーカス距離（Focus_distance）に関しては、ユーザは、「＋」の箇所を指でタップ操作することでフォーカス距離を長くする操作を行うことができ、「－」の箇所を指でタップ操作することでフォーカス距離を短くする操作を行うことができる。

　矢印Ｒは、水平アングル（H_degree）、垂直アングル（V_degree）、フォーカス距離（Focus_distance）の表示のための表示部を示している。図示の例では、カメラ（撮像部）の向きは、黒太の矢印の方向で示され、水平アングルに関しては北（Ｎ）の方向から右方にβ度だけずれた方向にあり、垂直アングルに関しては水平から上方にα度だけずれた方向にあることが示されている。また、図示の例では、カメラ（撮像部）のフォーカス距離は黒太の矢印の長さで示される。

　なお、図１１のＵＩ画面の一例では、図面を簡単化するために、撮像状態の表示、調整を行う部分のみ示されている。ユーザの選択操作に応じて、この表示を、画像（メディアキャプチャ・ロケーションサーバ１０１によるキャプチャ画像）に重畳した状態とすることも可能とされる。

　上述のズーム比（Zoom_ratio）の変更操作が行われる場合、クライアント装置２００からメディアキャプチャ・ロケーションサーバ１０１に送信される制御情報（制御メタ情報）（図６参照）において、「zoom_control_flag」が“１”とされ、「zoom_in_degree」、「zoom_out_degree」の各１６ビットフィールドが存在する状態となる。

　また、水平アングル（H_degree）、垂直アングル（V_degree）の変更操作が行われる場合、クライアント装置２００からメディアキャプチャ・ロケーションサーバ１０１に送信される制御情報（制御メタ情報）（図６参照）において、「view_angle_shift_flag」が“１”とされ、「Right_shift_degree」、「Left_shift_degree」、「Upper_shift_degree」、「Lower_shift_degree」の各１６ビットフィールドが存在する状態となる。

　また、フォーカス距離（Focus_distance）の変更操作が行われる場合、クライアント装置２００からメディアキャプチャ・ロケーションサーバ１０１に送信される制御情報（制御メタ情報）（図６参照）において、「focus_distance_flag」が“１”とされ、「Focus_distance」の１６ビットフィールドが存在する状態となる。

　なお、上述では、ユーザがＵＩ画面を参照してカメラ（撮像部）の撮像状態の各要素を変更できることを示した。しかし、クライアント装置２００においては、ユーザは、キャプチャビューＩＤを指定することで、撮像状態の各要素を一括して変更する操作を行うこともできる。

　例えば、クライアント装置２００は、メディアキャプチャ・ロケーションサーバ１０１にアクセスしてビデオストリームを含むＭＰ４の配信ストリームをネットワークを通じて受信したとき、ユーザ操作に応じて、キャプチャデバイスＩＤと共に撮像状態を示すキャプチャビューＩＤを、例えば撮像内容を特定するテキスト情報やサムネール情報を付加した状態で記憶しておくことができる。ユーザは、キャプチャビューＩＤを指定して撮像状態の各要素を一括して変更する操作を行う場合には、テキスト情報やサムネール情報などを参照して、所望の撮像状態を示すキャプチャビューＩＤを効率的に行うことができる。

　このキャプチャデバイスＩＤによる撮像状態の変更操作が行われる場合、クライアント装置２００からメディアキャプチャ・ロケーションサーバ１０１に送信される制御情報（制御メタ情報）（図６参照）において、「switch_view_flag」が“１”とされ、「switch_view」の１６ビットフィールドが存在する状態となる。

　クライアント装置２００は、あるメディアキャプチャ・ロケーションサーバ１０１に接続された状態で、ユーザが、他のメディアキャプチャ・ロケーションサーバ１０１に接続を切り替える操作を行った場合、当該他のメディアキャプチャ・ロケーションサーバ１０１にアクセスする。この場合、ユーザは、他のメディアキャプチャ・ロケーションサーバ１０１を、キャプチャデバイスＩＤで指定することができる。この場合、クライアント装置２００は、キャプチャデバイスＩＤに一対一に関連付けられているＵＲＬを用いて、当該他のメディアキャプチャ・ロケーションサーバ１０１にアクセスする。

　また、ユーザは、他のメディアキャプチャ・ロケーションサーバ１０１を、あるメディアキャプチャ・ロケーションサーバ１０１に対して方向および距離の情報で指定することができる。この場合、クライアント装置２００は、あるメディアキャプチャ・ロケーションサーバ１０１のＧＰＳデータとこの方向および距離の情報に基づいて、他のメディアキャプチャ・ロケーションサーバ１０１の位置近傍のＧＰＳデータを算出し、このＧＰＳデータをＧＰＳ_ＵＲＬマッピングサーバ１０３に送信する。

　この場合、ＧＰＳ_ＵＲＬマッピングサーバ１０３は、クライアント装置２００から送られてくるＧＰＳデータを、これに対応するメディアキャプチャ・ロケーションサーバ１０１のＵＲＬに変換し、このＵＲＬを用いて、クライアント装置２００に代わって、クライアント装置２００が接続すべきメディアキャプチャ・ロケーションサーバ１０１にアクセスする。

　なお、クライアント装置２００は、算出したＧＰＳデータをこれに対応するメディアキャプチャ・ロケーションサーバ１０１のＵＲＬに変換する機能を有している場合は、自身でＧＰＳデータからそれに対応するメディアキャプチャ・ロケーションサーバ１０１のＵＲＬに変換し、当該メディアキャプチャ・ロケーションサーバ１０１に直接アクセスする。

　ユーザは、方向の情報として現在のカメラ（撮像部）の向きの情報を与え、距離の情報としてフォーカス距離の情報を与えることもできる。図１２は、カメラ（撮像部）がショット２（Shot 2）の部分を撮像している状態を示している。この撮像状態において、水平アングルに関しては、カメラ（撮像部）の方角（Direction）を基準として右方にＸ１度ずれた方向にある。なお、垂直アングルに関しては、例えば水平にあるものとする。

　この場合、現在の地点ＡのＧＰＳ情報が（atitude1, longitude1, elevation1, time1）でるとき、方向および距離の情報から、地点ＢのＧＰＳ情報は(latitude_new, longitude_new, elevation_new )として算出される。ここで、latitude_new = latitude1 + delta_x 、longitude_new = longitude1 + delta_y 、elevation_new = elevation1 + delta_e である。

　図１３は、メディアキャプチャ・ロケーションサーバ１０１の構成例を示している。このメディアキャプチャ・ロケーションサーバ１０１は、コントローラ１１１と、ロケータ１１２と、キャプチャ１０３と、ビデオエンコーダ１１４と、コンテナエンコーダ１１５と、ネットワークインタフェース１１６を有している。各部は、バス１１７で接続されている。

　コントローラ１１１は、メディアキャプチャ・ロケーションサーバ１０１の各部の動作を制御する。ロケータ１１２は、ＧＰＳ衛星からの電波を受信して位置（経度・緯度・高度）の情報を得る。キャプチャ１１３は、被写体を撮像して画像データを得るカメラ（撮像部）である。ビデオエンコーダ１１４は、キャプチャ１１３で得られた画像データに対してＨＥＶＣなどの符号化を施して符号化画像データを得、この符号化画像データを含むビデオストリームを生成する。この場合、ビデオエンコーダ１１４は、アクセスユニット（ＡＵ）の“ＳＥＩｓ”のＳＥＩメッセージ群に、ロケーション・キャプチャ、インフォメーションＳＥＩメッセージ（図５参照）を配置する。

　このＳＥＩメッセージには、カメラ（撮像部）における撮像状態（撮像方向、フォーカス距離、ズーム比など）を示すキャプチャ情報と、自身のサーバ装置の位置を示す位置情報（ＧＰＳデータ）と、キャプチャ情報と位置情報の組み合わせを識別する識別情報（キャプチャビューＩＤ）および自身のサーバ装置を識別する識別情報（キャプチャデバイスＩＤ）と、自身のサーバ装置のＵＲＬなどの情報が挿入されている。

　コンテナエンコーダ１１５は、ビデオエンコーダ１１４で生成されたビデオストリームを含むコンテナ、ここではＭＰ４ストリームを、配信ストリームとして生成する。この場合、コンテナエンコーダ１１５は、イニシャライゼーション・セグメント（ＩＳ）や“ｍｏｏｆ”のボックスに定義される“ｕｄｔａ”のボックスに、ロケーション・キャプチャ・インフォメーションボックス「“ｌｃｉｂ”ボックス」（図３参照）を定義する。

　このボックスには、カメラ（撮像部）における撮像状態（撮像方向、フォーカス距離、ズーム比など）を示すキャプチャ情報と、自身のサーバ装置の位置を示す位置情報（ＧＰＳデータ）と、キャプチャ情報と位置情報の組み合わせを識別する識別情報（キャプチャビューＩＤ）および自身のサーバ装置を識別する識別情報（キャプチャデバイスＩＤ）と、自身のサーバ装置のＵＲＬなどの情報が挿入されている。

　なお、ロケーション・キャプチャ、インフォメーションＳＥＩメッセージの配置と、ロケーション・キャプチャ・インフォメーションボックスの配置は、必ずしも双方が必要となるのではなく、いずれか一方であってもよい。

　ネットワークインタフェース１１６は、ネットワークを介して、クライアント装置２００、さらには必要に応じて他のサーバと通信を行う。例えば、ネットワークインタフェース１１６は、コンテナエンコーダ１１５で得られた配信ストリームをクラインアント装置２００に送信する。また、例えば、ネットワークインタフェース１１６は、クライアント装置２００から送られてくる制御情報（制御メタ情報）（図６参照）を受信する。この場合、コントローラ１１１は、制御情報（制御メタ情報）の内容に応じて、キャプチャ１１３の状態を制御する。

　図１４は、クライアント装置２００の構成例を示している。コントローラ２１１と、ユーザ操作部２１２と、メッセージコンバータ２１３と、ネットワークインタフェース２１４と、コンテナデコーダ２１５と、ビデオでデコーダ２１６と、ビデオプロセッサ２１７と、ディスプレイ２１８を有している。各部は、バス２１９で接続されている。

　コントローラ２１１は、クライアント装置２００の各部の動作を制御する。ユーザ操作部２１２は、ユーザインタフェースを構成し、ユーザが各種操作を行うためのキー、タッチパネル、リモコンなどである。ネットワークインタフェース２１４は、ネットワークを介して、メディアキャプチャ・ロケーションサーバ１０１などのサーバと通信を行う。

　例えば、ネットワークインタフェース２１４は、メディアキャプチャ・ロケーションサーバ１０１から、ビデオストリームを含むＭＰ４ストリームを、配信ストリームとして受信する。また、ネットワークインタフェース２１４は、現在接続されているメディアキャプチャ・ロケーションサーバ１０１のカメラ（撮像部）の撮像状態の変更などのユーザ操作がなされるとき、制御情報（制御メタ情報）（図６参照）をメディアキャプチャ・ロケーションサーバ１０１に送信する。

　また、ネットワークインタフェース２１４は、現在接続されているメディアキャプチャ・ロケーションサーバ１０１から別なメディアキャプチャ・ロケーションサーバ１０１に接続を切り替えるためのユーザ操作がなされるとき、ＧＰＳ_ＵＲＬマッピングサーバ１０３にＧＰＳデータを送信するか、あるいは当該別なメディアキャプチャ・ロケーションサーバ１０１に直接アクセスする。

　コンテナデコーダ２１５は、ネットワークインタフェース２１４で受信された配信ストリーム（ＭＰ４ストリーム）からビデオストリームを取り出す。この場合、コンテナデコーダ２１５は、イニシャライゼーション・セグメント（ＩＳ）や“ｍｏｏｆ”のボックスに定義される“ｕｄｔａ”のボックスに存在するロケーション・キャプチャ・インフォメーションボックス「“ｌｃｉｂ”ボックス」を取り出し、コントローラ２１１に送る。これにより、コントローラ２１１は、カメラ（撮像部）における撮像状態（撮像方向、フォーカス距離、ズーム比など）などを認識する。

　ビデオデコーダ２１６は、コンテナデコーダ２１５で取り出されたビデオストリームにデコード処理を施して、表示用画像データを得る。この場合、ビデオデコーダ２１６は、ビデオストリームに挿入されているパラメータセットやＳＥＩメッセージを抽出し、コントローラ２１１に送る。この抽出情報には、ロケーション・キャプチャ、インフォメーションＳＥＩメッセージも含まれる。これにより、コントローラ２１１は、カメラ（撮像部）における撮像状態（撮像方向、フォーカス距離、ズーム比など）などを認識する。

　ビデオプロセッサ２１７は、ビデオデコーダ２１６で得られた表示用画像データを、解像度変換などの処理を施した後にディスプレイ２１８に供給する。ディスプレイ２１８は、ビデオデコーダ２１６で得られた表示用画像データによる画像（メディアキャプチャ・ロケーションサーバ１０１によるキャプチャ画像）を表示する。画像の表示はインターフェースを介して他の表示モニタになされることもできる。

　上述したように、コントローラ２１１がロケーション・キャプチャ・インフォメーションボックスやロケーション・キャプチャ、インフォメーションＳＥＩメッセージからカメラ（撮像部）における撮像状態（撮像方向、フォーカス距離、ズーム比など）などを認識することで、コントローラ２１１の制御のもと、ディスプレイ２１８に、現在の撮像状態を示すＵＩ画面（図１１参照）の表示が可能となる。

　メッセージコンバータ２１３は、例えばユーザ操作部２１２の操作に応じて、コントローラ２１１の制御のもと、メッセージを発生して、ネットワークインタフェース２１４に送る。例えば、メッセージコンバータ２１３は、現在接続されているメディアキャプチャ・ロケーションサーバ１０１のカメラ（撮像部）の撮像状態の変更などのユーザ操作がなされるとき、コントローラ２１１の制御のもと、制御情報（制御メタ情報）（図６参照）を発生して、ネットワークインタフェース２１４に送る。

　また、例えば、メッセージコンバータ２１３は、現在接続されているメディアキャプチャ・ロケーションサーバ１０１から別なメディアキャプチャ・ロケーションサーバ１０１に接続を切り替えるためのユーザ操作がなされるとき、別なメディアキャプチャ・ロケーションサーバ１０１のＵＲＬの情報を含む第１のメッセージ、あるいはＧＰＳ_ＵＲＬマッピングサーバ１０３のＵＲＬの情報と別なメディアキャプチャ・ロケーションサーバ１０１のＵＲＬを求めるためのＧＰＳデータを含む第２のメッセージを発生して、ネットワークインタフェース２１４に送る。

　図１５は、第１のメッセージとしてのサーバアクセス・メッセージ（Server_access_message ）の構造例を示している。「byte_length」の８ビットフィールドは、このＳＥＩメッセージの以降のサイズ（バイト数）を示す。「server_url_text_length」の８ビットフィールドは、以降のＵＲＬの文字列を示す文字コード部分の長さ（サイズ）をバイト数で示す。文字コードは、「url_text」のフィールドに配置される。

　図１６は、第２のメッセージとしてのサーバアクセス・メッセージ（Server_access_message ）の構造例を示している。「byte_length」の８ビットフィールドは、このＳＥＩメッセージの以降のサイズ（バイト数）を示す。「latitude_new」、「longitude_new」、「elevation_new」は、ＧＰＳデータを構成している。「latitude_new」は緯度データ、「longitude_new」は経度データ、「elevation_new」は高度データである。「server_url_text_length」の８ビットフィールドは、以降のＵＲＬの文字列を示す文字コード部分の長さ（サイズ）をバイト数で示す。文字コードは、「url_text」のフィールドに配置される。

　図１７のシーケンス図は、クライアント装置２００と各サーバとの間の通信の一例を示している。（１）最初に、クライアント装置２００は、初期アクセスサーバ１０２にアクセスする。なお、クライアント装置２００は、初期アクセスサーバ１０２のＵＲＬを予め認識しているものとする。（２）初期アクセスサーバ１０２は、最初にアクセスすべきメディアキャプチャ・ロケーションサーバ１０１のＵＲＬの情報を含むＭＰＤファイルをクライアント装置２００に送る。

　（３）クライアント装置２００は、ＭＰＤファイルに含まれるＵＲＬの情報に基づいて、最初にアクセスすべきメディアキャプチャ・ロケーションサーバ（キャプチャサーバ）１０１にアクセスし、接続状態とする。（４）当該メディアキャプチャ・ロケーションサーバ１０１は、撮像画像データのビデオストリームを含む配信ストリームをクライアント装置２００に送信する。これにより、クライアント装置２００は、メディアキャプチャ・ロケーションサーバ１０１におけるキャプチャ画像の表示状態になる。

　（５）クライアント装置２００は、ユーザの撮像状態変更操作に応じて、制御情報（制御メタ情報）を、当該メディアキャプチャ・ロケーションサーバ１０１に送る。これにより、メディアキャプチャ・ロケーションサーバ１０１における撮像状態が変更される。（６）当該メディアキャプチャ・ロケーションサーバ１０１は、撮像状態変更後の撮像画像データのビデオストリームを含む配信ストリームをクライアント装置２００に送信する。これにより、クライアント装置２００は、メディアキャプチャ・ロケーションサーバ１０１における撮像状態変更後のキャプチャ画像の表示状態になる。

　（７）クライアント装置２００は、ユーザの他のメディアキャプチャ・ロケーションサーバ１０１への変更操作に応じて、当該他のメディアキャプチャ・ロケーションサーバ１０１に、直接、あるいはＧＰＳ_ＵＲＬマッピングサーバ１０３を介してアクセスして、接続状態とする。（８）当該メディアキャプチャ・ロケーションサーバ１０１は、撮像画像データのビデオストリームを含む配信ストリームをクライアント装置２００に送信する。これにより、クライアント装置２００は、他のメディアキャプチャ・ロケーションサーバ１０１におけるキャプチャ画像の表示状態になる。

　（９）クライアント装置２００は、ユーザの撮像状態変更操作に応じて、制御情報（制御メタ情報）を、当該他のメディアキャプチャ・ロケーションサーバ１０１に送る。これにより、他のメディアキャプチャ・ロケーションサーバ１０１における撮像状態が変更される。（１０）当該メディアキャプチャ・ロケーションサーバ１０１は、撮像状態変更後の撮像画像データのビデオストリームを含む配信ストリームをクライアント装置２００に送信する。これにより、クライアント装置２００は、他のメディアキャプチャ・ロケーションサーバ１０１における撮像状態変更後のキャプチャ画像の表示状態になる。

　上述したように、図１に示すサーバシステム１０において、メディアキャプチャ・ロケーションサーバ１０１は、ビデオストリームのレイヤおよび/またはコンテナのレイヤに、カメラ（撮像部）における撮像状態を示すキャプチャ情報を挿入して送信する。そのため、クライアント装置２００では、このキャプチャ情報に基づいてメディアキャプチャ・ロケーションサーバ１０１のカメラ（撮像部）における撮像状態（撮像方向、フォーカス距離、ズーム比など）を容易に把握でき、メディアキャプチャ・ロケーションサーバ１０１の撮像状態を適切に制御できる。

　また、図１に示すサーバシステム１０において、クラインアント装置２００では、ユーザは、他のメディアキャプチャ・ロケーションサーバ１０１を、現在接続しているメディアキャプチャ・ロケーションサーバ１０１に対して方向および距離の情報で指定することができる。そのため、切り替えるべきメディアキャプチャ・ロケーションサーバ１０１のＵＲＬを知らない場合であっても、他のメディアキャプチャ・ロケーションサーバ１０１への切り替えを適切に行うことができる。

　＜２．第２の実施の形態＞
　［サーバシステムの構成例］
　図１８は、第２の実施の形態としてのサーバシステム３０の構成例を示している。このサーバシステム３０は、複数のサーバ装置とクライアント装置４００がネットワーク接続されて構成されている。

　複数のサーバ装置には、複数のメディアキャプチャ・ロケーションサーバ３０１と、初期アクセスサーバ３０２と、サムネールサーバ３０３と、ストレージサーバ３０４が含まれる。メディアキャプチャ・ロケーションサーバ３０１は、ストレージサーバ３０４に、例えば、ストレージサーバ３０４からのアクセスがあるとき、あるいは自動的に、カメラ（撮像部）で撮像されて得られた画像データで構成されるビデオストリームを含む所定フォーマットのコンテナ、この実施の形態ではＭＰ４の配信ストリームを、ネットワークを通じて送信する。図示の例では、ストレージサーバ３０４が一個であるものを示しているが、複数個のストレージサーバ３０４が存在していてもよい。

　メディアキャプチャ・ロケーションサーバ３０１は、詳細説明は省略するが、上述の第１の実施の形態におけるメディアキャプチャ・ロケーションサーバ１０１（図１３参照）と同様に構成されている。ストレージサーバ３０４は、各メディアキャプチャ・ロケーションサーバ３０１から送られてくるビデオストリーム（ビデオファイル）を、キャプチャビューＩＤおよびキャプチャデバイスＩＤの組み合わせを識別情報として、格納する。

　初期アクセスサーバ３０２は、ストレージサーバ３０４に格納されている複数のビデオストリームの情報を取得するためのサーバ装置である。初期アクセスサーバ３０２は、クライアント装置４００からアクセスがあるとき、当該クライアント装置４００に、複数のビデオストリームの情報を含むＭＰＤ（Media Presentation Description）ファイルを送る。

　このＭＰＤファイルには、複数のビデオストリームの情報として、各ビデオストリームの識別情報としてのキャプチャデバイスＩＤおよびキャプチャビューＩＤの組み合わせと、各ビデオストリームのサムネール画像データを取得するためのサムネールサーバのＵＲＬとが含まれる。

　図１９は、ＭＰＤファイルの記述例を示している。ここでは、説明の簡単化のためにビデオストリームに関する情報のみが記述されている例を示しているが、実際にはビデオストリームの他のメディアストリームに関する情報も記述されている。

　第１のピリオド（Period1）の情報と、第２のピリオド（Period2）の情報が存在する。第１のピリオド（Period1）において、「<AdaptationSet mimeType=“video/mp4” codecs=“hev1.xx.xx.L153”」の記述により、ビデオストリームに対するアダプテーションセット（AdaptationSet）が存在し、そのビデオストリームはＭＰ４ファイル構造で供給され、１５３のレベルのＨＥＶＣの符号化画像データが存在することが示されている。

　「<BaseURL>”thumbnail_server_URL1”</BaseURL>」の記述により、以下のキャプチャデバイスＩＤおよびキャプチャビューＩＤの組み合わせで識別されるストレージサーバ３０４に格納されている各ビデオストリームのサムネール画像データのロケーション先が、「thumbnail_server_URL1」であることが示されている。「thumbnail_server_URL1」で示されるサムネールサーバ内では個々のサムネール画とキャプチャデバイスＩＤおよびキャプチャビューＩＤとが対応して管理されている。

　また、第２のピリオド（Period2）において、「<AdaptationSet mimeType=“video/mp4” codecs=“hev1.xx.xx.L153”」の記述により、ビデオストリームに対するアダプテーションセット（AdaptationSet）が存在し、そのビデオストリームはＭＰ４ファイル構造で供給され、１５３のレベルのＨＥＶＣの符号化画像データが存在することが示されている。

　「<BaseURL>”thumbnail_server_URL2”</BaseURL>」の記述により、以下のキャプチャデバイスＩＤおよびキャプチャビューＩＤの組み合わせで識別されるストレージサーバ３０４に格納されている各ビデオストリームのサムネール画像データのロケーション先が、「thumbnail_server_URL2」であることが示されている。「thumbnail_server_URL2」で示されるサムネールサーバ内では個々のサムネール画とキャプチャデバイスＩＤおよびキャプチャビューＩＤとが対応して管理されている。なお、第１のピリオド（Period1）と第２のピリオド（Period2）におけるサムネール画像データのロケーション先が同じとされてもよい。

　図１８に戻って、サムネールサーバ３０３は、ストレージサーバ３０４に格納されている各ビデオストリームのサムネール画像データを一つ以上保持している。このサムネールサーバ３０３は、クラインアント装置４００からアクセスがあるとき、保持しているサムネール画像データを、当該クライアント装置４００に送信する。なお、図示の例では、サムネールサーバ３０３が一個の例を示しているが、複数個存在していてもよい。

　クライアント装置４００は、詳細説明は省略するが、上述の第１の実施の形態におけるクライアント装置２００（図１４参照）と同様に構成されている。クライアント装置４００は、初期アクセスサーバ３０２にアクセスして、ストレージサーバ３０４に格納されている複数のビデオストリームの情報を取得する。クライアント装置４００は、例えば、初期アクセスサーバ３０２から、各ビデオストリームの識別情報としてのキャプチャデバイスＩＤおよびキャプチャビューＩＤの組み合わせと、各ビデオストリームのサムネール画像データを取得するためのサムネールサーバのＵＲＬとが記述されたＭＰＤファイル（図１９参照）を受信する。

　クライアント装置４００は、サムネールサーバのＵＲＬに基づいて、サムネールサーバ３０３にアクセスする。そして、クライアント装置４００は、当該サムネールサーバ３０３から、ストレージサーバ３０４に格納されている複数のビデオストリームのサムネール画像データを、ネットワークを通じて受信する。なお、各サムネール画像データには、各ビデオストリームの撮像開始時刻と撮像終了時刻の情報が付加されていることも考えられる。

　クライアント装置２００は、ユーザの再生ビデオストリームの選択の便宜のために、ディスプレイにサムネール画を表示する。このとき、各サムネール画に対応付けて撮像開始時刻と撮像終了時刻をも表示し、ユーザが、再生ビデオストリームの選択だけでなく、その再生開始位置の指定も行い得るようにされてもよい。

　クライアント装置４００は、ユーザ操作で、再生ビデオストリームが選択されたとき、それを識別するキャプチャデバイスＩＤおよびキャプチャビューＩＤの組み合わせを含む再生要求を、ストレージサーバ３０４に送信する。そして、クライアント装置４００は、当該ストレージサーバ３０４から、選択された再生ビデオストリームを含むＭＰ４の配信ストリームを、ネットワークを通じて受信する。なお、ユーザ操作で再生開始位置の指定も行われる場合には、ストレージサーバ３０４からの受信はその再生開始位置からとなる。

　クライアント装置４００は、ＭＰ４の配信ストリームからビデオストリームを抽出し、このビデオストリームを処理して表示用画像データを得て、ディスプレイに、この表示用画像データによる画像（メディアキャプチャ・ロケーションサーバ３０１によるキャプチャ画像）を表示する。

　図２０は、ストレージサーバ３０４の構成例を示している。このストレージサーバ３０４は、コントローラ３１１と、ストレージ３１２と、コンテナエンコーダ３１３と、ネットワークインタフェース３１４を有している。各部は、バス３１５で接続されている。

　コントローラ３１１は、ストレージサーバ３０４の各部の動作を制御する。ストレージ３１２は、ハードディスクドライブ（ＨＤＤ）あるいは半導体メモリなどで構成されている。ストレージ３１２は、各メディアキャプチャ・ロケーションサーバ３０１から送られてくるビデオストリーム（ビデオファイル）を、キャプチャビューＩＤおよびキャプチャデバイスＩＤの組み合わせを識別情報として、格納する。

　コントローラ３１１は、クライアント装置４００から、キャプチャデバイスＩＤおよびキャプチャビューＩＤの組み合わせで再生すべきビデオストリームが指定された再生要求の受信があるとき、ストレージ３１２からそのキャプチャデバイスＩＤおよびキャプチャビューＩＤの組み合わせで識別されるビデオストリーム（ビデオファイル）を読み出し、コンテナエンコーダ３１３に送る。なお、当該再生要求に再生開始位置の指定も含まれるときには、その再生開始位置からの読み出しとなる。

　コンテナエンコーダ３１３は、ストレージ３１２から読み出されたビデオストリームを含むコンテナ、ここではＭＰ４ストリームを、配信ストリームとして生成する。ネットワークインタフェース３１４は、ネットワークを介して、クライアント装置４００、さらには必要に応じて他のサーバと通信を行う。

　例えば、ネットワークインタフェース３１４は、各メディアキャプチャ・ロケーションサーバ３０１から送られてくるビデオストリームを受信する。また、例えば、ネットワークインタフェース３１４は、コンテナエンコーダ３１３で得られた配信ストリームをクラインアント装置４００に送信する。また、例えば、ネットワークインタフェース３１４は、クライアント装置４００から送られてくる再生要求を受信する。

　図２１のシーケンス図は、クライアント装置４００と各サーバとの間の通信の一例を示している。（１１）最初に、クライアント装置４００は、初期アクセスサーバ３０２にアクセスする。なお、クライアント装置４００は、初期アクセスサーバ３０２のＵＲＬを予め認識しているものとする。（１２）初期アクセスサーバ３０２は、クライアント装置４００からアクセスがあるとき、当該クライアント装置４００に、複数のビデオストリームの情報を含むＭＰＤファイルを送る。

　（１３）クライアント装置４００は、ＭＰＤファイルに含まれるサムネールサーバのＵＲＬの情報に基づいて、サムネールサーバ３０３にアクセスし、接続状態とする。（１４）当該サムネールサーバ３０３は、サムネール画像データを、クライアント装置４００に送信する。これにより、クライアント装置４００は、再生ビデオストリームを選択の便宜のために、ストレージサーバ３０４に格納されている複数のビデオストリームのサムネール画像データをディスプレイに表示した状態となる。

　（１５）ユーザ操作で再生ビデオストリームの選択がなされると、クライアント装置４００は、その再生ビデオストリームを識別するキャプチャデバイスＩＤおよびキャプチャビューＩＤの組み合わせを、ストレージサーバ３０４に送信する。（１６）そして、クライアント装置４００は、当該ストレージサーバ３０４から、選択された再生ビデオストリームを含むＭＰ４の配信ストリームを、ネットワークを通じて受信する。これにより、クライアント装置４００は、再生ビデオストリームによる画像の表示状態になる。

　上述したように、図１８に示すサーバシステム３０において、クライアント装置４００は、ユーザ操作で、再生ビデオストリームが選択されたとき、それを識別するキャプチャデバイスＩＤおよびキャプチャビューＩＤの組み合わせを含む再生要求を、ストレージサーバ３０４に送信する。そのため、クライアント装置４００は、所望のビデオストリームをストレージサーバ３０４から適切に提供を受けることができる。

　また、図１８に示すサーバシステム３０において、クライアント装置４００では、ユーザは、サムネール画像に基づいて再生ビデオストリームの選択を行うことができ、再生ビデオストリームの選択を容易かつ適切に行うことができる。

　＜３．変形例＞
　なお、上述実施の形態においては、コンテナがＭＰ４（ＩＳＯＢＭＦＦ）である例を示した。しかし、本技術は、コンテナがＭＰ４に限定されるものではなく、ＭＰＥＧ－２　ＴＳやＭＭＴなどの他のフォーマットのコンテナであっても同様に適用し得る。

　また、本技術は、以下のような構成を取ることもできる。
　（１）被写体を撮像して画像データを得る撮像部と、
　上記画像データで構成されるビデオストリームを含む所定フォーマットのコンテナをクライアント装置に送信する送信部を備え、
　上記ビデオストリームのレイヤおよび/または上記コンテナのレイヤに、上記撮像部における撮像状態を示すキャプチャ情報が挿入されている
　サーバ装置。
　（２）上記キャプチャ情報には、上記撮像部の撮像方向の情報が含まれる
　前記（１）に記載のサーバ装置。
　（３）上記キャプチャ情報には、上記撮像部のフォーカス距離の情報が含まれる
　前記（１）または（２）に記載のサーバ装置。
　（４）上記キャプチャ情報には、上記撮像部のズーム比の情報が含まれる
　前記（１）から（３）のいずれかに記載のサーバ装置。
　（５）上記ビデオストリームのレイヤおよび/または上記コンテナのレイヤに、自身のサーバ装置の位置を示す位置情報がさらに挿入されている
　前記（１）から（４）のいずれかに記載のサーバ装置。
　（６）上記位置情報は、ＧＰＳデータである
　前記（５）に記載のサーバ装置。
　（７）上記ビデオストリームのレイヤおよび/または上記コンテナのレイヤに、上記キャプチャ情報と上記位置情報の組み合わせを識別する識別情報、および自身のサーバ装置を識別する識別情報がさらに挿入されている
　前記（５）または（６）に記載のサーバ装置。
　（８）クライアント装置から上記撮像部における撮像状態を制御するための制御情報を受信する受信部と、
　上記制御情報に基づいて上記撮像部の撮像状態を制御する制御部をさらに備える
　前記（１）から（７）のいずれかに記載のサーバ装置。
　（９）撮像部が、被写体を撮像して画像データを得る撮像ステップと、
　送信部が、上記画像データで構成されるビデオストリームを含む所定フォーマットのコンテナをクライアント装置に送信する送信ステップを有し、
　上記ビデオストリームのレイヤおよび/または上記コンテナのレイヤに、上記撮像部における撮像状態を示すキャプチャ情報が挿入されている
　サーバ装置の送信処理方法。
　（１０）サーバ装置からビデオストリームを含む所定フォーマットのコンテナを受信する受信部を備え、
　上記ビデオストリームは、被写体を撮像部で撮像して得られた画像データで構成されており、
　上記ビデオストリームのレイヤおよび/または上記コンテナのレイヤに、上記撮像部の撮像状態を示すキャプチャ情報が挿入されており、
　上記ビデオストリームから表示用画像データを得る処理と、上記キャプチャ情報に基づいて上記撮像部の撮像状態を表示する処理と、上記撮像状態の表示を用いたユーザ操作に応じて上記撮像部の撮像状態の制御情報を得る処理と、該制御情報を上記サーバ装置に送信する処理を制御する制御部をさらに備える
　クライアント装置。
　（１１）上記ビデオストリームのレイヤおよび/または上記コンテナのレイヤに、上記サーバ装置の位置を示す位置情報がさらに挿入されており、
　上記制御部は、ユーザ操作に基づいて、上記サーバ装置とは異なる他のサーバ装置にアクセスするためのアクセス情報を得る処理と、該アクセス情報に基づいて上記他のサーバ装置にアクセスする処理をさらに制御する
　前記（１０）に記載のクライアント装置。
　（１２）上記アクセス情報は、上記他のサーバ装置のＵＲＬである
　前記（１１）に記載のクライアント装置。
　（１３）上記アクセス情報は、位置情報および該位置情報をＵＲＬに変換する変換サーバのＵＲＬである
　前記（１１）に記載のクライアント装置。
　（１４）受信部が、サーバ装置からビデオストリームを含む所定フォーマットのコンテナを受信する受信ステップを有し、
　上記ビデオストリームは、被写体を撮像部で撮像して得られた画像データで構成されており、
　上記ビデオストリームのレイヤおよび/または上記コンテナのレイヤに、上記撮像部の撮像状態を示すキャプチャ情報が挿入されており、
　制御部が、上記ビデオストリームから表示用画像データを得る処理と、上記キャプチャ情報に基づいて上記撮像部の撮像状態を表示する処理と、該撮像状態の表示を用いたユーザ操作に応じて上記撮像部の撮像状態の制御情報を得る処理と、該制御情報を上記サーバ装置に送信する処理を制御する制御ステップをさらに有する
　クライアント装置の受信処理方法。
　（１５）複数のサーバ装置とクライアント装置がネットワーク接続されてなるサーバシステムであって、
　上記サーバ装置は、
　被写体を撮像して画像データを得る撮像部と、
　上記画像データで構成されるビデオストリームを含む所定フォーマットのコンテナを上記クライアント装置に送信する送信部を備え、
　上記ビデオストリームのレイヤおよび/または上記コンテナのレイヤに、上記撮像部における撮像状態を示すキャプチャ情報が挿入されており、
　上記クライアント装置は、
　上記サーバ装置から上記所定フォーマットのコンテナを受信する受信部を備え、
　上記ビデオストリームから表示用画像データを得る処理と、上記キャプチャ情報に基づいて上記撮像部の撮像状態を表示する処理と、該撮像状態の表示を用いたユーザ操作に応じて上記撮像部の撮像状態の制御情報を得る処理と、該制御情報を上記サーバ装置に送信する処理を制御する制御部をさらに備える
　サーバシステム。
　（１６）上記ビデオストリームのレイヤおよび/または上記コンテナのレイヤに、上記サーバ装置の位置を示す位置情報がさらに挿入されており、
　上記制御部は、ユーザ操作に基づいて、上記サーバ装置とは異なる他のサーバ装置にアクセスするためのアクセス情報を得る処理と、該アクセス情報に基づいて上記他のサーバ装置にアクセスする処理をさらに制御する
　前記（１５）に記載のサーバシステム。
　（１７）撮像デバイスを識別するキャプチャデバイス識別情報と、上記撮像デバイスの位置情報および上記撮像デバイスの撮像状態情報の組み合わせを識別するキャプチャビュー識別情報とで識別される複数のビデオストリームを格納するストレージと、
　クライアント装置から上記キャプチャデバイス識別情報および上記キャプチャビュー識別情報で再生すべきビデオストリームが指定された再生要求を受信する受信部と、
　上記指定されたビデオストリームを上記ストレージから読み出し、該ビデオストリームを含む所定フォーマットのコンテナを上記クライアント装置に送信する送信部を備える
　サーバ装置。
　（１８）撮像デバイスを識別するキャプチャデバイス識別情報と、上記撮像デバイスの位置情報および上記撮像デバイスの撮像状態情報の組み合わせを識別するキャプチャビュー識別情報とで再生すべきビデオストリームを指定した再生要求をサーバ装置に送信する送信部と、
　上記サーバ装置から上記再生要求に対応したビデオストリームを含む所定フォーマットのコンテナを受信する受信部と、
　上記コンテナに含まれるビデオストリームから表示用画像データを得る処理部を備える
　クライアント装置。

　本技術の主な特徴は、メディアキャプチャ・ロケーションサーバが、ビデオストリームのレイヤおよび/またはコンテナのレイヤに、カメラ（撮像部）における撮像状態を示すキャプチャ情報を挿入して送信することで、クライアント装置では、このキャプチャ情報に基づいてメディアキャプチャ・ロケーションサーバのカメラ（撮像部）における撮像状態（撮像方向、フォーカス距離、ズーム比など）を容易に把握でき、メディアキャプチャ・ロケーションサーバの撮像状態を適切に制御可能としたことである（図１、図１１、図１３参照）。

　１０，３０・・・サーバシステム
　１０１・・・メディアキャプチャ・ロケーションサーバ
　１０２・・・初期アクセスサーバ
　１０３・・・ＧＰＳ_ＵＲＬマッピングサーバ
　１１１・・・コントローラ
　１１２・・・ロケータ
　１１３・・・キャプチャ
　１１４・・・ビデオエンコーダ
　１１５・・・コンテナエンコーダ
　１１６・・・ネットワークインタフェース
　１１７・・・バス
　２００・・・クライアント装置
　２１１・・・コントローラ
　２１２・・・ユーザ操作部
　２１３・・・メッセージコンバータ
　２１４・・・ネットワークインタフェース
　２１５・・・コンテナデコーダ
　２１６・・・ビデオデコーダ
　２１７・・・ビデオプロセッサ
　２１８・・・ディスプレイ
　２１９・・・バス
　３０１・・・メディアキャプチャ・ロケーションサーバ
　３０２・・・初期サーバ
　３０３・・・サムネール
　３０４・・・ストレージサーバ
　３１１・・・コントローラ
　３１２・・・ストレージ
　３１３・・・コンテナエンコーダ
　３１４・・・ネットワークインタフェース
　３１５・・・バス

Claims

　被写体を撮像して画像データを得る撮像部と、
　上記画像データで構成されるビデオストリームを含む所定フォーマットのコンテナをクライアント装置に送信する送信部を備え、
　上記ビデオストリームのレイヤおよび/または上記コンテナのレイヤに、上記撮像部における撮像状態を示すキャプチャ情報が挿入されている
　サーバ装置。
　上記キャプチャ情報には、上記撮像部の撮像方向の情報が含まれる
　請求項１に記載のサーバ装置。
　上記キャプチャ情報には、上記撮像部のフォーカス距離の情報が含まれる
　請求項１に記載のサーバ装置。
　上記キャプチャ情報には、上記撮像部のズーム比の情報が含まれる
　請求項１に記載のサーバ装置。
　上記ビデオストリームのレイヤおよび/または上記コンテナのレイヤに、自身のサーバ装置の位置を示す位置情報がさらに挿入されている
　請求項１に記載のサーバ装置。
　上記位置情報は、ＧＰＳデータである
　請求項５に記載のサーバ装置。
　上記ビデオストリームのレイヤおよび/または上記コンテナのレイヤに、上記キャプチャ情報と上記位置情報の組み合わせを識別する識別情報、および自身のサーバ装置を識別する識別情報がさらに挿入されている
　請求項５に記載のサーバ装置。
　クライアント装置から上記撮像部における撮像状態を制御するための制御情報を受信する受信部と、
　上記制御情報に基づいて上記撮像部の撮像状態を制御する制御部をさらに備える
　請求項１に記載のサーバ装置。
　撮像部が、被写体を撮像して画像データを得る撮像ステップと、
　送信部が、上記画像データで構成されるビデオストリームを含む所定フォーマットのコンテナをクライアント装置に送信する送信ステップを有し、
　上記ビデオストリームのレイヤおよび/または上記コンテナのレイヤに、上記撮像部における撮像状態を示すキャプチャ情報が挿入されている
　サーバ装置の送信処理方法。
　サーバ装置からビデオストリームを含む所定フォーマットのコンテナを受信する受信部を備え、
　上記ビデオストリームは、被写体を撮像部で撮像して得られた画像データで構成されており、
　上記ビデオストリームのレイヤおよび/または上記コンテナのレイヤに、上記撮像部の撮像状態を示すキャプチャ情報が挿入されており、
　上記ビデオストリームから表示用画像データを得る処理と、上記キャプチャ情報に基づいて上記撮像部の撮像状態を表示する処理と、上記撮像状態の表示を用いたユーザ操作に応じて上記撮像部の撮像状態の制御情報を得る処理と、該制御情報を上記サーバ装置に送信する処理を制御する制御部をさらに備える
　クライアント装置。
　上記ビデオストリームのレイヤおよび/または上記コンテナのレイヤに、上記サーバ装置の位置を示す位置情報がさらに挿入されており、
　上記制御部は、ユーザ操作に基づいて、上記サーバ装置とは異なる他のサーバ装置にアクセスするためのアクセス情報を得る処理と、該アクセス情報に基づいて上記他のサーバ装置にアクセスする処理をさらに制御する
　請求項１０に記載のクライアント装置。
　上記アクセス情報は、上記他のサーバ装置のＵＲＬである
　請求項１１に記載のクライアント装置。
　上記アクセス情報は、位置情報および該位置情報をＵＲＬに変換する変換サーバのＵＲＬである
　請求項１１に記載のクライアント装置。
　受信部が、サーバ装置からビデオストリームを含む所定フォーマットのコンテナを受信する受信ステップを有し、
　上記ビデオストリームは、被写体を撮像部で撮像して得られた画像データで構成されており、
　上記ビデオストリームのレイヤおよび/または上記コンテナのレイヤに、上記撮像部の撮像状態を示すキャプチャ情報が挿入されており、
　制御部が、上記ビデオストリームから表示用画像データを得る処理と、上記キャプチャ情報に基づいて上記撮像部の撮像状態を表示する処理と、該撮像状態の表示を用いたユーザ操作に応じて上記撮像部の撮像状態の制御情報を得る処理と、該制御情報を上記サーバ装置に送信する処理を制御する制御ステップをさらに有する
　クライアント装置の受信処理方法。
　複数のサーバ装置とクライアント装置がネットワーク接続されてなるサーバシステムであって、
　上記サーバ装置は、
　被写体を撮像して画像データを得る撮像部と、
　上記画像データで構成されるビデオストリームを含む所定フォーマットのコンテナを上記クライアント装置に送信する送信部を備え、
　上記ビデオストリームのレイヤおよび/または上記コンテナのレイヤに、上記撮像部における撮像状態を示すキャプチャ情報が挿入されており、
　上記クライアント装置は、
　上記サーバ装置から上記所定フォーマットのコンテナを受信する受信部を備え、
　上記ビデオストリームから表示用画像データを得る処理と、上記キャプチャ情報に基づいて上記撮像部の撮像状態を表示する処理と、該撮像状態の表示を用いたユーザ操作に応じて上記撮像部の撮像状態の制御情報を得る処理と、該制御情報を上記サーバ装置に送信する処理を制御する制御部をさらに備える
　サーバシステム。
　上記ビデオストリームのレイヤおよび/または上記コンテナのレイヤに、上記サーバ装置の位置を示す位置情報がさらに挿入されており、
　上記制御部は、ユーザ操作に基づいて、上記サーバ装置とは異なる他のサーバ装置にアクセスするためのアクセス情報を得る処理と、該アクセス情報に基づいて上記他のサーバ装置にアクセスする処理をさらに制御する
　請求項１５に記載のサーバシステム。
　撮像デバイスを識別するキャプチャデバイス識別情報と、上記撮像デバイスの位置情報および上記撮像デバイスの撮像状態情報の組み合わせを識別するキャプチャビュー識別情報とで識別される複数のビデオストリームを格納するストレージと、
　クライアント装置から上記キャプチャデバイス識別情報および上記キャプチャビュー識別情報で再生すべきビデオストリームが指定された再生要求を受信する受信部と、
　上記指定されたビデオストリームを上記ストレージから読み出し、該ビデオストリームを含む所定フォーマットのコンテナを上記クライアント装置に送信する送信部を備える
　サーバ装置。
　撮像デバイスを識別するキャプチャデバイス識別情報と、上記撮像デバイスの位置情報および上記撮像デバイスの撮像状態情報の組み合わせを識別するキャプチャビュー識別情報とで再生すべきビデオストリームを指定した再生要求をサーバ装置に送信する送信部と、
　上記サーバ装置から上記再生要求に対応したビデオストリームを含む所定フォーマットのコンテナを受信する受信部と、
　上記コンテナに含まれるビデオストリームから表示用画像データを得る処理部を備える
　クライアント装置。