WO2024057398A1

WO2024057398A1 - 提示映像調整装置、提示映像調整方法及び提示映像調整プログラム

Info

Publication number: WO2024057398A1
Application number: PCT/JP2022/034205
Authority: WO
Inventors: 麻衣子井元; 真二深津; 淳一中嶋; 馨亮長谷川
Original assignee: 日本電信電話株式会社
Priority date: 2022-09-13
Filing date: 2022-09-13
Publication date: 2024-03-21

Abstract

一実施形態では、提示映像調整装置は、映像提示装置を備える第１の拠点の装置であって、受信部と、レイアウト調整部と、を備える。受信部は、第１の拠点とは異なる複数の第２の拠点のそれぞれから、第１の拠点で第１の時刻に取得された第１の映像を第２の拠点で再生する時刻に第２の拠点で取得された第２の映像を格納したパケットを受信する。レイアウト調整部は、第２の拠点からの複数のパケットに基づく複数の第２の映像それぞれの、遅延時間、解像度及び映像乱れ、の三指標の内の少なくとも一つに基づいて、複数の第２の映像それぞれの映像提示装置での規定の提示レイアウト上の配置位置を決定し、決定した配置位置に従って複数の前記第２の映像を配置した第３の映像を映像提示装置に出力する。

Description

提示映像調整装置、提示映像調整方法及び提示映像調整プログラム

　この発明の一態様は、提示映像調整装置、提示映像調整方法及び提示映像調整プログラムに関する。

　近年、或る地点で撮影・収録された映像・音声をデジタル化して、ＩＰ（Internet Protocol）ネットワーク等の通信回線を介して遠隔地にリアルタイム伝送し、遠隔地で映像・音声を再生する、映像・音声再生装置が用いられるようになってきた。例えば、競技会場で行われているスポーツ競技試合の映像・音声やコンサート会場で行われている音楽コンサートの映像・音声を遠隔地にリアルタイム伝送するパブリックビューイング等が盛んに行われている。

　このような映像・音声の伝送は、１対１の一方向伝送に留まらず、双方向伝送も行われている。この双方向伝送では、例えば、スポーツ競技試合が行われている会場（以下、イベント会場と称する）である第１の拠点から映像・音声を遠隔地の複数の第２の拠点に伝送し、各第２の拠点において大型映像表示装置やスピーカから出力する。そして、それら複数の遠隔地でもそれぞれ観客がイベントを楽しんでいる映像や歓声等の音声を撮影・収録して、それらの映像・音声を折り返し映像・音声として、イベント会場である第１の拠点に伝送し、第１の拠点においてそれらを集約して、大型映像表示装置やスピーカから出力する。このような双方向での映像・音声の伝送により、イベント会場に居る選手（または演者）や観客、複数の遠隔地に居る視聴者らは、物理的に離れた場所に居るにも関わらず、あたかも同じ空間（イベント会場）に居て、同じ体験をしているかのような臨場感や一体感を得ることができる。

　遠隔地の第２の拠点で撮影・収録された観客の折り返し映像・音声は、既存のＷｅｂ会議サービスやビデオ会議サービスを用いることで、第１の拠点であるイベント会場で集約して出力することができる。複数映像の表示レイアウトの調整や映像切替えの自動化については、音声情報を活用する方法（例えば、非特許文献１を参照）、視線情報に基づく方法（例えば、非特許文献２を参照）等が存在する。

齋藤渓，橋本浩二，「マルチストリーミングの音声情報による画面調整機能」，情報処理学会第７９回全国大会講演論文集，２０１７（１），２０１７年３月，ｐ．５０７－５０８竹前嘉修，大塚和弘，武川直樹，「対面の複数人対話を撮影対象とした対話参加者の視線に基づく映像切替え方法とその効果」，情報処理学会論文誌，２００５年７月，ｖｏｌ．４６，Ｎｏ．７，ｐ．１７５２－１７６７

　ＩＰネットワークによる映像・音声のリアルタイム伝送では、ＲＴＰ（Real-time Transport Protocol）が用いられることが多い。２拠点間でのデータ伝送時間は、その２拠点をつなぐ通信回線等により異なる。例えば、イベント会場Ａで時刻Ｔに撮影・収録された映像・音声を２つの遠隔地Ｂ及び遠隔地Ｃに伝送し、遠隔地Ｂ及び遠隔地Ｃでそれぞれ撮影された映像をイベント会場Ａに折り返し伝送する場合を考える。遠隔地Ｂにおいてイベント会場Ａから伝送された、時刻Ｔに撮影・収録された映像・音声は、時刻Ｔ_b1に再生され、遠隔地Ｂで時刻Ｔ_b1に撮影された映像は、イベント会場Ａに折り返し伝送され、イベント会場Ａで時刻Ｔ_b2に再生される。また、遠隔地Ｃにおいては、イベント会場Ａで時刻Ｔに撮影・収録され伝送された映像・音声は、時刻Ｔ_c1（≠Ｔ_b1）に再生され、遠隔地Ｃで時刻Ｔ_c1に撮影された映像は、イベント会場Ａに折り返し伝送され、イベント会場Ａで時刻Ｔ_c2（≠Ｔ_b2）に再生される。

　このような通信遅延が有る場合、イベント会場Ａに居る選手（または演者）や観客にとっては、時刻Ｔに自分自身が体験した出来事に対して、複数の遠隔地に居る視聴者がどのような反応をしたかを示す折り返し映像を、それぞれ異なる時刻（時刻Ｔ_b2と時刻Ｔ_c2）で視聴することになる。例えば、コンサート会場において楽曲の或るフレーズで手を挙げる演出を行うときに、遠隔地に居る視聴者は手を挙げるタイミングがずれてしまう。このようなタイミングがずれた遠隔地の観客の折り返し映像を大型映像表示装置に出力すると、イベント会場Ａに居る選手（または演者）や観客にとっては、自分自身との体験とのつながりの直感的な判りづらさや不自然さ（違和感）を生じさせてしまい、遠隔地の観客との一体感を高め難いことが有る。

　また、通信遅延によるタイミングがずれた映像以外にも、解像度が低い若しくは乱れが生じている折り返し映像が視界に入ると、イベント会場Ａに居る選手（または演者）や観客の快適な視聴を阻害する原因となり得る。

　このようなイベント会場Ａに居る選手（または演者）や観客の視聴を阻害しないように、イベント会場Ａに遅れて到着した遠隔地の観客の折り返し映像を出力しないようにすることが考えられる。しかしながら、それでは、その出力から外された遠隔地の観客の満足度を低下させてしまう。そのため、何らか工夫して折り返し映像を出力することが望ましい（観客に優先度等付けず公平に扱う）。Ｗｅｂ会議やビデオ会議のように話者と聴者に分かれるわけではないため、非特許文献１及び２に開示されているような従来手法によるレイアウト調整は適用し難い。

　この発明は、上記事情に着目してなされたもので、その目的とするところは、複数の拠点から異なる時刻に伝送される複数の映像が再生されるときに視聴者が感じる違和感を低減させる技術を提供することにある。

　この発明の一実施形態では、提示映像調整装置は、映像提示装置を備える第１の拠点の装置であって、受信部と、レイアウト調整部と、を備える。受信部は、第１の拠点とは異なる複数の第２の拠点のそれぞれから、第１の拠点で第１の時刻に取得された第１の映像を第２の拠点で再生する時刻に第２の拠点で取得された第２の映像を格納したパケットを受信する。レイアウト調整部は、第２の拠点からの複数のパケットに基づく複数の第２の映像それぞれの、遅延時間、解像度及び映像乱れ、の三指標の内の少なくとも一つに基づいて、複数の第２の映像それぞれの映像提示装置での規定の提示レイアウト上の配置位置を決定し、決定した配置位置に従って複数の前記第２の映像を配置した第３の映像を映像提示装置に出力する。

　この発明の一態様によれば、複数の拠点から異なる時刻に伝送される複数の映像が再生されるときに視聴者が感じる違和感を低減させることができる。

図１は、第１の実施形態に係る提示映像調整システムに含まれる各電子機器のハードウェア構成の一例を示すブロック図である。図２は、第１の実施形態に係る提示映像調整システムを構成する各電子機器のソフトウェア構成の一例を示すブロック図である。図３は、第１の実施形態に係る拠点Ｏのサーバが備える映像情報格納部における時刻管理ＤＢのデータ構造の一例を示す図である。図４は、第１の実施形態に係る拠点Ｒ₁のサーバが備える映像時刻管理ＤＢのデータ構造の一例を示す図である。図５は、第１の実施形態に係る拠点Ｏにおけるサーバの処理手順と処理内容を示すフローチャートである。図６は、第１の実施形態に係る拠点Ｒ₁におけるサーバの処理手順と処理内容を示すフローチャートである。図７は、第１の実施形態に係る拠点Ｏにおけるサーバのメディア送信処理の処理手順と処理内容を示すフローチャートである。図８は、第１の実施形態に係る拠点Ｒ₁におけるサーバのメディア受信処理の処理手順と処理内容を示すフローチャートである。図９は、第１の実施形態に係る拠点Ｒ₁におけるサーバの映像オフセット算出処理の処理手順と処理内容を示すフローチャートである。図１０は、第１の実施形態に係る拠点Ｒ₁におけるサーバの折り返し映像送信処理の処理手順と処理内容を示すフローチャートである。図１１は、第１の実施形態に係る拠点Ｏにおけるサーバの折り返し映像受信処理の処理手順と処理内容を示すフローチャートである。図１２は、第１の実施形態に係る拠点Ｏにおけるサーバの折り返し映像レイアウト調整処理の処理手順と処理内容を示すフローチャートである。図１３は、通信遅延に基づく折り返し映像の提示レイアウトを説明するための模式図である。図１４は、折り返し映像の配置順番を説明するための模式図である。図１５は、図１４の配置順番での折り返し映像の配置例を説明するための模式図である。図１６は、第２の実施形態に係る提示映像調整システムに含まれる各電子機器のハードウェア構成の一例を示すブロック図である。図１７は、第２の実施形態に係る提示映像調整システムを構成する各電子機器のソフトウェア構成の一例を示すブロック図である。図１８は、第２の実施形態に係る拠点Ｏにおける折り返し映像提示装置と基準映像撮影装置と演者との位置関係を説明するための模式図である。図１９は、第２の実施形態に係る拠点Ｏにおける折り返し映像提示装置での演者の移動領域を説明するための模式図である。図２０は、第２の実施形態に係る拠点Ｏにおけるサーバの折り返し映像レイアウト調整処理の処理手順と処理内容を示すフローチャートである。図２１は、第２の実施形態に係る通信遅延に基づく折り返し映像の提示レイアウトを説明するための模式図である。図２２は、第２の実施形態に係る折り返し映像の配置順番での折り返し映像の配置例を説明するための模式図である。図２３は、第３の実施形態に係る拠点Ｏのサーバが備える解像度テーブルの一例を示す図である。

　以下、図面を参照して、この発明に係る幾つかの実施形態を説明する。

　競技会場又はコンサート会場等のイベント会場となる拠点Ｏにおいて映像・音声が撮影・収録された絶対時刻に対して一意に定まる時刻情報は、複数の遠隔地の拠点Ｒ₁～拠点Ｒ_n（ｎは２以上の整数）に伝送する映像・音声に付与される。拠点Ｒ₁～拠点Ｒ_nのそれぞれにおいて、当該時刻情報を持つ映像・音声が再生された時刻に撮影された映像は、当該時刻情報と対応付けられる。拠点Ｏにおいて、拠点Ｒ₁～拠点Ｒ_nのそれぞれから伝送される映像を再生するとき、当該時刻情報に基づいて決定される表示位置に各映像が配置されて再生させる。

　時刻情報は、拠点Ｏと拠点Ｒ₁～拠点Ｒ_nのそれぞれとの間で以下の何れかの手段により送受信される。時刻情報は、拠点Ｒ₁～拠点Ｒ_nのそれぞれで撮影された映像と対応付けられる。

　（１）時刻情報は、拠点Ｏと拠点Ｒ₁～拠点Ｒ_nのそれぞれとの間で送受信するＲＴＰパケットのヘッダ拡張領域に格納される。例えば、時刻情報は、絶対時刻形式（hh:mm:ss.fff形式）であるが、ミリ秒形式であっても良い。

　（２）時刻情報は、拠点Ｏと拠点Ｒ₁～拠点Ｒ_nのそれぞれとの間で一定の間隔で送受信されるＲＴＣＰ（RTP Control Protocol）におけるＡＰＰ（Application-Defined）を用いて記述される。この例では、時刻情報は、ミリ秒形式である。

　（３）時刻情報は、伝送開始時に拠点Ｏと拠点Ｒ₁～拠点Ｒ_nのそれぞれとの間でやり取りさせる初期値パラメータを記述するＳＤＰ（Session Description Protocol）に格納される。この例では、時刻情報は、ミリ秒形式である。

　［第１の実施形態］
　第１の実施形態では、拠点Ｏにおいて撮影・収録された映像及び音声は、１つのＲＴＰパケットにどちらも格納されて遠隔地の拠点Ｒ₁～拠点Ｒ_nに送信され、同様に、拠点Ｒ₁～拠点Ｒ_nから拠点Ｏへ折り返し伝送される映像についても、ＲＴＰパケット化して送信されるとして説明する。勿論、映像と音声は、それぞれＲＴＰパケット化して送信されても良い。映像及び音声は、メディアの一例である。

　また、拠点Ｏにおいて拠点Ｒ₁～拠点Ｒ_nから折り返し伝送される映像の配置位置を決定するために用いる時刻情報は、拠点Ｏと拠点Ｒ₁～拠点Ｒ_nのそれぞれとの間で送受信するＲＴＰパケットのヘッダ拡張領域に格納される。例えば、時刻情報は、絶対時刻形式（hh:mm:ss.fff形式）である。

　（構成例）
　図１は、第１の実施形態に係る提示映像調整システムＳに含まれる各電子機器のハードウェア構成の一例を示すブロック図である。

　提示映像調整システムＳは、拠点Ｏに含まれる複数の電子機器、拠点Ｒ₁～拠点Ｒ_nのそれぞれに含まれる複数の電子機器及び時刻配信サーバ１０を含む。各拠点の電子機器及び時刻配信サーバ１０は、ＩＰネットワークＮＷを介して互いに通信可能である。

　拠点Ｏは、サーバ１、映像撮影装置１０１、音声収録装置１０２及び折り返し映像提示装置１０３を備える。拠点Ｏは、第１の拠点の一例である。

　サーバ１は、拠点Ｏに含まれる各電子機器を制御する電子機器である。サーバ１は、提示映像調整装置の一例である。

　映像撮影装置１０１は、拠点Ｏの映像を撮影するカメラを含む装置である。映像撮影装置１０１は、複数のカメラを含んでいても良い。

　音声収録装置１０２は、拠点Ｏの音声を収録するマイクを含む装置である。音声収録装置１０２は、複数のマイクを含んでいても良い。

　折り返し映像提示装置１０３は、拠点Ｒ₁～拠点Ｒ_nのそれぞれから拠点Ｏに折り返し伝送される映像がレイアウト配置された映像を再生して表示する大型ディスプレイを含む装置である。例えば、ディスプレイは、液晶ディスプレイである。折り返し映像提示装置１０３は、映像提示装置の一例である。折り返し映像提示装置１０３は、例えば、コンサートでは、演奏者や歌唱者等の演者が立つステージの演者背面に設置されることができる。また、競技会場においては、競技者である選手とは離れた位置に折り返し映像提示装置１０３が設置される場合が多い。

　拠点Ｏのサーバ１の構成例について説明する。
　サーバ１は、制御部１１、プログラム記憶部１２、データ記憶部１３、通信インタフェース１４及び入出力インタフェース１５を備える。サーバ１が備える各要素は、バスを介して、互いに接続されている。

　制御部１１は、サーバ１の中枢部分に相当する。制御部１１は、中央処理ユニット（Central Processing Unit：ＣＰＵ）等のプロセッサを備える。プロセッサは、マルチコア／マルチスレッドのものであって良く、複数の処理を並行して実行することができる。制御部１１は、不揮発性のメモリ領域としてＲＯＭ（Read Only Memory）を備える。制御部１１は、揮発性のメモリ領域としてＲＡＭ（Random Access Memory）を備える。プロセッサは、ＲＯＭ又はプログラム記憶部１２に記憶されているプログラムをＲＡＭに展開する。プロセッサがＲＡＭに展開されるプログラムを実行することで、制御部１１は、後述する各機能部を実現する。制御部１１は、コンピュータを構成する。

　プログラム記憶部１２は、記憶媒体としてＨＤＤ（Hard Disk Drive）又はＳＳＤ（Solid State Drive）等の随時書込み及び読出しが可能な不揮発性メモリで構成される。プログラム記憶部１２は、各種制御処理を実行するために必要なプログラムを記憶する。例えば、プログラム記憶部１２は、制御部１１に実現される後述する各機能部による処理をサーバ１に実行させるプログラムを記憶する。プログラム記憶部１２は、ストレージの一例である。

　データ記憶部１３は、記憶媒体としてＨＤＤ、又はＳＳＤ等の随時書込み及び読出しが可能な不揮発性メモリで構成される。データ記憶部１３は、ストレージ又は記憶部の一例である。

　通信インタフェース１４は、ＩＰネットワークＮＷにより定義される通信プロトコルを使用して、サーバ１を他の電子機器と通信可能に接続する種々のインタフェースを含む。

　入出力インタフェース１５は、サーバ１と映像撮影装置１０１、音声収録装置１０２及び折り返し映像提示装置１０３のそれぞれとの通信を可能にするインタフェースである。入出力インタフェース１５は、有線通信のインタフェースを備えていても良いし、無線通信のインタフェースを備えていても良い。

　なお、サーバ１のハードウェア構成は、上述の構成に限定されるものではない。サーバ１は、適宜、上述の構成要素の省略、及び変更並びに新たな構成要素の追加を可能とする。

　拠点Ｒ₁は、サーバ２、映像提示装置２０１、音声提示装置２０２、オフセット映像撮影装置２０３及び折り返し映像撮影装置２０４を備える。拠点Ｒ₁は、第１の拠点とは異なる第２の拠点の一例である。

　サーバ２は、拠点Ｒ₁に含まれる各電子機器を制御する電子機器である。

　映像提示装置２０１は、拠点Ｏから拠点Ｒ₁に伝送される映像を再生して表示するディスプレイを含む装置である。

　音声提示装置２０２は、拠点Ｏから拠点Ｒ₁に伝送される音声を再生して出力するスピーカを含む装置である。

　オフセット映像撮影装置２０３は、撮影時刻を記録可能な装置である。オフセット映像撮影装置２０３は、映像提示装置２０１の映像表示領域全体を撮影できるように設置されたカメラを含む装置である。

　折り返し映像撮影装置２０４は、拠点Ｒ₁の映像を撮影するカメラを含む装置である。例えば、折り返し映像撮影装置２０４は、拠点Ｏから拠点Ｒ₁に伝送される映像を再生して表示する映像提示装置２０１の設置された拠点Ｒ₁で視聴する観客の様子の映像を撮影する。

　拠点Ｒ₁のサーバ２の構成例について説明する。
　サーバ２は、制御部２１、プログラム記憶部２２、データ記憶部２３、通信インタフェース２４及び入出力インタフェース２５を備える。サーバ２が備える各要素は、バスを介して、互いに接続されている。

　制御部２１は、拠点Ｏのサーバ１における制御部１１と同様に構成され得る。プロセッサは、ＲＯＭ、又はプログラム記憶部２２に記憶されているプログラムをＲＡＭに展開する。プロセッサがＲＡＭに展開されるプログラムを実行することで、制御部２１は、後述する各機能部を実現する。制御部２１は、コンピュータを構成する。

　プログラム記憶部２２は、拠点Ｏのサーバ１におけるプログラム記憶部１２と同様に構成され得る。

　データ記憶部２３は、拠点Ｏのサーバ１におけるデータ記憶部１３と同様に構成され得る。

　通信インタフェース２４は、拠点Ｏのサーバ１における通信インタフェース１４と同様に構成され得る。通信インタフェース２４は、サーバ２を他の電子機器と通信可能に接続する種々のインタフェースを含む。

　入出力インタフェース２５は、拠点Ｏのサーバ１における入出力インタフェース１５と同様に構成され得る。入出力インタフェース２５は、サーバ２と映像提示装置２０１、音声提示装置２０２、オフセット映像撮影装置２０３及び折り返し映像撮影装置２０４のそれぞれとの通信を可能にする。

　なお、サーバ２のハードウェア構成は、上述の構成に限定されるものではない。サーバ２は、適宜、上述の構成要素の省略、及び変更並びに新たな構成要素の追加を可能とする。

　拠点Ｒ₂～拠点Ｒ_nのそれぞれに含まれる複数の電子機器のハードウェア構成は、上述の拠点Ｒ₁と同様であるので、その説明を省略する。以下、拠点Ｒ₁～拠点Ｒ_nを区別して説明する必要が無い場合には、単に拠点Ｒと記載して説明するものとする。

　時刻配信サーバ１０は、基準システムクロックを管理する電子機器である。基準システムクロックは、絶対時刻である。

　図２は、第１の実施形態に係る提示映像調整システムＳを構成する各電子機器のソフトウェア構成の一例を示すブロック図である。

　拠点Ｏのサーバ１は、時刻管理部１１１、メディア送信部１１２、折り返し映像受信部１１３及び折り返し映像レイアウト調整部１１４を備える。各機能部は、制御部１１によるプログラムの実行によって実現される。各機能部は、制御部１１又はプロセッサが備えると言うこともできる。各機能部は、制御部１１又はプロセッサと読み替え可能である。各機能部は、また、ＡＳＩＣ（Application Specific Integrated Circuit）、ＤＳＰ（Digital Signal Processor）、ＦＰＧＡ（field-programmable gate array）、ＧＰＵ（Graphics Processing Unit）、等の集積回路を含む、他の多様な形式で実現されても良い。更に、サーバ１は、映像情報格納部１３１を備える。映像情報格納部１３１は、データ記憶部１３によって実現される。

　時刻管理部１１１は、時刻配信サーバ１０と公知のＮＴＰやＰＴＰ等のプロトコルを用いて時刻同期を行い、基準システムクロックを管理する。時刻管理部１１１は、拠点Ｒ₁～拠点Ｒ_nのそれぞれのサーバ２が管理する基準システムクロックと同一の基準システムクロックを管理する。時刻管理部１１１が管理する基準システムクロックと、サーバ２が管理する基準システムクロックとは、時刻同期している。

　メディア送信部１１２は、映像撮影装置１０１から出力される映像Ｖ_signal1と音声収録装置１０２から出力される音声Ａ_signal1とを格納したＲＴＰパケットを、ＩＰネットワークＮＷを介して、拠点Ｒ₁～拠点Ｒ_nのそれぞれのサーバに送信する。映像Ｖ_signal1は、拠点Ｏで絶対時刻である時刻Ｔ_mediaに取得された映像である。映像Ｖ_signal1を取得することは、映像撮影装置１０１が映像Ｖ_signal1を撮影することを含む。映像Ｖ_signal1を取得することは、映像撮影装置１０１が撮影した映像Ｖ_signal1をサンプリングすることを含む。音声Ａ_signal1は、拠点Ｏで絶対時刻である時刻Ｔ_mediaに取得された音声である。音声Ａ_signal1を取得することは、音声収録装置１０２が音声Ａ_signal1を収録することを含む。音声Ａ_signal1を取得することは、音声収録装置１０２が収録した音声Ａ_signal1をサンプリングすることを含む。

　映像Ｖ_signal1及び音声Ａ_signal1を格納したＲＴＰパケットは、時刻Ｔ_mediaを付与されている。時刻Ｔ_mediaは、拠点Ｏで映像Ｖ_signal1及び音声Ａ_signal1が取得された時刻である。時刻Ｔ_mediaは、拠点Ｏで折り返し映像の表示位置調整処理するための時刻情報である。映像Ｖ_signal1は、第１の映像の一例である。時刻Ｔ_mediaは、第１の時刻の一例である。ＲＴＰパケットは、パケットの一例である。

　折り返し映像受信部１１３は、ＩＰネットワークＮＷを介して、映像Ｖ_signal2を格納したＲＴＰパケットを拠点Ｒ₁～拠点Ｒ_nのそれぞれのサーバ２から受信する。映像Ｖ_signal2は、映像Ｖ_signal1を拠点Ｒ₁～拠点Ｒ_nの何れかの拠点で再生する時刻にこの拠点で取得された映像である。映像Ｖ_signal2を取得することは、該当する拠点Ｒの折り返し映像撮影装置２０４が映像Ｖ_signal2を撮影することを含む。映像Ｖ_signal2を取得することは、折り返し映像撮影装置２０４が撮影した映像Ｖ_signal2をサンプリングすることを含む。映像Ｖ_signal2を格納したＲＴＰパケットは、時刻Ｔ_mediaを付与されている。折り返し映像受信部１１３は、受信したＲＴＰパケットから時刻Ｔ_media及び映像Ｖ_signal2を取得し、それら取得した時刻Ｔ_mediaと映像Ｖ_signal2とを関連付けて、映像情報格納部１３１に確保した拠点Ｒ₁～拠点Ｒ_nそれぞれの映像格納領域に格納する。或いは、折り返し映像受信部１１３は、取得した時刻Ｔ_mediaと映像Ｖ_signal2とに、拠点Ｒ₁～拠点Ｒ_nの何れに対応するのかを示す識別子を関連付けて、映像情報格納部１３１に格納する。映像Ｖ_signal2は、第２の映像の一例である。また、折り返し映像受信部１１３は、受信部の一例である。

　更に、折り返し映像受信部１１３は、その映像Ｖ_signal2の取得時刻つまりＲＴＰパケットの受信時刻ｔ₂を、時刻Ｔ_mediaと関連付けて映像情報格納部１３１に格納する。例えば、映像情報格納部１３１は、上記ＲＴＰパケットの受信時刻ｔ₂と時刻Ｔ_mediaとを関連付けて格納するためのデータベースである時刻管理ＤＢ１３１１を備えることができる。図３は、この時刻管理ＤＢのデータ構造の一例を示す図である。時刻管理ＤＢ１３１１は、映像同期基準時刻カラムと拠点Ｒ₁～拠点Ｒ_nそれぞれの受信時刻カラムとを備える。映像同期基準時刻カラムは、時刻Ｔ_mediaを格納する。受信時刻カラムは、拠点Ｒ₁～拠点Ｒ_nそれぞれの受信時刻ｔ₂である受信時刻ｔ_{2_R1}～ｔ_{2_Rn}を格納する。

　折り返し映像レイアウト調整部１１４は、映像情報格納部１３１に格納された拠点Ｒ₁～拠点Ｒ_nそれぞれの映像Ｖ_signal2を一画面に配置した映像Ｖ_signal3を生成し、映像Ｖ_signal3を折り返し映像提示装置１０３に出力する。例えば、折り返し映像レイアウト調整部１１４は、拠点Ｒ₁～拠点Ｒ_nそれぞれの映像Ｖ_signal2について、関連付けられた時刻Ｔ_mediaと受信時刻ｔ₂との差分を算出し、それら差分により拠点Ｏと拠点Ｒ₁～拠点Ｒ_nそれぞれとの間の遅延時間つまり通信遅延量を判定する。そして、折り返し映像レイアウト調整部１１４は、通信遅延量が小さい映像Ｖ_signal2程、観客の視界に入り易い位置に配置されるように、一画面上の各映像Ｖ_signal2の配置順番及び配置位置を調整して、映像Ｖ_signal3を生成する。映像Ｖ_signal3は、第３の映像の一例である。また、折り返し映像レイアウト調整部１１４は、レイアウト調整部の一例である。

　拠点Ｒ₁のサーバ２は、時刻管理部２１１、メディア受信部２１２、映像オフセット算出部２１３及び折り返し映像送信部２１４を備える。各機能部は、制御部２１によるプログラムの実行によって実現される。各機能部は、制御部２１又はプロセッサが備えると言うこともできる。各機能部は、制御部２１又はプロセッサと読み替え可能である。各機能部は、制御部１１又はプロセッサと読み替え可能である。各機能部は、また、ＡＳＩＣ、ＤＳＰ、ＦＰＧＡ、ＧＰＵ、等の集積回路を含む、他の多様な形式で実現されても良い。更に、サーバ２は、映像時刻管理ＤＢ２３１を備える。映像時刻管理ＤＢ２３１は、データ記憶部２３によって実現される。

　時刻管理部２１１は、時刻配信サーバ１０と公知のＮＴＰやＰＴＰ等のプロトコルを用いて時刻同期を行い、基準システムクロックを管理する。時刻管理部２１１は、サーバ１が管理する基準システムクロックと同一の基準システムクロックを管理する。時刻管理部２１１が管理する基準システムクロックと、サーバ１が管理する基準システムクロックとは、時刻同期している。

　メディア受信部２１２は、ＩＰネットワークＮＷを介して、時刻Ｔ_mediaを付与された、映像Ｖ_signal1及び音声Ａ_signal1を格納したＲＴＰパケットをサーバ１から受信する。メディア受信部２１２は、受信したＲＴＰパケットから時刻Ｔ_media、映像Ｖ_signal1及び音声Ａ_signal1を取得する。メディア受信部２１２は、取得した映像Ｖ_signal1を映像提示装置２０１に出力し、取得した音声Ａ_signal1を音声提示装置２０２に出力する。また、メディア受信部２１２は、取得した時刻Ｔ_media及び映像Ｖ_signal2を映像オフセット算出部２１３に出力する。

　映像オフセット算出部２１３は、映像提示装置２０１で映像Ｖ_signal1が再生された絶対時刻である提示時刻ｔ₁を算出する。例えば、映像オフセット算出部２１３は、公知の画像処理技術を用いて、オフセット映像撮影装置２０３で撮影した映像の中から、メディア受信部２１２から出力された映像Ｖ_signal1を含む映像フレームをオフセット映像撮影装置２０３で撮影した映像の中から抽出する。映像オフセット算出部２１３は、この抽出した映像フレームに付与されている撮影時刻を提示時刻ｔ₁として取得する。そして、映像オフセット算出部２１３は、メディア受信部２１２から出力された時刻Ｔ_mediaとこの取得した提示時刻ｔ₁とを関連付けて映像時刻管理ＤＢ２３１に格納する。

　図４は、第１の実施形態に係る拠点Ｒ₁のサーバ２が備える映像時刻管理ＤＢ２３１のデータ構造の一例を示す図である。映像時刻管理ＤＢ２３１は、時刻Ｔ_mediaと提示時刻ｔ₁とを関連付けて格納するデータベースである。映像時刻管理ＤＢ２３１は、映像同期基準時刻カラムと提示時刻カラムとを備える。映像同期基準時刻カラムは、時刻Ｔ_mediaを格納する。提示時刻カラムは、提示時刻ｔ₁を格納する。

　折り返し映像送信部２１４は、ＩＰネットワークＮＷを介して、折り返し映像撮影装置２０４が撮影した映像Ｖ_signal2を格納したＲＴＰパケットをサーバ１に送信する。この際、折り返し映像送信部２１４は、映像時刻管理ＤＢ２３１から、映像Ｖ_signal2が撮影された絶対時刻である時刻ｔと一致する提示時刻ｔ₁に関連付けられた時刻Ｔ_mediaを読み出し、その時刻Ｔ_mediaを、映像Ｖ_signal2を格納したＲＴＰパケットに付与する。

　なお、拠点Ｒ₂～拠点Ｒ_nの各サーバは、拠点Ｒ₁のサーバ２と同様の機能部及びＤＢを含み、拠点Ｒ₁のサーバ２と同様の処理を実行する。拠点Ｒ₂～拠点Ｒ_nの各サーバに含まれる機能部の処理フローやＤＢ構造の説明は省略する。

　（動作例）
　以下では、拠点Ｏ及び拠点Ｒ₁の動作を例にして説明する。拠点Ｒ₂～拠点Ｒ_nの動作は、拠点Ｒ₁の動作と同様であって良く、その説明を省略する。拠点Ｒ₁の表記は、拠点Ｒ₂～拠点Ｒ_nと読み替えても良い。

　拠点Ｏにおけるサーバ１の処理について説明する。図５は、第１の実施形態に係る拠点Ｏにおけるサーバ１の処理手順と処理内容を示すフローチャートである。サーバ１は、イベント会場のリアルタイム伝送を実施している間、このフローチャートに示す処理を繰り返し実行する。

　メディア送信部１１２は、ＩＰネットワークＮＷを介して、映像Ｖ_signal1及び音声Ａ_signal1を格納したＲＴＰパケットを拠点Ｒ₁～拠点Ｒ_nそれぞれのサーバ２に送信するメディア送信処理を実行する（ステップＳ１１）。このメディア送信処理の典型例については後述する。

　折り返し映像受信部１１３は、ステップＳ１１のメディア送信処理と併行して、折り返し映像受信処理を実行する（ステップＳ１２）。この折り返し映像受信処理は、ＩＰネットワークＮＷを介して、映像Ｖ_signal2を格納したＲＴＰパケットを拠点Ｒ₁～拠点Ｒ_nそれぞれのサーバ２から受信する処理である。この折り返し映像受信処理の典型例については後述する。

　折り返し映像レイアウト調整部１１４は、ステップＳ１１のメディア送信処理及びステップＳ１２の折り返し映像受信処理と併行して、折り返し映像レイアウト調整処理を実行する（ステップＳ１３）。この折り返し映像レイアウト調整処理は、折り返し映像受信部１１３により拠点Ｒ₁～拠点Ｒ_nそれぞれから受信した映像Ｖ_signal2の例えば遅延時間に基づいて、それら複数の映像Ｖ_signal2の折り返し映像提示装置１０３での規定の提示レイアウト上の配置位置を決定し、決定した配置位置に従って複数の映像Ｖ_signal2を配置した映像Ｖ_signal3を生成して、折り返し映像提示装置１０３に出力する処理である。この折り返し映像レイアウト調整処理の典型例については後述する。

　拠点Ｒ₁におけるサーバ２の処理について説明する。図６は、第１の実施形態に係る拠点Ｒ₁におけるサーバ２の処理手順と処理内容を示すフローチャートである。サーバ２は、イベント会場での競技会場やコンサートのリアルタイム伝送の実施中、このフローチャートに示す処理を繰り返し実行することができる。

　メディア受信部２１２は、ＩＰネットワークＮＷを介して、映像Ｖ_signal1及び音声Ａ_signal1を格納したＲＴＰパケットをサーバ１から受信するメディア受信処理を実行する（ステップＳ２１）。このメディア受信処理の典型例については後述する。

　映像オフセット算出部２１３は、映像提示装置２０１で映像Ｖ_signal1が再生された提示時刻ｔ₁を算出する映像オフセット算出処理を実行する（ステップＳ２２）。この映像オフセット算出処理の典型例については後述する。

　折り返し映像送信部２１４は、ＩＰネットワークＮＷを介して、映像Ｖ_signal2を格納したＲＴＰパケットをサーバ１に送信する折り返し映像送信処理を実行する（ステップＳ２３）。この折り返し映像送信処理の典型例については後述する。

　以下では、上述のサーバ１のステップＳ１１～ステップＳ１３の処理及び上述のサーバ２のステップＳ２１～ステップＳ２３の処理のそれぞれの典型例について説明する。時系列に沿った処理順で説明するため、サーバ１のステップＳ１１の処理、サーバ２のステップＳ２１の処理、サーバ２のステップＳ２２の処理、サーバ２のステップＳ２３の処理、サーバ１のステップＳ１２の処理、サーバ１のステップＳ１３の処理の順に説明する。

　図７は、第１の実施形態に係る拠点Ｏにおけるサーバ１のメデイア送信処理の処理手順と処理内容を示すフローチャートである。図７は、ステップＳ１１の処理の典型例を示す。

　メディア送信部１１２は、映像撮影装置１０１から出力される映像Ｖ_signal1を一定の間隔Ｉ_videoで取得する（ステップＳ１１１）。

　メディア送信部１１２は、このステップＳ１１１の処理と併行して、音声収録装置１０２から出力される音声Ａ_signal1を一定の間隔Ｉ_videoで取得する（ステップＳ１１２）。

　メディア送信部１１２は、映像Ｖ_signal1及び音声Ａ_signal1を格納したＲＴＰパケットを生成する（ステップＳ１１３）。ステップＳ１１３では、例えば、メディア送信部１１２は、ステップＳ１１１で取得した映像Ｖ_signal1とステップＳ１１２で取得した音声Ａ_signal1とをＲＴＰパケットに格納する。メディア送信部１１２は、更に、時刻管理部１１１で管理される基準システムクロックから、映像Ｖ_signal1を取得した絶対時刻である時刻Ｔ_mediaを取得する。メディア送信部１１２は、取得した時刻Ｔ_mediaをＲＴＰパケットのヘッダ拡張領域に格納する。

　メディア送信部１１２は、ステップＳ１１３で生成した映像Ｖ_signal1及び音声Ａ_signal1を格納したＲＴＰパケットをＩＰネットワークＮＷに送出する（ステップＳ１１４）。

　図８は、第１の実施形態に係る拠点Ｒ₁におけるサーバ２のメディア受信処理の処理手順と処理内容を示すフローチャートである。図８は、サーバ２のステップＳ２１の処理の典型例を示す。

　メディア受信部２１２は、ＩＰネットワークＮＷを介して、メディア送信部１１２から送出される映像Ｖ_signal1及び音声Ａ_signal1を格納したＲＴＰパケットを受信する（ステップＳ２１１）。

　メディア受信部２１２は、受信した映像Ｖ_signal1及び音声Ａ_signal1を格納したＲＴＰパケットに格納されている映像Ｖ_signal1を取得する（ステップＳ２１２）。そして、メディア受信部２１２は、その取得した映像Ｖ_signal1を映像提示装置２０１に出力する（ステップＳ２１３）。映像提示装置２０１は、映像Ｖ_signal1を再生して表示する。

　メディア受信部２１２は、ステップＳ２１２の処理と併行して、受信した映像Ｖ_signal1及び音声Ａ_signal1を格納したＲＴＰパケットに格納されている音声Ａ_signal1を取得する（ステップＳ２１４）。そして、メディア受信部２１２は、その取得した音声Ａ_signal1を音声提示装置２０２に出力する（ステップＳ２１５）。音声提示装置２０２は、音声Ａ_signal1を再生して出力する。

　メディア受信部２１２は、上記ステップＳ２１１で受信した映像Ｖ_signal1及び音声Ａ_signal1を格納したＲＴＰパケットのヘッダ拡張領域に格納されている時刻Ｔ_mediaを取得する（ステップＳ２１６）。

　メディア受信部２１２は、その取得した時刻Ｔ_mediaを、上記ステップＳ２１２で取得した映像Ｖ_signal1と共に映像オフセット算出部２１３に受け渡す（ステップＳ２１７）。

　図９は、第１の実施形態に係る拠点Ｒ₁におけるサーバ２の映像オフセット算出処理の処理手順と処理内容を示すフローチャートである。図９は、サーバ２のステップＳ２２の処理の典型例を示す。

　映像オフセット算出部２１３は、映像Ｖ_signal1及び時刻Ｔ_mediaをメディア受信部２１２から取得する（ステップＳ２２１）。

　映像オフセット算出部２１３は、取得した映像Ｖ_signal1及びオフセット映像撮影装置２０３から入力される映像に基づき、提示時刻ｔ₁を算出する（ステップＳ２２２）。ステップＳ２２２では、例えば、映像オフセット算出部２１３は、オフセット映像撮影装置２０３で撮影した映像の中から公知の画像処理技術を用いて映像Ｖ_signal1を含む映像フレームを抽出する。映像オフセット算出部２１３は、抽出した映像フレームに付与されている撮影時刻を提示時刻ｔ₁として取得する。撮影時刻は、絶対時刻である。

　映像オフセット算出部２１３は、取得した時刻Ｔ_mediaを映像時刻管理ＤＢ２３１の映像同期基準時刻カラムに格納する（ステップＳ２２３）。

　映像オフセット算出部２１３は、取得した提示時刻ｔ₁を映像時刻管理ＤＢ２３１の提示時刻カラムに格納する（ステップＳ２２４）。

　図１０は、第１の実施形態に係る拠点Ｒ₁におけるサーバ２の折り返し映像送信処理の処理手順と処理内容を示すフローチャートである。図１０は、サーバ２のステップＳ２３の処理の典型例を示す。

　折り返し映像送信部２１４は、折り返し映像撮影装置２０４から出力される映像Ｖ_signal2を一定の間隔Ｉ_videoで取得する（ステップＳ２３１）。映像Ｖ_signal2は、映像提示装置２０１が映像Ｖ_signal1を拠点Ｒ₁で再生する時刻に拠点Ｒ₁で取得された映像である。

　折り返し映像送信部２１４は、取得した映像Ｖ_signal2が撮影された絶対時刻である時刻ｔを算出する（ステップＳ２３２）。ステップＳ２３２では、例えば、折り返し映像送信部２１４は、映像Ｖ_signal2に撮影時刻を表すタイムコードＴ_c（絶対時刻）が付与されている場合、ｔ＝Ｔ_cとして、時刻ｔを取得する。映像Ｖ_signal2にタイムコードＴ_cが付与されていない場合、折り返し映像送信部２１４は、時刻管理部２１１で管理される基準システムクロックから、現在時刻Ｔ_nを取得する。折り返し映像送信部２１４は、予め決めておいた所定値ｔ_{video_offset}（正の数）を用いて、ｔ＝Ｔ_n－ｔ_{video_offset}として、時刻ｔを取得する。

　折り返し映像送信部２１４は、映像時刻管理ＤＢ２３１を参照し、取得した時刻ｔと一致する時刻ｔ₁を持つレコードを抽出する（ステップＳ２３３）。

　折り返し映像送信部２１４は、映像時刻管理ＤＢ２３１を参照し、抽出したレコードの映像同期基準時刻カラムの時刻Ｔ_mediaを取得する（ステップＳ２３４）。

　折り返し映像送信部２１４は、映像Ｖ_signal2を格納したＲＴＰパケットを生成する（ステップＳ２３５）。ステップＳ２３５では、例えば、折り返し映像送信部２１４は、取得した映像Ｖ_signal2をＲＴＰパケットに格納する。折り返し映像送信部２１４は、取得した時刻Ｔ_mediaをＲＴＰパケットのヘッダ拡張領域に格納する。

　折り返し映像送信部２１４は、生成した映像Ｖ_signal2を格納したＲＴＰパケットをＩＰネットワークＮＷに送出する（ステップＳ２３６）。

　図１１は、第１の実施形態に係る拠点Ｏにおけるサーバ１の折り返し映像受信処理の処理手順と処理内容を示すフローチャートである。図１１は、サーバ１のステップＳ１２の処理の典型例を示す。

　折り返し映像受信部１１３は、ＩＰネットワークＮＷを介して、拠点Ｒ₁～拠点Ｒ_nそれぞれの折り返し映像送信部２１４から送出される映像Ｖ_signal2を格納したＲＴＰパケットを受信する（ステップＳ１２１）。

　折り返し映像受信部１１３は、時刻管理部１１１で管理される基準システムクロックから、現在時刻Ｔ_nを、受信時刻ｔ₂として取得する（ステップＳ１２２）。

　折り返し映像受信部１１３は、受信した映像Ｖ_signal2を格納したＲＴＰパケットに格納されている映像Ｖ_signal2を取得する（ステップＳ１２３）。

　折り返し映像受信部１１３は、受信した映像Ｖ_signal2を格納したＲＴＰパケットのヘッダ拡張領域に格納されている時刻Ｔ_mediaを取得する（ステップＳ１２４）。

　折り返し映像受信部１１３は、これら取得した受信時刻ｔ₂、映像Ｖ_signal2及び時刻Ｔ_mediaを映像情報格納部１３１に格納する（ステップＳ１２５）。

　図１２は、第１の実施形態に係る拠点Ｏにおけるサーバ１の折り返し映像レイアウト調整処理の処理手順と処理内容を示すフローチャートである。図１２は、サーバ１のステップＳ１３の処理の典型例を示す。

　折り返し映像レイアウト調整部１１４は、拠点Ｒ₁～拠点Ｒ_nそれぞれの映像Ｖ_signal2の遅延時間を算出する（ステップＳ１３１）。例えば、折り返し映像レイアウト調整部１１４は、拠点Ｒ₁～拠点Ｒ_nそれぞれについて、映像情報格納部１３１の時刻管理ＤＢ１３１１に格納されている最新の受信時刻ｔ₂と、それに関連付けられた映像同期基準時刻である時刻Ｔ_mediaと、を取得する。この受信時刻ｔ₂は、折り返し映像受信部１１３により映像Ｖ_signal2を格納したＲＴＰパケットを受信したことに伴う時刻である。受信時刻ｔ₂は、映像Ｖ_signal2に基づき生成される映像Ｖ_signal3の再生時刻と言うこともできる。映像Ｖ_signal2を格納したＲＴＰパケットを受信したことに伴う受信時刻ｔ₂は、第２の時刻の一例である。折り返し映像レイアウト調整部１１４は、取得した受信時刻ｔ₂と時刻Ｔ_mediaとの差の値、つまり（ｔ₂－Ｔ_media）（ｍｓ）を、遅延時間として算出する。この遅延時間は、拠点Ｏと拠点Ｒとの間の往復の伝送遅延時間である。例えば、図３に示した例では、時刻Ｔ_mediaが「9:00:00.040」の映像Ｖ_signal2が最新の折り返し映像であるとするならば、拠点Ｒ₁の遅延時間は「9:00:02.040－9:00:00.040」であるので「2000（ｍｓ）」、拠点Ｒ₂の遅延時間は「9:00:06.040－9:00:00.040」であるので「6000（ｍｓ）」、拠点Ｒ_nの遅延時間は「9:00:10.040－9:00:00.040」であるので「10000（ｍｓ）」となる。

　折り返し映像レイアウト調整部１１４は、算出した拠点Ｒ₁～拠点Ｒ_nそれぞれの遅延時間が小さい順に拠点Ｒをソートする（ステップＳ１３２）。例えば、図３の例では、拠点Ｒ₁、Ｒ₂、Ｒ_nの順番となる。

　折り返し映像レイアウト調整部１１４は、ソートした順番に、その拠点Ｒの最新の映像Ｖ_signal2を規定の提示レイアウト上に配置する配置位置を決定する（ステップＳ１３３）。人間の目の解像度は高くないため、互いに遠くに配置された複数の折り返し映像を同時に認識することは難しい（どちらかがぼやけて見える）。従って、近くに配置された（視界に入る）複数映像の中に特異な映像が無ければ、違和感を覚え難い。よって、イベント会場の観客の視界に入り易い領域に遅延時間が短い折り返し映像を配置すれば、遅延時間の大きさによる違和感を与え難くすることができる。

　図１３は、通信遅延に基づく折り返し映像の提示レイアウトを説明するための模式図である。一般的に、コンサートでは、演奏者や歌唱者等の演者は、ステージＳＴ上の中央に居る時間が最も多い。よって、コンサート会場の観客は、ステージＳＴの背面に設置された折り返し映像提示装置１０３の映像表示領域ＤＡにおける中央領域ＣＡ付近を見ることが多い。また、競技会場においては、競技者である選手とは離れた位置に折り返し映像提示装置１０３が設置される場合が多く、競技者との位置関係に相関が低い。このような折り返し映像提示装置１０３においても、多くの観客は、映像表示領域ＤＡの端部分ではなくて中央領域ＣＡ付近を見ると想定される。そこで、この中央領域ＣＡに遅延量が小さい折り返し映像を配置し、中央領域ＣＡから離れるに従って遅延量が大きい折り返し映像を配置するようにすれば、拠点Ｒからの折り返し映像それぞれの時間のズレにより生じる観客の違和感を低減させることができる。中央領域ＣＡは、映像提示装置の中央部の一例である。

　図１４は、折り返し映像の配置順番を説明するための模式図であり、図１５は、図１４の配置順番での折り返し映像の配置例を説明するための模式図である（拠点Ｒの数ｎ＝５４の場合）。本実施形態では、中央領域ＣＡの中心に、ステップＳ１３２でソートした最も遅延時間が小さい拠点Ｒの折り返し映像を配置し、演者移動領域ＰＡの近くに遅延時間の小さい折り返し映像が配置されるように、例えば同心円状（放射線状）の折り返し映像のレイアウト配置を採用する。このレイアウト配置は、提示レイアウトの一例である。

　折り返し映像レイアウト調整部１１４は、映像情報格納部１３１から、ステップＳ１３２でソートした順番に従って最新の映像Ｖ_signal2を読み出し、それら読み出した拠点Ｒ₁～拠点Ｒ_nそれぞれの映像Ｖ_signal2をこのレイアウト配置における順番で配置していくことで、映像Ｖ_signal3を生成する（ステップＳ１３４）。

　折り返し映像レイアウト調整部１１４は、生成した映像Ｖ_signal3を折り返し映像提示装置１０３に出力する（ステップＳ１３５）。折り返し映像提示装置１０３は、拠点Ｒ₁～拠点Ｒ_nそれぞれから拠点Ｏに折り返し伝送される映像Ｖ_signal2に基づく映像Ｖ_signal3を再生して表示する。

　（効果）
　以上述べたように第１の実施形態では、サーバ１は、複数の拠点Ｒからの複数の映像Ｖ_signal2それぞれの遅延時間に基づいて、複数の映像Ｖ_signal2の折り返し映像提示装置１０３での提示レイアウト上の配置位置を決定し、その決定した配置位置に各映像Ｖ_signal2を配置した映像Ｖ_signal3を生成する。イベント会場の観客は折り返し映像提示装置１０３の映像表示領域ＤＡにおける中央領域ＣＡ付近を見ることが多い。よって、典型例では、サーバ１は、遅延時間が小さい映像Ｖ_signal2程、中央領域ＣＡの中心に配置し、遅延時間が大きくなるにつれてその映像Ｖ_signal2が中央領域ＣＡから離れるように配置する。このように、サーバ１は、映像Ｖ_signal2を表示するための遅延時間と観客の視界に対応する中央領域ＣＡとに基づいて、各拠点Ｒからの映像Ｖ_signal2を表示する位置を調整することができる。近くに配置された複数映像の中に特異な映像が無ければ、人は違和感を覚え難いので、サーバ１は、イベント会場の観客の視界に入り易い領域に遅延時間が短い折り返し映像を配置することで、折り返し映像それぞれの時間のズレにより生じる観客の違和感を低減させることができる。

　このように、サーバ１は、複数の拠点Ｒから異なる時刻に伝送される複数の映像Ｖ_signal2が再生されるときに、遅延時間が大きい映像Ｖ_signal2は、目立たなくなるような位置に配置することで、拠点Ｏの視聴者である観客が感じる違和感を低減させることができる。

　更に、サーバ１は、遅延時間が大きい環境で視聴する拠点Ｒの観客を撮影した折り返し映像を、他の拠点Ｒの観客を撮影した折り返し映像と一緒に折り返し映像提示装置１０３に表示させる。従って、遅延時間が大きい環境で視聴する拠点Ｒの観客を撮影した折り返し映像は表示しないというようなことは無く、全ての拠点Ｒの顧客を差別化せずに折り返し映像を表示させることで、拠点Ｒの観客の満足度を下げてしまうのを防ぐことができる。

　［第２の実施形態］
　特に音楽コンサート等のイベント会場では、観客は演者に注目する。演者は、ステージＳＴ上を移動する場合が有る。そこで、第２の実施形態では、この演者の移動に伴って、遅延時間に応じた折り返し映像Ｖ_signal2の配置位置を調整する。

　以下、第１の実施形態と同様の構成及び処理には第１の実施形態と同様の参照符号を付すことでその説明を省略し、第１の実施形態とは異なる部分について説明する。

　（構成例）
　図１６は、第２の実施形態に係る提示映像調整システムＳに含まれる各電子機器のハードウェア構成の一例を示すブロック図である。また、図１７は、第２の実施形態に係る提示映像調整システムＳを構成する各電子機器のソフトウェア構成の一例を示すブロック図である。

　拠点Ｏは、サーバ１、映像撮影装置１０１、音声収録装置１０２及び折り返し映像提示装置１０３に加えて、基準映像撮影装置１０４を備える。

　基準映像撮影装置１０４は、折り返し映像提示装置１０３の映像表示領域を撮影できるように設置されたカメラを含む装置である。基準映像撮影装置１０４は、複数のカメラを含んでいても良い。また、基準映像撮影装置１０４が含むカメラは、映像撮影装置１０１が含むカメラを兼用するものとしても良い。

　図１８は、折り返し映像提示装置１０３と基準映像撮影装置１０４と演者ＰＬとの位置関係を説明するための模式図である。折り返し映像提示装置１０３は、例えば、ステージＳＴ上の演奏者や歌唱者等の演者ＰＬの背面に、その映像表示領域ＤＡが観客側となるように配置される。そして、基準映像撮影装置１０４のカメラは、このステージＳＴ全体を撮影できるように設置され、基準映像撮影装置１０４は、ステージＳＴ上の演者ＰＬと共に、その背後の折り返し映像提示装置１０３の映像表示領域ＤＡを撮影する。

　図１９は、折り返し映像提示装置１０３の映像表示領域ＤＡに対する演者移動領域ＰＡを説明するための模式図である。演者ＰＬがステージＳＴ上を移動すると、その演者ＰＬ、例えば演者ＰＬの上半身、を見つめるコンサート会場内の観客の視界は、演者ＰＬの移動に伴って移動していく。演者移動領域ＰＡは、この観客の視界の移動範囲を、折り返し映像提示装置１０３の映像表示領域ＤＡに投影した範囲である。映像表示領域ＤＡは、映像提示装置の提示面の一例である。演者ＰＬは移動物体の一例である。演者移動領域ＰＡは、移動物体の移動領域の一例である。

　サーバ１が備える折り返し映像レイアウト調整部１１４は、基準映像撮影装置１０４が撮影した映像に対して既知の移動物体検出手法を用いて、折り返し映像提示装置１０３の前面に居る演者ＰＬを検出することで、折り返し映像提示装置１０３の映像表示領域ＤＡにおける演者移動領域ＰＡを推定する。この演者移動領域ＰＡは、観客の視界に入り易い領域である。折り返し映像レイアウト調整部１１４は、通信遅延量が小さい映像Ｖ_signal2程、観客の視界に入り易い位置に配置されるように、一画面上の各映像Ｖ_signal2の配置順番及び配置位置を調整して、映像Ｖ_signal3を生成する。

　（動作例）
　図２０は、第１の実施形態に係る拠点Ｏにおけるサーバ１の折り返し映像レイアウト調整処理の処理手順と処理内容を示すフローチャートである。図２０は、サーバ１のステップＳ１３の処理の典型例を示す。

　折り返し映像レイアウト調整部１１４は、基準映像撮影装置１０４から、ステージＳＴ全体を撮影した基準映像を取得する（ステップＳ１３６）。

　折り返し映像レイアウト調整部１１４は、この取得した基準映像に基づいて、折り返し映像提示装置１０３の映像表示領域ＤＡ上の、演者（１人以上）ＰＬの移動範囲に対応する領域である演者移動領域ＰＡを推定する（ステップＳ１３７）。この推定には、例えば、周知の移動物体の検出方法である、背景差分法や骨格推定法（上半身の移動領域だけを推定する場合には有効）を用いることができる。

　以下、第１の実施形態と同様に、折り返し映像レイアウト調整部１１４は、拠点Ｒ₁～拠点Ｒ_nそれぞれの映像Ｖ_signal2の遅延時間を算出し（ステップＳ１３１）、算出した拠点Ｒ₁～拠点Ｒ_nそれぞれの遅延時間が小さい順に拠点Ｒをソートする（ステップＳ１３２）。

　折り返し映像レイアウト調整部１１４は、ソートした順番に、その拠点Ｒの最新の映像Ｖ_signal2を規定の提示レイアウト上に配置する配置位置を決定する（ステップＳ１３３）。第２の実施形態においては、規定の提示レイアウトは、固定の中央領域ＣＡではなく、演者ＰＬの移動に伴って変化する演者移動領域ＰＡを含む。コンサートは、ステージＳＴ上の演者ＰＬに視線が集中し易い状況であるため、コンサート会場の観客の視界に入り易い領域に遅延時間が短い折り返し映像を配置すれば、遅延時間の大きさによる違和感を与え難くすることができる。

　図２１は、通信遅延に基づく折り返し映像の提示レイアウトを説明するための模式図である。折り返し映像提示装置１０３において各拠点Ｒからの折り返し映像が表示される映像表示領域ＤＡの内、上記ステップＳ１３７で推定した演者移動領域ＰＡは、観客の視界に入り易い領域である。そこで、この演者移動領域ＰＡに遅延量が小さい折り返し映像を配置し、演者移動領域ＰＡから離れるに従って遅延量が大きい折り返し映像を配置するようにすれば、拠点Ｒからの折り返し映像それぞれの時間のズレにより生じる観客の違和感を低減させることができる。

　図２２は、折り返し映像の配置順番での折り返し映像の配置例を説明するための模式図である（拠点Ｒの数ｎ＝５４の場合）。第２の実施形態では、ステップＳ１３７で推定した演者移動領域ＰＡの中心に、ステップＳ１３２でソートした最も遅延時間が小さい拠点Ｒの折り返し映像を配置し、演者移動領域ＰＡの近くに遅延時間の小さい折り返し映像が配置されるように、例えば同心円状（放射線状）の折り返し映像のレイアウト配置を採用する。このレイアウト配置は、提示レイアウトの一例である。

　以下、第１の実施形態と同様に、折り返し映像レイアウト調整部１１４は、映像情報格納部１３１から、ステップＳ１３２でソートした順番に従って最新の映像Ｖ_signal2を読み出し、それら読み出した拠点Ｒ₁～拠点Ｒ_nそれぞれの映像Ｖ_signal2をこのレイアウト配置における順番で配置していくことで、映像Ｖ_signal3を生成し（ステップＳ１３４）、生成した映像Ｖ_signal3を折り返し映像提示装置１０３に出力する（ステップＳ１３５）。折り返し映像提示装置１０３は、拠点Ｒ₁～拠点Ｒ_nそれぞれから拠点Ｏに折り返し伝送される映像Ｖ_signal2に基づく映像Ｖ_signal3を再生して表示する。

　（効果）
　以上述べたように第２の実施形態では、サーバ１は、複数の拠点Ｒからの複数の映像Ｖ_signal2それぞれの遅延時間に基づいて、複数の映像Ｖ_signal2の折り返し映像提示装置１０３での提示レイアウト上の配置位置を決定し、その決定した配置位置に各映像Ｖ_signal2を配置した映像Ｖ_signal3を生成する。典型例では、サーバ１は、遅延時間が小さい映像Ｖ_signal2程、演者移動領域ＰＡの中心に配置し、遅延時間が大きくなるにつれてその映像Ｖ_signal2が演者移動領域ＰＡから離れるように配置する。このように、サーバ１は、映像Ｖ_signal2を表示するための遅延時間と観客の視界に対応する演者移動領域ＰＡとに基づいて、各拠点Ｒからの映像Ｖ_signal2を表示する位置を調整することができる。近くに配置された複数映像の中に特異な映像が無ければ、人は違和感を覚え難いので、サーバ１は、コンサート会場の観客の視界に入り易い領域に遅延時間が短い折り返し映像を配置することで、折り返し映像それぞれの時間のズレにより生じる観客の違和感を低減させることができる。

　また、ステージＳＴ上の演者の移動に追従する観客の視界の移動に伴って、遅延時間の小さい映像Ｖ_signal2を表示する位置も変更されるため、より観客の違和感低減に効果的である。

　［第３の実施形態］
　第１及び第２の実施形態は、遅延時間に基づいて各拠点Ｒからの折り返し映像Ｖ_signal2の提示レイアウト上の配置位置を決定するようにしているが、遅延時間以外の指標、例えば、映像Ｖ_signal2の解像度の大きさ、映像Ｖ_signal2の映像乱れの有無、等に基づいて配置位置を決定することができる。なお、映像乱れが有るとは、例えば、一定時間におけるパケットロス発生率が閾値以上である場合を言う。

　また、複数の指標を組み合せて利用することもできる。

　よって、折り返し映像Ｖ_signal2の配置位置決定に用いる指標のバリエーションとしては、例えば、以下が考えられる：
　（１）遅延時間、
　（２）遅延時間と解像度、
　（３）遅延時間と映像乱れ、
　（４）遅延時間と解像度と映像乱れ、
　（５）解像度、
　（６）映像乱れ、
　（７）解像度と映像乱れ。

　例えば、「（２）遅延時間と解像度」を指標として用いる場合、折り返し映像レイアウト調整部１１４は、遅延時間が大きく解像度が小さい映像が、観客の視界に入り易い演者移動領域ＰＡから遠くに配置されるように配置位置を決定する。また、「（３）遅延時間と映像乱れ」を指標として用いる場合には、折り返し映像レイアウト調整部１１４は、遅延時間が大きく、映像乱れが生じている映像が、観客の視界に入り易い演者移動領域ＰＡから遠くに配置されるように配置位置を決定する。

　このように複数の指標を組み合せている場合には、それぞれの指標の値をそのまま使用するのではなく、各指標の値に重み付けを行った加重和を取って、その値に基づいて配置位置を決定する。この場合、重みは、例えば、遅延時間、解像度、映像乱れ、の順に大きくする。

　これを、「（４）遅延時間と解像度と映像乱れ」を指標として用いる場合を例に説明する。ここで、遅延時間指標値をａ（秒）、解像度指標値をｂ（pixel）、映像乱れ指標値をｃ（％）とする。

　折り返し映像レイアウト調整部１１４は、遅延時間指標値ａを、第１の実施形態で説明したように、映像情報格納部１３１に格納された時刻Ｔ_mediaと受信時刻ｔ₂とより、ａ＝ｔ₂－Ｔ_mediaによって算出する。

　サーバ１は、データ記憶部１３に解像度テーブルを記憶する。図２３は、解像度テーブル１３２の一例を示す図である。解像度テーブル１３２は、各解像度（ｂ１×ｂ２）に対する解像度指標値ｂを記憶している。折り返し映像レイアウト調整部１１４は、この解像度テーブル１３２から、映像情報格納部１３１に格納された映像Ｖ_signal2の解像度に該当する解像度指標値ｂを読み出す。

　折り返し映像レイアウト調整部１１４は、映像情報格納部１３１に格納された映像Ｖ_signal2列から直近１秒間におけるパケットロス発生率を算出し、それを映像乱れ指標値ｃとする。ただし、算出したパケットロス発生率が０の場合は、折り返し映像レイアウト調整部１１４は、映像乱れ指標値ｃを１とする。

　折り返し映像レイアウト調整部１１４は、これらａ，ｂ，ｃの値を、例えば以下の式に当てはめ、加重和ｐ（x）を取り、ｐ（x）の値が大きい程、観客の視界に入り易い演者移動領域ＰＡの近くに映像Ｖ_signal2を配置する。ここで、α、β、γは予め決められた重み係数であり、α＞β＞γである。

　以上述べたように、第３の実施形態では、サーバ１は、複数の拠点Ｒからの複数の映像Ｖ_signal2それぞれの遅延時間、解像度及び映像乱れ、の三指標の内の少なくとも一つに基づいて、複数の映像Ｖ_signal2の折り返し映像提示装置１０３での提示レイアウト上の配置位置を決定し、その決定した配置位置に各映像Ｖ_signal2を配置した映像Ｖ_signal3を生成する。このように、サーバ１は、複数の拠点Ｒから異なる時刻に伝送される複数の映像Ｖ_signal2が再生されるときに、遅延時間、解像度及び映像乱れ、の三指標の内の少なくとも一つが大きい映像Ｖ_signal2は、目立たなくなるような位置に配置することで、拠点Ｏの視聴者である観客が感じる違和感を低減させることができる。

　［その他の実施形態］
　遠隔地の各拠点Ｒから映像だけでなく音声も折り返すようにしても良い。拠点Ｏのサーバ１は、例えば、遅延時間が小さい程、大きな音で、各拠点Ｒからの音声を混合して、例えば折り返し音声提示装置から出力させることができる。

　上記ステップＳ１３１及びステップＳ１３２の遅延時間の算出及びソートの処理は、ステップＳ１３の折り返し映像レイアウト調整処理を繰り返し行う際、毎回実施するものとしているが、その内の１回だけ実施するものとしても良いし（遅延時間は一定とする）、一定時間ごとに実行してソート順番を更新していくようにしても良い。更に、各拠点Ｒの遅延時間を算出するとき、最新の遅延時間だけでなく過去に算出した遅延時間も利用して、平均値等により各拠点Ｒの遅延時間を決定するようにしても良い。

　第２の実施形態におけるステップＳ１３７の演者移動領域ＰＡの推定処理は、このステップＳ１３の折り返し映像レイアウト調整処理を繰り返し行う際、毎回実施するものとしているが、その内の１回だけ実施するものとしても良いし、一定時間ごとに推定をくり返し、演者移動領域ＰＡを更新していくようにしても良い。なお、ここでは基準映像撮影装置１０４の基準映像から自動的に推定する例を示したが、基準映像撮影装置１０４を用いずに、人手で演者移動領域ＰＡを設定するようにしても構わない。

　また、フローチャートを参照して説明した各処理の流れは、説明した処理手順に限定されるものではない。例えば、第２の実施形態におけるステップＳ１３６，Ｓ１３７の処理とステップＳ１３１の処理は、逆の順序で行っても良いし、同時に併行して行っても良い。このように、幾つかのステップの順序が入れ替えられても良いし、幾つかのステップが同時併行で実施されても良い。更に、幾つかのステップの処理内容が修正されても良い。

　提示映像調整装置は、上記の例で説明したように１つの装置で実現されても良いし、機能を分散させた複数の装置で実現されても良い。

　プログラムは、電子機器に記憶された状態で譲渡されて良いし、電子機器に記憶されていない状態で譲渡されても良い。後者の場合は、プログラムは、ネットワークを介して譲渡されて良いし、記録媒体に記録された状態で譲渡されても良い。記録媒体は、非一時的な有形の媒体である。記録媒体は、コンピュータ可読媒体である。記録媒体は、ＣＤ－ＲＯＭ、メモリカード等のプログラムを記憶可能かつコンピュータで読取可能な媒体であれば良く、その形態は問わない。

　以上、本発明の実施形態を詳細に説明してきたが、前述までの説明はあらゆる点において本発明の例示に過ぎない。本発明の範囲を逸脱することなく種々の改良や変形を行うことができることは言うまでもない。つまり、本発明の実施にあたって、実施形態に応じた具体的構成が適宜採用されても良い。

　要するにこの発明は、上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記実施形態に開示されている複数の構成要素の適宜な組み合せにより種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除しても良い。更に、異なる実施形態に亘る構成要素を適宜組み合せても良い。

　１，２…サーバ
　１０…時刻配信サーバ
　１１，２１…制御部
　１２，２２…プログラム記憶部
　１３，２３…データ記憶部
　１４，２４…通信インタフェース
　１５，２５…入出力インタフェース
　１０１…映像撮影装置
　１０２…音声収録装置
　１０３…折り返し映像提示装置
　１０４…基準映像撮影装置
　１１１，２１１…時刻管理部
　１１２…メディア送信部
　１１３…折り返し映像受信部
　１１４…折り返し映像レイアウト調整部
　１３１…映像情報格納部
　１３２…解像度テーブル
　１３１１…時刻管理ＤＢ
　２０１…映像提示装置
　２０２…音声提示装置
　２０３…オフセット映像撮影装置
　２０４…折り返し映像撮影装置
　２１２…メディア受信部
　２１３…映像オフセット算出部
　２１４…折り返し映像送信部
　２３１…映像時刻管理ＤＢ
　ＣＡ…中央領域
　ＤＡ…映像表示領域
　ＮＷ…ＩＰネットワーク
　Ｏ，Ｒ，Ｒ₁，Ｒ₂，Ｒ_n…拠点
　ＰＡ…演者移動領域
　ＰＬ…演者
　Ｓ…提示映像調整システム

Claims

　映像提示装置を備える第１の拠点の提示映像調整装置であって、
　前記第１の拠点とは異なる複数の第２の拠点のそれぞれから、前記第１の拠点で第１の時刻に取得された第１の映像を前記第２の拠点で再生する時刻に前記第２の拠点で取得された第２の映像を格納したパケットを受信する受信部と、
　前記複数の第２の拠点からの複数の前記パケットに基づく複数の前記第２の映像それぞれの、遅延時間、解像度及び映像乱れ、の三指標の内の少なくとも一つに基づいて、前記複数の前記第２の映像それぞれの前記映像提示装置での規定の提示レイアウト上の配置位置を決定し、前記決定した前記配置位置に従って前記複数の前記第２の映像を配置した第３の映像を前記映像提示装置に出力するレイアウト調整部と、
　を備える、提示映像調整装置。
　前記レイアウト調整部は、前記第２の映像を格納したパケットを受信したことに伴う第２の時刻と前記第１の時刻との差の値に基づき前記第２の映像の前記遅延時間を判別する、請求項１に記載の提示映像調整装置。
　前記レイアウト調整部は、前記第２の映像の前記遅延時間が大きくなるにつれて、前記第２の映像の提示位置が前記映像提示装置の中央部から離れるように、前記第２の映像の前記提示レイアウト上の前記配置位置を決定する、請求項２に記載の提示映像調整装置。
　前記レイアウト調整部は、前記映像提示装置の提示面の前で移動する移動物体が存在する場合、前記映像提示装置の前記提示面の前から見た前記提示面に投影される前記移動物体の移動領域に基づき前記提示レイアウト上の配置位置を決定する、請求項２に記載の提示映像調整装置。
　前記レイアウト調整部は、前記第２の映像の前記遅延時間が大きくなるにつれて、前記第２の映像の提示位置が前記映像提示装置の前記移動領域から離れるように、前記第２の映像の前記提示レイアウト上の前記配置位置を決定する、請求項４に記載の提示映像調整装置。
　前記レイアウト調整部は、前記三指標の内の二つ以上に基づいて前記提示レイアウト上の配置位置を決定する際、前記第２の映像の前記遅延時間、前記第２の映像の前記解像度及び前記第２の映像の前記映像乱れの順番で大きい重み付けを行って、前記複数の前記第２の映像を順番付けし、前記順番に基づいて前記配置位置を決定する、請求項１に記載の提示映像調整装置。
　映像提示装置を備える第１の拠点の提示映像調整装置による提示映像調整方法であって、
　前記第１の拠点とは異なる複数の第２の拠点のそれぞれから、前記第１の拠点で第１の時刻に取得された第１の映像を前記第２の拠点で再生する時刻に前記第２の拠点で取得された第２の映像を格納したパケットを受信することと、
　前記複数の第２の拠点からの複数の前記パケットに基づく複数の前記第２の映像それぞれの、遅延時間、解像度及び映像乱れ、の三指標の内の少なくとも一つに基づいて、前記複数の前記第２の映像それぞれの前記映像提示装置での規定の提示レイアウト上の配置位置を決定することと、
　前記決定した前記配置位置に従って前記複数の前記第２の映像を配置した第３の映像を前記映像提示装置に出力することと、
　を備える提示映像調整方法。
　請求項１乃至６の何れかの提示映像調整装置が備える各部による処理をコンピュータに実行させる提示映像調整プログラム。