JP2021033354A - 通信装置およびその制御方法 - Google Patents

通信装置およびその制御方法 Download PDF

Info

Publication number
JP2021033354A
JP2021033354A JP2019148896A JP2019148896A JP2021033354A JP 2021033354 A JP2021033354 A JP 2021033354A JP 2019148896 A JP2019148896 A JP 2019148896A JP 2019148896 A JP2019148896 A JP 2019148896A JP 2021033354 A JP2021033354 A JP 2021033354A
Authority
JP
Japan
Prior art keywords
communication device
view
image
viewpoint position
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2019148896A
Other languages
English (en)
Inventor
毅 小澤
Takeshi Ozawa
毅 小澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2019148896A priority Critical patent/JP2021033354A/ja
Publication of JP2021033354A publication Critical patent/JP2021033354A/ja
Pending legal-status Critical Current

Links

Images

Abstract

【課題】視聴装置の左右の視点位置に基づいて、適切な左視点用の映像データおよび右視点用の映像データを再生できるようにすること。【解決手段】通信装置は、オブジェクトの位置情報と、前記オブジェクトを撮像する複数の撮像装置の位置情報とを取得する第1の取得手段と、他の通信装置において左視界の映像を見る左視点位置と、右視界の映像を見る右視点位置とを取得する第2の取得手段と、前記オブジェクトの位置情報と前記複数の撮像装置の位置情報と前記左視点位置と前記右視点位置とに基づいて、前記左視界に対応する位置に在る撮像装置と前記右視界に対応する位置に在る撮像装置とを選択する選択手段と、前記選択手段により選択された撮像装置が撮像した映像のデータにアクセスするために必要な情報を生成する生成手段と、前記生成手段で生成された情報を前記他の通信装置へ送信する送信手段と、を備える。【選択図】 図4

Description

本発明は、通信装置およびその制御方法に関する。
近年、被写体の周囲にネットワーク接続された多数のカメラを配置し同時撮像した多数の映像を合成することで、視点移動をシミュレートした映像を視聴するシステムが開発されている。また、多数の映像から視点に応じた映像を選択して視聴する所謂自由視点映像配信システムも開発されている。
自由視点映像配信システムでは、予め決められた方向からの映像ではなく、視聴者が随時選択する方向からの映像が即座に配信されることが求められる。多数の映像から視聴する映像を視聴者が選択することができる映像伝送方式として、国際標準技術であるMPEG−DASH(Dynamic Adaptive Streaming over HTTP)がある。以下の説明では、MPEG−DASHをDASHと記載する。MPEGはMoving Picture Experts Groupの略である。HTTPはHypertext Transfer Protocolの略である。
DASHではMPD(Media Presentation Description)と呼ばれる映像データのダウンロードリスト(プレイリスト)の記述方式が定義されている。MPDには、一つ以上の映像のダウンロードURL、各映像の再生時間、データレート、階層符号化、映像間の関係などの、ストリーミング再生に必要な情報が記載される。視聴機器はまずMPDを配信機器からダウンロードする。そして、視聴機器は、MPDに記載されている映像情報に基づいてダウンロードする映像を選択し、配信機器から選択映像データをダウンロードし再生する。URLは、Uniform Resource Locatorの略である。
自由な視点からの映像を伝送するための技術として、カメラとカメラの間にある視点位置が指定された場合に、隣接するカメラからの映像を選択して配信し合成表示する技術も開示されている(特許文献1)。また、隣り合う二つのカメラの映像を左右視点映像とすることでステレオ映像を生成する技術も開発されている。自由視点映像システムの視聴機器でステレオ映像を視聴するには、多数のカメラの映像から視点位置に応じた左右それぞれの視点に対応する適切な映像が選択される必要がある。映像データの配信方式として国際標準であるDASHを使用することで、様々な視聴機器でステレオ映像を視聴可能となることが期待できる。
特開2015−125493号公報
自由視点映像システムの映像を視点位置に応じたステレオ映像として視聴することは、視聴者の所望する方向からの臨場感のある映像体験を実現する点で非常に有用である。しかしながら、特許文献1の技術では、複数配置されたカメラと被写体と左右視点との位置関係を視聴機器が把握していない。そのため、視聴機器は左右視点それぞれに対応する映像を適切に選択できない。
また、被写体へ近づいた位置を視点位置とする場合、被写体への近づき度合いと左右視点位置の差に応じて左右視点それぞれに対応するカメラ映像は変化する。視点位置が被写体に近づく動作に対し、映像を拡大表示することで近接を表現することは可能であるが、視点位置に応じた実際の被写体への画角のズレと拡大表示による映像表示の劣化が生ずる。
上記した課題に鑑み、本発明の目的は、視聴装置の左右の視点位置に基づいて、適切な左視点用の映像データおよび右視点用の映像データを再生できるようにすることである。
上記した目的を達成するために、本発明の1つの態様による通信装置は、オブジェクトの位置情報と、前記オブジェクトを撮像する複数の撮像装置の位置情報とを取得する第1の取得手段と、他の通信装置において左視界の映像を見る左視点位置と、右視界の映像を見る右視点位置とを取得する第2の取得手段と、前記オブジェクトの位置情報と前記複数の撮像装置の位置情報と前記左視点位置と前記右視点位置とに基づいて、前記左視界に対応する位置に在る撮像装置と前記右視界に対応する位置に在る撮像装置とを選択する選択手段と、前記選択手段により選択された撮像装置が撮像した映像のデータにアクセスするために必要な情報を生成する生成手段と、前記生成手段で生成された情報を前記他の通信装置へ送信する送信手段と、を備える。
本発明によれば、視聴装置の左右の視点位置に基づいて、適切な左視点用の映像データおよび右視点用の映像データを再生できる。
実施形態1のシステム構成図。 図1のサーバ装置の機能構成を示すブロック図。 図1の再生装置の機能構成を示すブロック図。 実施形態1におけるMPDの生成と映像再生のフローチャート。 図4のフローチャートにおけるMPD生成ステップの詳細フローチャート。 左右視点位置に応じたカメラ選択を説明する図。 図1のサーバ装置のハードウェア構成を示すブロック図。 実施形態2におけるMPD生成ステップの詳細フローチャート。 視点距離に応じた階層符号化データの選択を説明する図。
以下、添付図面を参照して本発明の実施形態を詳細に説明する。なお、以下の実施形態は本発明を限定するものではなく、また、実施形態で説明されている特徴の組み合わせの全てが本発明の解決手段に必須のものとは限らない。実施形態の構成は、本発明が適用されるシステムおよび装置の仕様および各種条件(使用条件、使用環境等)によって適宜修正又は変更され得る。本発明の技術的範囲は、特許請求の範囲によって確定されるのであって、以下の個別の実施形態によって確定されない。
以下に説明する実施形態では、映像伝送方式としてMPEG−DASHを採用する。実施形態の中でMPDに記載される撮像装置(カメラ)の物理的な配置情報について、配置の計測方法は本発明とは直接関係ない為、説明を行わない。また、サーバ装置がネットワーク上のカメラを発見する方法、および、クライアント装置(再生装置)がサーバ装置のアドレスを取得する方法についても、本発明とは直接関係ない為、説明を行わない。クライアント装置は複数あってもよいが、以下の実施形態では、クライアント装置が1つの場合を説明する。
<実施形態1>
<通信システム>
本実施形態の通信システム1の構成について、図1を参照して説明する。通信システム1は、被写体10を撮影(撮像)する複数のカメラ11〜16と、サーバ装置20と、再生装置30と、ネットワーク40とからなる。再生装置30は、左ディスプレイ30Lおよび右ディスプレイ30Rを有する。カメラ11〜16は撮像装置の一例である。再生装置30は視聴装置の一例である。被写体10はオブジェクトと称してもよい。本実施形態のシステム1は自由視点映像システムである。サーバ装置20は、通信装置の一例である。再生装置30は、サーバ装置20と通信する他の通信装置の一例である。
被写体10は、例えば、人物である。自由視点映像の撮像対象である被写体10が複数のカメラ11〜16により撮像される。カメラ11〜16は、例えば、ネットワークカメラである。カメラ11〜16は、同じ構成を有するカメラである。カメラ11〜16はそれぞれネットワーク40に接続する。カメラ11〜16は、映像セグメントデータを出力する。なお、図1には6つのカメラ11〜16が図示されているが、カメラの数は6に限定されない。
ネットワーク40は、例えば、LAN、インターネット、公衆無線通信等の通信網である。通信網は、有線でも無線でもよい。ネットワーク40にはサーバ装置20と再生装置30が接続する。LANはLocal Area Networkの略であり、例えばIEEE802.11規格に準拠した無線LANである。公衆無線通信は例えば3G、4G、5G、LTE等である。LTEはLong Term Evolutionの略である。LTEは、LTE−AdvancedおよびLTE−Advanced Proを含む。ネットワーク40の通信網は、Bluetooth(登録商標)やNear Field Communication(NFC)などの近距離無線通信でもよい。
本実施形態のサーバ装置20は、DASHサーバとして動作する。DASHサーバとは、映像伝送方式としてMPEG−DASHを使用するサーバである。サーバ装置20は、例えば、再生装置30からMPD送信要求を受け取ると、MPDを生成し、当該MPDを再生装置30に送信する。MPD送信要求は、MPDを作成させる信号である。MPDは、カメラが撮像した映像データへアクセスするために必要な情報(例えば、映像データのダウンロードURL)を含むプレイリストである。MPDには、映像(動画)のエンコードパラメータ(符号化方式、ビットレート等)や、セグメントの分割単位等も記述されている。MPDは、MPEG−DASHにより規定されたフォーマットで記述されている。
本実施形態の再生装置30は、DASHクライアント装置として動作する。再生装置30は、例えば、ステレオ映像が視聴可能なヘッドマウントディスプレイ装置(HMD)であり、DASH方式で配信される左右視点の映像を左ディスプレイ30Lおよび右ディスプレイ30Rに表示する。左ディスプレイ30Lおよび右ディスプレイ30Rは、例えば、液晶ディスプレイである。
<サーバ装置の機能ブロック>
図2はサーバ装置20の機能構成を示すブロック図である。
サーバ装置20は、通信部21、MPD生成部22、カメラ配置情報部23およびセグメント情報部24を有している。カメラ配置情報部23には、カメラ配置情報が格納される。カメラ配置情報は、カメラ11〜16の配置情報(位置情報)である。サーバ装置20は、カメラ11〜16の配置情報を取得することができる。セグメント情報部24には、セグメント情報が格納される。セグメント情報は、カメラ11〜16が出力する映像セグメントデータの情報である。映像セグメントは、例えば、数秒から10秒程度の動画データであり、符号化されている。サーバ装置20は、カメラ11〜16から映像セグメントデータを取得することができる。また、サーバ装置20は、カメラ11〜16の撮像情報(画角を示す情報を含む)を取得することができる。
通信部21はネットワーク40に接続する。通信部21がネットワーク40を介して再生装置30からMPD送信要求を受け取ると、MPD生成部22がMPDを生成する。生成されたMPDは、通信部21からネットワーク40を介して再生装置30へ送信される。
MPD生成部22は、カメラ配置情報部23とセグメント情報部24を管理する。MPD生成部23は、カメラ配置情報とセグメント情報を参照してMPDを生成する。
<再生装置の機能ブロック>
図3は再生装置30の機能ブロックを示す。
再生装置30は、再生制御部31と、視点座標部32と、通信部33と、セグメントバッファ34と、復号部35と、左視界描画部36と、右視界描画部37とを有する。視点座標部32は、左視点座標を検出するセンサおよび右視点座標を検出するセンサを含み、当該センサにより検出された左視点座標および右視点座標を格納している。なお、視点座標は、視聴座標と称してもよいし、視点位置と称してもよい。なお、以下の記載において、左視点座標および右視点座標をまとめて視点座標と称することがある。
通信部33は、ネットワーク40に接続して他の装置と通信する。通信部33は、再生制御部31による制御の下で、ネットワーク40を介して、サーバ装置20にMPD送信要求を送信する。MPD送信要求は視点座標を含む。視点座標は、物理的な絶対座標でもよいし、サーバ装置20より予め提供される座標系(例えば、被写体10に対する相対座標、または、カメラと被写体10の間の距離に対する比により示される位置)でもよいし、視点候補を指定する識別子でもよい。
また、通信部33は、ネットワーク40を介して、DASH方式で配信される映像セグメントデータを例えばサーバ装置20から受信(ダウンロード)する。
再生制御部31は、通信部33が受信した映像セグメントデータからステレオ映像を再生するための制御を行う。再生制御部31は、DASH仕様で規定されているMPDを解析する機能と、映像セグメントデータをダウンロードする機能と、ダウンロードした映像セグメントデータをセグメントバッファ34へ格納する機能とを有する。映像セグメントデータのダウンロードは、MPDに記述されているURLに基づいて行なわれる。
復号部35は、バッファ34に格納された映像セグメントデータを復号化する。復号部35により復号化された映像セグメントデータは、左視界描画部36と右視界描画部37に供給される。左視界描画部36は、映像セグメントデータから、左の視界用のステレオ映像を描画する。描画された左視界用のステレオ映像は、左ディスプレイ30Lに表示される。右視界描画部37は、映像セグメントデータから、右の視界用のステレオ映像を描画する。描画された右視界用のステレオ映像は、右ディスプレイ30Rに表示される。また、再生制御部31は視点座標を管理する。
再生装置30は、サーバ装置20に視点座標を含むMPD送信要求を送信し、MPD送信要求に応じてサーバ装置20から送信されたMPDを受信する。再生装置30は、MPDから左右視界映像として再生する映像セグメントを選択し、該当するカメラに映像セグメント送信要求をする機能と、受信した映像セグメントの映像データを左右視界それぞれで再生する機能とを有する。
なお、図2および図3に示す各機能部は、ASIC等の専用のハードウェア又はソフトウェアとしてサーバ装置20および再生装置30に実装される。ハードウェアとして実装される場合は、各機能部それぞれ又はいくつかをまとめた専用のハードウェアモジュールとして実装してもよい。例えば、サーバ装置20において、ソフトウェアとして実装される場合には、各機能部を実行するためのプログラムが後述のサーバ装置20の記憶部51に記憶され、制御部52のプロセッサにより適宜読み出されて実行される。ASICは、Application Specific Integrated Circuit(特定用途向け集積回路)の略である。
<MPD生成と映像再生>
図4のシーケンス図を参照して、MPD生成部22がカメラ配置情報23、セグメント情報24および左右の視点座標に基づいて、映像セグメントごとのカメラ選択情報をMPDに追記する手順を説明する。SはStepの略である。
まず再生装置30が、ステレオ視する左右の視点座標を決定する(S41)。より詳しくは、再生装置30のセンサが、左右の視点座標を検出することにより、左右の視点座標が決定される。
次に再生装置30は、サーバ装置20に対して、S41で決定された視点座標を指定してMPDの送信を要求する(S42)。
サーバ装置20は再生装置30からMPD送信要求を受信すると(S43)、当該MPD送信要求に応じたMPDを生成し(S44)、再生装置30へMPDを送信する(S45)。MPDの記載内容は、DASH仕様書に記載のステレオ視映像の記述方法で記載される。例えば、MPDには、映像セグメントのリスト(セグメントリスト)が含まれている。なお、MPDを生成するための処理であるMPD生成処理(S44)の詳細は、図5を用いて後述する。
再生装置30は、サーバ装置20からMPDを受信すると(S46)、当該MPDに記載されたセグメントリストから左右視点の映像をそれぞれダウンロードする(S47)。そして、再生装置30は、ダウンロードした左右視点映像のそれぞれを再生する(S48)。
<MPD生成の詳細>
次に図5および図6を参照して左右視点座標から送信映像を選択しMPDを生成する処理(S44)の詳細を説明する。図5はS44の詳細な処理フローを示している。
まず、サーバ装置20は、再生装置30から受信したMPD送信要求から視点座標情報を取得し(S51)、左右視点の座標を決定する(S52)。視点座標情報は、左右各視点の座標であってもよいし、再生装置30の仮想的な配置座標と再生装置30上の左右各視点との差分情報の組み合わせでもよい。なお、視点座標情報が左右各視点の座標である場合には、S52を省略することができる。
次に、サーバ装置20は、S52で決定された左右視点の各座標(各位置情報)と被写体10とを結ぶ線の延長線上の撮像座標を計算する(S53)。そして、サーバ装置20は、撮像座標とカメラの配置情報から2つのカメラ(左視点映像用のカメラと右視点映像用のカメラ)を選択(決定)する(S54)。
そして、サーバ装置20は、選択されたカメラの映像データにアクセスして再生するのに必要な情報を含むMPDを生成する(S55)。MPDは、映像データへのアクセス情報を含む。
図6は被写体10と複数のカメラが配置される空間の中で、被写体10と視点座標によって計算される延長線上のカメラを選択する手順を示している。視点座標が座標67の場合、左右視点それぞれと被写体10を結ぶ線の延長線からカメラ14、15が選択される。つまり、カメラ14は左視界に対応する位置に在るカメラとして選択され、カメラ15は右視界に対応する位置に在るカメラとして選択される。
視点座標が被写体10に近づいて座標68になった場合、左右視点それぞれと被写体10を結ぶ線の延長線からカメラ11、13が選択される。さらに、視点座標が被写体10に近づいて座標69になった場合は、左右視点それぞれと被写体10を結ぶ線の延長線からカメラ12、16が選択される。
なお、延長線上にカメラが存在しない場合には、当該延長線に最も近い撮像装置を選択してもよいし、延長線の近傍に存在する撮像装置を選択してもよい。延長線の近傍であると判断するための基準となる距離を予め設定しておき、延長線からその基準となる距離より近くに存在する撮像装置を選択するようにしてもよい。
<サーバ装置のハードウェア構成>
図7は、サーバ装置20のハードウェア構成を示す。サーバ装置20は、そのハードウェア構成として、例えば、記憶部51、制御部52、機能部53、入力部54、出力部55、および通信部56を有する。なお、図7の構成は一例であり、サーバ装置20は、図7に示す構成の一部のみを有してもよいし、図7に示される以外の構成(例えば、アンテナ)を有してもよい。
記憶部51は、ROM、RAMの両方、または、いずれか一方の、1以上のメモリにより構成され、前述の各種動作を行うためのプログラムや、無線通信・有線通信のための通信パラメータ等の各種情報を記憶する。ROMはRead Only Memoryの略であり、RAMはRandom Access Memoryの略である。なお、記憶部51として、ROM、RAM等のメモリの他に、フレキシブルディスク、ハードディスク、光ディスク、光磁気ディスク、CD−ROM、CD−R、磁気テープ、不揮発性のメモリカード、DVDなどの記憶媒体が用いられてもよい。DVDはDigital Versatile Discの略である。
制御部52は、例えば、CPUやMPU等の一つ以上のプロセッサ、ASIC、DSP(デジタルシグナルプロセッサ)、FPGA(フィールドプログラマブルゲートアレイ)等により構成される。CPUはCentral Processing Unitの略であり、MPUは、Micro Processing Unitの略である。制御部52は、記憶部51に記憶されたプログラムを実行することによりサーバ装置20の全体を制御する。なお、制御部52は、記憶部51に記憶されたプログラムとOS(Operating System)との協働によりサーバ装置20の全体を制御するようにしてもよい。また、制御部52は、機能部53を制御して、映像表示等の所定の処理を実行する。図4および図5においてサーバ装置20で実行される処理として説明した各ステップは、記憶部51に記憶されたプログラムを制御部52が実行することにより行われる。
機能部53は、サーバ装置20が所定の処理を実行するためのハードウェアである。機能部53が処理するデータは、記憶部51に記憶されているデータであってもよいし、通信部56を介して再生装置30やカメラ11〜16から受信したデータであってもよい。
入力部54は、外部(ユーザを含む)からの各種操作の受付を行う。出力部55は各種出力を行う。通信部56は、有線通信又は無線通信の制御を行う。サーバ装置20は通信部56を介して、映像データや音声データ等のコンテンツを他の通信装置(例えば再生装置30)と通信する。
なお、再生装置30も図7と同様なハードウェア構成を有するが、再生装置30は、左視点座標を検出するセンサと、右視点座標を検出するセンサとを有している。再生装置30の出力部55は、左ディスプレイ30Lおよび右ディスプレイ30Rを含む。出力部55による出力は、左ディスプレイ30Lおよび右ディスプレイ30R上へのステレオ映像の表示を含む。また、出力部55による出力は、スピーカによる音声出力や振動出力等含んでもよい。なお、図4において再生装置30で実行される処理として説明した各ステップは、再生装置30の記憶部51に記憶されたプログラムを制御部52が実行することにより行われる。
上記の説明では、再生装置30としてヘッドマウントディスプレイ装置を説明したが、再生装置30は通信機能を備えて映像を再生することができる装置であれば、ヘッドマウントディスプレイ装置以外でもよい。
<実施形態1の効果>
本実施形態では、複数のカメラ11〜16が被写体10を撮像する環境で自由視点のステレオ映像をネットワーク配信するシステム1において、視聴機器である再生装置30が指定する視聴位置(視点座標、視点位置)に応じた左右視点それぞれの位置に適切なカメラ映像を選択することができる。
この様な自由視点映像システム1が広く使用されるためには、専用の視聴機器の使用や既知の撮像環境の使用に制限(限定)されることなく、様々な視聴機器および撮像環境で自由視点映像システム1が使用できるようにすることが望ましい。一般的に、視聴機器が被写体10に対する視聴位置を選択したとしても、視聴機器が、対応する映像を提供するカメラの位置を全て把握しているとは限らない。本実施形態によれば、再生装置30が指定する視聴位置に基づいて、サーバ装置20が適切なカメラ映像を選択することが可能となる。従って、従来に比べ、視聴位置の被写体への近接度合いに応じて左右視点の画角に合致するカメラ映像を選択することが可能となる。
また、左右視点映像の配信方式にMPEG−DASHを使用することで、一般な視聴機器に対しても左右視点それぞれのステレオ映像を明示(供給、提供)することが可能となり、一般的な視聴機器でステレオ映像を再生することができるようになる。
<実施形態2>
実施形態2として、カメラが出力する映像が階層符号化されている場合に、視点位置に応じてアクセスすべき階層映像データ(以下、「階層データ」と称する)を選択する手順について説明する。以下の記載において実施形態1と同様な構成には同じ参照符号を付ける。
本実施形態のシステム構成は図1と同じであり、サーバ装置20の構成は図2と同じであり、再生装置30の構成は図3および図7と同じである。また、図4で説明した再生装置30とサーバ装置20との処理手順も、実施形態1と同様である。
本実施形態では、カメラ11〜16は映像データを階層符号化する機能を備え、サーバ装置20は、視点位置に応じて再生する階層を選択する機能を備えているとする。これら機能以外は、実施形態1と同じであるので、重複する動作・処理の説明は省略する。サーバ装置20がカメラ11〜16から取得する撮像情報には、映像データが階層符号化されているかの情報が含まれている。また、撮像情報には、階層符号化の階層数に関する情報も含まれている。
<階層符号化>
各カメラ11〜16は、階層符号化部を有する。本実施形態では、階層符号化部が1つの映像データを符号化すると、符号化された映像データは、基本階層データと、第1階層データ(第1の拡張レイヤデータ)と、第2階層データ(第2の拡張レイヤデータ)とを含むようになるとする。この場合、階層符号化の階層数は3である。基本階層データだけを復号化すると、低品質の復号映像が得られる。基本階層データおよび第1階層データを復号化すると、中品質の復号映像が得られる。基本階層データ、第1階層データおよび第2階層データを全て復号化すると、高品質の復号映像が得られる。
<MPD生成の詳細>
本実施形態では図4のS44(図5のS51〜S55)のMPD生成処理の詳細手順に新たな処理が追加される。図8は本実施形態のMPD生成処理の詳細手順を示すフローチャートである。
S51〜S54の左右視点に応じたカメラの選択までは実施形態1と同様である。S54でカメラを選択した後、S71に移行する。
S71において、サーバ装置20は、選択されたカメラが出力する階層符号化の階層数を取得する。上記したように、階層符号化の階層数は3である。
S72において、サーバ装置20は、カメラが階層符号化を行っているかを判定する。S72の判定結果がNoの場合、つまり、カメラが階層符号化を行なっていない場合は、実施形態1と同様にMPD生成処理(S55)へ移行する。S72の判定結果がYesの場合、つまり、カメラが階層符号化を行っている場合は、S73へ移行する。
S73においてサーバ装置20は、階層数に応じた被写体距離の範囲を決定する。被写体距離とは視点位置から被写体10までの距離であり、被写体距離の範囲とは、被写体距離が属する範囲である。被写体距離の範囲は、本実施形態では、カメラから被写体10までの距離(空間)を階層数に応じて分割した結果得られる複数の区間である。図9は階層数で分割した被写体距離の範囲の例を示す。階層数は3なので、図9において被写体距離の範囲は3つある。図9では、矢印に直交する2本の破線により、被写体とカメラの間の空間が3分割されていることが示されている。
S74において、被写体距離から映像表示の範囲を決定する。これは被写体10に近づくことによる拡大表現(画像拡大)の処理に相当する。S74により、視点位置(81、83または85)の存在範囲が決定される。
次にS73およびS74で決定した視点位置の存在範囲および映像表示範囲から、再生装置30への送信対象とする階層データ、つまり再生装置30がアクセスすべき階層データを選択・決定する(S75)。図9(a)〜(c)は、3分割された被写体距離の範囲のそれぞれに視点位置が選択された場合の送信対象となる階層データ82、84、86を示している。図9(a)の場合は、視点位置81は最も遠い被写体距離範囲にあるため、送信対象となる階層データ82は基本階層データのみとなる。図9(b)の場合は、視点位置83は中間の被写体距離範囲にあるため、送信対象となる階層データ84は基本階層データと第1の拡張レイヤデータとなる。図9(c)の場合は、視点位置85は最も近い被写体距離範囲にあるため、送信対象となる階層データ86は、基本階層データから第2の拡張レイヤデータまでのすべての階層データとなる。
S75で送信対象の階層データ(アクセスすべき階層データ)が決定すると、当該送信対象に基づいてMPDを生成(S55)して終了する。
なお、カメラの階層符号化が空間的符号化に対応し階層データをタイル分割する場合は、表示範囲のタイルを選択することになる。より詳しくは、タイル符号化が含まれる階層符号化がカメラ11〜16で行われる場合、MPD生成部22は、左視点位置からオブジェクト10までの距離が近いほど、アクセスすべき左視界用階層映像データから除外するタイルを多くする。また、MPD生成部22は、右視点位置からオブジェクト10までの距離が近いほど、アクセスすべき右視界用階層映像データから除外するタイルを多くする。タイルの除外は、映像データの周辺タイルから順次行われる。このようにタイルを除外することにより、オブジェクト10への接近に伴う拡大表示により不要となる周辺画像の送信を行なわないようにしている。
また、MPD生成部22は、アクセスすべき階層映像データの階層が増加するのに伴い、当該アクセスすべき階層映像データから除外するタイルの数を増加させてもよい。このように除外するタイルの数を増加すると、階層増加による映像詳細化と送信不要タイル数増加を連動させることができる。
MPD生成部22は、アクセスすべき階層映像データの階層およびタイルの構成が、左視界用階層映像データと右視界用階層映像データとで一致するようにMPDを生成する。送信する階層及びタイルの構成を、左右視の組み合わせで一致させることで、左右視界映像間の画質および表示範囲の不一致を回避することができる。
<実施形態2の効果>
本実施形態でも、実施形態1と同様な効果が得られる。さらに、本実施形態によれば、カメラ11〜16が階層符号化部を備えており、カメラが出力する映像が階層符号化される場合に、サーバ装置20は、視点位置に応じて、アクセスすべき階層データを適切に選択することができる。つまり、サーバ装置20は、視点位置の被写体への近接度合いに応じて階層符号化された映像データを適切な階層での再生できるようにMPDを生成し、当該MPDを再生装置30に送信することができる。このようなMPDを受信した再生装置30が、MPDに記述された階層データにアクセスして映像を再生すれば、被写体へ近づいた視点の場合に拡大された映像による臨場感の低下は発生しない。
なお、上記した実施形態2において、階層符号化の階層数は3に限定されない。また、図7において、S71の前にS72を実行してもよい。この場合、S72の判定結果がYesの場合にのみ、S71を実行し、S71の後にS73に移行する。S72の判定結果がNoの場合、S55に移行する。
上記した実施形態1および2において、再生装置30へ映像を視聴するとしたが、映像を見るだけでもよい。つまり、再生装置30は、映像(動画、静止画)を再生するだけでもよい。この場合、左視点位置は、再生装置30において左視界の映像を見る視点位置であり、右視点位置は、再生装置30において右視界の映像を見る視点位置となる。視聴は、見る場合のみと、聴く場合のみと、見て聴く場合とを含むとする。カメラ11〜16は同じ構成を有するとしたが、異なる構成のカメラでもよい。
再生装置30は、PC、タブレット端末、カメラ、モバイル端末(スマートフォンなど)などでもよい。
<その他の実施形態>
以上、実施形態例を詳述したが、本発明は例えば、システム、装置、方法、プログラム若しくは記録媒体(記憶媒体)等としての実施態様をとることが可能である。具体的には、複数の機器(例えば、ホストコンピュータ、インタフェース機器、撮像装置、webアプリケーション等)から構成されるシステムに適用してもよいし、また、一つの機器からなる装置に適用してもよい。
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
10…被写体、11〜16…カメラ、20…サーバ装置、22…MPD生成部、23…カメラ配置情報部、24…セグメント情報部、30…再生装置、31…再生制御部、32…視点座標管理部

Claims (14)

  1. オブジェクトの位置情報と、前記オブジェクトを撮像する複数の撮像装置の位置情報とを取得する第1の取得手段と、
    他の通信装置において左視界の映像を見る左視点位置と、右視界の映像を見る右視点位置とを取得する第2の取得手段と、
    前記オブジェクトの位置情報と前記複数の撮像装置の位置情報と前記左視点位置と前記右視点位置とに基づいて、前記複数の撮像装置から、前記左視界に対応する位置に在る撮像装置と前記右視界に対応する位置に在る撮像装置とを選択する選択手段と、
    前記選択手段により選択された撮像装置が撮像した映像のデータにアクセスするために必要な情報を生成する生成手段と、
    前記生成手段で生成された情報を前記他の通信装置へ送信する送信手段と、
    を備えることを特徴とする通信装置。
  2. 前記選択手段は、前記オブジェクトの位置と前記左視点位置とを結ぶ線の延長線上に在るまたは当該延長線の近傍にある撮像装置を前記左視界に対応する位置に在る撮像装置として選択し、前記オブジェクトの位置と前記右視点位置とを結ぶ線の延長線上に在るまたは当該延長線の近傍にある撮像装置を前記右視界に対応する位置に在る撮像装置として選択することを特徴とする請求項1に記載の通信装置。
  3. 前記左視点位置および前記右視点位置の各々は、絶対座標により示される位置、前記オブジェクトに対する相対座標により示される位置、または前記撮像装置と前記オブジェクトとの間の距離に対する比により示される位置であることを特徴とする請求項1に記載の通信装置。
  4. 前記映像のデータが階層符号化されているか否かを判定する判定手段をさらに備え、
    前記判定手段により、前記映像のデータが階層符号化されていると判定された場合、前記生成手段は、前記左視点位置および前記右視点位置に基づいて、前記階層符号化により生成される階層映像データの何れにアクセスすべきかの情報を、前記アクセスするために必要な情報に含ませることを特徴とする請求項1〜3のいずれかの1項に記載の通信装置。
  5. 前記生成手段は、前記撮像装置と前記オブジェクトの間の空間を前記階層符号化の階層数で複数の区間に分割し、前記左視点位置が何れの区間に入るかに基づいて、前記アクセスすべき左視界用階層映像データを決定し、前記右視点位置が何れの区間に入るかに基づいて、前記アクセスすべき右視界用階層映像データを決定することを特徴とする請求項4に記載の通信装置。
  6. 前記生成手段は、前記左視点位置から前記オブジェクトまでの距離が近いほど、前記アクセスすべき左視界用階層映像データを多くし、前記右視点位置から前記オブジェクトまでの距離が近いほど、前記アクセスすべき右視界用階層映像データを多くすることを特徴とする請求項5に記載の通信装置。
  7. 前記階層符号化にタイル符号化が含まれている場合、前記生成手段は、前記左視点位置から前記オブジェクトまでの距離が近いほど、前記アクセスすべき左視界用階層映像データから除外するタイルを多くし、前記右視点位置から前記オブジェクトまでの距離が近いほど、前記アクセスすべき右視界用階層映像データから除外するタイルを多くし、前記タイルの除外は、前記映像データの周辺タイルから順次行われることを特徴とする請求項6に記載の通信装置
  8. 前記生成手段は、前記アクセスすべき階層映像データの階層が増加するのに伴い、前記アクセスすべき階層映像データから除外するタイルの数を増加させることを特徴とする請求項7に記載の通信装置。
  9. 前記生成手段は、前記アクセスすべき階層映像データの階層およびタイルの構成が、左視界用階層映像データと右視界用階層映像データとで一致するようにすることを特徴とする請求項7に記載の通信装置。
  10. 前記生成手段が生成する情報は、MPEG−DASH(Dynamic Adaptive Streaming over HTTP)により規定されたフォーマットで記述されていることを特徴とする請求項1から9のいずれか1項に記載の通信装置。
  11. オブジェクトを撮像する複数の撮像装置が撮像した映像と、他の通信装置からの情報とを用いて、ステレオ映像を再生可能な通信装置であって、
    左視界の映像を見る左視点位置と、右視界の映像を見る右視点位置とを検出する検出手段と、
    前記他の通信装置に、前記左視界に対応する位置に在る撮像装置が撮像した映像のデータにアクセスするために必要な情報と、前記右視界に対応する位置に在る撮像装置が撮像した映像のデータにアクセスするために必要な情報とを、前記検出手段が検出した左視点位置および右視点位置に基づいて作成させる信号を送信する送信手段と、
    前記送信手段によって送信された信号に基づいて前記他の通信装置で生成された情報を受信する受信手段と、
    を備えることを特徴とする通信装置。
  12. 映像再生に必要な情報を送信する通信装置の制御方法であって、
    オブジェクトの位置情報を取得するステップと、
    前記オブジェクトを撮像する複数の撮像装置の位置情報を取得するステップと、
    他の通信装置において左視界の映像を見る左視点位置と、右視界の映像を見る右視点位置とを取得するステップと、
    前記オブジェクトの位置情報と前記複数の撮像装置の位置情報と前記左視点位置と前記右視点位置とに基づいて、前記複数の撮像装置から、前記左視界に対応する位置に在る撮像装置と前記右視界に対応する位置に在る撮像装置とを選択するステップと、
    前記選択するステップにより選択された撮像装置が撮像した映像のデータにアクセスするために必要な情報を生成するステップと、
    前記生成するステップで生成された情報を前記他の通信装置へ送信するステップと、
    を有することを特徴とする制御方法。
  13. オブジェクトを撮像する複数の撮像装置が撮像した映像と、他の通信装置からの情報とを用いて、ステレオ映像を再生可能な通信装置の制御方法であって、
    前記通信装置において左視界の映像を見る左視点位置と、右視界の映像を見る右視点位置とを検出するステップと、
    前記他の通信装置に、前記左視界に対応する位置に在る撮像装置が撮像した映像のデータにアクセスするために必要な情報と、前記右視界に対応する位置に在る撮像装置が撮像した映像のデータにアクセスするために必要な情報とを、前記検出ステップで検出した左視点位置および右視点位置に基づいて作成させる信号を送信するステップと、
    前記送信するステップによって送信された信号に基づいて前記他の通信装置で生成された情報を受信するステップと、
    を有することを特徴とする制御方法。
  14. コンピュータを、請求項1から11のいずれか1項に記載の通信装置の各手段として機能させるためのプログラム。
JP2019148896A 2019-08-14 2019-08-14 通信装置およびその制御方法 Pending JP2021033354A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019148896A JP2021033354A (ja) 2019-08-14 2019-08-14 通信装置およびその制御方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019148896A JP2021033354A (ja) 2019-08-14 2019-08-14 通信装置およびその制御方法

Publications (1)

Publication Number Publication Date
JP2021033354A true JP2021033354A (ja) 2021-03-01

Family

ID=74676581

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019148896A Pending JP2021033354A (ja) 2019-08-14 2019-08-14 通信装置およびその制御方法

Country Status (1)

Country Link
JP (1) JP2021033354A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022259480A1 (ja) * 2021-06-10 2022-12-15 日本電信電話株式会社 映像処理装置、映像処理方法及び映像処理プログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022259480A1 (ja) * 2021-06-10 2022-12-15 日本電信電話株式会社 映像処理装置、映像処理方法及び映像処理プログラム

Similar Documents

Publication Publication Date Title
US11381739B2 (en) Panoramic virtual reality framework providing a dynamic user experience
US11348202B2 (en) Generating virtual reality content based on corrections to stitching errors
US11917221B2 (en) Encoding device and method, reproduction device and method, and program
US11539983B2 (en) Virtual reality video transmission method, client device and server
WO2019202207A1 (en) Processing video patches for three-dimensional content
WO2019131577A1 (ja) 情報処理装置、情報処理方法、及びプログラム
JP2022536182A (ja) データストリームを同期させるシステム及び方法
WO2019064853A1 (ja) 情報処理装置、情報提供装置、制御方法、及びプログラム
US10547879B2 (en) Method and apparatus for streaming video content
KR102133207B1 (ko) 통신장치, 통신 제어방법 및 통신 시스템
WO2015198725A1 (ja) 通信装置、通信方法、及びプログラム
CN111869222B (zh) 基于http的dash客户端网元、方法及介质
US11568893B2 (en) Image acquisition system and method
CN116233493A (zh) 沉浸媒体的数据处理方法、装置、设备及可读存储介质
KR20200136393A (ko) 정보 처리 장치, 정보 처리 방법 및 프로그램
JP6952456B2 (ja) 情報処理装置、制御方法、及びプログラム
WO2020189051A1 (ja) 情報処理装置、情報処理方法、再生処理装置及び再生処理方法
JP2021033354A (ja) 通信装置およびその制御方法
JP2018037755A (ja) 注目対象物に関する情報提供システムおよび情報提供方法
KR20200136394A (ko) 정보 처리 장치, 정보 처리 방법 및 프로그램
US20200374567A1 (en) Generation apparatus, reproduction apparatus, generation method, reproduction method, control program, and recording medium
JP2021064822A (ja) 通信装置、通信装置の制御方法およびプログラム
KR102465403B1 (ko) 2d영상 및 360도 영상이 조합된 동영상 콘텐츠를 제공하는 방법 및 장치
KR20130066121A (ko) 단말들간의 영상 공유 요청에 대응하여 단말들로 3d 영상 데이터를 제공하는 서버 및 방법, 그리고 단말
JP2019205182A (ja) 注目対象物に関する情報提供システムおよび情報提供方法