WO2023276007A1

WO2023276007A1 - 映像配信装置、ユーザ端末、プログラム、映像配信システム及び映像配信方法

Info

Publication number: WO2023276007A1
Application number: PCT/JP2021/024599
Authority: WO
Inventors: 俊明久保; 聡道籏
Original assignee: 三菱電機株式会社
Priority date: 2021-06-29
Filing date: 2021-06-29
Publication date: 2023-01-05
Also published as: JP7462842B2; JPWO2023276007A1

Abstract

映像配信装置（１１０）は、複数のカメラ（１０１）のそれぞれで撮像された複数の映像を取得する映像取得部（１１１）と、その複数の映像のそれぞれに含まれる、時刻毎の複数の画像における二以上の画像を合成することで、合成画像を生成する映像合成部（１１２）と、その合成画像をエンコードすることで、エンコードデータを生成するエンコード部（１１３）と、そのエンコードデータを配信する映像配信部（１１５）とを備える。

Description

映像配信装置、ユーザ端末、プログラム、映像配信システム及び映像配信方法

　本開示は、映像配信装置、ユーザ端末、プログラム、映像配信システム及び映像配信方法に関する。

　複数のカメラで撮像された映像から、ユーザが選択した映像を見ることのできる映像配信システムが、従来から使用されている。
　例えば、特許文献１には、映像配信装置において、ユーザが見たい映像データのカメラ位置の指定を受け付けて、そのカメラ位置において撮像された映像データをエンコードして、ユーザの端末に送信し、ユーザ端末において、そのデータをデコードして所望の映像を表示するシステムが記載されている。

国際公開公報第２０１９／０５９３２５号公報

　しかしながら、従来の映像配信システムは、ユーザが指定したカメラ位置における映像データをエンコードして配信するため、最大で、ユーザ数だけエンコードを行う必要がある。このため、ユーザ数が多くなると、その処理負荷が非常に大きくなる。

　そこで、本開示の一又は複数の態様は、ユーザ数が多くなっても、処理負荷が大きくならないように、ユーザが選択した映像を配信できるようにすることを目的とする。

　本開示の一態様に係る映像配信装置は、複数の撮像装置のそれぞれで撮像された複数の映像を取得する取得部と、前記複数の映像のそれぞれに含まれる、時刻毎の複数の画像における二以上の画像を合成することで、合成画像を生成する合成部と、前記合成画像をエンコードすることで、エンコードデータを生成するエンコード部と、前記エンコードデータを配信する配信部と、を備えることを特徴とする。

　本開示の第１の態様に係るユーザ端末は、複数の撮像装置のそれぞれで撮像された複数の映像のそれぞれに含まれる、時刻毎の複数の画像における二以上の画像を合成した合成画像をエンコードすることで生成されたエンコードデータを受信する受信部と、前記エンコードデータをデコードすることで、前記合成画像を取得するデコード部と、前記合成画像から前記二以上の画像を分離する分離部と、表示する映像の選択の入力を受け付ける入力部と、前記二以上の画像の中から、選択された映像の画像を表示する表示部と、を備えることを特徴とする。

　本開示の第２の態様に係るユーザ端末は、複数の撮像装置のそれぞれで撮像された複数の映像のそれぞれに含まれる、時刻毎の複数の画像における二以上の画像を合成した合成画像をエンコードすることで生成されたエンコードデータを受信する受信部と、前記エンコードデータをデコードすることで、前記合成画像を取得するデコード部と、表示する映像の位置の選択の入力を受け付ける入力部と、前記合成画像から、前記位置に対応する画像を取り出す選択部と、前記取り出された画像を表示する表示部と、を備えることを特徴とする。

　本開示の第１の態様に係るプログラムは、コンピュータを、複数の撮像装置のそれぞれで撮像された複数の映像を取得する取得部、前記複数の映像のそれぞれに含まれる、時刻毎の複数の画像における二以上の画像を合成することで、合成画像を生成する合成部、前記合成画像をエンコードすることで、エンコードデータを生成するエンコード部、及び、前記エンコードデータを配信する配信部、として機能させることを特徴とする。

　本開示の第２の態様に係るプログラムは、コンピュータを、複数の撮像装置のそれぞれで撮像された複数の映像のそれぞれに含まれる、時刻毎の複数の画像における二以上の画像を合成した合成画像をエンコードすることで生成されたエンコードデータを受信する受信部、前記エンコードデータをデコードすることで、前記合成画像を取得するデコード部、前記合成画像から前記二以上の画像を分離する分離部、表示する映像の選択の入力を受け付ける入力部、及び、前記二以上の画像の中から、選択された映像の画像を表示する表示部、として機能させることを特徴とする。

　本開示の第３の態様に係るプログラムは、コンピュータを、複数の撮像装置のそれぞれで撮像された複数の映像のそれぞれに含まれる、時刻毎の複数の画像における二以上の画像を合成した合成画像をエンコードすることで生成されたエンコードデータを受信する受信部、前記エンコードデータをデコードすることで、前記合成画像を取得するデコード部、表示する映像の位置の選択の入力を受け付ける入力部、前記合成画像から、前記位置に対応する画像を取り出す選択部、及び、前記取り出された画像を表示する表示部、として機能させることを特徴とする。

　本開示の第１の態様に係る映像配信システムは、映像配信装置及びユーザ端末を備える映像配信システムであって、前記映像配信装置は、複数の撮像装置のそれぞれで撮像された複数の映像を取得する取得部と、前記複数の映像のそれぞれに含まれる、時刻毎の複数の画像における二以上の画像を合成することで、合成画像を生成する合成部と、前記合成画像をエンコードすることで、エンコードデータを生成するエンコード部と、前記エンコードデータを配信する配信部と、を備え、前記ユーザ端末は、前記エンコードデータを受信する受信部と、前記エンコードデータをデコードすることで、前記合成画像を取得するデコード部と、前記合成画像から前記二以上の画像を分離する分離部と、表示する映像の選択の入力を受け付ける入力部と、前記二以上の画像の中から、選択された映像の画像を表示する表示部と、を備えることを特徴とする。

　本開示の第２の態様に係る映像配信システムは、映像配信装置及びユーザ端末を備える映像配信システムであって、前記映像配信装置は、複数の撮像装置のそれぞれで撮像された複数の映像を取得する取得部と、前記複数の映像のそれぞれに含まれる、時刻毎の複数の画像における二以上の画像を合成することで、合成画像を生成する合成部と、前記合成画像をエンコードすることで、エンコードデータを生成するエンコード部と、前記エンコードデータを配信する配信部と、を備え、前記ユーザ端末は、前記エンコードデータを受信する受信部と、前記エンコードデータをデコードすることで、前記合成画像を取得するデコード部と、表示する映像の位置の選択の入力を受け付ける入力部と、前記合成画像から、前記位置に対応する画像を取り出す選択部と、前記取り出された画像を表示する表示部と、を備えることを特徴とする。

　本開示の一態様に係る映像配信方法は、複数の撮像装置のそれぞれで撮像された複数の映像を取得し、前記複数の映像のそれぞれに含まれる、時刻毎の複数の画像における二以上の画像を合成することで、合成画像を生成し、前記合成画像をエンコードすることで、エンコードデータを生成し、前記エンコードデータを配信することを特徴とする。

　本開示の一又は複数の態様によれば、ユーザ数が多くなっても、処理負荷が大きくならないように、ユーザが選択した映像を配信することができる。

実施の形態１及び２に係る映像配信システムの構成を概略的に示すブロック図である。実施の形態１における映像配信装置及びユーザ端末の構成を概略的に示すブロック図である。複数のカメラからの映像データの一例を説明するための概略図である。映像合成部が行う合成処理の一例を説明するための概略図である。（Ａ）～（Ｆ）は、実施の形態１における映像合成部による画像の合成例を示す概略図である。エンコード部が行うエンコードの一例を説明するための概略図である。コンピュータの一例を示すブロック図である。映像配信装置での処理を示すフローチャートである。ユーザ端末での処理を示すフローチャートである。（Ａ）～（Ｃ）は、ユーザ端末での処理を説明するための概略図である。（Ａ）及び（Ｂ）は、ユーザ端末での表示される映像を説明するための概略図である。（Ａ）及び（Ｂ）は、配信データの変形例を説明するための概略図である。（Ａ）及び（Ｂ）は、配信データの変形例での効果を説明するための概略図である。複数の画像を合成する第１の変形例を示す概略図である。複数のカメラを配置する第１の変形例を示す概略図である。複数のカメラを配置する第２の変形例を示す概略図である。複数の画像を合成する第２の変形例を示す概略図である。（Ａ）～（Ｄ）は、複数の画像を合成する第３の変形例を示す概略図である。実施の形態２における映像配信装置及びユーザ端末の構成を概略的に示すブロック図である。（Ａ）～（Ｅ）は、実施の形態２における映像合成部による画像の合成例を示す概略図である。実施の形態２における映像選択部での処理を説明するための概略図である。

実施の形態１．
　図１は、実施の形態１に係る映像配信システム１００の構成を概略的に示すブロック図である。
　映像配信システム１００は、映像配信装置１１０と、ユーザ端末１３０Ａ～１３０Ｄとを備える。
　なお、ユーザ端末１３０Ａ～１３０Ｄは、映像を見る機能に関して同様に構成されているため、ユーザ端末１３０Ａ～１３０Ｄの各々を特に区別する必要がない場合には、ユーザ端末１３０Ａ～１３０Ｄの何れか一つをユーザ端末１３０という。

　映像配信システム１００では、映像配信装置１１０は、複数の撮像装置としての複数のカメラ１０１Ａ～１０１Ｌで撮像された映像データを取得して、ユーザ端末１３０にユーザが見る映像を含む配信データを配信する。
　映像配信装置１１０は、複数のカメラ１０１Ａ～１０１Ｌの各々と、ユーザ端末１３０と、通信を行うことができるようにされている。例えば、図１では、映像配信装置１１０は、複数のカメラ１０１Ａ～１０１Ｌの各々と無線で接続されているが、有線で接続されていてもよい。同様に、映像配信装置１１０は、ユーザ端末１３０と無線で接続されているが、有線で接続されていてもよい。
　なお、複数のカメラ１０１Ａ～１０１Ｌの数については、二以上であればよい。また、複数のカメラ１０１Ａ～１０１Ｌの各々を特に区別する必要がない場合には、複数のカメラ１０１Ａ～１０１Ｌの何れか一つをカメラ１０１という。

　図２は、実施の形態１における映像配信装置１１０及びユーザ端末１３０の構成を概略的に示すブロック図である。
　映像配信装置１１０は、映像取得部１１１と、映像合成部１１２と、エンコード部１１３と、エンコードデータ記憶部１１４と、映像配信部１１５と、通信部１１６とを備える。

　映像取得部１１１は、複数のカメラ１０１Ａ～１０１Ｌのそれぞれで撮像された複数の映像を取得する取得部である。
　具体的には、映像取得部１１１は、複数のカメラ１０１Ａ～１０１Ｌの各々から、複数のカメラ１０１Ａ～１０１Ｌの各々で撮像された映像を示す映像データを受信する。
　図３は、複数のカメラ１０１Ａ～１０１Ｌからの映像データの一例を説明するための概略図である。
　図３に示されているように、例えば、カメラ１０１Ａからは、時刻ｔ＝１ｐに対応する画像Ａ００１、時刻ｔ＝２ｐに対応する画像Ａ００２、時刻ｔ＝３ｐに対応する画像Ａ００３、・・・を含む映像データが送られてくる。

　図２に戻り、映像合成部１１２は、複数のカメラ１０１Ａ～１０１Ｌから送られてきた複数の映像データのそれぞれで示される、時刻毎の複数の画像に対して合成処理を行う。ここでは、映像合成部１１２は、その複数の画像における二以上の画像を合成する。ここで、複数の画像は、複数のカメラ１０１Ａ～１０１Ｌから送られてきた複数の映像データのそれぞれから抽出されたものである。言い換えると、複数の画像に含まれている一つの画像を撮像したカメラ１０１は、その複数の画像に含まれている他の全ての画像を撮像したカメラ１０１と異なっている。

　図４は、映像合成部１１２が行う合成処理の一例を説明するための概略図である。
　ここでは、図３に示されているように、複数のカメラ１０１Ａ～１０１Ｌから、その各々で撮像された映像データが取得されているものとする。
　図４に示されているように、映像合成部１１２は、複数のカメラ１０１Ａ～１０１Ｌのそれぞれから得られる複数の画像を、カメラ１０１Ａ～１０１Ｄからの映像データで示される画像からなる第１のグループ、カメラ１０１Ｅ～１０１Ｈからの映像データで示される画像からなる第２のグループ、及び、カメラ１０１Ｉ～１０１Ｌからの映像データで示される画像からなる第３のグループに分けて、グループ毎に、同じ時刻に対応する画像を合成する。
　言い換えると、映像合成部１１２は、複数のカメラ１０１Ａ～１０１Ｌのそれぞれから取得される複数の映像データのそれぞれで示される複数の画像を複数のグループに分けて、複数のグループの各々に含まれる二以上の画像を合成する。

　図５（Ａ）～（Ｆ）は、映像合成部１１２による画像の合成例を示す概略図である。
　ここでは、図５（Ａ）に示されているシーンを、四台のカメラ１０１Ａ～１０１Ｄで撮像するものとする。

　図５（Ｂ）～（Ｅ）で示されている画像Ｉｍ１～Ｉｍ４は、それぞれ、同時刻において、四台のカメラ１０１Ａ～１０１Ｄで撮像された画像を示している。
　図５（Ｆ）に示されているように、映像合成部１１２は、画像Ｉｍ１～Ｉｍ４を横方向に連結することで、合成を行い、一つの合成画像を生成する。

　図２に戻り、エンコード部１１３は、映像合成部１１２で合成された合成画像をエンコードすることで、エンコードデータを生成する。
　ここでは、エンコード部１１３は、映像合成部１１２で合成された合成画像を、予め定められた期間毎にエンコードすることで、エンコードデータを生成する。
　図６は、エンコード部１１３が行うエンコードの一例を説明するための概略図である。
　ここでも、図３に示されているように、複数のカメラ１０１Ａ～１０１Ｌから、その各々で撮像された映像データが取得されているものとする。
　図６に示されているように、エンコード部１１３は、時刻ｔ＝１ｐ～時刻ｔ＝６ｐの合成画像をエンコードすることで、エンコードデータを生成する。図６に示されているように、ここでは、エンコードデータは、図４で説明したグループ毎に生成される。

　図２に戻り、エンコードデータ記憶部１１４は、エンコード部１１３で生成されたエンコードデータを記憶する。

　映像配信部１１５は、エンコードデータを配信する配信部である。
　ここでは、映像配信部１１５は、少なくともユーザが見る映像の画像を含むエンコードデータをエンコードデータ記憶部１１４から読み出し、そのエンコードデータを配信データとして、通信部１１６にユーザ端末１３０へ送信させる。

　例えば、映像配信部１１５は、ユーザ端末１３０が、ユーザ端末１３０において見られている映像の位置を示す位置情報を、通信部１１６を介して受け取り、その位置情報で示される位置に対応する画像を含むエンコードデータをエンコードデータ記憶部１１４から読み出す。

　通信部１１６は、ユーザ端末１３０と通信を行う。
　例えば、通信部１１６は、配信データをユーザ端末１３０に送信し、ユーザ端末１３０から位置情報を受信する。

　以上に記載された映像合成部１１２、エンコード部１１３及び映像配信部１１５は、例えば、図７に示されているように、メモリ１０と、メモリ１０に格納されているプログラムを実行するＣＰＵ（Ｃｅｎｔｒａｌ　Ｐｒｏｃｅｓｓｉｎｇ　Ｕｎｉｔ）等のプロセッサ１１とを備えるコンピュータ１２により実現することができる。このようなプログラムは、ネットワークを通じて提供されてもよく、また、記録媒体に記録されて提供されてもよい。即ち、このようなプログラムは、例えば、プログラムプロダクトとして提供されてもよい。

　なお、エンコードデータ記憶部１１４は、ＨＤＤ（Ｈａｒｄ　Ｄｉｓｃ　Ｄｒｉｖｅ）又はＳＳＤ（Ｓｏｌｉｄ　Ｓｔａｔｅ　Ｄｒｉｖｅ）等の記憶装置により実現することができる。
　また、映像取得部１１１及び通信部１１６は、無線通信を行う無線通信インターフェースにより実現することができる。なお、映像取得部１１１及び通信部１１６は、一つの無線通信インターフェースにより実現されてもよく、別々の無線通信インターフェースにより実現されてもよい。

　図２に戻り、ユーザ端末１３０は、通信部１３１と、デコード部１３２と、映像分離部１３３と、映像記憶部１３４と、映像選択部１３５と、入力部１３６と、映像表示部１３７とを備える。

　通信部１３１は、映像配信装置１１０と通信を行う。
　例えば、通信部１３１は、映像配信装置１１０からの配信データを受信する受信部として機能する。また、通信部１３１は、位置情報を映像配信装置１１０に送信する送信部として機能する。

　デコード部１３２は、通信部１３１を介して、映像配信装置１１０から配信データを受け取り、受け取った配信データをデコードする。これにより、デコード部１３２は、合成画像を取得することができる。

　映像分離部１３３は、デコード部１３２で取得された合成画像から二以上の画像を分離する。
　実施の形態１では、映像分離部１３３は、デコード部１３２で取得された合成画像を分離することで、カメラ１０１毎の画像を生成する。ここで、ユーザ端末１３０は、映像配信装置１１０から、配信データにおいて、どの位置の画像がどの位置のカメラ１０１に対応するかの情報である位置設定情報を予め取得しておくことで、分離された画像がどの位置のカメラ１０１の画像であるかを識別することができる。また、配信データに、合成画像の位置と、カメラ１０１との位置とを識別するための識別情報が含まれていてもよい。

　映像記憶部１３４は、映像分離部１３３で分離された画像を記憶する。

　映像選択部１３５は、入力部１３６を介して、ユーザから表示する映像の選択の入力を受け付ける。
　例えば、映像選択部１３５は、入力部１３６を介して、ユーザからカメラ位置の選択を受け付け、選択されたカメラ位置の画像を映像記憶部１３４から順次読み出して映像表示部１３７に送ることで、映像表示部１３７に、選択されたカメラ位置の映像を表示させる。

　また、映像選択部１３５は、ユーザにより選択されたカメラ位置を示す位置情報を生成し、通信部１３１を介して、その位置情報を映像配信装置１１０に送る。

　入力部１３６は、ユーザからの指示の入力を受け付ける。例えば、入力部１３６は、ユーザからカメラ１０１の位置を示すカメラ位置の選択の入力を受け付ける。これにより、入力部１３６は、表示する映像の選択の入力を受け付けることができる。

　映像表示部１３７は、映像選択部１３５から送られてくる画像を順次表示することにより、映像を表示する表示部である。これにより、映像表示部１３７は、ユーザが選択した映像の画像を順次表示することで、ユーザが選択した映像を表示することができる。

　以上に記載されたユーザ端末１３０のデコード部１３２、映像分離部１３３、映像記憶部１３４及び映像選択部１３５は、例えば、図７に示されているように、メモリ１０と、メモリ１０に格納されているプログラムを実行するＣＰＵ等のプロセッサ１１とを備えるコンピュータ１２により実現することができる。このようなプログラムは、ネットワークを通じて提供されてもよく、また、記録媒体に記録されて提供されてもよい。即ち、このようなプログラムは、例えば、プログラムプロダクトとして提供されてもよい。

　なお、映像記憶部１３４は、揮発性又は不揮発性のメモリにより実現することができる。
　また、通信部１３１は、無線通信を行う無線通信インターフェースにより実現することができる。
　入力部１３６は、ユーザからの入力を受け付ける入力装置により実現することができる。
　映像表示部１３７は、ディスプレイにより実現することができる。
　なお、入力部１３６及び映像表示部１３７は、タッチパネルにより実現されてもよい。

　図８は、映像配信装置１１０での処理を示すフローチャートである。
　まず、映像取得部１１１は、複数のカメラ１０１Ａ～１０１Ｌのそれぞれから、複数のカメラ１０１Ａ～１０１Ｌのそれぞれで撮像された映像を示す映像データを受信する（Ｓ１０）。受信された映像データは、映像合成部１１２に与えられる。

　映像合成部１１２は、複数のカメラ１０１Ａ～１０１Ｌから送られてきた複数の映像データのそれぞれで示される同じ時刻に対応する複数の画像に対して合成処理を行う（Ｓ１１）。例えば、映像合成部１１２は、複数のカメラ１０１Ａ～１０１Ｌから取得される複数の映像データで示される複数の画像を複数のグループに分けて、複数のグループの各々において、同じ時刻に対応する二以上の画像を合成する。ここで合成された合成画像は、エンコード部１１３に与えられる。

　エンコード部１１３は、映像合成部１１２で合成された合成画像を、予め定められた期間毎にエンコードすることで、エンコードデータを生成する（Ｓ１２）。エンコードデータは、エンコードデータ記憶部１１４に記憶される。

　映像配信部１１５は、少なくともユーザが見る映像の画像を含むエンコードデータをエンコードデータ記憶部１１４から読み出し、そのエンコードデータを配信データとして、通信部１１６を介してユーザ端末１３０に送る（Ｓ１３）。

　以上のようにして、少なくともユーザが見る映像の画像を含むエンコードデータがユーザ端末１３０に配信される。

　図９は、ユーザ端末１３０での処理を示すフローチャートである。
　まず、通信部１３１は、映像配信装置１１０からの配信データを受信する（Ｓ２０）。受信された配信データは、デコード部１３２に与えられる。

　デコード部１３２は、通信部１３１から配信データを受け取り、受け取った配信データをデコードする（Ｓ２１）。これにより、デコード部１３２は、合成画像を取得し、その合成画像を映像分離部１３３に与える。

　映像分離部１３３は、デコード部１３２で取得された合成画像を分離することで、カメラ１０１毎の画像を生成する（Ｓ２２）。ここで分離された画像は、映像記憶部１３４に記憶される。

　映像選択部１３５は、入力部１３６を介して、ユーザにより選択されたカメラ位置の画像を映像記憶部１３４から順次読み出して映像表示部１３７に送ることで、映像表示部１３７に、選択されたカメラ位置の映像を表示させる（Ｓ２３）。
　以上により、ユーザは、ユーザ自身が選択したカメラの映像を見ることができる。

　図１０（Ａ）～（Ｃ）並びに図１１（Ａ）及び（Ｂ）は、ユーザ端末１３０での処理を説明するための概略図である。
　例えば、通信部１３１は、図１０（Ａ）に示されているような、カメラ１０１Ａ～１０１Ｄで撮像された画像が合成され、時刻ｔ＝１ｐ～時刻ｔ＝６ｐまでの期間の合成画像がエンコードされた配信データを取得する。

　デコード部１３２が、その配信データをデコードすることで、図１０（Ｂ）に示されているような、合成画像が取得される。

　映像分離部１３３が、その合成画像をカメラ１０１Ａ～１０１Ｄ毎に分離することで、図１０（Ｃ）に示されているように、カメラ１０１Ａ～１０１Ｄ毎の画像が取得される。

　このような場合において、第１のユーザが図１０（Ｃ）の破線Ｌ１で示されているように、時刻ｔ＝１ｐ～時刻ｔ＝３ｐにおいてカメラ１０１Ａの位置、時刻ｔ＝４ｐにおいてカメラ１０１Ｂの位置、時刻ｔ＝５ｐにおいてカメラ１０１Ｃの位置、及び、時刻ｔ＝６ｐにおいてカメラ１０１Ｂの位置を選択した場合には、図１１（Ａ）に示されているように、第１のユーザが使用しているユーザ端末１３０Ａでは、第１のユーザの選択に応じた画像を含む映像が表示される。

　一方、第２のユーザが、その第２のユーザが使用しているユーザ端末１３０Ｂにおいて、図１０（Ｃ）の破線Ｌ２で示されているように、時刻ｔ＝１ｐ～時刻ｔ＝６ｐにおいてカメラ１０１Ｄの位置を選択した場合には、図１１（Ｂ）に示されているように、第２のユーザの選択に応じた画像を含む映像が表示される。

　以上のような場合でも、映像配信装置１１０は、第１のユーザが使用しているユーザ端末１３０Ａ及び第２のユーザが使用しているユーザ端末１３０Ｂに、図１０（Ａ）に示されているような配信データを送信すればよいため、ユーザ毎にエンコードデータを生成する必要がなくなる。
　また、ユーザが配信データに含まれている合成画像の範囲内で位置を変更しても、映像配信装置１１０は、配信データを変更する必要がなく、映像配信装置１１０の処理負荷が軽減される。

　なお、図１０に示した例では、ユーザが見ている映像の画像が含まれているグループの合成画像から生成された配信データのみが送信されている例を示したが、実施の形態１は、このような例に限定されるものではない。
　例えば、図１２（Ａ）及び（Ｂ）並びに図１３（Ａ）及び（Ｂ）は、配信データの変形例を説明するための概略図である。

　図１２（Ａ）に示されているように、一つのユーザ端末１３０に、カメラ１０１Ｅ～１０１Ｈで撮像された画像のグループから生成されたエンコードデータと、カメラ１０１Ｉ～１０１Ｌで撮像された画像のグループから生成されたエンコードデータとを、配信データとして送信するようにしてもよい。

　言い換えると、映像配信部１１５は、ユーザ端末１３０で見られている映像に含まれている画像を含む第１のグループに対応するエンコードデータと、ユーザ端末１３０で見られている映像に含まれている画像を含まない第２のグループに対応するエンコードデータとを通信部１１６にユーザ端末１３０へ送信させてもよい。ここで、第２のグループは、第１のグループに含まれている画像からなる映像を見ているユーザが映像を切り替える可能性の高いグループであることが望ましい。

　このような場合、ユーザ端末１３０のデコード部１３２は、それぞれの配信データをデコードすることで、図１２（Ｂ）に示されているように、カメラ１０１Ｅ～１０１Ｈで撮像された画像の合成画像と、カメラ１０１Ｉ～１０１Ｌで撮像された画像の合成画像とを取得することができる。

　そして、映像分離部１３３が、それぞれの合成画像を分離することで、図１３（Ａ）に示されているように、カメラ１０１Ｅ～１０１Ｌで撮像された画像が取得される。
　この場合において、ユーザが図１３（Ａ）の破線Ｌ３で示されているように、時刻ｔ＝１ｐ～時刻ｔ＝３ｐにおいてカメラ１０１Ｉの位置を選択し、時刻ｔ＝４ｐにおいてカメラ１０１Ｈの位置を選択し、時刻ｔ＝５ｐにおいてカメラ１０１Ｇの位置を選択し、及び、時刻ｔ＝６ｐにおいて、カメラ１０１Ｆの位置を選択することで、図１３（Ｂ）に示されているように、複数のグループに含まれている画像からなる映像がユーザ端末１３０に表示される。

　このような場合にも、映像配信装置１１０は、ユーザ端末１３０に送信している配信データの範囲内では、ユーザの選択に応じて、ユーザ端末１３０に送信する配信データを変える必要がなくなり、映像配信装置１１０の処理負荷を軽減することができる。

　なお、ユーザ端末１３０に送信する、一つの時刻に対応するエンコードデータの数及びそのエンコードデータの選択については、ユーザが見ている映像の位置に応じて予め定められていてもよく、また、ユーザが見ている映像の位置に応じて変化させてもよい。

　具体的には、ユーザが見ている映像の画像が含まれているグループから移動する可能性の高いグループの配信データが、そのユーザが使用しているユーザ端末１３０に送信されてもよい。例えば、図５で説明した例で示されているように、被写体に対して、複数のカメラ１０１を一列に配置した場合には、ユーザが見ている映像の画像が含まれているグループに隣接するグループから生成されたエンコードデータも、そのユーザが使用しているユーザ端末１３０に送信されればよい。

　また、例えば、図１２（Ａ）に示されている例において、ユーザがカメラ１０１Ｆ又はカメラ１０１Ｇからの映像を見ている場合には、カメラ１０１Ｅ～１０１Ｈで撮像された画像のグループから生成されたエンコードデータのみが送信され、ユーザがカメラ１０１Ｈからの映像に移動した場合に、隣接するグループであるカメラ１０１Ｉ～１０１Ｌで撮像された画像のグループから生成されたエンコードデータも送信されるようにしてもよい。
　言い換えると、ユーザが見ている位置から、別のグループに移動する可能性が高くなった場合に、移動する可能性が高くなったグループから生成されたエンコードデータも送信されるようにすればよい。

　また、以上に記載された実施の形態１では、複数のカメラ１０１で撮像された複数の画像が複数のグループに分けて合成されているが、実施の形態１は、このような例に限定されるものではない。
　例えば、図１４に示されているように、複数のカメラ１０１で撮像された複数の画像の全てが、一つの画像に合成されてもよい。ここで合成される複数の画像は、同じ時刻に対応する画像である。このような場合、映像配信装置１１０は、ユーザが見ている位置に応じて、ユーザ端末１３０に送信するエンコードデータを変える必要がなくなるため、処理負荷が軽減される。この場合には、ユーザ端末１３０も、位置情報を映像配信装置１１０に送信する必要がなくなり、処理負荷が軽減される。

　また、以上に記載された実施の形態１では、例えば、図１において、複数のカメラ１０１が一つの直線上に配置されている例を示したが、実施の形態１はこのような例に限定されない。例えば、図１５に示されているように、複数のカメラ１０１Ａ～１０１Ｎが、被写体に対して複数の直線上に配置されていてもよい。

　さらに、図１６に示されているように、複数のカメラ１０１Ａ～１０１Ｈが、被写体の周囲を囲むように円形に配置されていてもよい。
　言い換えると、複数のカメラ１０１は、自由に配置することができる。

　また、以上に記載された実施の形態１では、図５（Ｆ）に示されているように、複数のカメラ１０１で撮像された画像Ｉｍ１～Ｉｍ４を一方向（図５では横方向）に連結することで合成が行われているが、実施の形態１はこのような例に限定されるものではない。
　例えば、図１７に示されているように、映像合成部１１２は、画像Ｉｍ１～Ｉｍ４を二方向（図１７では、縦方向及び横方向）に連結、言い換えると、二列に連結することで合成を行ってもよい。

　さらに、以上に記載された実施の形態１では、図５（Ｆ）に示されているように、複数のカメラ１０１の各々で撮像された画像Ｉｍ１～Ｉｍ４を連結することにより合成が行われているが、実施の形態１は、このような例に限定されない。
　例えば、複数の画像の各々を構成する画素値を、対応する画素位置毎に連結することで、複数の画像の合成が行われてもよい。具体例を、図１８（Ａ）～（Ｄ）を用いて説明する。

　図１８（Ａ）は、カメラ１０１Ａで撮像された画像ＩｍＡを示し、図１８（Ｂ）は、カメラ１０１Ｂで撮像された画像ＩｍＢを示し、図１８（Ｃ）は、カメラ１０１Ｃで撮像された画像ＩｍＣを示しているものとする。また、画像ＩｍＡ～ＩｍＣのサイズは、同一であるものとする。ここでは、画像ＩｍＡ～ＩｍＣを合成する場合について説明する。

　このような場合、例えば、図１８（Ｄ）に示されているように、画像ＩｍＡの第１列第１行の画素位置の画素値Ａ（１，１）、画像ＩｍＢの第１列第１行の画素位置の画素値Ｂ（１，１）、画像ＩｍＣの第１列第１行の画素位置の画素値Ｃ（１，１）、画像ＩｍＡの第２列第１行の画素位置の画素値Ａ（２，１）、画像ＩｍＢの第２列第１行の画素位置の画素値Ｂ（２，１）、画像ＩｍＣの第２列第１行の画素位置の画素値Ｃ（２，１）、・・・といった順番で配列することにより、合成画像ＣＩｍ１を生成することができる。

　合成画像ＣＩｍ１では、画像ＩｍＡ、ＩｍＢ、ＩｍＣのそれぞれの対応する画素位置の画素値が、合成画像ＣＩｍ１の対応する画素位置に配置されているため、合成画像ＣＩｍ１から容易に画像ＩｍＡ、ＩｍＢ、ＩｍＣを分離することができる。

　また、例えば、画像ＩｍＡ、ＩｍＢ、ＩｍＣが、同じ被写体を撮像した画像である場合には、画像ＩｍＡ、ＩｍＢ、ＩｍＣのそれぞれにおいて対応する画素位置の画素値は、類似の画素値になる可能性が高い。このような場合において、合成画像を圧縮すると、圧縮技術にもよるが、圧縮率を高くすることも可能となる。

実施の形態２．
　図１に示されているように、実施の形態２に係る映像配信システム２００は、映像配信装置２１０と、ユーザ端末２３０Ａ～２３０Ｄとを備える。
　なお、ユーザ端末２３０Ａ～２３０Ｄも、映像を見る機能に関して同様に構成されているため、ユーザ端末２３０Ａ～２３０Ｄの各々を特に区別する必要がない場合には、ユーザ端末２３０Ａ～２３０Ｄの何れか一つをユーザ端末２３０という。

　実施の形態２に係る映像配信システム２００でも、映像配信装置２１０は、複数のカメラ１０１Ａ～１０１Ｌで撮像された映像データを取得して、ユーザ端末２３０にユーザが見る映像を含む配信データを配信する。

　図１９は、実施の形態２における映像配信装置２１０及びユーザ端末２３０の構成を概略的に示すブロック図である。
　実施の形態２における映像配信装置２１０は、映像取得部１１１と、映像合成部２１２と、エンコード部１１３と、エンコードデータ記憶部１１４と、映像配信部１１５と、通信部１１６とを備える。
　実施の形態２における映像配信装置２１０の映像取得部１１１、エンコード部１１３、エンコードデータ記憶部１１４、映像配信部１１５及び通信部１１６は、実施の形態１における映像配信装置１１０の映像取得部１１１、エンコード部１１３、エンコードデータ記憶部１１４、映像配信部１１５及び通信部１１６と同様である。

　映像合成部２１２は、複数のカメラ１０１Ａ～１０１Ｌから送られてきた複数の映像データのそれぞれで示される複数の画像に対して合成処理を行う合成部である。ここでも、映像合成部２１２は、その複数の画像における二以上の画像を合成する。

　実施の形態１における映像合成部１１２は、例えば、図５（Ｂ）～（Ｅ）に表されている画像Ｉｍ１～Ｉｍ４を、図５（Ｆ）に示されているように、単に連結することで、合成画像を生成している。

　これに対して、実施の形態２における映像合成部２１２は、複数のカメラ１０１で撮像された複数の画像のつなぎ目がわからないように、その複数の画像を合成する。
　実施の形態２における映像合成部２１２での処理の具体例を、図２０（Ａ）～（Ｅ）を用いて説明する。

　図２０（Ａ）～（Ｄ）で示されている画像Ｉｍ１～Ｉｍ４は、それぞれ、同時刻において、四台のカメラ１０１Ａ～１０１Ｄで撮像された画像を示している。
　ここでは、複数のカメラ１０１は、一つのカメラ１０１で撮像された画像が、他のカメラ１０１で撮像された画像と、連結する方向において少なくとも一部が重複するように配列されているものとする。

　このような場合、図２０（Ｅ）に示されているように、映像合成部２１２は、画像Ｉｍ１～Ｉｍ４を横方向において重複している部分がなくなるように連結することで、合成を行い、一つの合成画像を生成する。
　一例として、映像合成部２１２は、連結する方向において重複している部分を、重複している複数の画像の内、何れか一つの画像を採用し、残り画像から重複している部分を削除することで、これらを連結すればよい。これにより、これらの複数の画像において重複している部分をなくすことができる。

　図１９に戻り、ユーザ端末２３０は、通信部１３１と、デコード部１３２と、映像記憶部２３４と、映像選択部２３５と、入力部１３６と、映像表示部１３７とを備える。
　実施の形態２におけるユーザ端末２３０は、実施の形態１におけるユーザ端末１３０の映像分離部１３３を備えていない。
　また、実施の形態２におけるユーザ端末２３０の通信部１３１、デコード部１３２、入力部１３６及び映像表示部１３７は、実施の形態１におけるユーザ端末１３０の通信部１３１、デコード部１３２、入力部１３６及び映像表示部１３７と同様である。

　映像記憶部２３４は、デコード部１３２で取得された合成画像を記憶する。

　映像選択部２３５は、入力部１３６を介して、ユーザから表示する映像の位置である表示位置の選択を受け付け、選択された表示位置に対応する画像を映像記憶部１３４に記憶されている合成画像から取り出す。そして、映像選択部２３５は、取り出された画像を、順次、映像表示部１３７に送ることで、映像表示部１３７に、選択された表示位置の映像を表示させる。

　図２１は、映像選択部２３５での処理を説明するための概略図である。
　例えば、ユーザは、映像表示部１３７に表示されている映像を見ながら、画像が連結されている方向、図２１においては、横方向において、入力部１３６に表示位置を移動させることができるものとする。
　この場合、映像選択部２３５は、ユーザが移動させた表示位置に対応する画像ＳＩｍを、合成画像ＣＩｍ２から取り出す。

　このような場合、映像選択部２３５は、例えば、合成画像における基準となる位置である合成画像基準位置と、ユーザの表示位置を示す表示基準位置とを予め定めておき、これらの間の距離を位置情報として、映像配信装置２１０に送ればよい。

　例えば、合成画像ＣＩｍ２の横方向における左端の位置Ｐ１を合成画像基準位置とし、ユーザが見る画像ＳＩｍの横方向における左端の位置Ｐ２を表示基準位置とすると、これらの位置Ｐ１及びＰ２との間の距離Ｄが位置情報となる。

　このような場合、ユーザが合成画像を超えて表示位置を移動させた場合にも、映像配信装置２１０は、どの合成画像のエンコードデータを送信すればよいかを認識することができる。
　例えば、図２１に示されている例では、位置Ｐ１と、位置Ｐ２との間の距離が、位置Ｐ１と、合成画像の横方向における右端の位置Ｐ３との間の距離よりも長い場合には、映像配信装置２１０は、その長さに応じて、合成画像ＣＩｍの右方向の画像を含む別の合成画像があれば、その別の合成画像のエンコードデータをユーザ端末２３０に配信すればよい。
　また、位置Ｐ１と、位置Ｐ２との間の距離がマイナスになる場合には、映像配信装置２１０は、その長さの絶対値に応じて、合成画像ＣＩｍの左方向の画像を含む別の合成画像があれば、その別の合成画像をユーザ端末２３０に配信すればよい。

　以上のように、実施の形態２によれば、ユーザは、カメラ位置によらずに、自身が視聴したい位置の映像を見ることができる。

　１００，２００　映像配信システム、　１０１　カメラ、　１１０，２１０　映像配信装置、　１１１　映像取得部、　１１２，２１２　映像合成部、　１１３　エンコード部　、　１１４　エンコードデータ記憶部、　１１５　映像配信部、　１１６　通信部、　１３０，２３０　ユーザ端末、　１３１　通信部、　１３２　デコード部、　１３３　映像分離部、　１３４，２３４　映像記憶部、　１３５，２３５　映像選択部、　１３６　入力部、　１３７　映像表示部。

Claims

　複数の撮像装置のそれぞれで撮像された複数の映像を取得する取得部と、
　前記複数の映像のそれぞれに含まれる、時刻毎の複数の画像における二以上の画像を合成することで、合成画像を生成する合成部と、
　前記合成画像をエンコードすることで、エンコードデータを生成するエンコード部と、
　前記エンコードデータを配信する配信部と、を備えること
　を特徴とする映像配信装置。
　前記合成部は、前記複数の画像を二以上のグループに分け、前記二以上のグループの各々に含まれる前記二以上の画像を合成すること
　を特徴とする請求項１に記載の映像配信装置。
　ユーザ端末と通信を行う通信部をさらに備え、
　前記配信部は、前記二以上のグループの内、前記ユーザ端末で見られている映像に含まれている画像を含むグループに対応する前記エンコードデータを、前記通信部に前記ユーザ端末へ送信させること
　を特徴とする請求項２に記載の映像配信装置。
　ユーザ端末と通信を行う通信部をさらに備え、
　前記配信部は、前記二以上のグループの内、前記ユーザ端末で見られている映像に含まれている画像を含む第１のグループに対応する前記エンコードデータと、前記二以上のグループの内、前記ユーザ端末で見られている映像に含まれている画像を含まない第２のグループに対応する前記エンコードデータと、を前記通信部に前記ユーザ端末へ送信させること
　を特徴とする請求項２に記載の映像配信装置。
　前記合成部は、前記複数の画像の全てを一つの画像に合成することにより、前記合成画像を生成すること
　を特徴とする請求項１に記載の映像配信装置。
　前記複数のカメラに含まれる二以上のカメラで撮像される映像は、一部が重複するように撮像されており、
　前記合成部は、前記二以上のカメラで撮像された映像に含まれている前記二以上の画像を、前記一部の重複がなくなるように合成すること
　を特徴とする請求項１から５の何れか一項に記載の映像配信装置。
　複数の撮像装置のそれぞれで撮像された複数の映像のそれぞれに含まれる、時刻毎の複数の画像における二以上の画像を合成した合成画像をエンコードすることで生成されたエンコードデータを受信する受信部と、
　前記エンコードデータをデコードすることで、前記合成画像を取得するデコード部と、
　前記合成画像から前記二以上の画像を分離する分離部と、
　表示する映像の選択の入力を受け付ける入力部と、
　前記二以上の画像の中から、選択された映像の画像を表示する表示部と、を備えること
　を特徴とするユーザ端末。
　複数の撮像装置のそれぞれで撮像された複数の映像のそれぞれに含まれる、時刻毎の複数の画像における二以上の画像を合成した合成画像をエンコードすることで生成されたエンコードデータを受信する受信部と、
　前記エンコードデータをデコードすることで、前記合成画像を取得するデコード部と、
　表示する映像の位置の選択の入力を受け付ける入力部と、
　前記合成画像から、前記位置に対応する画像を取り出す選択部と、
　前記取り出された画像を表示する表示部と、を備えること
　を特徴とするユーザ端末。
　コンピュータを、
　複数の撮像装置のそれぞれで撮像された複数の映像を取得する取得部、
　前記複数の映像のそれぞれに含まれる、時刻毎の複数の画像における二以上の画像を合成することで、合成画像を生成する合成部、
　前記合成画像をエンコードすることで、エンコードデータを生成するエンコード部、及び、
　前記エンコードデータを配信する配信部、として機能させること
　を特徴とするプログラム。
　コンピュータを、
　複数の撮像装置のそれぞれで撮像された複数の映像のそれぞれに含まれる、時刻毎の複数の画像における二以上の画像を合成した合成画像をエンコードすることで生成されたエンコードデータを受信する受信部、
　前記エンコードデータをデコードすることで、前記合成画像を取得するデコード部、
　前記合成画像から前記二以上の画像を分離する分離部、
　表示する映像の選択の入力を受け付ける入力部、及び、
　前記二以上の画像の中から、選択された映像の画像を表示する表示部、として機能させること
　を特徴とするプログラム。
　コンピュータを、
　複数の撮像装置のそれぞれで撮像された複数の映像のそれぞれに含まれる、時刻毎の複数の画像における二以上の画像を合成した合成画像をエンコードすることで生成されたエンコードデータを受信する受信部、
　前記エンコードデータをデコードすることで、前記合成画像を取得するデコード部、
　表示する映像の位置の選択の入力を受け付ける入力部、
　前記合成画像から、前記位置に対応する画像を取り出す選択部、及び、
　前記取り出された画像を表示する表示部、として機能させること
　を特徴とするプログラム。
　映像配信装置及びユーザ端末を備える映像配信システムであって、
　前記映像配信装置は、
　複数の撮像装置のそれぞれで撮像された複数の映像を取得する取得部と、
　前記複数の映像のそれぞれに含まれる、時刻毎の複数の画像における二以上の画像を合成することで、合成画像を生成する合成部と、
　前記合成画像をエンコードすることで、エンコードデータを生成するエンコード部と、
　前記エンコードデータを配信する配信部と、を備え、
　前記ユーザ端末は、
　前記エンコードデータを受信する受信部と、
　前記エンコードデータをデコードすることで、前記合成画像を取得するデコード部と、
　前記合成画像から前記二以上の画像を分離する分離部と、
　表示する映像の選択の入力を受け付ける入力部と、
　前記二以上の画像の中から、選択された映像の画像を表示する表示部と、を備えること
　を特徴とする映像配信システム。
　映像配信装置及びユーザ端末を備える映像配信システムであって、
　前記映像配信装置は、
　複数の撮像装置のそれぞれで撮像された複数の映像を取得する取得部と、
　前記複数の映像のそれぞれに含まれる、時刻毎の複数の画像における二以上の画像を合成することで、合成画像を生成する合成部と、
　前記合成画像をエンコードすることで、エンコードデータを生成するエンコード部と、
　前記エンコードデータを配信する配信部と、を備え、
　前記ユーザ端末は、
　前記エンコードデータを受信する受信部と、
　前記エンコードデータをデコードすることで、前記合成画像を取得するデコード部と、
　表示する映像の位置の選択の入力を受け付ける入力部と、
　前記合成画像から、前記位置に対応する画像を取り出す選択部と、
　前記取り出された画像を表示する表示部と、を備えること
　を特徴とする映像配信システム。
　複数の撮像装置のそれぞれで撮像された複数の映像を取得し、
　前記複数の映像のそれぞれに含まれる、時刻毎の複数の画像における二以上の画像を合成することで、合成画像を生成し、
　前記合成画像をエンコードすることで、エンコードデータを生成し、
　前記エンコードデータを配信すること
　を特徴とする映像配信方法。