WO2023276005A1

WO2023276005A1 - 制御装置、撮影システムおよび追尾制御方法

Info

Publication number: WO2023276005A1
Application number: PCT/JP2021/024593
Authority: WO
Inventors: 智明龍; 孝幸永井; 貴文甲斐
Original assignee: 三菱電機株式会社
Priority date: 2021-06-29
Filing date: 2021-06-29
Publication date: 2023-01-05
Also published as: JPWO2023276005A1

Abstract

本開示にかかる制御装置（１）は、撮影方向および撮影画角が調整可能な１つ以上の追尾用撮影装置（５－１～５－Ｎ）を制御する制御装置（１）であって、イベントの出演者である複数の追尾対象者のそれぞれの位置に関する情報である位置関連情報を用いて、追尾対象者ごとに、当該追尾対象者を判断対象者とし、イベントの他の出演者の位置と判断対象者の位置とに応じた撮影画角の調整量である画角調整量を決定する領域判断部（１５）および画角制御部（１９）と、を備える。

Description

制御装置、撮影システムおよび追尾制御方法

　本開示は、イベントにおいて追尾用撮影装置を制御する制御装置、撮影システムおよび追尾制御方法に関する。

　放送または配信によりユーザに提供する映像を撮影する際に、移動する撮影対象者を追尾して撮影を行うことがある。特許文献１には、撮影対象者を自動追尾する撮影装置が開示されている。特許文献１に記載の技術では、撮影装置の制御パラメータを撮影対象者の位置に応じてあらかじめ制御モデルとして定めておき、撮影対象者の３次元空間内の位置を検出し、検出した位置と制御モデルとを用いて撮影対象者の位置に応じた制御パラメータを決定し、決定した制御パラメータを用いて撮影を行う。

特開平９－３２２０５２号公報

　コンサート、演劇などのイベントでは、複数の出演者が出演する。近年、このような複数の出演者のうち２人以上のそれぞれを追尾対象とし、ユーザが複数の追尾対象者のなかから映像の配信を希望する追尾対象者を選択し、選択した映像がユーザに配信される追尾サービスの提供が進められている。追尾対象者が複数の場合、追尾対象者ごとに追尾用撮影装置およびカメラマンを配置すると、追尾対象者の数に応じたカメラマンの人件費を要することになる。このため、このような追尾サービスの普及のために、自動追尾により人件費が抑制されることが望ましい。

　一方、例えば、グループのコンサートなどでは、グループのメンバー全体がステージ上で様々な位置に移動する。このため、例えば、グループの各メンバーを追尾対象者とする場合、追尾対象者自体の位置が同一であっても、グループ内の他のメンバーとの相対的な関係によっては、追尾用撮影装置における適切な制御パラメータが異なることも考えられる。特許文献１には、自動追尾の技術が開示されているが、定められた一人の追尾対象者の位置に応じて制御パラメータが決定されており、他の出演者との相対的な関係については考慮されていない。このため、特許文献１に記載の技術では、追尾対象者が複数存在する場合に、追尾用撮影装置の制御パラメータを適切に決定することができないという問題があった。

　本開示は、上記に鑑みてなされたものであって、追尾対象者が複数存在する場合に、追尾用撮影装置の制御パラメータを適切に決定することができる制御装置を得ることを目的とする。

　上述した課題を解決し、目的を達成するために、本開示にかかる制御装置は、撮影方向および撮影画角が調整可能な１つ以上の追尾用撮影装置を制御する制御装置であって、イベントの出演者である複数の追尾対象者のそれぞれの位置に関する情報である位置関連情報を用いて、追尾対象者ごとに、当該追尾対象者を判断対象者とし、イベントの他の出演者の位置と判断対象者の位置とに応じた撮影画角の調整量である画角調整量を決定する画角判断部と、を備える。

　本開示にかかる制御装置は、追尾対象者が複数存在する場合に、追尾用撮影装置の制御パラメータを適切に決定することができるという効果を奏する。

実施の形態１にかかる撮影システムの構成例を示す図実施の形態１の撮影システムにおける動作の一例を示すシーケンス図実施の形態１の制御装置における追尾用撮影装置の制御処理手順の一例を示すフローチャート実施の形態１の画像情報の一例を示す図実施の形態１の撮影装置情報の一例を示す図実施の形態１の領域の種別の一例を示す図グループのメンバーがステージ全体に広がっている場合の実施の形態１の全体映像の一例を示す図グループのメンバーが端付近に集まっている場合の実施の形態１の全体映像の一例を示す図実施の形態１における画角調整規則の一例を示す図実施の形態１の制御装置を実現するコンピュータシステムの構成例を示す図実施の形態１にかかる変形例１の撮影システムの構成例を示す図実施の形態１の変形例１における追尾対象者の配置の一例を示す図実施の形態１にかかる変形例２の撮影システムの構成例を示す図実施の形態１の行程表の一例を示す図実施の形態２の領域判断部の構成例を示す図ニューラルネットワークの一例を示す模式図実施の形態２にかかる変形例１の画角判断部の構成例を示す図実施の形態２にかかる変形例２の領域判断部の構成例を示す図実施の形態２の変形例２におけるイベント会場情報の一例を示す図実施の形態２にかかる変形例３の領域判断部の構成例を示す図実施の形態２の変形例３におけるイベント内容情報の一例を示す図

　以下に、実施の形態にかかる制御装置、撮影システムおよび追尾制御方法を図面に基づいて詳細に説明する。

実施の形態１．
　図１は、実施の形態１にかかる撮影システムの構成例を示す図である。本実施の形態の撮影システム１００は、制御装置１および追尾用撮影装置５－１～５－Ｎを備える。Ｎは２以上の整数である。撮影システム１００は、イベントに出演する出演者のうち複数の追尾対象者をそれぞれ追尾した追尾映像を取得可能である。撮影システム１００は、配信事業者装置２へ追尾対象者ごとの映像を送信する。ユーザ端末３は、複数の追尾対象者のうちユーザによって選択された追尾対象者の追尾映像を、配信事業者装置２から受信する。これにより、ユーザは、複数の追尾対象者のうち選択した追尾対象者の追尾映像を、ユーザ端末３を用いて視聴することができる。なお、図１では、制御装置１が、配信事業者装置２を介してユーザ端末３に追尾映像を送信しているが、配信事業者装置２を介さずに、制御装置１がユーザ端末３に追尾映像を送信してもよい。また、図１では、ユーザ端末３を１台図示しているが、ユーザ端末３の数は図１に示した例に限定されない。

　本実施の形態の撮影システム１００は、上述したように、複数の追尾対象者のそれぞれを追尾した追尾映像を取得可能である。追尾対象者は、例えば、コンサート、演劇などのイベントにおける出演者である。追尾対象者は、イベントの出演者の全てであってもよく一部であってもよい。例えば、アイドルグループなどのグループのコンサートにおいては、グループのメンバーのそれぞれを追尾対象者とし、バックダンサーなどの他の出演者は追尾対象者に含めないようにしてもよい。また、グループのメンバーについても、グループのメンバー全員を追尾対象者としてもよいし、一部のメンバーを追尾対象者としてもよい。

　追尾用撮影装置５－１～５－Ｎは、撮影方向および撮影画角（以下、画角と略す）が調整可能な１つ以上の追尾用撮影装置の一例であり、複数の追尾対象者のそれぞれを撮影することにより追尾映像を取得する。なお、追尾用撮影装置５－１～５－Ｎは、光学的に画角を調整してもよいし、追尾用撮影装置５－１～５－Ｎによって取得された追尾映像が制御装置１によってクリッピングされることにより画角が調整されてもよい。なお、ここでは、追尾用撮影装置５－１～５－Ｎの画角が調整可能であるとは、追尾用撮影装置５－１～５－Ｎによって取得された追尾映像が制御装置１によってクリッピングされる場合も含むとする。なお、図１では、追尾用撮影装置５－１の構成を図示しているが、追尾用撮影装置５－２～５－Ｎの構成は追尾用撮影装置５－１と同様である。以下、追尾用撮影装置５－１～５－Ｎのそれぞれを個別に区別せずに示すときには、追尾用撮影装置５と記載する。追尾用撮影装置５は、追尾対象者と１対１に対応していてもよいし、複数の対象者を１つの追尾用撮影装置５により追尾してもよいし、複数の追尾用撮影装置５を用いて１人の追尾対象者を追尾してもよい。複数の対象者を１つの追尾用撮影装置５により追尾する場合には、例えば、複数の対象者全員が映像に含まれるように設定してもよいし、時分割で追尾対象者を設定してもよい。以下では、追尾用撮影装置５が、追尾対象者と１対１に対応して設けられる例を説明するが、上述したように、追尾用撮影装置５は追尾対象者と１対１に対応していなくてもよい。

　追尾用撮影装置５は、図１に示すように、映像送信部５１、撮影部５２、追尾駆動部５３および画角駆動部５４を備える。撮影部５２は、撮影を行うことで映像を取得し、映像送信部５１へ出力する。追尾駆動部５３は撮影部５２の撮影方向を変更する駆動部であり、制御装置１からの指示に基づいて、パン、チルトを制御することができる。画角駆動部５４は、撮影部５２の画角を変更する駆動部であり、制御装置１からの指示に基づいて、画角を制御することができる。映像送信部５１は、撮影部５２により取得された映像を制御装置１へ送信する。なお、映像送信部５１は、図示しない通信装置を介して映像を制御装置１へ送信してもよい。

　全体用撮影装置４は、イベントの全体映像を取得することが可能な撮影装置である。全体映像とは、例えば、複数の追尾対象者の全体が含まれる映像、あるいは出演者の全体が含まれる映像である。全体映像は、複数の追尾対象者のそれぞれの位置に関する情報である位置関連情報の一例である。全体映像は、イベントのステージ全体が撮影された映像であってもよい。全体用撮影装置４は、全体映像を撮影する撮影部４１と、撮影部４１によって撮影された全体映像を制御装置１へ送信する映像送信部４２とを備える。なお、全体用撮影装置４は図示しない通信装置を介して、全体映像を制御装置１へ送信してもよい。

　制御装置１は、全体用撮影装置４によって取得された全体映像を用いて、追尾用撮影装置５の撮影方向の調整量である撮影方向調整量を決定し、全体映像を用いて追尾対象者が存在する領域の種別を判断し、判断した種別を用いて画角の調整量である画角調整量を決定する。そして、制御装置１は、決定した撮影方向調整量および画角調整量を追尾用撮影装置５へ指示する。領域の種別は、イベントにおける当該領域の注目度に対応し、例えば、複数の追尾対象者の位置に応じて定められる。領域の種別は、例えば、センター、端、中間などの種別である。追尾対象者がこれらの領域の種別のうちどの種別の領域に位置するかにより、適切な画角が異なる場合がある。また、複数の追尾対象者をグループのメンバーであるとすると、各領域の大きさと領域の種別とはステージ上の位置に対して固定とは限らず、メンバー全員の移動などにより変わる可能性がある。本実施の形態では、制御装置１が、全体映像を用いて、イベントの他の出演者の位置または複数の追尾対象者の位置に応じて、領域の種別を決定し、追尾対象者がどの種別の領域に位置するかに応じて画角調整量を決定する。これにより、追尾用撮影装置５は、全体映像における追尾対象者の位置に応じて追尾対象者を追尾するだけでなく、追尾対象者が存在する領域の種別に応じて画角を調整することができる。

　制御装置１は、図１に示すように、イベント情報取得部１１、追尾対象者情報通知部１２、画像情報取得部１３、追尾対象者検出部１４、領域判断部１５、画角調整規則記憶部１６、追尾制御部１７、撮影装置情報記憶部１８、画角制御部１９、映像送信部２０、全体映像取得部２１および追尾映像取得部２２を備える。

　イベント情報取得部１１は、撮影対象のイベントに関する情報であるイベント情報を取得する。イベント情報は、イベントに出演する出演者のうちの追尾対象者を示す追尾対象者情報と、各追尾対象者の画像を含む画像情報と、を含む。また、イベント情報は、イベントにおける行程を示す行程表を含んでいてもよい。追尾対象者情報は、例えば、追尾対象者の芸名、愛称などであってもよいし、芸名、愛称などが追尾対象者に付与される識別番号と対応付けられたものであってもよい。芸名、愛称などと識別番号とは、いずれも追尾対象者を識別する識別情報である。画像情報は、追尾対象者の識別情報と、対応する追尾対象者の画像とが対応付けられた情報である。イベント情報取得部１１は、オペレータから入力を受け付けることでイベント情報を取得してもよいし、配信事業者装置２または図示しない他の装置から送信されたイベント情報を受信することでイベント情報を取得してもよい。イベント情報取得部１１は、イベント情報のうち追尾対象者情報を追尾対象者情報通知部１２へ出力し、画像情報を画像情報取得部１３へ出力する。

　追尾対象者情報通知部１２は、追尾対象者情報を配信事業者装置２へ通知する。画像情報取得部１３は、イベント情報取得部１１から受け取った画像情報を追尾対象者検出部１４および領域判断部１５へ出力する。なお、ここでは、画像情報がイベント情報に含まれる例を説明するが、イベント情報に画像情報が含まれない場合は、画像情報取得部１３が、オペレータから入力を受け付けることで画像情報を取得してもよいし、配信事業者装置２または図示しない他の装置から送信された画像情報を受信することで画像情報を取得してもよい。

　全体映像取得部２１は、全体用撮影装置４から全体映像を受信することで全体映像を取得し、取得した全体映像を、映像送信部２０、追尾対象者検出部１４および領域判断部１５へ出力する。

　追尾対象者検出部１４は、全体映像取得部２１から受け取った全体映像と、画像情報取得部１３から受け取った画像情報とを用いて、追尾対象者ごとに、全体映像における追尾対象者を検出し、追尾対象者の全体映像における位置を算出し、算出した位置を追尾制御部１７へ出力する。また、追尾対象者検出部１４は、画像情報を追尾制御部１７へ出力する。詳細には、追尾対象者検出部１４は、追尾対象者ごとに、当該追尾対象者の画像を用いて画像認識処理により全体映像から追尾対象者を検出し、検出した追尾対象者の全体映像における位置を算出する。全体映像における位置は、例えば、全体映像の基準位置をあらかじめ定めておき基準位置からの横（Ｘ方向）と縦（Ｙ方向）との距離または画素数により表わされる。

　撮影装置情報記憶部１８は、追尾対象者と追尾用撮影装置５との対応を示す撮影装置情報を記憶する。撮影装置情報は、図示しない入力手段によってオペレータから入力されて撮影装置情報記憶部１８に記憶されてもよいし、図示しない他の装置から受信されて撮影装置情報記憶部１８に記憶されてもよい。

　追尾制御部１７は、全体映像および追尾映像を用いて、複数の追尾対象者のそれぞれに対応する追尾用撮影装置５の撮影方向の調整量である撮影方向調整量を決定し、決定した撮影方向調整量を対応する追尾用撮影装置５へ出力する。詳細には、追尾制御部１７は、追尾用撮影装置５が追尾対象者を捉えていない場合すなわち追尾用撮影装置５の撮影範囲に追尾対象者が存在しない場合には、追尾対象者検出部１４から受け取った追尾対象者の位置と、撮影装置情報記憶部１８から読み出した撮影装置情報とを用いて、各追尾用撮影装置５の撮影方向調整量を算出し、算出した撮影方向調整量を対応する追尾用撮影装置５へ送信する。追尾制御部１７は、追尾映像および画像情報を用いて、追尾用撮影装置５に対応する対象者が撮影範囲に入ったか、すなわち追尾対象者を捉えたかを判断し、追尾対象者を捉えた後は、追尾映像を用いて、対応する追尾対象者が例えば撮影範囲の中央となるように追尾用撮影装置５の撮影方向調整量を算出する。なお、ここでは、全体映像を用いて初期の撮影方向調整量を決定する例を説明したが、追尾用撮影装置５をパンニングさせて追尾対象者を捉える場合には、全体映像を用いる必要はない。撮影装置情報には、各追尾用撮影装置５のパン、チルトの調整量と、全体映像における位置との対応を示す情報である変換情報とが含まれているとする。追尾制御部１７は、追尾用撮影装置５ごとに、撮影装置情報を用いて対応する追尾対象者を決定し、追尾用撮影装置５に対応する追尾対象者の位置と、撮影装置情報における追尾用撮影装置５に関する情報とを用いて、パン、チルトの調整量を撮影方向調整量として算出する。

　本実施の形態の領域判断部１５および画角制御部１９は、全体映像を用いて、追尾対象者ごとに、当該追尾対象者を判断対象者とし、イベントの他の出演者の位置と判断対象者の位置とに応じた撮影画角の調整量である画角調整量を決定し、決定した画角調整量を判断対象者に対応する画角判断部を構成する。なお、撮影画角の調整は、光学的な画角の調整とクリッピングによる調整とのうちの少なくとも一方である。撮影画角の調整量は、光学的な画角の調整量であってもよいし、クリッピングの調整量であってもよい。画角制御部１９は、イベントの他の出演者の位置または複数の追尾対象者の位置と、判断対象者の位置とに応じた撮影画角の調整量である画角調整量を決定してもよい。

　領域判断部１５は、全体映像を用いて、追尾対象者ごとに、当該追尾対象者を判断対象者とし、イベントの他の出演者の位置、あるいは複数の追尾対象者の位置と、判断対象者の位置とに応じて、判断対象者が存在する領域の種別を判断する。詳細には、領域判断部１５は、全体映像取得部２１から受け取った全体映像と、画像情報取得部１３から受け取った画像情報とを用いて、複数の追尾対象者の位置を検出し、検出した位置を用いて、全体映像を領域に区分し、区分した領域の種別を決定し、追尾対象者ごとに、追尾対象者である判断対象者が存在する領域の種別を判断する。領域判断部１５の処理の詳細については後述する。領域判断部１５は、追尾対象者ごとの、追尾対象者が存在する領域の種別を画角制御部１９へ出力する。なお、追尾映像取得部２２が追尾映像を領域判断部１５にも出力するようにし、領域判断部１５は、追尾用撮影装置５によって撮影された追尾映像（クリッピング前の追尾映像）を用いて、当該追尾用撮影装置５が追尾する追尾対象者を判断対象者とし、イベントの他の出演者の位置、あるいは複数の追尾対象者の位置と、判断対象者の位置とに応じて、判断対象者が存在する領域の種別を判断してもよい。すなわち、位置関連情報は、追尾映像であってもよい。

　画角調整規則記憶部１６は、領域の種別と撮影画角の調整内容との対応を定めた画角調整規則を記憶する。画角調整規則は、図示しない入力手段によってオペレータから入力されて画角調整規則記憶部１６に記憶されてもよいし、図示しない他の装置から受信されて画角調整規則記憶部１６に記憶されてもよい。

　画角制御部１９は、領域判断部１５から受け取った判断対象者である追尾対象者が存在する領域の種別と、画角調整規則記憶部１６から読み出した画角調整規則とを用いて、追尾対象者ごとに、領域判断部１５から受け取った領域の種別に対応する画角調整の内容を決定する。すなわち、画角制御部１９は、画角調整規則に従って、領域判断部１５によって判断された判断対象者が存在する領域の種別に対応する撮影画角の調整内容を決定する。画角制御部１９は、決定した画角調整の内容と、撮影装置情報記憶部１８から読み出した撮影装置情報と、を用いて追尾用撮影装置５ごとに画角調整量を決定し、決定した画角調整量を対応する追尾用撮影装置５へ送信する。なお、クリッピングにより画角が調整される場合には、画角制御部１９は、決定した画角調整量を映像送信部２０へ指示する。

　追尾映像取得部２２は、追尾用撮影装置５から追尾映像を受信し、受信した追尾映像を映像送信部２０および追尾制御部１７へ出力する。映像送信部２０は、全体映像取得部２１から受け取った全体映像と、追尾映像取得部２２から受け取った追尾映像とを配信事業者装置２へ送信する。なお、ここでは、追尾映像だけでなく全体映像も配信事業者装置２へ送信される例を説明するが、全体映像は配信事業者装置２へ送信されなくてもよい。なお、クリッピングにより画角が調整される場合には、追尾用撮影装置５は取得した追尾画像（クリッピング前の追尾画像）を、映像送信部２０へ送信し、映像送信部２０が、追尾制御装置１７からの指示に基づいてクリッピングを行い、クリッピング後の追尾映像を配信事業者装置２へ送信する。

　配信事業者装置２は、制御装置１から受信した追尾対象者情報をユーザ端末３へ送信する。また、配信事業者装置２は、ユーザ端末３から、ユーザが選択した追尾対象者の識別情報である追尾対象者識別情報を受信すると、制御装置１から受信した追尾映像のうち追尾対象者識別情報に対応する追尾映像をユーザ端末３へ送信する。また、配信事業者装置２は、全体映像についてもユーザ端末３へ送信してもよい。

　ユーザ端末３は、追尾対象者情報取得部３１、選択受付部３２、選択結果通知部３３、映像出力部３４および映像受信部３５を備える。追尾対象者情報取得部３１は、配信事業者装置２から追尾対象者情報を受信することで追尾対象者情報を取得し、取得した追尾対象者情報を選択受付部３２へ出力する。選択受付部３２は、表示機能と入力受付機能とを有し、追尾対象者情報によって示される複数の追尾対象者を表示し、ユーザに追尾対象者の選択を促す表示を行う。選択受付部３２は、ユーザから追尾対象者の選択を受け付け、選択結果に対応する追尾対象者識別情報を選択結果通知部３３へ出力する。選択結果通知部３３は、選択結果である追尾対象者識別情報を配信事業者装置２へ送信する。

　映像受信部３５は、配信事業者装置２から受信した追尾映像を映像出力部３４へ出力する。映像出力部３４は、映像受信部３５から受け取った追尾映像を出力する。例えば、映像出力部３４は、表示機能と音の出力機能とを有し、追尾映像を表示するとともに映像とともに送信される音データに応じて音を出力する。これにより、ユーザは、選択した追尾対象者の追尾映像を視聴することができる。

　次に、本実施の形態の動作について説明する。図２は、本実施の形態の撮影システム１００における動作の一例を示すシーケンス図である。図２に示すように、全体用撮影装置４は、全体映像を制御装置１へ送信し（ステップＳ１）、各追尾用撮影装置５は追尾映像を制御装置１へ送信する（ステップＳ２）。図２では、記載を省略しているが、追尾用撮影装置５－１～５－Ｎのそれぞれが追尾映像を制御装置１へ送信する。また、図２では、追尾用撮影装置５－１から送信される追尾映像を追尾映像＃１と記載し、追尾用撮影装置５－２から送信される追尾映像を追尾映像＃２と記載している。なお、この時点では、各追尾用撮影装置５に制御装置１による撮影方向および画角の制御が行われていてもよいし、ステップＳ１，Ｓ２の前に、後述するステップＳ７からステップＳ１０までが行われていてもよいし、また、ステップＳ１，Ｓ２は行われずに、ステップＳ３から処理が開始されてもよい。

　制御装置１は、追尾対象者情報を取得する（ステップＳ３）。詳細には、例えば、イベント情報取得部１１がイベント情報を取得し、取得したイベント情報から追尾対象者情報を抽出することで、追尾対象者情報を取得する。

　制御装置１は、追尾対象者情報を配信事業者装置２へ送信し、配信事業者装置２は追尾対象者情報をユーザ端末３へ送信する（ステップＳ４）。ユーザ端末３は、追尾対象者を決定する（ステップＳ５）。詳細には、選択受付部３２が、追尾対象者情報を表示し、ユーザから追尾対象者の選択を受け付けることにより追尾対象者を決定する。

　ユーザ端末３は、追尾対象者識別情報を配信事業者装置２へ送信する（ステップＳ６）。詳細には、選択受付部３２が、ユーザにより選択された追尾対象者を示す追尾対象者識別情報を配信事業者装置２へ送信する。

　一方、制御装置１は、全体映像と識別情報とを用いて追尾用撮影装置５ごとの撮影方向調整量および画角調整量を算出し（ステップＳ７）、算出した撮影方向調整量および画角調整量を対応する追尾用撮影装置５へ送信する（ステップＳ８）。ステップＳ７およびステップＳ８の処理である制御装置１における追尾用撮影装置５の制御処理の詳細については後述する。

　追尾用撮影装置５－１～５－Ｎのそれぞれは、撮影方向調整量に応じて撮影の向きを制御し（ステップＳ９）、画角調整量に応じて画角を制御する（ステップＳ１０）。追尾用撮影装置５－１～５－Ｎのそれぞれは、追尾映像を制御装置１へ送信し、制御装置１は、追尾用撮影装置５－１～５－Ｎから受信した追尾映像を配信事業者装置２へ送信する（ステップＳ１１）。なお、ステップＳ２からステップＳ１１までの間も追尾用撮影装置５－１～５－Ｎから追尾映像は送信されているが、図示を省略している。同様に、全体映像もステップＳ２以降でも送信されている。

　配信事業者装置２は、制御装置１から受信した追尾映像のうち、ユーザ端末３からステップＳ６で受信した追尾対象者識別情報に対応する追尾映像をユーザ端末３へ送信する（ステップＳ１２）。なお、ここでは、ユーザが追尾映像＃２に対応する追尾対象者を選択した例を示しているため、ステップＳ１２では、追尾映像＃２がユーザ端末３に送信される。配信事業者装置２は、複数のユーザ端末３から、追尾対象者識別情報を受信した場合は、ユーザ端末３ごとに、追尾対象者識別情報に対応する追尾映像を送信する。以降、例えば、ステップＳ７～Ｓ１０が周期的に行われ、追尾対象者の位置に応じた制御が行われる。これにより、追尾対象者を追尾した追尾映像がユーザ端末３に提供される。

　次に、制御装置１における追尾用撮影装置５の制御処理について説明する。図３は、本実施の形態の制御装置１における追尾用撮影装置５の制御処理手順の一例を示すフローチャートである。図３に示すように、制御装置１は、調整タイミングであるか否かを判断する（ステップＳ２１）。例えば、あらかじめ定められた制御周期ごとに撮影方向調整量および画角調整量を算出する場合、制御装置１の追尾対象者検出部１４が、１制御周期が経過するごとに調整タイミングであると判断する。

　調整タイミングでない場合（ステップＳ２１　Ｎｏ）、制御装置１はステップＳ２１を繰り返す。調整タイミングである場合（ステップＳ２１　Ｙｅｓ）、制御装置１は追尾対象者を設定する（ステップＳ２２）。詳細には、追尾対象者検出部１４が、全ての追尾対象者のうちの任意の一人を追尾対象者に設定する。

　次に、制御装置１は、全体映像から画像情報を用いて追尾対象者を検出する（ステップＳ２３）。詳細には、追尾対象者検出部１４が、全体映像取得部２１から受け取った全体映像と、画像情報取得部１３から受け取った画像情報に含まれる追尾対象者の画像とを用いて画像認識処理により全体映像から追尾対象者を検出し、検出した追尾対象者の全体映像における位置を算出する。追尾対象者検出部１４は、算出した位置を追尾対象者識別情報とともに、追尾制御部１７および領域判断部１５へ出力する。図４は、本実施の形態の画像情報の一例を示す図である。画像情報は、例えば、図４に示すように、追尾対象者ごとの画像を含む。図４に示した例では、追尾対象者の数はＭ（Ｍは２以上の整数）であり、出演者＃１、出演者＃Ｍは、追尾対象者識別情報である。

　図３の説明に戻る。ステップＳ２３の後、制御装置１は、追尾対象者と追尾用撮影装置５との対応を示す撮影装置情報に基づき、追尾対象者を追尾する追尾用撮影装置５を特定する（ステップＳ２４）。詳細には、追尾制御部１７が、撮影装置情報記憶部１８から読み出した撮影装置情報を用いて、ステップＳ２２で設定された追尾対象者を追尾する追尾用撮影装置５を特定する。図５は、本実施の形態の撮影装置情報の一例を示す図である。図５に示すように、撮影装置情報は、追尾対象者と追尾用撮影装置５との対応を示す情報である。また、撮影装置情報には、図示を省略するが上述したように、各追尾用撮影装置５のパン、チルトの調整量と、全体映像における位置との対応を示す情報である変換情報が含まれている。

　図３の説明に戻る。ステップＳ２４の後、制御装置１は、追尾映像および全体映像における追尾対象者の位置に基づいて、追尾対象者の出演者を追尾する追尾用撮影装置５の撮影方向調整量を算出する（ステップＳ２５）。詳細には、追尾制御部１７は、追尾用撮影装置５が追尾対象者を捉えていない場合には、追尾対象者検出部１４から受け取った追尾対象者の位置と、撮影装置情報に含まれる変換情報とを用いて追尾対象者の出演者を追尾する追尾用撮影装置５の撮影方向調整量を算出する。追尾用撮影装置５が追尾対象者を捉えている場合には、追尾制御部１７は、追尾映像における追尾対象者の位置に基づいて追尾対象者を追尾する追尾用撮影装置５の撮影方向調整量を算出する。上述したように、追尾用撮影装置５がパンニングする場合には、撮影方向調整量の算出に全体映像が用いられてなくてもよい。

　次に、制御装置１は、追尾対象者の出演者を追尾する追尾用撮影装置５へ撮影方向調整量を指示する（ステップＳ２６）。詳細には、追尾制御部１７が、ステップＳ２５で算出した撮影方向調整量をステップＳ２４で特定した追尾用撮影装置５へ送信する。

　次に、制御装置１は、全体映像における追尾対象者の位置に基づいて、追尾対象者の出演者の存在する領域の種別を判断する（ステップＳ２７）。ここで、本実施の形態における領域の種別について説明する。領域の種別は、例えば、イベントにおける注目度を示す。

　図６は、本実施の形態の領域の種別の一例を示す図である。図６は、イベントのステージ全体を正面から撮影した全体映像の例を示している。図６に示した例では、領域の種別は、センター、中間、端であり、中央に位置する領域２０１の種別がセンター、端に位置する領域２０２が端、端とセンターの間に位置する領域の種別が中間と判断されている。この場合、例えば、センター、中間、端の各種別に対応する領域の注目度は、センターが最も高く、次に中間の注目度が高く、端の注目度が最も低い。各領域の種別の注目度の高さは、イベントによって異なることがあり、ステージにおける位置と注目度との対応はこの例に限定されず、イベントの内容などに応じてあらかじめ定められていればよい。

　例えば、ある追尾対象者の追尾映像を視聴するユーザにとって、当該追尾対象者がセンター、中間、端のいずれの領域に位置するかにより、追尾対象者を撮影する際の適切な画角が異なることが想定される。例えば、追尾対象者がセンターの領域２０１に存在するときには、センターであることがわかるようにある程度広い範囲まで撮影されることが好ましく、また追尾対象者が端の領域２０２に存在する場合には、追尾対象者を大きく撮影することが好ましいといったことが考えられる。したがって、領域の種別は、設定する画角に応じた種別ということもできる。なお、領域の種別と画角との関係はこの例に限定されない。

　一方、イベントにおいては、複数の追尾対象者である複数の出演者の位置は固定ではなく変化する場合がある。例えば、ステージ上にグループのメンバー全員が広がっている場合と、ステージの端付近にグループのメンバー全員が集まっている場合とでは、例えば、ステージの全体位置としての中央付近における注目度の高さが異なる。

　図７は、グループのメンバーがステージ全体に広がっている場合の本実施の形態の全体映像の一例を示す図である。図８は、グループのメンバーが端付近に集まっている場合の本実施の形態の全体映像の一例を示す図である。図７および図８では、グループのメンバーがそれぞれ追尾対象者３００である例を示しており、３００の符号を付した図形と同一の形状の図形であり符号を省略した図形も追尾対象者３００である。図７および図８では、複数の追尾対象者３００のそれぞれの全体映像における横方向（左右方向）の位置の座標値をもとに、各追尾対象者３００の質量を同一と仮定して算出した場合の左右方向における重心の位置を示す線を重心３０１として示している。図７に示した例では、重心３０１は、全体映像の中央付近であるが、図８に示した例では、複数の追尾対象者３００が全体映像における中央より左側に集まっているため、重心３０１も左端に近い位置となっている。

　図７に示した複数の追尾対象者３００の配置では、全体映像の中央付近である領域２０１の種別を最も注目度の高いセンターとする。一方、図８に示した複数の追尾対象者３００の配置では、全体映像における中央付近には追尾対象者３００が存在せず中央付近の注目度は低くなり、重心３０１に近い部分の注目度が高くなる。このため、図８に示した例では、領域２０１の種別を最も注目度の高いセンターとする。

　具体的には、例えば、領域判断部１５が、全体映像取得部２１から受け取った全体映像と、画像情報取得部１３から受け取った画像情報とを用いて、全体映像における複数の追尾対象者３００を検出し、検出した複数の追尾対象者３００のそれぞれの全体映像における位置の左右方向における座標値を算出する。そして、領域判断部１５が、複数の追尾対象者３００の左右方向における座標値を用いて左右方向の重心を算出し、重心を含み定められた数の追尾対象者３００を含む領域を、センターに対応する領域に決定する。例えば、図７および図８に示した例では、追尾対象者３００が２人含まれる領域をセンターとしている。図７および図８に示した例では、領域の種別をセンターとセンター以外との２種類としており、領域２０１以外の領域の種別をセンター以外としている。また、領域判断部１５は、これに限らず、図６の例と同様に、センター以外の領域を端および中間の領域に分割してもよい。センター以外の領域を端および中間の領域に分ける場合も、同様に、例えば端の領域内の追尾対象者３００の数をあらかじめ定めておくことで、領域判断部１５が、端の領域を決定し、端でもセンターでもない領域を中間の領域とする。なお、端は左右の両側に存在するため、例えば、１つの端の領域あたりの追尾対象者３００の数をあらかじめ定めておく。全体映像における出演者を検出し、上記と同様に領域を判断してもよい。以上述べた例は一例であり、領域の種別の数、領域の決定方法は上述した例に限定されない。

　上記のように、全体映像における各領域の種別を決定すると、領域判断部１５は、設定されている追尾対象者が存在する領域がどの種別の領域であるかを判断し、判断した結果を画角制御部１９へ通知する。例えば、図７に示した例において、設定されている追尾対象者が左から３番目の追尾対象者３００である場合には、左から３番目の追尾対象者３００はセンターに対応する領域２０１に位置しているため、領域判断部１５は、設定されている追尾対象者に対応する領域の種別をセンターと判断する。また、領域判断部１５は、センターの領域に追尾対象者が存在する場合であっても、追尾対象者が最前列ではないと判断される場合には、例えば、中間の領域に存在すると判定してもよい。例えば、領域判断部１５は、全体映像を解析することにより、追尾対象者の一部が別の追尾対象者により隠れていると判断した場合に、追尾対象者が最前列ではないと判断する。最前列か否かの判断方法はこの例に限定されない。

　また、上述した例では、複数の追尾対象者３００の重心３０１をもとに、領域の種別を決定したが、例えば、複数の追尾対象者３００がランダムに広がっていたり、複数の追尾対象者３００が移動中であったりといったように、複数の追尾対象者３００の配置が、注目度を定義できない状態である場合もある。このため、領域判断部１５は、複数の追尾対象者３００の全体映像における配置が、例えば左右対象でない場合にはランダムまたは移動中であると判断するといったように、ランダムまたは移動中と判断するための規則を定めておく。そして、領域判断部１５は、規則に基づいて、ランダムまたは移動中と判断した場合には、全体映像の全領域を、その他の種別の領域と判断してもよい。

　図３の説明に戻る。ステップＳ２７の後、制御装置１は、画角調整規則を用いて、判断した領域の種別に応じた画角調整量を算出する（ステップＳ２８）。詳細には、画角制御部１９が、画角調整規則記憶部１６に記憶されている画角調整規則を参照し、領域判断部１５から通知された判断結果である領域の種別に対応する画角調整内容を決定する。

　図９は、本実施の形態における画角調整規則の一例を示す図である。図９に示すように、画角調整規則は、領域の種別ごとの、画角調整の内容を示す情報を含む。図９に示した例では、領域の種別をセンター、端、中間、その他の４種類としているが、種別の数および種別の内容はこの例に限定されず、どのような場合に画角を変更するかに応じて決定されればよい。図９に示した例では、設定された追尾対象者がセンターの領域に位置する場合に、画角を広角＃１に設定し、設定された追尾対象者が端の領域に位置する場合に、追尾対象者の顔へズームするすなわち追尾対象者の顔を拡大して撮影するように画角を設定する。また、図９に示した例では、設定された追尾対象者が中間の領域に位置する場合に、画角を広角＃２に設定し、設定された追尾対象者がその他の領域に位置する場合に、グループ全員を撮影するように画角を設定する。

　広角＃１と広角＃２は、いずれも広角ではあるが、画角が異なっていてもよい。例えば、広角＃１は、追尾対象者を中心に数人が含まれる画角、すなわち追尾対象者がセンターに位置することがわかる程度の画角とし、広角＃２は、例えば、追尾対象者の全身が含まれるような画角とする。また、図９は、一例であり、これに限らず、画角調整の内容は、イベントの内容などに応じて設定されればよく、例えば、プロのカメラマンなどの有識者から、追尾対象者が各種別の領域に存在する場合にどのような画角調整を行うかの情報をあらかじめ取得して画角調整の内容を決定してもよいし、ユーザによるアンケートなどによりあらかじめ決定してもよい。画角調整規則の決定方法はこの例に限定されない。また、上記の例では、領域の種別に応じて画角を設定する例を説明したが、画角以外の追尾用撮影装置５における制御パラメータを、追尾対象者が存在する領域の種別に応じて決定するようにしてもよい。

　画角制御部１９は、画角調整内容を決定した後、全体映像における追尾対象者の大きさ、顔の位置などに応じて、決定した画角調整内容に対応した画角調整量を算出する。

　図３の説明に戻る。ステップＳ２８の後、制御装置１は、追尾対象者の出演者を追尾する追尾用撮影装置５へ画角調整量を指示する（ステップＳ２９）。詳細には、画角制御部１９が、撮影装置情報記憶部１８から読み出した撮影装置情報を用いて、ステップＳ２２で設定された追尾対象者を追尾する追尾用撮影装置５を特定し、特定した追尾用撮影装置５へステップＳ２８で決定した画角調整量を送信する。なお、ここでは、追尾制御部１７および画角制御部１９がそれぞれ撮影装置情報を参照して、設定された追尾対象者を追尾する追尾用撮影装置５を特定するようにしたが、追尾対象者検出部１４が撮影装置情報を参照して、設定された追尾対象者を追尾する追尾用撮影装置５を特定し、特定した追尾用撮影装置５を追尾制御部１７および画角制御部１９へ通知してもよい。または、追尾対象者検出部１４が、ステップＳ２４で特定した結果を、画角制御部１９へ通知してもよい。

　次に、制御装置１は、全追尾対象者を設定済であるか否かを判断し（ステップＳ３０）、全追尾対象者を設定済である場合（ステップＳ３０　Ｙｅｓ）、制御装置１はステップＳ２１からの処理を繰り返す。ステップＳ３０では、詳細には、追尾対象者検出部１４が、全追尾対象者に関して、ステップＳ２２の設定が行われたか否かを判断する。全追尾対象者を設定済でない場合（ステップＳ３０　Ｎｏ）、すなわち、全追尾対象者のうち、ステップＳ２２で設定されていない追尾対象者が存在する場合、制御装置１は、設定する追尾対象者を変更し（ステップＳ３１）、ステップＳ２３からの処理を繰り返す。ステップＳ３１では、追尾対象者検出部１４は、設定されていない追尾対象者のなかから任意の追尾対象者を選択し、選択した追尾対象者を設定の対象とすることで、設定する追尾対象者を変更する。

　以上の処理により、複数の追尾対象者の位置に応じて領域の種別が決定され、追尾対象者が存在する領域の種別に応じて画角が調整される。これにより、制御装置１は、追尾対象者が複数存在する場合に、追尾用撮影装置５の制御パラメータを適切に決定することができる。

　次に、本実施の形態の制御装置１のハードウェア構成について説明する。本実施の形態の制御装置１は、コンピュータシステム上で、制御装置１における処理が記述されたコンピュータプログラムであるプログラムが実行されることにより、コンピュータシステムが制御装置１として機能する。図１０は、本実施の形態の制御装置１を実現するコンピュータシステムの構成例を示す図である。図１０に示すように、このコンピュータシステムは、制御部１０１と入力部１０２と記憶部１０３と表示部１０４と通信部１０５と出力部１０６とを備え、これらはシステムバス１０７を介して接続されている。

　図１０において、制御部１０１は、例えば、ＣＰＵ（Central　Processing　Unit）等のプロセッサであり、本実施の形態の制御装置１における処理が記述されたプログラムを実行する。なお、制御部１０１の一部が、ＧＰＵ（Graphics　Processing　Unit）、ＦＰＧＡ（Field-Programmable　Gate　Array）などの専用ハードウェアにより実現されてもよい。入力部１０２は、たとえばキーボード、マウスなどで構成され、コンピュータシステムの使用者が、各種情報の入力を行うために使用する。記憶部１０３は、ＲＡＭ（Random　Access　Memory），ＲＯＭ（Read　Only　Memory）などの各種メモリおよびハードディスクなどのストレージデバイスを含み、上記制御部１０１が実行すべきプログラム、処理の過程で得られた必要なデータ、などを記憶する。また、記憶部１０３は、プログラムの一時的な記憶領域としても使用される。表示部１０４は、ディスプレイ、ＬＣＤ（液晶表示パネル）などで構成され、コンピュータシステムの使用者に対して各種画面を表示する。通信部１０５は、通信処理を実施する受信機および送信機である。出力部１０６は、プリンタ、スピーカなどである。なお、図１０は、一例であり、コンピュータシステムの構成は図１０の例に限定されない。

　ここで、本実施の形態のプログラムが実行可能な状態になるまでのコンピュータシステムの動作例について説明する。上述した構成をとるコンピュータシステムには、たとえば、図示しないＣＤ（Compact　Disc）－ＲＯＭドライブまたはＤＶＤ（Digital　Versatile　Disc）－ＲＯＭドライブにセットされたＣＤ－ＲＯＭまたはＤＶＤ－ＲＯＭから、コンピュータプログラムが記憶部１０３にインストールされる。そして、プログラムの実行時に、記憶部１０３から読み出されたプログラムが記憶部１０３の主記憶領域に格納される。この状態で、制御部１０１は、記憶部１０３に格納されたプログラムに従って、本実施の形態の制御装置１としての処理を実行する。

　なお、上記の説明においては、ＣＤ－ＲＯＭまたはＤＶＤ－ＲＯＭを記録媒体として、制御装置１における処理を記述したプログラムを提供しているが、これに限らず、コンピュータシステムの構成、提供するプログラムの容量などに応じて、たとえば、通信部１０５を経由してインターネットなどの伝送媒体により提供されたプログラムを用いることとしてもよい。

　図１に示した画像情報取得部１３、追尾対象者検出部１４、領域判断部１５、追尾制御部１７および画角制御部１９は、図１０に示した記憶部１０３に記憶されたコンピュータプログラムが図１０に示した制御部１０１により実行されることにより実現される。画像情報取得部１３、追尾対象者検出部１４、領域判断部１５、追尾制御部１７および画角制御部１９の実現には、記憶部１０３も用いられる。図１に示した画角調整規則記憶部１６および撮影装置情報記憶部１８は、記憶部１０３の一部である。図１に示したイベント情報取得部１１、追尾対象者情報通知部１２、映像送信部２０、全体映像取得部２１および追尾映像取得部２２は、図１０に示した通信部１０５により実現される。イベント情報取得部１１、追尾対象者情報通知部１２、映像送信部２０、全体映像取得部２１および追尾映像取得部２２の実現には制御部１０１も用いられる。また、イベント情報取得部１１および画像情報取得部１３には、入力部１０２も用いられてもよい。また、制御装置１は複数のコンピュータシステムにより実現されてもよい。例えば、制御装置１は、クラウドコンピュータシステムにより実現されてもよい。

　また、図１では、制御装置１が追尾映像、全体映像などの映像を配信事業者装置２へ送信したが、配信事業者装置２へ映像を配信する映像提供装置を、制御装置１とは別に設けてもよい。この場合、追尾用撮影装置５によって取得された追尾映像は映像提供装置を介して配信事業者装置２へ送信され、制御装置１は追尾映像を追尾用撮影装置５から取得しなくてもよい。なお、この場合も制御装置１は、全体映像については、全体用撮影装置４から取得する。全体映像を配信事業者装置２へ送信する場合には、例えば、映像提供装置が全体用撮影装置４から全体映像を取得し、制御装置１へ送信してもよいし、全体用撮影装置４が映像提供装置および制御装置１に全体映像を送信してもよい。

　配信事業者装置２も、同様に、例えば、図１０に示した構成のコンピュータシステムにより実現される。ユーザ端末３も、同様に、例えば、図１０に示した構成のコンピュータシステムにより実現される。図１に示した追尾対象者情報取得部３１、選択結果通知部３３および映像受信部３５は、図１０に示した通信部１０５により実現される。図１に示した選択受付部３２は、図１０に示した制御部１０１、入力部１０２および表示部１０４により実現される。図１に示した映像出力部３４は、表示部１０４および、スピーカである出力部１０６により実現される。ユーザ端末３は、スマートフォンの端末であってもよいし、テレビなどであってもよく、ゲーム機とテレビの組み合わせなどであってもよい。

＜変形例１＞
　次に、変形例１の撮影システムについて説明する。図１１は、本実施の形態にかかる変形例１の撮影システムの構成例を示す図である。図１１に示した撮影システム１００ａは、制御装置１の代わりに制御装置１ａを備える以外は、図１に示した撮影システム１００と同様である。図１に示した撮影システム１００と同様の機能を有する構成要素は図１と同一の符号を付して重複する説明を省略する。

　制御装置１ａは、タグ通信部２３を追加し、領域判断部１５の代わりに領域判断部１５ａを備える以外は、図１に示した制御装置１と同様である。変形例１では、追尾対象者はそれぞれ無線信号を送信可能なＢＬＥ（Bluetooth（登録商標）　Low　Energy）端末、またはＲＦＩＤ（Radio　Frequency　IDentifier）タグなどを身に着ける。タグ通信部２３は、各追尾対象者に対応するＢＬＥ端末あるいはタグと通信を行い、ＢＬＥ端末あるいはタグから追尾対象者の例えばステージの左右方向と奥行き方向の２次元、あるいは高さ方向を加えた３次元の位置を示す位置情報を取得する。タグ通信部２３は、位置情報を追尾対象者識別情報と対応付けて領域判断部１５ａへ出力する。また、変形例１では、イベント情報取得部１１が取得するイベント情報にはイベントの会場の配置位置を示すイベント会場情報を含む。イベント情報取得部１１は、イベント会場情報を領域判断部１５ａへ出力する。イベント会場情報は、例えば、イベントにおけるステージの範囲を座標値で示した情報である。本実施の形態では、位置関連情報は、複数の追尾対象者のそれぞれの２次元または３次元の位置を示す位置情報である。

　領域判断部１５ａは、タグ通信部２３から受け取った２次元または３次元の位置情報と、イベント情報取得部１１から受け取ったイベント会場情報とを用いて、領域を区分して各領域の種別を決定する。イベント会場情報におけるステージの範囲を示す座標値が、タグ通信部２３から受け取った２次元または３次元の位置情報と異なる座標系で示されている場合には、いずれかを座標変換することで同じ座標系における値とする。そして、領域判断部１５ａは、タグ通信部２３から受け取った２次元または３次元の位置情報を、ステージの左右方向と奥行き方向とをそれぞれＸ、Ｙとする座標系の座標値に変換する。領域判断部１５ａは、このＸＹの２次元平面における各追尾対象者の座標値を用いて、上述した図１の制御装置１と同様に、左右方向の重心を求め、重心に基づいて領域に区分し、各領域の種別を決定することができる。または、左右方向における追尾対象者の位置だけでなく、奥行方向の追尾対象者の位置も考慮して各領域の種別を決定してもよい。

　図１２は、本実施の形態の変形例１における追尾対象者の配置の一例を示す図である。図１２では、横方向はイベントの会場のステージの左右方向を示し、縦方向はステージの奥行を示している。したがって、図１２は、追尾対象者３００を上からみた図に相当する。領域判断部１５ａは、このような２次元平面における各追尾対象者の座標値を用いて、例えば、左右方向における重心の付近の最前列の領域である領域２０１の種別をセンターとし、領域２０１の左右の両脇と２列目の全体の領域２０３の種別を中間とし、最後列の領域２０４の種別を最後列、あるいは端とする。このように、領域判断部１５ａは、奥行方向も考慮して各領域の種別を決定してもよい。変形例１においても、各領域の種別と画角調整内容とは画角調整規則として画角調整規則記憶部１６に記憶されている。以上述べた以外の変形例１の撮影システム１００ａの動作は、図１に示した撮影システム１００の動作と同様である。変形例１の撮影システム１００ａは、実施の形態１と同様の効果を奏するとともに、奥行に応じた画角の調整も行うことができる。

＜変形例２＞
　次に、変形例２の撮影システムについて説明する。図１３は、本実施の形態にかかる変形例２の撮影システムの構成例を示す図である。図１３に示した撮影システム１００ｂは、制御装置１の代わりに制御装置１ｂを備える以外は、図１に示した撮影システム１００と同様である。図１に示した撮影システム１００と同様の機能を有する構成要素は図１と同一の符号を付して重複する説明を省略する。

　制御装置１ｂは、領域判断部１５の代わりに領域判断部１５ｂを備える以外は、図１に示した制御装置１と同様である。変形例２では、イベント情報取得部１１が取得するイベント情報には行程表が含まれる。イベント情報取得部１１は、行程表を領域判断部１５ｂへ出力する。行程表は、例えば、イベントの区切りごとの、複数の追尾対象者のうち少なくとも一部の追尾対象者が存在する領域の種別を示す情報を含む。

　図１４は、本実施の形態の行程表の一例を示す図である。図１４に示すように、行程表は、イベントの進行を示すイベント進行情報と追尾対象者の移動に関する情報である移動予定情報とを含む。イベント進行情報は、図１４に示すように、例えば、時間を示す時間情報とイベントの内容との対応を含む。時間情報は、時刻自体を示す情報であってもよいし、イベント開始時からの経過時間を示す情報であってもよい。図１４に示した例では、イベントはコンサートであり、イベントの内容として演奏される曲が記載されている。また、図１４に示した例では、イベントの内容がさらに細分化されたセクションを示すセクション名が時間情報と対応付けられている。このように、イベントがコンサートの場合、イベントの区切りは、例えば、曲を分割したセクション単位の区切りである。図１４に示した例では、Ａメロ、Ｂメロ、サビなどのように曲調に応じてセクションに区切っているが、セクションの区切り方はこれに限定されず、例えば、追尾対象者である出演者の配置の大きな変更ごとに区切ることができる。

　また、図１４では、上述した注目度に応じた領域の種別のうちどの種別の領域に各追尾対象者が存在するかが、移動予定情報として示されている。なお、図１４では、移動予定情報として、追尾対象者である出演者ごとに、どの種別の領域であるかが示されているが、これに限らず、移動予定情報には、だれがセンターであるかを示す情報だけが含まれているなどこれ以外の形式であってもよい。また、図１４では、イベント進行情報にイベントの内容とセクションを示す情報の一例であるセクション名が含まれているが、イベント進行情報は時間情報だけであってもよく、イベントの内容およびセクション名だけであってもよい。イベント進行情報がイベントの内容およびセクション名だけである場合、セクションの区切りを示す歌詞、伴奏の楽譜などの情報が行程表とともに領域判断部１５ｂに入力される。また、セクションの区切りとなる、照明、効果音、背景映像などが行程表とともに領域判断部１５ｂに入力されてもよい。

　領域判断部１５ｂは、イベント情報取得部１１から受け取った行程表を用いて、追尾対象者の位置する領域の種別を判断する。例えば、イベント進行情報が時間情報である場合には、現在の時刻に応じて、行程表における対応する移動予定情報を参照することで、追尾対象者の位置する領域の種別を判断する。また、イベント進行情報がイベントの内容およびセクション名で示される場合、図示しないマイクで音を検出し、領域判断部１５ｂは、区切りを示す歌詞、伴奏の楽譜を用いて、マイクによって検出された音データを用いて音声認識、周波数解析などにより、区切りを判定する。そして、領域判断部１５ｂは、行程表における各セクションに応じた移動予定情報を参照することで、追尾対象者の位置する領域の種別を判断する。また、領域判断部１５ｂは、照明、効果音、背景映像などにより区切りが示される場合には、全体映像を用いた画像認識、音データの解析などにより、区切りを検出する。このように、時間情報ではなくセクションの区切りを音声認識、画像認識などを用いて判定し、セクションの区切りに応じて行程表における対応する移動予定情報を参照することで、イベントが予定通りの時刻で進行していない場合でも、適切な画角の制御を行うことができる。

　また、領域判断部１５ｂは、移動予定情報として、だれがセンターであるかを示す情報が格納されている場合には、現在の時刻に応じて行程表を用いて、だれがセンターであるがを特定し、画像情報を用いて全体映像からセンターとして特定された追尾対象者の位置を検出する。そして、この追尾対象者の位置を上述した重心として扱って、図１の制御装置１の動作として説明したように、領域を区分し、各領域の種別を決定してもよい。そして、図１の制御装置１と同様に、領域判断部１５ｂは、追尾対象者の全体映像における位置と各領域の種別とを用いて、追尾対象者が存在する領域の種別を判断する。

　なお、上述した行程表は、イベントがコンサートである例を説明したが、イベントが演劇である場合にも同様に、行程表に演劇の脚本、台本、演出内容などを基に、セクションを区切り、移動予定情報を定めておいてもよい。

　また、領域判断部１５ｂは、行程表を用いた判断と全体映像を用いた判断とを組み合わせてもよい。例えば、領域判断部１５ｂは、イベント情報取得部１１から受け取った行程表を用いて、追尾対象者の位置する領域の種別を判断するとともに、少なくとも一部の追尾対象者に関して図１の制御装置１と同様に全体映像を用いた追尾対象者の位置する領域の種別の判断を実施し、２つの判断結果が一致した場合には、判断結果をそのまま使用する。２つの判断結果が一致しない追尾対象者の数が、あらかじめ定めた閾値以上の場合には、行程表を用いた判断を停止して、全ての追尾対象者に関して全体映像を用いた判断を行う。これにより、イベントが予定通りに進行しない場合にも、適切な画角の制御を行うことができる。

　以上述べたように、本実施の形態では、複数の追尾対象者の位置と、設定された追尾対象者の位置とを用いて、設定された追尾対象者が存在する領域の種別を判断し、領域の種別に応じて制御パラメータである画角調整量を決定するようにした。このため、追尾対象者が複数する場合に、追尾用撮影装置５の制御パラメータを適切に決定することができる。

実施の形態２．
　次に、実施の形態２にかかる撮影システムについて説明する。図１５は、本実施の形態の領域判断部の構成例を示す図である。実施の形態２の撮影システムは、実施の形態１の制御装置１における領域判断部１５の代わりに領域判断部１５ｃを備える以外は実施の形態１の撮影システムと同様である。実施の形態１と同様の機能を有する構成要素は実施の形態１と同一の符号を付して説明する。以下、実施の形態１と異なる点を主に説明する。

　実施の形態１では、全体映像における複数の追尾対象者の位置に基づく各領域の種別を決定するルールをあらかじめ定めておき、ルールに基づいて決定した領域の種別を用いて、追尾対象者が存在する領域の種別を決定した。本実施の形態では、全体映像から、追尾対象者すなわち判断対象者が存在する領域の種別を推論するための学習済モデルを用いて、追尾対象者すなわち判断対象者が存在する領域の種別を決定する。

　図１５に示すように、領域判断部１５ｃは、学習済モデル生成部１５１、学習済モデル記憶部１５２および推論部１５３を備える。

　推論部１５３は、学習済モデル記憶部１５２に格納されている学習済モデルを読み出し、読み出した学習済モデルに、全体映像取得部２１から受け取った全体映像を入力することで、全体映像における領域の種別すなわち全体映像における各位置の領域の種別を推論する。例えば、推論部１５３は、全体映像における各位置が例えば、センター、端などのどの種別に属するかを推論する。そして、推論部１５３は、推論結果である全体映像における各位置の領域の種別と、追尾対象者検出部１４により検出された追尾対象者の位置とを用いて、追尾対象者が存在する領域の種別を推論する。すなわち、推論部１５３は、学習済モデルに、全体映像を入力して得られる出力を用いて、追尾対象者が存在する領域の種別を求める。なお、追尾映像取得部２２が、追尾映像（クリッピング前の追尾映像）を推論部１５３にも出力するようにし、推論部１５３が、全体映像の代わりに追尾映像を学習済モデルに入力することで、追尾映像における領域の種別を推論してもよい。この場合、追尾対象者検出部１４により検出された追尾対象者の位置を用いる必要はなく、推論部１５３は、例えば、追尾対象者が追尾映像の中央に位置するとして、推論結果を用いて追尾対象者が存在する領域の種別を求める。

　学習済モデルは、イベントの映像の提供の開始前に、学習済モデル生成部１５１によって、例えば、以下のように生成される。学習済モデル生成部１５１は、映像と、対応する正解データとを含む学習用データセットを複数用いて学習済モデルを生成し、生成した学習済モデルを学習済モデル記憶部１５２に格納する。学習済モデルの生成に用いられる映像は、全体映像取得部２１から受け取った全体映像であってもよいし、追尾映像取得部２２から受け取った追尾映像であってもよいし、学習用映像であってもよい。学習用映像は、例えば、複数の追尾対象者が出演した映像であり、過去に配信された映像、過去のテレビ放送の映像などである。学習用映像は、複数の追尾対象者が出演したイベントにおいて取得された画像または映像であってもよい。学習済モデルの生成は、イベントの映像の提供が行われる前に実施しておく。なお、学習済モデルは、大人数のグループ用、少人数のグループ用といったように、グループの規模に応じて生成されてもよいし、グループごとに生成されてもよい。この場合、推論部１５３は、推論時に、グループの規模またはグループに応じて使用される学習済モデルを切替える。

　なお、学習済モデル生成部１５１に入力される学習用映像は、他の用途のために撮影されたものであってもよいし、イベントのリハーサル時に、イベントの全体を撮影した映像または画像であってもよい。学習用の全体映像または全体映像は、図示しない入力手段によって制御装置１に入力され入力手段から学習済モデル生成部１５１に入力されてもよいし、他の装置から送信され図示しない受信手段により受信され受信手段から学習済モデル生成部１５１に入力されてもよい。

　正解データは、対応する映像における各位置の領域の種別が、例えば、センター、中間、端などのうちのいずれであるかであるかを示すデータである。全体映像における各位置は、画素単位で示されてもよいし、例えば１０×１０の画素など複数の画素単位で示されてもよい。正解データは、例えば、全体映像を、追尾対象者の情報をよく知るイベントの主催者、演出担当者、追尾対象者のマネージャなどの有識者が確認することで決定される。正解データは、例えば、図示しない入力手段によって制御装置１に入力され入力手段から学習済モデル生成部１５１に入力されてもよいし、他の装置から送信され図示しない受信手段により受信され受信手段から学習済モデル生成部１５１に入力されてもよい。

　学習済モデル生成部１５１における学習済モデルの生成は、例えば、教師あり学習により行われる。教師あり学習のアルゴリズムとしては、どのようなものを用いてもよいが、例えば、ニューラルネットワークモデルを用いることもできる。ニューラルネットワークは、複数のニューロンからなる入力層、複数のニューロンからなる中間層（隠れ層）、および複数のニューロンからなる出力層で構成される。中間層は、１層、又は２層以上でもよい。

　図１６は、ニューラルネットワークの一例を示す模式図である。例えば、図１６に示すような３層のニューラルネットワークであれば、複数の入力が入力層（Ｘ１－Ｘ３）に入力されると、その値に重みＷ１（ｗ１１－ｗ１６）を掛けて中間層（Ｙ１－Ｙ２）に入力され、その結果にさらに重みＷ２（ｗ２１－ｗ２６）を掛けて出力層（Ｚ１－Ｚ３）から出力される。この出力結果は、重みＷ１の値と重みＷ２の値とによって変わる。

　本実施の形態においては、追尾対象者ごとに学習済モデルが生成される場合には、全体映像が入力されたときの出力層からの出力が正解データに近づくように、重みＷ１と重みＷ２とを調整することで全体映像と正解データとの関係が学習される。グループごとに学習済モデルが生成される場合には、全体映像が入力されたときの出力層からの出力が正解データに近づくように、重みＷ１と重みＷ２とを調整することで全体映像と正解データとの関係が学習される。なお、機械学習のアルゴリズムはニューラルネットワークに限定されない。

　なお、図１５に示した例では、領域判断部１５ｃが、学習済モデル生成部１５１を備えているが、制御装置１とは別に学習済モデルを生成する学習装置を設け、学習装置が学習済モデル生成部１５１を備えてもよい。この場合、領域判断部１５ｃは学習済モデル生成部１５１を備えなくてよく、学習装置の学習済モデル生成部１５１が、上記と同様に学習済モデルを生成する。そして、学習装置によって生成された学習済モデルが、領域判断部１５ｃの学習済モデル記憶部１５２に格納される。

　本実施の形態では、実施の形態１で述べたステップＳ２７において、領域判断部１５ｃが、上記のように、学習済モデルを用いて、追尾対象者が存在する領域の種別を決定する。本実施の形態におけるその他の動作は、実施の形態１と同様である。本実施の形態においても制御装置は、コンピュータシステムにより実現される。

　また、実施の形態１の変形例１で述べたように、複数の追尾対象者がタグを身に着け、タグ通信部２３が各追尾対象者の位置情報を取得してもよい。この場合、領域判断部１５ｃは、学習済モデルを用いて判断した結果を、位置情報を用いて補正してもよい。例えば、実施の形態１の変形例１で述べたように奥行方向の位置を反映して補正が行われてもよい。

　本実施の形態においても、実施の形態１と同様に、追尾対象者が複数する場合に、追尾用撮影装置５の制御パラメータを適切に決定することができる。また、グループのメンバーの配置は多様な場合があり、人が全体映像をみて追尾対象者がセンターであるか端であるかを判断することはできても、多様な配置を考慮して事前に領域の範囲をルールとして定義することが難しい場合もある。本実施の形態では、正解データとして人がみて判断した結果を用いて機械学習により追尾対象者が存在する領域の種別を決定するため、領域の種別を判断するためのルールを事前に定める必要がない。また、イベントにおいて撮影された全体映像を用いて、再学習を行うことで、学習済モデルの精度を高めていくことができる。

＜変形例１＞
　次に、本実施の形態の変形例１について説明する。図１７は、本実施の形態にかかる変形例１の画角制御部の構成例を示す図である。本実施の形態の変形例１の撮影システムは、実施の形態１の制御装置１における領域判断部１５、画角制御部１９および画角調整規則記憶部１６の代わりに画角判断部２４を備える以外は実施の形態１の撮影システムと同様である。実施の形態１と同様の機能を有する構成要素は実施の形態１と同一の符号を付して説明する。以下、実施の形態１と異なる点を主に説明する。

　図１５に示した例では、全体映像取得部２１から受け取った全体映像を入力として、追尾対象者の存在する領域の種別を推論するための学習済モデルを用いた。このため、図１５に示した例では、領域の種別から画角の調整内容を求める処理は実施の形態１と同様に画角調整規則に基づいて行う。変形例１では、全体映像取得部２１から受け取った全体映像を入力として画角調整量を推論するための学習済モデルを用いる。これにより、画角調整規則も含めて学習が行われることになる。すなわち、画角判断部２４は、領域判断部１５，１５ａ，１５ｂ，１５ｃなどの領域判断部に対応する機能と画角制御部１９との両方の機能を有する。

　図１７に示すように、画角判断部２４は、学習済モデル生成部１９１、学習済モデル記憶部１９２および推論部１９３を備える。

　推論部１９３は、学習済モデル記憶部１９２に格納されている学習済モデルを読み出し、読み出した学習済モデルに、全体映像取得部２１から受け取った全体映像と、追尾対象者の追尾映像とを入力することで、画角調整量を推論する。すなわち、画角判断部２４は、全体映像および追尾画像を用いて追尾対象者すなわち判断対象者に対応する撮影画角の調整量を推論するための学習済モデルを用いて、撮影画角の調整量を決定する。学習済モデルは、イベントの映像の提供の開始前に、学習済モデル生成部１９１によって、例えば、以下のように生成される。

　学習済モデル生成部１９１は、全体映像取得部２１から受け取った全体映像または学習用映像と、追尾映像と、対応する正解データとを含む学習用データセットを複数用いて学習済モデルを生成し、生成した学習済モデルを学習済モデル記憶部１９２に格納する。学習用映像は、図１５に示した例と同様に、複数の追尾対象者が出演した映像であり、過去に配信された映像、過去のテレビ放送の映像などである。学習済モデルの生成は、イベントの映像の提供が行われる前に実施しておく。なお、学習済モデルは、大人数のグループ用、少人数のグループ用といったように、グループの規模に応じて生成されてもよいし、グループごとに生成されてもよい。学習済モデルの生成方法は、正解データが画角調整量となること以外は、図１５に示した例と同様である。本実施の形態では、正解データが画角調整量であるため、例えば、プロのカメラマンなどの有識者が正解データを決定してもよい。例えば、イベントのリハーサルにおけるカメラテストなどの際に、カメラマンなどの有識者が全体映像に対応する正解データを決定してもよい。以上述べた以外の動作は、実施の形態１と同様である。また、本実施の形態の変形例１においても、タグ通信部２３によって取得された位置情報を用いて画角調整量を補正してもよい。また、本実施の形態の変形例１においても、全体映像から検出した追尾対象者を入力として学習を行ってもよい。

＜変形例２＞
　次に、本実施の形態の変形例２について説明する。図１８は、本実施の形態にかかる変形例２の領域判断部の構成例を示す図である。本実施の形態の変形例２の撮影システムは、実施の形態１の制御装置１における領域判断部１５の代わりに領域判断部１５ｃを備える以外は実施の形態１の撮影システムと同様である。実施の形態１と同様の機能を有する構成要素は実施の形態１と同一の符号を付して説明する。以下、実施の形態１と異なる点を主に説明する。

　図１８に示すように、領域判断部１５ｃは、図１５に示した例と同様に、学習済モデル生成部１５１、学習済モデル記憶部１５２および推論部１５３を備える。図１５に示した例では、領域判断部１５ｃは、全体映像を入力として、追尾対象者の存在する領域の種別を決定した。変形例２では、全体映像に加えて、さらにイベントの会場に関する情報であるイベント会場情報を入力として、追尾対象者の存在する領域の種別を決定する。なお、図１５に示した例と同様に、追尾映像取得部２２が追尾映像を推論部１５３にも出力するようにし、推論部１５３が、全体映像の代わりに追尾映像を学習済モデルに入力してもよい。

　イベント会場情報は、実施の形態１の変形例１で述べたように、例えばイベント情報に含まれており、イベント情報取得部１１から領域判断部１５ｃへ入力される。イベント会場情報は、例えば、イベントの会場を示す識別情報と、イベントにおけるステージの形状を示す情報とを含む。

　図１９は、本実施の形態の変形例２におけるイベント会場情報の一例を示す図である。図１９に示した例では、イベント会場情報は、イベント会場の識別情報（図１９ではイベント会場と記載）と、イベントの会場の形状を示す情報すなわちステージの形状を示す情報（図１９では形状と記載）とを示す。例えば、イベント会場αであっても、形状Ａと形状Ｂのように、異なる形状のステージが用いられる場合がある。このように、形状によって複数の追尾対象者の配置が異なる場合があるため、本実施の形態では、イベント会場情報に含まれるステージの形状を示す情報についても学習済モデルの入力とする。

　例えば、イベント会場αの形状Ａのステージにおいてイベントが行われる場合には、図１９の最上段に示した情報がイベント会場情報としてイベント情報取得部１１から領域判断部１５ｃへ入力される。なお、形状を示す情報としては、形状自体を示す情報として画像、ステージの領域を座標値などが入力されてもよいし、形状Ａを示す番号などのように識別情報が入力されてもよい。

　変形例２の領域判断部１５ｃにおける学習済モデルの生成方法は、入力にイベント会場情報が追加される以外は、図１５に示した領域判断部１５ｃにおける学習済モデルの生成方法と同様である。変形例２の領域判断部１５ｃの推論時の動作についても、入力にイベント会場情報が追加される以外は、図１５に示した領域判断部１５ｃにおける動作と同様である。また、イベント会場情報を入力に学習済モデルに用いるかわりに、イベント会場と形状の組み合わせごとに、学習済モデルを生成してもよい。この場合、領域判断部１５ｃは、推論時には、イベント会場情報に基づいて使用する学習済モデルを選択する。

　また、変形例２の領域判断部１５ｃの推論結果である、追尾対象者の存在する領域の種別を、タグ通信部２３によって取得された位置情報を用いて補正してもよい。また、本実施の形態の変形例１で述べた画角調整量を学習する場合に、イベント会場情報を入力に追加してもよい。

＜変形例３＞
　次に、本実施の形態の変形例３について説明する。図２０は、本実施の形態にかかる変形例３の領域判断部の構成例を示す図である。本実施の形態の変形例３の撮影システムは、実施の形態１の制御装置１における領域判断部１５の代わりに領域判断部１５ｃを備える以外は実施の形態１の撮影システムと同様である。実施の形態１と同様の機能を有する構成要素は実施の形態１と同一の符号を付して説明する。以下、実施の形態１と異なる点を主に説明する。

　図２０に示すように、領域判断部１５ｃは、図１５に示した例と同様に、学習済モデル生成部１５１、学習済モデル記憶部１５２および推論部１５３を備える。図１５に示した例では、領域判断部１５ｃは、全体映像を入力として、追尾対象者の存在する領域の種別を決定した。変形例３では、全体映像に加えて、さらに演奏する曲などのイベントの内容を示す情報を入力として、追尾対象者の存在する領域の種別を決定する。なお、図１５に示した例と同様に、追尾映像取得部２２が追尾映像を推論部１５３にも出力するようにし、推論部１５３が、全体映像の代わりに追尾映像を学習済モデルに入力してもよい。

　変形例２の領域判断部１５ｃにおける学習済モデルの生成方法は、入力にイベントの内容を示す情報が追加される以外は、図１５に示した領域判断部１５ｃにおける学習済モデルの生成方法と同様である。イベントがコンサートである場合、イベントの内容は例えば、曲であり、曲名を示す情報が学習済モデルの生成時に入力データとして用いられる。

　また、イベントの内容を含むイベント内容情報は、例えば、実施の形態１の変形例２で述べたように、イベント情報の行程表に含まれており、推論時には、イベント情報取得部１１から領域判断部１５ｃへ入力される。

　図２１は、本実施の形態の変形例３におけるイベント内容情報の一例を示す図である。図２１に示すように、イベント内容情報は、例えば、時間を示す時間情報と、イベント内容とを含む。図２１に示した例では、イベント内容は曲である。領域判断部１５ｃは、推論時には、現在時刻を用いて、イベント内容情報における時間情報のうち現在時刻に対応する時間帯の曲を示す情報を、全体映像とともに学習済モデルへ入力することで、全体映像における各位置の領域の種別を推論し、推論結果を用いて追尾対象者の存在する領域の種別を決定する。

　変形例３の領域判断部１５ｃにおける学習済モデルの生成方法は、入力にイベントの内容を示す情報が追加される以外は、図１５に示した領域判断部１５ｃにおける学習済モデルの生成方法と同様である。変形例３の領域判断部１５ｃの推論時の動作についても、入力にイベントの内容を示す情報が追加される以外は、図１５に示した領域判断部１５ｃにおける動作と同様である。また、イベントの内容を示す情報を学習済モデルの入力に用いるかわりに、イベントの内容を示す情報ごとに、学習済モデルを生成してもよい。この場合、領域判断部１５ｃは、推論時には、イベントの内容を示す情報に基づいて使用する学習済モデルを選択する。イベントの内容を示す情報が曲である場合には、曲ごとに学習済モデルが生成される。

　また、変形例３の領域判断部１５ｃの推論結果である、追尾対象者の存在する領域の種別を、タグ通信部２３によって取得された位置情報を用いて補正してもよい。また、本実施の形態の変形例１で述べた画角調整量を学習する場合に、イベントの内容を示す情報を入力に追加してもよい。

　以上述べたように、本実施の形態では、全体映像を用いて機械学習により、設定された追尾対象者が存在する領域の種別を判断し、領域の種別に応じて制御パラメータである画角調整量を決定するようにした。このため、追尾対象者が複数する場合に、追尾用撮影装置５の制御パラメータを適切に決定することができる。

　以上の実施の形態に示した構成は、一例を示すものであり、別の公知の技術と組み合わせることも可能であるし、実施の形態同士を組み合わせることも可能であるし、要旨を逸脱しない範囲で、構成の一部を省略、変更することも可能である。

　１，１ａ，１ｂ　制御装置、２　配信事業者装置、３　ユーザ端末、４　全体用撮影装置、５　追尾用撮影装置、１１　イベント情報取得部、１２　追尾対象者情報通知部、１３　画像情報取得部、１４　追尾対象者検出部、１５，１５ａ，１５ｂ，１５ｃ　領域判断部、１６　画角調整規則記憶部、１７　追尾制御部、１８　撮影装置情報記憶部、１９　画角制御部、２０，４２，５１　映像送信部、２１　全体映像取得部、２２　追尾映像取得部、２３　タグ通信部、２４　画角判断部、３１　追尾対象者情報取得部、３２　選択受付部、３３　選択結果通知部、３４　映像出力部、３５　映像受信部、４１，５２　撮影部、５３　追尾駆動部、５４　画角駆動部、１００　撮影システム、１５１，１９１　学習済モデル生成部、１５２，１９２　学習済モデル記憶部、１５３，１９３　推論部。

Claims

　撮影方向および撮影画角が調整可能な１つ以上の追尾用撮影装置を制御する制御装置であって、
　イベントの出演者である複数の追尾対象者のそれぞれの位置に関する情報である位置関連情報を用いて、前記追尾対象者ごとに、当該追尾対象者を判断対象者とし、当該イベントの他の出演者の位置と前記判断対象者の位置とに応じた前記撮影画角の調整量である画角調整量を決定する画角判断部と、
　を備えることを特徴とする制御装置。
　前記画角判断部は、
　前記位置関連情報を用いて、前記追尾対象者ごとに、当該追尾対象者を判断対象者とし、前記複数の追尾対象者の位置と前記判断対象者の位置とに応じて、前記判断対象者が存在する領域の種別を判断する領域判断部と、
　領域の種別と前記撮影画角の調整内容との対応を定めた画角調整規則に従って、前記領域判断部によって判断された前記判断対象者が存在する領域の種別に対応する前記撮影画角の調整内容を決定し、決定した前記撮影画角の調整内容に基づいて前記撮影画角の調整量を決定し、決定した前記画角調整量を前記判断対象者に対応する前記追尾用撮影装置へ出力する画角制御部と、
　を備えることを特徴とする請求項１に記載の制御装置。
　前記領域判断部は、前記イベントの区切りごとの、前記複数の追尾対象者のうち少なくとも一部の前記追尾対象者が存在する領域の種別を示す情報を含む行程表を用いて、前記判断対象者が存在する領域の種別を判断することを特徴とする請求項２に記載の制御装置。
　前記イベントはコンサートであり、イベントの区切りは、曲を分割したセクション単位の区切りであることを特徴とする請求項３に記載の制御装置。
　領域の種別は前記イベントにおける注目度を示すことを特徴とする請求項１から４のいずれか１つに記載の制御装置。
　前記位置関連情報は、前記複数の追尾対象者を含む全体映像であることを特徴とする請求項１から５のいずれか１つに記載の制御装置。
　前記位置関連情報は、前記複数の追尾対象者のそれぞれの２次元または３次元の位置を示す位置情報であることを特徴とする請求項１から５のいずれか１つに記載の制御装置。
　前記位置関連情報は、前記複数の追尾対象者を含む全体映像であり、
　前記領域判断部は、前記全体映像における領域の種別を推論するための学習済モデルを用いて前記判断対象者が存在する領域の種別を判断することを特徴とする請求項２に記載の制御装置。
　前記学習済モデルは、前記全体映像と前記イベントの会場の形状を示す情報とを用いて前記全体映像における領域の種別を判断するための学習済モデルであることを特徴とする請求項８に記載の制御装置。
　前記学習済モデルは、前記全体映像と前記イベントの内容を示す情報とを用いて前記全体映像における領域の種別を判断するための学習済モデルであることを特徴とする請求項８に記載の制御装置。
　前記イベントはコンサートであり、
　前記イベントの内容を示す情報は、曲を示す情報であることを特徴とする請求項１０に記載の制御装置。
　前記位置関連情報は、前記複数の追尾対象者を含む全体映像であり、
　前記画角判断部は、前記全体映像を用いて前記判断対象者に対応する撮影画角の調整内容を推論するための学習済モデルを用いて、前記撮影画角の調整内容を決定し、決定した前記撮影画角の調整内容を用いて前記撮影画角の調整量を決定することを特徴とする請求項１に記載の制御装置。
　撮影方向および撮影画角が調整可能な１つ以上の追尾用撮影装置と、
　前記追尾用撮影装置を制御する制御装置とを備え、
　前記制御装置は、
　イベントの出演者である複数の追尾対象者のそれぞれの位置に関する情報である位置関連情報を用いて、前記追尾対象者ごとに、当該追尾対象者を判断対象者とし、当該イベントの他の出演者の位置と前記判断対象者の位置とに応じた前記撮影画角の調整量である画角調整量を決定する画角判断部と、
　を備えることを特徴とする撮影システム。
　前記複数の追尾対象者を含む全体映像を撮影する全体用撮影装置、
　を含み、
　前記位置関連情報は、前記全体映像であることを特徴とする請求項１３に記載の撮影システム。
　撮影方向および撮影画角が調整可能な１つ以上の追尾用撮影装置を制御する制御装置における追尾制御方法であって、
　イベントの出演者である複数の追尾対象者のそれぞれの位置に関する情報である位置関連情報を用いて、前記追尾対象者ごとに、当該追尾対象者を判断対象者とし、当該イベントの他の出演者の位置と前記判断対象者の位置とに応じた前記撮影画角の調整量である画角調整量を決定するステップと、
　を含むことを特徴とする追尾制御方法。