WO2022230291A1

WO2022230291A1 - 情報処理装置、情報処理方法、プログラム

Info

Publication number: WO2022230291A1
Application number: PCT/JP2022/004897
Authority: WO
Inventors: 裕也山下; 和政田中
Original assignee: ソニーグループ株式会社
Priority date: 2021-04-26
Filing date: 2022-02-08
Publication date: 2022-11-03
Also published as: JPWO2022230291A1; EP4332871A1; CN117178285A

Abstract

情報処理装置は、イベントにおいて発生したシーンについてのシーン関連情報に基づいて、ダイジェスト映像を生成するための補助情報を特定する特定部を備えたものとした。

Description

情報処理装置、情報処理方法、プログラム

　本技術は、ダイジェスト映像を生成するための情報処理装置、情報処理方法及びプログラムの技術分野に関する。

　映像コンテンツは視聴するユーザの興味や関心に基づいて作成されることが望まれている。
　例えば、下記特許文献１では、ソーシャルネットワーキングシステム（ＳＮＳ：Social Networking Service）に投稿された情報から視聴者の興味の度合いが高い内容を含むようにテレビコンテンツを生成するシステムが開示されている。

特開２０１７－１０７４０４号公報

　ところが、ＳＮＳ等から得られる情報から視聴者が興味関心を抱いたシーンが具体的にどのシーンであるのかを把握するのは難しく、適切な映像コンテンツを生成できない場合がある。

　本技術はこのような問題に鑑みて為されたものであり、視聴者の興味関心を反映した映像コンテンツを提供することを目的とする。

　本技術に係る情報処理装置は、イベントにおいて発生したシーンについてのシーン関連情報に基づいて、ダイジェスト映像を生成するための補助情報を特定する特定部を備えたものである。
　イベントとは、例えば、スポーツの試合やコンサートなどの催し物である。また、補助情報とは、例えば、ダイジェスト映像を生成するために用いられる情報であり、撮像された映像の中からどの部分の映像を切り出すかを決定するために用いられる情報である。例えば、スポーツの試合であれば、具体的には、選手名やシーンの種別やプレイの種別などの情報が補助情報とされる。

情報処理装置を含むシステム構成例を示す図である。映像生成部の機能構成を示す図である。各撮像装置において撮像される映像の一例を示す図である。図５から図７の各図と共に示す第１の処理フローを示す図であり、本図は投稿データ抽出部が実行する処理の一例を示すフローチャートである。第１の処理フローにおいてメタデータ抽出部が実行する処理の一例を示すフローチャートである。第１の処理フローにおいて映像解析部が実行する処理の一例を示すフローチャートである。第１の処理フローにおいて映像生成部が実行する処理の一例を示すフローチャートである。図９から図１１の各図と共に示す第２の処理フローを示す図であり、本図は投稿データ抽出部が実行する処理の一例を示すフローチャートである。第２の処理フローにおいてメタデータ抽出部が実行する処理の一例を示すフローチャートである。第２の処理フローにおいて映像解析部が実行する処理の一例を示すフローチャートである。第２の処理フローにおいて映像生成部が実行する処理の一例を示すフローチャートである。クリップ集の生成処理の一例を示すフローチャートである。クリップ映像及びクリップ集の生成処理の一例を示すフローチャートである。撮像装置の映像に付与されたスコアの一例を示す例である。クリップ映像を結合して対象シーンについてのクリップ集を生成する処理の一例を示すフローチャートである。クリップ映像及びクリップ集の生成処理の一例を示すフローチャートである。クリップ映像及びクリップ集の生成処理の別の例を示すフローチャートである。コンピュータ装置のブロック図である。

　以下、添付図面を参照し、本技術に係る情報処理装置の実施の形態を次の順序で説明する。
＜１．システム構成＞
＜２．処理フロー＞
＜２－１．第１の処理フロー＞
＜２－２．第２の処理フロー＞
＜２－３．第３の処理フロー＞
＜２－４．クリップ集の生成処理のフロー＞
＜３．スコアリングについて＞
＜３－１．スコアリング方法＞
＜３－２．スコアを用いた映像選択における処理フロー＞
＜４．変形例＞
＜５．コンピュータ装置＞
＜６．まとめ＞
＜７．本技術＞

＜１．システム構成＞
　本実施の形態のシステム構成例について図１を参照して説明する。
　本実施の形態の情報処理装置１は、スポーツの試合やコンサートや舞台などの催し物についてのダイジェスト映像ＤＶを生成する装置である。生成されたダイジェスト映像ＤＶは、視聴者に対して配信される。

　なお、以下の説明においては、催し物の一例としてスポーツの試合を挙げる。特に、アメリカンフットボールの試合のダイジェスト映像ＤＶの生成を行う情報処理装置１について述べる。

　ダイジェスト映像ＤＶは、試合の流れを理解させるための重要なシーンを集めた映像とされる。また、ダイジェスト映像ＤＶは、ハイライト映像と読み替えることが可能である。

　情報処理装置１は、投稿データ抽出部２と、メタデータ抽出部３と、映像解析部４と、映像生成部５と、を備えている。

　投稿データ抽出部２は、ＳＮＳ（Social Networking Service）に投稿された文章やハッシュタグや映像などからキーワードを抽出する処理を行う。そのために、情報処理装置１は、通信ネットワークＮＷを介してＳＮＳサーバ１００との相互通信が可能に構成されている。

　投稿データ抽出部２が抽出するキーワードは、例えば、試合に出場している選手の選手名や、その背番号、或いは、監督や審判員の名前などである。これらの情報は、人物を特定可能な情報とされる。選手名としては、ファーストネームやファミリーネームだけでなく、愛称などが含まれる。

　また、投稿データ抽出部２が抽出するキーワードは、プレイの内容を示すシーン種別の情報であってもよい。具体的には、タッチダウンやフィールドゴールなどの得点シーンについての種別情報や、オフサイドやホールディングなどの各種反則についての種別情報などである。或いは通常よりもよいプレイを示す情報や失敗となったプレイを示す情報としてスーパープレイや失策などの種別であってもよい。

　投稿データ抽出部２が抽出する情報は、ダイジェスト映像ＤＶを生成するための指標となる情報である。特に、ＳＮＳに投稿された情報は、視聴者の興味関心に沿ったダイジェスト映像ＤＶを生成するために用いられる情報である。

　投稿データ抽出部２が抽出する情報は、イベントにおける特定のシーンについての情報であり、これを「シーン関連情報」と記載する。

　メタデータ抽出部３は、試合の展開等を表す情報が含まれたメタデータを抽出する処理を行う。メタデータとは、例えば、試合を運営している企業が独自に配信している情報であってもよいし、試合を観戦しながら試合展開等の各種情報を記録している記録員（スコアラー）によって入力された情報であってもよいし、スポーツについての情報を扱う企業から配信されるデータであってもよい。或いは、ウェブ上にアップロードされた試合展開についての情報であってもよい。

　メタデータの一例を挙げると、タッチダウンやフィールドゴールや反則や選手の交代や選手の退場など試合中に発生するシーンの種別情報と、シーンの発生時刻と、シーンに関わった選手情報と、シーンの発生に伴う得点の変化などの情報が紐付けられた情報がメタデータである。

　メタデータは、試合において特定のシーンが発生するごとに配信されてもよいし、試合終了後にまとめて配信されてもよい。

　メタデータ抽出部３は、イベントにおける特定のシーンについての情報であり、この情報も「シーン関連情報」とされる。

　情報処理装置１は、メタデータ抽出部３がメタデータの抽出処理を実行可能なように、通信ネットワークＮＷを介してメタデータサーバ２００との相互通信が可能に構成されている。

　映像解析部４は、試合会場に配置された複数の撮像装置ＣＡから映像を受信する処理を行うと共に、受信した映像に対する画像解析処理を行う。
　また、映像解析部４は、放送された映像である放送映像ＶＡを取得する処理を行い、放送映像ＶＡに対する画像解析処理を行う。

　なお、図１には撮像装置ＣＡの一例として第１撮像装置ＣＡ１、第２撮像装置ＣＡ２、第３撮像装置ＣＡ３を例示しているが、これは一例であり、１台のみの撮像装置ＣＡが試合会場に設置されていてもよいし、４台以上の撮像装置ＣＡが試合会場に設置されていてもよい。

　また、第１撮像装置ＣＡ１から得た映像を第１映像Ｖ１とし、第２撮像装置ＣＡ２から得た映像を第２映像Ｖ２とし、第３撮像装置ＣＡ３から得た第３映像をＶ３とする。

　各撮像装置ＣＡは同期されており、タイムコードを参照することにより同タイミングで撮像された画像が分かるようにされている。

　映像解析部４は、画像解析処理によって、時間ごとに撮像されている被写体の情報を得る。被写体の情報としては、例えば、選手名などの被写体の名前や背番号情報や撮像角度や被写体の姿勢などである。また、顔の特徴や、髪型や、髪色や、表情などに基づいて被写体を特定してもよい。

　映像解析部４は、画像解析処理によって、シーンを特定するシーン種別の情報を得る。シーン種別の情報としては、例えば、撮像されているシーンが得点シーンであるのか、反則シーンであるのか、選手の交代シーンであるのか、負傷シーンであるのかなどの情報である。前述した被写体の姿勢検出によってシーン種別を特定してもよい。例えば、審判員の姿勢を検出することにより審判員のジャッジ内容を推定してシーン種別を特定してもよいし、選手のガッツポーズを検出することにより得点シーンを検出してもよい。

　映像解析部４は、画像解析処理によってイン点及びアウト点を特定する。イン点及びアウト点は、撮像装置ＣＡが撮像した映像の切り出し範囲を特定するための情報である。以降の説明においては、一組のイン点及びアウト点によって切り出された所定範囲の映像を「クリップ映像ＣＶ」として記載する。

　イン点及びアウト点は、例えば、検出対象のプレイが発生した瞬間を画像解析処理により特定し、そこを基点として決定してもよい。
　また、放送映像ＶＡに基づいてイン点及びアウト点を検出する場合には、映像の切り替わりのタイミングを検出することにより行ってもよい。即ち、映像解析部４は、放送映像ＶＡに対する画像解析処理を行い、撮像装置ＣＡのスイッチング点を検出することにより、イン点及びアウト点を特定してもよい。

　映像解析部４は、映像に対して画像解析処理によって得られた情報を付与する。例えば、第１映像Ｖ１においてある時間帯に選手Ａと選手Ｂが撮像されていること、そして、当該時間帯はタッチダウンのシーンであることなどが紐付けられて記憶される。
　これにより、例えば、特定の選手が撮像されたシーンを用いてダイジェスト映像ＤＶを作成したい場合などに、特定の選手が撮像された時間帯を容易に特定することができる。

　映像解析部４は、放送映像ＶＡに対する画像解析処理を実行することにより、試合展開を特定する。
　放送映像ＶＡは、第１映像Ｖ１や第２映像Ｖ２や第３映像Ｖ３を素材として特定の部分映像（クリップ映像ＣＶ）を繋ぎ合わせると共に、得点情報や選手名情報などの各種情報が重畳されて生成されたものである。

　画像解析処理では、映像に重畳された字幕や三次元画像などを認識することにより、得点の推移や選手交代や画像に撮像された選手の選手名や試合における経過時間などを特定する。

　また、映像解析部４は、画像解析処理を行うことにより、映像ごとにスコアを付与してもよい。スコアは、撮像されている被写体を特定した場合における尤度として算出されてもよいし、視聴者に対して提示する映像として適切であるか否かを表す指標として算出されてもよい。

　なお、図１においては、映像解析部４が撮像装置ＣＡから映像を取得する構成を示しているが、撮像装置ＣＡにおいて撮像された映像が記憶された記憶装置から映像を取得してもよい。

　映像生成部５は、第１映像Ｖ１、第２映像Ｖ２及び第３映像Ｖ３を用いてダイジェスト映像ＤＶを生成する処理を行う。

　そのために、映像生成部５は特定部１０とクリップ集生成部１１とダイジェスト映像生成部１２とを備える（図２参照）。

　特定部１０は、ダイジェスト映像ＤＶを生成するための補助情報ＳＤを特定する処理を行う。ここで、ダイジェスト映像ＤＶの生成の流れの一例を示す。

　あるスポーツの試合で得点シーンが発生したとする。この場合には、該得点シーンについてのクリップ集ＣＳが生成される。クリップ集ＣＳは、複数のクリップ映像ＣＶを結合したものであり、例えば、第１撮像装置ＣＡ１によって撮像された第１映像Ｖ１の中から該得点シーンが撮像された時間帯を切り出したクリップ映像ＣＶと、第２撮像装置ＣＡ２によって撮像された第２映像Ｖ２の中から該得点シーンが撮像された時間帯を切り出したクリップ映像ＣＶと、第３撮像装置ＣＡ３によって撮像された第３映像Ｖ３の中から該得点シーンが撮像された時間帯を切り出したクリップ映像ＣＶが結合されて、該得点シーンについてのクリップ集ＣＳが生成される。

　このようなクリップ集ＣＳは、例えば、得点シーンの数だけ、或いは反則シーンの数だけ、または、選手交代のシーンの数だけ生成される。

　ダイジェスト映像ＤＶは、このように生成された複数のクリップ集ＣＳから視聴者に対して提示すべきクリップ集ＣＳを選択し、結合することにより生成される。

　クリップ集ＣＳに含めるクリップ映像ＣＶの選択には、例えば、補助情報ＳＤが用いられる。補助情報ＳＤは、ダイジェスト映像ＤＶに含まれるクリップ集ＣＳを複数のクリップ集ＣＳから選択する際に用いられるキーワードとされる。ＳＮＳである選手の名前が頻繁に投稿されている場合には、当該選手に対する視聴者の関心が高いと判定できる。その場合には、当該選手が関わった得点シーンや反則シーンなどが選択されてダイジェスト映像ＤＶに組み込まれる。

　なお、選手名や上述した愛称だけでなく、選手を特定できる情報であればよく、例えば、ポジション名や審判などのキーワードであってもよい。

　或いは、補助情報ＳＤは、シーン種別情報としてのキーワードとされてもよい。例えば、ＳＮＳで反則シーンについての投稿が多い場合には、反則シーンに対する視聴者の関心が高いと判定できる。その場合には、反則シーンのクリップ集ＣＳが選択されてダイジェスト映像ＤＶに組み込まれる。

　なお、補助情報ＳＤは、得点シーンや反則シーンなどのような種別情報であってもよいし、それよりも更に細かいフィールドゴールシーンやタッチダウンシーンや具体的な反則名などのような種別情報を示すキーワードであってもよい。

　また、補助情報ＳＤは、クリップ集ＣＳに含まれるクリップ映像ＣＶの結合順序を示すものであってもよい。
　補助情報ＳＤに基づいてクリップ集ＣＳを生成することで、例えば、図３に示すように、第１映像Ｖ１がフィールドのサイドから俯瞰で撮像した広角映像とされ、第２映像Ｖ２がボール保持した選手付近を撮像した望遠映像とされ、第３映像Ｖ３がゴールポスト側から撮像した映像とされていた場合に、各映像から切り出したクリップ映像ＣＶを適切な順序で結合することが可能となる。

　なお、結合順序を示す補助情報ＳＤは、シーン種別に応じて異なるものとされてもよい。例えば、得点シーンは広角映像から開始され、反則シーンは望遠映像から開始されるようにしてもよい。

　他にも、補助情報ＳＤは、放送された映像であるか否かを示す情報であってもよい。視聴者は、試合についての放送映像ＶＡを既に視聴済みである可能性がある。
　そのような視聴者に対して同じ映像を視聴させても視聴者に対して有意な情報を提供することにはならないため、視聴者が視聴していない角度から撮像された映像が含まれるようにダイジェスト映像ＤＶを生成することが考えられる。放送された映像であるか否かを示す補助情報ＳＤは、このような場合においてクリップ集ＣＳの選択或いはクリップ映像ＣＶの選択に用いられる。

　クリップ集生成部１１は、補助情報ＳＤに基づいてクリップ映像ＣＶの生成を行う。具体的には、選手名などの特定された補助情報ＳＤを映像解析部４に提示することにより、映像解析部４に当該選手が撮像された映像のイン点及びアウト点を決定させクリップ映像ＣＶを生成させる。

　クリップ集生成部１１は、クリップ映像ＣＶを結合してクリップ集ＣＳを生成する。クリップ映像ＣＶの結合順序は、補助情報ＳＤに基づいてもよいし、予め決められた所定の順序とされてもよい。

　即ち、クリップ集生成部１１は、映像解析部４による画像解析処理の解析結果と補助情報ＳＤとを用いてクリップ集ＣＳを生成する。

　なお、クリップ集生成部１１は、二つのクリップ映像ＣＶを結合する際に、映像が切り替わることを表現する画像をクリップ映像ＣＶ間に挿入してもよい。

　ダイジェスト映像生成部１２は、クリップ集生成部１１によって生成されたクリップ集ＣＳを結合してダイジェスト映像ＤＶを生成する。
　クリップ集ＣＳの結合順序は、例えば、各シーンの発生時刻に沿って決定される。クリップ集ＣＳの間には、映像が切り替わることを表現する画像等が挿入されてもよい。

　生成されたダイジェスト映像ＤＶは、ＳＮＳに投稿されてもよいし、ウェブページ上にアップロードされてもよい。

＜２．処理フロー＞
　情報処理装置１が実行する処理についていくつかの例を説明する。

＜２－１．第１の処理フロー＞
　第１の処理フローの例を図４から図７の各図に示す。具体的には、情報処理装置１の投稿データ抽出部２が実行する処理フローの一例を図４に、メタデータ抽出部３が実行する処理フローの一例を図５に、映像解析部４が実行する処理フローの一例を図６に、映像生成部５が実行する処理フローの一例を図７に示す。

　投稿データ抽出部２は、図４のステップＳ１０１においてＳＮＳの投稿データの解析を行う。この解析処理によって出現頻度の高いキーワードや注目度の高いキーワードが抽出される。これらのキーワードは、例えば、前述した選手名やシーン種別である。

　次に、投稿データ抽出部２はステップＳ１０２において、抽出されたキーワードが対象のイベントに関連しているか否かを判定する。具体的には、抽出された人名がダイジェスト映像ＤＶの生成対象となる試合に参加しているチームの一員として存在するか否かを判定したり、抽出されたキーワードが対象の試合に関連するものであるか否かを判定したりする。

　対象とするイベントに関連していると判定した場合、投稿データ抽出部２はステップＳ１０３において、抽出したキーワードをメタデータ抽出部３に出力する処理を行う。

　一方、対象とするイベントに関連していないと判定した場合、投稿データ抽出部２はステップＳ１０３の処理を行わずにステップＳ１０４において、イベントが終了したか否かを判定する。

　イベントは終了していないと判定した場合、投稿データ抽出部２はステップＳ１０１の処理へと戻ることにより、キーワードの抽出を継続する。
　一方、イベントは終了したと判定した場合、投稿データ抽出部２は図４に示す一連の処理を終了する。

　なお、図４及び以降に示す各図においては、イベントの進行と並行してダイジェスト映像ＤＶを生成するためのクリップ集ＣＳを生成する例であるため、ステップＳ１０４においてイベントが終了しているか否かを判定する処理を実行している。

　これに対して、イベントの終了後にクリップ集ＣＳ及びダイジェスト映像ＤＶの生成を行う場合には、ステップＳ１０４の判定処理の代わりに、イベントが開催されていた時間帯においてＳＮＳに投稿された投稿データすべてに対してキーワード等の抽出を終えたか否かを判定する処理を実行すればよい。

　投稿データ抽出部２が図４に示す一連の処理を実行することにより、スポーツの試合などのイベントの開始からイベントの終了にかけて、ＳＮＳに投稿された投稿データからキーワードが継続的に抽出されて、適宜メタデータ抽出部３に出力される。

　投稿データ抽出部２による図４に示す処理の実行と並行して、メタデータ抽出部３は図５に示す一連の処理を実行する。
　具体的に、メタデータ抽出部３はステップＳ２０１において、メタデータサーバ２００から取得したメタデータを解析してイベントにおいて発生したシーンを特定するための情報を抽出する。例えば、アメリカンフットボールの試合であれば、シーン種別の一つであるタッチダウンに該当するシーンが発生した時刻と、タッチダウンによって得点を得た選手名と、タッチダウンによる得点の変化の情報などを抽出する。

　続いて、メタデータ抽出部３はステップＳ２０２において、ＳＮＳの投稿から抽出されたキーワードを投稿データ抽出部２から得たか否かを判定する。

　キーワード情報を得ていない場合、メタデータ抽出部３はステップＳ２０１の処理へと戻る。

　キーワード情報を得ていた場合、メタデータ抽出部３はステップＳ２０３において取得したキーワードに関連するメタデータを特定する。

　続いて、メタデータ抽出部３はステップＳ２０４において、特定したメタデータを映像解析部４へと出力する。

　そして、メタデータ抽出部３はステップＳ２０５において、イベントが終了したか否かを判定する。

　イベントは終了していないと判定した場合、メタデータ抽出部３はステップＳ２０１の処理へと戻ることにより、メタデータを解析する処理を行う。
　一方、イベントは終了したと判定した場合、メタデータ抽出部３は図５に示す一連の処理を終了する。

　メタデータ抽出部３が図５に示す一連の処理を実行することにより、スポーツの試合などのイベントの開始からイベントの終了にかけて、外部の情報処理装置としてのメタデータサーバ２００に蓄積されるメタデータの解析処理が継続的に実行されて、試合中に発生する各シーンの情報が抽出される。

　投稿データ抽出部２による図４に示す処理の実行とメタデータ抽出部３による図５に示す処理の実行に並行して、映像解析部４は図６に示す一連の処理を実行する。

　映像解析部４はステップＳ３０１において、第１映像Ｖ１や第２映像Ｖ２や第３映像Ｖ３や放送映像ＶＡなどの複数の映像に対して画像認識処理を行うことにより映像解析を行い、映像中に撮像された背番号や、選手の顔や、ボールなどを識別する。また、映像解析部４は、更にカメラアングルを特定してもよいし、クリップ映像ＣＶを生成するためのイン点及びアウト点を特定してもよい。

　顔認識処理においては、認識結果の尤もらしさを示す尤度情報を算出してもよい。尤度情報は、後段の映像生成部５における映像の選択処理などに利用される。

　画像認識処理によって特定された情報は、複数の映像ごとに試合経過時間や録画開始からの経過時間などの時間情報と紐付けられて記憶される。

　映像解析部４はステップＳ３０２において、イベントが終了したか否かを判定する。
　イベントは終了していないと判定した場合、映像解析部４はステップＳ３０１の処理へと戻ることにより、映像解析処理を継続して行う。
　一方、イベントは終了したと判定した場合、映像解析部４は図６に示す一連の処理を終了する。

　映像解析部４が図６に示す一連の処理を実行することにより、スポーツの試合などのイベントの開始からイベントの終了にかけて撮像された映像について、各種の情報が抽出される。

　映像生成部５は投稿データ抽出部２とメタデータ抽出部３と映像解析部４の処理結果に応じてダイジェスト映像ＤＶを生成する。

　具体的に、映像生成部５は図７のステップＳ４０１において、キーワードやメタデータを取得したか否かを判定する。

　投稿データ抽出部２からＳＮＳに投稿されたキーワードを取得していた場合や、メタデータ抽出部３からメタデータについての情報を取得していた場合には、映像生成部５はステップＳ４０２へと進み、キーワードまたはメタデータに基づいて対象シーンについてのクリップ映像ＣＶを生成する処理を行う。この処理は、対象シーンについて映像解析部４によって特定されたイン点及びアウト点に基づいてクリップ映像ＣＶを生成する。

　クリップ映像ＣＶを生成した後、映像生成部５はステップＳ４０３において、クリップ映像ＣＶを結合して対象シーンについてのクリップ集ＣＳを生成する。クリップ映像ＣＶは、例えば、第１映像Ｖ１と第２映像Ｖ２と第３映像Ｖ３を予め決められた順序で結合することにより生成されてもよい。

　或いは、シーン種別に応じて所定のカメラアングルの順序で映像が結合されるようにテンプレートが用意され、各撮像装置ＣＡごとのカメラアングルの情報に基づいて各クリップ映像ＣＶを当該テンプレートに当てはめることにより最適な順序でクリップ映像ＣＶが結合されるようにしてもよい。

　クリップ映像ＣＶを生成した後、映像生成部５はステップＳ４０１の処理へと戻る。

　ステップＳ４０１の判定処理において、キーワードやメタデータを取得していないと判定した場合、映像生成部５はステップＳ４０４へと進み、イベントが終了したか否かを判定する。

　イベントはまだ終了していないと判定した場合、映像生成部５はステップＳ４０１へと戻り、クリップ映像ＣＶとクリップ集ＣＳの生成を継続する。

　一方、イベントは終了したと判定した場合、映像生成部５はステップＳ４０５へと進み、クリップ集ＣＳを結合してダイジェスト映像ＤＶを生成する。

　ダイジェスト映像ＤＶは、基本的に試合中に起きた各シーンについてのクリップ集ＣＳを時系列順に結合することにより生成される。

　なお、ダイジェスト映像ＤＶの再生時間長に制限がある場合には、クリップ集ＣＳの中から優先度が高いクリップ集ＣＳが含まれるように取捨選択をしながらダイジェスト映像ＤＶを生成することとなる。

　優先度が高いクリップ集ＣＳとは、いずれかのチームが得点したシーンに対応したクリップ集ＣＳや、ＳＮＳの投稿データから視聴者の関心が高いと推定されるシーンに対応したクリップ集ＣＳなどである。

　なお、クリップ集ＣＳの選択においては、試合終了後の所定期間（１０分や３０分など）に投稿された投稿データを用いてもよい。例えば、試合終了後の所定期間に投稿された投稿データは、試合を総括するような投稿や、その試合でもう一度みたいシーンに言及した投稿などが含まれていることが推定される。

　そのような投稿データに基づいてクリップ集ＣＳを選択することにより、視聴者の興味関心の高いダイジェスト映像ＤＶを生成することが可能となる。

　ダイジェスト映像ＤＶを生成した後、映像生成部５はステップＳ４０６において、ダイジェスト映像ＤＶを保存する処理を行う。ダイジェスト映像ＤＶが保存される場所は、情報処理装置１の内部にある記憶部であってもよいし、情報処理装置１とは別のサーバ装置の記憶部であってもよい。

＜２－２．第２の処理フロー＞
　第２の処理フローの例を図８から図１１の各図に示す。なお、第１の処理フローにおいて説明した処理と同様の処理については、同じステップ番号を付し適宜説明を省略する。

　投稿データ抽出部２は、図８のステップＳ１０１において、ＳＮＳの投稿データの解析を行う。この解析処理によって選手名やシーン種別などの出現頻度の高いキーワードや注目度の高いキーワードが抽出される。

　次に、投稿データ抽出部２はステップＳ１０２において、抽出されたキーワードが対象のイベントに関連しているか否かを判定する。

　対象とするイベントに関連していると判定した場合、投稿データ抽出部２はステップＳ１１０において、抽出したキーワードを分類する処理を行う。

　例えば、抽出したキーワードを、選手や審判員や監督などの人物に関連するキーワードと、フィールドゴールやタッチダウンなど得点シーンに関連するキーワードと、オフサイドやホールディングなど反則シーンに関連するキーワードの何れかに分類する。

　なお、ここで示した三つの分類はあくまで一例であり、キーワードをそれ以外のカテゴリに分類してもよい。

　キーワードを分類した後、投稿データ抽出部２はステップＳ１１１において、分類結果をメタデータ抽出部３に出力する。

　一方、対象とするイベントに関連していないと判定した場合、または、ステップＳ１１１を実行した後、投稿データ抽出部２はステップＳ１１０及びステップＳ１１１の各処理を行わずにステップＳ１０４において、イベントが終了したか否かを判定する。

　イベントは終了していないと判定した場合、投稿データ抽出部２はステップＳ１０１の処理へと戻ることにより、キーワードの抽出を継続する。
　一方、イベントは終了したと判定した場合、投稿データ抽出部２は図８に示す一連の処理を終了する。

　投稿データ抽出部２による図８に示す処理の実行と並行して、メタデータ抽出部３は図９に示す一連の処理を実行する。

　メタデータ抽出部３は図９のステップＳ２１０において、キーワードの分類結果を取得したか否かを判定する。
　分類結果を取得したと判定した場合、メタデータ抽出部３はステップＳ２１１において、分類結果に応じた分岐処理を行う。

　例えば、抽出したキーワードが人物に関連するものであった場合、メタデータ抽出部３はステップＳ２１２において、キーワードに関連する人物が含まれるメタデータを特定する。

　或いは、抽出したキーワードが得点シーンに関連するものであった場合、メタデータ抽出部３はステップＳ２１３において、得点シーンについてのメタデータを特定する。

　また、抽出したキーワードが反則シーンに関連するものであった場合、メタデータ抽出部３はステップＳ２１４において、反則シーンについてのメタデータを特定する。

　ステップＳ２１２、Ｓ２１３またはＳ２１４の何れかを実行した後、メタデータ抽出部３はステップＳ２０４へと進み、特定したメタデータ及び先述の分類結果を映像解析部４へと出力する。

　イベントは終了していないと判定した場合、メタデータ抽出部３はステップＳ２１０の処理へと戻ることにより、分類結果の取得判定を行う。
　一方、イベントは終了したと判定した場合、メタデータ抽出部３は図９に示す一連の処理を終了する。

　投稿データ抽出部２による図８に示す処理とメタデータ抽出部３による図９に示す処理に並行して、映像解析部４は図１０に示す一連の処理を実行する。

　映像解析部４はステップＳ３１０において、メタデータ抽出部３からメタデータや分類結果を取得したか否かを判定する。
　メタデータを取得していないと判定した場合、映像解析部４はステップＳ３１０の処理を再び実行する。

　一方、メタデータを取得したと判定した場合、映像解析部４はステップＳ３１１へと進み、分類結果に応じた分岐処理を行う。

　例えば、メタデータが人物に関連するものであった場合、映像解析部４はステップＳ３１２において、特定された人物が撮像された時間帯を特定するために画像認識処理による背番号認識や顔認識を行う。

　或いは、メタデータが得点シーンに関連するものであった場合、映像解析部４はステップＳ３１３において、得点シーンを特定するために画像認識処理によるスコアボード認識を行う。

　画像認識処理によるスコアボード認識とは、例えば、会場に設置されているスコアボードが撮像された箇所を検出してスコアボードの点数を抽出する処理を行ってもよいし、放送映像ＶＡを解析することにより撮像画像に重畳された字幕やグラフィックス等を認識することにより両チームの点数の変化を検出してもよい。

　なお、メタデータによって得点シーンが発生した時刻が明らかであるため、撮像された映像の全体を対象として画像認識処理を行うのではなく、特定された時刻を中心とした前後所定範囲の映像を対象として画像認識処理を行えばよい。これにより、画像認識処理に係る処理負担の軽減や処理時間の短縮を図ることができる。

　また、抽出したキーワードが反則シーンに関連するものであった場合、映像解析部４はステップＳ３１４において、反則シーンを特定するために画像認識処理による反則表示の検出を行う。

　反則シーンを特定するための画像認識処理とは、例えば、フィールド内に投げ込まれたイエローフラッグを認識することにより反則シーンの発生タイミングを特定してもよいし、放送映像ＶＡを解析することにより撮像画像に重畳された字幕やグラフィックス等を認識することにより反則シーンを特定してもよい。
　また、サッカーであれば、審判員の姿勢を検出することにより、対象選手に対してイエローカードやレッドカードを掲げているシーンを反則シーンとして特定してもよい。

　ステップＳ３１４の画像解析処理においてもステップＳ３１３と同様にメタデータに基づいて所定の区間の映像を対象として処理を行えばよい。

　ステップＳ３１２、Ｓ３１３またはＳ３１４の何れかを実行した後、映像解析部４はステップＳ３１５へと進み、画像解析処理によってカメラアングルを特定する。
　ここで特定されたカメラアングルの情報は、後段のクリップ集ＣＳを生成する処理において用いられる。

　続いて、映像解析部４はステップＳ３１６において、イン点及びアウト点を特定するための画像解析処理を実行する。
　なお、イン点及びアウト点は、シーンの発生タイミングを基点として決められてもよい。例えば、シーンの発生タイミングの１５秒前をイン点とし、イン点から２０秒後をアウト点としてもよい。

　映像解析部４はステップＳ３０２において、イベントが終了したか否かを判定する。
　イベントは終了していないと判定した場合、映像解析部４はステップＳ３１０の処理へと戻る。
　一方、イベントは終了したと判定した場合、映像解析部４は図１０に示す一連の処理を終了する。

　具体的に、映像生成部５は図１１のステップＳ４１０において、イン点及びアウト点を特定したことを検出したか否かを判定する。

　イン点及びアウト点を特定したことを検出した場合には、映像生成部５はステップＳ４１１へと進み、イン点及びアウト点に基づいてクリップ映像ＣＶを生成する処理を行う。

　クリップ映像ＣＶを生成した後、映像生成部５はステップＳ４０３において、クリップ映像ＣＶを結合して対象シーンについてのクリップ集ＣＳを生成する。

　クリップ映像ＣＶを生成した後、映像生成部５はステップＳ４１０の処理へと戻る。

　ステップＳ４１０の判定処理において、イン点及びアウト点を特定したことを検出していないと判定した場合、映像生成部５はステップＳ４０４へと進み、イベントが終了したか否かを判定する。

　イベントはまだ終了していないと判定した場合、映像生成部５はステップＳ４１０へと戻る。

　一方、イベントは終了したと判定した場合、映像生成部５はステップＳ４０５へと進み、クリップ集ＣＳを結合してダイジェスト映像ＤＶを生成し、続くステップＳ４０６において、ダイジェスト映像ＤＶを保存する処理を行う。

＜２－３．第３の処理フロー＞
　第３の処理フローは、メタデータを利用せずにダイジェスト映像ＤＶを生成する場合の例である。

　具体的に、図８、図１０及び図１１の各図を参照して説明する。

　投稿データ抽出部２は図８に示す一連の処理を実行することにより、イベントに関連したキーワードを抽出し分類する。分類結果は、ステップＳ１１１において映像解析部４へ出力される。

　メタデータ抽出部３はメタデータの解析を行う必要が無いため、処理を行わない。

　映像解析部４は、図１０のステップＳ３１０において、メタデータを取得したか否かを判定する代わりにキーワードの分類結果を取得したか否かを判定する。

　そして、キーワードの分類結果に応じて適宜ステップＳ３１１からＳ３１６の各処理を実行する。

　映像生成部５は、図１１に示す一連の処理を実行することにより、ダイジェスト映像ＤＶを生成する。

　このように、メタデータを利用せずにＳＮＳへの投稿データのみを用いて視聴者に訴求力のあるダイジェスト映像ＤＶを生成することができる。

＜２－４．クリップ集の生成処理のフロー＞
　図７や図１１のステップＳ４０３で説明したクリップ集ＣＳの生成処理について、具体的な処理の流れを説明する。

　一つ目の例は、シーンの種別ごとに異なるテンプレートを用いる例である。

　映像生成部５は図１２のステップＳ５０１において、対象シーンのシーン種別に応じた分岐処理を行う。対象シーンの種別は、キーワードから推定してもよいし、メタデータに基づいて決定されてもよい。

　シーン種別がタッチダウンシーンである場合には、映像生成部５はステップＳ５０２において、タッチダウンシーン用のテンプレートを選択する。

　テンプレートは前述したように、どのようなカメラアングルの映像をどのような順序で結合するかについて定めた情報とされる。

　シーン種別がフィールドゴールシーンである場合には、映像生成部５はステップＳ５０３において、フィールドゴールシーン用のテンプレートを選択する。

　シーン種別が反則シーンである場合には、映像生成部５はステップＳ５０４において、反則シーン用のテンプレートを選択する。

　ステップＳ５０２、Ｓ５０３またはＳ５０４においていずれかのテンプレートを選択した後、映像生成部５はステップＳ５０５において、選択したテンプレートを利用してクリップ集ＣＳを生成する処理を実行する。

　また、ステップＳ５０１において、シーン種別が何れにも該当しない場合と判定した場合には、映像生成部５はステップＳ５０６において、放送映像ＶＡにおける対象区間をクリップ集ＣＳとして採用する。

　対象区間は、例えば、ＳＮＳへの投稿時間に基づいて決定されてもよいし、メタデータにおけるシーン発生時刻に基づいて決定されてもよい。

　ステップＳ５０５またはＳ５０６のいずれかの処理を実行した後、映像生成部５はクリップ集ＣＳの生成処理を終える。

　もう一つの例は、クリップ集ＣＳの生成だけでなくクリップ映像ＣＶの生成のためのイン点及びアウト点の決定を対象シーンのシーン種別に応じたものとする例である。

　具体的には、図７のステップＳ４０２及びステップＳ４０３の代わりに実行する処理であり、図１１におけるステップＳ４１１及びステップＳ４０３の代わりに実行する処理である。この処理をステップＳ４２１として説明する（図１３参照）。

　映像生成部５はステップＳ５０１において、対象シーンのシーン種別に応じた分岐処理を行う。

　シーン種別がタッチダウンシーンである場合には、映像生成部５はステップＳ５１０において、タッチダウンシーン用にイン点及びアウト点を決定してクリップ映像ＣＶを生成する。このとき、イン点及びアウト点は例えばクリップ映像ＣＶが最適な長さとなるように決定されてもよい。

　次に、映像生成部５はステップＳ５０２において、タッチダウンシーン用のテンプレートを選択する。

　また、シーン種別がフィールドゴールシーンである場合には、映像生成部５はステップＳ５１１において、フィールドゴールシーン用にイン点及びアウト点を決定してクリップ映像ＣＶを生成する。

　次に、映像生成部５はステップＳ５０３において、フィールドゴールシーン用のテンプレートを選択する。

　更に、シーン種別が反則シーンである場合には、映像生成部５はステップＳ５１２において、反則シーン用にイン点及びアウト点を決定してクリップ映像ＣＶを生成する。

　次に、映像生成部５はステップＳ５０４において、反則シーン用のテンプレートを選択する。

　ステップＳ５０２、Ｓ５０３またはＳ５０４の何れかを実行した後、映像生成部５はステップＳ５０５において、選択したテンプレートを利用してクリップ集ＣＳを生成する処理を実行する。

　なお、図１２及び図１３においては、反則シーンに対して一つのテンプレートが用意されている例を示したが、反則の種類に応じて異なるテンプレートが用意されていてもよい。また、図示するケースだけでなく、負傷シーンなど他のシーン種別に対してもテンプレートが用意されていてもよい。

＜３．スコアリングについて＞
＜３－１．スコアリング方法＞
　クリップ集ＣＳの再生時間長に制限がある場合には、選択したクリップ映像ＣＶを全て結合できない場合もある。そのような場合には、各クリップ映像ＣＶにスコアを付すスコアリング処理を行い、スコアの高いクリップ映像ＣＶが優先的にクリップ集ＣＳに含まれるようにしてもよい。

　図１４は、撮像装置ＣＡごとのクリップ映像ＣＶについて、被写体の大きさに対するスコアリングの結果付与されたスコアと、被写体の向きに対するスコアリングの結果付与されたスコアの一例を示している。なお、各スコアは０～１の範囲の値とされ、値が大きいほどよいスコアとされている。

　第１映像Ｖ１は俯瞰の映像であり、被写体が小さく撮像されているため、被写体の大きさについてのスコアは０．０２とされている。また、被写体の向きについても被写体が小さく向きがわかりにくく、被写体の顔のパーツがはっきりと判別できないため、被写体の向きについてのスコアは０．１とされている。

　第２映像Ｖ２はボールを保持した選手が大きく映し出された望遠映像であり、被写体の大きさについてのスコアは０．８５とされている。また、被写体の向きは撮像装置ＣＡに対して正面を向いており、且つ、被写体の顔のパーツがはっきり撮像されているため、被写体の向きについてのスコアは０．９とされている。

　第３映像Ｖ３は、比較的狭いエリアを撮像した俯瞰の映像であり、被写体の大きさもそれほど大きくないため、被写体の大きさについてのスコアは０．１とされている。また、被写体の向きについても被写体が小さく向きがわかりにくく、被写体の顔のパーツがはっきりと判別できないため、被写体の向きについてのスコアは０．１とされている。

　第４映像Ｖ４は、第４撮像装置ＣＡ４によって撮像された映像である。第４映像Ｖ４は、被写体が大きく撮像された望遠映像であり、被写体の大きさに対するスコアは０．９２とされている。しかし、被写体の向きは撮像装置ＣＡに対して正対していないため、被写体の向きについてのスコアは０．１とされている。

　被写体が大きく映っている映像を優先する場合には、第４映像Ｖ４が優先的に選択される。
　また、被写体の正面が撮像された映像を優先する場合には、第２映像Ｖ２が優先的に選択される。

　このように、目的に応じて異なるスコアを参照してクリップ映像ＣＶの選択を行うことにより、訴求力のあるクリップ集ＣＳ及びダイジェスト映像ＤＶを生成することができる。

　なお、スコアリングは、クリップ映像ＣＶごと算出するだけでなく、複数のクリップ映像ＣＶが含まれたクリップ集ＣＳごとに算出してもよい。
　そして、ダイジェスト映像ＤＶに含まれるクリップ集ＣＳを選択する場合に、当該スコアリングによって付与されたクリップ集ＣＳごとのスコアが高いクリップ集ＣＳが含まれやすくなるようにしてもよい。

　また、クリップ映像ＣＶのスコアリング処理においては、最も高いスコアが付与された撮像画像を含むクリップ映像ＣＶを選択してもよいし、各撮像画像の平均スコアに基づいてクリップ映像ＣＶを選択してもよい。平均スコアとは、例えば、クリップ映像ＣＶに含まれる撮像画像ごとに算出されたスコアを平均したものである。

＜３－２．スコアを用いた映像選択における処理フロー＞
　図７や図１１のステップＳ４０３で説明したクリップ集ＣＳの生成処理の具体的な処理手順について説明する。特に、本例においては、スコアを用いてクリップ集ＣＳを生成する例について説明する。

　なお、スコアリング処理については、図６のステップＳ３０１や、図１０のステップＳ３１６の後において、映像解析部４により実行される。従って、図１５に示す一連の処理を実行する段階においては、クリップ映像ＣＶごとにスコアが種々のスコアが付与された状態とされる。

　映像生成部５は図１５のステップＳ６０１において、スコアが閾値以上とされたクリップ映像ＣＶを選択する。これにより、スコアが低く視聴者に対して魅力的でない映像を省くことができる。

　映像生成部５はステップＳ６０２において、クリップ映像ＣＶをスコア順に結合することによりクリップ集ＣＳを生成する。

　スコアリング処理によって付与されたスコアは、視聴者にとって見やすい映像であると共に当該シーンにおいて何が起きたかを把握するのに適切な映像であることを示す指標とみなすことができる。

　スコアが高いクリップ映像ＣＶから順に結合されてクリップ集ＣＳが生成されることにより、クリップ集ＣＳを視聴した視聴者は、当該シーンにおいて何が起きたのかを正しく理解することができる。換言すれば、スコアが低いクリップ映像ＣＶを視聴してしまい、当該シーンにおいて起きた事象を視聴者が理解できない状態を招来してしまうことを防止することができる。

　スコアを用いてクリップ集ＣＳを生成する処理の他の例について、図１６を参照して説明する。

　なお、本例は、クリップ映像ＣＶの生成とクリップ集ＣＳの生成を行う処理であり、図７のステップＳ４０２及びステップＳ４０３の代わりに実行する処理、或いは、図１１におけるステップＳ４１１及びステップＳ４０３の代わりに実行する処理である。

　先述した例と同様に、この処理をステップＳ４２１として図１６を参照して説明する。なお、図１６に示す各処理は、映像生成部５が実行するものとして説明するが、一部の処理を映像解析部４が実行してもよい。

　映像生成部５は、ステップＳ５０１において、対象シーンのシーン種別に応じた分岐処理を行う。

　シーン種別がタッチダウンシーンである場合には、映像生成部５はステップＳ６１０において、タッチダウンシーンに最適な映像（撮像装置ＣＡ）を選択する。選択される映像は複数であってもよい。即ち、複数の撮像装置ＣＡが選択されてもよい。

　また、シーン種別がフィールドゴールシーンである場合には、映像生成部５はステップＳ６１１において、フィールドゴールシーンに最適な映像を選択する。

　更に、シーン種別が反則シーンである場合には、映像生成部５はステップＳ６１２において、反則シーン用に最適な映像を選択する。

　ステップＳ５０２、Ｓ５０３またはＳ５０４の何れかを実行した後、映像生成部５はステップＳ６１３において、対象シーンが撮像された区間からスコアが閾値以上の区間についてのイン点及びアウト点を決定しクリップ映像ＣＶを生成する。この処理は、選択された映像ごとに実行される。

　次に映像生成部５はステップＳ５０５において、選択したテンプレートを利用してクリップ集ＣＳを生成する処理を実行する。

　スコアを用いてクリップ集ＣＳを生成する処理の更に他の例について、図１７を参照して説明する。

　映像生成部５は図１７のステップＳ６０１において、スコアが閾値以上とされたクリップ映像ＣＶを選択する。これにより、スコアが低く視聴者に対して魅力的でない映像を排除することができる。

　映像生成部５はステップＳ６１３において、選択されたクリップ映像ＣＶのうち、スコアが閾値以上の区間を切り出して新たにクリップ映像ＣＶとして生成する。
　具体的には、スコアが閾値上とされた区間のイン点及びアウト点を決定してクリップ映像ＣＶを生成する。この処理は、選択された映像ごとに実行される。

　これにより、スコアが高いクリップ映像ＣＶの中からスコアが高い区間を更に厳選されて切り出されるため、視聴者の興味関心の高い映像のみを用いたダイジェスト映像ＤＶなどを生成することができる。

＜４．変形例＞
　上述した例では、ＳＮＳから投稿データを抽出することを示した。ここで、投稿データの抽出対象としては、不特定多数のアカウントであってもよいし、特定のアカウントであってもよい。不特定多数のアカウントについての投稿データを抽出することにより、視聴者の興味関心をより把握することが可能となる。
　一方、チームの関係者や試合の実況を行っている者などが利用する特定のアカウントについての投稿データを抽出することにより、誤った情報を抽出してしまう可能性を低減させることができる。即ち、ある程度のノイズを除去することができる。

　また、投稿データの抽出は、投稿データそのものを抽出してもよいし、投稿データに統計処理を施した後に得られる情報であってもよい。例えば、直近の所定時間に投稿された情報に出現する頻度が高いキーワードなど、統計処理によって抽出された情報であってもよい。
　これらの情報は、ＳＮＳへの投稿を管理しているＳＮＳサーバ１００において抽出されてもよいし、ＳＮＳサーバ１００についての投稿を解析する別のサーバ装置から得てもよい。

　映像解析部４は、放送映像ＶＡを解析する例を示した。放送映像ＶＡの解析の際には、画像解析処理だけでなく実況者や解説者による音声を解析する音声解析処理を行ってもよい。これにより、試合中に発生したシーンをより具体的に特定することや正確に特定することが可能となり、当該シーンに関連した選手を特定することも容易となる。また、音声解析処理により、クリップ映像ＣＶを生成するためのイン点及びアウト点を決定してもよい。
　また、観客の歓声などを音声解析することによりシーンの発生タイミングを把握することやシーン種別を特定することなどを行ってもよい。

　上述したシーン種別以外にも、ラフプレイシーン、ミスプレイシーン、好プレイシーン、記念プレイシーンなどを検出してダイジェスト映像ＤＶに含まれるようにしてもよい。
　なお、記念プレイとは、ある選手にとっての通算成績が所定の数値に達した瞬間のプレイや、それまでの記録を塗り替えた際のプレイなどである。

　テンプレートを用いる例では、該当する映像が存在しない場合には、その映像を結合せずにクリップ集ＣＳを生成してもよい。例えば、テンプレートで指定された画角の拡大映像が存在しない場合は、その映像を含めずにクリップ集ＣＳを生成する。

　競技によっては、プレイの種類や反則の種類に応じて審判員のジェスチャーが細かく設定されている場合がある。
　そのような場合には、審判員を撮像する専用の撮像装置ＣＡを会場内に配置し、画像解析処理によって審判員の姿勢やジェスチャーを特定することにより、試合中に起きたプレイの内容、即ち、シーン種別等を特定することが可能となる。

　このようにして得られたシーン種別の情報は、例えば、メタデータの代わりに用いることが可能となる。
　なお、画像解析処理の対象となる審判員は、主審だけでなく副審などが含まれていてもよい。

　また、上述した例では、複数のクリップ集ＣＳを結合してダイジェスト映像ＤＶを生成する例を説明したが、一つのクリップ集ＣＳでダイジェスト映像ＤＶが生成されてもよい。具体的には、視聴者に提示すべきクリップ集ＣＳが一つである場合には、ダイジェスト映像ＤＶは当該クリップ集ＣＳを一つだけ含むように生成されてもよい。

＜５．コンピュータ装置＞
　上述した情報処理装置１を実現する演算処理部を備えるコンピュータ装置の構成について図１８を参照して説明する。

　コンピュータ装置のＣＰＵ７１は、上述した各種の処理を行う演算処理部として機能し、ＲＯＭ７２や例えばＥＥＰ－ＲＯＭ（Electrically Erasable Programmable Read-Only Memory）などの不揮発性メモリ部７４に記憶されているプログラム、または記憶部７９からＲＡＭ７３にロードされたプログラムに従って各種の処理を実行する。ＲＡＭ７３にはまた、ＣＰＵ７１が各種の処理を実行する上において必要なデータなども適宜記憶される。
　ＣＰＵ７１、ＲＯＭ７２、ＲＡＭ７３、不揮発性メモリ部７４は、バス８３を介して相互に接続されている。このバス８３にはまた、入出力インタフェース（Ｉ／Ｆ）７５も接続されている。

　入出力インタフェース７５には、操作子や操作デバイスよりなる入力部７６が接続される。
　例えば入力部７６としては、キーボード、マウス、キー、ダイヤル、タッチパネル、タッチパッド、リモートコントローラ等の各種の操作子や操作デバイスが想定される。
　入力部７６によりユーザの操作が検知され、入力された操作に応じた信号はＣＰＵ７１によって解釈される。

　また入出力インタフェース７５には、ＬＣＤ或いは有機ＥＬパネルなどよりなる表示部７７や、スピーカなどよりなる音声出力部７８が一体又は別体として接続される。
　表示部７７は各種表示を行う表示部であり、例えばコンピュータ装置の筐体に設けられるディスプレイデバイスや、コンピュータ装置に接続される別体のディスプレイデバイス等により構成される。
　表示部７７は、ＣＰＵ７１の指示に基づいて表示画面上に各種の画像処理のための画像や処理対象の動画等の表示を実行する。また表示部７７はＣＰＵ７１の指示に基づいて、各種操作メニュー、アイコン、メッセージ等、即ちＧＵＩ（Graphical User Interface）としての表示を行う。

　入出力インタフェース７５には、ハードディスクや固体メモリなどより構成される記憶部７９や、モデムなどより構成される通信部８０が接続される場合もある。

　通信部８０は、インターネット等の伝送路を介しての通信処理や、各種機器との有線／無線通信、バス通信などによる通信を行う。

　入出力インタフェース７５にはまた、必要に応じてドライブ８１が接続され、磁気ディスク、光ディスク、光磁気ディスク、或いは半導体メモリなどのリムーバブル記憶媒体８２が適宜装着される。
　ドライブ８１により、リムーバブル記憶媒体８２から各処理に用いられるプログラム等のデータファイルなどを読み出すことができる。読み出されたデータファイルは記憶部７９に記憶されたり、データファイルに含まれる画像や音声が表示部７７や音声出力部７８で出力されたりする。またリムーバブル記憶媒体８２から読み出されたコンピュータプログラム等は必要に応じて記憶部７９にインストールされる。

　このコンピュータ装置では、例えば本実施の形態の処理のためのソフトウェアを、通信部８０によるネットワーク通信やリムーバブル記憶媒体８２を介してインストールすることができる。或いは当該ソフトウェアは予めＲＯＭ７２や記憶部７９等に記憶されていてもよい。

　ＣＰＵ７１が各種のプログラムに基づいて処理動作を行うことで、上述した演算処理部を備えた情報処理装置１としての必要な情報処理や通信処理が実行される。
　なお、情報処理装置１は、図２のようなコンピュータ装置が単一で構成されることに限らず、複数のコンピュータ装置がシステム化されて構成されてもよい。複数のコンピュータ装置は、ＬＡＮ（Local Area Network）等によりシステム化されていてもよいし、インターネット等を利用したＶＰＮ（Virtual Private Network）等により遠隔地に配置されたものでもよい。複数のコンピュータ装置には、クラウドコンピューティングサービスによって利用可能なサーバ群（クラウド）としてのコンピュータ装置が含まれてもよい。

＜６．まとめ＞
　上述した各例において説明したように、情報処理装置１は、スポーツの試合などのイベントにおいて発生したシーンについてのシーン関連情報に基づいて、ダイジェスト映像ＤＶを生成するための補助情報ＳＤを特定する特定部１０を備えている。
　イベントとは、例えば、スポーツの試合やコンサートなどの催し物である。また、補助情報ＳＤとは、例えば、ダイジェスト映像ＤＶを生成するために用いられる情報であり、撮像された映像の中からどの部分の映像を切り出すかを決定するために用いられる情報である。例えば、スポーツの試合であれば、具体的には、選手名やシーンの種別やプレイの種別などの情報が補助情報とされる。
　補助情報ＳＤを特定することで、撮像された映像から切り出すべき時間帯を特定することができるため、ダイジェスト映像ＤＶの生成を行うことができる。

　シーン関連情報は他の情報処理装置（メタデータサーバ２００）から配信されるメタデータを含む情報とされていてもよい。
　メタデータとは、スポーツなどの催し物の進行状況が含まれた情報であり、スポーツの試合を例に挙げると、特定のプレイが発生した時間情報とプレイに関係した選手名とプレイの結果として変動した得点の情報などが含まれている。
　このようなメタデータに基づいて補助情報ＳＤを特定することで、撮像された映像から切り出すべき時間帯をより適切に特定することができる。

　シーン関連情報はソーシャルネットワーキングサービス（ＳＮＳ）の利用ユーザによる投稿に関連する情報を含むものとされていてもよい。
　ＳＮＳには催し物の進行状況に合わせて様々な投稿がなされる。そして、ＳＮＳへの投稿内容を解析することにより、視聴者の興味関心の高いシーンを特定することが可能となる。
　このようなＳＮＳから得られた情報であるシーン関連情報に基づいて補助情報ＳＤを特定することにより、視聴者の興味関心に適合した適切なシーンが含まれたダイジェスト映像ＤＶを生成することができる。
　なお、上述したように、ＳＮＳの利用ユーザによる投稿に関する情報とは、ＳＮＳに投稿された情報に関連する情報であり、例えば、直近の所定時間における出現頻度が高いキーワードなどを含むものである。この情報は、ＳＮＳに投稿された情報に基づいてキーワードを抽出してもよいし、ＳＮＳに付属するサービスによって提示されたキーワードを取得してもよいし、ＳＮＳとは異なるサービスによって提示されたキーワードを取得してもよい。

　補助情報ＳＤは、放送映像ＶＡとして採用されたか否かを示す情報とされていてもよい。
　例えば、撮像された映像において放送映像ＶＡとして採用された区間を特定することができれば、放送映像ＶＡとして採用されていない区間を特定することができる。
　これにより、放送映像ＶＡとして採用されていないクリップ映像ＣＶを含むようにダイジェスト映像ＤＶを生成することが可能となる。従って、視聴者にとって新たな映像が含まれたダイジェスト映像ＤＶを提供することが可能となる。

　補助情報ＳＤは、キーワード情報とされていてもよい。
　キーワード情報は、例えば、選手名の情報やシーンの種別情報やプレイの種別常用や用具の名称などの情報である。
　キーワード情報を用いることにより、撮像された映像から切り出すべき時間帯を特定する処理を少ない処理負担で実現することができる。

　キーワード情報は、シーンの種別情報とされていてもよい。
　例えば、撮像された映像から切り出すクリップ映像ＣＶがシーンの種別情報に基づいて決定される。
　従って、所定のシーン種別に応じたクリップ映像ＣＶが含まれたダイジェスト映像ＤＶを生成することができる。

　キーワード情報は、イベントの参加者を特定する情報とされてもよい。
　イベントがスポーツの試合であれば、試合に出場した選手名や背番号などのキーワード情報に基づいて、撮像された映像から切り出すべきシーンが決定される。
　従って、特定の選手に着目したダイジェスト映像ＤＶなどを生成することができる。

　補助情報ＳＤは、イベントを撮像する複数の撮像装置ＣＡから得られる一つ以上のクリップ映像ＣＶが含まれるクリップ集ＣＳの生成に用いられる情報とされていてもよい。
　例えば、補助情報ＳＤとして特定のプレイ種別が選択された場合に、複数の撮像装置ＣＡにおいて撮像された複数の映像（第１映像Ｖ１や第２映像Ｖ２など）から特定のプレイ種別が撮像された区間を切り出して結合することにより、当該プレイ種別に関するクリップ集ＣＳが生成される。
　このようにして生成されたクリップ集ＣＳが含まれるようにダイジェスト映像ＤＶを生成することで、一つのプレイを異なる角度から視聴することができ、視聴者にとってよりプレイ状況を把握しやすいダイジェスト映像ＤＶを生成することができる。

　クリップ集ＣＳは、イベントにおける特定のシーンを撮像したクリップ映像ＣＶが結合されたものとされ、補助情報ＳＤは、予め決められたクリップ映像ＣＶの結合順序の情報を含んでいてもよい。
　クリップ集ＣＳは、一つのプレイを異なる角度から撮像した部分映像としてのクリップ映像ＣＶが複数結合されたものとされる。
　このようなクリップ集ＣＳの生成において、予め決められた順序で映像を繋ぎ合わせることにより、一つのプレイを異なる角度から視聴することができる映像を視聴者に提供することができると共に、結合順序を決定するための処理負担を軽減することができる。

　クリップ映像ＣＶの結合順序の情報は、特定のシーンについてのシーン種別に応じた情報とされていてもよい。
　即ち、予め決められた順序は、シーンの種別ごとに異なる適切な順序とされていてもよい。
　例えば、アメリカンフットボールの試合において発生した一つのフィールドゴールに対して一つのクリップ集ＣＳを生成する場合に、フィールドゴールについての状況を視聴者が正しく認識するため、或いは、臨場感を高めるために特定の順序でクリップ映像ＣＶを結合することにより、当該フィールドゴールについての適切なクリップ集ＣＳを生成することができる。特定の順序であるテンプレートは、例えば、側方からの映像、ゴールの背面側からの映像、ゴールの正面側からの映像、俯瞰の映像、などのように異なる角度から撮像した映像を所定の順序で結合することが規定されたものとされる。このテンプレートに準じるように各撮像装置ＣＡの映像を当てはめることで、自動的に適切なクリップ集ＣＳを生成することができる。そして、映像の結合順序を決定するための処理負担を軽減することができる。
　また、テンプレートは、シーン種別に応じて異なるものとされてもよい。

　情報処理装置１は、補助情報ＳＤを用いてクリップ集ＣＳを生成するクリップ集生成部１１を備えていてもよい。
　これにより、情報処理装置１において補助情報ＳＤの特定からクリップ映像ＣＶの生成及びクリップ集ＣＳの生成までの一連の処理が実行される。
　情報処理装置１が単一の装置である場合には、補助情報ＳＤの特定からクリップ集ＣＳの生成までに必要な情報を他の情報処理装置に対して送信する必要が無く、処理負担の軽減が図られる。
　なお、クリップ映像ＣＶとクリップ映像ＣＶの間に短い別の映像や画像などが挟み込まれていてもよい。

　情報処理装置１のクリップ集生成部１１は、クリップ映像ＣＶを結合することによりクリップ集ＣＳを生成してもよい。
　例えば、クリップ映像ＣＶ間に別の映像を挟まずに結合するだけでクリップ集ＣＳが生成される。
　これにより、クリップ集ＣＳの生成に要する処理負担の軽減を図ることができる。

　クリップ集ＣＳは、イベントにおける特定のシーンを撮像したクリップ映像ＣＶを結合したものとされてもよい。
　あるシーンについて異なる角度から撮像された映像を切り取った複数のクリップ映像ＣＶを結合することにより、当該シーンを異なる角度から確認できるクリップ集ＣＳが生成される。
　これにより、ユーザにとって各シーンで起きた事象を把握しやすいダイジェスト映像ＤＶを生成することができる。

　情報処理装置１のクリップ集生成部１１は、イベントを撮像する撮像装置ＣＡから得られる映像に対する画像解析処理によって得られた解析結果と補助情報ＳＤを用いてクリップ集ＣＳを生成してもよい。
　映像に対する画像解析処理によって映像の被写体についての情報やシーンの種別情報などを特定することが可能となる。
　これにより、補助情報ＳＤに応じたクリップ集ＣＳを生成することができ、適切なダイジェスト映像ＤＶを生成することができる。

　画像解析処理は、映像に映っている人物を特定する処理とされていてもよい。
　画像解析処理によって映像に写っている人物が適切に特定されることで、選手名などのキーワードを元にクリップ集ＣＳに含めるべきクリップ映像ＣＶを特定することが可能となる。
　従って、クリップ映像ＣＶの選択に係る処理負担を軽減することができる。

　画像解析処理は、映像に映っているシーンの種別を特定する処理とされていてもよい。
　画像解析処理によって映像に映っているシーンの種別が適切に特定されることで、シーン種別などのキーワードを元にクリップ集ＣＳに含めるべきクリップ映像ＣＶを特定することが可能となる。
　従って、クリップ映像ＣＶの選択に係る処理負担を軽減することができる。

　画像解析処理は、イン点及びアウト点を特定する処理とされていてもよい。
　画像解析処理によってイン点及びアウト点が特定されることにより、クリップ映像ＣＶとして適切な区間の映像を切り取ることができる。
　従って、適切なクリップ集ＣＳの生成及びダイジェスト映像ＤＶの生成を行うことができる。

　画像解析処理は、クリップ映像ＣＶごとにスコアを付与する処理を含んでいてもよい。
　クリップ映像ＣＶの時間長によっては一つのクリップ集ＣＳに当該シーンを撮像したクリップ映像ＣＶを全て含めることができない場合がある。また、クリップ集ＣＳに含めない方がよいクリップ映像ＣＶなども存在する。
　クリップ映像ＣＶごとにスコアリングされることで、適切なクリップ映像ＣＶのみを結合させたクリップ集ＣＳを生成することができる。

　本実施の形態の情報処理方法は、イベントにおいて発生したシーンについてのシーン関連情報に基づいて、ダイジェスト映像を生成するための補助情報を特定する処理を、コンピュータ装置が実行するものである。

　上述した情報処理装置１に実行させるプログラムはコンピュータ装置等の機器に内蔵されている記録媒体としてのＨＤＤ（Hard Disk Drive）や、ＣＰＵを有するマイクロコンピュータ内のＲＯＭ等に予め記録しておくことができる。あるいはまたプログラムは、フレキシブルディスク、ＣＤ－ＲＯＭ（Compact Disk Read Only Memory）、ＭＯ(Magneto Optical)ディスク、ＤＶＤ(Digital Versatile Disc)、ブルーレイディスク（Blu-ray Disc（登録商標））、磁気ディスク、半導体メモリ、メモリカードなどのリムーバブル記録媒体に、一時的あるいは永続的に格納（記録）しておくことができる。このようなリムーバブル記録媒体は、いわゆるパッケージソフトウェアとして提供することができる。
　また、このようなプログラムは、リムーバブル記録媒体からパーソナルコンピュータ等にインストールする他、ダウンロードサイトから、ＬＡＮ(Local Area Network)、インターネットなどのネットワークを介してダウンロードすることもできる。

　なお、本明細書に記載された効果はあくまでも例示であって限定されるものではなく、また他の効果があってもよい。

　また、上述した各例はいかように組み合わせてもよく、各種の組み合わせを用いた場合であっても上述した種々の作用効果を得ることが可能である。

＜７．本技術＞
　本技術は以下のような構成を採ることもできる。
（１）
　イベントにおいて発生したシーンについてのシーン関連情報に基づいて、ダイジェスト映像を生成するための補助情報を特定する特定部を備えた
　情報処理装置。
（２）
　前記シーン関連情報は他の情報処理装置から配信されるメタデータを含む情報とされた
　上記（１）に記載の情報処理装置。
（３）
　前記シーン関連情報はソーシャルネットワーキングサービスの利用ユーザによる投稿に関連する情報を含むものとされた
　上記（１）から上記（２）の何れかに記載の情報処理装置。
（４）
　前記補助情報は、放送映像として採用されたか否かを示す情報とされた
　上記（１）から上記（３）の何れかに記載の情報処理装置。
（５）
　前記補助情報は、キーワード情報とされた
　上記（１）から上記（４）の何れかに記載の情報処理装置。
（６）
　前記キーワード情報は、シーンの種別情報とされた
　上記（５）に記載の情報処理装置。
（７）
　前記キーワード情報は、前記イベントの参加者を特定する情報とされた
　上記（５）に記載の情報処理装置。
（８）
　前記補助情報は、前記イベントを撮像する複数の撮像装置から得られる一つ以上のクリップ映像が含まれるクリップ集の生成に用いられる情報とされた
　上記（１）から上記（７）の何れかに記載の情報処理装置。
（９）
　前記クリップ集は、前記イベントにおける特定のシーンを撮像したクリップ映像が結合されたものとされ、
　前記補助情報は、予め決められた前記クリップ映像の結合順序の情報を含む
　上記（８）に記載の情報処理装置。
（１０）
　前記結合順序の情報は、前記特定のシーンについてのシーン種別に応じた情報とされた
　上記（９）に記載の情報処理装置。
（１１）
　前記補助情報を用いて前記クリップ集を生成するクリップ集生成部を備えた
　上記（８）から上記（１０）の何れかに記載の情報処理装置。
（１２）
　前記クリップ集生成部は、前記クリップ映像を結合することにより前記クリップ集を生成する
　上記（１１）に記載の情報処理装置。
（１３）
　前記クリップ集は、前記イベントにおける特定のシーンを撮像したクリップ映像を結合したものとされた
　上記（１２）に記載の情報処理装置。
（１４）
　前記クリップ集生成部は、前記イベントを撮像する撮像装置から得られる映像に対する画像解析処理によって得られた解析結果と前記補助情報を用いて前記クリップ集を生成する
　上記（１１）から上記（１３）の何れかに記載の情報処理装置。
（１５）
　前記画像解析処理は、映像に映っている人物を特定する処理とされた
　上記（１４）に記載の情報処理装置。
（１６）
　前記画像解析処理は、映像に映っているシーンの種別を特定する処理とされた
　上記（１４）に記載の情報処理装置。
（１７）
　前記画像解析処理は、イン点及びアウト点を特定する処理とされた
　上記（１４）に記載の情報処理装置。
（１８）
　前記画像解析処理は、前記クリップ映像ごとにスコアを付与する処理を含む
　上記（１４）に記載の情報処理装置。
（１９）
　イベントにおいて発生したシーンについてのシーン関連情報に基づいて、ダイジェスト映像を生成するための補助情報を特定する処理を、コンピュータ装置が実行する
　情報処理方法。
（２０）
　イベントにおいて発生したシーンについてのシーン関連情報に基づいて、ダイジェスト映像を生成するための補助情報を特定する機能を、演算処理装置に実行させる
　プログラム。

１　情報処理装置
１０　特定部
１１　クリップ集生成部
２００　メタデータサーバ（他の情報処理装置）
ＣＡ　撮像装置
ＤＶ　ダイジェスト映像
ＳＤ　補助情報
ＣＶ　クリップ映像
ＣＳ　クリップ集
ＶＡ　放送映像

Claims

　イベントにおいて発生したシーンについてのシーン関連情報に基づいて、ダイジェスト映像を生成するための補助情報を特定する特定部を備えた
　情報処理装置。
　前記シーン関連情報は他の情報処理装置から配信されるメタデータを含む情報とされた
　請求項１に記載の情報処理装置。
　前記シーン関連情報はソーシャルネットワーキングサービスの利用ユーザによる投稿に関連する情報を含むものとされた
　請求項１に記載の情報処理装置。
　前記補助情報は、放送映像として採用されたか否かを示す情報とされた
　請求項１に記載の情報処理装置。
　前記補助情報は、キーワード情報とされた
　請求項１に記載の情報処理装置。
　前記キーワード情報は、シーンの種別情報とされた
　請求項５に記載の情報処理装置。
　前記キーワード情報は、前記イベントの参加者を特定する情報とされた
　請求項５に記載の情報処理装置。
　前記補助情報は、前記イベントを撮像する複数の撮像装置から得られる一つ以上のクリップ映像が含まれるクリップ集の生成に用いられる情報とされた
　請求項１に記載の情報処理装置。
　前記クリップ集は、前記イベントにおける特定のシーンを撮像したクリップ映像が結合されたものとされ、
　前記補助情報は、予め決められた前記クリップ映像の結合順序の情報を含む
　請求項８に記載の情報処理装置。
　前記結合順序の情報は、前記特定のシーンについてのシーン種別に応じた情報とされた
　請求項９に記載の情報処理装置。
　前記補助情報を用いて前記クリップ集を生成するクリップ集生成部を備えた
　請求項８に記載の情報処理装置。
　前記クリップ集生成部は、前記クリップ映像を結合することにより前記クリップ集を生成する
　請求項１１に記載の情報処理装置。
　前記クリップ集は、前記イベントにおける特定のシーンを撮像したクリップ映像を結合したものとされた
　請求項１２に記載の情報処理装置。
　前記クリップ集生成部は、前記イベントを撮像する撮像装置から得られる映像に対する画像解析処理によって得られた解析結果と前記補助情報を用いて前記クリップ集を生成する
　請求項１１に記載の情報処理装置。
　前記画像解析処理は、映像に映っている人物を特定する処理とされた
　請求項１４に記載の情報処理装置。
　前記画像解析処理は、映像に映っているシーンの種別を特定する処理とされた
　請求項１４に記載の情報処理装置。
　前記画像解析処理は、イン点及びアウト点を特定する処理とされた
　請求項１４に記載の情報処理装置。
　前記画像解析処理は、前記クリップ映像ごとにスコアを付与する処理を含む
　請求項１４に記載の情報処理装置。
　イベントにおいて発生したシーンについてのシーン関連情報に基づいて、ダイジェスト映像を生成するための補助情報を特定する処理を、コンピュータ装置が実行する
　情報処理方法。
　イベントにおいて発生したシーンについてのシーン関連情報に基づいて、ダイジェスト映像を生成するための補助情報を特定する機能を、演算処理装置に実行させる
　プログラム。