WO2023032303A1

WO2023032303A1 - 映像処理装置、映像処理方法およびプログラム

Info

Publication number: WO2023032303A1
Application number: PCT/JP2022/012162
Authority: WO
Inventors: 克海長井
Original assignee: ソニーグループ株式会社
Priority date: 2021-09-03
Filing date: 2022-03-17
Publication date: 2023-03-09

Abstract

複数の入力映像において、ある事象に対応する事象を特定して、それらの事象を含めるように出力映像を作成することができる映像処理装置、映像処理方法およびプログラムを提供する。　複数の入力映像から検知された複数のトリガーに基づいて、映像作成用情報を作成する情報作成部と、映像作成用情報に基づいて、複数の入力映像の中から出力映像の作成に関連付ける素材映像を決定する映像処理部１０６とを備える映像処理装置１００である。

Description

映像処理装置、映像処理方法およびプログラム

　本技術は、映像処理装置、映像処理方法およびプログラムに関する。

　様々な対戦型のテレビゲームやeスポーツ（electronicスポーツ）と呼ばれるような競技では、映像を用いて視聴者にゲームの状況を提供している。例えば、視聴者が入場できる会場がある場合は、その会場に設置されたスクリーンに映像が映し出されたり、動画配信サイト等を通して映像を提供している。提供している映像は、例えば現在行われているゲームにおけるプレイヤーのプレイ映像やそれを加工したものであったり、試合の見どころ部分を切り出したハイライトシーンであったりする。そのような用途に用いることができる、映像からそのハイライトシーンを抽出する技術として特許文献１がある。

特開２０２０－１７９０４５号公報

　しかし、特許文献１記載の技術では、特定のプレイヤーの映像におけるハイライトに関係している他のプレイヤーの映像を同時に特定することができない、という問題点がある。

　例えば、あるゲームにおいてプレイヤーが他のプレイヤーに勝利したという事象の映像が抽出された際、負けたプレイヤーのゲームプレイ映像は同時には特定されない。その場合、負けたプレイヤーの視点で、勝利したプレイヤーがどのように見えていたのかを伝えることができない。また、どちらが勝つかわからないという緊張した状況そのものをリアルタイムに視聴者に伝えることができない、という問題点がある。

　本技術はこのような点に鑑みなされたものであり、複数の入力映像において、ある事象に対応する事象を特定して、それらの事象を含めるように出力映像を作成することができる映像処理装置、映像処理方法およびプログラムを提供することを目的とする。

　上述した課題を解決するために、第１の技術は、複数の入力映像から検知された複数のトリガーに基づいて、映像作成用情報を作成する情報作成部と、映像作成用情報に基づいて、複数の入力映像の中から出力映像の作成に関連付ける素材映像を決定する映像処理部１０６とを備える映像処理装置である。

　また、第２の技術は、複数の入力映像から検知された複数のトリガーに基づいて、映像作成用情報を作成し、映像作成用情報に基づいて、複数の入力映像の中から出力映像の作成に関連付ける素材映像を決定する映像処理方法である。

　また、第３の技術は、複数の入力映像から検知された複数のトリガーに基づいて、映像作成用情報を作成し、映像作成用情報に基づいて、複数の入力映像の中から出力映像の作成に関連付ける素材映像を決定する映像処理方法をコンピュータに実行させるプログラムである。

図１Ａはゲームプレイ映像の例を示す図であり、図１Ｂはプレイヤー映像の一例を示す図である。図２Ａは地図映像の例を示す図であり、図２Ｂは自由視点映像の例を示す図である。映像処理装置１００の構成を示すブロック図である。映像処理装置１００の全体処理を示すフローチャートである。前処理部１０１の処理を示すフローチャートである。映像情報の説明図である。第１情報作成部１０３の処理を示すフローチャートである。トリガー検知処理を示すフローチャートである。トリガー検知方法の種類を示す表である。トリガー検知方法の説明図である。トリガー検知方法の説明図である。トリガー検知方法の説明図である。トリガー検知方法の説明図である。トリガー情報の説明図である。イベント特定処理を示すフローチャートである。対応トリガーの評価方法の説明図である。対応トリガーの評価方法の説明図である。対応トリガーの評価方法の説明図である。イベント情報の説明図である。第２情報作成部１０５の処理を示すフローチャートである。イベントシーン情報作成処理を示すフローチャートである。イベントシーン情報の説明図である。イベントシーン情報作成の説明図である。出力映像の第１の例を示す図である。出力映像の第２の例を示す図である。出力映像の第３の例を示す図である。映像処理部１０６の処理を示すフローチャートである。第２の実施の形態の前提の説明図である。第２の実施の形態におけるゲームプレイ映像の例を示す図である。映像IDに対応付ける情報を示す図である。第２の実施の形態における第１情報作成部１０３の処理を示すフローチャートである。映像IDに対応付ける推定位置情報を示す図である。第２の実施の形態におけるイベント特定処理を示すフローチャートである。評価値の計算方法の説明図である。イベント情報の説明図である。プレイヤーの姿勢推定の説明図である。

　以下、本技術の実施の形態について図面を参照しながら説明する。なお、説明は以下の順序で行う。
＜１．第１の実施の形態＞
［１－１．前提］
［１－２．映像処理装置１００の構成］
［１－３．映像処理装置１００による処理］
［１－３－１．全体処理］
［１－３－２．前処理部１０１における処理］
［１－３－３．第１情報作成部１０３における処理］
［１－３－４．第２情報作成部１０５における処理］
［１－３－５．映像処理部１０６における処理］
＜２．第２の実施の形態＞
［２－１．前提］
［２－２．映像処理装置１００における処理］
［２－３．トリガー検知処理の他の例］
［２－３－１．第１の例］
［２－３－２．第２の例］
＜３．変形例＞

＜１．第１の実施の形態＞
［１－１．前提］
　本技術は、テレビゲームやＰＣ（Personal Computer）ゲームにおける、広大なフィールドに多くのプレイヤーが降り立ち、そこでプレイヤー同士で銃撃や格闘などの戦闘を行い、勝利して生き残ることを目標とする対戦型ゲームの映像を視聴者に提供する例で説明を行う。以降、このプレイヤーがプレイ中であるゲームを試合と表現し、プレイヤーがゲームをプレイ中であることを試合中と表現することがある。

　プレイヤーとはゲームをプレイする人物である。視聴者とはプレイヤー以外の人物であり、会場に設置されたスクリーンやモニターなどに映し出されたり、インターネット上の動画配信サービスなどで配信されているゲームの映像を見る観客などである。また、映像を提供する側のことを主催者と呼称する。

　映像処理装置１００は、ネットワークを介して入力される、ゲームのプレイ映像を撮影した映像やゲーム機などから出力されたゲームのプレイ映像、プレイヤーをカメラで撮影した映像などを処理対象の映像（以下、入力映像と称する）として、視聴者の視聴用に提供する映像（以下、出力映像と称する）を作成する。

　入力映像を映像処理装置１００に供給する映像ソースとしては、各プレイヤーが使用するゲーム機（家庭用ゲーム機、携帯ゲーム機、パーソナルコンピュータなどを含む）、ゲーム機から出力されて表示されている映像を撮影するキャプチャーボードなどのゲームプレイ映像撮影装置、各プレイヤーを撮影するウェブカメラ等のプレイヤー撮影用カメラ、ゲーム実行を管理しゲーム観戦用の情報や映像を出力するゲームサーバーなどがある。

　入力映像は、各プレイヤーが使用するゲーム機から出力される映像、ゲームプレイ映像撮影装置で撮影されたゲームプレイ映像、プレイヤー撮影用カメラで撮影したプレイヤーの映像、ゲーム実行を管理しゲーム観戦用の情報や映像を出力するゲームサーバーなどから出力される映像などである。これらの入力映像は映像ソースからネットワークを介して映像処理装置１００に入力される。ネットワークは有線ネットワークでも無線ネットワークでもよく、入力映像を伝送することができればどのようなものでもよい。ネットワークは有線、無線を問わず、専用回線でもよいし、インターネットでもよい。

　図１Ａは、ゲーム機から入力される映像、または、ゲーム機から出力されて表示されている映像を撮影するキャプチャーボードなどのゲームプレイ映像撮影装置で撮影したプレイヤー視点のゲームプレイ映像の例である。以下、このプレイヤー視点のゲームの映像をゲームプレイ映像と称する。

　ゲームプレイ映像は、プレイヤーが操作するキャラクターの本人視点でゲーム中の空間を表示するいわゆるＦＰＳ（First Person Shooter）でもよい。または、ゲームプレイ映像は、操作するプレイヤーキャラクターが画面上に表示され、プレイヤーが操作するキャラクターとは異なるキャラクターの肩越しや俯瞰した視点でゲーム中の空間を表示するいわゆるＴＰＳ（Third Person Shooter）でもよいし、その他の表示形式でもよい。

　ゲームプレイ映像には、例えば、ゲームフィールド上の様子、プレイヤーが操作するキャラクター、他のプレイヤーが操作する敵キャラクター、キャラクターやゲームの状況を示す情報などが含まれている。

　例えば、図１Ａに示すようにゲームプレイ映像の左上にはプレイヤーのゲームフィールド上の位置を示した地図が表示されている。また、左下にはプレイヤーに関する情報としてプレイヤーの生存力（ゲームによってはアーマーなどと称する場合がある）やＨＰ（ゲームによっては体力、ライフなどとも称する場合がある）、能力などを示すゲージが表示されている。以降、生存力やＨＰ等を含む、キャラクターの生存に直接関係する数値やゲージを生存力と呼称する。この生存力は、ゲームによっては１つだけの場合もあれば、複数存在することもあり、図１Ａでは生存力とＨＰの２つが存在している状況を示している。生存力は他プレイヤーからの攻撃を受けた場合や、ゲームフィールド上の仕掛けなどで減少し、ゲージがすべて消失したり、各ゲームによって設定された優先度が高いゲージが先に消失したりした場合に、そのプレイヤーが撃破されたと判定できる。

　また、ゲームプレイ映像の右下にはプレイヤーが使用する武器に関する情報が表示されている。武器に関する情報としては例えば、武器の種類を示すアイコンや武器の球数や使用限度回数などの数値の情報がある。武器以外にもプレイヤーが使用する道具（アイテム）に関する情報なども表示される場合がある。

　なお、これらのプレイヤーに関する情報、武器に関する情報の内容や表示位置はあくまで例にすぎない。例えば生存力を示すゲージは具体的な数値などでもよく、地図の表現位置が右下などの別の場所であってもよいし、他の情報をゲームプレイ映像中に表示してもよい。

　図１Ｂは、ウェブカメラ等の撮像装置によってプレイヤーを撮影した映像の例である。この映像により、視聴者はゲームに参加しているプレイヤーの表情や挙動を見ることができる。以下、この映像をプレイヤー映像と称する。

　図２Ａは、ゲームフィールド全体を映した地図映像の例である。図２Ａに示されている複数の三角形は各プレイヤーを表しており、三角形によって地図上にプレイヤーの位置と向きが視覚的に表されている。ただし、地図映像はプレイヤーの位置と向きに関する情報が文字や図形などによって表現されていない映像であってもよい。また、この地図映像は、映像ソースから受け取らずに事前に準備したゲームフィールド全体を映している地図画像で代替してもよい。

　図２Ｂは、ゲームフィールド上を自由に移動できる自由視点映像の例である。この自由視点映像はプレイヤーの視点とは異なる視点の映像であり、その視点位置は主催者等によってゲームプレイの継続中いつでも移動させることができる。

　映像処理装置１００は、上述した対戦型ゲームにおける戦闘や攻撃の発生時にそれに関与したプレイヤー、例えば攻撃したプレイヤーと攻撃されたプレイヤーに関係する映像を推測、特定することにより、視聴者がより興味を引く出力映像や、視聴者がより楽しめる出力映像を作成する。

　なお第１の実施の形態では、各種映像ソースはゲームの試合中は絶えず入力映像を映像処理装置１００に供給し続け、映像処理装置１００は試合に参加する全プレイヤーのゲームプレイ映像を入手できるものとする。

［１－２．映像処理装置１００の構成］
　次に図３を参照して、映像処理装置１００の構成について説明する。映像処理装置１００は、前処理部１０１、映像記憶部１０２、第１情報作成部１０３、情報記憶部１０４、第２情報作成部１０５、映像処理部１０６を備えて構成されている。なお、各部をつなぐ矢印は映像や情報の主な流れを示しており、物理的、または無線などを介して接続することで映像や情報等をやり取りすることができる。

　前処理部１０１は、映像ソースから入力された入力映像に映像情報を付与し、入力映像と映像情報の組を映像記憶部１０２、第１情報作成部１０３、第２情報作成部１０５に出力する。また、試合終了時には試合終了情報を映像記憶部１０２と第２情報作成部１０５に出力する。

　映像記憶部１０２は、前処理部１０１から取得した入力映像と映像情報を各処理部が参照可能な形式で保存する。映像記憶部１０２は、前処理部１０１から入力映像と映像情報を取得するまで待機状態であり、前処理部１０１から入力映像と映像情報を受け取ると、各試合固有の試合IDと、試合開始時間として現在時刻を保存したのち、映像保存状態に移行する。映像保存状態において前処理部１０１から試合終了情報を受信した場合、現在の試合IDに対して試合終了時間として現在時刻を保存したのち、再び待機状態に移行する。

　第１情報作成部１０３は、前処理部１０１から取得した入力映像と映像情報に基づいて、入力映像から複数のトリガーを検知し、映像作成用情報であるトリガー情報とイベント情報を作成する。第１情報作成部１０３は作成したトリガー情報とイベント情報を情報記憶部１０４に出力する。

　トリガーとは、ゲームにおける特徴的な事象、例えば映像上の変化などである。具体的には、例えば、プレイヤーが他のプレイヤーや敵を攻撃した、プレイヤーが他のプレイヤーや敵に攻撃された、プレイヤーが他のプレイヤーや敵を撃破した、プレイヤーが他のプレイヤーや敵に撃破された、などの事象である。

　トリガーには対象トリガーと対応トリガーがある。あるプレイヤーのゲームプレイ映像において検知された「他のプレイヤーを攻撃した」というトリガーを対象トリガーとした場合、それに対応する事象として、別のプレイヤーのゲームプレイ映像では「他のプレイヤーから攻撃された」というトリガーが検知されるはずである。このような対象トリガーに対応する関係を有するトリガーのことを対応トリガーと定義する。

　イベントとは、対象トリガーと対応トリガーを含み、ゲームの状況を変化させるようなプレイヤー間の関係が特定、推定できた事象を意味する。

　情報記憶部１０４は、第１情報作成部１０３によって作成されたトリガー情報とイベント情報を受け取り、各処理部が参照可能な形式で保存する。また、第２情報作成部１０５によって作成された統計情報やイベントシーン情報等を受け取った場合も、各処理部が参照可能な形式で保存する。

　第２情報作成部１０５は、情報記憶部１０４に保存されているトリガー情報とイベント情報を読み込み、映像作成用情報である統計情報とイベントシーン情報を作成する。第２情報作成部１０５は作成した統計情報とイベントシーン情報の一部または全てを情報記憶部１０４に出力することができる。

　イベントシーンとは、複数のイベントを含む時間的な区間、つまりはゲームの状況が変化した時間的な区間である。具体的には、例えば、あるプレイヤーが別のプレイヤーを撃破したシーンや、複数プレイヤー間で攻撃を当てた、攻撃を当てられたが頻繁に発生した小競り合いシーンなどがある。

　また、第２情報作成部１０５は前処理部１０１から試合終了情報を受け取った場合、試合終了処理を行う。

　映像処理部１０６は、映像記憶部１０２、情報記憶部１０４、第２情報作成部１０５から必要な入力映像や映像作成用情報としてのトリガー情報、イベント情報、イベントシーン情報、統計情報を取得し、それらを用いて、複数の入力映像の中から出力映像の作成に関連付ける映像（以下、素材映像と称する）を決定する。そして、映像処理部１０６は素材映像を用いて出力映像を作成する。作成された出力映像はネットワークなどを介して外部に出力されて視聴者に提供される。出力映像は会場などに設置されたスクリーンやモニターに映し出されたり、インターネット上の動画配信サービスで利用可能とすることなどにより視聴者に提供される。

　映像処理装置１００は以上のようにして構成されている。映像処理装置１００を構成する各部は、ＣＰＵ（Central Processing Unit）やＧＰＵ（Graphics Processing Unit）等の演算処理装置、ＤＲＡＭ（Dynamic Random Access Memory）等の一次記憶装置、ＨＤＤ（Hard Disc Drive）やＳＳＤ（Solid State Drive）等の二次記憶装置により構成される。映像処理装置１００を構成する第１情報作成部１０３、第２情報作成部１０５、映像処理部１０６は一次記憶装置や二次記憶装置などを用いて、処理に必要なデータや情報を自身で保持することができるものとする。

　なお、必要に応じて図示していない矢印に相当する接続を追加で実装し、映像や情報をやりとりしてもよい。例えば、前処理部１０１の出力である入力映像とその入力映像に関する情報を映像処理部１０６に供給できるように接続を追加することで、映像記憶部１０２を介す時間を削減してもよい。

　パーソナルコンピュータ、タブレット端末、スマートフォンなどの電子機器やサーバ装置が映像処理装置１００としての機能を備えるようにしてもよい。また、映像処理装置１００はそれらの電子機器やサーバ装置において動作する装置として構成してもよい。また、複数の処理部を一つの電子機器やサーバ装置などにまとめてもよいし、一つの処理部を複数の電子機器やサーバ装置などで分散して構成してもよい。また、ここで使用される電子機器やサーバ装置などはすべて同じ現在時刻を示すよう調整されているものとする。

　また、映像処理装置１００はプログラムの実行により実現されてもよい。映像処理装置１００がプログラムの実行により実現される場合、プログラムは予め上述の電子機器やサーバ装置内にインストールされていてもよいし、ダウンロード、記憶媒体などで配布されて、使用者が自らインストールするようにしてもよい。

［１－３．映像処理装置１００による処理］
［１－３－１．全体処理］
　次に映像処理装置１００による処理について説明する。まず図４を参照して、全体処理について説明する。なお、図４を含めた全てのフローチャートにおいては、矢印はあくまで処理の順序のみを示しており、情報の受け渡しはこの限りではない。また、映像記憶部１０２、情報記憶部１０４の処理は適宜複数の部にまたがって処理をする為記述していない。

　まずステップＳ１００１で、映像ソースから入力映像を取得した前処理部１０１が処理を行う。次にステップＳ１００２で、前処理部１０１は現在試合中であるか否かを判定する。

　試合中であるか否かは、例えば、ゲーム競技の管理者などにより直接映像処理装置１００に試合が開始したことを示す情報が入力されたことで判定することができる。また、ゲームにおける特定の映像、例えば、映像の所定位置に表示される「試合開始」等の文字をパターン認識処理、文字認識処理で認識したか否かで判定することもできる。また、ゲーム装置の動作状況に基づいて判定してもよい。

　試合が終了した場合は、処理は終了となる（ステップＳ１００２のＮｏ）。

　試合が継続中である場合、処理はステップＳ１００３に進み（ステップＳ１００２のＹｅｓ）、第１情報作成部１０３が処理を行う。

　次にステップＳ１００４で、第２情報作成部１０５が処理を行う。そして、ステップＳ１００５で、映像処理部１０６が処理を行って出力映像を作成する。その後、処理はステップＳ１００１に戻り、試合が継続している限り、映像処理装置１００はステップＳ１００１乃至ステップＳ１００５を繰り返して処理を行う。

［１－３－２．前処理部１０１における処理］
　次に、図５を参照して前処理部１０１による処理について説明する。

　まずステップＳ１０１で、現在試合中であるか否かを判定する。試合中である場合、処理はステップＳ１０２に進み（ステップＳ１０１のＹｅｓ）、前処理部１０１は映像ソースから複数の入力映像を取得する。

　次にステップＳ１０３で、入力映像のそれぞれに映像情報を対応付ける。前処理部１０１は一つの入力映像のデータに一つの映像情報を対応付ける。映像情報とは図６に示すように、少なくとも、映像記憶部１０２において入力映像を識別可能とするための映像ID、その入力映像が何を映しているのかを示す映像種別を含む。映像種別としては、例えば、図１および図２を参照して説明したゲームプレイ映像、プレイヤー映像、地図映像、自由視点映像等がある。図６Ａは映像種別がゲームプレイ映像である入力映像に対応付けられる映像情報の例である。図６Ｂは映像種別がプレイヤー映像である入力映像に対応付けられる映像情報の例である。

　映像種別は、映像ソースや通信経路に基づいて、主催者等が事前に映像種別を示す情報を映像処理装置１００に入力しておくとよい。例えば、ゲーム機であるPlay Station 5(ソニー株式会社の登録商標)からの入力映像はゲームプレイ映像であり、ウェブカメラからの入力映像はプレイヤーＡのプレイヤー映像である、などである。前処理部１０１は、映像ソースである機器から入力映像と共に機器識別情報を受信してその入力映像を出力したのがどの機器であるかを特定することにより、事前に人が入力した映像種別と入力映像とを対応付けることができる。

　また、通信経路などに基づいて前処理部１０１が自動で映像種別を決定してもよい。さらに、シーン認識処理、物体認識処理などにより入力映像中のシーンや物体を認識して映像種別を決定してもよい。

　また、映像情報にはプレイヤーを識別するためのプレイヤー名が含まれる。プレイヤー名を映像情報に含める場合、映像種別が「プレイヤー映像」または「ゲームプレイ映像」である映像に対して、事前に設定したプレイヤー名を対応付ける。なお、プレイヤー名は必須のものではなく必要に応じて映像情報に含めるようにしてもよい。

　次にステップＳ１０４で、前処理部１０１は入力映像と映像情報の組を映像記憶部１０２と第１情報作成部１０３に出力する。そして処理は終了となる。

　説明はステップＳ１０１に戻る。ステップＳ１０１で試合中ではない場合、処理はステップＳ１０５に進み（ステップＳ１０１のＮｏ）、試合終了とみなし、前処理部１０１は映像記憶部１０２と第２情報作成部１０５に試合終了情報を出力する。試合終了情報には少なくとも、映像記憶部１０２と第２情報作成部１０５が試合終了情報であると認識できる情報が含まれている。

［１－３－３．第１情報作成部１０３における処理］
　次に図７を参照して第１情報作成部１０３における処理について説明する。

　まずステップＳ２０１で、第１情報作成部１０３は前処理部１０１から出力された入力映像と映像情報の組を取得する。なお、第１情報作成部１０３は入力映像と映像情報の各組ごとに図７の処理を実行するが、図７の各段階において同期をとるものとする。なお、取得した入力映像は図７の処理が終了するまで第１情報作成部１０３で保持して自由に参照できるものとする。

　次にステップＳ２０２で、第１情報作成部１０３はトリガー検知処理を行う。トリガーを検知した場合、ステップＳ２０３からステップＳ２０４に進み、第１情報作成部１０３はイベント特定処理を行う。

　一方、トリガーを検知しなかった場合、イベント特定処理は行わず処理は終了となる（ステップＳ２０３のＮｏ）。以上のようにして第１情報作成部１０３における処理が行われる。

　次に図８を参照して、ステップＳ２０２におけるトリガー検知処理について説明する。

　まずステップＳ３０１で、第１情報作成部１０３は、入力映像に対応付けられている映像情報が持つ映像種別を参照して、入力映像が事前に設定したトリガー検知処理の対象である映像種別か否かを判定する。

　このために、事前にどの映像種別の入力映像に対してトリガー検知処理を行うかを設定しておく必要がある。例えば、ゲームプレイ映像とプレイヤー映像に対してトリガー検知処理を行う場合には、ゲームプレイ映像とプレイヤー映像という映像種別をトリガー検知対象映像種別に設定しておく。なお、どのような入力映像もトリガー検知対象映像種別に設定することができる。

　入力映像がトリガー検知対象の映像種別でない場合はトリガー検知処理を行わずに終了する（ステップＳ３０１のＮｏ）。

　一方、入力映像がトリガー検知対象映像種別である場合、処理はステップＳ３０２に進む（ステップＳ３０１のＹｅｓ）。トリガー検知対象種別である入力映像が複数ある場合にはそれら複数の入力映像のそれぞれに対してステップＳ３０２以降の処理を行う。

　次にステップＳ３０２で、第１情報作成部１０３はトリガー検知対象映像種別である入力映像に対してトリガー検知処理を行う。トリガー検知処理は、事前に設定した複数の検知方法を実行し、トリガーを検知した際は各検知方法に対応するトリガーが検知されたものとする。なお、トリガー検知処理においては、各トリガー検知方法に応じたトリガー詳細情報を取得できるものとする。

　トリガー検知処理を行うためには図９に示すように、事前にトリガー検知対象映像種別、トリガー種別、トリガー検知方法、トリガー詳細情報の組み合わせを複数設定しておく。

　図９の例１では、ゲームプレイ映像に対してトリガー検知処理を行い、検知するトリガーの種別は「敵を撃破した」というゲーム内の事象であり、トリガー検知方法はゲームプレイ映像内の所定領域内において事前に指定した「○○を撃破した」という文字を検知することである。さらに、撃破したプレイヤーの名前をトリガー詳細情報として取得する。

　なお、図９の内容はあくまで一例であり、ゲームやそのプレイモードなどに合わせて、組み合わせの追加削除をしたり、トリガー種別やトリガー検知方法等の各項目を変更したりすることができる。

　ここで、図１０乃至図１３を参照してトリガー検知方法について説明する。図１０は、ゲームプレイ映像内において事前に指定した文字を検知することによるトリガー検知方法である。文字とは例えば「を撃破した！！」である。この方法では、事前にゲームプレイ映像内に文字検知領域を指定しておく必要がある。そして、既知の文字認識技術を用いて、図１０Ａに示すように指定した文字が文字検出領域内において検知された場合、トリガーを検知したことになる。一方、図１０Ｂに示すように、指定した文字が文字検出領域内において検知されない場合、トリガーを検知していないことになる。

　その際、文字検知領域内で検知されたプレイヤー名をトリガー詳細情報として保存することができる。なお、撃破された側のプレイヤーのゲームプレイ映像に「（敵プレイヤー名）に撃破された！！」などの文字が表示される場合、同様の方法で文字検出領域内の文字「撃破された！！」を検知することでトリガーを検知することができる。なお、文字検出領域を指定せず、ゲームプレイ映像全体から文字を検知するようにしてもよい。

　図１１および図１２は、ゲーム内の所定の事象発生時の映像パターンを検知し、パターン詳細情報を計算することによるトリガー検知方法の例である。ここでは所定の事象が「攻撃が命中した」という事象である例で説明する。

　この方法では、事前に攻撃命中時に表示される映像のパターンの位置、形状、色等といった情報を把握しておき、ゲームプレイ映像中から同じパターンが検出された場合にトリガーが検知されたとする。図１１では、点線で示すＸ字状の形状が攻撃命中時に映像中に表示されるパターンであるとする

　パターンを検出したか否かの判定は、まず、図１２のように事前準備したパターンの２値エッジ画像（正解画像）と、ゲームプレイ映像の指定位置で閾値th1により２値化したエッジ画像を取得して、それらをピクセル単位で比較する。そして、正解画像と映像の指定位置から取得したエッジ画像ともにエッジがあるpx数を計算し、それを下記の式（１）で計算した一致度が閾値th2以上かどうかで判定する。

［式１］
一致度＝（比較後の白色のｐｘ数）／（正解画像の白色のｐｘ数）

　その結果、図１１Ａに示すように入力映像中からパターンが検知された場合、トリガーを検知したことになる。一方、図１１Ｂに示すように入力映像中からパターンが検知されなかった場合、トリガーは検知されなかったことになる。

　他にも、パターンの事前指定位置における輝度平均やＲＧＢ色平均等の指標をあらかじめ計算し、映像の指定位置における同様の指標との差が閾値th3以下であるときにトリガーを検知したとする方法もある。さらに、指定位置の正解パターン画像や正解パターン輝度画像を準備し、そのパターン画像と事前指定位置の映像との差分が閾値th4以下であるときにトリガーを検知したと判定する方法もある。トリガー検知方法は上述した方法いずれかを用いてもよいし、それらを組み合わせて用いてもよい。

　また、攻撃命中時に表示されるパターンの位置や色などが一定でない場合も、それらの範囲を広く指定し、範囲内に対して正解画像をずらして一致度や指標等を複数回計算し、上述した方法でパターンを検知したかどうか判定することで対応できる。また、パターンをディープラーニングなどの技術を用いて学習し、トリガー検知に利用することが可能である。さらに、パターンが文字や数値である場合も既知の文字認識技術を用いて文字や数値が存在するかどうかでトリガー検知を行うことが可能である。

　トリガーを検知した場合、ゲームプレイ映像内に表示される生存力について、事前に把握している試合における最大生存力との差分を計算し、生存力が最大である状態を１としたときの割合として数値にしたものをトリガー詳細情報とすることができる。

　差分を計算する方法としては、閾値th6を用いて試合における最大生存力時の表示の輝度２値画像を作成し、映像の事前指定位置に同様の処理を施した画像との差分を計算し、最大生存力時を１としたときの差分の割合を計算する方法がある。また、閾値th7を用いて試合における最大生存力時のゲージの２値エッジ画像を求め、エッジによって囲まれた領域の面積を計算したのち、映像に同様の処理をして求めた領域の面積との差分を計算し、最大生存力時の面積を１としたときの差分の割合を計算する方法がある。さらに、生存力表示がゲージではなく数値の場合は、既知の文字認識技術を用いて生存力を数値として取得し、最大生存力時を１としたときの差分の割合をとる方法がある。この場合のトリガー詳細情報は、最大生存力時からどのくらい生存力が減少しているのかを示すこととなる。

　図１３は、現在の生存力と直前の生存力を比較し、生存力の減少量が閾値th8以上か否かでトリガーを検知する方法の具体例である。直前の生存力は例えば現在時刻から１秒前の生存力であるが、それはあくまで一例であり、ミリ秒やフレーム数等で直前の生存力を指定してもよい。このトリガー検知方法では、図１３Ａに示すように、直前の生存力の値を第１情報作成部１０３で保持しておき、その直前の生存力と現在のゲームプレイ映像中における現在の生存力と比較して、その減少量が閾値th8以上である場合にトリガーを検知したとする。減少量を計算する方法は上述の方法と同じである。一方、図１３Ｂに示すように、直前の生存力と現在の生存力と比較して、その減少量が閾値th8以上ではないまたは差分がない場合はトリガーを検知していないとする。

　図８のフローチャートの説明に戻る。トリガーを検知しなかった場合、トリガー情報を作成せずに処理は終了となる（ステップＳ３０３のＮｏ）。

　一方、トリガーを検知した場合、処理はステップＳ３０３からステップＳ３０４に進む（ステップＳ３０３のＹｅｓ）。

　次にステップＳ３０４で、第１情報作成部１０３はトリガー情報を作成する。トリガー情報は、図１４に示すように、少なくとも、トリガーを情報記憶部１０４などで一意に識別するためのトリガーID、トリガーの種別を示すトリガー種別、トリガー検知時刻、トリガーを検知した入力映像を識別するための映像ID、トリガー詳細情報、トリガー検知時の映像が持つゲームフィールド上の位置を示した地図画像を含む。トリガー検知時刻はトリガーとして検知されたゲーム内の事象が起きた時刻である。第１情報作成部１０３はこれらの情報を集めて互いに対応付けることによりトリガー情報を作成する。

　なお、トリガーを複数検知した場合、第１情報作成部１０３はステップＳ３０４で複数のトリガーのそれぞれについてトリガー情報を作成する。

　次にステップＳ３０５で、第１情報作成部１０３は作成したトリガー情報を情報記憶部１０４に出力する。トリガー情報は情報記憶部１０４に保存され、イベント特定処理において参照可能な状態になる。

　次にステップＳ３０６で、第１情報作成部１０３はトリガー情報をイベント特定処理で参照可能なように自身でトリガー情報を保持する。

　以上のようにして第１情報作成部１０３はトリガー検知処理を行う。

　次に図１５を参照して、ステップＳ２０４におけるイベント特定処理について説明する。
なお、イベント特定処理は、トリガー検知処理において複数のトリガーが検知された場合にはそれら複数のトリガーのそれぞれについて行われる。

　まずステップＳ４０１で、検知された複数のトリガーのうちのイベント特定処理の対象である対象トリガーについて、現在時刻または対象トリガーの検知時刻を基準として、過去n[msec]以内における対応トリガーを検索する。検索は、情報記憶部１０４が保存するトリガー情報および第１情報作成部１０３が保持するトリガー情報に対して行う。このn[msec]は事前に設定する値であり、ゲームサーバーとの通信時間、映像ソースから受け取れる入力映像それぞれが持つ遅延時間、各入力映像のトリガー検知処理にかかる時間などの影響を隠し、正しく対応トリガーを検知できるようにする役割がある。

　対応トリガーとは、検知された複数のトリガーのうち、対象トリガーに対応する、対象トリガー以外のトリガーである。例えば、プレイヤーＡのゲームプレイ映像において検知された、トリガー種別が「敵を撃破した」であるトリガーが対象トリガーである場合、対応トリガーは他のプレイヤーのゲームプレイ映像における「敵（プレイヤーＡ）に撃破された」というトリガー種別のトリガーである。対象トリガーと対応トリガーの組合わせによりイベントが構成される。

　また、プレイヤーＢのゲームプレイ映像において検知された、トリガー種別が「敵に攻撃された」であるトリガーが対象トリガーである場合、対応トリガーは他のプレイヤーのゲームプレイ映像における「敵（プレイヤーＢ）を攻撃した」というトリガー種別のトリガーである。

　このように、対象トリガーと対応トリガーには「一方が他方に攻撃などの影響を及ぼした」に対する「他方が一方に影響を及ぼされた」という対応関係がある。

　また、対応トリガーの検索にはトリガー詳細情報を用いてもよい。たとえば、トリガー種別が「敵を撃破した」というトリガーのトリガー詳細情報に撃破した敵プレイヤーの名前がある場合、そのプレイヤー名を用いて対応トリガーを検索することができる。

　対応トリガーが存在しない場合、処理はステップＳ４０６に進む（ステップＳ４０２のＮｏ）。この場合イベント情報は作成されない。一方、対応トリガーが存在する場合、処理はステップＳ４０３に進む（ステップＳ４０２のＹｅｓ）。

　次にステップＳ４０３で、対応トリガーについて評価値を計算し、その評価値に従って対応トリガーの並べ替えを行う。この対応トリガーの評価と並べ替えは、例えば、複数箇所で同時に戦闘が発生した際に、対象トリガーと各対応トリガーの対応関係をより正しく推測するために行うものである。

　対応トリガーの評価値の計算は、図１６、図１７に示すように、各プレイヤーのゲームフィールド上における位置を示す地図情報を用いて行うことができる。

　まず、対象トリガーのトリガー情報が持つ地図情報と、対応トリガーのトリガー情報が持つ地図情報について、閾値th9を用いた２値エッジ画像を求める。その後、図１６に示すように、対応トリガーのエッジ画像を対象トリガーのエッジに一定サイズだけ縦横をずらして配置する。二つのエッジ画像が重なっている領域における、対象トリガーが持つ２値エッジ画像のエッジpx数を分母とし、重なっている領域において二つのエッジ画像がともにエッジとなっているpx数を分子として一致度を求める。これを縦と横におけるずらす量を変化させながら繰り返し行い、その最大の一致度を対応トリガーの評価値とする。

　この方法を使用すると、図１７のように一度に複数の対応トリガーが検知された場合でも、より対象トリガーとの位置が近い対応トリガーほど高い評価値を持つことになり、対象トリガーと各対応トリガーの対応関係をより正確に推測できる。

　さらに図１８のように、ゲームフィールド全体を映した地図映像を用いて対応トリガーの評価値を計算する方法もある。閾値th10を用いてゲームフィールド全体を映した地図映像の２値エッジ画像を作り、同様にして求めた各トリガーのエッジを図１６で示したように縦横に動かしながらその一致度を求め、最大の一致度となる場所のゲームフィールド全体を映した地図映像上の位置をそのプレイヤーの推定位置とする。そして、各トリガーの推定位置との距離を用いて、ゲームフィールド上で取りうる最大の距離を分母とし、分母の値から対象トリガーと各対応トリガーとの距離を引いた値を分子とする評価値を計算することができる。

　ここではエッジによる特定方法を例に挙げたが、それだけでなく、各地図画像や映像についてＳＩＦＴ特徴量（Scaled Invariance. Feature Transform特徴量）やＨＯＧ特徴量（Histograms of Oriented Gradients特徴量）などを計算し、分母に検知トリガーが持つ特徴量の２乗和を分母に持ち、検知トリガーが持つ特徴量から対応トリガーが持つ特徴量を引いた値の二乗和を分母の値から引いたものを分子に置き、評価値とすることも可能である。

　各対応トリガーの評価値を計算すると、その評価値の降順で対応トリガーを並べ替える。

　次にステップＳ４０４で、第１情報作成部１０３はトリガー情報に基づいてイベント情報を作成する。イベント情報は、図１９に示すように、少なくとも、イベント情報を情報記憶部１０４などで一意に識別するためのイベントID、イベントの種別を示すイベント種別、イベント発生時刻、イベントを構成する対象トリガーと対応トリガーを識別するための対象トリガーIDと対応トリガーID、対応トリガーの評価値を含む。第１情報作成部１０３はこれらの情報を集めて互いに対応付けることによりイベント情報を作成する。イベント発生時刻は、トリガーとして検知されたゲーム内の事象が起きた時刻である。

　次にステップＳ４０５で、第１情報作成部１０３はイベント情報を情報記憶部１０４に出力する。

　そしてステップＳ４０６で、第１情報作成部１０３で保持しているトリガー情報のうち、現在時刻を基準として検知時刻が過去n[msec]よりも古いトリガー情報を削除する。これは、過去n[msec]よりも古いトリガー情報はイベント情報作成時には不要であるからである。

　イベント特定処理は以上のようにして行われる。第１情報作成部１０３の処理により、例えば、「攻撃した」という事象がトリガーとして検知され、それを対象トリガーとした場合、「攻撃された」という事象が対応トリガーとして検知され、対象トリガーとその対応トリガーを含めてイベント情報を作成することで、攻撃したプレイヤーの特定と同時に攻撃されたプレイヤーの特定や推定を行うことができる。

［１－３－４．第２情報作成部１０５における処理］
　次に図２０を参照して、第２情報作成部１０５における処理について説明する。

　まずステップＳ５０１で、現在時刻から変数lastを引いた値が閾値th11以上かどうか判定し、閾値th11以上である場合、処理はステップＳ５０２に進む（ステップＳ５０１のＹｅｓ）。変数lastの初期値は０とする。

　次にステップＳ５０２で、現在時刻を変数lastとして設定する。ステップＳ５０１とステップＳ５０２は、前回の処理においてステップＳ５０３からステップＳ５０６を行ってから一定時間が経過したか否かを判定するためのものである。これは、第２情報作成部１０５の処理の性質上、ステップＳ５０３からステップＳ５０６の処理を常に実行してもよいし、事前に秒数などを決め、試合開始から一定秒数ごとに実行してもよいためである。

　次にステップＳ５０３で、情報記憶部１０４から現在行われている試合に関するトリガー情報とイベント情報を取得する。具体的には、トリガー検知時刻が前回情報記憶部１０４からトリガー情報とイベント情報を取得した時刻以降のトリガー情報と、イベント発生時刻が前回情報記憶部１０４からトリガー情報とイベント情報を取得した時刻以降のイベント情報を取得する。なお、取得したトリガー情報とイベント情報はこの後の処理で参照されるため、事前に設定した期間だけ第２情報作成部１０５で保持し、自由に参照できるものとする。

　次にステップＳ５０４で、第２情報作成部１０５は、取得したトリガー情報とイベント情報から統計情報を作成する。統計情報とは例えば、試合におけるトリガー種別ごとのトリガーの検知回数、各プレイヤーのトリガー検知回数、トリガー種別ごとのトリガー検知回数などであるが、それらに限定されるものではない。

　プレイヤーを基準とした統計情報を作成する場合は、トリガー情報がトリガー詳細情報として持つプレイヤー名や、トリガー情報が持つ映像IDで特定できる映像情報が持つプレイヤー名を取得することで実現できる。トリガー情報とイベント情報、映像情報から統計情報を作成することにより、どのプレイヤーがどのくらいイベントに関与したのかといった情報を得ることができ、その情報を映像処理部１０６における映像作成で使用することができる。作成した統計情報は第２情報作成部１０５で保持しておく。

　次にステップＳ５０５で、第２情報作成部１０５で保持しているトリガー情報とイベント情報や、情報記憶部１０４に保存されているトリガー情報とイベント情報を用いてイベントシーン情報を作成する。イベントシーン情報の作成について後述する。なお、イベントシーン情報は、イベントシーン条件を達成するイベントシーンがある場合に作成される。イベントシーンとは、複数のイベントにより構成され、試合の盛り上がりシーンやハイライトシーンなどとされる時間的な区間である。イベントシーン条件とは、所定の閾値や条件文などによって構成される、イベントシーン足りえるかどうかを判定する条件である。イベントシーン情報の詳細とイベントシーン情報作成については後述する。

　次にステップＳ５０６で、第２情報作成部１０５は作成した統計情報とイベントシーン情報を情報記憶部１０４へ出力する。その際、出力した統計情報とイベントシーン情報の一部を第２情報作成部１０５で保持し、第２情報作成部１０５の次回の処理において使用してもよい。例えば、統計情報であるトリガー総検知回数を保持しておき、次回統計情報を計算しなおす際に、保持していたトリガー総検知回数に新しく検知されたトリガー検知処理回数を加算することで、処理時間を削減することができる。

　次にステップＳ５０７で、前処理部１０１から試合終了情報を受信したか否かを判定する。試合終了情報を受信した場合、処理はステップＳ５０８に進み（ステップＳ５０７のＹｅｓ）、試合終了処理を行う。試合終了処理として、第２情報作成部１０５内に保持していたトリガー情報、イベント情報、統計情報などを削除することで次の試合の情報が入力されたときに、前の試合の情報の影響を受けないようにする。

　ここで、図２１を参照して、ステップＳ５０５におけるイベントシーン情報作成について説明する。

　ここでは、第２情報作成部１０５がステップＳ５０３で、「プレイヤーＡがプレイヤーＢを撃破した」というイベント種別を持つイベント情報（撃破イベント情報と称する）を取得した場合を例として説明を行う。この方法をより一般化して、「敵を撃破した」、もしくは「敵に撃破された」というイベント種別を持つイベント情報を受け取るごとにイベントシーン作成することができる。

　まずステップＳ６０１で、撃破イベント情報が持つイベント発生時刻から過去s[msec]以内に発生した、プレイヤーＡとプレイヤーＢに関連するイベント情報を検索して取得する。検索は、情報記憶部１０４が保存するイベント情報と第２情報作成部１０５が保持するイベント情報に対して行う。ここでのs[msec]は事前に設定される値であり、イベントシーンとする最大の区間長を意味している。

　プレイヤーＡとプレイヤーＢに関連するイベント情報とは、イベント情報が持つ対象トリガーIDによって特定できるトリガー情報を参照し、そのトリガー情報がもつ映像IDによって特定できる映像情報が持つプレイヤー名がプレイヤーＡもしくはプレイヤーＢであるイベント情報である。またその際、対象トリガーIDによって特定できるトリガー情報のトリガー詳細情報を参照してもよい。関連するイベント情報は一つの場合もあるし、複数の場合もある。取得したイベント情報は以降、取得イベント情報と称する。

　ステップＳ６０２からステップＳ６０７は、取得イベント情報から１つずつイベント情報を取り出して、イベントシーンに含むべきかを判定する処理である。

　次にステップＳ６０２で、撃破イベント情報が持つイベント発生時刻を変数timeとして設定する。

　次にステップＳ６０３で、まだ取り出していない取得イベント情報が存在する場合、処理はステップＳ６０４に進む（ステップＳ６０３のＹｅｓ）。一方、取り出していない取得イベント情報が存在しない、もしくは検索結果が０件であった場合、処理はステップＳ６０８に進む（ステップＳ６０３のＮｏ）。

　次にステップＳ６０４で、取り出していない取得イベント情報の中で、最もイベント発生時刻が現在時刻の直近であるイベント情報を取り出す。なお、取り出す処理は取得する処理とは異なる処理である。次にステップＳ６０５で、その現在時刻に最も直近であるイベント発生時刻と変数timeとの差分diff_1を計算する。

　差分diff_1が事前に設定した閾値lim以下である場合、処理はステップＳ６０７に進む（ステップＳ６０６のＹｅｓ）。閾値limは、取り出したイベント情報をイベントシーンに含むべきかどうかを判定する基準値である。差分diff_1が閾値lim以下である場合、取り出したイベント情報はイベントシーンに含むべきものであると判定する。

　次にステップＳ６０７で、変数timeの値を、取り出したイベント情報のイベント発生時刻に更新する。そして処理はステップＳ６０３に戻る。一方、差分diff_1が閾値lim以下ではない場合、処理はステップＳ６０８に進む（ステップＳ６０６のＮｏ）。

　次にステップＳ６０８で、撃破イベント情報のイベント発生時刻と、ステップＳ６０７まででイベントシーンに含むべきと判定されたイベント情報が持つイベント発生時刻の中で最も古いイベント発生時刻との差分diff_2を計算する。イベントシーンに含むべきと判定されたイベント情報が存在しない場合は、差分diff_2に対し0を設定する。閾値minは、イベントシーンとして認める最小の区間長を意味している。

　そしてステップＳ６０９で、差分diff_2が閾値min以上であるか否かを判定する。差分diff_2が閾値min以上である場合は、処理はステップＳ６１０に進む（ステップＳ６０９のＹｅｓ）。

　そしてステップＳ６１０で、第２情報作成部１０５はイベントシーン情報を作成する。

　イベントシーン情報は図２２に示す情報を含むものとして作成される。イベントシーンIDは情報記憶部１０４などでイベントシーン情報を一意に識別するためのIDである。イベントシーン種別はそのイベントシーンがどのようなものなのかを示し、ここでは撃破イベント情報を取得した場合のイベントシーン情報の作成であるため、イベントシーン種別は「敵を撃破した」である。

　イベントシーン開始時刻はステップＳ６０７までで判明したイベントシーンに含むべきイベント情報のイベント発生時刻の中で最も古いイベント発生時刻である。イベントシーン終了時刻はイベント種別が「敵を撃破した」である取得イベント情報のイベント発生時刻である。また、イベント個数とイベントIDはステップＳ６０７までで判明したイベントシーンに含むべきイベント情報の個数とそのイベント情報のイベントIDである。

　あるイベント情報を取得した際に作成されるイベントシーン情報において、対象映像IDは、あるイベント情報が持つトリガーIDによって特定できるトリガー情報が持つ映像IDである。対応映像IDは、あるイベント情報やステップＳ６０７までで判明したイベントシーンに含むべきイベント情報が持つ対応トリガーIDによって特定できるトリガー情報が持つ複数の映像IDである。この説明では、撃破イベント情報があるイベント情報に対応するため、対象映像IDは撃破イベント情報に含まれるトリガーIDによって特定できるトリガー情報が持つ映像IDである。なお、対応映像IDは、対象映像IDを含む複数の映像IDである。これは戦闘が一方的ではない限り、敵を攻撃した、敵に攻撃されたというイベントがそれぞれ発生するためである。

　対応映像個数は、イベントシーンに含まれる対応映像の個数である。

　映像IDごとの評価値は、その入力映像がイベントシーンにどの程度関与したかの度合いを示すものである。例えば図２２の例では、例えば映像ID５は、対象映像ID以外の映像IDよりも高い評価値を持っているため、映像ID７に対応するプレイヤーが、映像ID５に対応するプレイヤーを撃破した可能性が高いと推測することができる。

　また図２２の例では、映像ID１と映像ID２の評価値は、他の映像IDの評価値より明らかに低く、今回例示したイベント情報の評価値計算方法も含めて考えると、このイベントシーンに関与していない、関係ない映像IDである可能性が高いと推測できる。

　対応映像IDの評価値は例えば次のようにして求めることができる。まず、イベントシーンに含むべきイベント情報が持つ全ての対応トリガーIDとその評価値（図１９に示すもの）を取得し、そのイベントシーンに含むべきイベント情報が持つイベント発生時刻に基づいて、対応トリガーの評価値に重み付けを行う。

　例えば、イベント発生時刻が最新のイベント情報が持つ対応トリガーの評価値は１倍し、イベント発生時刻が２番目に新しいイベント情報が持つ対応トリガーの評価値は０．９倍し、イベント発生時刻が３番目に新しいイベント情報が持つ対応トリガーの評価値は０．８倍する。その後、イベントシーンに含むべきイベント情報が持つ全ての対応トリガーIDを、その対応トリガーIDによって特定できるトリガー情報が持つ映像IDに変換し、映像IDごとに評価値を合計し、評価値で降順に並べて対応映像IDとその評価値との組とする。

　図２３は、取得イベント情報を時系列に並べたものであり、ステップＳ６０３からステップＳ６０７までの流れと、イベントシーン開始時刻とイベントシーン終了時刻を図示した例である。イベントID２１のイベント発生時刻から閾値limを引いた時刻よりも遠いイベント発生時刻を持つイベントID１７は、作成しようとしているイベントシーンに大きな影響を与えないとして、イベントシーンに含めないようにする。そうすることでイベントシーンの不要な時間を削り、より盛り上がる場面についてイベントシーンを作成することができる。

　ここでは、敵を撃破したイベント情報を取得した場合におけるイベントシーン情報の作成について説明したが、それに限らず、例えば、あるプレイヤーに関係のあるトリガー情報が一定時間内に大量に検知された区間をイベントシーンとすることもできる。

　なお、第２情報作成部１０５は、上述した処理だけでなく、映像処理部１０６にとって必要と考えられる情報の作成や情報の整理を行うことができる。例えば、イベント情報が持つイベント種別において、「敵に攻撃された」というイベント種別を、「敵を攻撃した」というイベント種別に変更し、評価値が最も高い対応トリガーIDを対象トリガーIDに、元の対象トリガーIDを評価値最大の対応トリガーIDに置き換えることも可能である。そのようにイベント種別の種類を減らし、攻撃したプレイヤーは対象トリガーIDで指定できるトリガー情報が持つ映像ID、攻撃されたプレイヤーは対応トリガーIDで指定できるトリガー情報が持つ映像IDというようにすることで、映像処理部１０６の処理をより効率化することができる。特に人間が後述する映像作成方法を決定する段階において、イベントにおける対応関係を勘違いする可能性を減らすことができる。

［１－３－５．映像処理部１０６における処理］
　次に映像処理部１０６における処理について説明する。

　映像処理部１０６は、映像記憶部１０２から取得した入力映像、情報記憶部１０４から取得した映像作成用情報であるトリガー情報、イベント情報、統計情報、イベントシーン情報を用いて、入力映像の中から出力映像の作成に関連付ける映像（素材映像）を決定し、その素材映像を用いて出力映像を作成する。例えば、プレイヤーが５人いる場合、少なくともゲームプレイ映像が５個、プレイヤー映像が５個で合計１０個の入力映像が存在することになり、映像処理部１０６はその１０個の映像のどれを素材映像にするかを決定し、その素材映像を用いて出力映像を作成する。

　映像作成方法は、出力映像内のどこに何を配置するかという配置情報と、出力映像の作成に関連付ける映像IDの決定方法とからなる。図２４、図２５、図２６は作成された出力映像の例である。

　図２４は、イベント情報とトリガー情報を用いて作成された出力映像の例である。「敵を攻撃した」というイベント種別と、一つの対象トリガーに対して一つの対応トリガーIDを有する最新のイベント情報を取得し、そのイベント情報を元に二人のプレイヤーのゲームプレイ映像とプレイヤー映像を配置して、出力映像を作成している。

　図２４の例では、出力映像は上段、中段、下段によって構成されている。上段には左右に各プレイヤーのゲームプレイ映像が配置され、下段には上段のゲームプレイ映像に対応するプレイヤーのプレイヤー映像が配置され、中段には各プレイヤー名が配置されている。

　上段左側に配置されているゲームプレイ映像の映像IDは、最新のイベント情報が持つ対象トリガーIDで特定できるトリガー情報が持つ映像IDである。また、下段左側に配置されているプレイヤー映像の映像IDは、左上の映像と同じプレイヤーを映した映像の映像IDである。プレイヤー名はトリガー情報が有する映像IDから特定できる映像情報が持つプレイヤー名で確認することができる。このように、映像処理部１０６は、トリガー情報が持つ映像IDで特定できる入力映像を素材映像として決定する。

　上段右側に配置されているゲームプレイ映像の映像IDは、最新のイベント情報において最も高い評価値を持つ対応トリガーIDによって特定できるトリガー情報が持つ映像IDである。下段右側の映像の映像IDは、右上の映像と同じプレイヤーを映した映像の映像IDである。このように、映像処理部１０６はイベント情報が持つトリガーIDで特定できるトリガー情報が持つ映像IDで特定できる入力映像を素材映像として決定する。

　中段左側の文字は、出力映像の左側部分で表示している映像に対応するプレイヤー名であり、中段右側の文字は、出力映像の右側部分で表示している映像に対応するプレイヤー名である。

　最新のイベント情報を使用することで、現在誰と誰が戦っているかを瞬時に特定できるため、攻撃しているプレイヤーのゲームプレイ映像およびプレイヤー映像と、攻撃されているプレイヤーのゲームプレイ映像とプレイヤー映像の映像IDを特定して、それらの映像を素材映像として一つの出力映像に含めることができる。これにより、どちらが勝つのかわからないという状況を表現した出力映像を作成することができる。このような映像作成方法は、対応トリガーIDが複数あるが、事前に設定した閾値th12以上の評価値を持つ映像IDが一つしかないような状況にも適用できるし、最も評価値が高い映像IDを採用することもできる。

　図２５は、イベントシーン情報を用いて作成された出力映像の例である。具体的には、「敵に撃破された」というイベントシーン種別を持つイベントシーン情報を用いて作成された出力映像の例である。この例は、試合後にその試合での敵撃破映像をハイライトとして提供するための出力映像の作成において有用である。

　この出力映像は、イベントシーン情報が持つ対応映像IDであって、評価値が閾値th12以上の値を持つ映像IDが、対象映像IDを除き二つ存在する場合の出力映像である。

　イベントシーン種別が「敵に撃破された」であるイベントシーン情報が持つ対応映像IDは、撃破したプレイヤーのゲームプレイ映像を含んでいる。また、評価値が閾値th12以上の映像IDが対象映像ID以外の二つあるということは、撃破されたプレイヤーを攻撃したプレイヤーが２人いることを意味する。よって、それらの映像IDを用いて、１人のプレイヤーが２人のプレイヤーから攻撃されている出力映像を作成することができる。このように、映像処理部１０６はイベントシーン情報が持つ映像IDで特定できる入力映像を素材映像として決定する。

　また、図１８で示したような、各映像のゲームフィールド上の位置を示す地図映像を用いた対応トリガーの評価値計算方法を用いて、評価値計算ではなく位置推定を行うことで位置関係を計算し、その計算結果を出力映像の作成に反映させることができる。

　具体的には、図２５のようにプレイヤーの位置関係を反映させて配置情報を決定してゲームプレイ映像を配置したり、最も位置が近いプレイヤーＢ人を選択して映し出すような出力映像を作成することができる。図２５の出力映像の作成に用いた映像作成方法における映像IDの決定方法については前述したような方法が挙げられる。

　配置情報については、複数の関数で設定することができる。一つ目の関数は、イベントシーン情報における評価値が閾値th13以上の対応映像IDと対象映像IDの位置情報を入力することで、その位置情報に合致した出力映像上の位置に配置されるような関数である。二つ目の関数は、イベントシーン情報におけるイベントシーン種別、各映像が対象映像か対応映像かという情報、各映像の作成映像上の位置情報を入力することで、例えば攻撃している映像から攻撃されている映像へ矢印を伸ばすような、イベントシーン種別に対応した図形を出力する関数である。

　また、イベントシーン情報のイベントシーン開始時刻から定数秒前の時刻から、イベントシーン終了時刻の定数秒後の時刻までの出力映像を作成することで、ハイライトとして視聴者に提供する際、映像が何を示しているのか理解するための時間を確保することができる。

　図２６は、トリガー情報を用いた出力映像の作成例である。この映像作成方法の配置情報と映像ID決定方法は、上部は図２４の上段と同じである。図２６の例では、下段には上段に配置された各ゲームプレイ映像に対応したプレイヤーの生存力を示すゲージが配置され、中段には上段に配置された各ゲームプレイ映像に対応したプレイヤー名が配置されている。

　下段は、図９で説明したような、トリガー種別が「敵を攻撃した」である場合のトリガー詳細情報である「最大生存力と現在の生存力の差分」を用いて、各プレイヤーの現在の生存力を計算してグラフで表現するというものである。この数値や映像表現は、各プレイヤーのトリガーが検出されるたびに更新することで、トリガーごとに戦況の優劣を伝えることができる。

　いつ、どの映像作成方法で出力映像を作成するかは、事前に映像作成方法を複数用意し、人間が各情報を閲覧して決定してもよいし、条件などを予め設定しておき自動で決定してもよい。映像作成方法決定の条件には、トリガー情報、イベント情報、イベントシーン情報、統計情報等から得られる情報を利用することができる。

　図２４乃至図２６に示したような映像作成方法のテンプレートを事前に用意しておき、映像処理部１０６はそのいずれかを用いて出力映像を作成する。図２７は、映像処理部１０６が自動で映像作成方法を決定する処理の一例である。この処理を数msec等の短い間隔で定期的に実行することで、適宜映像作成方法を決定し、その方法に従って出力映像を作成することができる。

　まずステップＳ７０１で、前回の出力映像作成以降に、新しいイベント情報が作成されたか否かを、第１情報作成部１０３が保持しているイベント情報と、情報記憶部１０４に保存されているイベント情報を参照して確認する。新しいイベント情報が作成されている場合、処理はステップＳ７０２に進む（ステップＳ７０１のＹｅｓ）。

　次にステップＳ７０２で、変数endとして設定されている時刻が、現在時刻より過去のものかを判定する。変数endは、イベント情報に基づいて映像作成方法を決定した状況において、その映像設定方法で作成した出力映像をいつまで継続するかという時刻を意味している。変数endが、現在時刻より過去のものである場合、処理はステップＳ７０３に進む（ステップＳ７０２のＹｅｓ）。

　次にステップＳ７０３で、新しいイベント情報に対して評価値を計算する。これは特に新しいイベント情報が複数存在する場合に有効である。この評価値は、どのイベント情報に関する出力映像を作成するかを選択する場合における指標となる０から１までの数値である。この評価値は、トリガー情報、イベント情報、統計情報、直前に用いた映像作成方法で使用している映像ID等の情報を用いて作成できる条件文を組み合わせて設定することができる。

　例えば、直前に用いた映像作成方法で使用している映像IDと、イベント情報が持つ対象トリガーIDで特定できるトリガー情報が持つ映像IDや、対応トリガーIDで特定できるトリガー情報が持つ映像IDが一致する場合は評価値を１とする。また、対象トリガーIDで特定できるトリガー情報から映像IDを用いて映像情報を特定し、その映像情報が持つプレイヤー名を利用し、プレイヤーの今までのトリガー発生回数を全トリガー発生回数で割った値を評価値としてもよい。また、イベント情報の発生時刻が新しい順に評価値を１、０．８、０．６、…としてもよい。また、イベント種別に応じた評価値を設定してもよい。さらに、前述した条件で計算した評価値を重み付きで積算したものを評価値としてもよい。なお、これら評価値の例は一例であり、評価値はこれらに限らない。

　次にステップＳ７０４で、ステップＳ７０３で計算した評価値が最も高いイベント情報を選択する。

　次にステップＳ７０５で、ステップＳ７０４で選択したイベント情報のイベント発生時刻に対して、事前に設定した定数秒を加算し、それを変数endとして設定する。

　次にステップＳ７０６で、ステップＳ７０４で選択したイベント情報を用いて、事前に指定した映像作成方法で新たな出力映像を作成する。図２４乃至図２６で示した映像作成方法がある状態で図２４の映像作成方法を事前に指定している場合にはその図２４の映像作成方法で出力映像が作成される。

　説明はステップＳ７０２に戻る。ステップＳ７０２で、変数endとして設定されている時刻が現在時刻より過去ではない場合、処理はステップＳ７０７に進む（ステップＳ７０２のＮｏ）。そしてステップＳ７０７で、直前の出力映像作成で用いた映像作成方法を引き続き使用し出力映像を作成する。

　説明はステップＳ７０１に戻る。ステップＳ７０１で、前回の出力映像作成以降に新しいイベント情報が作成されていない場合、処理はステップＳ７０８に進む（ステップＳ７０１のＮｏ）。

　次にステップＳ７０８で、直前の出力映像作成で用いた映像作成方法によって作成された出力映像が、事前に設定した時間以上続いているかどうかを判定する。事前に設定した時間とは、視聴者に対して同じ映像作成方法で作成した出力映像を連続で出力する最低時間を示している。この時間を設定することで、作成する出力映像が時間と共に目まぐるしく変化するような状況を避けることができる。

　直前の出力映像作成で用いた映像作成方法によって作成された出力映像が事前設定した時間以上続いている場合、処理はステップＳ７０９に進む（ステップＳ７０８のＹｅｓ）。そしてステップＳ７０９で、事前指定した映像作成方法で新たな出力映像を作成する。ステップＳ７０９における事前指定した映像作成方法としては、例えば、ランダムに映像IDを一つ指定し、その映像IDで特定できる映像をそのまま出力映像として出力とする方法がある。

　一方、ステップＳ７０８で、直前の出力映像作成で用いた映像作成方法によって作成された映像が、事前に設定した時間以上続いていない場合、処理はステップＳ７１０に進む（ステップＳ７０８のＮｏ）。

　そして、ステップＳ７１０で、直前の出力映像作成で用いた映像作成方法を引き続き使用し出力映像を作成する。

　なお、映像処理部１０６は対応トリガーの数に基づいて映像作成用のテンプレートを決定してもよい。

　図２７の処理では、ステップＳ７０６やステップＳ７０９における事前指定した映像作成方法を一つとしたが、さらに条件を付け加えることで複数の映像作成方法を事前指定することができる。例えば、ステップＳ７０６において、図２６のような映像作成方法と図２４のような映像作成方法をランダムに選択させることも可能である。

　図２７の処理で設定された映像作成方法は、直前に選択された映像作成方法として、記憶装置などを用いて映像処理部１０６で保持し、参照できるようにする。

　なお、映像処理部１０６の処理開始は試合が開始されてから一定時間経過後としてもよい。つまり、試合開始時間と映像作成開始時間に一定時間の遅れを設けてもよい。この遅れを設けることにより、試合後に配信する映像を決定するために用いられてきたイベントシーン情報を利用することができる。それにより、イベントシーン情報には確実に含まれなかったイベント情報でも映像作成方法を切り替えているような状況を改善し、確実に試合に変化があった場面を含んだ出力映像を作成することができる。具体的には、図２７におけるイベント情報をイベントシーン情報に置き換え、変数endの値をイベントシーン情報におけるイベントシーン終了時刻に定数秒加算した値を代入するような形で処理することができる。

　なお、人が映像処理装置１００としてのパーソナルコンピュータなどを操作してドラッグアンドドロップなどで出力映像内における素材映像の配置などを決定し、それに基づいて映像処理部１０６が出力映像を作成してもよい。

　以上のようにして第１の実施の形態における処理が行われる。第１の実施の形態では、第１情報作成部１０３および第２情報作成部１０５によって映像作成用情報としてのトリガー情報、イベント情報、イベントシーン情報、統計情報を作成し、映像処理部１０６で作成する。そして、それらの情報に基づいて、複数の入力映像において、ある事象に対応する事象をトリガー、イベントという形式で特定して、それらの事象を含めるように出力映像を作成する。これにより、出力映像の幅が広がり、視聴者がより楽しいと感じる出力映像を作成でき、どちらが勝つのかわからないという状況を視聴者に伝えることができる。また、「どちらが勝つか」という緊張感を伝え、出力映像により視聴者をより盛り上げることができる。

　また、本技術によれば、対象トリガーと対応トリガーの関係により、どのプレイヤーとどのプレイヤーが関わっているか（戦っているか）ということが容易にわかる出力映像を作成することができる。これにより、視聴者はどのプレイヤーとどのプレイヤーが関わっているか（戦っているか）がわかりやすくなる。さらに、イベント情報に含まれるトリガーにより、そのイベントにどのプレイヤーが関わっているかを特定して、イベントに関わっているプレイヤーの映像を含めるよう出力映像を作成することができる。

　また、本技術によれば、主催者等側が、どのプレイヤーとどのプレイヤーが関わっているか（戦っているか）を把握し、出力映像をする際の判定材料になり、より視聴者を惹きつける出力映像を作成できる。

　さらに、イベント情報を用いることにより、イベントに関わったプレイヤーや、より攻撃を当てたプレイヤーなどの情報を数値を用いて表現することができ、視聴者に対して、各プレイヤーがどのくらい頑張ったのかを視覚的に伝えられる。視聴者に対して、戦闘が起こりそうな２人のプレイヤーの映像を先に見せておき、実際に戦闘が起きたときに、戦闘の様子を最初から最後まで収めた出力映像を作成して、盛り上がりのタイミングを逃さず出力映像を提供することができる。

＜２．第２の実施の形態＞
［２－１．前提］
　次に本技術の第２の実施の形態について説明する。

　第１の実施の形態では、試合に参加する全プレイヤーのゲームプレイ映像を同時に入手できることを前提としていたため、対応トリガーの発見が容易であり、イベント情報を作成することができた。

　しかしそのような環境を準備することは難しく、実際には視聴者に映像を提供するようなゲーム大会等においては、ゲームサーバーが提供するプレイヤー数人のゲームプレイ映像等といった、限られた映像を元に出力映像を作成し、視聴者に提供する事例が多く存在する。

　そこで第２の実施の形態では、そのような制限のある状況においても、出力映像の作成に関連付ける素材映像を決定し、その素材映像がどのプレイヤーの映像であるかを推定できる仕組みを提案する。

　第２の実施の形態では、最大Ｐ人のプレイヤーのゲームプレイ映像しか同時に取得できないような状況を考える。Ｐは１試合における全プレイヤー参加人数より小さい値である。これは、映像IDに対してプレイヤー名が一意に対応していない状況を指している。より具体的には、各種映像ソースからプレイヤー数人のゲームプレイ映像が入力される状況において、どのプレイヤーのゲームプレイ映像を受け取るかをリアルタイムに切り替える必要があり、かつ、その切り替えは、一つの映像IDに対応する映像上で行われることを想定している。

　図２８はそのような状況における映像の切り替えを例示したものである。図２８は、入力映像がゲームプレイ映像（映像ID［１］）である場合で、主催者等が時刻ｔ＋１においてその映像ID［１］のゲームプレイ映像を、プレイヤーＡのゲームプレイ映像からプレイヤーＢのゲームプレイ映像に切り替えた場合である。ゲームプレイ映像に対応するプレイヤーは変更されたものの、時刻tにおけるプレイヤーＡのゲームプレイ映像の映像IDと時刻ｔ＋２におけるプレイヤーＢのゲームプレイ映像の映像IDは同一である。

［２－２．映像処理装置１００における処理］
　次に第２の実施の形態における映像処理装置１００における処理について説明する。映像処理装置１００は、第１の実施の形態と同様に、前処理部１０１、映像記憶部１０２、第１情報作成部１０３、情報記憶部１０４、第２情報作成部１０５、映像処理部１０６を備えて構成されている。

　前処理部１０１で各入力映像に対応付ける映像情報にはプレイヤー名が含まれているが、第２の実施の形態では、入力映像を解析することにより各入力映像がどのプレイヤーのゲームプレイ映像であるかを特定する。

　図２９は、第２の実施の形態の状況における、ゲームプレイ映像の例である。第２の実施の形態では、ゲームプレイ映像がどのプレイヤーのゲームプレイ映像であるかを示すプレイヤー名などの文字や数値が常にゲームプレイ映像内に表示されているものとする。

　事前にゲームプレイ映像内において文字検出領域を指定し、既知の文字認識技術などを用いてその文字を認識してプレイヤー名を特定することで、ゲームプレイ映像がどのプレイヤーのゲームプレイ映像であるかを特定し、入力映像に映像情報としてのプレイヤー名を対応付ける。もし、プレイヤー切り替え時やその他ゲーム内の処理によって文字検出領域にゲームプレイ映像内の物体などが重なってプレイヤー名を特定できなかった場合は、プレイヤー名を空白にしたり、直前のプレイヤー名と同じプレイヤー名にする、といった対応を取ることができる。

　なお、プレイヤー名を示す文字の表示位置は図２９に示す位置に限定されず、ゲームプレイ映像内に表示されていればどこでもよい。

　前処理部１０１では、さらに、ゲームプレイ映像に映像情報として対応付けられている映像IDに対して、図３０に示すように、ゲームプレイ映像のどの区間がどのプレイヤーのゲームプレイ映像であるかという情報を対応付ける。具体的には映像IDに対して、開始時刻、終了時刻、プレイヤー名を対応付ける。ゲームプレイ映像から特定したプレイヤー名が変化した時点をこれまでのプレイヤー名の終了時刻とし、変化した後のプレイヤー名をその開始時刻としている。

　第１の実施の形態の第１情報作成部１０３によるトリガー検知処理では、図１３で示したように、生存力の減少量が閾値th8以上であるときにトリガーを検知した判定する方法を説明した。一方、第２の実施の形態では、第１情報作成部１０３は、ゲームプレイ映像が他のプレイヤーのゲームプレイ映像に切り替わったことを検知してから一定時間は、直前の生存力の表示を現在の生存力の表示に更新するだけにとどめ、トリガー検知処理しないようにする。

　なぜなら、ゲームプレイ映像が他のプレイヤーのゲームプレイ映像に切り替わった後の生存力の表示は切り替わる前の別のプレイヤーの生存力を示しているため、その生存力の違いが差分として検出されてしまうためである。

　ゲームプレイ映像における他のプレイヤーのゲームプレイ映像への切り替えは、前処理部１０１から供給される映像情報を第１情報作成部１０３で保持しておき、前回参照した映像情報と最新の映像情報を比較することで検知できる。そのようにすることでトリガーの誤検知を防ぐことができる。

　また、図３１に示すように、第２の実施の形態の第１情報作成部１０３における処理では、ステップＳ２０１とステップＳ２０２の間に、ステップＳ２２１の位置推定処理を行う。

　ステップＳ２２１の位置推定処理では、現在入力されているゲームプレイ映像からプレイヤーのゲームフィールド上の位置を推定し、現在時刻、映像ID、推定位置の組として情報記憶部１０４に保存する。

　位置推定処理は、ゲームフィールド全体を映した地図映像を用いて行うことができる。図３２は映像IDに対応付けて情報記憶部１０４に保存される推定位置情報の例である。推定位置情報は例えば、ゲームフィールド上における緯度経度に相当する値によって記述される。また、位置を推定した時刻も映像IDに対応付けて保存される。これにより、指定時刻における一部のプレイヤーの推定位置を得ることができる。

　図３３は、第２の実施の形態の第１情報作成部１０３におけるイベント特定処理のフローチャートである。なお、ステップＳ４０１、ステップＳ４０４、ステップＳ４０５、ステップＳ４０６は第１の実施の形態における処理と同様である。

　ステップＳ４２１は第１の実施の形態におけるステップＳ４０３と基本的には同様の処理を行うが、第２の実施の形態では対応トリガーの評価値計算方法として、図１８で示した、ゲームフィールド全体を映した地図映像とプレイヤーの推定位置を利用した対応トリガーの評価値計算方法を実行する。

　また、評価値計算の過程で推定する検知トリガーの位置は第１情報作成部１０３で保持しておく。なお、対応トリガーが０個の場合、対応トリガーとの差分を計算する必要はない。

　ステップＳ４２２では、各プレイヤーがステップＳ４０４でイベント情報が作成されたイベントにどの程度関与しているかを計算し、対応プレイヤー名としてイベント情報に追加する。

　まず、事前に設定した過去past[sec]以内のプレイヤーの推定位置をわかっている人数分取得する。具体的には、映像情報が持つ映像IDに追加で対応付けた、図３０に示す、ゲームプレイ映像のどの区間がどのプレイヤーのゲームプレイ映像であるかという区間情報と、映像記憶部１０２に追加で保存した図３２に示す推定位置情報を元に、各プレイヤーがいつ、ゲームフィールドのどの位置にいたのかという時刻位置情報を取得する。同じプレイヤー名に対し複数の推定位置が分かった場合、その中で最も現在時刻に近い時刻の推定位置をそのプレイヤーの推定位置とする。

　その後、区間情報、推定位置情報、時刻位置情報を用いて、プレイヤー名と評価値の組を作成する。ここでの評価値とは、各プレイヤーにおける時刻とその時刻における推定位置、そして検知トリガーの推定位置を入力として計算できる値であり、そのイベントにおける各プレイヤーが関与している可能性を示すものである。

　評価値は図３４に示す方法で計算できる。図３４に示す評価値を算出する計算式では、評価値が１に近づくほど、そのプレイヤーがイベントにかかわった可能性が比較的高いと判定できる。ここでは単純な計算式を例に挙げたが、この計算式に限らず、距離に対する計算と時間に対する計算に重み付けを行ってもよいし、距離や時刻がより近いほど高い評価値を出すような計算方法等を採用してもよい。推定位置がわかっているプレイヤーについて評価値を計算したのちは、プレイヤー名とその評価値の組をイベント情報に追加する。追加された後のイベント情報の図３５のようになる。

　このように、各イベントに対して、わかる範囲で各プレイヤーがどのくらい関与している可能性があるかを数値化することで、対応トリガーが存在しない場合でもイベントに関与したプレイヤーを推測することができる。最もイベントに関与したプレイヤーの映像IDを用いて出力映像を作成することで、例えば、攻撃したプレイヤーと攻撃されたプレイヤーを同時に出力映像に含めることができる可能性を上げることができる。

　第２の実施の形態では、情報記憶部１０４は第１情報作成部１０３で追加作成した、現在時刻、映像ID、推定位置の組を保存する。また、第１情報作成部１０３で新たに作成したイベント情報内の対応プレイヤー名を追加で保存する。

　映像処理部１０６は、第２の実施の形態で新たに作成された情報を用いて出力映像の作成に関連付ける素材映像を決定し、その素材映像を用いて出力映像を作成する。

　例えば、イベント情報に対応トリガーIDがない場合や、イベント情報に対応トリガーIDがあるが評価値が極端に低い場合、対応プレイヤー名の中から最も評価値が高いプレイヤー名を用いて出力映像を作成することができる。そのプレイヤー名を用いて、適当なプレイヤーのゲームプレイ映像を、そのプレイヤーのものに切り替え、映像作成方法の映像IDとして準備することで実現できる。

　また、人間がイベント情報などを見て映像作成方法等を指定する場合においても、イベント情報の対応プレイヤー名とその評価値を見ることで、イベントに関与している可能性が高い映像を意識的に映像作成で使用することができる。これにより、盛り上がりそうな映像や、戦闘を行っている２人のプレイヤーの映像を出力できる可能性が増え、結果として視聴者をより楽しませることができる。

　以上のようにして第２の実施の形態における処理が行われる。第２の実施の形態では、全プレイヤーのゲームプレイ映像を同時に入手できない状況であっても、プレイヤーのゲームフィールド上の位置を推定して推定位置情報を蓄積することにより、プレイヤーの推定位置からイベントに関与した可能性があるプレイヤーを推定して出力映像の作成に反映させることができる。これにより、例えば、敵を攻撃したというイベントのイベント情報に基づいて出力映像を作成する場合、そのイベントに関与した可能性のあるプレイヤーを推測して、出力映像の作成に反映させることができる。

［２－３．トリガー検知処理の他の例］
［２－３－１．第１の例］
　第２の実施の形態では、プレイヤー間の距離を計算することでイベントに関与したプレイヤーを推測したが、このプレイヤー間の距離はトリガーとしても利用することができる。プレイヤー間の距離を計算することでプレイヤー間の距離が近付いたことをトリガーとして扱うことができる。

　このトリガー検知処理の方法としては、図３４で説明した、対応プレイヤー名とその評価値の組を求める方法を利用する。検知トリガー推定位置の代わりに、前処理部１０１から取得したプレイヤーのゲームプレイ映像から求めることができる推定位置を用いることで、対応プレイヤー名とその評価値の組を計算する。そして、最も高い評価値が閾値th14以上の時、２人のプレイヤー間の距離が近付いたというトリガーを検知したとみなす。検知したトリガーのトリガー詳細情報は、最も高い評価値を持っていたプレイヤー名とする。

　なお、このトリガーの対応トリガーは存在しない設定にすることで、不要なイベントの作成を防ぎ、このトリガー検知処理の方法で必要な情報やそれら情報を求める処理のみを第１の実施の形態に追加することで、第１の実施の形態でも同様のトリガーを追加することができる。

　このようにして、２人のプレイヤー間の距離が近付いたことをトリガーとして検知することで、特にリアルタイムな出力映像作成を行う場合において、近い将来戦闘やイベントが発生しそうな２人のプレイヤーを推定することができる。

　このトリガーにより、映像処理部１０６の映像作成方法として、現時点ではイベントやイベントシーンが存在していないが、近い将来イベントやイベントシーンが出現する可能性が高い映像IDを予め素材映像にしておくという映像作成方法を追加することができる。

［２－３－２．第２の例］
　他のトリガー検知方法の第２の例では、ゲームプレイ映像ではなく、プレイヤー映像においてプレイヤーの状態の変化があった場合にトリガーを検知したとする。

　この場合、プレイヤー映像という映像種別を事前にトリガー検知対象映像種別に設定しておく。第１情報作成部１０３は、映像種別がプレイヤー映像である入力映像に対してトリガー検知処理を行う。具体的には、まず、プレイヤー映像に対して状態推定としての姿勢推定処理を行い、プレイヤーの姿勢（骨の位置）を推定し、その推定姿勢情報と現在時刻とプレイヤー名との組を第１情報作成部１０３で保持する。

　そして、映像種別がプレイヤー映像である映像情報が持つプレイヤー名情報を取得後、現在時刻から過去一定時間以内の同じプレイヤー名を持つ映像情報を検索し、発見した場合は、その映像情報が持つ映像IDで特定できるプレイヤー映像に対しても姿勢推定処理を行う。そして、二つのプレイヤー映像における推定姿勢情報を用いて骨の位置の移動量を計算し、その総和が閾値th15以上である場合はトリガーを検知したとみなす。

　図３６は姿勢推定によって検出された骨の位置の例である。図３６ＡはプレイヤーＡのプレイヤー映像であり、図３６Ｂはそのプレイヤー映像における姿勢推定結果である。図３７Ｃは一定時間経過後のプレイヤーＡのプレイヤー映像であり、図３６Ｄはそのプレイヤー映像における姿勢推定結果である。

　このように姿勢が変化すると骨の位置が変化する為、この変化量を元にトリガー検知処理を行うことができる。なお、推定骨情報から検知したトリガーには対応トリガーは存在しないという設定にすることで、不要なイベントの作成を防ぐことができる。

　なお、プレイヤーの状態の変化は骨の位置の変化に限られない。骨の位置に加え、または骨の位置に代えて、関節の位置を推定して関節の位置の変化量に基づいてトリガー検知処理をしてもよい。さらに、プレイヤーの視線の検出処理を行い、プレイヤーの視線の位置の変化量に基づいてトリガー検知処理をしてもよい。

　プレイヤー映像におけるプレイヤーの状態に基づいてトリガー検知処理することにより、ゲームプレイ映像では十分に検知できないトリガーを検知することができる。例えば、「敵に撃破された」という事象を、予期しないプレイヤーの操作によってトリガーとして検知できなかった場合を考える。例えば、敵に撃破されたプレイヤーの試合中の姿勢が頭を抱え込む姿勢に変化した場合、そのプレイヤーの状態の変化を上述の方法で検知することでトリガー検知処理することができる。

＜３．変形例＞
　以上、本技術の実施の形態について具体的に説明したが、本技術は上述の実施の形態に限定されるものではなく、本技術の技術的思想に基づく各種の変形が可能である。

　実施の形態は、多数のプレイヤーがフィールドで戦闘を行い、勝利して生き残ることを目標とする対戦型ゲームを例にして説明したがゲームはそれに限られない、例えば複数プレイヤーが一つのチームとなり、敵チームとゲームフィールド上で戦うゲームでもよいし、レースなど競争するゲームでもよいし、パズルなどのゲームでもよいし、複数のプレイヤーが参加するゲームであればどのようなものでもよい。その場合、各ゲームの映像に合わせたトリガー検知方法などを予め設定しておく必要がある。

　また、ゲームに限らず、音楽イベント、トークイベントなど各種イベントを撮影した映像からダイジェスト映像やハイライト映像を作成する場合にも本技術を用いることができる。

　実施の形態では第１情報作成部１０３と第２情報作成部１０５という２つの情報作成部で映像作成用情報を作成したが、一つの情報作成部で全ての映像作成用情報を作成してもよい。

　本技術は以下のような構成も取ることができる。
（１）
　複数の入力映像から検知された複数のトリガーに基づいて、映像作成用情報を作成する情報作成部と、
　前記映像作成用情報に基づいて、前記複数の入力映像の中から出力映像の作成に関連付ける素材映像を決定する映像処理部と
を備える
映像処理装置。
（２）
　前記情報作成部は、複数の前記トリガーに基づいて前記映像作成用情報としてのトリガー情報を作成する（１）に記載の映像処理装置。
（３）
　前記トリガー情報は、前記トリガーが検知された前記入力映像を識別するための映像IDを含む（２）に記載の映像処理装置。
（４）
　前記トリガー情報は、前記トリガーの種別を示すトリガー種別情報を含む（２）または（３）に記載の映像処理装置。
（５）
　前記トリガーは、前記入力映像内で起きた特徴的な事象である（１）に記載の映像処理装置。
（６）
　前記情報作成部は、前記トリガー情報に基づいて、前記映像作成用情報としてのイベント情報を作成する（２）に記載の映像処理装置。
（７）
　前記イベント情報は、イベントを構成する、前記複数のトリガーのうちのいずれかである対象トリガーと前記対象トリガーに対応する対応トリガーとを識別するためのトリガーIDを含む（６）に記載の映像処理装置。
（８）
　前記イベント情報は、イベントの種別を示すイベント種別情報を含む（７）に記載の映像処理装置。
（９）
　前記情報作成部は、前記イベント情報に基づいて前記映像作成用情報としてのイベントシーン情報を作成する（７）に記載の映像処理装置。
（１０）
　前記イベントシーン情報は、イベントシーンを構成する前記イベントを識別するためのイベントIDを含む（９）に記載の映像処理装置。
（１１）
　前記情報作成部は前記トリガー情報に基づいて前記映像作成用情報としての統計情報を作成する（１）から（１０）のいずれかに記載の映像処理装置。
（１２）
　前記映像処理部は、前記トリガー情報に含まれる前記映像IDで特定できる前記入力映像を前記素材映像として決定する（３）に記載の映像処理装置。
（１３）
　前記映像処理部は、前記イベント情報に含まれる前記トリガーIDが示す前記トリガー情報に含まれる前記映像IDで特定できる前記入力映像を前記素材映像として決定する（７）に記載の映像処理装置。
（１４）
　前記映像処理部は、前記イベントシーン情報に含まれる前記映像IDで特定できる前記入力映像を前記素材映像として決定する（１０）に記載の映像処理装置。
（１５）
　前記映像処理部は、前記出力映像の作成に関連付けられた前記素材映像を用いて前記出力映像を作成する（１）から（１４）のいずれかに記載の映像処理装置。
（１６）
　前記映像処理部は、複数の前記素材映像を一つの映像内に配置して前記出力映像を作成する（１５）に記載の映像処理装置。
（１７）
　前記入力映像は、ゲーム機が出力するゲームプレイ映像である（１）から（１６）のいずれかに記載の映像処理装置。
（１８）
　前記入力映像は、ゲームをプレイしているプレイヤーを撮影した映像である（１）から（１７）のいずれかに記載の映像処理装置。
（１９）
　複数の入力映像から検知された複数のトリガーに基づいて、映像作成用情報を作成し、
　前記映像作成用情報に基づいて、前記複数の入力映像の中から出力映像の作成に関連付ける素材映像を決定する
映像処理方法。
（２０）
　複数の入力映像から検知された複数のトリガーに基づいて、映像作成用情報を作成し、
　前記映像作成用情報に基づいて、前記複数の入力映像の中から出力映像の作成に関連付ける素材映像を決定する
映像処理方法をコンピュータに実行させるプログラム。

１００・・・映像処理装置。
１０３・・・第１映像処理部
１０５・・・第２情報作成部

Claims

　複数の入力映像から検知された複数のトリガーに基づいて、映像作成用情報を作成する情報作成部と、
　前記映像作成用情報に基づいて、前記複数の入力映像の中から出力映像の作成に関連付ける素材映像を決定する映像処理部と
を備える
映像処理装置。
　前記情報作成部は、複数の前記トリガーに基づいて前記映像作成用情報としてのトリガー情報を作成する
請求項１に記載の映像処理装置。
　前記トリガー情報は、前記トリガーが検知された前記入力映像を識別するための映像IDを含む
請求項２に記載の映像処理装置。
　前記トリガー情報は、前記トリガーの種別を示すトリガー種別情報を含む
請求項２に記載の映像処理装置。
　前記トリガーは、前記入力映像内で起きた特徴的な事象である
請求項１に記載の映像処理装置。
　前記情報作成部は、前記トリガー情報に基づいて、前記映像作成用情報としてのイベント情報を作成する
請求項２に記載の映像処理装置。
　前記イベント情報は、イベントを構成する、前記複数のトリガーのうちのいずれかである対象トリガーと前記対象トリガーに対応する対応トリガーとを識別するためのトリガーIDを含む
請求項６に記載の映像処理装置。
　前記イベント情報は、イベントの種別を示すイベント種別情報を含む
請求項７に記載の映像処理装置。
　前記情報作成部は、前記イベント情報に基づいて前記映像作成用情報としてのイベントシーン情報を作成する
請求項７に記載の映像処理装置。
　前記イベントシーン情報は、イベントシーンを構成する前記イベントを識別するためのイベントIDを含む
請求項９に記載の映像処理装置。
　前記情報作成部は前記トリガー情報に基づいて前記映像作成用情報としての統計情報を作成する
請求項１に記載の映像処理装置。
　前記映像処理部は、前記トリガー情報に含まれる前記映像IDで特定できる前記入力映像を前記素材映像として決定する
請求項３に記載の映像処理装置。
　前記映像処理部は、前記イベント情報に含まれる前記トリガーIDが示す前記トリガー情報に含まれる前記映像IDで特定できる前記入力映像を前記素材映像として決定する
請求項７に記載の映像処理装置。
　前記映像処理部は、前記イベントシーン情報に含まれる前記映像IDで特定できる前記入力映像を前記素材映像として決定する
請求項１０に記載の映像処理装置。
　前記映像処理部は、前記出力映像の作成に関連付けられた前記素材映像を用いて前記出力映像を作成する
請求項１に記載の映像処理装置。
　前記映像処理部は、複数の前記素材映像を一つの映像内に配置して前記出力映像を作成する
請求項１５に記載の映像処理装置。
　前記入力映像は、ゲーム機が出力するゲームプレイ映像である
請求項１に記載の映像処理装置。
　前記入力映像は、ゲームをプレイしているプレイヤーを撮影した映像である
請求項１に記載の映像処理装置。
　複数の入力映像から検知された複数のトリガーに基づいて、映像作成用情報を作成し、
　前記映像作成用情報に基づいて、前記複数の入力映像の中から出力映像の作成に関連付ける素材映像を決定する
映像処理方法。
　複数の入力映像から検知された複数のトリガーに基づいて、映像作成用情報を作成し、
　前記映像作成用情報に基づいて、前記複数の入力映像の中から出力映像の作成に関連付ける素材映像を決定する
映像処理方法をコンピュータに実行させるプログラム。