WO2020066659A1

WO2020066659A1 - 情報処理方法、情報処理装置およびプログラム

Info

Publication number: WO2020066659A1
Application number: PCT/JP2019/035901
Authority: WO
Inventors: 直之安立; 克己石川; 康之介加藤; 祐二小池; 謙一良齋藤
Original assignee: ヤマハ株式会社
Priority date: 2018-09-28
Filing date: 2019-09-12
Publication date: 2020-04-02
Also published as: JP2020053936A; JP7167602B2

Abstract

情報処理装置は、収録装置により複数の動画を収録する第１収録処理を実行し、複数の動画のうち第１動画の選択の指示を利用者から受付け、テンプレートに含まれる複数のシーンのうちの第１シーンに第１動画を対応付け、複数のシーンのうち第１シーン以外のシーンに対応する動画を収録装置により収録する第２収録処理を実行する。

Description

情報処理方法、情報処理装置およびプログラム

　本開示は、動画を処理する技術に関する。

　端末装置を利用して動画を収録する技術が従来から提案されている。例えば特許文献１には、複数のシーンで構成されるコンテンツを生成するために、各シーンをビデオカメラで撮影する技術が開示されている。

特開２００４－３２２７７号公報

　動画の撮影または編集に関する専門的な知識がない利用者にとって、複数のシーンの各々について当該シーンに適切な動画を撮影することは、実際には容易ではない。以上の事情を考慮して、本開示のひとつの態様は、複数のシーンの各々について適切な動画を撮影することを目的とする。

　以上の課題を解決するために、本開示のひとつの態様に係る情報処理方法は、収録装置により複数の動画を収録し、前記複数の動画のうち第１動画の選択の指示を利用者から受付け、テンプレートに含まれる複数のシーンのうちの第１シーンに前記第１動画を対応付け、前記複数のシーンのうち前記第１シーン以外のシーンに対応する動画を前記収録装置により収録する。

　本開示のひとつの態様に係る情報処理装置は、収録装置により複数の動画を収録する第１収録処理部と、前記複数の動画のうち第１動画の選択の指示を利用者から受付ける選択受付部と、テンプレートに含まれる複数のシーンのうちの第１シーンに前記第１動画を対応付ける動画対応部と、前記複数のシーンのうち前記第１シーン以外のシーンに対応する動画を前記収録装置により収録する第２収録処理部とを具備する。

　本開示のひとつの態様に係るプログラムは、収録装置により複数の動画を収録する第１収録処理部、前記複数の動画のうち第１動画の選択の指示を利用者から受付ける選択受付部、テンプレートに含まれる複数のシーンのうちの第１シーンに前記第１動画を対応付ける動画対応部、および、前記複数のシーンのうち前記第１シーン以外のシーンに対応する動画を前記収録装置により収録する第２収録処理部、としてコンピュータを機能させる。

第１実施形態における情報処理装置の構成を例示するブロック図である。テンプレートの模式図である。制御装置が実行する処理の具体的な手順を例示するフローチャートである。使用テンプレートを選択する処理の具体的な手順を例示するフローチャートである。使用テンプレートを選択する過程で表示装置が表示する画面の遷移を例示する模式図である。語句に対応する動画を撮影する過程で表示装置が表示する画面の遷移を例示する模式図である。第１収録処理の具体的な手順を例示するフローチャートである。複数の動画の何れかを利用者が選択するための画面の模式図である。第２収録処理の具体的な手順を例示するフローチャートである。第２収録処理の過程で表示装置が表示する画面の遷移を例示する模式図である。第２実施形態において使用テンプレートを選択する処理の具体的な手順を例示するフローチャートである。第３実施形態におけるテンプレートの模式図である。第３実施形態の制御装置が実行する処理の具体的な手順を例示するフローチャートである。

＜第１実施形態＞
　図１は、本開示の第１実施形態に係る情報処理装置１００の構成を例示するブロック図である。情報処理装置１００は、コンテンツを構成する複数の動画を収録するためのコンピュータシステムである。例えば、携帯電話機、スマートフォン、タブレット端末、またはパーソナルコンピュータ等の情報端末が、情報処理装置１００として利用される。コンテンツは、複数のシーンにそれぞれ対応する複数の動画の時系列で構成される。第１実施形態では、例えば企業を紹介するコンテンツまたは人材募集のためのコンテンツなど、企業に関する各種のコンテンツを想定する。企業を紹介するコンテンツとしては、例えば企業自体を紹介するコンテンツのほか、企業が取扱う製品を紹介するコンテンツ、または、企業が開発した技術を紹介するコンテンツなどが想定される。もっとも、コンテンツの内容は以上の例示に限定されない。

　図１に例示される通り、第１実施形態の情報処理装置１００は、制御装置１１と記憶装置１２と通信装置１３と表示装置１４と入力装置１５と収録装置１６とを具備する。制御装置１１は、情報処理装置１００の各要素を制御する単数または複数のプロセッサで構成される。例えば、制御装置１１は、ＣＰＵ（Central Processing Unit）またはＦＰＧＡ（Field Programmable Gate Array）等の１種類以上のプロセッサで構成される。なお、制御装置１１の一部の機能を専用の電子回路で実現してもよい。また、制御装置１１の機能を複数の装置に搭載してもよい。

　通信装置１３は、移動体通信網またはインターネット等を含む通信網２００を介して編集装置３００と通信する。具体的には、通信装置１３は、複数のシーンの各々について収録された動画を含むデータ（以下「素材データ」という）を編集装置３００に送信する。編集装置３００は、情報処理装置１００から受信した素材データを編集することで１個のコンテンツを生成する。例えば自動または手動による編集でコンテンツが生成される。編集装置３００が生成したコンテンツは情報処理装置１００に提供される。なお、情報処理装置１００が素材データからコンテンツを生成してもよい。

　表示装置１４は、制御装置１１による制御のもとで各種の画像を表示する。例えば液晶表示パネルが表示装置１４として利用される。表示装置１４は、例えば複数の動画を収録するための画面、および、編集装置３００が生成したコンテンツの各動画を表示する。入力装置１５は、利用者による操作を受付ける。例えば、利用者が操作する操作子、または表示装置１４と一体に構成されたタッチパネルが、入力装置１５として利用される。また、音声入力が可能な収音装置を入力装置１５として利用してもよい。

　収録装置１６は、映像と音響とを含む動画を収録する画像入力機器である。具体的には、収録装置１６は、撮影レンズ等の光学系からの入射光を電気信号に変換する撮像装置と、周囲の音響を収音する収音装置とを具備する。収録装置１６が収録した動画は、任意の形式の動画データで表現される。なお、情報処理装置１００とは別体の収録装置１６を有線または無線により情報処理装置１００に接続してもよい。なお、音響を含まない動画を収録してもよい。

　記憶装置１２は、制御装置１１が実行するプログラムと制御装置１１が使用する各種のデータとを記憶する単数または複数のメモリである。例えば収録装置１６が収録した動画が記憶装置１２に記憶される。半導体記録媒体および磁気記録媒体等の公知の記録媒体、または複数種の記録媒体の組合せが、記憶装置１２として任意に採用される。なお、情報処理装置１００に対して着脱可能な可搬型の記録媒体、または情報処理装置１００が通信可能な外部記録媒体（例えばオンラインストレージ）を、記憶装置１２として利用してもよい。すなわち、記憶装置１２は情報処理装置１００から省略され得る。

　第１実施形態の記憶装置１２は、コンテンツの基礎となる複数のテンプレートＴを記憶する。複数のテンプレートＴの各々は、図２に例示される通り、動画の収録の単位となる複数のシーンを含む時系列データである。１個のテンプレートＴに含まれるシーンの総数および組合せはテンプレートＴ毎に相違する。各シーンは、特定の題材または趣旨に対応した単位である。例えば企業名または製品名等の表題のシーン、製品を紹介するシーン、製品の複数の型式を提示するシーン、または製品の利用例を紹介するシーンなど、多様なシーンがテンプレートＴに登録される。適切な動画の内容はシーン毎に相違する。

　図２に例示される通り、各テンプレートＴに含まれる複数のシーンは、第１シーンと第２シーンとを含む。第１シーンおよび第２シーンは、テンプレートＴの作成者により事前に選択される。具体的には、テンプレートＴは、複数のシーンのうち第１シーンおよび第２シーンを指定するデータを含む。第１シーンおよび第２シーンは、コンテンツのなかで重要なシーンである。例えば、コンテンツの複数のシーンのうち、企業を紹介する序盤のハイライトシーン、または、当該企業の製品の優位点を主張する中盤または終盤のハイライトシーンが、第１シーンおよび第２シーンとして事前に選定される。第１シーンは、第２シーンよりも重要なシーンである。なお、第１シーンおよび第２シーンを利用者が選択してもよい。

　図２は、任意の１個のテンプレートＴの構成を示す模式図である。図２に例示される通り、各テンプレートＴは、当該テンプレートＴの属性を表す属性データＸと、相異なるシーンに関する複数の単位データＵを含んで構成される。

　任意の１個のテンプレートＴの属性データＸは、当該テンプレートＴを基礎として生成されるコンテンツの種別Ｘ1と、コンテンツの趣旨Ｘ2と、コンテンツで表現される企業または製品等の対象（以下「表現対象」という）に関する優位点Ｘ3とを表す。コンテンツの趣旨Ｘ2は、利用者が当該コンテンツの視聴者に主張したい事柄である。優位点Ｘ3は、他の企業または製品との比較において利用者が表現対象の強味として認識する事項（結果的には視聴者に主張したい事柄）である。

　任意の１個のシーンの単位データＵは、案内文字列Ｕ1と付加文字列Ｕ2とを含む。各シーンの案内文字列Ｕ1は、当該シーンの動画の撮影を案内する文字列である。例えば撮影時の留意点等が案内文字列Ｕ1としてシーン毎に用意される。付加文字列Ｕ2は、動画に付加されるべき文字列（すなわち動画とともに表示されるテロップ）である。

　第１実施形態の制御装置１１は、記憶装置１２に記憶されたプログラムを実行することで、図３に例示した処理を実行する。例えば、入力装置１５に対する利用者からの指示を契機として図３の処理が開始される。処理を開始すると、制御装置１１は、記憶装置１２に記憶された複数のテンプレートＴの何れか（以下「使用テンプレートＴ」という）を選択する（Ｓa1）。

　図４は、使用テンプレートＴを選択する処理（Ｓa1）の具体的な手順を例示するフローチャートである。制御装置１１は、コンテンツの種別（カテゴリ）に関する複数の選択肢を含む図５の画面Ｇa1を表示装置１４に表示させ（Ｓb1）、利用者による選択の指示を待機する（Ｓb2：NO）。利用者による種別の選択の指示を受付けると（Ｓb2：YES）、制御装置１１は、コンテンツの趣旨に関する複数の選択肢を含む図５の画面Ｇa2を表示装置１４に表示させ（Ｓb3）、利用者による選択の指示を待機する（Ｓb4：NO）。例えば「会社の特徴」「技術力のアピール」または「イメージアップ」等の複数の選択肢が画面Ｇa2に表示される。利用者による趣旨の選択の指示を受付けると（Ｓb4：YES）、制御装置１１は、コンテンツの表現対象の優位点に関する複数の選択肢を含む図５の画面Ｇa3を表示装置１４に表示させ（Ｓb5）、利用者による選択の指示を待機する（Ｓb6：NO）。例えば「信頼性」「先進性」または「安全性」等の複数の選択肢（すなわち表現対象の優位点を表現する語句）が画面Ｇa3に表示される。以上の説明から理解される通り、制御装置１１は、複数の事項（以下「指示事項」という）の各々について利用者による選択の指示を受付ける。コンテンツの種別および趣旨と表現対象の優位点とは、指示事項の例示である。

　利用者による優位点の選択の指示を受付けると（Ｓb6：YES）、制御装置１１は、記憶装置１２に記憶された複数のテンプレートＴから利用者による選択の結果に応じた１個の使用テンプレートＴを選択する（Ｓb7）。具体的には、制御装置１１は、利用者が選択した種別、趣旨および優位点の組合せに類似する属性データＸのテンプレートＴを使用テンプレートＴとして選択する。すなわち、利用者の意図に沿ったコンテンツの生成に好適な使用テンプレートＴが選択される。以上の説明から理解される通り、制御装置１１は、複数のテンプレートＴから使用テンプレートＴを選択する要素（選択処理部）として機能する。具体的には、制御装置１１は、複数の指示事項の各々に関する利用者からの指示に応じて使用テンプレートＴを選択する。

　以上の手順（Ｓb1～Ｓb7）で使用テンプレートＴを選択すると、制御装置１１は、図３に例示される通り、２個の語句Ｗ（ＷaおよびＷb）の入力を利用者から受付ける（Ｓa2）。具体的には、制御装置１１は、各語句Ｗの入力欄を含む図６の画面Ｇb0を表示装置１４に表示させて利用者による入力を待機する。各語句Ｗは、利用者がコンテンツの視聴者に主張したい事項を表す任意のキーワード（単語または句）である。例えば、企業の技術力の高さを主張したい場合、利用者は「高度な技術」等の語句Ｗを入力し、自社製品の実績を主張したい場合、利用者は「豊富な実績」等の語句Ｗを入力する。

　語句Ｗaおよび語句Ｗbの入力を利用者から受付けると、制御装置１１は、語句Ｗaに対応する動画Ｍaと語句Ｗbに対応する動画Ｍbとを、収録装置１６により収録する（Ｓa3，Ｓa4）。図７は、語句Ｗに対応する動画Ｍを収録する処理（以下「第１収録処理」という）の具体的な手順を例示するフローチャートである。語句Ｗaについて第１収録処理が実行されることで動画Ｍaが収録され（Ｓa3）、語句Ｗbについて第１収録処理が実行されることで動画Ｍbが生成される（Ｓa4）。

　第１収録処理を開始すると、制御装置１１は、語句Ｗに対応する動画Ｍの撮影を利用者に案内する図６の画面Ｇb1を表示装置１４に表示させる（Ｓc1）。画面Ｇb1の案内には語句Ｗが含まれる。具体的には、動画Ｍaを生成する第１収録処理（Ｓa3）においては語句Ｗaを含む案内が画面Ｇb1に表示され、動画Ｍbを生成する第１収録処理（Ｓa4）においては語句Ｗbを含む案内が画面Ｇb1に表示される。利用者が処理の進行を指示すると、制御装置１１は、語句Ｗに対応する動画Ｍを撮影するための図６の画面Ｇb2を表示装置１４に表示させる（Ｓc2）。

　画面Ｇb2は、撮影領域Ｒ1と付加領域Ｒ2と操作領域Ｒ3とを含んで構成される。撮影領域Ｒ1には、収録装置１６の撮像装置により撮像される映像が実時間的に表示（すなわちライブビュー表示）される。付加領域Ｒ2には語句Ｗが表示される。操作領域Ｒ3には、利用者からの操作を受付ける操作子が表示される。例えば、動画Ｍの収録の開始および終了を指示する操作子Ｂが操作領域Ｒ3に配置される。

　画面Ｇb2の表示後、制御装置１１は、語句Ｗに対応する動画Ｍを、利用者からの指示に応じて収録装置１６により収録する（Ｓc3）。具体的には、制御装置１１は、語句Ｗaに対応する動画Ｍaの収録（Ｓa3）、または、語句Ｗbに対応する動画Ｍbの収録（Ｓa4）を、収録装置１６に実行させる。例えば、画面Ｇb2の操作子Ｂを利用者が操作すると、制御装置１１は、収録装置１６に動画Ｍの収録を開始させる。利用者は、収録装置１６を利用して、語句Ｗに適合する動画Ｍを撮影する。また、収録中に利用者が操作子Ｂを操作すると、収録装置１６による動画Ｍの収録は終了する。なお、収録の開始から所定の時間が経過した場合に動画Ｍの収録を終了してもよい。収録装置１６が収録した動画Ｍは記憶装置１２に記憶される。以上の説明から理解される通り、制御装置１１は、収録装置１６により複数の動画Ｍ（動画Ｍaおよび動画Ｍb）を収録する要素（第１収録処理部）として機能する。

　以上の手順で動画Ｍaおよび動画Ｍbを収録すると、制御装置１１は、図８の画面Ｇcを表示装置１４に表示させる（Ｓa5）。画面Ｇcは、再生領域Ｑaと再生領域Ｑbとを含んで構成される。再生領域Ｑaには動画Ｍaと語句Ｗaとが表示され、再生領域Ｑbには動画Ｍbと語句Ｗbとが表示される。利用者は、画面Ｇcを視認することで動画Ｍaと動画Ｍbとを比較し、入力装置１５を操作することで動画Ｍaおよび動画Ｍbのうちの一方の動画Ｍ（以下「第１動画Ｍ1」という）を選択する。例えば利用者は、動画Ｍaおよび動画Ｍbのうちの印象的な方を第１動画Ｍ1として選択する。制御装置１１は、利用者による第１動画Ｍ1の選択の指示を受付ける（Ｓa6）。動画Ｍaおよび動画Ｍbのうち利用者が画面Ｇcで選択しない動画を以下では「第２動画Ｍ2」と表記する。以上の説明から理解される通り、制御装置１１は、複数の動画Ｍのうち第１動画Ｍ1の選択の指示を利用者から受付ける要素（選択受付部）として機能する。

　制御装置１１は、図２に例示される通り、使用テンプレートＴに含まれる複数のシーンのうち第１シーンに第１動画Ｍ1を対応付け、第２シーンに第２動画Ｍ2を対応付ける（Ｓa7）。例えば、制御装置１１は、第１動画Ｍ1に第１シーンの識別情報を付加し、第２動画Ｍ2に第２シーンの識別情報を付加する。以上の説明から理解される通り、制御装置１１は、使用テンプレートＴの第１シーンに第１動画Ｍ1を対応付け、第２シーンに第２動画Ｍ2を対応付ける要素（動画対応部）として機能する。

　また、制御装置１１は、第１動画Ｍ1に対応する語句Ｗと属性データＸが示す優位点Ｘ3とに応じた付加文字列Ｕ2をシーン毎に生成する（Ｓa8）。具体的には、制御装置１１は、使用テンプレートＴの複数のシーンの各々について、当該シーンの初期的な付加文字列Ｕ2に語句Ｗと優位点Ｘ3とを挿入する。すなわち、付加文字列Ｕ2が語句Ｗおよび優位点Ｘ3に応じて更新される。

　例えば、初期的な付加文字列Ｕ2が「｛Ａ｝によって実現される｛Ｂ｝」という文字列である場合を想定する。第１動画Ｍ1の語句Ｗが「高度な技術」であり、優位点Ｘ3が「信頼性」である場合、語句Ｗを空欄｛Ａ｝に挿入するとともに優位点Ｘ3を空欄｛Ｂ｝に挿入することで、「｛高度な技術｝によって実現される｛信頼性｝」という付加文字列Ｕ2が生成される。

　語句Ｗおよび優位点Ｘ3に応じてシーン毎に生成された付加文字列Ｕ2が、使用テンプレートＴの当該シーンに対応付けられる。前述の通り、第１シーンには第１動画Ｍ1が対応付けられる。したがって、制御装置１１は、第１動画Ｍ1の語句Ｗに応じて生成された付加文字列Ｕ2を第１動画Ｍ1とともに当該第１シーンに対応付ける要素（対応管理部）として機能する。

　なお、以上の説明では使用テンプレートＴの全部のシーンについて付加文字列Ｕ2を生成したが、使用テンプレートＴの一部のシーンのみについて付加文字列Ｕ2を生成してもよい。また、以上の説明では属性データＸが示す優位点Ｘ3に応じた付加文字列Ｕ2を生成したが、使用テンプレートＴを選択する処理（Ｓb5，Ｓb6）において利用者が選択した優位点に応じて付加文字列Ｕ2を生成してもよい。

　制御装置１１は、第１動画Ｍ1に対応する語句Ｗと属性データＸが示す優位点Ｘ3とに応じた案内文字列Ｕ1をシーン毎に生成する（Ｓa9）。具体的には、制御装置１１は、使用テンプレートＴの複数のシーンの各々について、当該シーンの初期的な案内文字列Ｕ1に語句Ｗと優位点Ｘ3とを挿入する。すなわち、案内文字列Ｕ1が語句Ｗおよび優位点Ｘ3に応じて更新される。なお、付加文字列Ｕ2の生成（Ｓa8）と案内文字列Ｕ1の生成（Ｓa9）との順序を逆転してもよい。

　例えば、初期的な案内文字列Ｕ1が「｛Ａ｝を視聴者に印象付けるために｛Ｂ｝を強調する動画を撮影しましょう」という文字列である場合を想定する。第１動画Ｍ1の語句Ｗが「高度な技術」であり、優位点Ｘ3が「信頼性」である場合を仮定する。語句Ｗを空欄｛Ａ｝に挿入するとともに優位点Ｘ3を空欄｛Ｂ｝に挿入することで、「｛高度な技術｝を視聴者に印象付けるために｛信頼性｝を強調する動画を撮影しましょう」という案内文字列Ｕ1が生成される。

　語句Ｗおよび優位点Ｘ3に応じてシーン毎に生成された案内文字列Ｕ1が、使用テンプレートＴの当該シーンに対応付けられる。なお、以上の説明では使用テンプレートＴの全部のシーンについて案内文字列Ｕ1を生成したが、使用テンプレートＴの一部のシーンのみについて案内文字列Ｕ1を生成してもよい。また、以上の説明では属性データＸが示す優位点Ｘ3に応じた案内文字列Ｕ1を生成したが、使用テンプレートＴの選択（Ｓb5，Ｓb6）において利用者が選択した優位点に応じて案内文字列Ｕ1を生成してもよい。

　以上の処理を実行すると、制御装置１１は、利用者からの指示に応じて、使用テンプレートＴの各シーンについて動画Ｍを収録する処理（以下「第２収録処理」という）を実行する（Ｓa10）。第２収録処理において、制御装置１１は、複数のシーンのうち利用者が選択したシーン（以下「収録シーン」という）の動画Ｍを収録装置１６により収録する。利用者は、入力装置１５を適宜に操作することで、第１シーンおよび第２シーンを含む任意のシーンを収録シーンとして選択できる。動画Ｍが未収録である収録シーンが選択されると、第２収録処理で収録された動画Ｍが当該収録シーンに対応付けられる。他方、動画Ｍが収録済である収録シーン（例えば第１シーンまたは第２シーン）が選択されると、当該収録シーンに対応付けられた収録済の動画Ｍが、直近の第２収録処理で収録された動画Ｍに置換される。

　図９は、１個の収録シーンの動画Ｍを収録する第２収録処理（Ｓa10）の具体的な手順を例示するフローチャートである。利用者による収録シーンの選択の指示を契機として第２収録処理が開始される。

　第２収録処理を開始すると、制御装置１１は、収録シーンの動画Ｍの撮影を利用者に案内する図１０の画面Ｇd1を表示装置１４に表示させる（Ｓd1）。画面Ｇd1には、収録シーンに対応付けられた案内文字列Ｕ1が表示される。前述の通り、案内文字列Ｕ1には、利用者が指示した語句Ｗおよび優位点Ｘ3が包含される。したがって、案内文字列Ｕ1を参照することで、収録シーンの撮影に関する留意点とともにコンテンツの全体的な趣旨を利用者が再認識できる。

　利用者が処理の進行を指示すると、制御装置１１は、収録シーンの動画Ｍを撮影するための図１０の画面Ｇd2を表示装置１４に表示させる（Ｓd2）。画面Ｇd2は、図６に例示した画面Ｇb1と同様に、撮影領域Ｒ1と付加領域Ｒ2と操作領域Ｒ3とを含んで構成される。撮影領域Ｒ1には、収録装置１６により撮像された映像が実時間的に表示される。付加領域Ｒ2には、収録シーンに対応付けられた付加文字列Ｕ2が表示される。操作領域Ｒ3には、利用者からの操作を受付ける操作子Ｂが表示される。制御装置１１は、操作領域Ｒ3の操作子に対する利用者からの指示に応じて、収録シーンの動画Ｍを収録装置１６により収録する（Ｓd3）。以上の説明から理解される通り、制御装置１１は、収録シーン（例えば第１シーンおよび第２シーン等の収録済のシーン以外のシーン）に対応する動画を収録装置１６により収録する要素（第２収録処理部）として機能する。制御装置１１は、収録シーンについて収録した動画Ｍを、使用テンプレートＴの当該収録シーンに対応付ける（Ｓd4）。

　第２収録処理は、利用者が処理の終了を指示するまでシーン毎に反復される（Ｓa11：NO）。複数回にわたる第２収録処理の実行中の任意の時点において、利用者は、収録済の各シーンの動画Ｍを視聴することが可能である。すなわち、制御装置１１は、利用者から視聴が指示された収録済の動画Ｍを表示装置１４に表示させる。したがって、利用者は、例えば第１シーンについて収録済の第１動画Ｍ1または第２シーンについて収録済の第２動画Ｍ2を適宜に視聴しながら、その他のシーンの動画Ｍを撮影することが可能である。

　以上に説明した第２収録処理の反復により、使用テンプレートＴの各シーンについて動画Ｍと付加文字列Ｕ2とが対応付けられる。利用者が処理の終了を指示すると（Ｓa11：YES）、制御装置１１は、使用テンプレートＴの複数のシーンの各々に対応する動画Ｍと付加文字列Ｕ2とを含む素材データを通信装置１３から編集装置３００に送信する（Ｓa12）。編集装置３００は、付加文字列Ｕ2が合成された動画Ｍを適宜に調整したうえで複数のシーンについて時系列に配列したコンテンツを生成する。

　以上に説明した通り、第１実施形態では、複数の動画Ｍのうち利用者が選択した第１動画Ｍ1が使用テンプレートＴの第１シーンに対応付けられたうえで、第１シーン以外のシーンに対応する動画Ｍが収録装置１６により収録される。したがって、利用者は、第１シーンに対応する収録済の第１動画Ｍ1を適宜に確認しながら、収録装置１６により第１シーン以外のシーンに対応する動画Ｍを撮影できる。第１実施形態では特に、第１動画Ｍ1が第１シーンに対応付けられるだけでなく、第２動画Ｍ2が第２シーンに対応付けられる。したがって、利用者は、第１動画Ｍ1および第２動画Ｍ2を適宜に参照しながら、第１シーンおよび第２シーン以外のシーンに対応する動画を収録装置１６により撮影できる。

　第１実施形態では、利用者から受付けた語句Ｗに対応する複数の動画Ｍ（Ｍa，Ｍb）が収録装置１６により収録され、当該語句Ｗに応じた付加文字列Ｕ2と第１動画Ｍ1とが第１シーンに対応付けられる。したがって、語句Ｗとは別個に付加文字列Ｕ2を利用者が指示する構成と比較して、利用者の作業の負荷を軽減することが可能である。また、第１実施形態では、利用者がコンテンツについて指示した趣旨および優位点に応じて使用テンプレートＴが選択されるから、利用者の意図に沿ったコンテンツを生成することが可能である。

＜第２実施形態＞
　本開示の第２実施形態を説明する。なお、以下の各例示において機能が第１実施形態と同様である要素については、第１実施形態の説明で使用した符号を流用して各々の詳細な説明を適宜に省略する。

　図１１は、第２実施形態の制御装置１１が使用テンプレートＴを選択する処理（Ｓa1）の手順を例示するフローチャートである。図１１に例示される通り、第２実施形態では、コンテンツの種別（Ｓb1，Ｓb2）とコンテンツの趣旨（Ｓb3，Ｓb4）と表現対象の優位点（Ｓb5，Ｓb6）との入力を利用者から受付けると、制御装置１１は所要時間τを特定する（Ｓe）。所要時間τは、複数の指示事項の各々を指示するために利用者が必要とした時間である。例えば、制御装置１１は、例えば画面Ｇa1の表示（Ｓb1）とともに計時を開始し、優位点の選択の指示を受付けた時点（Ｓb6：YES）までに経過した時間を所要時間τとして特定する。

　所要時間τを特定すると、制御装置１１は、各指示事項に関する利用者からの指示と当該所要時間τとに応じて使用テンプレートＴを選択する（Ｓb7）。具体的には、制御装置１１は、所要時間τが長いほど、複数のテンプレートＴのうち長時間のテンプレートＴを使用テンプレートＴとして選択する。

　所要時間τに応じた使用テンプレートＴの選択（Ｓe，Ｓb7）以外の動作は第１実施形態と同様である。したがって、第２実施形態においても第１実施形態と同様の効果が実現される。ところで、所要時間τが長い場合、コンテンツに関する複数の指示事項（コンテンツの種別および趣旨と表現対象の優位点）を利用者が充分に絞込めずに悩んでいる状態が想定される。第２実施形態では、所要時間τに応じた使用テンプレートＴが選択されるから、利用者の多様な意図を充分に盛込んだ好適なコンテンツを生成できるという利点がある。

＜第３実施形態＞
　第１実施形態では、複数の指示事項（コンテンツの種別および趣旨と表現対象の優位点）に関する利用者からの指示に応じて使用テンプレートＴを選択した。第３実施形態では、利用者が指示した語句Ｗに応じて使用テンプレートＴを選択する。

　図１２は、第３実施形態におけるテンプレートＴの模式図である。図１２に例示される通り、第３実施形態のテンプレートＴの属性データＸは、当該テンプレートＴに関連する語句を表す語句ベクトルＶを記憶する。各テンプレートＴに関連する語句は、当該テンプレートＴを使用したコンテンツにおいて利用者が視聴者に主張したいと推測される事項を表す単語または句であり、テンプレートＴの作成者が事前に設定する。語句ベクトルＶは、語句間の意味的な関係を表す言語空間（意味空間）における位置を表すベクトルである。語句ベクトルＶは、例えばニューラルネットワーク等の統計的推定モデル（Word2Vec）を利用した自然言語処理により特定される。統計的推定モデルの具体例については、例えばTomas Mikolov et al."Efficient Estimation of Word Representations in Vector Space," arXiv:1301.3781 [cs.CL], 2013に詳述されている。

　図１３は、第３実施形態の制御装置１１が実行する処理の具体的な手順を例示するフローチャートである。図１３に例示される通り、第３実施形態の制御装置１１は、図３のステップＳa1およびステップＳa2に代えてステップＳf1からステップＳf3を実行する。第３実施形態では、複数の指示事項に関する利用者からの指示に応じて使用テンプレートＴを選択する図４の処理は実行されない。

　図１３の処理を開始すると、制御装置１１は、図３のステップＳa2と同様に、２個の語句Ｗ（ＷaおよびＷb）の入力を利用者から受付ける（Ｓf1）。具体的には、制御装置１１は、各語句Ｗの入力欄を含む図６の画面Ｇb0を表示装置１４に表示させ、利用者による各語句Ｗの入力を受付ける。語句Ｗaおよび語句Ｗbの入力を利用者から受付けると、制御装置１１は、利用者が指示した語句Ｗaを解析することで語句ベクトルωを特定する（Ｓf2）。語句ベクトルωの特定には、前述の通り、例えばニューラルネットワーク等の統計的推定モデルを利用した自然言語処理が採用される。

　制御装置１１は、記憶装置１２に記憶された複数のテンプレートＴから語句Ｗaに応じた使用テンプレートＴを選択する（Ｓf3）。具体的には、制御装置１１は、複数のテンプレートＴの各々について、当該テンプレートＴの語句ベクトルＶと語句Ｗaの語句ベクトルωとの間の類似指標を算定する。類似指標は、語句ベクトルＶと語句ベクトルωとの類似度の指標（相関または距離）である。制御装置１１は、記憶装置１２に記憶された複数のテンプレートＴのうち、類似指標が表す類似度が最大（相関最大または距離最小）となるテンプレートＴを、使用テンプレートＴとして選択する。すなわち、利用者が指示した語句Ｗaに対して意味的な相関が高い語句が対応付けられたテンプレートＴが選択される。以上の説明から理解される通り、第３実施形態の制御装置１１は、利用者が指示した語句Ｗaに応じた使用テンプレートＴを選択する要素（選択処理部）として機能する。

　第３実施形態においても第１実施形態と同様の効果が実現される。また、第３実施形態では、利用者が指示した語句Ｗaに応じた使用テンプレートＴが選択されるから、利用者の意図に適合したテンプレートＴを利用して好適なコンテンツを生成できるという利点がある。なお、以上の説明では、複数の指示事項に関する利用者からの指示を使用テンプレートＴの選択に加味しない構成を例示したが、複数の指示事項に関する利用者からの指示と利用者が指示した語句Ｗaとの双方に応じて使用テンプレートＴを選択してもよい。

＜変形例＞
　以上に例示した各態様に付加される具体的な変形の態様を以下に例示する。以下の例示から任意に選択された複数の態様を、相互に矛盾しない範囲で適宜に併合してもよい。

（１）前述の各形態では、２個の語句Ｗ（ＷaおよびＷb）にそれぞれ対応する２個の動画Ｍ（ＭaおよびＭb）を第１収録処理により収録したが、利用者が指示する語句Ｗの総数および第１収録処理により収録される動画Ｍの総数は、以上の例示に限定されない。例えば、３個以上の語句Ｗの入力を利用者から受付け、各語句Ｗに対応する３個以上の動画Ｍを第１収録処理により収録してもよい。

（２）前述の各形態では、複数の動画Ｍ（ＭaおよびＭb）のうち１個の動画Ｍを利用者が選択したが、利用者が複数の動画Ｍの何れかを択一的に選択することは必須ではない。例えば、複数の動画Ｍの各々について利用者が優先度を設定し、優先度が第１位（すなわち最大）である動画Ｍを第１動画Ｍ1として第１シーンに対応付けてもよい。複数の動画Ｍのうち優先度が第２位である動画Ｍを第２動画Ｍ2として第２シーンに対応付けてもよい。

（３）前述の各形態では、利用者が選択した第１動画Ｍ1を第１シーンに対応付け、非選択の第２動画Ｍ2を第２シーンに対応付けたが、非選択の第２動画Ｍ2を破棄してもよい。すなわち、第２動画Ｍ2を第２シーンに対応付ける処理は省略される。

（４）第３実施形態では、利用者が指示した２個の語句Ｗ（ＷaおよびＷb）のうち語句Ｗaに応じて使用テンプレートＴを選択したが、制御装置１１が、語句Ｗbに応じて使用テンプレートＴを選択してもよい。また、制御装置１１が、語句Ｗaおよび語句Ｗbの双方に応じた使用テンプレートＴを選択してもよい。例えば、制御装置１１は、語句Ｗaに対応する語句ベクトルと語句Ｗbに対応する語句ベクトルとの中間的な語句ベクトルωを生成する。そして、制御装置１１は、複数のテンプレートＴのうち語句ベクトルωに類似する語句ベクトルＶが対応付けられたテンプレートＴを、使用テンプレートＴとして選択する。

（５）前述の各形態では、第１動画Ｍ1に対応する語句Ｗと属性データＸが示す優位点Ｘ3とに応じて案内文字列Ｕ1および付加文字列Ｕ2を生成したが、生成後の案内文字列Ｕ1および付加文字列Ｕ2を利用者からの指示に応じて変更してもよい。また、編集装置３００が情報処理装置１００から受信した素材データについて、編集装置３００が、当該素材データの送信元の情報処理装置１００または他の情報端末からの指示に応じて案内文字列Ｕ1および付加文字列Ｕ2を変更してもよい。

（６）前述の各形態では、初期的な付加文字列Ｕ2に語句Ｗと優位点Ｘ3とを挿入することで更新後の付加文字列Ｕ2を生成したが、語句Ｗおよび優位点Ｘ3の一方のみを初期的な付加文字列Ｕ2に挿入してもよい。また、前述の各形態では、初期的な案内文字列Ｕ1に語句Ｗと優位点Ｘ3とを挿入することで更新後の案内文字列Ｕ1を生成したが、語句Ｗおよび優位点Ｘ3の一方のみを初期的な案内文字列Ｕ1に挿入してもよい。

（７）編集装置３００が、情報処理装置１００から受信した素材データ内の動画Ｍを、当該情報処理装置１００または他の情報端末からの指示に応じて編集してもよい。また、編集装置３００が、情報処理装置１００から受信した素材データ内の動画Ｍを、当該情報処理装置１００または他の情報端末から送信された動画に置換してもよい。

（８）前述の各形態に係る情報処理装置１００の機能は、各形態での例示の通り、制御装置１１等の処理回路とプログラムとの協働により実現される。前述の各形態に係るプログラムは、コンピュータが読取可能な記録媒体に格納された形態で提供されてコンピュータにインストールされ得る。記録媒体は、例えば非一過性（non-transitory）の記録媒体であり、ＣＤ-ＲＯＭ等の光学式記録媒体（光ディスク）が好例であるが、半導体記録媒体または磁気記録媒体等の公知の任意の形式の記録媒体も包含される。なお、非一過性の記録媒体とは、一過性の伝搬信号（transitory, propagating signal）を除く任意の記録媒体を含み、揮発性の記録媒体も除外されない。また、通信網を介した配信の形態でプログラムをコンピュータに提供してもよい。

＜付記＞
　以上に例示した形態から、例えば以下の構成が把握される。

　本開示のひとつの態様（第１態様）に係る情報処理方法は、収録装置により複数の動画を収録する第１収録処理を実行し、前記複数の動画のうち第１動画の選択の指示を利用者から受付け、テンプレートに含まれる複数のシーンのうちの第１シーンに前記第１動画を対応付け、前記複数のシーンのうち前記第１シーン以外のシーンに対応する動画を前記収録装置により収録する第２収録処理を実行する。以上の態様では、複数の動画のうち利用者が選択した第１動画がテンプレートの第１シーンに対応付けられたうえで、第１シーン以外のシーンに対応する動画が第２収録処理において収録装置により収録される。したがって、利用者は、第１シーンに対応する第１動画を適宜に確認しながら、収録装置により第１シーン以外のシーンに対応する動画を撮影できる。なお、「第１シーン以外のシーン」は、複数のシーンのうち第１シーン以外の全部のシーンには限定されず、第１シーン以外の一部のシーンでもよい。

　第１態様の具体例（第２態様）において、複数の語句の入力を利用者から受付け、前記第１収録処理においては、前記複数の語句にそれぞれ対応する前記複数の動画を前記収録装置により収録し、前記第１動画に合成される付加文字列を、前記第１動画に対応する語句に応じて生成し、前記第１動画と前記付加文字列とを前記第１シーンに対応付ける。以上の態様では、利用者から受付けた語句に対応する複数の動画が収録装置により収録され、当該語句に応じた付加文字列と第１動画とが第１シーンに対応付けられる。したがって、当該語句とは別個に付加文字列を利用者が指示する構成と比較して、利用者の作業の負荷を軽減することが可能である。

　第１態様の具体例（第３態様）において、利用者からの指示に応じて前記複数の動画から前記第１動画以外の第２動画を選択し、前記複数のシーンのうち前記第１シーン以外の第２シーンに前記第２動画を対応付ける。以上の態様によれば、利用者は、第１動画および第２動画を参照しながら、第１シーンおよび第２シーン以外のシーンに対応する動画を収録装置により撮影できる。

　第１態様から第３態様の何れかの具体例（第４態様）において、前記テンプレートを使用して生成されるコンテンツの趣旨の入力を利用者から受付け、前記コンテンツで表現される対象に関する優位点の入力を利用者から受付け、前記コンテンツの趣旨と前記対象に関する優位点とに応じて前記テンプレートを選択する。以上の態様によれば、コンテンツの趣旨とコンテンツで表現される対象に関する優位点とに応じてテンプレートが選択されるから、利用者の意図に沿ったコンテンツを生成することが可能である。

　第４態様の具体例（第５態様）において、テンプレートの選択においては、前記コンテンツの趣旨と前記対象に関する優位点とを含む１以上の項目について利用者が選択肢を選択するための所要時間が長いほど、前記複数のテンプレートのうち長時間のテンプレートを選択する。利用者が各項目について選択肢を選択するための所要時間が長い場合、各項目を利用者が充分に絞込めずに悩んでいる状態が想定される。第５態様によれば、所要時間が長いほど長時間のテンプレートが選択されるから、利用者の多様な意図を充分に盛込んだ好適なコンテンツを生成できるという利点がある。

　第２態様の具体例（第６態様）において、前記複数の語句のうち１個以上の語句に応じて複数のテンプレートから前記テンプレートを選択する。以上の態様によれば、利用者の意図に適合したテンプレートを選択できるという利点がある。

　本開示のひとつの態様（第７態様）に係る情報処理装置は、収録装置により複数の動画を収録する第１収録処理部と、前記複数の動画のうち第１動画の選択の指示を利用者から受付ける選択受付部と、テンプレートに含まれる複数のシーンのうちの第１シーンに前記第１動画を対応付ける動画対応部と、前記複数のシーンのうち前記第１シーン以外のシーンに対応する動画を前記収録装置により収録する第２収録処理部とを具備する。

　本開示のひとつの態様（第８態様）に係るプログラムは、収録装置により複数の動画を収録する第１収録処理部、前記複数の動画のうち第１動画の選択の指示を利用者から受付ける選択受付部、テンプレートに含まれる複数のシーンのうちの第１シーンに前記第１動画を対応付ける動画対応部、および、前記複数のシーンのうち前記第１シーン以外のシーンに対応する動画を前記収録装置により収録する第２収録処理部としてコンピュータを機能させる。

＜他の態様＞
　特開２０１５－１１５７１８号公報には、複数のテンプレートのうち利用者が選択したテンプレートを利用してシーン毎の動画を撮影し、複数の動画を統合することで映像作品を作成する技術が開示されている。しかし、動画の撮影または編集に関する専門的な知識がない利用者にとって、複数のテンプレートから自身の意図に沿った適切なテンプレートを選択することは、実際には容易ではない。

　以上の事情を考慮して、本開示のひとつの態様に係る情報処理方法は、利用者から語句の入力を受付け、複数のテンプレートのうち前記語句に対応するテンプレートと選択し、前記テンプレートに含まれる複数のシーンの各々に対応する動画を収録装置により収録する。以上の態様によれば、利用者から受付けた語句に対応するテンプレートが選択されるから、動画の撮影または編集に関する専門的な知識がない利用者でも、自身の意図に沿った適切なテンプレートを利用して動画を撮影できるという利点がある。

１００…情報提供装置、１１…制御装置、１２…記憶装置、１３…通信装置、１４…表示装置、１５…入力装置、１６…収録装置、２００…通信網、３００…編集装置。

Claims

　収録装置により複数の動画を収録する第１収録処理を実行し、
　前記複数の動画のうち第１動画の選択の指示を利用者から受付け、
　テンプレートに含まれる複数のシーンのうちの第１シーンに前記第１動画を対応付け、
　前記複数のシーンのうち前記第１シーン以外のシーンに対応する動画を前記収録装置により収録する第２収録処理を実行する
　コンピュータにより実現される情報処理方法。
　複数の語句の入力を前記利用者から受付け、
　前記第１収録処理においては、前記複数の語句にそれぞれ対応する前記複数の動画を前記収録装置により収録し、
　前記第１動画に合成される付加文字列を、前記第１動画に対応する語句に応じて生成し、
　前記第１動画と前記付加文字列とを前記第１シーンに対応付ける
　請求項１の情報処理方法。
　前記利用者からの指示に応じて前記複数の動画から前記第１動画以外の第２動画を選択し、
　前記複数のシーンのうち前記第１シーン以外の第２シーンに前記第２動画を対応付ける
　請求項１の情報処理方法。
　前記テンプレートを使用して生成されるコンテンツの趣旨の入力を前記利用者から受付け、
　前記コンテンツで表現される対象に関する優位点の入力を前記利用者から受付け、
　前記コンテンツの趣旨と前記対象に関する優位点とに応じて前記テンプレートを選択する
　請求項１から請求項３の何れかの情報処理方法。
　前記テンプレートの選択においては、前記コンテンツの趣旨と前記対象に関する優位点とを含む１以上の項目について前記利用者が選択肢を選択するための所要時間が長いほど、複数のテンプレートのうち長時間のテンプレートを選択する
　請求項４の情報処理方法。
　前記複数の語句のうち１個以上の語句に応じて複数のテンプレートから前記テンプレートを選択する
　請求項２の情報処理方法。
　収録装置により複数の動画を収録する第１収録処理部と、
　前記複数の動画のうち第１動画の選択の指示を利用者から受付ける選択受付部と、
　テンプレートに含まれる複数のシーンのうちの第１シーンに前記第１動画を対応付ける動画対応部と、
　前記複数のシーンのうち前記第１シーン以外のシーンに対応する動画を前記収録装置により収録する第２収録処理部と
　を具備する情報処理装置。
　収録装置により複数の動画を収録する第１収録処理部、
　前記複数の動画のうち第１動画の選択の指示を利用者から受付ける選択受付部、
　テンプレートに含まれる複数のシーンのうちの第１シーンに前記第１動画を対応付ける動画対応部、および、
　前記複数のシーンのうち前記第１シーン以外のシーンに対応する動画を前記収録装置により収録する第２収録処理部
　としてコンピュータを機能させるプログラム。