WO2022102186A1

WO2022102186A1 - 情報処理装置、情報処理方法、情報処理プログラム

Info

Publication number: WO2022102186A1
Application number: PCT/JP2021/029539
Authority: WO
Inventors: 啓舘野; 将大吉田; 拓麻宇田川
Original assignee: ソニーグループ株式会社
Priority date: 2020-11-13
Filing date: 2021-08-10
Publication date: 2022-05-19
Also published as: JPWO2022102186A1; US20240015370A1; EP4246422A4; EP4246422A1

Abstract

コンテンツの制作者に対してコンテンツ制作の参考になる適切なコンテンツを提示することができる情報処理装置、情報処理方法、情報処理プログラムを提供する。　入力情報と、消費者がコンテンツを消費した際の状態を示す状態情報とに基づいて新コンテンツを生成するコンテンツ生成部と、新コンテンツと既存コンテンツのいずれか一方または両方からコンテンツの制作者に提示される提示コンテンツを決定する提示コンテンツ決定部とを備える情報処理装置である。

Description

情報処理装置、情報処理方法、情報処理プログラム

　本技術は、情報処理装置、情報処理方法、情報処理プログラムに関する。

　従来からインターネット上には、ニュースや映画、テレビ番組、音楽、小説、漫画、イラストなどの多種多用なコンテンツが公開されており、消費者がそれらのコンテンツを消費する機会が増加している。近年、グローバルなコンテンツ配信サービスが普及し、コンテンツの需要が増加し、さらにコンテンツを消費する消費者も増えたことにより、多様な消費者の好みに対応したコンテンツを制作することが重要になっている。

　しかし、現状、コンテンツの制作者はそのような需要の拡大やプラットフォームの拡大には追いついているとは言い難い。また、コンテンツ制作者と協調して、特定の消費者集合に対応したコンテンツを効率的に制作するための技術は提案されていない。コンテンツの制作については、任意のコンテンツから消費者の好みに応じたダイジェストを生成する技術が提案されている（特許文献１）。

特開２０１２－３９５５０号公報

　しかし、特許文献１に記載の技術はあくまでコンテンツのダイジェストを生成するものであり、様々な消費者の好みに応じたコンテンツを生成したり、コンテンツの制作者が消費者の好みに応じたコンテンツを生成することをアシストするものではない。コンテンツの制作者が需要の拡大やプラットフォームの拡大には追いついているとは言い難い現状においては、コンテンツの制作者が効率よくコンテンツを制作できるように情報を提示する技術が必要である。

　本技術はこのような点に鑑みなされたものであり、コンテンツの制作者に対してコンテンツ制作の参考になる適切なコンテンツを提示することができる情報処理装置、情報処理方法、情報処理プログラムを提供することを目的とする。

　上述した課題を解決するために、第１の技術は、入力情報と、消費者がコンテンツを消費した際の状態を示す状態情報とに基づいて新コンテンツを生成するコンテンツ生成部と、新コンテンツと既存コンテンツのいずれか一方または両方からコンテンツの制作者に提示される提示コンテンツを決定する提示コンテンツ決定部とを備える情報処理装置である。

　また、第２の技術は、入力情報と、消費者がコンテンツを消費した際の状態を示す状態情報とに基づいて新コンテンツを生成し、新コンテンツと既存コンテンツのいずれか一方または両方の中からコンテンツの制作者に提示される提示コンテンツを決定する情報処理方法である。

　さらに、第３の技術は、入力情報と、消費者がコンテンツを消費した際の状態を示す状態情報とに基づいて新コンテンツを生成し、新コンテンツと既存コンテンツのいずれか一方または両方の中からコンテンツの制作者に提示される提示コンテンツを決定する情報処理方法をコンピュータに実行させる情報処理プログラムである。

情報処理装置１００の構成を示すブロック図である。第１の実施の形態にかかる情報処理装置１００の処理ブロックを示すブロック図である。消費者状態情報の説明図である。情報処理装置１００による処理を示すフローチャートである。ＧＡＮを用いたコンテンツ生成の説明図である。ＶＡＥとＭＦを用いたコンテンツ生成の第１の方法の説明図である。ＶＡＥとＭＦを用いたコンテンツ生成の第２の方法の説明図である。提示コンテンツの決定処理を示すフローチャートである。入力用ユーザインターフェースの例を示す図である。入力用ユーザインターフェースの例を示す図である。入力用ユーザインターフェースの例を示す図である。入力用ユーザインターフェースの例を示す図である。入力用ユーザインターフェースの例を示す図である。提示用ユーザインターフェースの例を示す図である。提示用ユーザインターフェースの例を示す図である。提示用ユーザインターフェースの例を示す図である。第２の実施の形態にかかる情報処理装置２００の処理ブロックを示すブロック図である。コンテンツの時間と消費者の感情の関係を示すグラフである。消費者の感情情報を用いたコンテンツ生成用ユーザインターフェースの例を示す図である。

　以下、本技術の実施の形態について図面を参照しながら説明する。なお、説明は以下の順序で行う。
＜１．第１の実施の形態＞
［１－１．情報処理装置１００の構成］
［１－２．情報処理装置１００による処理］
［１－３．ユーザインターフェースの具体例］
＜２．第２の実施の形態＞
［２－１．情報処理装置２００の構成］
［２－２．消費者の感情情報を用いたコンテンツ生成］
＜３．変形例＞

＜１．実施の形態＞
［１－１．情報処理装置１００の構成］
　まず図１を参照して情報処理装置１００の構成について説明する。情報処理装置１００は制御部１０１、記憶部１０２、インターフェース１０３、入力部１０４、表示部１０５を備えて構成されている。

　制御部１０１は、ＣＰＵ（Central Processing Unit）、ＲＡＭ（Random Access Memory）およびＲＯＭ（Read Only Memory）などから構成されている。ＣＰＵがＲＯＭに記憶されたプログラムに従い様々な処理を実行してコマンドの発行を行うことによって情報処理装置１００の全体および各部の制御を行う。

　記憶部１０２は、例えば、ハードディスク、フラッシュメモリなどの大容量記憶媒体である。

　インターフェース１０３は状態情報取得装置５００や他の装置、さらにインターネットなどとの間のインターフェースである。インターフェース１０３は、有線または無線の通信インターフェースを含みうる。また、より具体的には、有線または無線の通信インターフェースは、３ＴＴＥなどのセルラー通信、Wi-Fi、Bluetooth（登録商標）、ＮＦＣ、イーサネット（登録商標）、ＳＤＩ（Serial Digital Interface）、ＨＤＭＩ（登録商標）、ＵＳＢ（Universal Serial Bus）、４Ｇ（第４世代移動通信システム）、５Ｇ（第５世代移動通信システム）などを含みうる。また、情報処理装置１００と他の装置がハードウェア的に接続される場合、インターフェース１０３は、装置間の接続端子や、装置内のバスなどを含みうる。また、情報処理装置１００が複数の装置に分散して実現される場合、インターフェース１０３は、それぞれの装置のための異なる種類のインターフェースを含みうる。例えば、インターフェース１０３は、通信インターフェースと装置内のインターフェースとの両方を含んでもよい。

　入力部１０４は情報処理装置１００に対して各種指示など行うためのものである。入力部１０４に対してユーザから入力がなされると、その入力に応じた制御信号が生成されて制御部１０１に供給される。そして、制御部１０１はその制御信号に対応した各種処理を行う。入力部１０４としては各種ボタン、タッチパネル、表示部１０５としてのディスプレイと一体に構成されたタッチスクリーンなどがある。

　表示部１０５は、コンテンツ、ＧＵＩ（Graphical User Interface）などを表示するものである。表示部１０５としては、例えば、ＬＣＤ（Liquid Crystal Display）、有機ＥＬパネルなどにより構成されたものがある。

　情報処理装置１００は例えば、パーソナルコンピュータ、スマートフォン、タブレット端末、サーバ装置などにより構成される。

　図２を参照して情報処理装置１００の処理ブロックの構成について説明する。情報処理装置１００は、消費者状態情報保存部１１１、消費者特徴情報保存部１１２、コンテンツデータベース１１３、変換処理部１１４、新コンテンツ生成用情報保存部１１５、コンテンツ生成部１１６、提示コンテンツ決定部１１７を備えて構成されている。

　消費者状態情報保存部１１１、消費者特徴情報保存部１１２、コンテンツデータベース１１３、新コンテンツ生成用情報保存部１１５は記憶部１０２において実現される機能であり、各保存部においてデータや情報を記憶する指示や制御は制御部１０１により行われる。また、変換処理部１１４、コンテンツ生成部１１６、提示コンテンツ決定部１１７は制御部１０１における処理により実現される機能である。

　コンテンツとは、映画、テレビ番組、映像、音楽、音声、文芸、写真、漫画、アニメーション、イラスト、コンピュータゲーム、プログラム、文字列など、人間の創造的活動により生み出され、教養又は娯楽の範囲に属するものである。

　コンテンツの消費とは、映画やテレビ番組などの映像コンテンツであれば視聴すること、イラストや写真などの画像コンテンツであれば見ること、音楽などの音声コンテンツであれば聴くこと、文字のコンテンツであれば読むことなど、各種コンテンツごとの様々な利用形態を含むものである。消費者とはそのようなコンテンツの消費を行う者である。

　制作者とはコンテンツを制作する者であり、具体的には、映画監督、テレビ番組のプロデューサー、映像作家、音楽家、作家、写真家、漫画家、アニメーター、イラストレーター、ゲームクリエイター、プログラマーなどである。制作者は個人の場合もあれば制作会社などの組織の場合もあり、本技術はいずれかに限定されるものではない。

　本実施の形態ではコンテンツ配信サービスにおける配信によりコンテンツが消費者に提供されるものとする。配信とはインターネットなどネットワークにおけるデータの送信によりコンテンツを提供することである。コンテンツの提供方法は、データのダウンロード、ストリーミングなど消費者がコンテンツを消費することができればどのような方法でもよい。

　消費者状態情報保存部１１１は、状態情報取得装置５００により取得される、消費者のコンテンツ配信サービスに対する行動や、コンテンツ消費時における消費者の行動や反応など、消費したコンテンツに対する消費者の状態を示す消費者状態情報を保存するものである。

　コンテンツ配信サービスに対する消費者の行動としては、例えば、消費したコンテンツのタイトルや種類やジャンル、コンテンツの詳細ページの閲覧の有無、お気に入りやウォッチリストの登録内容、等がある。

　コンテンツ消費時における消費者の行動や反応としては、例えば、コンテンツの視聴完了、コンテンツの再生を停止（一時停止含む）する、「いいね」や「Like」の入力、コンテンツの再生を早送りする、コンテンツを変える、笑顔になる、顔をそむける、視線をそらす、目をつむる、手を叩く、手で顔を覆う、特定の文言を発する（面白い、好き、嫌い、気持ち悪いなど）、大声を出す、移動する、などがある。

　消費者状態情報にはコンテンツ消費時における消費者の発汗量、体温、心拍数などの生体情報を含めてもよい。

　また、消費者状態情報に含まれる情報としては、消費者のコンテンツ詳細ページの閲覧履歴、消費者のコンテンツ購入履歴、消費者が入力した「いいね」や「Like」などから総合的に取得できる既存コンテンツに対する評価である消費者評価情報もある。

　状態情報取得装置５００としては、消費者がコンテンツの消費に使用するウェブブラウザ、コンテンツ配信サービスにおけるユーザインターフェース（ブラウザ上のアプリケーションやパーソナルコンピュータなどで動作するアプリケーションなど）などがある。また、カメラ、赤外線カメラ、赤外線センサ、マイクなど映像、画像、音声で消費者状態情報を取得できるデバイスもある。さらに、発汗センサや温度センサや心拍センサなどの各種生体センサもある。

　状態情報取得装置５００は情報処理装置１００やコンテンツ再生装置が備えていてもよいし、それらとは別の装置が備えていてもよいし、独立した装置として構成されてもよい。状態情報取得装置５００が情報処理装置１００と別体の装置として構成されている場合、情報処理装置１００は、状態情報取得装置５００が取得した状態情報をネットワークとインターフェース１０３を介して受信する。

　消費者状態情報は例えば図３に示すように、消費者集合を構成する個々の消費者を識別するためのユーザＩＤ、消費者が消費したコンテンツを識別するためのコンテンツＩＤ、それらの情報を取得した日時、コンテンツに対する消費者の状態が対応付られて構成される。

　消費者特徴情報保存部１１２は消費者特徴情報を保存するものである。消費者特徴情報として消費者の年齢、性別、国籍、住所、好みのコンテンツのジャンルなどがある。消費者特徴情報は、例えば、消費者がコンテンツ配信サービスにユーザ登録した際の入力内容などから取得することができる。

　さらに、消費者特徴情報としては、複数の消費者からなる消費者集合の行動ログなどから抽出したコンテンツの購入や消費頻度などの統計情報などもある。消費者集合は例えばコンテンツ配信サービスにおける全ての登録ユーザや、その登録ユーザにおいて特定の既存コンテンツを購入した全ての消費者などである。

　コンテンツデータベース１１３は、市場に流通しており、消費者がコンテンツ配信サービスを介して提供を受けることが可能なコンテンツである既存コンテンツを保存するものである。なお、コンテンツデータベース１１３は必ずしも情報処理装置１００が備えている必要はなく、外部のサーバなどにおいて構築され、情報処理装置１００がそれにアクセスすることで既存コンテンツを取得できるようにしてもよい。

　変換処理部１１４には制作者によって情報処理装置１００に入力された入力情報が供給される。変換処理部１１４は入力情報を新コンテンツ生成用情報に変換する処理を行う。変換処理の詳細は後述する。

　入力情報とは、制作者により入力される新コンテンツ生成のための情報であり、入力コンテンツ、入力キーワードなどを含むものである。新コンテンツ生成用情報はコンテンツ生成部１１６によるコンテンツ生成に用いられる情報である。新コンテンツ生成用情報は生成されると新コンテンツ生成用情報保存部１１５に保存される。

　入力コンテンツとは、コンテンツ生成部１１６による新コンテンツ生成の条件や要素として制作者により入力されたコンテンツである。制作者は入力コンテンツとして市場に流通していて消費者が利用可能な既存コンテンツ、制作者または制作会社が過去に制作した既存コンテンツなどを入力コンテンツとして入力することができる。入力コンテンツは完成した１つのコンテンツだけではなく、コンテンツを構成するコンテンツの一部分（コンテンツのパーツ）でもよい。例えば、入力コンテンツは静止画像、映像、絵コンテ、ＣＧ（Computer Graphic）画像、シナリオ、画像やテキストで表現された登場人物の属性や容姿、メロディ、歌詞、文章などであってもよい。

　制作者による入力コンテンツの入力は、情報処理装置１００がコンテンツデータベース１１３に保存されている既存コンテンツを制作者に提示して、制作者がその中から入力コンテンツとするコンテンツを選択することで行うことができる。また、制作者がコンテンツのデータを情報処理装置１００に入力することで入力コンテンツの入力を行ってもよい。

　入力キーワードとは、コンテンツ生成部１１６による新コンテンツ生成の条件や要素として制作者により入力されるキーワードである。入力キーワードは新コンテンツの内容、コンセプトなどを表すキーワードであるともいえる。

　制作者による入力キーワードの入力は、情報処理装置１００が予めテンプレートとして用意している複数のキーワードを制作者に提示して、制作者がその中から入力キーワードとするキーワードを選択することで行うことができる。また、制作者がキーワードとしての文字列として直接入力することで入力キーワードの入力を行ってもよい。

　なお、制作者が入力する入力情報は一つに限られず、複数でもよく、その数に制限はない。また、制作者は入力コンテンツと入力キーワードの両方を入力することもできる。

　コンテンツ生成部１１６は、入力情報から生成された新コンテンツ生成用情報、消費者状態情報、消費者特徴情報、消費者評価情報などに基づいて新コンテンツを生成する。コンテンツ生成部１１６は一つのコンテンツを生成するだけでなく、複数のコンテンツを生成することもできる。また、コンテンツ生成部１１６が生成する新コンテンツの種類は入力コンテンツの種類や入力キーワードによって限定されるものではなく、コンテンツとして消費者が消費することができるものであればどのようなものでもよい。

　提示コンテンツ決定部１１７は、コンテンツ生成部１１６が生成した新コンテンツと、コンテンツデータベース１１３に保存されている複数の既存コンテンツのいずれか一方または両方の中から制作者に提示するコンテンツである提示コンテンツを決定する。提示コンテンツは制作者によるコンテンツ制作のアイデア、ヒントなどとして制作に提示されるものである。決定された提示コンテンツは提示コンテンツ情報として出力され、表示部１０５等において表示されて制作者に提示される。

　情報処理装置１００は以上のようにして構成されている。情報処理装置１００はその機能を有するハードウェアによる専用の装置として構成されてもよい。また、情報処理装置１００は専用の装置として構成されるのみでなく、プログラムにより構成され、そのプログラムの実行により電子機器が情報処理装置１００として機能を備えるようにしてもよい。そのプログラムは予め電子機器にインストールされていてもよいし、ダウンロードや記憶媒体などで配布されて、消費者が自ら電子機器にインストールするようにしてもよい。

　コンテンツ配信サービス事業者がコンテンツの制作を行う場合、情報処理装置１００はコンテンツ配信サービス事業者の電子機器において動作する。また、制作者がコンテンツの制作を行い、コンテンツ配信サービス事業者がそのコンテンツの配信を行う場合、例えば、変換処理部１１４、新コンテンツ生成用情報保存部１１５、コンテンツ生成部１１６、提示コンテンツ決定部１１７は制作者の電子機器において動作し、消費者状態情報保存部１１１、消費者特徴情報保存部１１２、コンテンツデータベース１１３はコンテンツ配信サービス事業者の電子機器において動作する。

［１－２．情報処理装置１００による処理］
　次に情報処理装置１００による処理を図４のフローチャートを参照して説明する。なお、予め消費者特徴情報は消費者特徴情報保存部１１２に保存されているものとする。

　まずステップＳ１０１で、情報処理装置１００は状態情報取得装置５００から消費者状態情報を取得して消費者状態情報保存部１１１に保存する。なお、情報処理装置１００はコンテンツ生成時、提示コンテンツ決定時に限らず、常時状態情報取得装置５００から消費者状態情報を取得して消費者状態情報保存部１１１に保存して消費者状態情報を蓄積している。

　次にステップＳ１０２で、情報処理装置１００は制作者から入力情報の入力を受け付ける。

　次にステップＳ１０３で、変換処理部１１４が変換処理により入力情報を新コンテンツ生成用情報に変換する。変換処理部１１４による変換処理は入力情報からの情報の抽出とモデル化により行う。

　モデルとしては、例えばトピックモデルやニューラルネットワーク、Factorization Machinesなどを用いることができる。例えばトピックモデルを用いる場合、入力情報としての１つのコンテンツを１つの文書とみなし、入力情報に含まれるキーワードなどを単語とみなし、ＬＤＡ（Latent Dirichlet Allocation）などによって入力情報をトピックベクトルに圧縮する。そのようなテキスト情報である入力情報をＬＤＡで処理する場合、前処理として入力情報を単語もしくは単語の集合に分解してトピックベクトルにする。このとき、消費者のフィードバック（評価値など）を活用し、消費者の評価に寄与するようなトピックを抽出するために、Supervised topic modelなどを利用してもよい。入力情報がシナリオ、設定文、文章、キーワード等のテキスト情報である場合は、例えばＬＳＴＭ（Long Short Term Memory）やTransformerなどのニューラルネットワークのモデルでベクトル化する。入力情報が画像である場合は情報の抽出を行わずに、例えばＶＡＥ（Variational Auto Encoder）などで適宜圧縮し、ベクトル（あるいはテンソル）として扱えるように変換する。

　入力情報からの情報の抽出は、例えば、入力情報としてのコンテンツに関しては上述した各種モデルでベクトル化した各コンテンツのトピックベクトルの平均値を取るなどの方法により行うことができる。あるいは、モデルとしてトピックモデルを用いるとして、入力情報の特徴量と、制作者が入力コンテンツとは別に選択した入力キーワードをまとめて１つの文書とみなし、学習済みのモデルを利用して同様のトピックベクトルに変換してそれを新コンテンツ生成用情報としてもよい。また、必ずしも制作者により入力された各種の入力情報をひとまとめにしなくても、入力情報としてのコンテンツやキーワードをそのまま後述する「提示コンテンツの選択」における提示コンテンツの選択やソートのための入力情報として利用してもよい。

　変換処理部１１４は、入力情報に他の処理を施さずにベクトル化する場合もあれば、入力情報から情報を抽出してその抽出した情報をベクトル化する場合もある。

　次にステップＳ１０４で、コンテンツ生成部１１６が新コンテンツを生成する。新コンテンツの生成は図５に示すように、例えばConditional GAN（Generative Adversarial Network）を利用して行うことができる。Conditional GANにおける生成器（Generator）に対する入力は、ノイズ、新コンテンツ生成用情報、消費者状態情報および消費者特徴情報、消費者状態情報に含まれる消費者評価情報である。

　新コンテンツ生成用情報は変換処理部１１４により変換されたもので固定である。

　消費者特徴情報は、新コンテンツ生成用情報を生成するために用いられた入力情報に関連する消費者（例えば入力コンテンツを購入・評価している消費者や入力キーワードでコンテンツを検索・購入した消費者）についての消費者特徴情報である。コンテンツ生成部１１６はその消費者特徴情報を消費者特徴情報保存部１１２から読み出して新コンテンツ生成に使用する。

　消費者評価情報は、例えば、新コンテンツ生成用情報を生成するために用いられた入力情報に関連する消費者（上記と同様）の既存コンテンツに対する評価情報である。コンテンツ生成部１１６はその消費者評価情報を消費者状態情報保存部１１１から読み出して新コンテンツ生成に使用する。

　Conditional GANにおける分類器（Discriminator）に対する入力は、新コンテンツ生成用情報、消費者状態情報および消費者特徴情報、消費者状態情報に含まれる消費者評価情報、新コンテンツ生成用情報を生成するために利用された入力情報に関連するコンテンツ、コンテンツそのものである。「コンテンツそのもの」とは、生成器によって生成されたコンテンツ（図５中のgenerated content）、または、既存コンテンツ（生成器から吐き出されたものではなく実在するコンテンツ）の中の任意のコンテンツ（図５中のreal content）である。分類器は「コンテンツそのもの」と、その他の情報（新コンテンツ生成用情報、消費者状態情報および消費者特徴情報、消費者状態情報に含まれる消費者評価情報）を合わせて既存コンテンツか生成されたコンテンツかを分類する。よって、既存コンテンツに関しては原則ランダムに選択される。

　新コンテンツ生成用情報を生成するために利用された入力情報に関連するコンテンツとは、新コンテンツ生成用情報の抽出元に直接含まれるコンテンツ、あるいは入力キーワードなどである。

　消費者特徴情報と消費者評価情報は、新コンテンツ生成用情報を生成するために利用された入力情報に関連するコンテンツを評価している消費者の消費者特徴情報とその消費者評価情報である。

　なお、生成器Ｇは必ずしも入力が必要なわけではなく、例えば通常のGANなどで生成し、次のステップで各種の観点でフィルタリングやソートを行ってもよい。

　また、新コンテンツの生成はＶＡＥ（Variational Autoencoder）とＭＦ（Matrix Factorization）を利用して行うこともできる。図６を参照してＶＡＥとＭＦを用いた新コンテンツの生成の第１の手法について説明する。

　ＶＡＥとＭＦを用いた新コンテンツの生成は学習段階と生成段階とに分けられる。図６Ａは新コンテンツの生成の第１の手法における学習段階を示したものである。学習段階では、第１エンコーダＥｍ、第２エンコーダＥｕ、特徴空間、デコーダＤｍ、予測器ｆｒで処理を行う。

　学習段階では第１エンコーダＥｍに新コンテンツ生成用情報が入力される。さらに、第２エンコーダＥｕには消費者状態情報および消費者特徴情報が入力される。説明の便宜上、消費者状態情報と消費者特徴情報をまとめて消費者情報とする。

　そして、新コンテンツ生成用情報および消費者情報を特徴空間上にマッピングし、デコーダＤｍを通してその特徴空間における特徴点からコンテンツを生成する。これにＭＦを応用することで消費者の評価を反映した特徴空間を作ることができる。

　具体的には図６Ａに示すように、新コンテンツ生成用情報を第１エンコーダＥｍでベクトル化（ベクトル化したものをコンテンツベクトルと称する。）し、消費者情報を第２エンコーダＥｕでベクトル化する（ベクトル化したものを消費者ベクトルと称する。）。さらに、ＭＦを用いた予測器f_rを用いて新コンテンツ生成用情報と変換された入力コンテンツに対する消費者の評価を予測する。予測器ｆｒは、新コンテンツ生成用情報をベクトル化したコンテンツベクトルと、消費者情報をベクトル化した消費者ベクトルに基づいて新コンテンツ生成用情報となった入力コンテンツに対する消費者の評価を予測するものである。

　消費者ベクトルとコンテンツベクトルの距離が評価器ｆｒに入る。消費者が新コンテンツ生成用情報としての入力コンテンツを高く評価していればしているほど特徴空間上において消費者ベクトルとコンテンツベクトルの距離が近くなるように学習される。そうすることで、消費者とその消費者が高く評価した入力コンテンツは特徴空間上での距離が短くなるようにマッピングされる。

　図６ＢはＶＡＥを用いた新コンテンツの生成の生成段階を示したものである。生成段階では、学習段階で形成された特徴空間およびデコーダＤｍで処理を行う。新コンテンツ生成時には、特徴空間上でターゲットとなる消費者群が集まった領域の点からデコーダＤｍが新コンテンツを生成することによって、狙った消費者層から高評価が得られやすい新コンテンツを生成することができる。

　次に図７を参照してＶＡＥとＭＦを用いた新コンテンツの生成の第２の手法について説明する。上述の第１の手法では任意の条件に応じた新コンテンツを生成することができない。任意の条件とは例えば新コンテンツのジャンルや、新コンテンツ内に登場するキャラクターなどである。そこで第２の手法では、任意の条件に応じた新コンテンツの生成を可能とするために、特徴空間上に任意の条件を特定するための制御用次元を設けてＶＡＥにおける学習を行う。ここでは入力コンテンツおよび新コンテンツを映画の脚本とし、任意の条件を映画のジャンルとして説明を行う。

　図７Ａは新コンテンツの生成の第２の手法における学習段階を示したものである。学習段階では、第１エンコーダＥｍ１、第２エンコーダＥｍ２、第３エンコーダＥｕ、特徴空間、第１デコーダＤｍ１、第２デコーダＤｍ２、予測器ｆｒで処理を行う。

　第２の手法では新コンテンツ生成用情報に制御用情報が含まれている。制御用情報とは任意の条件を備えた新コンテンツを生成するために、新コンテンツの生成を制御する情報である。変換処理部１１４は、製作者によって入力された入力情報としてのジャンルを特定する情報を制御用情報に変換し、制御用情報を含めて新コンテンツ生成用情報とする。

　ジャンルを特定する情報の入力のためには、情報処理装置１００において予め映画のジャンルを定義して分類しておく（例えば、ホラー、コメディ、ミステリー、など）。製作者はその定義づけられたジャンルのいずれかを指定することで入力情報としてジャンルを特定する情報を入力することができる。例えば、予め１０個のジャンルを定義していた場合、１０次元のベクトルのうち指定されたジャンルに１が立ち、それ以外のジャンルは０となる。なお、製作者によるジャンルの指定は一つでもよいし、複数指定できるようにしてもよい。

　なお、学習段階で、新コンテンツ生成用情報に変換される入力コンテンツのジャンルと、制御用情報に変換される入力コンテンツの条件を示す情報、すなわち、入力コンテンツのジャンルを特定する情報におけるジャンルは一致している必要がある。

　学習段階では第１エンコーダＥｍ１に新コンテンツ生成用情報の制御用情報以外の情報が入力される。また、第２エンコーダＥｍ２に制御用情報が入力され、特徴空間上の特定の次元では制御用情報のみを表現する。図７Ａ、図７Ｂでは特徴空間上における縦軸が制御情報に対応しており、横軸が制御用情報以外の新コンテンツ生成用情報に対応している。さらに、第２エンコーダＥｕには消費者状態情報および消費者特徴情報が入力される。消費者状態情報および消費者特徴情報をまとめて消費者情報とする。

　そして、新コンテンツ生成用情報および消費者情報を特徴空間上にマッピングし、第１デコーダＤｍ１を通してその特徴空間における特徴点からコンテンツを生成し、第２デコーダＤｍ２から制御用情報を生成して学習を行う。これにＭＦを応用することで消費者の評価を反映したコンテンツの特徴空間を作ることができる。

　図７ＢはＶＡＥを用いた新コンテンツ生成の第２の手法の生成段階における処理を示したものである。生成段階では、第２エンコーダＥｍ２と特徴空間と第１デコーダＤｍ１で処理を行う。

　図７Ｂに示すように、生成段階では、第２エンコーダＥｍ２に入力された制御用情報に応じて特徴空間における制御用次元を固定して特徴空間上でターゲットとなる消費者群が集まった領域の点から第１デコーダＤｍ１が新コンテンツを生成する。これにより、制御用情報に応じている、すなわち任意の条件に応じ、かつ、狙った消費者層から高評価が得られやすい新コンテンツを生成することができる。

　例えば、製作者が新コンテンツとしてコメディ映画の脚本を生成したい場合を考える。この場合、任意の条件はコメディというジャンルである。学習段階では既存のコメディ映画の脚本を入力情報とした新コンテンツ生成用情報を第１エンコーダＥｍ１に入力し、コメディというジャンルを特定する情報が変換された制御用情報を第２エンコーダＥｍ２に入力して学習を行う。そして生成段階では、コメディというジャンルを特定する情報が変換された制御用情報を第２エンコーダＥｍ２に入力すると、特徴空間上における制御用情報に対応する軸上の点であり、かつ、ターゲットとなる消費者群付近の特徴点から第１デコーダＤｍ１によって新コンテンツとしてのジャンルがコメディである映画の脚本が生成される。これにより、任意の条件である製作者が希望するジャンルで、狙った消費者群から高評価が得られやすい新コンテンツを生成できる。

　なお、上述の第２の手法の説明では新コンテンツ生成用情報と制御用情報を分けて、それぞれが異なるエンコーダに入力するように説明した。しかし、制御用情報を新コンテンツ生成用情報に含めて、一つのエンコーダに入力するようにしてもよい。例えば、任意の条件がコンテンツのジャンルである場合、変換処理部１１４は、入力コンテンツやキーワードに加え、入力されたジャンルを特定する情報も含めて新コンテンツ生成用情報に変換する。

　上述の説明では制御用情報はコンテンツに対する任意の条件をジャンルとして説明を行ったが、他の条件で新コンテンツを生成することもできる。例えば、映画コンテンツに出演する役者を示す情報を制御用情報に変換することで、任意の条件として出演する役者を特定した新コンテンツとしての映画コンテンツを生成することができる。このように、任意の条件はコンテンツを構成する要素に関するものであればどのようなものでもよい。

　図４のフローチャートの説明に戻る。次にステップＳ１０５で、提示コンテンツ決定部１１７が新コンテンツと既存コンテンツの中から制作者に提示するコンテンツである提示コンテンツを決定する。なお、制作者が入力情報として入力した入力コンテンツが配信されているものである場合、既存コンテンツにはその入力コンテンツも含まれる。提示コンテンツ決定部１１７は、新コンテンツと既存コンテンツに対してソートと選択の両方またはいずれか一方を行うことにより提示コンテンツを決定する。ソートとは、制作者に提示するコンテンツを提示する順序を決定することである。

　提示コンテンツ決定部１１７は、入力コンテンツまたは新コンテンツ生成用情報に対する全体的な類似度に基づいて複数の新コンテンツと既存コンテンツをソートし、さらにその中から選択することにより提示コンテンツを決定する。選択は、閾値を予め設定しておき、入力コンテンツに対する全体的な類似度が閾値以上の新コンテンツと既存コンテンツを提示コンテンツとして選ぶことで行なう。

　また、入力コンテンツまたは新コンテンツ生成用情報に対する部分的な類似度に基づいて複数の新コンテンツと既存コンテンツをソートし、さらにその中から選択することにより提示コンテンツを決定することもできる。選択は、閾値を予め設定しておき、入力コンテンツに対する部分的な類似度が閾値以上の新コンテンツと既存コンテンツを提示コンテンツとして選ぶことで行なう。

　さらに、既存コンテンツにおいては、視聴率や購入率に基づいても複数の新コンテンツと既存コンテンツをソートし、さらに視聴その中から選択することにより提示コンテンツを決定することもできる。選択は、閾値を予め設定しておき、視聴率や購入率が閾値以上の新コンテンツと既存コンテンツを提示コンテンツとして選ぶことで行なう。

　選択方法には、入力コンテンツとの類似度に基づく方法と、新コンテンツ生成用情報との類似度に基づく方法があるが、制作者がどちらの方法を使用するかを選べるようにしてもよいし、予めデフォルトでどちらかの方法に設定されていてもよい。なお、どちらの方法においても入力コンテンツは一つでもよいし、複数でもよく、入力コンテンツの数に限定はない。

　また、ソートされた新コンテンツと既存コンテンツのソート順の上位Ｎ個を選択して提示コンテンツとして決定することもできる。Ｎの値は予め設定されていてもよいし、制作者が任意の値に設定できるようにしてもよい。

　次にステップＳ１０６で、提示コンテンツ決定部１１７により決定された提示コンテンツが表示部１０５において表示されて制作者に提示される。

　提示コンテンツを制作者に提示する際には、提示コンテンツ決定部１１７でソートされた順に提示コンテンツが提示される。また、提示コンテンツを提示する際に、提示コンテンツに類似度が高い入力コンテンツ、提示コンテンツに類似度が高い入力コンテンツの類似度に寄与した入力コンテンツの特徴などを共に提示してもよい。これにより、提示コンテンツと入力コンテンツの関係を制作者が理解することができ、なぜこのような提示コンテンツがこのような順番で提示されているのかということを制作者が理解することができる。表示部１０５における提示コンテンツの提示方法は後述する。

　次にステップＳ１０７で、提示コンテンツを確認した制作者が情報処理装置１００にフィードバックを入力した場合、処理はステップＳ１０８に進む（ステップＳ１０７のＹｅｓ）。

　制作者は提示された提示コンテンツを確認し、さらに新コンテンツの再生成や、別の提示コンテンツの提示が必要であると考えた場合、フィードバックとして入力情報の追加、削除、変更を行うことができる。

　次にステップＳ１０８で、新コンテンツ生成用情報保存部１１５に保存されている新コンテンツ生成用情報を更新する。フィードバックとして入力された入力情報を変換処理部１１４が新コンテンツ生成用情報に変換し、その新コンテンツ生成用情報を新コンテンツ生成用情報保存部１１５に保存することで新コンテンツ生成用情報を更新する。新コンテンツ生成用情報の生成は上述したステップＳ１０３における方法と同様である。

　一方、制作者からのフィードバックの入力がない場合、処理は終了となる（ステップＳ１０７のＮｏ）。

　次に図８のフローチャートを参照して提示コンテンツ決定部１１７による提示コンテンツの決定処理について説明する。

　まずステップＳ２０１で、入力コンテンツとの類似度に基づいてソートを行う場合、処理はステップＳ２０２に進む（ステップＳ２０１のＹｅｓ）。

　次にステップＳ２０２で、提示コンテンツ決定部１１７は新コンテンツと既存コンテンツを入力コンテンツとの類似度に基づいてソートする。

　そしてステップＳ２０３で、提示コンテンツ決定部１１７は、ソートされた新コンテンツと既存コンテンツから最終的に制作者に提示する提示コンテンツを選択して決定する。選択は上述したように閾値を用いた選択と、ソート順の上位Ｎ個を選択してする方法がある。

　説明はステップＳ２０１に戻り、入力コンテンツとの類似度に基づいてソートを行わない場合、処理はステップＳ２０４に進む（ステップＳ２０１のＮｏ）。この場合、新コンテンツ生成用情報との類似度に基づいてソートを行う。

　次にステップＳ２０４で、提示コンテンツ決定部１１７は新コンテンツと既存コンテンツを新コンテンツ生成用情報との類似度に基づいてソートする。

　そしてステップＳ２０３で、提示コンテンツ決定部１１７は、ソートされた新コンテンツと既存コンテンツから最終的に制作者に提示する提示コンテンツを選択して決定する。

　類似度は、新コンテンツ生成用情報がベクトルの場合は、各ベクトル間のユークリッド距離に対して単調減少する関数(例えばユークリッド距離dに対して exp(-d) など)やコサイン類似度などを用いて算出することができる。また、類似度算出の際に、入力コンテンツまたは新コンテンツ生成用情報のベクトルのうち、特に高い値(大きな絶対値)を持つ要素のみ(複数もあり)を利用してもよい。これによって、制作者にとって重要なポイントは押さえつつ、重要ではない要素に関しては制作者が取り込んでこなかった要素を含んだ提示コンテンツを制作者に提示することができ、制作者はその提示コンテンツを参考にして新たなコンテンツを制作することができる。

　また、提示コンテンツの決定は、類似度の基づく方法以外に、複数の消費者で構成される特定の消費者集合が購入または評価するか、という基準で行うことができる。

　その場合、特定の消費者集合を全消費者とすれば全消費者に広く受け入れられるであろうと予測される順序で新コンテンツと既存コンテンツをソートおよび選択して提示コンテンツを決定することができる。全消費者とは、例えば特定のコンテンツ配信サービスにおける全登録ユーザなどである。

　一方、特定の消費者集合を、入力コンテンツを購入した消費者のみで構成された消費者集合とすれば、既存の消費者に引き続き受け入れられるであろうと予測される順序で新コンテンツと既存コンテンツをソートおよび選択して提示コンテンツを決定することができる。

　なお、既存コンテンツはすでに配信がされているため、既存コンテンツに関しては、例えば全消費者集合あるいは入力コンテンツを購入した消費者集合を取得し、その消費者集合の中での既存コンテンツの販売数や販売率に基づいてソートおよび選択を行って提示コンテンツを決定することができる。なお、購入率に対する閾値を設定し、閾値以上の購入率を有する既存コンテンツを提示コンテンツとして決定することもできる。

　また、新コンテンツに関しては、消費者状態情報、消費者特徴情報、コンテンツ情報（消費者状態情報に含まれる、いずれかの消費者が消費や評価したコンテンツについての情報）などを用いて例えばFactorization Machinesなどで各消費者の各新コンテンツに対する評価値予測器を作成しておき、全消費者集合または既存コンテンツを購入した消費者集合に関して、各新コンテンツに対する予測値や平均値が高い順にソートおよび選択を行って提示コンテンツを決定することができる。これにより、全消費者集合または既存コンテンツを購入した消費者集合に受けいれられる（高く評価される）であろうと考えられる新コンテンツを提示コンテンツにできる。なお、予測値に対する閾値を設定し、閾値以上の予測値を有する新コンテンツを提示コンテンツとして決定することもできる。

さらに、制作者が過去に制作したコンテンツを消費したことがない消費者に評価される可能性に基づいて提示コンテンツを決定することもできる。

　入力コンテンツが、制作者が過去に制作した既存コンテンツである場合、それを消費していない消費者が消費あるいは評価するかという基準でソートおよび選択を行って提示コンテンツを決定する。これにより、まだ制作者が制作したコンテンツを消費したことがない消費者に向けたポートフォリオ（ラインナップ、カタログともいえる）を拡充する作品集合を知ることができる。このように決定した提示コンテンツを参照することにより、制作者は、制作者が制作したコンテンツをまだ消費したことがない消費者が高く評価するであろうと考えられるコンテンツを制作することができる。

　既存コンテンツに関しては、例えば入力コンテンツを購入していない消費者集合を取得し、その消費者集合の中での購入率に基づいてソートおよび選択を行って提示コンテンツを決定することができる。

　なお、上述の説明において入力コンテンツを消費した複数の消費者を消費者集合とすることができるのは入力コンテンツが完成して配信がされている既存コンテンツである場合に限られる。

　入力情報として入力キーワードのみが入力されている場合、その入力キーワードに対応する（含む）既存コンテンツを購入している消費者集合、または購入していない消費者集合として提示コンテンツの決定を行うこともできる。

［１－３．ユーザインターフェースの具体例］
　次に図９乃至図１３を参照して情報処理装置１００による処理がアプリケーションやウェブサービスとして提供される場合のユーザインターフェースについて説明する。以下のユーザインターフェースの説明ではコンテンツは漫画であるとして説明を行う。まず図９を参照して、新コンテンツ生成のための入力情報の入力用ユーザインターフェースについて説明する。この入力用ユーザインターフェースは表示部１０５等において表示される。

　入力用ユーザインターフェースは、入力可能コンテンツ表示部３０１、入力済みコンテンツ表示部３０２、検索用入力部３０３、キーワード入力部３０４を備えて構成されている。

　入力可能コンテンツ表示部３０１は、コンテンツデータベース１１３に存在する複数の既存コンテンツを制作者が入力コンテンツとして入力するために表示するものである。入力可能コンテンツ表示部３０１においては既存コンテンツを入力コンテンツとして入力するための各既存コンテンツに対応付けてチェックマーク入力欄が設けられている。

　入力済みコンテンツ表示部３０２は、制作者によって入力された入力コンテンツを表示するものである。図１０に示すように、入力可能コンテンツ表示部３０１において入力する既存コンテンツにチェックマークをつけると、その既存コンテンツが入力済みコンテンツ表示部３０２に表示される。制作者は自分がどのような既存コンテンツを入力コンテンツとして入力したかを目視で確認することができる。

　検索用入力部３０３は、図１１に示すように、入力可能コンテンツ表示部３０１に表示されている複数の既存コンテンツを検索するために任意の検索用キーワードを入力するためのものである。図１１は、コンテンツである漫画を作者名で検索した場合の例である。

　図１２に示すように、複数の既存コンテンツを入力コンテンツとして入力した場合、その複数の入力コンテンツが入力済みコンテンツ表示部３０２に表示される。

　キーワード入力部３０４は、入力コンテンツともに入力することができる入力キーワードを選択するためのものである。図１３の例では予め情報処理装置１００において用意してあるキーワードの候補を複数表示し、その中から制作者が入力キーワードとしたいキーワードを選択する構成になっている。

　なお、入力キーワードは表示されている候補から制作者が選択するのではなく、入力キーワードとなる文字列を制作者が直接入力できるようにしてもよい。

　キーワード入力部３０４に表示されるキーワードの候補は入力コンテンツに関係なく、常に同じものでもよいし、制作者が入力した入力コンテンツの種類、ジャンル、内容などに応じてキーワード入力部３０４に表示されるキーワードの候補が変化するようにしてもよい。そのためには情報処理装置１００において予め既存コンテンツのそれぞれにキーワードの候補を対応付けておく必要がある。

　図９乃至図１３の例では、入力コンテンツと入力キーワードの選択が完了するとコンテンツ生成のための入力情報の入力が完了となる。

　次に図１４乃至図１６を参照して、提示コンテンツを制作者に提示するための提示用ユーザインターフェースについて説明する。この提示用ユーザインターフェースは表示部１０５等において表示される。

　提示用ユーザインターフェースは類似コンテンツ提示タブ３１１、類似人気コンテンツ提示タブ３１２、読者層共通コンテンツ提示タブ３１３、軸共通コンテンツ提示タブ３１４、既存コンテンツ３１５、新コンテンツタブ３１６、ハイライト表示入力部３１７、キーワード入力部３１８、興味分布表示部３１９を備えて構成されている。

　類似コンテンツ提示タブ３１１は、入力情報としての入力コンテンツまたは新コンテンツ生成用情報との類似度によって決定された提示コンテンツを表示するものである。また、類似人気コンテンツ提示タブ３１２は、入力情報としての入力コンテンツまたは新コンテンツ生成用情報との類似度によって決定された提示コンテンツの中から人気があるコンテンツを表示するものである。人気があるコンテンツとは例えばコンテンツ配信プラットフォームにおける販売数が所定数以上であるコンテンツや、コンテンツ配信プラットフォームのラインキングの所定順位以上のコンテンツなどである。

　また、読者層共通コンテンツ提示タブ３１３は、提示コンテンツの中から、入力情報としての入力コンテンツと読者層が共通するコンテンツを表示するものである。

　さらに、軸共通コンテンツ提示タブ３１４は、提示コンテンツの中から入力情報としての入力コンテンツと軸が共通するコンテンツを提示コンテンツとして表示するものである。軸が共通するコンテンツとは、興味分布表示部３１９に表示される制作者の興味分布において一番大きい値を持つ要素に関して、作品のトピック分布において同様に一番大きい値を持つ作品を抽出したコンテンツである。

　上述した各タブは下位構造として既存コンテンツを表示する既存コンテンツ３１５と新コンテンツを表示する新コンテンツタブ３１６を備えている。これにより、制作者は各タブにおいて表示する提示コンテンツを既存コンテンツと新コンテンツに分けて確認することができる。

　各タブには提示コンテンツに関する情報が表示される。提示コンテンツに関する情報としては例えば、コンテンツの設定、トーン、登場キャラクターに関する情報、あらすじなどがある。なお、これらの表示される情報はあくまで例示であり、本技術の内容が図１４に示した情報に限定されるものではない。制作者にとって有益な情報であればどのような情報を表示してもよい。

　ハイライト表示入力部３１７は、表示されている提示コンテンツに関する情報を所定の条件に基づいてハイライト表示するためのものである。所定の条件としては、例えば、制作者の興味に近いワード、制作者が使ったことがないワード、最近のトレンドワードなどである。この所定の条件はあくまで例示であり、本技術の内容が図１４に示した情報に限定されるものではない。

　興味分布表示部３１９は、制作者の興味分布をグラフで示したものである。制作者の興味分布は新コンテンツ生成用情報に基づいて生成したものである。例えば、新コンテンツ生成用情報が１０次元ベクトルであれば１０個の数値が順に並んだものに対応するので、各次元それぞれに要素名を付けてグラフとして表現したものが制作者の興味分布を示すグラフとなる。なお、制作者がグラフを分類してもよいし、要素（次元）名は人が分析結果を見て人手で付けてもよいし、分析結果から自動的に名前がつくようにしてもよい。

　コンテンツ再入力ボタンは、新たな入力情報を入力するために入力用ユーザインターフェースに遷移するためのボタンである。

　キーワード入力部３０４は、入力用ユーザインターフェースが備えるものと同様に、入力コンテンツともに入力することができるキーワードを選択するためのものである。図１６の例では予め情報処理装置１００においてキーワードの候補を複数表示し、その中から制作者が入力情報としたいキーワードを選択する構成になっている。

　以上のようにして本技術の第１の実施の形態が構成されている。第１の実施の形態によれば、制作者が入力した入力情報と消費者に関する情報である消費者状態情報と消費者特徴情報に基づいて新コンテンツを生成して制作者に提示することができる。この提示された新コンテンツを参考にして制作者は自身の新たなコンテンツを制作することができる。

　また、新コンテンツに加え、既存コンテンツも提示コンテンツとして制作者に提示することができるので、この提示された既存コンテンツを参考にして制作者は自身の新たなコンテンツを制作することができる。

　新コンテンツだけでなく既存コンテンツも提示コンテンツとして制作者に提示することによりコンテンツ制作のための幅広い情報を制作者に提供することができる。

　制作者は提示コンテンツを参考にしてコンテンツを制作し、そのコンテンツの販売、配信などを行うことができる。

＜２．第２の実施の形態＞
［２－１．情報処理装置２００の構成］
　次に本技術の第２の実施の形態について説明する。第２の実施の形態は、消費者の感情を活用して新コンテンツを生成するものである。「消費者の感情を活用して新コンテンツを生成する」とは、コンテンツに対する消費者の感情の盛り上がりを特定のパターンに沿わせるように新コンテンツを生成することである。

　図１７を参照して第２の実施の形態における情報処理装置２００の処理ブロックの構成について説明する。情報処理装置２００は、感情予測部２０１を備える点で第１の実施の形態と異なる。それ以外の構成は第１の実施の形態と同様であるため説明を省略する。

　感情予測部２０１は、消費者のコンテンツ中の特定のシーンに対する消費者の感情の起伏を予測する。この感情の起伏の予測値は複数のシーン候補とともに制作者に提示されて、制作者は予測値を参考にしてコンテンツに含めるシーンを選択する。

［２－２．情報処理装置２００における処理］
　次に情報処理装置２００における処理について説明する。この説明では、時間の経過とともにコンテンツの内容が進行していき、コンテンツ再生開始位置からの経過時間でコンテンツ内の再生位置を把握することができる映画などの映像コンテンツを例にする。

　状態情報取得装置５００では、コンテンツの消費時における消費者の状態情報を取得し、コンテンツ内の再生位置（コンテンツ再生開始からの経過時間）に紐づけて消費者状態情報保存部１１１に保存する。

　消費者状態情報はセンサ情報そのままではなく、感情予測部２０１において別途各種識別器を用いて、消費者状態情報を例えばネガティブとポジティブ、緊張度と盛り上がり度のような１軸の数値にマッピングすることにより、コンテンツに対する消費者の感情を示す感情情報に変換する。

　別途各種識別器とは、消費者のコンテンツ視聴時の行動、反応などである消費者状態情報をコンテンツに対する感情を示す数値に変換するものである。例えば、「視線をそらす」という行動はネガティブな反応であるとして、コンテンツ消費中の視線をそらした回数やそらした時間などに応じてマイナスの値として数値化する。また、「笑顔」という反応はポジティブな反応であるとして、コンテンツ消費中の笑顔の回数や笑顔の時間などに応じてプラスの値として数値化する。また、発汗という反応はネガティブな反応であるとして、コンテンツ消費中の発汗量などに応じてマイナスの値として数値化する。このように消費者状態情報としての消費者のあらゆる行動や反応を消費者の感情を表す数値に変換する。

　なお、消費者にコンテンツを視聴しながら感情の度合いを示す情報（５段階評価など）を入力させて、感情予測部２０１は、消費者状態情報と消費者が入力した感情の度合いを示す情報を対応付けることにより消費者状態情報を感情情報に変換してもよい。

　例えば特定のコンテンツに対する消費者状態情報を取得し、それを感情情報に変換した結果、図１８に示すようにコンテンツの時間軸上の再生位置に対して消費者の盛り上がりを表すことができる。この場合、消費者の感情情報（盛り上がり）は一人の消費者のものでもよいし、複数の消費者からなる消費者集合のものであってもよい。消費者集合である場合、盛り上がりは複数の消費者の平均となる。

　感情予測部２０１は、時刻tにおけるコンテンツ特徴量をｆｔ（例えば、映画のあるシーンにおける画像情報、登場人物、音楽等）、消費者uの消費者状態情報および消費者特徴情報をｆｕ（例えば性別・年齢や過去視聴作品など）、コンテンツにおける時刻tでの消費者の感情情報（盛り上がり度）をｙｔとすると、一般的な教師ありの機械学習モデルｇ（以下、モデルｇ）を用いて下記の式１に示す予測モデルを作成できる。このモデルｇによりコンテンツのシーンにおける盛り上がり度ｙｔを予測し、数値として算出することができる。なお、消費者特徴情報ｆｕと盛り上がり度ｙｔは対象となる消費者全ての盛り上がり度の平均値である。

［式１］
ｙｔ＝ｇ（ｆｔ,ｆｕ）

　ここでモデルｇは、入力として過去の時刻におけるコンテンツ特徴量ｆ（ｔ－１）、ｆ（ｔ－２）、・・・などを利用してもよい。また、盛り上がりは各消費者に関するものでなくても、例えばコンテンツを消費した複数の消費者の平均値などを用いてもよい。

　このモデルｇを用いて、制作者は例えば、映画における特定のシーンの次のシーンをどのようなシーンにすべきかという判断において複数のシーンの候補を比較検討することができる。複数のシーンの候補をそれぞれコンテンツ特徴量（ｆｔ）化し、制作側が意図する盛り上がりのパターンを実現するのに最もふさわしいシーンを選択する。

　さらに、ユーザ評価予測と組み合わせて、そのシーンを選択した場合の最終的な盛り上げりの予測値（例えば全消費者に対する予測評価の平均値）を組み合わせて制作者に提示してもよい。

　情報処理装置２００はシーン候補と盛り上がりの予測値を対応付けて、後述するコンテンツ生成用ユーザインターフェースで制作者に提示する。そして、制作者が盛り上がりの予測値を参考にして採用するシーン候補を選択して選択入力を行うと、そのシーン選択情報はコンテンツ生成部１１６に供給されて、コンテンツ生成部１１６はシーン選択情報に基づいてコンテンツを生成する。

　図１９に消費者の感情情報を用いたコンテンツ生成用のユーザインターフェースとコンテンツの生成について説明する。コンテンツ生成用ユーザインターフェースは、グラフ表示部４０１、シーン候補表示部４０２、予測値表示部４０３を備えて構成されている。

　グラフ表示部４０１は横軸が映像コンテンツの時間（再生位置）であり、縦軸が映像コンテンツに対する消費者の感情情報（盛り上がり）であるグラフを示すものである。シーン候補表示部４０２は、シーン候補の具体的映像の内容を示すものである。予測値表示部４０３は、シーン候補ごとの盛り上がりの予測値を示すものである。

　グラフ表示部４０１において、制作者が意図する消費者の盛り上がりが実線で表されている。そして時刻ｔ１の時点のシーン候補としてシーン候補Ａ、シーン候補Ｂ、シーン候補Ｃがあることを示している。各シーン候補Ａ乃至Ｃはシーン候補表示部４０２に表示されている。なお、シーン候補表示部４０２におけるシーン候補の表示は静止画、絵コンテ、イラスト、動画など制作者がシーンの内容を把握できればどのような形態でもよい。

　グラフ表示部４０１には、感情予測部２０１で予測した各シーン候補の盛り上がりの予測値（感情の起伏の予測値）がグラフ上に破線と点により示されており、制作者はこの予測値を見てどのシーン候補を採用するシーンにするかを判断することができる。図１９の場合、シーン候補Ｂを選択すれば制作者の意図に最も近い映像コンテンツを生成することができる。また、制作者は各シーン候補の具体的な予測値を予測値表示部４０３で確認することができる。

　なお、シーン候補表示部４０２に表示されているシーンを表す画像、映像などを制作者が編集可能とし、編集後のシーンの盛り上がりを動的に予測できるようにしてもよい。

　例えば、制作者がグラフ表示部４０１において表示された各シーン候補の盛り上がりの予測値を参考にしてシーン候補Ｂを選択した場合、そのシーン選択情報がコンテンツ生成部１１６に供給され、コンテンツ生成部１１６はシーン候補Ｂを含めるように新コンテンツを生成する。

　以上のようにして本技術の第２の実施の形態が構成されている。第２の実施の形態によれば、消費者の感情の盛り上がりに応じて新コンテンツを生成することができ、さらに、制作者の意図をより新コンテンツに反映させることができる。

　なお、上述の第２の実施の形態は、時間の経過とともにコンテンツの内容が進行していく映画などの映像コンテンツを例にしたが、コンテンツはそれだけに限られない。コンテンツの内容が進行していくものであればどのようなものでもよく、音楽、漫画などでもよい。

　また、感情情報は盛り上がりに限定されるものではない。喜び、楽しさ、怒り、悲しみなど消費者状態情報から変換することができる感情であればどのようなものでもよい。

＜３．変形例＞
　以上、本技術の実施の形態について具体的に説明したが、本技術は上述の実施の形態に限定されるものではなく、本技術の技術的思想に基づく各種の変形が可能である。

　本技術は以下のような構成も取ることができる。
（１）
　入力情報と、消費者がコンテンツを消費した際の状態を示す状態情報とに基づいて新コンテンツを生成するコンテンツ生成部と、
　前記新コンテンツと既存コンテンツのいずれか一方または両方からコンテンツの制作者に提示される提示コンテンツを決定する提示コンテンツ決定部と、
を備える情報処理装置。
（２）
　前記入力情報は、前記制作者により入力された入力コンテンツである（１）に記載の情報処理装置。
（３）
　前記コンテンツ生成部は、前記消費者の特徴情報に基づいて前記新コンテンツを生成する（１）または（２）に記載の情報処理装置。
（４）
　前記入力情報を新コンテンツ生成用情報に変換する変換処理部を備え、
　前記コンテンツ生成部は、前記新コンテンツ生成用情報に基づいて前記新コンテンツを生成する（１）から（３）のいずれかに記載の情報処理装置。
（５）
　前記コンテンツ生成部は、前記消費者による前記既存コンテンツに対する評価情報に基づいて前記新コンテンツを生成する（１）から（４）のいずれかに記載の情報処理装置。
（６）
　前記コンテンツ生成部は、制御用情報に基づいて前記新コンテンツを生成する（２）から（４）のいずれかに記載の情報処理装置。
（７）
　前記制御用情報は、前記入力コンテンツおよび前記新コンテンツにおける条件を示す情報である（６）に記載の情報処理装置。
（８）
　前記コンテンツ生成部は、学習段階と生成段階とで処理を行い、
　前記学習段階で、前記新コンテンツ生成用情報と、前記状態情報と、制御用情報に基づいて前記入力コンテンツに対する前記消費者の評価を予測して学習を行い、
　前記生成段階で、前記制御用情報に基づいて前記新コンテンツを生成する（４）に記載の情報処理装置。
（９）
　前記提示コンテンツ決定部は、前記入力情報との類似度に基づいて前記新コンテンツと既存コンテンツのいずれか一方または両方の中から前記提示コンテンツを決定する（１）から（８）のいずれかに記載の情報処理装置。
（１０）
　前記提示コンテンツ決定部は、前記新コンテンツと前記既存コンテンツを前記入力情報との類似度が高い順にソートして前記提示コンテンツとする（９）に記載の情報処理装置。
（１１）
　前記提示コンテンツ決定部は、前記入力コンテンツとの類似度が所定の閾値以上の前記新コンテンツと前記既存コンテンツを前記提示コンテンツとする（９）または（１０）に記載の情報処理装置。
（１２）
　前記提示コンテンツ決定部は、前記コンテンツ生成用情報との類似度に基づいて前記新コンテンツと既存コンテンツの中から前記提示コンテンツを決定する（１）から（１１）のいずれかに記載の情報処理装置。
（１３）
　前記変換処理部は、前記提示コンテンツに対する前記コンテンツ制作者のフィードバックとしての前記入力情報を新コンテンツ生成用情報に変換する（１）から（１２）のいずれかに記載の情報処理装置。
（１４）
　前記提示コンテンツが前記製作者に提示される際に、前記提示コンテンツとの類似度が高い前記入力コンテンツも提示される（１）から（１３）のいずれかに記載の情報処理装置。
（１５）
　前記提示コンテンツが前記コンテンツ製作者に提示される際、前記類似度に寄与した前記入力コンテンツの要素も提示される（１）から（１４）のいずれかに記載の情報処理装置。
（１６）
　前記提示コンテンツ決定部は、前記消費者に消費または評価されるかの予測に基づいて前記新コンテンツと既存コンテンツのいずれか一方または両方の中から前記提示コンテンツを決定する（１）から（１５）のいずれかに記載の情報処理装置。
（１７）
　前記入力情報とは、前記新コンテンツの内容を示すキーワードである（１）から（１６）のいずれかに記載の情報処理装置。
（１８）
　前記コンテンツ生成部は、前記制作者に提示された複数のシーン候補の中から前記制作者に選択された前記シーン候補を用いて前記新コンテンツを生成する（１）から（１７）のいずれかに記載の情報処理装置。
（１９）
　入力情報と、消費者がコンテンツを消費した際の状態を示す状態情報とに基づいて新コンテンツを生成し、
　前記新コンテンツと既存コンテンツのいずれか一方または両方からコンテンツの制作者に提示される提示コンテンツを決定する
情報処理方法。
（２０）
　入力情報と、消費者がコンテンツを消費した際の状態を示す状態情報とに基づいて新コンテンツを生成し、
　前記新コンテンツと既存コンテンツのいずれか一方または両方の中からコンテンツの制作者に提示される提示コンテンツを決定する
情報処理方法をコンピュータに実行させる情報処理プログラム。
（２１）
　前記複数のシーン候補は、前記シーン候補に対応した前記消費者の感情の起伏の予測値と共に提示される（１８）に記載の情報処理装置。
（２２）
　前記複数のシーン候補は、前記制作者が意図する前記消費者の感情の起伏と共に提示される（１８）に記載の情報処理装置。

１００・・・情報処理装置
１１４・・・変換処理部
１１６・・・コンテンツ生成部
１１７・・・提示コンテンツ決定部

Claims

　入力情報と、消費者がコンテンツを消費した際の状態を示す状態情報とに基づいて新コンテンツを生成するコンテンツ生成部と、
　前記新コンテンツと既存コンテンツのいずれか一方または両方からコンテンツの制作者に提示される提示コンテンツを決定する提示コンテンツ決定部と、
を備える情報処理装置。
　前記入力情報は、前記制作者により入力された入力コンテンツである
請求項１に記載の情報処理装置。
　前記コンテンツ生成部は、前記消費者の特徴情報に基づいて前記新コンテンツを生成する
請求項１に記載の情報処理装置。
　前記入力情報を新コンテンツ生成用情報に変換する変換処理部を備え、
　前記コンテンツ生成部は、前記新コンテンツ生成用情報に基づいて前記新コンテンツを生成する
請求項１に記載の情報処理装置。
　前記コンテンツ生成部は、前記消費者による前記既存コンテンツに対する評価情報に基づいて前記新コンテンツを生成する
請求項１に記載の情報処理装置。
　前記コンテンツ生成部は、制御用情報に基づいて前記新コンテンツを生成する
請求項２に記載の情報処理装置。
　前記制御用情報は、前記入力コンテンツおよび前記新コンテンツにおける条件を示す情報である
請求項６に記載の情報処理装置。
　前記コンテンツ生成部は、学習段階と生成段階とで処理を行い、
　前記学習段階で、前記新コンテンツ生成用情報と、前記状態情報と、制御用情報に基づいて前記入力コンテンツに対する前記消費者の評価を予測して学習を行い、
　前記生成段階で、前記制御用情報に基づいて前記新コンテンツを生成する
請求項４に記載の情報処理装置。
　前記提示コンテンツ決定部は、前記入力情報との類似度に基づいて前記新コンテンツと既存コンテンツのいずれか一方または両方の中から前記提示コンテンツを決定する
請求項１に記載の情報処理装置。
　前記提示コンテンツ決定部は、前記新コンテンツと前記既存コンテンツを前記入力情報との類似度が高い順にソートして前記提示コンテンツとする
請求項９に記載の情報処理装置。
　前記提示コンテンツ決定部は、前記入力コンテンツとの類似度が所定の閾値以上の前記新コンテンツと前記既存コンテンツを前記提示コンテンツとする
請求項９に記載の情報処理装置。
　前記提示コンテンツ決定部は、前記コンテンツ生成用情報との類似度に基づいて前記新コンテンツと既存コンテンツの中から前記提示コンテンツを決定する
請求項１に記載の情報処理装置。
　前記変換処理部は、前記提示コンテンツに対する前記コンテンツ制作者のフィードバックとしての前記入力情報を新コンテンツ生成用情報に変換する
請求項１に記載の情報処理装置。
　前記提示コンテンツが前記製作者に提示される際に、前記提示コンテンツとの類似度が高い前記入力コンテンツも提示される
請求項１に記載の情報処理装置。
　前記提示コンテンツが前記コンテンツ製作者に提示される際、前記類似度に寄与した前記入力コンテンツの要素も提示される
請求項１に記載の情報処理装置。
　前記提示コンテンツ決定部は、前記消費者に消費または評価されるかの予測に基づいて前記新コンテンツと既存コンテンツのいずれか一方または両方の中から前記提示コンテンツを決定する
請求項１に記載の情報処理装置。
　前記入力情報とは、前記新コンテンツの内容を示すキーワードである
請求項１に記載の情報処理装置。
　前記コンテンツ生成部は、前記制作者に提示された複数のシーン候補の中から前記制作者に選択された前記シーン候補を用いて前記新コンテンツを生成する
請求項１に記載の情報処理装置。
　入力情報と、消費者がコンテンツを消費した際の状態を示す状態情報とに基づいて新コンテンツを生成し、
　前記新コンテンツと既存コンテンツのいずれか一方または両方からコンテンツの制作者に提示される提示コンテンツを決定する
情報処理方法。
　入力情報と、消費者がコンテンツを消費した際の状態を示す状態情報とに基づいて新コンテンツを生成し、
　前記新コンテンツと既存コンテンツのいずれか一方または両方の中からコンテンツの制作者に提示される提示コンテンツを決定する
情報処理方法をコンピュータに実行させる情報処理プログラム。