WO2023139849A1

WO2023139849A1 - 感情推定方法、コンテンツ決定方法、プログラム、感情推定システム、及びコンテンツ決定システム

Info

Publication number: WO2023139849A1
Application number: PCT/JP2022/036346
Authority: WO
Inventors: 伸一郎栗原
Original assignee: パナソニックＩｐマネジメント株式会社
Priority date: 2022-01-18
Filing date: 2022-09-29
Publication date: 2023-07-27

Abstract

感情推定方法では、ユーザの主観的な気分を示す第１パラメータ、ユーザの主観的な興奮度を示す第２パラメータ、及びユーザの主観的な弛緩度を示す第３パラメータを取得し（Ｓ１１）、取得した第１パラメータ、第２パラメータ、及び第３パラメータに基づいて、ユーザの感情を示す感情パラメータを推定し（Ｓ１２）、感情パラメータに関する情報を出力する（Ｓ１３）。

Description

感情推定方法、コンテンツ決定方法、プログラム、感情推定システム、及びコンテンツ決定システム

　本開示は、感情推定方法、コンテンツ決定方法、プログラム、感情推定システム、及びコンテンツ決定システムに関する。

　特許文献１には、ユーザの生体データを取得し、生体データに基づいて、ユーザの現在の感情状態を示す現在感情状態値を算出する技術が開示されている。

特開２０１８－１９５０４３号公報

　本開示は、ユーザの主観的な気分に基づいて、ユーザの感情を推定することができる感情推定方法等を提供する。

　本開示の一態様に係る感情推定方法では、ユーザの主観的な気分を示す第１パラメータ、前記ユーザの主観的な興奮度を示す第２パラメータ、及び前記ユーザの主観的な弛緩度を示す第３パラメータを取得し、取得した前記第１パラメータ、前記第２パラメータ、及び前記第３パラメータに基づいて、前記ユーザの感情を示す感情パラメータを推定し、前記感情パラメータに関する情報を出力する。

　本開示の一態様に係る感情推定方法は、ユーザの主観的な気分に基づいて、ユーザの感情を推定することができる。

図１は、実施の形態に係る感情推定システム及びコンテンツ決定システムを含む全体構成を示すブロック図である。図２は、実施の形態に係る情報端末における第１パラメータの入力画面の一例を示す図である。図３は、実施の形態に係る情報端末における第２パラメータの入力画面の一例を示す図である。図４は、実施の形態に係る情報端末における第３パラメータの入力画面の一例を示す図である。図５は、実施の形態に係るアフェクトグリッドの一例を示す図である。図６は、実施の形態に係る感情推定システムによるユーザの感情の推定の説明図である。図７は、実施の形態に係るコンテンツ決定システムで用いられる予測モデルの説明図である。図８は、実施の形態に係る感情推定システム及びコンテンツ決定システムの動作の一例を示す概要図である。図９は、実施の形態に係る感情推定システムの動作の一例を示すフローチャートである。図１０は、実施の形態に係るコンテンツ決定システムの動作の一例を示すフローチャートである。図１１は、実施の形態に係るコンテンツ決定システムにおけるプレイリストの生成の一例の説明図である。図１２は、実施の形態に係るコンテンツ決定システムにおけるプレイリストの再生成の一例の説明図である。

　以下、実施の形態について、図面を参照しながら具体的に説明する。なお、以下で説明する実施の形態は、いずれも包括的又は具体的な例を示すものである。以下の実施の形態で示される数値、形状、材料、構成要素、構成要素の配置位置及び接続形態、ステップ、ステップの順序等は、一例であり、本開示を限定する主旨ではない。また、以下の実施の形態における構成要素のうち、独立請求項に記載されていない構成要素については、任意の構成要素として説明される。

　なお、各図は模式図であり、必ずしも厳密に図示されたものではない。また、各図において、実質的に同一の構成に対しては同一の符号を付し、重複する説明は省略又は簡略化される場合がある。

　（実施の形態）
　［１．構成］
　まず、実施の形態に係る感情推定システム及びコンテンツ決定システムの構成について説明する。感情推定システムは、ユーザの主観的な気分、主観的な興奮度、及びユーザの主観的な弛緩度に基づいて、ユーザの感情を推定するためのシステムである。コンテンツ決定システムは、感情推定システムで推定したユーザの感情に基づいて、ユーザに対して提供するコンテンツを決定するためのシステムである。

　実施の形態では、コンテンツは、例えばユーザの存在する空間にて再生される音楽、又は自然環境音等を含む音コンテンツである。自然環境音は、例えば鳥のさえずり、虫の鳴き声、風の音、又は流水音等である。なお、コンテンツは、ユーザに対して提供することによりユーザの現在の感情を所定の感情へと誘導し得るコンテンツであればよく、音コンテンツに限られない。例えば、コンテンツは、ユーザの存在する空間にて再生される静止画像又は動画像を含む画像コンテンツであってもよいし、ユーザの存在する空間を照らす照明の輝度又は色温度を含む照明コンテンツであってもよい。

　図１は、実施の形態に係る感情推定システム及びコンテンツ決定システムを含む全体構成を示すブロック図である。実施の形態では、感情推定システム１０は、ユーザが利用する情報端末１で実現される。また、実施の形態では、コンテンツ決定システム２０は、サーバ２で実現される。また、実施の形態では、コンテンツ決定システム２０で決定した音コンテンツは、再生システム３で再生される。サーバ２は、インターネット等のネットワークＮ１を介して情報端末１及び再生システム３の各々と通信可能である。

　図１では、情報端末１は１台のみ図示されている。実施の形態では、情報端末１は、複数のユーザの人数と同じ台数存在する。なお、ユーザが１人である場合、又は複数のユーザで１台の情報端末１を共用する場合であれば、情報端末１は１台のみ存在する。

　実施の形態では、感情推定システム１０、コンテンツ決定システム２０、及び再生システム３は、いずれもオフィス内に存在するユーザを対象とする。つまり、感情推定システム１０は、オフィス内に存在するユーザの感情を推定する。また、コンテンツ決定システム２０は、感情推定システム１０で推定したオフィス内に存在するユーザの感情に基づいて、オフィス内に存在するユーザに対して音コンテンツを提供する。再生システム３は、コンテンツ決定システム２０で決定した音コンテンツを、オフィス内に向けて再生する。再生システム３は、例えばオフィス内の所定の場所に設置される。所定の場所は、再生システム３が再生する音コンテンツをオフィス内のユーザが聴くことが可能な場所である。一例として、所定の場所は、オフィスの中央における天井、又はオフィスの中央に設置された机の上等である。もちろん、感情推定システム１０、コンテンツ決定システム２０、及び再生システム３は、いずれもオフィス以外の空間に存在するユーザを対象としてもよい。

　［１－１．情報端末の構成］
　まず、情報端末１の構成について具体的に説明する。情報端末１は、例えばスマートフォン、タブレット端末、又はラップトップ型のパーソナルコンピュータ等の携帯型の端末である。なお、情報端末１は、デスクトップ型のパーソナルコンピュータ等の設置型の端末であってもよい。実施の形態では、情報端末１は、スマートフォンである。

　情報端末１は、所定のアプリケーションがインストールされることにより、感情推定システム１０として機能する。情報端末１は、ユーザインタフェース（Ｕｓｅｒ　Ｉｎｔｅｒｆａｃｅ）１１と、通信インタフェース（Ｉ／Ｆ）１２と、ＣＰＵ（Ｃｅｎｔｒａｌ　Ｐｒｏｃｅｓｓｉｎｇ　Ｕｎｉｔ）１３と、メモリ１４と、を備える。

　ユーザインタフェース１１は、ユーザの操作を受け付け、かつ、ユーザへ画像を提示する装置である。ユーザインタフェース１１は、例えばタッチパネル等の操作受付装置、及び表示パネル等の表示装置によって実現される。ユーザインタフェース１１は、感情推定システム１０の入力インタフェースの一例である。なお、ユーザインタフェース１１におけるユーザの操作を受け付ける手段は、例えばマイクロホン等の音声入力受付装置で実現されてもよい。また、ユーザインタフェース１１におけるユーザへの情報を提示する手段は、例えばスピーカ等の音声出力装置で実現されてもよい。

　ユーザは、ユーザインタフェース１１に表示される入力画面を見ながら、第１パラメータ、第２パラメータ、及び第３パラメータを入力する。これにより、ユーザインタフェース１１は、第１パラメータ、第２パラメータ、及び第３パラメータを取得する。第１パラメータ、第２パラメータ、及び第３パラメータの入力については、後述する［第１パラメータ、第２パラメータ、及び第３パラメータの入力］にて詳細に説明する。

　ここで、第１パラメータは、ユーザの主観的な気分を示すパラメータである。気分は、例えば落ち込み、憂鬱、充足、又は愉快等を含み得る。第２パラメータは、ユーザの主観的な興奮度を示すパラメータである。興奮度は、ユーザが興奮を覚えているか否か、又は倦怠感を覚えているか否かを含み得る。第３パラメータは、ユーザの主観的な弛緩度を示すパラメータである。弛緩度は、ユーザが弛緩しているか否か、又は緊張しているか否かを含み得る。第１パラメータ、第２パラメータ、及び第３パラメータは、いずれもユーザの自己申告による感情を示すパラメータである。

　通信インタフェース１２は、例えば無線通信インタフェースであり、Ｗｉ－Ｆｉ（登録商標）等の無線通信規格に基づいて、ネットワークＮ１を介してサーバ２と通信を行う。通信インタフェース１２は、ネットワークＮ１を介してサーバ２と通信を行うことにより、サーバ２へ信号を送信する。この信号には、後述するＣＰＵ１３で推定したユーザの感情を示す感情パラメータが含まれる。通信インタフェース１２は、感情推定システム１０の出力インタフェースの一例である。

　ＣＰＵ１３は、ユーザインタフェース１１への画像の表示、及び通信インタフェース１２を用いた信号の送信に関する情報処理を行う。また、ＣＰＵ１３は、ユーザインタフェース１１で取得した第１パラメータ、第２パラメータ、及び第３パラメータに基づいて、ユーザの感情を示す感情パラメータを推定する情報処理を行う。感情パラメータを推定する情報処理については、後述する［ユーザの感情の推定］にて詳細に説明する。

　上述の画像の表示処理、信号の送信処理、及び感情パラメータの推定処理は、いずれもＣＰＵ１３がメモリ１４に記憶されたコンピュータプログラムを実行することにより実現される。ＣＰＵ１３は、感情推定システム１０の信号処理回路の一例である。

　メモリ１４は、ＣＰＵ１３が情報処理を行うために必要な各種情報、及びＣＰＵ１３が実行するコンピュータプログラム等が記憶される記憶装置である。メモリ１４は、例えば半導体メモリによって実現される。

　［１－２．サーバの構成］
　次に、サーバ２の構成について具体的に説明する。サーバ２は、通信インタフェース２１と、ＣＰＵ２２と、メモリ２３と、記憶装置２４と、を備えている。

　通信インタフェース２１は、例えば無線通信インタフェースであり、Ｗｉ－Ｆｉ（登録商標）等の無線通信規格に基づいて、ネットワークＮ１を介して情報端末１と通信を行うことにより、情報端末１から送信される信号を受信する。また、通信インタフェース２１は、Ｗｉ－Ｆｉ（登録商標）等の無線通信規格に基づいて、ネットワークＮ１を介して再生システム３と通信を行うことにより、再生システム３へ信号を送信する。

　通信インタフェース２１は、入力インタフェース２１Ａと、出力インタフェース２１Ｂと、の両方の機能を有する。入力インタフェース２１Ａは、情報端末１から送信される信号を受信することにより、感情推定システム１０で推定した感情パラメータを取得する。入力インタフェース２１Ａは、コンテンツ決定システム２０における入力インタフェースの一例である。

　実施の形態では、入力インタフェース２１Ａは、ユーザの目標とする感情を示す目標パラメータを更に取得する。目標パラメータは、例えばコンテンツ決定システム２０の管理者によって事前に設定される。目標パラメータの設定は、例えば管理者が利用する情報端末にて実行される。入力インタフェース２１Ａは、管理者の情報端末から送信される信号を受信することにより、目標パラメータを取得する。なお、目標パラメータの設定は、例えばユーザによって事前に設定されてもよい。

　出力インタフェース２１Ｂは、再生システム３へ信号を送信することにより、ＣＰＵ２２で決定した音コンテンツに関する情報を出力する。実施の形態では、音コンテンツに関する情報は、音コンテンツを再生システム３で再生する順番を規定するプレイリストである。なお、プレイリストは、複数の音コンテンツを再生する順番を規定してもよいし、１つの音コンテンツのみをリピート再生することを規定してもよい。出力インタフェース２１Ｂは、コンテンツ決定システム２０における出力インタフェースの一例である。

　ＣＰＵ２２は、通信インタフェース２１を用いた信号の送信及び受信に関する情報処理、並びに通信インタフェース２１で取得した感情パラメータに基づいて音コンテンツを決定する情報処理を行う。実施の形態では、ＣＰＵ２２は、音コンテンツを決定する情報処理において、更に目標パラメータを参照する。音コンテンツを決定する情報処理については、後述する［音コンテンツの決定］にて詳細に説明する。

　上述の信号の送信処理及び受信処理、並びに音コンテンツの決定処理は、いずれもＣＰＵ２２がメモリ２３に記憶されたコンピュータプログラムを実行することにより実現される。ＣＰＵ２２は、コンテンツ決定システム２０の信号処理回路の一例である。

　メモリ２３は、ＣＰＵ２２が情報処理を行うために必要な各種情報、及びＣＰＵ２２が実行するコンピュータプログラム等が記憶される記憶装置である。メモリ２３は、例えば半導体メモリによって実現される。

　記憶装置２４は、ＣＰＵ２２が音コンテンツを決定する情報処理を実行する際に参照するデータベース２５が記憶される装置である。記憶装置２４は、例えばハードディスク、又はＳＳＤ（Ｓｏｌｉｄ　Ｓｔａｔｅ　Ｄｒｉｖｅ）等の半導体メモリによって実現される。データベース２５については、後述する［音コンテンツの決定］にて詳細に説明する。

　［１－３．再生システムの構成］
　次に、再生システム３の構成について具体的に説明する。再生システム３は、通信インタフェース３１と、ＣＰＵ３２と、メモリ３３と、記憶装置３４と、アンプ３５と、スピーカ３６と、を備えている。

　通信インタフェース３１は、例えば無線通信インタフェースであり、Ｗｉ－Ｆｉ（登録商標）等の無線通信規格に基づいて、ネットワークＮ１を介してサーバ２と通信を行う。通信インタフェース３１は、ネットワークＮ１を介してサーバ２と通信を行うことにより、サーバ２から信号を受信する。この信号には、コンテンツ決定システム２０で決定したプレイリストが含まれる。

　ＣＰＵ３２は、通信インタフェース３１を用いた信号の受信に関する情報処理、及び通信インタフェース３１で取得したプレイリストに従ってスピーカ３６に音コンテンツを再生させる情報処理を行う。すなわち、ＣＰＵ３２は、取得したプレイリストにて規定された音コンテンツを記憶装置３４から順次読み出し、読み出した音コンテンツを含む音信号を、アンプ３５を介してスピーカ３６で再生させる。これにより、スピーカ３６は、プレイリストで規定された順番に従って音コンテンツを再生する。上述の信号の受信処理、及び音コンテンツの処理は、いずれもＣＰＵ３２がメモリ３３に記憶されたコンピュータプログラムを実行することにより実現される。

　メモリ３３は、ＣＰＵ３２が情報処理を行うために必要な各種情報、及びＣＰＵ３２が実行するコンピュータプログラム等が記憶される記憶装置である。メモリ３３は、例えば半導体メモリによって実現される。

　記憶装置３４は、スピーカ３６で再生される複数の音コンテンツが記憶される装置である。記憶装置３４は、例えばハードディスク、又はＳＳＤ（Ｓｏｌｉｄ　Ｓｔａｔｅ　Ｄｒｉｖｅ）等の半導体メモリによって実現される。

　アンプ３５は、入力された音信号を増幅し、増幅した音信号をスピーカ３６へ出力する。実施の形態では、アンプ３５は、音信号のサンプリングレートを高いサンプリングレートに変換するアップサンプリング機能を有している。なお、アンプ３５は、アップサンプリング機能を有していなくてもよい。

　スピーカ３６は、アンプ３５で増幅された音信号を音に変換して出力することにより、音信号に基づく音コンテンツを再生する。

　［１－４．第１パラメータ、第２パラメータ、及び第３パラメータの入力］
　以下、ユーザの主観的な気分を示す第１パラメータ、ユーザの主観的な興奮度を示す第２パラメータ、及びユーザの主観的な弛緩度を示す第３パラメータの入力について図２～図４を用いて説明する。図２は、実施の形態に係る情報端末１における第１パラメータの入力画面１００の一例を示す図である。図３は、実施の形態に係る情報端末１における第２パラメータの入力画面２００の一例を示す図である。図４は、実施の形態に係る情報端末１における第３パラメータの入力画面３００の一例を示す図である。

　実施の形態では、第１パラメータ、第２パラメータ、及び第３パラメータは、いずれもユーザが情報端末１のユーザインタフェース１１にて入力する。具体的には、ユーザは、例えば情報端末１にインストールされている所定のアプリケーションを実行する。すると、情報端末１のユーザインタフェース１１には、まず、図２に示す第１パラメータの入力画面１００が表示される。この入力画面１００には、「どんな気分ですか？」というユーザに対する質問を表す文字列１０１と、第１パラメータを表す複数（ここでは、５つ）のアイコン１１１～１１５と、複数のアイコン１１１～１１５それぞれを説明する複数の文字列１２１～１２５と、が表示される。入力画面１００の下部においては、左から順に、落ち込んだ気分であることを表すアイコン１１１及び文字列１２１、憂鬱な気分であることを表すアイコン１１２及び文字列１２２、普通の気分であることを表すアイコン１１３及び文字列１２３、充足した気分であることを表すアイコン１１４及び文字列１２４、並びに愉快な気分であることを表すアイコン１１５及び文字列１２５が表示される。ユーザは、入力画面１００に触れる等して、いずれかのアイコン１１１～１１５を選択することにより、ユーザの主観的な気分を表す第１パラメータを入力することが可能である。

　ユーザが第１パラメータを入力すると、情報端末１のユーザインタフェース１１には、次に図３に示す第２パラメータの入力画面２００が表示される。この入力画面２００には、「今の気分はどのくらいですか？」というユーザに対する質問を表す文字列２０１と、第２パラメータを表す複数（ここでは、５つ）のアイコン２１１～２１５と、複数のアイコン２１１～２１５それぞれを説明する複数の文字列２２１～２２５と、が表示される。複数の文字列２２１～２２５は、それぞれ元気の度合いを百分率で表した値である。入力画面２００の下部においては、左から順に、全く元気がないことを表すアイコン２１１及び文字列２２１、あまり元気でないことを表すアイコン２１２及び文字列２２２、普通であることを表すアイコン２１３及び文字列２２３、やや元気であることを表すアイコン２１４及び文字列２２４、並びにとても元気であることを表すアイコン２１５及び文字列２２５が表示される。ユーザは、入力画面２００に触れる等して、いずれかのアイコン２１１～２１５を選択することにより、ユーザの主観的な興奮度を示す第２パラメータを入力することが可能である。

　ユーザが第２パラメータを入力すると、情報端末１のユーザインタフェース１１には、次に図４に示す第３パラメータの入力画面３００が表示される。この入力画面３００には、「今のリラックス度はどのくらいですか？」というユーザに対する質問を表す文字列３０１と、第３パラメータを表す複数（ここでは、５つ）のアイコン３１１～３１５と、複数のアイコン３１１～３１５それぞれを説明する複数の文字列３２１～３２５と、が表示される。入力画面３００の下部においては、左から順に、全くリラックスしていないことを表すアイコン３１１及び文字列３２１、あまりリラックスしていないことを表すアイコン３１２及び文字列３２２、普通であることを表すアイコン３１３及び文字列３２３、ややリラックスしていることを表すアイコン３１４及び文字列３２４、並びにとてもリラックスしていることを表すアイコン３１５及び文字列３２５が表示される。ユーザは、入力画面３００に触れる等して、いずれかのアイコン３１１～３１５を選択することにより、ユーザの主観的な弛緩度を示す第３パラメータを入力することが可能である。

　なお、実施の形態では、情報端末１のユーザインタフェース１１には、第１パラメータの入力画面１００、第２パラメータの入力画面２００、及び第３パラメータの入力画面３００がこの順に表示されるが、これらの入力画面１００～３００の表示順は、この順に限られない。例えば、情報端末１のユーザインタフェース１１には、第３パラメータの入力画面３００、第２パラメータの入力画面２００、及び第１パラメータの入力画面１００がこの順に表示されてもよい。

　また、実施の形態では、第１パラメータ、第２パラメータ、及び第３パラメータは、いずれも５つの段階で表されているが、これに限られない。例えば、第１パラメータ、第２パラメータ、及び第３パラメータの少なくとも１つは、５未満の段階で表されてもよいし、５よりも多い段階で表されてもよい。

　［１－５．ユーザの感情の推定］
　以下、感情推定システム１０のＣＰＵ１３による感情パラメータを推定する情報処理について、図５及び図６を用いて説明する。図５は、実施の形態に係るアフェクトグリッドの一例を示す図である。実施の形態に係る感情推定システム１０によるユーザの感情の推定の説明図である。図５及び図６は、いずれもユーザの感情を示す感情パラメータを２次元座標で評価するアフェクトグリッド（Ａｆｆｅｃｔ　Ｇｒｉｄ）法に基づく２次元直交座標系を示す図である。アフェクトグリッド法については、Ｒｕｓｓｅｌｌ，　Ｊ．　Ａ．，　Ｗｅｉｓｓ，　Ａ．，　＆　Ｍｅｎｄｅｌｓｏｈｎ，　Ｇ．　Ａ．　（１９８９）．　Ａｆｆｅｃｔ　ｇｒｉｄ：　ａ　ｓｉｎｇｌｅ－ｉｔｅｍ　ｓｃａｌｅ　ｏｆ　ｐｌｅａｓｕｒｅ　ａｎｄ　ａｒｏｕｓａｌ．　Ｊｏｕｒｎａｌ　ｏｆ　ｐｅｒｓｏｎａｌｉｔｙ　ａｎｄ　ｓｏｃｉａｌ　ｐｓｙｃｈｏｌｏｇｙ，　５７（３），　４９３．を参照されたい。

　図５及び図６に示すように、感情パラメータは、快適度を示す第１軸Ａ１と、覚醒度を示す第２軸Ａ２と、で定義される平面（アフェクトグリッド）の座標で表される。第１軸Ａ１においては、快適度は、－１．０（不快）から＋１．０（快適）までの値で示される。第２軸Ａ２においては、覚醒度は、－１．０（沈静）から＋１．０（覚醒）までの値で示される。なお、快適度の数値及び覚醒度の数値は、いずれも±１．０の範囲で正規化した数値であって、この数値に限定する意図ではない。

　また、実施の形態のアフェクトグリッドにおいては、興奮度を示す第３軸Ａ３と、弛緩度を示す第４軸Ａ４と、が更に定義されている。第３軸Ａ３は、第１軸Ａ１を平面（アフェクトグリッド）の原点を基準として第１角度θ１回転させた軸である。ここでは、第１角度θ１は４５度であり、第３軸Ａ３は、原点を基準として第１軸Ａ１を反時計回りに回転させた軸である。第３軸Ａ３においては、興奮度は、ユーザが興奮を覚える度合いが大きい程、正の値が大きく、ユーザが倦怠感を覚える度合いが大きい程、負の値が大きくなるように示される。なお、第１角度θ１は、４５度に限られず、興奮度を示すことが可能な角度であればよい。

　第４軸Ａ４は、第２軸Ａ２を平面（アフェクトグリッド）の原点を基準として第２角度θ２回転させた軸である。ここでは、第２角度θ２は４５度であり、第４軸Ａ４は、原点を基準として第２軸Ａ２を反時計回りに回転させた軸である。第４軸Ａ４においては、弛緩度は、ユーザが弛緩している度合いが大きい程、正の値が大きく、ユーザが緊張を覚える度合いが大きい程、負の値が大きくなるように示される。なお、第２角度θ２は、４５度に限られず、弛緩度を示すことが可能な角度であればよい。

　感情推定システム１０のＣＰＵ１３は、まず、第１パラメータに基づいて、平面（アフェクトグリッド）での始点Ｐ０（図６参照）を決定する。具体的には、入力画面１００でユーザがアイコン１１１を選択した場合、つまりユーザが落ち込んだ気分であることを示す第１パラメータを入力した場合、ＣＰＵ１３は、点Ｐ１を始点Ｐ０として決定する。また、入力画面１００でユーザがアイコン１１２を選択した場合、つまりユーザが憂鬱な気分であることを示す第１パラメータを入力した場合、ＣＰＵ１３は、点Ｐ２を始点Ｐ０として決定する。また、入力画面１００でユーザがアイコン１１３を選択した場合、つまりユーザが普通の気分であることを示す第１パラメータを入力した場合、ＣＰＵ１３は、点Ｐ３を始点Ｐ０として決定する。点Ｐ３は、アフェクトグリッドの原点である。また、入力画面１００でユーザがアイコン１１４を選択した場合、つまりユーザが充足した気分であることを示す第１パラメータを入力した場合、ＣＰＵ１３は、点Ｐ４を始点Ｐ０として決定する。また、入力画面１００でユーザがアイコン１１５を選択した場合、つまりユーザが愉快な気分であることを示す第１パラメータを入力した場合、ＣＰＵ１３は、点Ｐ５を始点Ｐ０として決定する。

　次に、ＣＰＵ１３は、第１移動量Ｍ１（図６参照）を決定する。第１移動量Ｍ１は、第３軸Ａ３に沿った第２パラメータに基づく移動量である。つまり、第１移動量Ｍ１は、第３軸Ａ３に平行なベクトルで表される。具体的には、入力画面２００でユーザがアイコン２１１を選択した場合、つまりユーザが全く元気でないことを示す第２パラメータを入力した場合、ＣＰＵ１３は、第１移動量Ｍ１を負の向き（図６における左下向き）のベクトルに決定する。また、入力画面２００でユーザがアイコン２１２を選択した場合、つまりユーザがあまり元気でないことを示す第２パラメータを入力した場合、ＣＰＵ１３は、第１移動量Ｍ１を負の向きのベクトルに決定する。このベクトルは、ユーザが全く元気でない場合のベクトルよりも移動量が小さい。また、入力画面２００でユーザがアイコン２１３を選択した場合、つまりユーザが普通であることを示す第２パラメータを入力した場合、ＣＰＵ１３は、第１移動量Ｍ１を零に決定する。また、入力画面２００でユーザがアイコン２１４を選択した場合、つまりユーザがやや元気であることを示す第２パラメータを入力した場合、ＣＰＵ１３は、第１移動量Ｍ１を正の向き（図６における右上向き）のベクトルに決定する。また、入力画面２００でユーザがアイコン２１５を選択した場合、つまりユーザがとても元気であることを示す第２パラメータを入力した場合、ＣＰＵ１３は、第１移動量Ｍ１を正の向きのベクトルに決定する。このベクトルは、ユーザがやや元気である場合のベクトルよりも移動量が大きい。

　次に、ＣＰＵ１３は、第２移動量Ｍ２（図６参照）を決定する。第２移動量Ｍ２は、第４軸Ａ４に沿った第３パラメータに基づく移動量である。つまり、第２移動量Ｍ２は、第４軸Ａ４に平行なベクトルで表される。具体的には、入力画面３００でユーザがアイコン３１１を選択した場合、つまりユーザが全くリラックスしていないことを示す第３パラメータを入力した場合、ＣＰＵ１３は、第２移動量Ｍ２を負の向き（図６における左上向き）のベクトルに決定する。また、入力画面３００でユーザがアイコン３１２を選択した場合、つまりユーザがあまりリラックスしていないことを示す第３パラメータを入力した場合、ＣＰＵ１３は、第２移動量Ｍ２を負の向きのベクトルに決定する。このベクトルは、ユーザが全くリラックスしていない場合のベクトルよりも移動量が小さい。また、入力画面３００でユーザがアイコン３１３を選択した場合、つまりユーザが普通であることを示す第３パラメータを入力した場合、ＣＰＵ１３は、第２移動量Ｍ２を零に決定する。また、入力画面３００でユーザがアイコン３１４を選択した場合、つまりユーザがややリラックスしていることを示す第３パラメータを入力した場合、ＣＰＵ１３は、第２移動量Ｍ２を正の向き（図６における右下向き）のベクトルに決定する。また、入力画面３００でユーザがアイコン３１５を選択した場合、つまりユーザがとてもリラックスしていることを示す第３パラメータを入力した場合、ＣＰＵ１３は、第２移動量Ｍ２を正の向きのベクトルに決定する。このベクトルは、ユーザがややリラックスしている場合のベクトルよりも移動量が大きい。

　そして、ＣＰＵ１３は、第１移動量Ｍ１及び第２移動量Ｍ２に応じて始点Ｐ０を移動させることで、感情パラメータＰ１０を推定する。すなわち、ＣＰＵ１３は、アフェクトグリッドにおいて、始点Ｐ０を第１移動量Ｍ１が示すベクトル分だけ移動させ、更に第２移動量Ｍ２が示すベクトル分だけ移動させ、移動後の座標を感情パラメータＰ１０として推定する。図６は、入力画面１００でユーザがアイコン１１２を選択（つまりユーザが憂鬱な気分であることを示す第１パラメータを入力）し、かつ、入力画面２００でユーザがアイコン２１４を選択（つまりユーザがやや元気であることを示す第２パラメータを入力）し、かつ、入力画面３００でユーザがアイコン３１４を選択（つまりユーザがややリラックスしていることを示す第３パラメータを入力）した場合の感情パラメータＰ１０の例を表している。

　上述のように、ユーザの感情を示す感情パラメータは、快適度及び覚醒度によってあらわされる。そして、実施の形態に係る感情推定システム１０は、ユーザの感情についてのユーザの主観的な評価に基づいて、すなわちユーザの主観的な気分を示す第１パラメータ、ユーザの主観的な興奮度を示す第２パラメータ、及びユーザの主観的な弛緩度を示す第３パラメータに基づいて、快適度及び覚醒度を求めることにより、ユーザの感情を推定することができる。このため、感情推定システム１０では、特許文献１に開示の技術のようにユーザの生体データを取得しなくて済むので、ユーザの生体データを取得するための手段を別途用意する必要がない。また、感情推定システム１０では、ユーザの３つの主観的な評価に基づいてユーザの感情を推定することができるので、ユーザが多数の問い合わせについて回答する必要がない。したがって、感情推定システム１０では、比較的簡易な手法によりユーザの感情を推定しやすい、という利点がある。

　［１－６．音コンテンツの決定］
　以下、コンテンツ決定システム２０のＣＰＵ２２による音コンテンツを決定する情報処理について説明する。ＣＰＵ２２は、感情推定システム１０で推定した感情パラメータが、ユーザが誘導される感情を示す誘導パラメータへと変化するように、音コンテンツを決定する。つまり、ＣＰＵ２２は、音コンテンツを再生する前におけるユーザの感情を、音コンテンツを再生することで所定の感情に変化させるように、音コンテンツを決定する。ここでいう誘導パラメータは、感情パラメータの一種であって、ユーザに音コンテンツを聴かせることによりユーザに抱かせたい先の感情を示すパラメータである。

　実施の形態では、ＣＰＵ２２は、データベース２５を参照して、音コンテンツを決定する情報処理を実現している。そして、データベース２５は、図７に示す機械学習済みの予測モデル４を用いて、事前に構築される。図７は、実施の形態に係るコンテンツ決定システム２０で用いられる予測モデル４の説明図である。予測モデル４は、音コンテンツの再生前における感情パラメータ及び音響特徴量を入力として、音コンテンツの再生後における感情パラメータを出力するように、教師あり学習により機械学習されたニューラルネットワークである。つまり、予測モデル４は、ある感情を抱いているユーザに対して音コンテンツを再生した場合に、ユーザの感情がどのような感情に誘導されるかを評価したモデルである。

　ここで、音響特徴量は、音コンテンツから抽出される、音信号の物理的な特徴量である。例えば、音響特徴量は、テンポ（音コンテンツの速さ）、ビート白色性（ビート形成に寄与する音と、寄与しない音との出現頻度の比率）、スペクトル変化度（所定の時間長のフレーム間でのスペクトル変化の度合い）、及び平均発音数（音コンテンツで発音される音の発音頻度）等を含み得る。また、音響特徴量は、例えば人の聴覚特性を考慮した音色を表すスペクトルであるＭＦＣＣ（Ｍｅｌ－ｆｒｅｑｕｅｎｃｙ　ｃｅｐｓｔｒａｌ　ｃｏｅｆｆｉｃｉｅｎｔｓ）、音の和音、及び周波数領域のエネルギー分布のコントラスト等の特徴量も含み得る。予測モデル４を機械学習する際には、これらの音響特徴量のうちの１以上の音響特徴量を用いる。

　予測モデル４は、事前に準備した多数の学習用データセットを用いて機械学習される。学習用データセットは、入力データとしての感情パラメータ及び音響特徴量と、正解データと、を含む。学習用データセットは、例えば第１パラメータ、第２パラメータ、及び第３パラメータを入力した被験者に対して音コンテンツを聴かせた後に、再び第１パラメータ、第２パラメータ、及び第３パラメータを入力させることで生成することが可能である。つまり、学習用データセットは、音コンテンツを聴く前に被験者が入力した第１パラメータ、第２パラメータ、及び第３パラメータに基づく感情パラメータと、被験者に聴かせる音コンテンツから抽出される音響特徴量と、当該音コンテンツを聴いた後に被験者が入力した第１パラメータ、第２パラメータ、及び第３パラメータに基づく正解データとしての感情パラメータと、を含む。

　ここで、被験者が音コンテンツを聴くことによる感情の変化は、被験者が音コンテンツを聴く時間帯によって異なり得る。すなわち、例えば被験者の疲れ具合、又は被験者が直接的若しくは間接的に受ける太陽光の量等に起因して、同じ音コンテンツを聴いた場合でも、被験者の感情の変化が異なり得る。このため、実施の形態では、朝、昼、及び夜の３つの時間帯にそれぞれ対応する３つの予測モデル４を準備する。

　次に、データベース２５の構築について説明する。まず、任意の音コンテンツから音響特徴量を抽出する。そして、抽出した音響特徴量と、音コンテンツを聴かせる前の感情パラメータとを、機械学習済みの予測モデル４に入力することで、予測モデル４が出力する当該音コンテンツを聴かせた後の感情パラメータを得る。上記と同様の作業を、予測モデル４に入力する音響特徴量を固定して全ての感情パラメータについて行う。これにより、任意の音コンテンツについて、抽出した音響特徴量に対応する音コンテンツの識別子（例えば、音コンテンツの曲名）と、当該音コンテンツを聴かせる前の感情パラメータと、当該音コンテンツを聴かせた後の感情パラメータと、分類確率と、を紐づけたデータセットを得ることができる。ここで、分類確率は、予測モデル４が当該音コンテンツを聴かせた後の感情パラメータに分類する確率をいう。以下、準備した全ての音コンテンツ及び全ての予測モデル４について上記の作業を行うことにより、全ての音コンテンツそれぞれのデータセットを得る、つまりデータベース２５を構築することができる。

　そして、ＣＰＵ２２は、上記のように構築したデータベース２５を用いて、音コンテンツを決定する情報処理を実行する。具体的には、ＣＰＵ２２は、感情パラメータ（音コンテンツを聴かせる前の感情パラメータ）及び誘導パラメータ（音コンテンツを聴かせた後の感情パラメータ）の組み合わせが一致する音コンテンツをデータベース２５から検索する。なお、ＣＰＵ２２は、感情パラメータ及び誘導パラメータの組み合わせが一致する音コンテンツが存在しない場合、当該組み合わせに最も近い音コンテンツをデータベース２５から検索する。そして、ＣＰＵ２２は、検索した音コンテンツのうち分類確率が高い音コンテンツを優先的に選択することで、音コンテンツを決定し、決定した音コンテンツを含むプレイリストを生成する。

　［２．動作］
　以下、実施の形態に係る感情推定システム１０及びコンテンツ決定システム２０の動作の一例について、図８、図９、及び図１０を用いて説明する。図８は、実施の形態に係る感情推定システム１０及びコンテンツ決定システム２０の動作の一例を示す概要図である。図９は、実施の形態に係る感情推定システム１０の動作の一例を示すフローチャートである。図１０は、実施の形態に係るコンテンツ決定システム２０の動作の一例を示すフローチャートである。以下では、オフィスに複数のユーザＵ１が存在することとして説明する。

　まず、感情推定システム１０の動作の一例について説明する。各ユーザＵ１は、自身が利用する情報端末１のユーザインタフェース１１で第１パラメータ、第２パラメータ、及び第３パラメータを入力する。これにより、ユーザインタフェース１１は、第１パラメータ、第２パラメータ、及び第３パラメータを取得する（Ｓ１１）。次に、情報端末１のＣＰＵ１３は、ユーザインタフェース１１で取得した第１パラメータ、第２パラメータ、及び第３パラメータに基づいて、ユーザＵ１の感情を示す感情パラメータを推定する（Ｓ１２）。そして、情報端末１の通信インタフェース１２は、ＣＰＵ１３で推定した感情パラメータを含む信号を、ネットワークＮ１を介してサーバ２へ送信することにより、感情パラメータを出力する（Ｓ１３）。これにより、サーバ２には、各ユーザＵ１の情報端末１で推定した感情パラメータが出力される。

　次に、コンテンツ決定システム２０の動作の一例について説明する。サーバ２の通信インタフェース２１（入力インタフェース２１Ａ）は、情報端末１から送信される信号を受信することにより、感情パラメータを取得する（Ｓ２１）。ここでは、通信インタフェース２１は、各ユーザＵ１の感情パラメータを取得する。また、通信インタフェース２１は、管理者の情報端末から送信される信号を受信することにより、目標パラメータを取得する（Ｓ２２）。ここでいう目標パラメータは、誘導パラメータと同様に、各ユーザＵ１に音コンテンツを聴かせることにより各ユーザＵ１に抱かせたい先の感情を示すパラメータであるが、誘導パラメータとは異なるパラメータである。すなわち、目標パラメータは、各ユーザＵ１に音コンテンツを聴かせることにより、各ユーザＵ１に最終的に抱かせたい感情を示すパラメータである。

　実施の形態では、朝、昼、及び夜の３つの時間帯の各々で目標とする各ユーザＵ１の感情の傾向が異なっている。具体的には、朝の時間帯においては、興奮度及び覚醒度が比較的大きい感情（つまり、図５に示すアフェクトグリッドの第１象限のうち第３軸Ａ３よりも上方の領域で示される感情）を目標とする。また、昼の時間帯においては、興奮度及び快適度が比較的大きい感情（つまり、図５に示すアフェクトグリッドの第１象限のうち第３軸Ａ３よりも下方の領域で示される感情）を目標とする。また、夜の時間帯においては、弛緩度が比較的大きい感情（つまり、図５に示すアフェクトグリッドの第４象限で示される感情）を目標とする。したがって、ここでは、通信インタフェース２１は、朝、昼、及び夜の各々の時間帯の目標パラメータを取得する。ステップＳ２２は、ステップＳ２１よりも前のタイミングで行われてもよい。

　次に、サーバ２のＣＰＵ２２は、取得した感情パラメータ及び目標パラメータに基づいて、音コンテンツを決定する情報処理を実行する。この情報処理においては、各ユーザＵ１の感情パラメータの代表値を用いる。例えば、代表値は、各ユーザＵ１の感情パラメータの移動平均値である。移動平均値は、各ユーザＵ１のオフィスの滞在時間に応じて重み付けを行って算出してもよい。例えば、ユーザＵ１の滞在時間が短い程、重み付けを大きくし、ユーザＵ１の滞在時間が長い程、重み付けを小さくしてもよい。

　ＣＰＵ２２は、取得した感情パラメータ及び目標パラメータに基づいて、誘導パラメータを設定する（Ｓ２３）。ステップＳ２３においては、ＣＰＵ２２は、現在の時刻を取得し、現在の時刻に基づいて朝、昼、及び夜の３つの時間帯にそれぞれ対応する３つの目標パラメータから１つの目標パラメータを選択する。次に、ＣＰＵ２２は、設定した誘導パラメータ及び目標パラメータにそれぞれ対応するプレイリストを生成する（Ｓ２４）。そして、通信インタフェース２１（出力インタフェース２１Ｂ）は、ＣＰＵ２２で生成したプレイリストを含む信号を、ネットワークＮ１を介して再生システム３へ送信することにより、プレイリストを出力する（Ｓ２５）。

　ここで、誘導パラメータの設定及びプレイリストの生成について、図１１を用いて説明する。図１１は、実施の形態に係るコンテンツ決定システム２０におけるプレイリストの生成の一例の説明図である。図１１は、図５と同様に、アフェクトグリッドを示している。なお、図１１では、第３軸Ａ３及び第４軸Ａ４の図示を省略している。また、図１１では、朝の時間帯の目標パラメータＰ２１と、昼の時間帯の目標パラメータＰ２２と、夜の時間帯の目標パラメータＰ２３，Ｐ２４と、を図示している。図１１に示す例では、時間帯が昼であり、ＣＰＵ２２は、目標パラメータＰ２２を用いることとする。

　まず、ＣＰＵ２２は、アフェクトグリッド上における感情パラメータＰ１０と目標パラメータＰ２２との間の距離（つまり、差分）を算出する。そして、ＣＰＵ２２は、算出した距離に基づいて、感情パラメータＰ１０が目標パラメータＰ２２に近づくように、誘導パラメータを設定する。例えば、ＣＰＵ２２は、算出した距離が等間隔に分割されるように、誘導パラメータを設定する。図１１に示す例では、ＣＰＵ２２は、３つの誘導パラメータＰ３１～Ｐ３３を設定している。なお、算出した距離が閾値よりも短い場合、つまり、感情パラメータと目標パラメータとが近接している場合、ＣＰＵ２２は、誘導パラメータを設定しなくてもよい。

　次に、ＣＰＵ２２は、誘導パラメータ及び目標パラメータの各々に対応するプレイリストを生成する。ここでは、ＣＰＵ２２は、３つの誘導パラメータＰ３１～Ｐ３３にそれぞれ対応するプレイリストと、目標パラメータに対応するプレイリストと、を生成する。

　例えば、誘導パラメータＰ３１に対応するプレイリストを生成する場合、ＣＰＵ２２は、感情パラメータＰ１０及び誘導パラメータＰ３１の組み合わせが一致する音コンテンツをデータベース２５から検索することにより、音コンテンツを決定し、決定した音コンテンツを含むプレイリストを生成する。

　また、例えば、誘導パラメータＰ３２に対応するプレイリストを生成する場合、ＣＰＵ２２は、誘導パラメータＰ３１を感情パラメータとして、当該感情パラメータ及び誘導パラメータＰ３２の組み合わせが一致する音コンテンツをデータベース２５から検索することにより、音コンテンツを決定し、決定した音コンテンツを含むプレイリストを生成する。また、例えば、誘導パラメータＰ３３に対応するプレイリストを生成する場合、ＣＰＵ２２は、誘導パラメータＰ３２を感情パラメータとして、当該感情パラメータ及び誘導パラメータＰ３３の組み合わせが一致する音コンテンツをデータベース２５から検索することにより、音コンテンツを決定し、決定した音コンテンツを含むプレイリストを生成する。

　また、例えば、目標パラメータＰ２２に対応するプレイリストを生成する場合、ＣＰＵ２２は、誘導パラメータＰ３３を感情パラメータ、目標パラメータＰ２２を誘導パラメータとして、当該感情パラメータ及び当該誘導パラメータの組み合わせが一致する音コンテンツをデータベース２５から検索することにより、音コンテンツを決定し、決定した音コンテンツを含むプレイリストを生成する。

　プレイリストを含む信号を受信した再生システム３は、取得したプレイリストに従って音コンテンツを再生する。例えば、図１１に示す例に従ってコンテンツ決定システム２０のＣＰＵ２２がプレイリストを生成した場合、再生システム３は、まず、誘導パラメータＰ３１に対応するプレイリストに従って音コンテンツを所定の時間（例えば、３０分）再生する。その後、再生システム３は、誘導パラメータＰ３２に対応するプレイリスト、誘導パラメータＰ３３に対応するプレイリスト、及び目標パラメータＰ２２に対応するプレイリストにそれぞれ従って、音コンテンツを所定の時間ずつ再生する。

　ここで、再生システム３が誘導パラメータＰ３１～Ｐ３３に対応するプレイリストに従って音コンテンツを再生せずに、目標パラメータＰ２２に対応するプレイリストに従って音コンテンツを再生した場合、以下のような問題が生じ得る。すなわち、目標パラメータＰ２２で表される感情が、感情パラメータＰ１０で表される感情と大きく乖離しているため、目標パラメータＰ２２に対応するプレイリストに従って音コンテンツを再生しても、ユーザＵ１が不快感を覚えるだけで、ユーザＵ１の感情を目標パラメータＰ２２で表される感情へと誘導する効果が期待できない。

　これに対して、上述のように再生システム３が誘導パラメータＰ３１～Ｐ３３に対応するプレイリストに従って音コンテンツを再生することにより、ユーザＵ１の感情を、感情パラメータＰ１０で表される感情から徐々に目標パラメータＰ２２で表される感情へと誘導することが可能である。

　ところで、再生システム３が音コンテンツを再生している過程において時間帯が変化する場合がある。このような場合、コンテンツ決定システム２０のＣＰＵ２２は、誘導パラメータ及び目標パラメータを再設定し、再設定した誘導パラメータ及び目標パラメータに基づいてプレイリストを再生成する。

　図１２は、実施の形態に係るコンテンツ決定システム２０におけるプレイリストの再生成の一例の説明図である。図１２は、図１１と同様に、アフェクトグリッドを示しており、かつ、第３軸Ａ３及び第４軸Ａ４の図示を省略している。また、図１２では、図１１と同様に、朝の時間帯の目標パラメータＰ２１と、昼の時間帯の目標パラメータＰ２２と、夜の時間帯の目標パラメータＰ２３，Ｐ２４と、を図示している。図１２に示す例では、昼の時間帯において、昼の時間帯の目標パラメータＰ２２に基づいて１以上の誘導パラメータ及び１以上の誘導パラメータに対応するプレイリストを生成していることとする。そして、図１２に示す例では、誘導パラメータＰ３２に対応するプレイリストに従って再生システム３が音コンテンツを再生している際に、時間帯が昼から夜へと変化したこととする。

　図１２に示す例では、ＣＰＵ２２は、時間帯が昼から夜へと変化した時点で再生しているプレイリスト（ここでは、誘導パラメータＰ３２に対応するプレイリスト）の再生が終了してから、誘導パラメータ及び目標パラメータの再設定、並びにプレイリストの再生成を実行し、再生システム３に再生成したプレイリストの再生を開始する。

　具体的には、ＣＰＵ２２は、まず、目標パラメータを、目標パラメータＰ２２から目標パラメータＰ２３へと再設定する。ここで、時間帯が昼から夜へと変化した時点で、ユーザＵ１の感情は、誘導パラメータＰ３１で表される感情と、誘導パラメータＰ３２で表される感情との間にあると推定される。そして、当該時点で再生している誘導パラメータＰ３２に対応するプレイリストの再生が終了すると、ユーザＵ１の感情は、誘導パラメータＰ３２で表される感情に誘導されていると推定される。そこで、ＣＰＵ２２は、誘導パラメータＰ３２を新たな始点となる感情パラメータとして、当該感情パラメータと新たな目標パラメータＰ２３との間の距離（つまり、差分）を算出する。そして、ＣＰＵ２２は、算出した距離に基づいて、上記新たな感情パラメータが新たな目標パラメータＰ２３に近づくように、新たな誘導パラメータを再設定する。図１２に示す例では、ＣＰＵ２２は、誘導パラメータＰ３４を新たな誘導パラメータとして再設定している。

　ＣＰＵ２２は、再設定した誘導パラメータＰ３４に対応するプレイリストと、再設定した目標パラメータＰ２３に対応するプレイリストを再生成する。そして、通信インタフェース２１（出力インタフェース２１Ｂ）は、ＣＰＵ２２で再生成したプレイリストを含む信号を、ネットワークＮ１を介して再生システム３へ送信する。これにより、再生システム３は、誘導パラメータＰ３２に対応するプレイリストに従って音コンテンツを再生した後は、再設定した誘導パラメータＰ３４に対応するプレイリスト、及び再設定した目標パラメータＰ２３に対応するプレイリストにそれぞれ従って、音コンテンツを所定の時間ずつ再生する。これにより、ユーザＵ１の感情を、変化後の時間帯に対応する目標パラメータで表される感情へと誘導することが可能である。

　また、上記の動作において、ＣＰＵ２２は、時間帯が昼から夜へと変化した時点で、当該時点で再生しているプレイリスト（ここでは、誘導パラメータＰ３２に対応するプレイリスト）の再生を直ちに終了させ、誘導パラメータ及び目標パラメータの再設定、並びにプレイリストの再生成を実行し、再生システム３に再生成したプレイリストの再生を開始させてもよい。すなわち、この場合、ＣＰＵ２２は、図１２に示す例と同様に、誘導パラメータＰ３２を新たな始点となる感情パラメータとして、新たな誘導パラメータの再設定、及び新たな誘導パラメータに対応するプレイリストを再生成する。ただし、この場合、新たな誘導パラメータに対応するプレイリストの再生は、現在のプレイリスト（誘導パラメータＰ３２に対応するプレイリスト）の再生が終了した時点で開始されるのではなく、時間帯が昼から夜へと変化した時点で開始されることになる。

　また、上記の動作において、ＣＰＵ２２は、時間帯が昼から夜へと変化した時点で、当該時点で再生しているプレイリスト（ここでは、誘導パラメータＰ３２に対応するプレイリスト）の再生を直ちに終了させ、当該時点で再生しているプレイリストの１つ前のプレイリストに対応する誘導パラメータ（ここでは、誘導パラメータＰ３１）を新たな始点となる感情パラメータとして、誘導パラメータ及び目標パラメータの再設定、並びにプレイリストの再生成を実行してもよい。すなわち、この場合、ＣＰＵ２２は、誘導パラメータＰ３１を新たな始点となる感情パラメータとして、新たな誘導パラメータの再設定、及び新たな誘導パラメータに対応するプレイリストを再生成する。また、この場合、新たな誘導パラメータに対応するプレイリストの再生は、時間帯が昼から夜へと変化した時点で開始されることになる。

　［３．効果等］
　以上説明したように、ＣＰＵ１３等のコンピュータによって実行される第１の態様に係る感情推定方法では、ユーザの主観的な気分を示す第１パラメータ、ユーザの主観的な興奮度を示す第２パラメータ、及びユーザの主観的な弛緩度を示す第３パラメータを取得し（Ｓ１１）、取得した第１パラメータ、第２パラメータ、及び第３パラメータに基づいて、ユーザの感情を示す感情パラメータを推定し（Ｓ１２）、感情パラメータに関する情報を出力する（Ｓ１３）。

　このような感情推定方法では、特許文献１に開示の技術のようにユーザの生体データを取得しなくて済むので、ユーザの生体データを取得するための手段を別途用意する必要がない。また、このような感情推定方法では、ユーザの３つの主観的な評価に基づいてユーザの感情を推定することができるので、ユーザが多数の問い合わせについて回答する必要がない。したがって、このような感情推定方法では、比較的簡易な手法によりユーザの感情を推定しやすい、という利点がある。

　また、例えば、第２の態様に係る感情推定方法では、第１の態様において、感情パラメータは、快適度を示す第１軸Ａ１と、覚醒度を示す第２軸Ａ２とで定義される平面の座標として表される。感情推定方法では、第１パラメータに基づいて平面での始点Ｐ０を決定し、第１軸Ａ１を平面の原点を基準として第１角度θ１回転させた第３軸Ａ３に沿った第２パラメータに基づく第１移動量Ｍ１と、第２軸Ａ２を原点を基準として第２角度θ２回転させた第４軸Ａ４に沿った第３パラメータに基づく第２移動量Ｍ２と、に応じて始点Ｐ０を移動させることで感情パラメータを推定する。

　このような感情推定方法では、ユーザの感情を平面の座標で表すことで、ユーザの感情を定量的に推定しやすい、という利点がある。

　また、例えば、第３の態様に係る感情推定方法では、第２の態様において、第１角度θ１及び第２角度θ２は、いずれも４５度である。第３軸Ａ３は、興奮度を示す軸であり、第４軸Ａ４は、弛緩度を示す軸である。

　このような感情推定方法では、ユーザの感情を平面の座標で表す際に、第２パラメータ及び第３パラメータを座標に反映しやすい、という利点がある。

　また、例えば、ＣＰＵ２２等のコンピュータによって実行される第４の態様に係るコンテンツ決定方法では、上記の第１～第３の態様のいずれか１つの態様の感情推定方法で推定した感情パラメータを取得し（Ｓ２１）、取得した感情パラメータに基づいて、ユーザに対して提供するコンテンツを決定し（Ｓ２４）、決定したコンテンツに関する情報を出力する（Ｓ２５）。

　このようなコンテンツ決定方法では、推定したユーザの感情に応じたコンテンツをユーザに提供することで、例えばコンテンツの提供によりユーザの感情を所定の感情へ誘導させやすくなる、という利点がある。

　また、例えば、第５の態様に係るコンテンツ決定方法では、第４の態様において、ユーザの目標とする感情を示す目標パラメータを更に取得し（Ｓ２２）、感情パラメータと、目標パラメータとの差分に基づいて、コンテンツを決定する（Ｓ２４）。

　このようなコンテンツ決定方法では、ユーザの感情を目標とする感情へと誘導させるコンテンツをユーザに提供しやすくなる、という利点がある。

　また、例えば、第６の態様に係るコンテンツ決定方法では、第５の態様において、上記差分に基づいて、感情パラメータが目標パラメータに近づくようにユーザが誘導される感情を示す誘導パラメータを設定し（Ｓ２３）、誘導パラメータに基づいて、コンテンツを決定する（Ｓ２４）。

　このようなコンテンツ決定方法では、ユーザの感情を目標とする感情へと誘導させる効果が更に期待できるコンテンツをユーザに提供しやすくなる、という利点がある。

　また、例えば、第７の態様に係るプログラムは、ＣＰＵ１３等のコンピュータに、上記の第１～第３の態様のいずれか１つの態様の感情推定方法を実行させる。

　このようなプログラムは、上記の感情推定方法と同様の効果を奏することができる。

　また、例えば、第８の態様に係るプログラムは、ＣＰＵ２２等のコンピュータに、上記の第４～第６の態様のいずれか１つの態様のコンテンツ決定方法を実行させる。

　このようなプログラムは、上記のコンテンツ決定方法と同様の効果を奏することができる。

　また、例えば、第９の態様に係る感情推定システム１０は、ユーザインタフェース１１と、ＣＰＵ１３と、通信インタフェース１２と、を備える。ユーザインタフェース１１は、ユーザの主観的な気分を示す第１パラメータ、ユーザの主観的な興奮度を示す第２パラメータ、及びユーザの主観的な弛緩度を示す第３パラメータを取得する。ＣＰＵ１３は、取得した第１パラメータ、第２パラメータ、及び第３パラメータに基づいて、ユーザの感情を示す感情パラメータを推定する。通信インタフェース１２は、感情パラメータに関する情報を出力する。ユーザインタフェース１１は、入力インタフェースの一例である。ＣＰＵ１３は、信号処理回路の一例である。通信インタフェース１２は、出力インタフェースの一例である。

　このような感情推定システム１０は、上記の感情推定方法と同様の効果を奏することができる。

　また、例えば、第１０の態様に係るコンテンツ決定システム２０は、入力インタフェース２１Ａと、ＣＰＵ２２と、出力インタフェース２１Ｂと、を備える。入力インタフェース２１Ａは、第９の態様に係る感情推定システム１０で推定した感情パラメータを取得する。ＣＰＵ２２は、取得した感情パラメータに基づいて、ユーザに対して提供するコンテンツを決定する。出力インタフェース２１Ｂは、決定したコンテンツに関する情報を出力する。ＣＰＵ２２は、信号処理回路の一例である。

　このようなコンテンツ決定システム２０は、上記のコンテンツ決定方法と同様の効果を奏することができる。

　［４．その他の実施の形態］
　以上、実施の形態について説明したが、本開示は、上記実施の形態に限定されるものではない。

　上記実施の形態では、感情推定システム１０が情報端末１で実現され、コンテンツ決定システム２０がサーバ２で実現されているが、これに限られない。例えば、感情推定システム１０及びコンテンツ決定システム２０の両方が、情報端末１で実現されてもよい。この場合、サーバ２は不要である。また、例えば、感情推定システム１０がサーバ２で実現されてもよい。この場合、サーバ２の入力インタフェース２１Ａが、情報端末１で入力された第１パラメータ、第２パラメータ、及び第３パラメータを含む信号を受信することにより、各パラメータを取得する。

　上記実施の形態では、感情推定システム１０、コンテンツ決定システム２０、及び再生システム３はそれぞれ互いに独立した装置により実現されているが、これに限られない。例えば、サーバ２及び再生システム３は、１つの装置により実現されてもよい。また、例えば、感情推定システム１０、コンテンツ決定システム２０、及び再生システム３の全てが１つの装置により実現されてもよい。この場合、当該１つの装置は、例えばオフィス内に設置される。

　上記実施の形態では、再生システム３は、記憶装置３４に記憶されている音コンテンツを読み出してスピーカ３６で再生しているが、これに限られない。例えば、再生システム３は、ネットワークＮ１を介してサーバ２から送信される音コンテンツを受信してスピーカ３６で再生する、いわゆるストリーミング再生により音コンテンツを再生してもよい。この場合、再生システム３は、記憶装置３４を備えていなくてもよい。また、この場合、サーバ２は、複数の音コンテンツを記憶させる記憶装置を備えていればよい。なお、再生システム３は、サーバ２と異なるサーバであって、音楽配信業者が運用するサーバから送信される音コンテンツを受信してもよい。

　上記実施の形態では、再生システム３は、コンテンツ決定システム２０で決定した音コンテンツを、オフィス内の所定の場所からユーザに向けて再生するように構成されているが、これに限られない。例えば、再生システム３は、情報端末１で実現されてもよい。この場合、ユーザは、情報端末１に内蔵されたスピーカから再生される音コンテンツを聴いてもよいし、情報端末１に接続されたイヤホンを介して再生される音コンテンツを聴いてもよい。また、例えば、情報端末１は、ネットワークＮ１を介して再生システム３から送信される音コンテンツを受信し、情報端末１に内蔵されたスピーカで再生するストリーミング再生により、音コンテンツを再生してもよい。

　上記実施の形態では、機械学習済みの予測モデル４を用いてデータベース２５を構築しているが、これに限られない。例えば、データベース２５は、機械学習済みの予測モデル４を用いずにルールベースで構築されてもよい。

　上記実施の形態において、予測モデル４は、以下のような予測モデルであってもよい。すなわち、予測モデルは、音コンテンツを聴く前のユーザの感情パラメータと、音コンテンツを聴いた後のユーザの感情パラメータとを入力とし、音響特徴量を出力とするようなモデルでもよい。この場合、機械学習済みの予測モデルに現在の感情パラメータと誘導したい先の誘導パラメータとを入力すると、音響特徴量が出力されるので、音コンテンツと音響特徴量とを対応付けたデータベースから、予測モデルの出力する音響特徴量に最も近い音響特徴量を有する音コンテンツを選択することが可能である。

　上記実施の形態では、音コンテンツの再生過程において時間帯が変化した場合に、コンテンツ決定システム２０は、変化後の時間帯に対応する目標パラメータへとユーザの感情が誘導されるようにプレイリストを変更したが、これに限られない。例えば、コンテンツの再生過程において時間帯が変化した場合であっても、コンテンツ決定システム２０は、最初に決定したプレイリストを維持してもよい。

　上記実施の形態では、サーバ２の通信インタフェース２１は、入力インタフェース２１Ａと、出力インタフェース２１Ｂと、の両方を兼ねているが、これに限られない。例えば、入力インタフェース２１Ａと、出力インタフェース２１Ｂとは、互いに異なるインタフェースであってもよい。

　また、上記実施の形態において、感情推定システムは、単一の装置によって実現されたが、複数の装置として実現されてもよい。感情推定システム１０が複数の装置によって実現される場合、感情推定システムが備える機能的な構成要素は、複数の装置にどのように振り分けられてもよい。同様に、上記実施の形態において、コンテンツ決定システムは、単一の装置によって実現されたが、複数の装置として実現されてもよい。コンテンツ決定システムが複数の装置によって実現される場合、コンテンツ決定システムが備える機能的な構成要素は、複数の装置にどのように振り分けられてもよい。

　また、上記実施の形態における装置間の通信方法については特に限定されるものではない。上記実施の形態において２つの装置が通信を行う場合、２つの装置間には図示されない中継装置が介在してもよい。

　また、上記実施の形態で説明された処理の順序は、一例である。複数の処理の順序は変更されてもよいし、複数の処理は並行して実行されてもよい。また、特定の処理部が実行する処理を別の処理部が実行してもよい。また、上記実施の形態で説明されたデジタル信号処理の一部がアナログ信号処理によって実現されてもよい。

　また、上記実施の形態において、各構成要素は、各構成要素に適したソフトウェアプログラムを実行することによって実現されてもよい。各構成要素は、ＣＰＵ又はプロセッサ等のプログラム実行部が、ハードディスク又は半導体メモリ等の記録媒体に記録されたソフトウェアプログラムを読み出して実行することによって実現されてもよい。

　また、各構成要素は、ハードウェアによって実現されてもよい。例えば、各構成要素は、回路（又は集積回路）でもよい。これらの回路は、全体として１つの回路を構成してもよいし、それぞれ別々の回路でもよい。また、これらの回路は、それぞれ、汎用的な回路でもよいし、専用の回路でもよい。

　また、本開示の全般的又は具体的な態様は、システム、装置、方法、集積回路、コンピュータプログラム又はコンピュータ読み取り可能なＣＤ－ＲＯＭ等の記録媒体で実現されてもよい。また、システム、装置、方法、集積回路、コンピュータプログラム及び記録媒体の任意な組み合わせで実現されてもよい。例えば、本開示は、コンピュータが実行する感情推定方法として実行されてもよいし、このような感情推定方法をコンピュータに実行させるためのプログラムとして実現されてもよい。同様に、本開示は、コンピュータが実行するコンテンツ決定方法として実行されてもよいし、このようなコンテンツ決定方法をコンピュータに実行させるためのプログラムとして実現されてもよい。また、本開示は、このようなプログラムが記録されたコンピュータ読み取り可能な非一時的な記録媒体として実現されてもよい。なお、ここでのプログラムには、汎用の情報端末を上記実施の形態の上方端末として機能させるためのアプリケーションプログラムが含まれる。

　その他、各実施の形態に対して当業者が思いつく各種変形を施して得られる形態、又は、本開示の趣旨を逸脱しない範囲で各実施の形態における構成要素及び機能を任意に組み合わせることで実現される形態も本開示に含まれる。

　本開示の感情推定方法は、ユーザの主観的な気分に基づいて、ユーザの感情を推定することができる。

　１　情報端末
　１０　感情推定システム
　１００、２００、３００　入力画面
　１０１、１２１～１２５、２０１、２２１～２２５、３０１、３２１～３２５　文字列
　１１　ユーザインタフェース
　１１１～１１５、２１１～２１５、３１１～３１５　アイコン
　１２　通信インタフェース
　１３　ＣＰＵ
　１４　メモリ
　２　サーバ
　２０　コンテンツ決定システム
　２１　通信インタフェース
　２１Ａ　入力インタフェース
　２１Ｂ　出力インタフェース
　２２　ＣＰＵ
　２３　メモリ
　２４　記憶装置
　２５　データベース
　３　再生システム
　３１　通信インタフェース
　３２　ＣＰＵ
　３３　メモリ
　３４　記憶装置
　３５　アンプ
　３６　スピーカ
　４　予測モデル
　Ａ１　第１軸
　Ａ２　第２軸
　Ａ３　第３軸
　Ａ４　第４軸
　Ｍ１　第１移動量
　Ｍ２　第２移動量
　Ｎ１　ネットワーク
　Ｐ０　始点
　Ｐ１０　感情パラメータ
　Ｐ２１～Ｐ２４　目標パラメータ
　Ｐ３１～Ｐ３４　誘導パラメータ
　Ｕ１　ユーザ
　θ１　第１角度
　θ２　第２角度

Claims

　ユーザの主観的な気分を示す第１パラメータ、前記ユーザの主観的な興奮度を示す第２パラメータ、及び前記ユーザの主観的な弛緩度を示す第３パラメータを取得し、
　取得した前記第１パラメータ、前記第２パラメータ、及び前記第３パラメータに基づいて、前記ユーザの感情を示す感情パラメータを推定し、
　前記感情パラメータに関する情報を出力する、
　感情推定方法。
　前記感情パラメータは、快適度を示す第１軸と、覚醒度を示す第２軸とで定義される平面の座標として表され、
　前記第１パラメータに基づいて前記平面での始点を決定し、
　前記第１軸を前記平面の原点を基準として第１角度回転させた第３軸に沿った前記第２パラメータに基づく第１移動量と、前記第２軸を前記原点を基準として第２角度回転させた第４軸に沿った前記第３パラメータに基づく第２移動量と、に応じて前記始点を移動させることで前記感情パラメータを推定する、
　請求項１に記載の感情推定方法。
　前記第１角度及び前記第２角度は、いずれも４５度であって、
　前記第３軸は、興奮度を示す軸であり、
　前記第４軸は、弛緩度を示す軸である、
　請求項２に記載の感情推定方法。
　請求項１～３のいずれか１項に記載の感情推定方法で推定した前記感情パラメータを取得し、
　取得した前記感情パラメータに基づいて、前記ユーザに対して提供するコンテンツを決定し、
　決定した前記コンテンツに関する情報を出力する、
　コンテンツ決定方法。
　前記ユーザの目標とする感情を示す目標パラメータを更に取得し、
　前記感情パラメータと、前記目標パラメータとの差分に基づいて、前記コンテンツを決定する、
　請求項４に記載のコンテンツ決定方法。
　前記差分に基づいて、前記感情パラメータが前記目標パラメータに近づくように前記ユーザが誘導される感情を示す誘導パラメータを設定し、
　前記誘導パラメータに基づいて、前記コンテンツを決定する、
　請求項５に記載のコンテンツ決定方法。
　コンピュータに、
　請求項１～３のいずれか１項に記載の感情推定方法を実行させる、
　プログラム。
　コンピュータに、
　請求項４～６のいずれか１項に記載のコンテンツ決定方法を実行させる、
　プログラム。
　ユーザの主観的な気分を示す第１パラメータ、前記ユーザの主観的な興奮度を示す第２パラメータ、及び前記ユーザの主観的な弛緩度を示す第３パラメータを取得する入力インタフェースと、
　取得した前記第１パラメータ、前記第２パラメータ、及び前記第３パラメータに基づいて、前記ユーザの感情を示す感情パラメータを推定する信号処理回路と、
　前記感情パラメータに関する情報を出力する出力インタフェースと、を備える、
　感情推定システム。
　請求項９に記載の感情推定システムで推定した前記感情パラメータを取得する入力インタフェースと、
　取得した前記感情パラメータに基づいて、前記ユーザに対して提供するコンテンツを決定する信号処理回路と、
　決定した前記コンテンツに関する情報を出力する出力インタフェースと、を備える、
　コンテンツ決定システム。