WO2023233979A1

WO2023233979A1 - 気分推定プログラム

Info

Publication number: WO2023233979A1
Application number: PCT/JP2023/018025
Authority: WO
Inventors: 宏樹渡部; 綾井原; 康成瀬; 幸平伏田
Original assignee: 国立研究開発法人情報通信研究機構
Priority date: 2022-05-30
Filing date: 2023-05-15
Publication date: 2023-12-07
Also published as: JP2023175380A

Abstract

推定装置は、文章を発話する音声を聴いていた際の学習被験者の脳波特徴量と学習被験者の気分スコアとの組合せの組み合わせによりそれぞれ構成される複数の学習データセットを使用した機械学習により生成された推定モデルに、文章を発話する音声を聴いている際の対象者の脳波特徴量を入力することで、対象者の気分スコアを推定させる。

Description

気分推定プログラム

　本発明は、気分推定プログラムに関する。

　これまでに、脳波の特徴量を用いた機械学習、深層学習により、大うつ病と健常者の識別、非臨床群でうつ気分が高い人と低い人とを識別した研究が報告されている。例えば、下掲の非特許文献１には、被験者が聴覚刺激に対して課題を行っているときの脳波を計測し、事象関連電位成分（Ｎ１、Ｐ３００）の潜時、振幅等を特徴量として、大うつ病か否かを識別する手法が開示されている。

Jang, K.ら(2021). 「Machine learning-based electroencephalographic phenotypes of Schizophrenia and Major Depressive Disorder」. Frontiers in Psychiatry, 12:745458. （2021年10月13日オンライン版公開，doi:10.3389/fpsyt.2021.745458）

　近年、メディアの発達、特にインターネットの普及によって、人々が受け取る情報は爆発的に増大しているが、それに対応して現代人の脳のキャパシティが増大しているわけではない。情報過多によるストレスやメンタルの不調、生産性の低下は社会的な問題となっている。また、情報の量だけでなく、情報の内容もメンタルの健康に影響を及ぼす。新型コロナウィルスの感染拡大下において、メンタルの病気になる人が増大したが、最近の研究では、パンデミック関連のネガティブなニュースにさらされた人ほどメンタルに不調をきたしているということが報告されている。

　ネガティブな情報をどのように認知するかは個人差が大きい。例えば、うつ病の人はそうでない人と比べて、ネガティブな情報により注意を向けやすいという注意バイアスがあることが報告されている。また、うつ病の人では情動的な情報の処理にリソースを割くために、認知的な処理が影響を受けることが報告されている。

　しかしながら、上述の従来技術は、単純な音刺激（85[デシベル]で2000ミリ秒の固定刺激間隔で配信される音刺激）に対する課題を行なうという特殊な状態で脳波を計測しており、日常的に耳にする音声情報に対する脳波を気分の推定に利用するものではない。

　本発明は、一側面では、このような事情を鑑みてなされたものであり、その目的は、日常的な音声情報に対する脳の応答から、個人のメンタルの状態、特に抑うつ気分の高さを推定する推定装置等を提供することである。

　本発明は、上述した課題を解決するために、以下の構成を採用する。

　第１の観点に係る気分推定プログラムは、コンピュータに、文章を発話する音声を聴いている際の対象者の脳波である対象者脳波を取得する対象者脳波取得ステップと、文章を発話する音声を聴いている際のヒトの脳波から脳波特徴量を生成する脳波符号ステップであって、前記対象者脳波から前記脳波特徴量として対象者脳波特徴量を生成する脳波符号ステップと、少なくとも前記脳波特徴量を入力として受け付け、前記ヒトの抑うつ気分の高さを示す気分スコアを推定する推定モデルであって、複数の学習データセットを使用した機械学習が実施されることによって生成され、前記複数の学習データセットは、それぞれ、少なくとも、文章を発話する音声を聴いていた際の学習被験者の脳波から生成される前記脳波特徴量である被験者脳波特徴量に対して、前記学習被験者の抑うつ気分の高さを示す前記気分スコアである被験者気分スコアが、対応付けられることにより構成され、前記機械学習を実施することは、前記複数の学習データセットの各々について、前記被験者脳波特徴量を入力として受け付けたときに前記推定モデルが推定する前記気分スコアが、前記被験者気分スコアに一致するように、前記推定モデルを訓練する訓練ステップを含む、推定モデルに、前記対象者脳波特徴量を入力することにより、前記対象者の抑うつ気分の高さを示す前記気分スコアである対象者気分スコアを推定させる推定ステップと、を実行させる。

　当該構成では、前記気分推定プログラムは、コンピュータに、例えばニュース音声、会話音声などの「文章を発話する音声」を聴いている際の前記対象者の脳波から生成される前記対象者脳波特徴量から、前記対象者の抑うつ気分の高さを示す前記対象者気分スコアを推定させる。前記気分推定プログラムは、コンピュータに、前記複数の学習データセットを使用した前記機械学習が実施されることによって生成された前記推定モデルに、前記対象者脳波特徴量を入力することにより、前記対象者気分スコアを推定させる。

　前記学習データセットは、少なくとも、文章を発話する音声を聴いている際のヒト（前記学習被験者）の脳波から生成される脳波特徴量（被験者脳波特徴量）に対して、前記ヒトの抑うつ気分の高さを示す気分スコア（被験者気分スコア）が対応付けられて構成される。また、前記機械学習を実施することは、前記複数の学習データセットの各々について、前記被験者脳波特徴量から前記推定モデルが推定する前記気分スコアが、前記被験者気分スコアに一致するように、前記推定モデルを訓練する訓練ステップを含む。

　本件発明者らは、それぞれ、前記被験者脳波特徴量に対して前記被験者気分スコアが対応付けられることにより構成された前記複数の学習データセットを使用した前記機械学習が実施されることによって生成された前記推定モデルについて、推定精度の検証を行ない、以下の検証結果を得た。すなわち、前記推定モデルのＡＵＣ（Area Under the Roc Curve）が「０．７３」となったことを確認した。また、前記推定モデルは、抑うつ気分が高い人（ベック抑うつ調査（ＢＤＩ、Beck Depression Inventory）に対する回答から算出されるＢＤＩスコアが１４以上の人）のうち６６％について、抑うつ気分が高いと識別した。

　そのため、前記コンピュータは、ニュース音声、会話音声などの「文章を発話する音声」を聴いている際の対象者の脳波から生成される前記対象者脳波特徴量を、前記推定モデルに入力することにより、前記対象者気分スコアを高精度に推定させることができる。

　特に、ニュース音声、会話音声などの「文章を発話する音声」は、非特許文献１に記載されている非日常的な（特殊な）音ではなく、前記対象者が日常的に耳にする音声であり、つまり、日常的な音声情報である。そのため、前記コンピュータは、係る日常的な音声情報に対する前記対象者の脳波（脳の応答）から、前記対象者の抑うつ気分の高さを示す前記対象者気分スコアを推定することができるとの効果を奏する。

　第２の観点に係る気分推定プログラムは、上記第１の観点に係る気分推定プログラムにおいて、前記コンピュータに、前記脳波符号ステップにおいて、ネガティブ、ニュートラル、ポジティブの少なくとも３つの区分の何れかに分類される文章を発話する音声を聴いている際のヒトの脳波と、前記文章が前記少なくとも３つの区分の何れに分類されるかを示す情報とから、前記文章が分類される区分に対応する脳波特徴量を、前記脳波特徴量として生成させ、前記推定モデルは、前記脳波特徴量として、前記文章が分類される区分に対応する脳波特徴量を入力されると、前記気分スコアを推定し、前記被験者脳波特徴量は、それぞれが前記ネガティブの区分に分類される文章を発話する音声を聴いていた際の前記学習被験者の脳波である複数の脳波の平均から生成される、前記ネガティブの区分に対応する脳波特徴量である被験者第１脳波特徴量と、それぞれが前記ニュートラルの区分に分類される文章を発話する音声を聴いていた際の前記学習被験者の脳波である複数の脳波の平均から生成される、前記ニュートラルの区分に対応する脳波特徴量である被験者第２脳波特徴量と、それぞれが前記ポジティブの区分に分類される文章を発話する音声を聴いていた際の前記学習被験者の脳波である複数の脳波の平均から生成される、前記ポジティブの区分に対応する脳波特徴量である被験者第３脳波特徴量と、を含み、前記機械学習を実施することは、前記複数の学習データセットの各々について、前記ネガティブの区分に対応する脳波特徴量として前記被験者第１脳波特徴量を入力されたときに前記推定モデルが推定する前記気分スコアが、前記被験者気分スコアに一致するように、前記推定モデルを訓練する第１訓練ステップと、前記ニュートラルの区分に対応する脳波特徴量として前記被験者第２脳波特徴量を入力されたときに前記推定モデルが推定する前記気分スコアが、前記被験者気分スコアに一致するように、前記推定モデルを訓練する第２訓練ステップと、前記ポジティブの区分に対応する脳波特徴量として前記被験者第３脳波特徴量を入力されたときに前記推定モデルが推定する前記気分スコアが、前記被験者気分スコアに一致するように、前記推定モデルを訓練する第３訓練ステップと、を含み、前記コンピュータに、前記対象者が音声として聴いている文章が、前記少なくとも３つの区分の何れに分類されるかを示す分類情報を取得する分類情報取得ステップをさらに実行させ、前記脳波符号ステップにおいて、前記分類情報によって示される区分に分類される文章を発話する音声を聴いている際の前記対象者の前記対象者脳波と、前記分類情報とから生成される、前記分類情報によって示される区分に対応する前記対象者脳波特徴量を、前記推定ステップにおいて、前記分類情報によって示される区分に対応する脳波特徴量として前記推定モデルに入力することにより、前記対象者気分スコアを推定させてもよい。

　当該構成では、前記学習データセットは、ネガティブ、ニュートラル、ポジティブの少なくとも３つの区分の各々に対応する脳波特徴量（前記被験者第１脳波特徴量、前記被験者第２脳波特徴量、前記被験者第３脳波特徴量）に対して、前記被験者気分スコアが対応付けられることにより構成される。そして、前記推定モデルは、前記学習データセットを使用した、前記第１訓練ステップと、前記第２訓練ステップと、前記第３訓練ステップと、を含む前記機械学習が実施されることによって生成される。そのため、前記推定モデルは、前記各区分に対応する脳波特徴量から、前記ヒトの抑うつ気分の高さを示す前記気分スコアを推定することができる。

　さらに、前記コンピュータは、前記分類情報を取得する分類情報取得ステップを実行する。前記分類情報は、前記コンピュータの外部から取得してもよい。また、前記コンピュータが、前記分類情報を生成し、生成した前記分類情報を、前記分類情報取得ステップにおいて取得してもよい。前記分類情報は、アナログ的に（例えば、ヒトが前記文章を前記少なくとも３つの区分の何れかに分類することによって）生成してもよい。また、文章と分類結果との組み合わせによりそれぞれ構成される複数の学習データセットを使用した機械学習を実施することで生成される分類モデルなどを利用して、前記文章を前記少なくとも３つの区分の何れかに分類することによって、前記分類情報を生成してもよい。前記分類情報は、ルールベースで生成されてもよいし、モデルベースで生成されてもよい。　前記コンピュータは、前記分類情報によって示される区分に分類される文章を発話する音声を聴いている際の前記対象者の前記対象者脳波から、前記分類情報によって示される区分に対応する前記対象者脳波特徴量を生成する。そして、前記コンピュータは、前記分類情報によって示される区分に対応する前記対象者脳波特徴量を、前記推定モデルに入力することにより、前記対象者気分スコアを推定させる。

　それゆえ、前記コンピュータは、文章を発話する音声を聴いている際の前記対象者の脳波と、係る文章がネガティブ、ニュートラル、ポジティブの少なくとも３つの区分の何れかに分類されるかを示す前記分類情報とから、前記対象者の抑うつ気分の高さを示す前記対象者気分スコアを推定することができる。

　第３の観点に係る気分推定プログラムは、上記第１または第２の観点に係る気分推定プログラムにおいて、前記コンピュータに、前記脳波符号ステップにおいて、文章を発話する音声を聴いている際のヒトの脳波と、前記ヒトが音声として聴いている前記文章に含まれる各単語の開始時点とから、前記ヒトの前記単語に対する脳波応答における所定の成分のピーク潜時およびピーク前後の平均振幅の少なくとも一方を、前記脳波特徴量として生成させ、前記被験者脳波特徴量は、文章を発話する音声を聴いていた際の前記学習被験者の脳波と、前記学習被験者が音声として聴いていた前記文章に含まれる各単語の開始時点とから生成される、前記学習被験者の前記単語に対する脳波応答における前記所定の成分のピーク潜時およびピーク前後の平均振幅の少なくとも一方であり、前記コンピュータに、前記対象者が音声として聴いている文章に含まれる各単語の開始時点を示すオンセット情報を取得するオンセット情報取得ステップをさらに実行させ、前記脳波符号ステップにおいて、前記対象者脳波と、前記オンセット情報によって示される、前記対象者が音声として聴いている文章に含まれる各単語の開始時点とから生成される、前記対象者の前記単語に対する脳波応答における前記所定の成分のピーク潜時およびピーク前後の平均振幅の少なくとも一方を、前記推定ステップにおいて、前記対象者脳波特徴量として前記推定モデルに入力することにより、前記対象者気分スコアを推定させてもよい。

　当該構成では、前記脳波特徴量は、文章に含まれる単語に対する脳波応答における前記所定の成分のピーク潜時およびピーク前後の平均振幅の少なくとも一方である。前記所定の成分は、例えば、単語提示後１００ミリ秒前後、２００ミリ秒前後、４００ミリ秒前後にピークを持つ成分の少なくとも１つである。前記学習データセットは、前記学習被験者の単語に対する脳波応答における前記所定の成分のピーク潜時およびピーク前後の平均振幅の少なくとも一方に対して、前記被験者気分スコアが対応付けられることにより構成される。そして、前記推定モデルは、前記学習データセットを使用した前記機械学習が実施されることによって生成される。そのため、前記推定モデルは、文章に含まれる単語に対する脳波応答における前記所定の成分のピーク潜時およびピーク前後の平均振幅の少なくとも一方から、ヒトの抑うつ気分の高さを示す前記気分スコアを推定することができる。

　さらに、前記コンピュータは、前記オンセット情報を取得するオンセット情報取得ステップを実行する。前記コンピュータは、前記対象者脳波と前記オンセット情報とから、前記対象者の単語に対する脳波応答における前記所定の成分のピーク潜時およびピーク前後の平均振幅の少なくとも一方を、前記対象者脳波特徴量として生成する。そして、前記コンピュータは、前記対象者の単語に対する脳波応答における前記所定の成分のピーク潜時およびピーク前後の平均振幅の少なくとも一方を、前記推定モデルに入力することにより、前記対象者気分スコアを推定させる。

　それゆえ、前記コンピュータは、文章を発話する音声を聴いている際の前記対象者の脳波と、係る文章に含まれる各単語の開始時点を示す前記オンセット情報とから、前記対象者の抑うつ気分の高さを示す前記対象者気分スコアを推定することができる。

　第４の観点に係る気分推定プログラムは、上記第１から第３のいずれかの観点に係る気分推定プログラムにおいて、前記コンピュータに、前記脳波符号ステップにおいて、文章を発話する音声を聴いている際のヒトの脳波と、前記ヒトが聴いている前記音声の音声エンベロープとから、前記ヒトの前記音声エンベロープに追随する脳波応答における所定の成分のピーク潜時およびピーク前後の平均振幅の少なくとも一方を、前記脳波特徴量として生成させ、前記被験者脳波特徴量は、文章を発話する音声を聴いていた際の前記学習被験者の脳波と、前記学習被験者が聴いていた前記音声の音声エンベロープとから生成される、前記学習被験者の前記音声エンベロープに追随する脳波応答における前記所定の成分のピーク潜時およびピーク前後の平均振幅の少なくとも一方であり、前記コンピュータに、前記対象者が聴いている音声の音声エンベロープを示すエンベロープ情報を取得するエンベロープ情報取得ステップをさらに実行させ、前記脳波符号ステップにおいて、前記対象者脳波と、前記エンベロープ情報によって示される、前記対象者が聴いている音声の音声エンベロープとから生成される、前記対象者の前記音声エンベロープに追随する脳波応答における前記所定の成分のピーク潜時およびピーク前後の平均振幅の少なくとも一方を、前記推定ステップにおいて、前記対象者脳波特徴量として前記推定モデルに入力することにより、前記対象者気分スコアを推定させてもよい。

　当該構成では、前記脳波特徴量は、聴いている音声の音声エンベロープに追随する脳波応答における前記所定の成分のピーク潜時およびピーク前後の平均振幅の少なくとも一方である。前記所定の成分は、例えば、音声エンベロープに基づいて解析された脳波応答における５０ミリ秒前後、１５０ミリ秒前後、２５０ミリ秒前後にピークを持つ成分の少なくとも１つである。前記学習データセットは、前記学習被験者の音声エンベロープに追随する脳波応答における前記所定の成分のピーク潜時およびピーク前後の平均振幅の少なくとも一方に対して、前記被験者気分スコアが対応付けられることにより構成される。そして、前記推定モデルは、前記学習データセットを使用した前記機械学習が実施されることによって生成される。そのため、前記推定モデルは、音声エンベロープに追随する脳波応答における前記所定の成分のピーク潜時およびピーク前後の平均振幅の少なくとも一方から、ヒトの抑うつ気分の高さを示す前記気分スコアを推定することができる。

　さらに、前記コンピュータは、前記エンベロープ情報を取得するエンベロープ情報取得ステップを実行する。前記コンピュータは、前記対象者脳波と前記エンベロープ情報とから、前記対象者の音声エンベロープに追随する脳波応答における前記所定の成分のピーク潜時およびピーク前後の平均振幅の少なくとも一方を、前記対象者脳波特徴量として生成する。そして、前記コンピュータは、前記対象者の音声エンベロープに追随する脳波応答における前記所定の成分のピーク潜時およびピーク前後の平均振幅の少なくとも一方を、前記推定モデルに入力することにより、前記対象者気分スコアを推定させる。

　それゆえ、前記コンピュータは、文章を発話する音声を聴いている際の前記対象者の脳波と、係る音声の音声エンベロープを示す前記エンベロープ情報とから、前記対象者の抑うつ気分の高さを示す前記対象者気分スコアを推定することができる。

　第５の観点に係る気分推定プログラムは、上記第１から第４のいずれかの観点に係る気分推定プログラムにおいて、前記推定モデルは、前記脳波特徴量に加えてさらに、文章を発話する音声を聴いた後に前記文章に対してヒトが感じた主観的評価を示す主観スコアを入力として受け付け、入力された前記脳波特徴量および前記主観スコアから、前記気分スコアを推定し、前記複数の学習データセットは、それぞれ、前記被験者脳波特徴量と、文章を発話する音声を聴いた後に前記文章に対して前記学習被験者が感じた主観的評価を示す前記主観スコアである被験者主観スコアと、に対して、前記被験者気分スコアが対応付けられることにより構成され、前記機械学習を実施することは、前記複数の学習データセットの各々について、前記被験者脳波特徴量および前記被験者主観スコアを入力されたときに前記推定モデルが推定する前記気分スコアが、前記被験者気分スコアに一致するように、前記推定モデルを訓練する訓練ステップを含み、前記コンピュータに、文章を発話する音声を聴いた後に前記文章に対して前記対象者が感じた主観的評価を示す前記主観スコアである対象者主観スコアを取得する対象者主観スコア取得ステップをさらに実行させ、前記推定ステップにおいて、前記対象者脳波特徴量と、前記対象者主観スコアとを前記推定モデルに入力することにより、前記対象者気分スコアを推定させてもよい。

　当該構成では、前記学習データセットは、前記被験者脳波特徴量と、音声として聴いた文章に対して前記学習被験者が感じた主観的評価を示す前記主観スコア（被験者主観スコア）とに対して、前記被験者気分スコアが対応付けられることにより構成される。また、前記機械学習を実施することは、前記複数の学習データセットの各々について、前記被験者脳波特徴量および前記被験者主観スコアを入力されたときに前記推定モデルが推定する前記気分スコアが、前記被験者気分スコアに一致するように、前記推定モデルを訓練する訓練ステップを含む。そのため、前記推定モデルは、前記脳波特徴量と、音声として聴いた文章に対して前記ヒトが感じた主観的評価を示す前記主観スコアとから、前記ヒトの抑うつ気分の高さを示す前記気分スコアを推定することができる。

　本件発明者らは、それぞれ、前記被験者脳波特徴量および前記被験者主観スコアに対して前記被験者気分スコアが対応付けられることにより構成された前記複数の学習データセットを使用した前記機械学習が実施されることによって生成された前記推定モデルについて、推定精度の検証を行ない、以下の検証結果を得た。すなわち、前記推定モデルのＡＵＣが「０．８３」となったことを確認した。また、前記推定モデルは、抑うつ気分が高い人のうち７８％について、抑うつ気分が高いと識別した。

　さらに、前記コンピュータは、前記対象者主観スコアを取得する対象者主観スコア取得ステップを実行する。前記コンピュータは、前記対象者脳波と前記対象者主観スコアとを、前記推定モデルに入力することにより、前記対象者気分スコアを推定させる。

　それゆえ、前記コンピュータは、文章を発話する音声を聴いている際の前記対象者の脳波と、係る文章に対して前記対象者が感じた主観的評価を示す前記対象者主観スコアとから、前記対象者の抑うつ気分の高さを示す前記対象者気分スコアを高精度に推定することができる。

　第６の観点に係る気分推定プログラムは、上記第１から第５のいずれかの観点に係る気分推定プログラムにおいて、前記コンピュータに、前記推定ステップにおいて推定させた前記対象者気分スコアに対応する情報を、前記対象者に出力する出力ステップをさらに実行させてもよい。

　当該構成では、前記コンピュータは、前記対象者気分スコアに対応する情報を、前記対象者に出力する（例えば、通知する）。前記対象者気分スコアに対応する情報は、前記対象者気分スコア自体であってもよい。また、前記対象者気分スコアに対応する情報は、前記対象者気分スコアによって示される、前記対象者の抑うつ気分の高低を示す情報であってもよい。さらに、前記対象者気分スコアに対応する情報は、前記対象者気分スコアに対応する、前記対象者へのアドバイスを含む情報であってもよい。例えば、前記コンピュータは、前記対象者気分スコアを前記対象者に出力することにより、前記対象者に、自らの気分の落ち込みなどの心の状態を自覚させることができる。例えば、前記コンピュータは、前記対象者気分スコアに対応する、前記対象者へのアドバイスを含む情報を前記対象者に出力することにより、前記対象者に、メンタルに負担の大きい情報を遮断するなどの、メンタルヘルスを健全に保つための行動を促すことができる。

　前記対象者気分スコアが前記対象者の抑うつ気分が高いことを示すものであった場合、前記対象者気分スコアに対応する情報は、前記対象者をリラックスさせる情報、例えば、前記対象者をリラックスさせる音楽、映像等であってもよい。前記コンピュータは、前記対象者気分スコアが示す前記対象者の抑うつ気分の高さに応じた情報を、「前記対象者気分スコアに対応する情報」として前記対象者に出力することができる。

　特に、前記コンピュータは、非特許文献１に記載されている非日常的な（特殊な）音ではなく、対象者が日常的に耳にする、ニュース音声、会話音声などの「文章を発話する音声」を聴いている際の前記対象者の脳波から、前記対象者気分スコアを推定する。そのため、前記コンピュータは、日常的な音声情報に対する前記対象者の脳波から前記対象者気分スコアを推定し、推定した前記対象者気分スコアを前記対象者に出力することにより、前記対象者に自らの心の状態を自覚させたり、行動を促したり、また、前記対象者をリラックスさせたりすることができる。

　また、上記各観点に係る気分推定プログラムの別の態様として、本発明の一側面は、上記各観点に係る気分推定プログラムを実行するコンピュータその他装置であってもよいし、上記各観点に係る気分推定プログラムを記憶した、コンピュータその他装置、機械等が読み取り可能な記憶媒体であってもよい。ここで、コンピュータ等が読み取り可能な記憶媒体とは、プログラム等の情報を、電気的、磁気的、光学的、機械的、又は、化学的作用によって蓄積する媒体である。

　本発明によれば、日常的な音声情報に対する脳の応答から、個人のメンタルの状態、特に抑うつ気分の高さを推定する推定装置等を提供することができる。

図１は、本発明を適用した場面の一例を模式的に例示する。図２は、実施の形態に係るモデル生成装置のハードウェア構成の一例を模式的に例示する。図３は、実施の形態に係る推定装置のハードウェア構成の一例を模式的に例示する。図４は、実施の形態に係るモデル生成装置のソフトウェア構成の一例を模式的に例示する。図５は、実施の形態に係るモデル生成装置が実行する特徴量生成処理および学習処理の各々の過程の一例を模式的に例示する。図６は、実施の形態に係る推定装置のソフトウェア構成の一例を模式的に例示する。図７は、実施の形態に係る推定装置が実行する特徴量生成処理および気分推定処理の各々の過程の一例を模式的に例示する。図８は、実施の形態に係るモデル生成装置の処理手順の一例を例示する。図９は、実施の形態に係る推定装置の処理手順の一例を例示する。

　以下、本発明の一側面に係る実施の形態（以下、「本実施形態」とも表記する）を、図面に基づいて説明する。ただし、以下で説明する本実施形態は、あらゆる点において本発明の例示に過ぎない。本発明の範囲を逸脱することなく種々の改良や変形を行うことができることは言うまでもない。つまり、本発明の実施にあたって、実施形態に応じた具体的構成が適宜採用されてもよい。なお、本実施形態において登場するデータを自然言語により説明しているが、より具体的には、コンピュータが認識可能な疑似言語、コマンド、パラメータ、マシン語等で指定される。

　§１　適用例
　図１は、本発明を適用した場面の一例を模式的に例示する。本実施形態に係る気分推定システム１００は、モデル生成装置１および推定装置２を備えている。

　本実施形態に係るモデル生成装置１は、推定モデル３の機械学習を実施するように構成されたコンピュータである。モデル生成装置１は、複数の学習データセット１２０を使用して、推定モデル３の機械学習を実施する。

　推定モデル３は、少なくとも、文章を発話する音声を聴いている際のヒト（学習被験者および対象者）の脳波から生成される脳波特徴量Ｆｗを与えられると、ヒトの抑うつ気分の高さを示す気分スコアＳｍを推定する推定タスクを遂行する（換言すると、推定タスクを遂行した結果に対応する出力値を出力する）ように構成される。本実施形態において推定モデル３は、文章を発話する音声を聴いている際のヒトの脳波から生成される脳波特徴量Ｆｗに加え、聴いた後に係る文章に対してヒトが感じた主観的評価を示す主観スコアＳｓを受け付け、脳波特徴量Ｆｗおよび主観スコアＳｓから、気分スコアＳｍを推定する。

　「文章を発話する音声」とは、例えば、ニュースを発話する音声（ニュース音声）であってもよいし、会話の相手方が会話内容（会話文章）を発話する音声（会話音声）であってもよい。「文章を発話する音声」とは、「脳波を測定されるヒト」以外のヒト、機械などが文章を発話する音声であればよく、ヒトが日常的に耳にする音声（日常的な音声）である。本実施形態では、「文章を発話する音声」として、ニュース音声を用いる。

　本実施形態では、ヒトが音声として聴いている文章（例えば、ニュース）は、ネガティブ、ニュートラル、ポジティブの少なくとも３つの区分の何れかに分類される。ヒトが音声として聴いている文章は、少なくとも、ネガティブ、ニュートラル、ポジティブな情動の何れかを生じさせ得るものである。以下の説明においては、「ネガティブ」、「ニュートラル」、「ポジティブ」は、各々、「Ｎｇ」、「Ｎｔ」、「Ｐｓ」と略記することがある。

　ヒトが音声として聴く文章の分類は、アナログ的に実施されてもよく、例えば、「係る文章を発話する音声を聴くヒト以外の複数のヒトが、係る文章を分類した区分」を統計的に処理して、係る文章が分類される区分としてもよい。また、文章の分類は、分類装置等によって自動的又は半自動的に実行されてもよい。例えば、文章と分類結果（区分）との組み合わせによりそれぞれ構成される複数の学習データセットを使用した機械学習を実施することで生成される分類モデルなどを利用して、ヒトが音声として聴く文章を上述の少なくとも３つの区分の何れかに分類してもよい。文章の分類は、ルールベースで実施されてもよいし、モデルベースで実施されてもよい。

　脳波は、文章を発話する音声を聴いている際のヒトの脳波であればよい。本実施形態では、脳波は、ヒトが文章を発話する音声を聴いている際に、係るヒトについて、複数（例えば、３つ）の脳波計測点の各々で計測された脳波から特定される。ただし、脳波が、複数の脳波計測点の各々で計測された脳波から特定されることは必須ではない。脳波は、ヒトが文章を発話する音声を聴いている際に、係るヒトについて、１つの脳波計測点で計測された脳波であってもよい。

　ヒトが音声として聴く文章が「Ｎｇ」、「Ｎｔ」、「Ｐｓ」の少なくとも３つの区分に分類されるのに対応して、文章を発話する音声を聴いている際のヒトの脳波からは、係る少なくとも３つの区分の各々に対応する脳波特徴量Ｆｗが生成される。例えば、「Ｎｇ」の区分に分類される文章を発話する音声を聴いている際のヒトの脳波からは、「Ｎｇ」の区分に対応する第１脳波特徴量Ｆｗ（１）が生成される。また、「Ｎｔ」の区分に分類される文章を発話する音声を聴いている際のヒトの脳波からは、「Ｎｔ」の区分に対応する第２脳波特徴量Ｆｗ（２）が生成される。同様に、「Ｐｓ」の区分に分類される文章を発話する音声を聴いている際のヒトの脳波からは、「Ｐｓ」の区分に対応する第３脳波特徴量Ｆｗ（３）が生成される。推定モデル３は、少なくとも、第１脳波特徴量Ｆｗ（１）、第２脳波特徴量Ｆｗ（２）、第３脳波特徴量Ｆｗ（３）の何れかを与えられると、気分スコアＳｍを推定する（出力する）。以下の説明において、第１脳波特徴量Ｆｗ（１）、第２脳波特徴量Ｆｗ（２）、第３脳波特徴量Ｆｗ（３）の各々を特に区別しない場合には、これらを総称して「脳波特徴量Ｆｗ」と呼ぶことがある。

　脳波特徴量Ｆｗは、文章を発話する音声を聴いている際のヒトの脳波（脳波応答）の所定の成分Ｐｃのピーク潜時およびピーク前後の平均振幅の少なくとも一方である。以下の説明においては、「所定の成分Ｐｃのピーク潜時およびピーク前後の平均振幅の少なくとも一方」を、「成分特徴量Ｉｆａ」と称することがある。本実施形態において「文章を発話する音声を聴いている際のヒトの脳波」は、「ヒトが音声として聴いている文章に含まれる単語（各単語）に対する脳波応答」および「係る音声の音声エンベロープに追随する脳波応答」の少なくとも一方である。「所定の成分Ｐｃ」は、例えば、単語提示後１００ミリ秒前後、２００ミリ秒前後、４００ミリ秒前後にピークを持つ成分の少なくとも１つであってもよい。また、「所定の成分Ｐｃ」は、例えば、音声エンベロープに基づいて解析された脳波応答における５０ミリ秒前後（または１００ミリ秒前後）、１５０ミリ秒前後（または２００ミリ秒前後）、２５０ミリ秒前後（または４００ミリ秒前後）にピークを持つ成分の少なくとも１つであってもよい。以下では、「ヒトが音声として聴いている文章に含まれる単語に対する脳波応答」の成分特徴量Ｉｆａを、つまり、ヒトの「単語に対する脳波応答」の成分特徴量Ｉｆａを、脳波特徴量Ｆｗとして用いる例について説明する。

　本実施形態において主観スコアＳｓは、文章を発話する音声を聴いた後に係る文章（音声）に対してヒトが感じた、難易度、関心度、情動価、覚醒度の各々についての５段階評価を含む情報である。「難易度」は、聴いた文章（音声）に対して感じた難易度を５段階評価で示すものである。「関心度」は、聴いた文章（音声）に対して感じた関心度を５段階評価で示すものである。「情動価」は、聴いた文章（音声）をポジティブまたはネガティブなものとして捉えたかを５段階評価で示すものである。「覚醒度」は、情動を喚起された度合（「強く喚起された」から「弱く喚起された」まで）を５段階評価で示すものである。ただし、主観スコアＳｓは、難易度、関心度、情動価、覚醒度の各々についての５段階評価を示すものに限られず、文章を発話する音声を聴いた後に、係る文章に対してヒトが感じた主観的評価を示すものであればよい。

　本実施形態において気分スコアＳｍは、例えば、ヒトのベック抑うつ調査（ＢＤＩ、Beck Depression Inventory）に対する回答から算出されるＢＤＩスコアであってもよい。また、気分スコアＳｍは、ヒトの抑うつ気分が高いか否かを示すものであってもよく、例えば、ＢＤＩスコアが「１４」以上か否かを示すものであってもよい。ただし、気分スコアＳｍは、これらの例に限られるものではなく、ヒトの抑うつ気分の高さを示すことのできるものであればよい。

　推定モデル３の機械学習に利用される各学習データセット１２０は、被験者脳波特徴量１２１、被験者主観スコア１２２、および、被験者気分スコア１２３の組み合わせにより構成される。被験者脳波特徴量１２１は、文章を発話する音声を聴いていた際の学習被験者の脳波から生成される脳波特徴量Ｆｗである。被験者主観スコア１２２は、文章を発話する音声を聴いた後に係る文章に対して学習被験者が感じた主観的評価を示す主観スコアＳｓである。被験者気分スコア１２３は、学習被験者の抑うつ気分の高さを示す気分スコアＳｍであり、被験者脳波特徴量１２１および被験者主観スコア１２２に対する推定タスクの正解を示す。

　本実施形態において機械学習を実施することは、以下の訓練ステップを含む。すなわち、各学習データセット１２０について、被験者脳波特徴量１２１と被験者主観スコア１２２とを推定モデル３に与えたときに、推定モデル３の推定タスクを遂行した結果（気分スコアＳｍ）が被験者気分スコア１２３に適合（一致）するように、推定モデル３を訓練する訓練ステップを含む。モデル生成装置１は、例えば、サポートベクターマシン（線形サポートベクターマシン）による機械学習により、推定モデル３を学習してもよい。線形サポートベクターマシンによる機械学習を実施して生成される推定モデル３は、ヒトの抑うつ気分が高いか（例えば、ＢＤＩスコアが「１４」以上か）を推定することができる。

　推定装置２は、本発明に係る気分推定プログラム（気分推定プログラム８２）を実行するコンピュータの一例であり、モデル生成装置１により生成された訓練済みの機械学習モデル（推定モデル３）を使用して、推定タスクを遂行するように構成されたコンピュータである。本実施形態において推定装置２は、訓練済みの推定モデル３を使用して、対象者脳波特徴量２２１と対象者主観スコア９とに対する推定タスクを遂行する（対象者の抑うつ気分の高さを示す気分スコアＳｍである対象者気分スコア２２３を推定する）。対象者脳波特徴量２２１は、文章を発話する音声を聴いている際の対象者の脳波から生成される脳波特徴量Ｆｗである。対象者主観スコア９は、文章を発話する音声を聴いた後に係る文章に対して対象者が感じた主観的評価を示す主観スコアＳｓである。

　なお、本発明において、推定モデル３への入力として主観スコアＳｓは必須ではない。推定モデル３は、少なくとも脳波特徴量Ｆｗの入力を受け付け、入力された脳波特徴量Ｆｗに基づいて、気分スコアＳｍを推定できればよい。これに対応して、各学習データセット１２０は、少なくとも被験者脳波特徴量１２１に対して、被験者気分スコア１２３が対応付けられることにより構成されていればよい。この場合、訓練ステップは、各学習データセット１２０について、被験者脳波特徴量１２１を推定モデル３に与えたときに、推定モデル３の推定する気分スコアＳｍが被験者気分スコア１２３に一致するように、推定モデル３を訓練するものであればよい。主観スコアＳｓを必要とせずに脳波特徴量Ｆｗのみから気分スコアＳｍを推定する推定モデル３を利用する場合、推定装置２は、対象者脳波特徴量２２１のみを推定モデル３に与えることによって、対象者気分スコア２２３を推定することができる。

　また、図１の例では、モデル生成装置１および推定装置２は、ネットワークを介して互いに接続されている。ネットワークの種類は、例えば、インターネット、無線通信網、移動通信網、電話網、専用網等から適宜選択されてよい。ただし、モデル生成装置１および推定装置２の間でデータをやりとりする方法は、このような例に限定されなくてもよく、実施の形態に応じて適宜選択されてよい。例えば、モデル生成装置１および推定装置２の間では、記憶媒体を利用して、データがやりとりされてよい。

　さらに、図１の例では、モデル生成装置１および推定装置２は、それぞれ別個のコンピュータにより構成されている。しかしながら、本実施形態に係る気分推定システム１００の構成は、このような例に限定されなくてもよく、実施の形態に応じて適宜決定されてよい。例えば、モデル生成装置１および推定装置２は一体のコンピュータであってもよい。また、例えば、モデル生成装置１および推定装置２のうちの少なくとも一方は、複数台のコンピュータにより構成されてもよい。

　§２　構成例
　［ハードウェア構成］
　＜モデル生成装置＞
　図２は、本実施形態に係るモデル生成装置１のハードウェア構成の一例を模式的に例示する。図２に示される通り、本実施形態に係るモデル生成装置１は、制御部１１、記憶部１２、通信インタフェース１３、外部インタフェース１４、入力装置１５、出力装置１６、およびドライブ１７が電気的に接続されたコンピュータである。なお、図２では、通信インタフェースおよび外部インタフェースを「通信Ｉ／Ｆ」および「外部Ｉ／Ｆ」と記載している。後述の図３でも同様の表記を用いる。

　制御部１１は、ハードウェアプロセッサであるＣＰＵ（Central Processing Unit）、ＲＡＭ（Random Access Memory）、ＲＯＭ（Read Only Memory）等を含み、プログラムおよび各種データに基づいて情報処理を実行するように構成される。ＣＰＵは、プロセッサ・リソースの一例である。プロセッサ・リソースとして、ＣＰＵに代えて、または、ＣＰＵと共に、ＧＰＵ（Graphics Processing Unit）を利用してもよい。記憶部１２は、メモリ・リソースの一例であり、例えば、ハードディスクドライブ、ソリッドステートドライブ等で構成される。本実施形態では、記憶部１２は、モデル生成プログラム８１、複数の学習データセット１２０、学習結果データ１２９等の各種情報を記憶する。

　モデル生成プログラム８１は、推定モデル３の機械学習等に関する後述の情報処理（図５）をモデル生成装置１に実行させるためのプログラムであり、当該情報処理の一連の命令を含む。複数の学習データセット１２０は、推定モデル３の機械学習に使用される。学習結果データ１２９は、機械学習の結果（本実施形態では、機械学習により生成された訓練済みの推定モデル３）に関する情報を示す。本実施形態では、学習結果データ１２９は、モデル生成プログラム８１を実行した結果として生成される。

　通信インタフェース１３は、例えば、有線ＬＡＮ（Local Area Network）モジュール、無線ＬＡＮモジュール等であり、ネットワークを介した有線又は無線通信を行うためのインタフェースである。モデル生成装置１は、この通信インタフェース１３を利用して、他の情報処理装置との間で、ネットワークを介したデータ通信を実行してもよい。外部インタフェース１４は、例えば、ＵＳＢ（Universal Serial Bus）ポート、専用ポート等であり、外部装置と接続するためのインタフェースである。外部インタフェース１４の種類および数は、接続される外部装置の種類および数に応じて適宜選択されてよい。被験者脳波４等のデータを脳波計などの検出装置により取得する場合、モデル生成装置１は、通信インタフェース１３および外部インタフェース１４の少なくとも一方を介して、対象の検出装置に接続されてよい。

　入力装置１５は、例えば、マウス、キーボード等の入力を行うための装置である。また、出力装置１６は、例えば、ディスプレイ、スピーカ等の出力を行うための装置である。ユーザ等のオペレータは、入力装置１５および出力装置１６を利用することで、モデル生成装置１を操作することができる。

　ドライブ１７は、例えば、ＣＤドライブ、ＤＶＤドライブ等であり、記憶媒体９１に記憶されたプログラム等の各種情報を読み込むためのドライブ装置である。記憶媒体９１は、コンピュータその他装置、機械等が、記憶されたプログラム等の各種情報を読み取り可能なように、当該プログラム等の情報を、電気的、磁気的、光学的、機械的又は化学的作用によって蓄積する媒体である。上記モデル生成プログラム８１および複数の学習データセット１２０の少なくともいずれかは、記憶媒体９１に記憶されていてもよい。モデル生成装置１は、この記憶媒体９１から、上記モデル生成プログラム８１および複数の学習データセット１２０の少なくともいずれかを取得してもよい。なお、図２では、記憶媒体９１の一例として、ＣＤ、ＤＶＤ等のディスク型の記憶媒体を例示している。しかしながら、記憶媒体９１の種類は、ディスク型に限られなくてもよく、ディスク型以外であってもよい。ディスク型以外の記憶媒体として、例えば、フラッシュメモリ等の半導体メモリを挙げることができる。ドライブ１７の種類は、記憶媒体９１の種類に応じて任意に選択されてよい。

　なお、モデル生成装置１の具体的なハードウェア構成に関して、実施形態に応じて、適宜、構成要素の省略、置換および追加が可能である。例えば、プロセッサ・リソースは、複数のハードウェアプロセッサを含んでもよい。ハードウェアプロセッサは、マイクロプロセッサ、ＦＰＧＡ（field-programmable gate array）、ＤＳＰ（digital signal processor）等で構成されてよい。記憶部１２は、制御部１１に含まれるＲＡＭおよびＲＯＭにより構成されてもよい。通信インタフェース１３、外部インタフェース１４、入力装置１５、出力装置１６およびドライブ１７の少なくともいずれかは省略されてもよい。モデル生成装置１は、複数台のコンピュータで構成されてもよい。この場合、各コンピュータのハードウェア構成は、一致していてもよいし、一致していなくてもよい。また、モデル生成装置１は、提供されるサービス専用に設計された情報処理装置の他、汎用のサーバ装置、ＰＣ（Personal Computer）等であってもよい。

　＜推定装置＞
　図３は、本実施形態に係る推定装置２のハードウェア構成の一例を模式的に例示する。図３に示される通り、本実施形態に係る推定装置２は、制御部２１、記憶部２２、通信インタフェース２３、外部インタフェース２４、入力装置２５、出力装置２６、およびドライブ２７が電気的に接続されたコンピュータである。

　推定装置２の制御部２１～ドライブ２７および記憶媒体９２はそれぞれ、上記モデル生成装置１の制御部１１～ドライブ１７および記憶媒体９１それぞれと同様に構成されてよい。制御部２１は、ハードウェアプロセッサであるＣＰＵ、ＲＡＭ、ＲＯＭ等を含み、プログラムおよびデータに基づいて各種情報処理を実行するように構成される。制御部２１は、ＣＰＵに代えて、または、ＣＰＵと共に、ＧＰＵを利用してもよい。記憶部２２は、例えば、ハードディスクドライブ、ソリッドステートドライブ等で構成される。記憶部２２は、気分推定プログラム８２、学習結果データ１２９等の各種情報を記憶する。

　気分推定プログラム８２は、訓練済みの機械学習モデル（本実施形態では、推定モデル３）を使用して、少なくとも対象者脳波特徴量２２１に対して所定の推定タスクを遂行する後述の情報処理（図７）を推定装置２に実行させるためのプログラムである。気分推定プログラム８２は、当該情報処理の一連の命令を含む。気分推定プログラム８２および学習結果データ１２９のうちの少なくともいずれかは、記憶媒体９２に記憶されていてもよい。また、推定装置２は、気分推定プログラム８２および学習結果データ１２９のうちの少なくともいずれかを記憶媒体９２から取得してもよい。

　なお、推定装置２の具体的なハードウェア構成に関して、実施形態に応じて、適宜、構成要素の省略、置換および追加が可能である。例えば、推定装置２のプロセッサ・リソースは、複数のハードウェアプロセッサを含んでもよい。ハードウェアプロセッサは、マイクロプロセッサ、ＦＰＧＡ、ＤＳＰ等で構成されてよい。記憶部２２は、制御部２１に含まれるＲＡＭおよびＲＯＭにより構成されてもよい。通信インタフェース２３、外部インタフェース２４、入力装置２５、出力装置２６、およびドライブ２７の少なくともいずれかは省略されてもよい。推定装置２は、複数台のコンピュータで構成されてもよい。この場合、各コンピュータのハードウェア構成は、一致していてもよいし、一致していなくてもよい。また、推定装置２は、提供されるサービス専用に設計された情報処理装置の他、汎用のサーバ装置、汎用のＰＣ等であってもよい。

　［ソフトウェア構成］
　＜モデル生成装置＞
　図４は、本実施形態に係るモデル生成装置１のソフトウェア構成の一例を模式的に例示する。モデル生成装置１の制御部１１は、記憶部１２に記憶されたモデル生成プログラム８１をＲＡＭに展開する。そして、制御部１１は、ＣＰＵにより、ＲＡＭに展開されたモデル生成プログラム８１に含まれる命令を解釈および実行して、各構成要素を制御する。これにより、本実施形態に係るモデル生成装置１は、図４に例示する被験者脳波取得部１１１、基礎情報取得部１１２、被験者主観スコア取得部１１３、被験者気分スコア取得部１１４、符号部１１５、学習処理部１１６、および、保存処理部１１７をソフトウェアモジュールとして備えるコンピュータとして動作する。すなわち、本実施形態では、モデル生成装置１の各ソフトウェアモジュールは、制御部１１（ＣＰＵ）により実現される。

　被験者脳波取得部１１１は、文章を発話する音声を聴いている際に計測された学習被験者の脳波である被験者脳波４を取得する。被験者脳波取得部１１１は、複数の学習被験者（本実施形態では「１３５名の学習被験者」）の各々の被験者脳波４を取得する。

　本実施形態において被験者脳波取得部１１１は、「Ｎｇ」、「Ｎｔ」、「Ｐｓ」の区分ごとに、各学習被験者の複数の被験者脳波４を取得する。図４に例示するように、被験者脳波取得部１１１は、被験者第１脳波取得部１１１（１）、被験者第２脳波取得部１１１（２）、および、被験者第３脳波取得部１１１（３）を含んでいてもよい。被験者第１脳波取得部１１１（１）は、各学習被験者が「Ｎｇ」の区分に分類される複数（例えば５つ）の文章の各々を発話する音声を聴いていた際の脳波を、各学習被験者の複数（例えば５つ）の被験者第１脳波４（１）として取得する。各学習被験者の複数の被験者第１脳波４（１）は、各々、「Ｎｇ」の区分に分類される文章を発話する音声を聴いていた各学習被験者の脳波である。被験者第２脳波取得部１１１（２）は、各学習被験者が「Ｎｔ」の区分に分類される複数（例えば５つ）の文章の各々を発話する音声を聴いていた際の脳波を、各学習被験者の複数（例えば５つ）の被験者第２脳波４（２）として取得する。各学習被験者の複数の被験者第２脳波４（２）は、各々、「Ｎｔ」の区分に分類される文章を発話する音声を聴いていた各学習被験者の脳波である。被験者第３脳波取得部１１１（３）は、各学習被験者が「Ｐｓ」の区分に分類される複数（例えば５つ）の文章の各々を発話する音声を聴いていた際の脳波を、各学習被験者の複数（例えば５つ）の被験者第３脳波４（３）として取得する。各学習被験者の複数の被験者第３脳波４（３）は、各々、「Ｐｓ」の区分に分類される文章を発話する音声を聴いていた各学習被験者の脳波である。被験者脳波取得部１１１は、取得した、各学習被験者の複数の被験者第１脳波４（１）、各学習被験者の複数の被験者第２脳波４（２）、および、各学習被験者の複数の被験者第３脳波４（３）を、符号部１１５に通知する。

　基礎情報取得部１１２は、文章を発話する音声を聴いている際のヒトの脳波から脳波特徴量Ｆｗを生成する際に用いられる基礎情報を取得する。基礎情報取得部１１２が取得する基礎情報は、オンセット情報５およびエンベロープ情報の少なくとも一方である。オンセット情報５は、学習被験者が音声として聴いていた文章に含まれる各単語の開始時点を示す情報である。エンベロープ情報は、ヒトが聴いている音声の音声エンベロープを示す情報である。本実施形態では、基礎情報取得部１１２は、基礎情報として、学習被験者が音声として聴いていた文章に含まれる各単語の開始時点を示すオンセット情報５を取得する。基礎情報取得部１１２は、取得したオンセット情報５を符号部１１５に通知する。

　被験者主観スコア取得部１１３は、各学習被験者の主観スコアＳｓとして、文章を発話する音声を聴いた後に係る文章に対して各学習被験者が感じた主観的評価を示す被験者主観スコア１２２を取得する。被験者主観スコア取得部１１３は、取得した各学習被験者の被験者主観スコア１２２を、記憶部１２の学習データセット１２０に格納する。

　被験者気分スコア取得部１１４は、各学習被験者の気分スコアＳｍとして、各学習被験者の抑うつ気分の高さを示す被験者気分スコア１２３を取得する。被験者気分スコア取得部１１４は、取得した各学習被験者の被験者気分スコア１２３を、記憶部１２の学習データセット１２０に格納する。

　符号部１１５は、文章を発話する音声を聴いている際のヒトの脳波から脳波特徴量Ｆｗを生成する。本実施形態では、符号部１１５は、文章を発話する音声を聴いている際の学習被験者の脳波（つまり、被験者脳波４）から被験者脳波特徴量１２１を生成する。

　本実施形態において符号部１１５は、「Ｎｇ」、「Ｎｔ」、「Ｐｓ」の各区分に分類される文章を発話する音声を聴いていた際の各学習被験者の複数の被験者脳波４を統計的に処理して（例えば、平均して）、「Ｎｇ」、「Ｎｔ」、「Ｐｓ」の各区分に対応する各学習被験者の被験者脳波特徴量１２１を生成する。具体的には、符号部１１５は、各学習被験者の第１脳波特徴量Ｆｗ（１）、第２脳波特徴量Ｆｗ（２）、第３脳波特徴量Ｆｗ（３）として、各学習被験者の被験者第１脳波特徴量１２１（１）、被験者第２脳波特徴量１２１（２）、被験者第３脳波特徴量１２１（３）を生成する。

　図５は、本実施形態においてモデル生成装置１が実行する特徴量生成処理および学習処理の各々の過程の一例を模式的に例示する。図５に例示するように、符号部１１５は、各学習被験者の複数の被験者第１脳波４（１）を統計的に処理して、各学習被験者の「Ｎｇ」の区分に対応する被験者脳波特徴量１２１として、各学習被験者の被験者第１脳波特徴量１２１（１）を生成する。また、符号部１１５は、各学習被験者の複数の被験者第２脳波４（２）を統計的に処理して、各学習被験者の「Ｎｔ」の区分に対応する被験者脳波特徴量１２１として、各学習被験者の被験者第２脳波特徴量１２１（２）を生成する。さらに、符号部１１５は、各学習被験者の複数の被験者第３脳波４（３）を統計的に処理して、各学習被験者の「Ｐｓ」の区分に対応する被験者脳波特徴量１２１として、各学習被験者の被験者第３脳波特徴量１２１（３）を生成する。

　特に、符号部１１５は、「Ｎｇ」、「Ｎｔ」、「Ｐｓ」の区分ごとに、複数の『各学習被験者の「単語に対する脳波応答」における成分特徴量Ｉｆａ』を統計的に処理して（例えば、平均して）、「Ｎｇ」、「Ｎｔ」、「Ｐｓ」の区分ごとの、各学習被験者の被験者脳波特徴量１２１を生成する。

　例えば、符号部１１５は、（Ａ）各学習被験者の複数の被験者第１脳波４（１）と、（Ｂ）各学習被験者が聴いている、「Ｎｇ」に分類される複数の文章の各々に含まれる各単語の開始時点を示すオンセット情報５とから、（Ｃ）係る複数の文章の各々について、各学習被験者の「単語に対する脳波応答」の成分特徴量Ｉｆａ（１）を生成する。そして、符号部１１５は、各々が「Ｎｇ」に分類される文章についての『各学習被験者の「単語に対する脳波応答」の成分特徴量Ｉｆａ』である、複数の成分特徴量Ｉｆａ（１）を統計的に処理して、各学習被験者の被験者第１脳波特徴量１２１（１）を生成する。

　同様に、符号部１１５は、（Ａ）各学習被験者の複数の被験者第２脳波４（２）と、（Ｂ）各学習被験者が聴いている、「Ｎｔ」に分類される複数の文章の各々に含まれる各単語の開始時点を示すオンセット情報５とから、（Ｃ）係る複数の文章の各々について、各学習被験者の「単語に対する脳波応答」の成分特徴量Ｉｆａ（２）を生成する。そして、符号部１１５は、各々が「Ｎｔ」に分類される文章についての『各学習被験者の「単語に対する脳波応答」の成分特徴量Ｉｆａ』である、複数の成分特徴量Ｉｆａ（２）を統計的に処理して、各学習被験者の被験者第２脳波特徴量１２１（２）を生成する。

　また、符号部１１５は、（Ａ）各学習被験者の複数の被験者第３脳波４（３）と、（Ｂ）各学習被験者が聴いている、「Ｐｓ」に分類される複数の文章の各々に含まれる各単語の開始時点を示すオンセット情報５とから、（Ｃ）係る複数の文章の各々について、各学習被験者の「単語に対する脳波応答」の成分特徴量Ｉｆａ（３）を生成する。そして、符号部１１５は、各々が「Ｐｓ」に分類される文章についての『各学習被験者の「単語に対する脳波応答」の成分特徴量Ｉｆａ』である、複数の成分特徴量Ｉｆａ（３）を統計的に処理して、各学習被験者の被験者第３脳波特徴量１２１（３）を生成する。

　符号部１１５は、生成した各学習被験者の被験者第１脳波特徴量１２１（１）、被験者第２脳波特徴量１２１（２）、被験者第３脳波特徴量１２１（３）を、記憶部１２の学習データセット１２０に格納する。

　学習処理部１１６は、記憶部１２に格納されている複数の学習データセット１２０を使用して、推定モデル３の機械学習を実施する。これまで説明してきたように、符号部１１５は、各学習被験者の被験者脳波特徴量１２１を各学習データセット１２０に格納し、被験者気分スコア取得部１１４は、各学習被験者の被験者気分スコア１２３を各学習データセット１２０に格納する。そのため、各学習データセット１２０は、少なくとも、各学習被験者の被験者脳波特徴量１２１に対して、各学習被験者の被験者気分スコア１２３が、対応付けられることにより構成されている。

　学習処理部１１６が実施する機械学習は、少なくとも、以下の訓練ステップを含む。すなわち、各学習データセット１２０について、被験者脳波特徴量１２１を入力として受け付けたときに推定モデル３が推定する主観スコアＳｓが、被験者気分スコア１２３に一致するように、推定モデル３を訓練する訓練ステップを含む。

　本実施形態において各学習データセット１２０には、さらに、被験者主観スコア取得部１１３によって各学習被験者の被験者主観スコア１２２が格納されている。すなわち、各学習データセット１２０においては、各学習被験者の被験者脳波特徴量１２１および被験者主観スコア１２２に対して、各学習被験者の被験者気分スコア１２３が対応付けられている。そのため、本実施形態において学習処理部１１６が実施する機械学習は、以下の訓練ステップを含む。すなわち、各学習データセット１２０について、被験者脳波特徴量１２１および被験者主観スコア１２２を入力されたときに推定モデル３が推定する主観スコアＳｓが、被験者気分スコア１２３に一致するように、推定モデル３を訓練する訓練ステップを含む。

　特に、本実施形態に係る各学習データセット１２０には、符号部１１５によって、各学習被験者の被験者脳波特徴量１２１として、被験者第１脳波特徴量１２１（１）、被験者第２脳波特徴量１２１（２）、および、被験者第３脳波特徴量１２１（３）が、格納されている。すなわち、各学習データセット１２０において、各学習被験者の、被験者第１脳波特徴量１２１（１）、被験者第２脳波特徴量１２１（２）、被験者第３脳波特徴量１２１（３）、および、被験者主観スコア１２２に対して、各学習被験者の被験者気分スコア１２３が対応付けられている。

　そのため、本実施形態において学習処理部１１６が実施する機械学習は、以下の第１訓練ステップ、第２訓練ステップ、および、第３訓練ステップを含む。第１訓練ステップにおいて推定モデル３は、少なくとも学習被験者の第１脳波特徴量Ｆｗ（１）（被験者第１脳波特徴量１２１（１））を入力されたときに推定モデル３が推定する主観スコアＳｓが、被験者気分スコア１２３に一致するように、訓練される。第２訓練ステップにおいて推定モデル３は、少なくとも学習被験者の第２脳波特徴量Ｆｗ（２）（被験者第２脳波特徴量１２１（２））を入力されたときに推定モデル３が推定する主観スコアＳｓが、被験者気分スコア１２３に一致するように、訓練される。第３訓練ステップにおいて推定モデル３は、少なくとも学習被験者の第３脳波特徴量Ｆｗ（３）（被験者第３脳波特徴量１２１（３））を入力されたときに推定モデル３が推定する主観スコアＳｓが、被験者気分スコア１２３に一致するように、訓練される。

　具体的には、図５に例示するように、第１訓練ステップにおいて推定モデル３は、被験者第１脳波特徴量１２１（１）および被験者主観スコア１２２を入力されたときに推定モデル３が推定する主観スコアＳｓが、被験者気分スコア１２３に一致するように、訓練される。第２訓練ステップにおいて推定モデル３は、被験者第２脳波特徴量１２１（２）および被験者主観スコア１２２を入力されたときに推定モデル３が推定する主観スコアＳｓが、被験者気分スコア１２３に一致するように、訓練される。第３訓練ステップにおいて推定モデル３は、被験者第３脳波特徴量１２１（３）および被験者主観スコア１２２を入力されたときに推定モデル３が推定する主観スコアＳｓが、被験者気分スコア１２３に一致するように、訓練される。以上の各訓練ステップの実行により、訓練済みの推定モデル３が生成される。推定モデル３の演算パラメータの値は、上記機械学習の各訓練ステップにより調節される。

　保存処理部１１７は、訓練済みの推定モデル３の構造および演算パラメータの値を示す情報を学習結果データ１２９として生成する。構造は、例えば、ニューラルネットワークにおける入力層から出力層までの層の数、各層の種類、各層に含まれるニューロンの数、隣接する層のニューロン同士の結合関係等により特定されてよい。気分推定システム１００内でモデル（推定モデル３）の構造が共通化される場合、この構造に関する情報は学習結果データ１２９から省略されてもよい。また、利用場面で使用されない情報は、学習結果データ１２９から省略されてよい。保存処理部１１７は、生成した学習結果データ１２９を所定の記憶領域（本実施形態では、記憶部１２）に保存する。

　＜推定装置＞
　図６は、本実施形態に係る推定装置２のソフトウェア構成の一例を模式的に例示する。推定装置２の制御部２１は、記憶部２２に記憶された気分推定プログラム８２をＲＡＭに展開する。そして、制御部２１は、ＣＰＵにより、ＲＡＭに展開された気分推定プログラム８２に含まれる命令を解釈および実行して、各構成要素を制御する。これにより、本実施形態に係る推定装置２は、図６に例示する対象者脳波取得部２１１、分類情報取得部２１２、基礎情報取得部２１３、対象者主観スコア取得部２１４、符号部２１５、推定部２１６、および、出力部２１７をソフトウェアモジュールとして備えるコンピュータとして動作する。すなわち、本実施形態では、推定装置２の各ソフトウェアモジュールは、上記モデル生成装置１と同様に、制御部２１（ＣＰＵ）により実現される。

　対象者脳波取得部２１１は、本発明の「対象者脳波取得ステップ」を実行するソフトウェアモジュールの一例である。対象者脳波取得部２１１は、文章を発話する音声を聴いている際に計測された対象者の脳波である対象者脳波６を取得する。対象者脳波取得部２１１は、取得した対象者脳波６を、符号部２１５に通知する。

　分類情報取得部２１２は、本発明の「分類情報取得ステップ」を実行するソフトウェアモジュールの一例である。分類情報取得部２１２は、対象者が音声として聴いている文章が、「Ｎｇ」、「Ｎｔ」、「Ｐｓ」の少なくとも３つの区分の何れに分類されるかを示す分類情報７を取得する。分類情報取得部２１２は、取得した分類情報７を、符号部２１５に通知する。

　基礎情報取得部２１３は、本発明の「オンセット情報取得ステップ」および「エンベロープ情報取得ステップ」の少なくとも一方を実行するソフトウェアモジュールの一例である。本実施形態において基礎情報取得部２１３は、基礎情報取得部１１２と同様に、基礎情報を取得し、具体的には、対象者が音声として聴いていた文章に含まれる各単語の開始時点を示すオンセット情報８を取得する。基礎情報取得部２１３は、取得したオンセット情報８を、符号部２１５に通知する。なお、基礎情報取得部２１３は、基礎情報取得部１１２と同様に、オンセット情報８に代えて、または、オンセット情報８と共に、対象者が聴いている音声の音声エンベロープを示すエンベロープ情報を取得してもよい。

　対象者主観スコア取得部２１４は、本発明の「対象者主観スコア取得ステップ」を実行するソフトウェアモジュールの一例である。対象者主観スコア取得部２１４は、対象者の主観スコアＳｓとして、文章を発話する音声を聴いた後に係る文章に対して対象者が感じた主観的評価を示す対象者主観スコア９を取得する。対象者主観スコア取得部２１４は、取得した対象者主観スコア９を、推定部２１６に通知する。

　符号部２１５は、本発明の「脳波符号ステップ」を実行するソフトウェアモジュールの一例である。符号部２１５は、対象者脳波６から、対象者脳波特徴量２２１を生成する。本実施形態において符号部２１５は、対象者脳波６と分類情報７とから、分類情報７によって示される区分（ｘ）に対応する対象者脳波特徴量２２１（ｘ）を生成する。「ｘ」は、「１」以上の整数であり、例えば、区分（１）は「Ｎｇ」に、区分（２）は「Ｎｔ」に、区分（３）は「Ｐｓ」に、それぞれ対応する。

　具体的には、分類情報７が、対象者が音声として聴いている文章が「Ｎｇ」に分類されることを示す場合、符号部２１５は、対象者の第１脳波特徴量Ｆｗ（１）として、対象者脳波特徴量２２１（１）を生成する。また、分類情報７が、対象者が音声として聴いている文章が「Ｎｔ」に分類されることを示す場合、符号部２１５は、対象者の第２脳波特徴量Ｆｗ（２）として、対象者脳波特徴量２２１（２）を生成する。さらに、分類情報７が、対象者が音声として聴いている文章が「Ｐｓ」に分類されることを示す場合、符号部２１５は、対象者の第３脳波特徴量Ｆｗ（３）として、対象者脳波特徴量２２１（３）を生成する。以下の説明において、対象者脳波特徴量２２１（１）、２２１（２）、２２１（３）の各々を特に区別しない場合、「対象者脳波特徴量２２１」と称することがある。

　符号部２１５は、対象者脳波６とオンセット情報８とから、対象者の「単語に対する脳波応答」における成分特徴量Ｉｆａを、脳波特徴量Ｆｗとして生成する。本実施形態において符号部２１５は、「Ｎｇ」、「Ｎｔ」、「Ｐｓ」の区分ごとに、対象者の「単語に対する脳波応答」における成分特徴量Ｉｆａを生成することができ、つまり、「Ｎｇ」、「Ｎｔ」、「Ｐｓ」の区分ごとに、対象者の脳波特徴量Ｆｗを生成することができる。具体的には、符号部２１５は、対象者脳波６と分類情報７とオンセット情報８とから、対象者の「分類情報７によって示される区分（ｘ）に分類される文章に含まれる単語に対する脳波応答」における成分特徴量Ｉｆａ（ｘ）を、分類情報７によって示される区分（ｘ）に対応する対象者脳波特徴量２２１（ｘ）として生成する。

　例えば、分類情報７が、対象者が音声として聴いている文章が「Ｎｇ」に分類されることを示す場合、符号部２１５は、対象者の『「Ｎｇ」に分類される文章に含まれる単語に対する脳波応答』における成分特徴量Ｉｆａ（１）を、「Ｎｇ」に対応する対象者脳波特徴量２２１（１）として生成する。また、分類情報７が、対象者が音声として聴いている文章が「Ｎｔ」に分類されることを示す場合、符号部２１５は、対象者の『「Ｎｔ」に分類される文章に含まれる単語に対する脳波応答』における成分特徴量Ｉｆａ（２）を、「Ｎｔ」に対応する対象者脳波特徴量２２１（２）として生成する。さらに、分類情報７が、対象者が音声として聴いている文章が「Ｐｓ」に分類されることを示す場合、符号部２１５は、対象者の『「Ｐｓ」に分類される文章に含まれる単語に対する脳波応答』における成分特徴量Ｉｆａ（３）を、「Ｐｓ」に対応する対象者脳波特徴量２２１（３）として生成する。

　推定部２１６は、本発明の「推定ステップ」を実行するソフトウェアモジュールの一例である。推定部２１６は、モデル生成装置１により生成された訓練済みの機械学習モデル（つまり、推定モデル３）を使用して、少なくとも対象者脳波特徴量２２１に対して推定タスクを遂行し、つまり、対象者気分スコア２２３を推定する。推定部２１６は、学習結果データ１２９を保持することで、モデル生成装置１により生成された訓練済みの推定モデル３を備えている。推定部２１６は、訓練済みの推定モデル３を使用して、少なくとも対象者脳波特徴量２２１から、対象者気分スコア２２３を推定する。

　本実施形態において対象者脳波特徴量２２１は、分類情報７によって示される区分（ｘ）に対応する対象者脳波特徴量２２１（ｘ）であり、特に、対象者の「分類情報７によって示される区分（ｘ）に分類される文章に含まれる単語に対する脳波応答」における成分特徴量Ｉｆａ（ｘ）である。前述の通り、訓練済の推定モデル３は、「Ｎｇ」、「Ｎｔ」、「Ｐｓ」の区分ごとの被験者脳波特徴量１２１（被験者第１脳波特徴量１２１（１）、被験者第２脳波特徴量１２１（２）、被験者第３脳波特徴量１２１（３））を入力されたときに推定モデル３が推定する主観スコアＳｓが、被験者気分スコア１２３に一致するように訓練されている。そして、被験者第１脳波特徴量１２１（１）は、各学習被験者の『「Ｎｇ」に分類される文章に含まれる単語に対する脳波応答』における成分特徴量Ｉｆａ（１）の平均である。また、被験者第２脳波特徴量１２１（２）は、各学習被験者の『「Ｎｔ」に分類される文章に含まれる単語に対する脳波応答』における成分特徴量Ｉｆａ（２）の平均である。さらに、被験者第３脳波特徴量１２１（３）は、各学習被験者の『「Ｐｓ」に分類される文章に含まれる単語に対する脳波応答』における成分特徴量Ｉｆａ（３）の平均である。そのため、推定部２１６は、対象者の「分類情報７によって示される区分（ｘ）に分類される文章に含まれる単語に対する脳波応答」における成分特徴量Ｉｆａ（ｘ）を、訓練済の推定モデル３に与えることにより、対象者気分スコア２２３を推定することができる。

　特に、推定部２１６は、対象者脳波特徴量２２１と対象者主観スコア９とから、対象者気分スコア２２３を推定する。前述の通り、訓練済の推定モデル３は、被験者脳波特徴量１２１および被験者主観スコア１２２を入力されたときに推定モデル３が推定する主観スコアＳｓが、被験者気分スコア１２３に一致するように訓練されている。そのため、推定部２１６は、対象者脳波特徴量２２１および対象者主観スコア９を訓練済の推定モデル３に与えることにより、対象者気分スコア２２３を推定することができる。

　例えば、推定部２１６は、対象者の『「Ｎｇ」に分類される文章に含まれる単語に対する脳波応答』における成分特徴量Ｉｆａ（１）（「Ｎｇ」に対応する対象者脳波特徴量２２１（１））と対象者主観スコア９とを訓練済の推定モデル３に与えることにより、対象者気分スコア２２３を推定する。また、推定部２１６は、対象者の『「Ｎｔ」に分類される文章に含まれる単語に対する脳波応答』における成分特徴量Ｉｆａ（２）（「Ｎｔ」に対応する対象者脳波特徴量２２１（２））と対象者主観スコア９とを訓練済の推定モデル３に与えることにより、対象者気分スコア２２３を推定する。さらに、推定部２１６は、対象者の『「Ｐｓ」に分類される文章に含まれる単語に対する脳波応答』における成分特徴量Ｉｆａ（３）（「Ｐｓ」に対応する対象者脳波特徴量２２１（３））と対象者主観スコア９とを訓練済の推定モデル３に与えることにより、対象者気分スコア２２３を推定する。

　図７は、推定装置２が実行する特徴量生成処理および気分推定処理の各々の過程の一例を模式的に例示する。図７に例示するように、符号部２１５は、対象者脳波６と分類情報７とオンセット情報８とから、対象者の「分類情報７によって示される区分（ｘ）に分類される文章に含まれる単語に対する脳波応答」における成分特徴量Ｉｆａ（ｘ）（分類情報７によって示される区分（ｘ）に対応する対象者脳波特徴量２２１（ｘ））を生成する。つまり、符号部２１５は、分類情報７によって示される区分に応じて、対象者の第１脳波特徴量Ｆｗ（１）である対象者脳波特徴量２２１（１）、対象者の第２脳波特徴量Ｆｗ（２）である対象者脳波特徴量２２１（２）、対象者の第３脳波特徴量Ｆｗ（３）である対象者脳波特徴量２２１（３）の何れかを生成する。そして、訓練済の推定モデル３は、対象者脳波特徴量２２１（特に、分類情報７によって示される区分（ｘ）に対応する対象者脳波特徴量２２１（ｘ））および対象者主観スコア９から、対象者気分スコア２２３を推定する（出力する）。

　出力部２１７は、本発明の「出力ステップ」を実行するソフトウェアモジュールの一例である。出力部２１７は、推定ステップにおいて推定された対象者気分スコア２２３に対応する情報を、対象者に出力する。

　当該構成では、推定装置２は、対象者気分スコア２２３に対応する情報を、対象者に出力する（例えば、通知する）。対象者気分スコア２２３に対応する情報は、対象者気分スコア２２３自体であってもよい。また、対象者気分スコア２２３に対応する情報は、対象者気分スコア２２３によって示される、対象者の抑うつ気分の高低を示す情報であってもよい。さらに、対象者気分スコア２２３に対応する情報は、対象者気分スコア２２３に対応する、対象者へのアドバイスを含む情報であってもよい。例えば、推定装置２は、対象者気分スコア２２３を対象者に出力することにより、対象者に、自らの気分の落ち込みなどの心の状態を自覚させることができる。例えば、推定装置２は、対象者気分スコア２２３に対応する、対象者へのアドバイスを含む情報を対象者に出力することにより、対象者に、メンタルに負担の大きい情報を遮断するなどの、メンタルヘルスを健全に保つための行動を促すことができる。

　対象者気分スコア２２３が対象者の抑うつ気分が高いことを示すものであった場合、対象者気分スコア２２３に対応する情報は、対象者をリラックスさせる情報、例えば、対象者をリラックスさせる音楽、映像等であってもよい。推定装置２は、対象者気分スコア２２３が示す対象者の抑うつ気分の高さに応じた情報を、「対象者気分スコア２２３に対応する情報」として対象者に出力することができる。

　特に、推定装置２は、非特許文献１に記載されている非日常的な（特殊な）音ではなく、対象者が日常的に耳にする、ニュース音声などの文章を発話する音声を聴いている際の対象者の脳波から、対象者気分スコア２２３を推定する。そのため、推定装置２は、日常的な音声情報に対する対象者の脳波から対象者気分スコア２２３を推定し、推定した対象者気分スコア２２３に対応する情報を対象者に出力することにより、対象者に自らの心の状態を自覚させたり、メンタルヘルスを健全に保つための行動を促したり、また、対象者をリラックスさせたりすることができる。

　＜その他＞
　モデル生成装置１および推定装置２の各ソフトウェアモジュールに関しては後述する動作例で詳細に説明する。なお、本実施形態では、モデル生成装置１および推定装置２の各ソフトウェアモジュールがいずれも汎用のＣＰＵによって実現される例について説明している。しかしながら、上記ソフトウェアモジュールの一部又は全部が、１又は複数の専用のプロセッサにより実現されてもよい。例えば、上記ソフトウェアモジュールの一部又は全部が、グラフィックスプロセッシングユニットにより処理されてもよい。また、モデル生成装置１および推定装置２それぞれのソフトウェア構成に関して、実施形態に応じて、適宜、ソフトウェアモジュールの省略、置換および追加が行われてもよい。

　§３　動作例
　［モデル生成装置］
　図８は、本実施形態に係るモデル生成装置１の処理手順の一例を示すフローチャートである。ただし、以下で説明する処理手順は一例に過ぎず、各ステップは可能な限り変更されてよい。更に、以下で説明する処理手順について、実施の形態に応じて、適宜、ステップの省略、置換、および追加が可能である。

　（ステップＳ１０１）
　ステップＳ１０１では、制御部１１は、被験者脳波取得部１１１として動作し、「Ｎｇ」、「Ｎｔ」、「Ｐｓ」の区分ごとに、各学習被験者の複数の被験者脳波４を取得する。すなわち、制御部１１は、各学習被験者の複数の被験者第１脳波４（１）、被験者第２脳波４（２）、被験者第３脳波４（３）を取得する。

　（ステップＳ１０２）
　ステップＳ１０２では、制御部１１は、基礎情報取得部１１２として動作し、本実施形態においては、学習被験者が音声として聴いていた文章に含まれる各単語の開始時点を示すオンセット情報５を取得する。

　（ステップＳ１０３）
　ステップＳ１０３では、制御部１１は、被験者主観スコア取得部１１３として動作し、文章を発話する音声を聴いた後に係る文章に対して各学習被験者が感じた主観的評価を示す被験者主観スコア１２２を取得する。制御部１１は、取得した各学習被験者の被験者主観スコア１２２を、記憶部１２の学習データセット１２０に格納する。

　（ステップＳ１０４）
　ステップＳ１０４では、制御部１１は、被験者気分スコア取得部１１４として動作し、各学習被験者の抑うつ気分の高さを示す被験者気分スコア１２３を取得する。制御部１１は、取得した各学習被験者の被験者気分スコア１２３を、記憶部１２の学習データセット１２０に格納する。

　（ステップＳ１０５）
　ステップＳ１０５では、制御部１１は、符号部１１５として動作し、「Ｎｇ」、「Ｎｔ」、「Ｐｓ」の区分ごとに、複数の被験者脳波４と基礎情報（オンセット情報５）とから、被験者脳波特徴量１２１を生成する。すなわち、制御部１１は、各学習被験者の複数の被験者第１脳波４（１）と、オンセット情報５とから、各学習被験者の『「Ｎｇ」に分類される文章に含まれる単語に対する脳波応答』の成分特徴量Ｉｆａ（１）を、各学習被験者の被験者第１脳波特徴量１２１（１）として生成する。また、制御部１１は、各学習被験者の複数の被験者第２脳波４（２）と、オンセット情報５とから、各学習被験者の『「Ｎｔ」に分類される文章に含まれる単語に対する脳波応答』の成分特徴量Ｉｆａ（２）を、各学習被験者の被験者第２脳波特徴量１２１（２）として生成する。さらに、制御部１１は、各学習被験者の複数の被験者第３脳波４（３）と、オンセット情報５とから、各学習被験者の『「Ｐｓ」に分類される文章に含まれる単語に対する脳波応答』の成分特徴量Ｉｆａ（３）を、各学習被験者の被験者第３脳波特徴量１２１（３）として生成する。

　（ステップＳ１０６）
　ステップＳ１０６では、制御部１１は、符号部１１５として動作し、それぞれが『「Ｎｇ」、「Ｎｔ」、「Ｐｓ」の区分ごとの被験者脳波特徴量１２１および被験者主観スコア１２２』に対して被験者気分スコア１２３が対応付けられることにより構成される、複数の学習データセット１２０を準備する。前述の通り、Ｓ１０３において、各学習データセット１２０には各学習被験者の被験者主観スコア１２２が格納される。また、Ｓ１０４において、各学習データセット１２０には各学習被験者の被験者気分スコア１２３が格納される。そして、ステップＳ１０６において制御部１１は、ステップＳ１０５において生成した、各学習被験者の被験者第１脳波特徴量１２１（１）、被験者第２脳波特徴量１２１（２）、被験者第３脳波特徴量１２１（３）を、各学習データセット１２０に格納する。これにより、それぞれ、各学習被験者の被験者脳波特徴量１２１（被験者第１脳波特徴量１２１（１）、被験者第２脳波特徴量１２１（２）、被験者第３脳波特徴量１２１（３））および被験者主観スコア１２２に対して、各学習被験者の被験者気分スコア１２３が対応付けられた複数の学習データセット１２０が準備される。

　（ステップＳ１０７）
　ステップＳ１０７では、制御部１１は、学習処理部１１６として動作し、複数の学習データセット１２０を使用して、学習モデル（つまり、推定モデル３）の機械学習を実施する。機械学習を実施することは、複数の学習データセット１２０の各々について、少なくとも被験者脳波特徴量１２１を入力として受け付けたときに推定モデル３が推定する主観スコアＳｓが、被験者気分スコア１２３に一致するように、推定モデル３を訓練する訓練ステップを含む。本実施形態において機械学習を実施することは、各学習データセット１２０について、被験者脳波特徴量１２１（被験者第１脳波特徴量１２１（１）、被験者第２脳波特徴量１２１（２）、被験者第３脳波特徴量１２１（３））および被験者主観スコア１２２を入力されたときに推定モデル３が推定する主観スコアＳｓが、被験者気分スコア１２３に一致するように、推定モデル３を訓練する訓練ステップを含む。

　具体的には、機械学習を実施することは、以下の第１訓練ステップ、第２訓練ステップ、および、第３訓練ステップを含む。第１訓練ステップにおいて推定モデル３は、被験者第１脳波特徴量１２１（１）および被験者主観スコア１２２を入力されたときに推定モデル３が推定する主観スコアＳｓが、被験者気分スコア１２３に一致するように、訓練される。第２訓練ステップにおいて推定モデル３は、被験者第２脳波特徴量１２１（２）および被験者主観スコア１２２を入力されたときに推定モデル３が推定する主観スコアＳｓが、被験者気分スコア１２３に一致するように、訓練される。第３訓練ステップにおいて推定モデル３は、被験者第３脳波特徴量１２１（３）および被験者主観スコア１２２を入力されたときに推定モデル３が推定する主観スコアＳｓが、被験者気分スコア１２３に一致するように、訓練される。

　機械学習の処理対象となる推定モデル３を構成するニューラルネットワークは適宜用意されてよい。推定モデル３の構造（例えば、層の数、各層に含まれるニューロンの数、隣接する層のニューロン同士の結合関係等）、各ニューロン間の結合の重みの初期値、および各ニューロンの閾値の初期値は、テンプレートにより与えられてもよいし、オペレータの入力により与えられてもよい。また、再学習を行う場合には、制御部１１は、過去の機械学習を行うことで得られた学習結果データに基づいて、推定モデル３を用意してもよい。この機械学習の訓練処理には、例えば、バッチ勾配降下法、確率的勾配降下法、ミニバッチ勾配降下法等が用いられてよい。

　制御部１１は、例えば、各学習データセット１２０について、推定モデル３から得られる出力値と正解データである「被験者気分スコア１２３」との間の誤差を算出する。制御部１１は、例えば、誤差逆伝播（Back propagation）法により、算出された誤差の勾配を用いて、推定モデル３の各演算パラメータ（各ニューロン間の結合の重み、各ニューロンの閾値等）の値の誤差を算出する。制御部１１は、算出された各誤差に基づいて、推定モデル３の各演算パラメータの値を更新する。各演算パラメータの値を更新する程度は、学習率により調節されてよい。学習率は、オペレータの指定により与えられてもよいし、プログラム内の設定値として与えられてもよい。

　制御部１１は、上記一連の更新処理により、算出される各誤差の和が小さくなるように、推定モデル３の各演算パラメータの値を調整する。例えば、規定回数実行する、算出される誤差の和が閾値以下になる等の所定の条件を満たすまで、制御部１１は、上記一連の処理による各演算パラメータの値の調節を繰り返してもよい。これにより、制御部１１は、各学習データセット１２０について、被験者脳波特徴量１２１および被験者主観スコア１２２を推定モデル３に与えることで推定モデル３から得られる推定タスクの遂行結果が正解データ（被験者気分スコア１２３）に適合するように、推定モデル３を訓練することができる。ステップＳ１０７の訓練処理が完了すると、制御部１１は、次のステップＳ１０８に処理を進める。

　（ステップＳ１０８）
　ステップＳ１０８では、制御部１１は、保存処理部１１７として動作し、機械学習の結果を保存し、つまり、訓練済みの推定モデル３の構造および演算パラメータの値を示す学習結果データ１２９を、所定の記憶領域に保存する。

　［推定装置］
　図９は、本実施形態に係る推定装置２の処理手順の一例を示すフローチャートである。ただし、以下で説明する処理手順は一例に過ぎず、各ステップは可能な限り変更されてよい。更に、以下で説明する処理手順について、実施の形態に応じて、適宜、ステップの省略、置換、および追加が可能である。

　（ステップＳ２０１、対象者脳波取得ステップ）
　ステップＳ２０１では、制御部２１は、対象者脳波取得部２１１として動作し、文章を発話する音声を聴いている際の対象者の脳波（対象者脳波６）を取得する。

　（ステップＳ２０２、分類情報取得ステップ）
　ステップＳ２０２では、制御部２１は、分類情報取得部２１２として動作し、対象者が音声として聴いている文章が、「Ｎｇ」、「Ｎｔ」、「Ｐｓ」の少なくとも３つの区分の何れに分類されるかを示す分類情報７を取得する。

　（ステップＳ２０３、オンセット情報取得ステップ）
　ステップＳ２０３では、制御部２１は、基礎情報取得部２１３として動作し、基礎情報として、対象者が音声として聴いていた文章に含まれる各単語の開始時点を示すオンセット情報８を取得する。

　（ステップＳ２０４、対象者主観スコア取得ステップ）
　ステップＳ２０４では、制御部２１は、対象者主観スコア取得部２１４として動作し、文章を発話する音声を聴いた後に係る文章に対して対象者が感じた主観的評価を示す対象者主観スコア９を取得する。

　（ステップＳ２０５、脳波符号ステップ）
　ステップＳ２０５では、制御部２１は、符号部２１５として動作し、対象者脳波６から対象者脳波特徴量２２１を生成する。本実施形態において制御部２１は、対象者脳波６、オンセット情報８、分類情報７から、分類情報７によって示される区分（ｘ）に対応する対象者脳波特徴量２２１（ｘ）を生成する。具体的には、制御部２１は、対象者の「分類情報７によって示される区分（ｘ）に分類される文章に含まれる単語に対する脳波応答」における成分特徴量Ｉｆａ（ｘ）を、分類情報７によって示される区分（ｘ）に対応する対象者脳波特徴量２２１（ｘ）として生成する。

　（ステップＳ２０６、推定ステップ）
　ステップＳ２０６では、制御部２１は、推定部２１６として動作し、訓練済みの推定モデル３に、少なくとも対象者脳波特徴量２２１を入力することにより、対象者気分スコア２２３を推定する。本実施形態において制御部２１は、ステップＳ２０５において生成した「分類情報７によって示される区分（ｘ）に対応する対象者脳波特徴量２２１（ｘ）」と、対象者主観スコア９とを、訓練済みの推定モデル３に入力して、推定タスクを遂行する。つまり、制御部２１は、「分類情報７によって示される区分（ｘ）に対応する対象者脳波特徴量２２１（ｘ）」と、対象者主観スコア９とを、訓練済みの推定モデル３に入力して、対象者気分スコア２２３を推定させる（出力させる）。

　（ステップＳ２０７、出力ステップ）
　ステップＳ２０７では、制御部２１は、出力部２１７として動作し、ステップＳ２０６における推定タスクの遂行結果に関する情報を出力し、つまり、推定ステップにおいて推定された対象者気分スコア２２３に対応する情報を、対象者に出力する。

　［特徴］
　以上のとおり、本実施形態において気分推定プログラム８２は、推定装置２（コンピュータ）に、対象者脳波取得ステップ（Ｓ２０１）と、脳波符号ステップ（Ｓ２０５）と、推定ステップ（Ｓ２０６）と、を実行させる。対象者脳波取得ステップにおいて、推定装置２は、文章を発話する音声を聴いている際の対象者の脳波である対象者脳波６を取得する。脳波符号ステップにおいて、推定装置２は、文章を発話する音声を聴いている際のヒトの脳波から脳波特徴量Ｆｗを生成する。特に、脳波符号ステップにおいて、推定装置２は、対象者脳波６から「対象者の脳波特徴量Ｆｗ」として対象者脳波特徴量２２１を生成する。推定ステップにおいて、推定装置２は、訓練済の推定モデル３に、対象者脳波特徴量２２１を入力することにより、対象者の抑うつ気分の高さを示す気分スコアＳｍである対象者気分スコア２２３を推定する。

　推定モデル３は、少なくとも脳波特徴量Ｆｗを入力として受け付け、ヒトの抑うつ気分の高さを示す気分スコアＳｍを推定し、例えば、線形サポートベクターマシンとして構成されてもよい。推定モデル３は、複数の学習データセット１２０を使用した機械学習が実施されることによって生成される。複数の学習データセット１２０は、それぞれ、少なくとも、文章を発話する音声を聴いていた際の学習被験者の脳波（被験者脳波４）から生成される脳波特徴量Ｆｗである被験者脳波特徴量１２１に対して、学習被験者の抑うつ気分の高さを示す気分スコアＳｍである被験者気分スコア１２３が、対応付けられることにより構成される。機械学習を実施することは、複数の学習データセット１２０の各々について、被験者脳波特徴量１２１を入力として受け付けたときに推定モデル３が推定する気分スコアＳｍが、被験者気分スコア１２３に一致するように、推定モデル３を訓練する訓練ステップを含む。

　当該構成では、気分推定プログラム８２は、推定装置２に、文章を発話する音声を聴いている際の対象者の対象者脳波６から生成される対象者脳波特徴量２２１に基づいて、係る対象者の抑うつ気分の高さを示す対象者気分スコア２２３を推定させる。気分推定プログラム８２は、推定装置２に、複数の学習データセット１２０を使用した機械学習が実施されることによって生成された推定モデル３に、対象者脳波特徴量２２１を入力することにより、対象者気分スコア２２３を推定させる。

　学習データセット１２０は、少なくとも、文章を発話する音声を聴いている際のヒト（学習被験者）の脳波から生成される脳波特徴量Ｆｗ（被験者脳波特徴量１２１）に対して、係るヒトの抑うつ気分の高さを示す気分スコアＳｍ（被験者気分スコア１２３）が対応付けられて構成される。また、機械学習を実施することは、複数の学習データセット１２０の各々について、被験者脳波特徴量１２１から推定モデル３が推定する気分スコアＳｍが、被験者気分スコア１２３に一致するように、推定モデル３を訓練する訓練ステップを含む。

　本件発明者らは、それぞれ、被験者脳波特徴量１２１に対して被験者気分スコア１２３が対応付けられることにより構成された複数の学習データセット１２０を使用した機械学習が実施されることによって生成された推定モデル３について、推定精度の検証を行ない、以下の検証結果を得た。すなわち、係る推定モデル３のＡＵＣ（Area Under the Roc Curve）が「０．７３」となったことを確認した。また、推定モデル３は、抑うつ気分が高い人（ＢＤＩスコアが１４以上の人）のうち６６％について、抑うつ気分が高いと識別した。そのため、推定装置２は、ニュース音声、会話音声などの「文章を発話する音声」を聴いている際の対象者の脳波から生成される対象者脳波特徴量２２１を、推定モデル３に入力することにより、対象者気分スコア２２３を高精度に推定することができる。

　特に、ニュース音声、会話音声などの「文章を発話する音声」は、非特許文献１に記載されている非日常的な（特殊な）音ではなく、対象者が日常的に耳にする音声であり、つまり、日常的な音声情報である。そのため、推定装置２は、係る日常的な音声情報に対する対象者の脳波（脳の応答）から、対象者の抑うつ気分の高さを示す対象者気分スコア２２３を推定することができるとの効果を奏する。

　気分推定プログラム８２は、推定装置２に、脳波符号ステップにおいて、「Ｎｇ」、「Ｎｔ」、「Ｐｓ」の少なくとも３つの区分ごとの脳波特徴量Ｆｗを生成させる。すなわち、推定装置２は、脳波符号ステップにおいて、係る少なくとも３つの区分の何れかに分類される文章を発話する音声を聴いている際のヒトの脳波と、その文章が分類される区分を示す情報とから、その文章が分類される区分に対応する脳波特徴量Ｆｗを、前述の脳波特徴量Ｆｗとして生成する。

　推定モデル３は、脳波特徴量Ｆｗとして、ヒトが音声として聴いている文章が分類される区分に対応する脳波特徴量Ｆｗを入力されると、係るヒトの抑うつ気分の高さを示す気分スコアＳｍを推定する。例えば、推定モデル３は、「Ｎｇ」の区分に対応する第１脳波特徴量Ｆｗ（１）、「Ｎｔ」の区分に対応する第２脳波特徴量Ｆｗ（２）、および、「Ｐｓ」の区分に対応する第３脳波特徴量Ｆｗ（３）の何れかを入力されると、気分スコアＳｍを推定する。

　被験者脳波特徴量１２１は、被験者第１脳波特徴量１２１（１）と、被験者第２脳波特徴量１２１（２）と、被験者第３脳波特徴量１２１（３）と、を含む。被験者第１脳波特徴量１２１（１）は、それぞれが「Ｎｇ」の区分に分類される文章を発話する音声を聴いていた際の学習被験者の脳波である、複数の被験者第１脳波４（１）を統計的に処理して（例えば、平均して）生成される第１脳波特徴量Ｆｗ（１）である。被験者第２脳波特徴量１２１（２）は、それぞれが「Ｎｔ」の区分に分類される文章を発話する音声を聴いていた際の学習被験者の脳波である、複数の被験者第２脳波４（２）を統計的に処理して生成される第２脳波特徴量Ｆｗ（２）である。被験者第３脳波特徴量１２１（３）は、それぞれが「Ｐｓ」の区分に分類される文章を発話する音声を聴いていた際の学習被験者の脳波である、複数の被験者第３脳波４（３）を統計的に処理して生成される第３脳波特徴量Ｆｗ（３）である。

　機械学習を実施することは、第１訓練ステップと、第２訓練ステップと、第３訓練ステップと、を含む。第１訓練ステップは、複数の学習データセット１２０の各々について、「Ｎｇ」の区分に対応する第１脳波特徴量Ｆｗ（１）として被験者第１脳波特徴量１２１（１）を入力されたときに推定モデル３が推定する気分スコアＳｍが、被験者気分スコア１２３に一致するように、推定モデル３を訓練する。第２訓練ステップは、複数の学習データセット１２０の各々について、「Ｎｔ」の区分に対応する第２脳波特徴量Ｆｗ（２）として被験者第２脳波特徴量１２１（２）を入力されたときに推定モデル３が推定する気分スコアＳｍが、被験者気分スコア１２３に一致するように、推定モデル３を訓練する。第３訓練ステップは、複数の学習データセット１２０の各々について、「Ｐｓ」の区分に対応する第３脳波特徴量Ｆｗ（３）として被験者第３脳波特徴量１２１（３）を入力されたときに推定モデル３が推定する気分スコアＳｍが、被験者気分スコア１２３に一致するように、推定モデル３を訓練する。

　気分推定プログラム８２は、推定装置２に、対象者が音声として聴いている文章が、前述の少なくとも３つの区分の何れに分類されるかを示す分類情報７を取得する分類情報取得ステップ（Ｓ２０２）をさらに実行させる。そして、気分推定プログラム８２は、推定装置２に、脳波符号ステップにおいて、分類情報７によって示される区分（ｘ）に分類される文章を発話する音声を聴いている際の対象者の対象者脳波６と、分類情報７とから、分類情報７によって示される区分（ｘ）に対応する対象者脳波特徴量２２１（ｘ）を生成させる。気分推定プログラム８２は、推定装置２に、推定ステップにおいて、分類情報７によって示される区分（ｘ）に対応する脳波特徴量Ｆｗとして、脳波符号ステップにおいて生成した対象者脳波特徴量２２１（ｘ）を、推定モデル３に入力することにより、対象者気分スコア２２３を推定する処理を実行させる。

　当該構成では、学習データセット１２０は、「Ｎｇ」、「Ｎｔ」、「Ｐｓ」の少なくとも３つの区分の各々に対応する脳波特徴量Ｆｗ（被験者第１脳波特徴量１２１（１）、被験者第２脳波特徴量１２１（２）、被験者第３脳波特徴量１２１（３））に対して、被験者気分スコア１２３が対応付けられることにより構成される。そして、推定モデル３は、学習データセット１２０を使用した、前述の第１訓練ステップ、第２訓練ステップ、第３訓練ステップと、を含む機械学習が実施されることによって生成される。そのため、推定モデル３は、「Ｎｇ」、「Ｎｔ」、「Ｐｓ」の各区分に対応する脳波特徴量Ｆｗ（第１脳波特徴量Ｆｗ（１）、第２脳波特徴量Ｆｗ（２）、および、第３脳波特徴量Ｆｗ（３）の何れか）から、ヒトの抑うつ気分の高さを示す気分スコアＳｍを推定することができる。

　さらに、推定装置２は、分類情報７を取得する分類情報取得ステップを実行する。分類情報７は、推定装置２の外部から取得してもよい。また、推定装置２が、分類情報７を生成し、生成した分類情報７を、前述の分類情報取得ステップにおいて取得してもよい。上述の通り、分類情報７は、ルールベースで生成されてもよいし、モデルベースで生成されてもよい。

　推定装置２は、分類情報７によって示される区分（ｘ）に分類される文章を発話する音声を聴いている際の対象者の対象者脳波６から、分類情報７によって示される区分（ｘ）に対応する対象者脳波特徴量２２１（ｘ）を生成する。そして、推定装置２は、対象者脳波特徴量２２１（ｘ）を、推定モデル３に入力することにより、対象者気分スコア２２３を推定させる。

　それゆえ、推定装置２は、文章を発話する音声を聴いている際の対象者の脳波と、係る文章が「Ｎｇ」、「Ｎｔ」、「Ｐｓ」の少なくとも３つの区分の何れかに分類されるかを示す分類情報７とから、対象者の抑うつ気分の高さを示す対象者気分スコア２２３を推定することができる。

　気分推定プログラム８２は、推定装置２に、脳波符号ステップにおいて、文章を発話する音声を聴いている際のヒトの脳波から、ヒトの「係る文章に含まれる単語に対する脳波応答」における成分特徴量Ｉｆａを、脳波特徴量Ｆｗとして生成させてもよい。例えば、推定装置２（特に、符号部２１５）は、文章を読む音声を聴いている際のヒトの脳波と、係る文章に含まれる各単語の開始時点とから、ヒトの「単語に対する脳波応答」における成分特徴量Ｉｆａを、脳波特徴量Ｆｗとして生成する。

　被験者脳波特徴量１２１は、文章を発話する音声を聴いていた際の学習被験者の被験者脳波４と、係る文章に含まれる各単語の開始時点とから生成される、学習被験者の「単語に対する脳波応答」における成分特徴量Ｉｆａである。

　気分推定プログラム８２は、推定装置２に、対象者が音声として聴いている文章に含まれる各単語の開始時点を示すオンセット情報８を取得するオンセット情報取得ステップ（Ｓ２０３）をさらに実行させる。そして、気分推定プログラム８２は、推定装置２に、脳波符号ステップにおいて、対象者脳波６と、オンセット情報８によって示される「対象者が音声として聴いている文章に含まれる各単語の開始時点」とから、対象者の「単語に対する脳波応答」における成分特徴量Ｉｆａを、対象者脳波特徴量２２１として生成させる。気分推定プログラム８２は、推定装置２に、推定ステップにおいて、対象者の「単語に対する脳波応答」における成分特徴量Ｉｆａを、対象者脳波特徴量２２１として推定モデル３に入力することにより、対象者気分スコア２２３を推定する処理を実行させる。

　当該構成では、脳波特徴量Ｆｗは、「文章に含まれる単語に対する脳波応答」における成分特徴量Ｉｆａである。学習データセット１２０は、学習被験者の「単語に対する脳波応答」における成分特徴量Ｉｆａに対して、被験者気分スコア１２３が対応付けられることにより構成される。そして、推定モデル３は、学習データセット１２０を使用した機械学習が実施されることによって生成される。そのため、推定モデル３は、「文章に含まれる単語に対する脳波応答」における成分特徴量Ｉｆａから、ヒトの抑うつ気分の高さを示す気分スコアＳｍを推定することができる。

　さらに、推定装置２は、オンセット情報８を取得するオンセット情報取得ステップを実行する。推定装置２は、対象者脳波６とオンセット情報８とから、対象者の「単語に対する脳波応答」における成分特徴量Ｉｆａを、対象者脳波特徴量２２１として生成する。そして、推定装置２は、対象者の「単語に対する脳波応答」における成分特徴量Ｉｆａを、推定モデル３に入力することにより、対象者気分スコア２２３を推定する。

　それゆえ、推定装置２は、文章を発話する音声を聴いている際の対象者の脳波（対象者脳波６）と、係る文章に含まれる各単語の開始時点を示すオンセット情報８とから、対象者の抑うつ気分の高さを示す対象者気分スコア２２３を推定することができる。

　気分推定プログラム８２について、推定モデル３は、脳波特徴量Ｆｗに加えてさらに、文章を発話する音声を聴いた後に係る文章に対してヒトが感じた主観的評価を示す主観スコアＳｓを入力として受け付け、入力された脳波特徴量Ｆｗおよび主観スコアＳｓから、気分スコアＳｍを推定してもよい。

　複数の学習データセット１２０は、それぞれ、被験者脳波特徴量１２１と、文章を発話する音声を聴いた後に係る文章に対して学習被験者が感じた主観的評価を示す主観スコアＳｓである被験者主観スコア１２２とに対して、被験者気分スコア１２３が対応付けられることにより構成される。機械学習を実施することは、複数の学習データセット１２０の各々について、被験者脳波特徴量１２１および被験者主観スコア１２２を入力されたときに推定モデル３が推定する気分スコアＳｍが、被験者気分スコア１２３に一致するように、推定モデル３を訓練する訓練ステップを含む。

　気分推定プログラム８２は、推定装置２に、文章を発話する音声を聴いた後に係る文章に対して対象者が感じた主観的評価を示す主観スコアＳｓである対象者主観スコア９を取得する対象者主観スコア取得ステップ（Ｓ２０４）をさらに実行させる。そして、気分推定プログラム８２は、推定装置２に、推定ステップにおいて、対象者脳波特徴量２２１と、対象者主観スコア９とを推定モデル３に入力することにより、対象者気分スコア２２３を推定する処理を実行させる。

　当該構成では、学習データセット１２０は、被験者脳波特徴量１２１と被験者主観スコア１２２とに対して、被験者気分スコア１２３が対応付けられることにより構成される。また、機械学習を実施することは、複数の学習データセット１２０の各々について、被験者脳波特徴量１２１および被験者主観スコア１２２を入力されたときに推定モデル３が推定する気分スコアＳｍが、被験者気分スコア１２３に一致するように、推定モデル３を訓練する訓練ステップを含む。そのため、推定モデル３は、脳波特徴量Ｆｗと、音声として聴いた文章に対してヒトが感じた主観的評価を示す主観スコアＳｓとから、ヒトの抑うつ気分の高さを示す気分スコアＳｍを推定することができる。本件発明者らは、それぞれ、被験者脳波特徴量１２１および被験者主観スコア１２２に対して被験者気分スコア１２３が対応付けられることにより構成された複数の学習データセット１２０を使用した機械学習が実施されることによって生成された推定モデル３について、推定精度の検証を行ない、以下の検証結果を得た。すなわち、推定モデル３のＡＵＣが「０．８３」となったことを確認した。また、推定モデル３は、抑うつ気分が高い人のうち７８％について、抑うつ気分が高いと識別した。

　さらに、推定装置２は、対象者主観スコア９を取得する対象者主観スコア取得ステップを実行する。推定装置２は、対象者脳波６と対象者主観スコア９とを、推定モデル３に入力することにより、対象者気分スコア２２３を推定する。

　それゆえ、推定装置２は、文章を発話する音声を聴いている際の対象者の脳波（対象者脳波６）と、係る文章に対して対象者が感じた主観的評価を示す対象者主観スコア９とから、対象者の抑うつ気分の高さを示す対象者気分スコア２２３を高精度に推定することができる。

　§４　変形例
　以上、本発明の実施の形態を詳細に説明してきたが、前述までの説明はあらゆる点において本発明の例示に過ぎない。本発明の範囲を逸脱することなく種々の改良又は変形を行うことができることは言うまでもない。例えば、以下のような変更が可能である。なお、以下では、上記実施形態と同様の構成要素に関しては同様の符号を用い、上記実施形態と同様の点については、適宜説明を省略した。以下の変形例は適宜組み合わせ可能である。

　＜４．１＞
　上記実施形態では、文章を発話する音声を聴いている際のヒトの脳波（脳波応答）から生成される脳波特徴量Ｆｗとして、ヒトの「単語に対する脳波応答」の成分特徴量Ｉｆａを用いる例を説明した。しかしながら、本発明において、脳波特徴量Ｆｗが、「単語に対する脳波応答」の成分特徴量Ｉｆａであることは必須ではない。本発明において、脳波特徴量Ｆｗは、「単語に対する脳波応答」および「音声エンベロープに追随する脳波応答」の少なくとも一方の成分特徴量Ｉｆａであればよい。

　すなわち、気分推定プログラム８２は、推定装置２に、脳波符号ステップ（ステップＳ２０５）において、「単語に対する脳波応答」における成分特徴量Ｉｆａに代えて、または、「単語に対する脳波応答」における成分特徴量Ｉｆａと共に、「音声エンベロープに追随する脳波応答」における成分特徴量Ｉｆａを生成させてもよい。例えば、文章を発話する音声を聴いている際のヒトの脳波から、ヒトの「音声に追随する脳波応答」における成分特徴量Ｉｆａが、脳波特徴量Ｆｗとして生成されてもよい。具体的には、推定装置２（特に、符号部２１５）は、文章を読む音声を聴いている際のヒトの脳波と、係る音声の音声エンベロープとから、ヒトの「音声に追随する脳波応答」における成分特徴量Ｉｆａを、脳波特徴量Ｆｗとして生成してもよい。

　これに対応させて、被験者脳波特徴量１２１は、文章を発話する音声を聴いていた際の学習被験者の脳波と、係る音声の音声エンベロープとから生成される、学習被験者の「音声エンベロープに追随する脳波応答」における成分特徴量Ｉｆａとする。その場合、気分推定プログラム８２は、推定装置２に、「対象者が聴いている音声の音声エンベロープを示す」エンベロープ情報を取得するエンベロープ情報取得ステップをさらに実行させる。エンベロープ情報取得ステップは、オンセット情報取得ステップ（Ｓ２０３）に代えて、または、オンセット情報取得ステップ（Ｓ２０３）と共に、行なわれてもよい。

　気分推定プログラム８２は、推定装置２に、脳波符号ステップ（ステップＳ２０５）において、対象者脳波６と、前述のエンベロープ情報によって示される「対象者が聴いている音声の音声エンベロープ」とから、対象者の「音声エンベロープに追随する脳波応答」における成分特徴量Ｉｆａを、対象者脳波特徴量２２１として生成させる。そして、気分推定プログラム８２は、推定装置２に、推定ステップ（ステップＳ２０６）において、対象者の「音声エンベロープに追随する脳波応答」における成分特徴量Ｉｆａを、対象者脳波特徴量２２１として推定モデル３に入力することにより、対象者気分スコア２２３を推定する処理を実行させる。

　当該構成では、脳波特徴量Ｆｗは、「聴いている音声の音声エンベロープに追随する脳波応答」における成分特徴量Ｉｆａである。学習データセット１２０は、学習被験者の「音声エンベロープに追随する脳波応答」における成分特徴量Ｉｆａに対して、被験者気分スコア１２３が対応付けられることにより構成される。そして、推定モデル３は、学習データセット１２０を使用した機械学習が実施されることによって生成される。そのため、推定モデル３は、ヒトの「音声エンベロープに追随する脳波応答」における成分特徴量Ｉｆａから、ヒトの抑うつ気分の高さを示す気分スコアＳｍを推定することができる。

　さらに、推定装置２は、エンベロープ情報を取得するエンベロープ情報取得ステップを実行する。推定装置２は、対象者脳波６と係るエンベロープ情報とから、対象者の「音声エンベロープに追随する脳波応答」における成分特徴量Ｉｆａを、対象者脳波特徴量２２１として生成する。そして、推定装置２は、対象者の「音声エンベロープに追随する脳波応答」における成分特徴量Ｉｆａを、推定モデル３に入力することにより、対象者気分スコア２２３を推定する。

　それゆえ、推定装置２は、文章を発話する音声を聴いている際の対象者の脳波（対象者脳波６）と、係る音声の音声エンベロープを示すエンベロープ情報とから、対象者の抑うつ気分の高さを示す対象者気分スコア２２３を推定することができる。

　＜４．２＞
　上記実施形態では、ヒトが音声として聴いている文章（例えば、ニュース）が、「Ｎｇ」、「Ｎｔ」、「Ｐｓ」の３つの区分の何れかに分類される例を説明した。しかしながら、本発明において、ヒトが音声として聴いている文章が、「Ｎｇ」、「Ｎｔ」、「Ｐｓ」の３つの区分の何れかに分類されることは必須ではない。本発明においては、ヒトが音声として聴いている文章は、「Ｎｇ」、「Ｎｔ」、「Ｐｓ」の少なくとも３つの区分の何れかに分類されればよく、４つ以上の区分の何れかに分類されてもよい。

　２…推定装置（コンピュータ）、３…推定モデル、６…対象者脳波、７…分類情報、８…オンセット情報、９…対象者主観スコア、８２…気分推定プログラム、１２１…被験者脳波特徴量、１２１（１）…被験者第１脳波特徴量、１２１（２）…被験者第２脳波特徴量、１２１（３）…被験者第３脳波特徴量、１２２…被験者主観スコア、１２３…被験者気分スコア、２２１…対象者脳波特徴量、２２３…対象者気分スコア、Ｆｗ…脳波特徴量、Ｓｍ…気分スコア、Ｓｓ…主観スコア、Ｓ２０１…対象者脳波取得ステップ、Ｓ２０２…分類情報取得ステップ、Ｓ２０３…オンセット情報取得ステップ、Ｓ２０４…対象者主観スコア取得ステップ、Ｓ２０５…脳波符号ステップ、Ｓ２０６…推定ステップ、Ｓ２０７…出力ステップ

Claims

　コンピュータに、
　文章を発話する音声を聴いている際の対象者の脳波である対象者脳波を取得する対象者脳波取得ステップと、
　文章を発話する音声を聴いている際のヒトの脳波から脳波特徴量を生成する脳波符号ステップであって、
　　前記対象者脳波から前記脳波特徴量として対象者脳波特徴量を生成する脳波符号ステップと、
　少なくとも前記脳波特徴量を入力として受け付け、前記ヒトの抑うつ気分の高さを示す気分スコアを推定する推定モデルであって、
　複数の学習データセットを使用した機械学習が実施されることによって生成され、
　　前記複数の学習データセットは、それぞれ、
　　　少なくとも、文章を発話する音声を聴いていた際の学習被験者の脳波から生成される前記脳波特徴量である被験者脳波特徴量に対して、
　　　前記学習被験者の抑うつ気分の高さを示す前記気分スコアである被験者気分スコアが、
対応付けられることにより構成され、
　　前記機械学習を実施することは、前記複数の学習データセットの各々について、前記被験者脳波特徴量を入力として受け付けたときに前記推定モデルが推定する前記気分スコアが、前記被験者気分スコアに一致するように、前記推定モデルを訓練する訓練ステップを含む、
推定モデルに、前記対象者脳波特徴量を入力することにより、前記対象者の抑うつ気分の高さを示す前記気分スコアである対象者気分スコアを推定させる推定ステップと、
を実行させるための、
気分推定プログラム。
　前記コンピュータに、
　前記脳波符号ステップにおいて、
　　ネガティブ、ニュートラル、ポジティブの少なくとも３つの区分の何れかに分類される文章を発話する音声を聴いている際のヒトの脳波と、
　　前記文章が前記少なくとも３つの区分の何れに分類されるかを示す情報と
から、前記文章が分類される区分に対応する脳波特徴量を、前記脳波特徴量として生成させ、
　前記推定モデルは、前記脳波特徴量として、前記文章が分類される区分に対応する脳波特徴量を入力されると、前記気分スコアを推定し、
　前記被験者脳波特徴量は、
　　それぞれが前記ネガティブの区分に分類される文章を発話する音声を聴いていた際の前記学習被験者の脳波である複数の脳波の平均から生成される、前記ネガティブの区分に対応する脳波特徴量である被験者第１脳波特徴量と、
　　それぞれが前記ニュートラルの区分に分類される文章を発話する音声を聴いていた際の前記学習被験者の脳波である複数の脳波の平均から生成される、前記ニュートラルの区分に対応する脳波特徴量である被験者第２脳波特徴量と、
　　それぞれが前記ポジティブの区分に分類される文章を発話する音声を聴いていた際の前記学習被験者の脳波である複数の脳波の平均から生成される、前記ポジティブの区分に対応する脳波特徴量である被験者第３脳波特徴量と、
を含み、
　前記機械学習を実施することは、前記複数の学習データセットの各々について、
　前記ネガティブの区分に対応する脳波特徴量として前記被験者第１脳波特徴量を入力されたときに前記推定モデルが推定する前記気分スコアが、前記被験者気分スコアに一致するように、前記推定モデルを訓練する第１訓練ステップと、
　前記ニュートラルの区分に対応する脳波特徴量として前記被験者第２脳波特徴量を入力されたときに前記推定モデルが推定する前記気分スコアが、前記被験者気分スコアに一致するように、前記推定モデルを訓練する第２訓練ステップと、
　前記ポジティブの区分に対応する脳波特徴量として前記被験者第３脳波特徴量を入力されたときに前記推定モデルが推定する前記気分スコアが、前記被験者気分スコアに一致するように、前記推定モデルを訓練する第３訓練ステップと、
を含み、
　前記コンピュータに、
　前記対象者が音声として聴いている文章が、前記少なくとも３つの区分の何れに分類されるかを示す分類情報を取得する分類情報取得ステップをさらに実行させ、
　前記脳波符号ステップにおいて、
　　前記分類情報によって示される区分に分類される文章を発話する音声を聴いている際の前記対象者の前記対象者脳波と、
　　前記分類情報と
から生成される、前記分類情報によって示される区分に対応する前記対象者脳波特徴量を、前記推定ステップにおいて、前記分類情報によって示される区分に対応する脳波特徴量として前記推定モデルに入力することにより、前記対象者気分スコアを推定させる、
請求項１に記載の気分推定プログラム。
　前記コンピュータに、
　前記脳波符号ステップにおいて、
　　文章を発話する音声を聴いている際のヒトの脳波と、
　　前記ヒトが音声として聴いている前記文章に含まれる各単語の開始時点と
から、前記ヒトの前記単語に対する脳波応答における所定の成分のピーク潜時およびピーク前後の平均振幅の少なくとも一方を、前記脳波特徴量として生成させ、
　前記被験者脳波特徴量は、
　　文章を発話する音声を聴いていた際の前記学習被験者の脳波と、
　　前記学習被験者が音声として聴いていた前記文章に含まれる各単語の開始時点と
から生成される、前記学習被験者の前記単語に対する脳波応答における前記所定の成分のピーク潜時およびピーク前後の平均振幅の少なくとも一方であり、
　前記コンピュータに、
　前記対象者が音声として聴いている文章に含まれる各単語の開始時点を示すオンセット情報を取得するオンセット情報取得ステップをさらに実行させ、
　前記脳波符号ステップにおいて、
　　前記対象者脳波と、
　　前記オンセット情報によって示される、前記対象者が音声として聴いている文章に含まれる各単語の開始時点と
から生成される、前記対象者の前記単語に対する脳波応答における前記所定の成分のピーク潜時およびピーク前後の平均振幅の少なくとも一方を、前記推定ステップにおいて、前記対象者脳波特徴量として前記推定モデルに入力することにより、前記対象者気分スコアを推定させる、
請求項１または２に記載の気分推定プログラム。
　前記コンピュータに、
　前記脳波符号ステップにおいて、
　　文章を発話する音声を聴いている際のヒトの脳波と、
　　前記ヒトが聴いている前記音声の音声エンベロープと
から、前記ヒトの前記音声エンベロープに追随する脳波応答における所定の成分のピーク潜時およびピーク前後の平均振幅の少なくとも一方を、前記脳波特徴量として生成させ、
　前記被験者脳波特徴量は、
　　文章を発話する音声を聴いていた際の前記学習被験者の脳波と、
　　前記学習被験者が聴いていた前記音声の音声エンベロープと
から生成される、前記学習被験者の前記音声エンベロープに追随する脳波応答における前記所定の成分のピーク潜時およびピーク前後の平均振幅の少なくとも一方であり、
　前記コンピュータに、
　前記対象者が聴いている音声の音声エンベロープを示すエンベロープ情報を取得するエンベロープ情報取得ステップをさらに実行させ、
　前記脳波符号ステップにおいて、
　　前記対象者脳波と、
　　前記エンベロープ情報によって示される、前記対象者が聴いている音声の音声エンベロープと
から生成される、前記対象者の前記音声エンベロープに追随する脳波応答における前記所定の成分のピーク潜時およびピーク前後の平均振幅の少なくとも一方を、前記推定ステップにおいて、前記対象者脳波特徴量として前記推定モデルに入力することにより、前記対象者気分スコアを推定させる、
請求項１または２に記載の気分推定プログラム。
　前記推定モデルは、前記脳波特徴量に加えてさらに、文章を発話する音声を聴いた後に前記文章に対してヒトが感じた主観的評価を示す主観スコアを入力として受け付け、入力された前記脳波特徴量および前記主観スコアから、前記気分スコアを推定し、
　前記複数の学習データセットは、それぞれ、
　　前記被験者脳波特徴量と、
　　文章を発話する音声を聴いた後に前記文章に対して前記学習被験者が感じた主観的評価を示す前記主観スコアである被験者主観スコアと、
に対して、前記被験者気分スコアが対応付けられることにより構成され、
　前記機械学習を実施することは、前記複数の学習データセットの各々について、前記被験者脳波特徴量および前記被験者主観スコアを入力されたときに前記推定モデルが推定する前記気分スコアが、前記被験者気分スコアに一致するように、前記推定モデルを訓練する訓練ステップを含み、
　前記コンピュータに、
　文章を発話する音声を聴いた後に前記文章に対して前記対象者が感じた主観的評価を示す前記主観スコアである対象者主観スコアを取得する対象者主観スコア取得ステップをさらに実行させ、
　前記推定ステップにおいて、
　　前記対象者脳波特徴量と、
　　前記対象者主観スコアと
を前記推定モデルに入力することにより、前記対象者気分スコアを推定させる、
請求項１または２に記載の気分推定プログラム。
　前記コンピュータに、
　前記推定ステップにおいて推定させた前記対象者気分スコアに対応する情報を、前記対象者に出力する出力ステップをさらに実行させる、
請求項１または２に記載の気分推定プログラム。