JP5718495B1 - 印象推定装置、その方法、及びプログラム - Google Patents
印象推定装置、その方法、及びプログラム Download PDFInfo
- Publication number
- JP5718495B1 JP5718495B1 JP2014005530A JP2014005530A JP5718495B1 JP 5718495 B1 JP5718495 B1 JP 5718495B1 JP 2014005530 A JP2014005530 A JP 2014005530A JP 2014005530 A JP2014005530 A JP 2014005530A JP 5718495 B1 JP5718495 B1 JP 5718495B1
- Authority
- JP
- Japan
- Prior art keywords
- time interval
- music
- feature amount
- feature
- impression
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Eye Examination Apparatus (AREA)
- Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)
Abstract
【課題】音楽の好みをリアルタイムで推定することができる技術を提供する。【解決手段】印象推定装置は、第1時間区間を第1の音楽を受聴可能なようにヒトに呈示する時間区間とし、第2時間区間を第1の音楽と異なる第2の音楽を受聴可能なようにヒトに呈示する時間区間とし、第1時間区間におけるヒトの瞳孔の大きさの変化を表す第1特徴量と、第2時間区間におけるヒトの瞳孔の大きさの変化を表す第2特徴量と、を抽出する特徴量抽出部と、第1特徴量と第2特徴量との相違の度合いに基づいて、第1の音楽と第2の音楽に対する印象を推定する嗜好推定部とを含む。【選択図】図2
Description
本発明は、音楽に対する印象(好き/嫌い)を推定する技術に関する。
非特許文献1では、好きな音楽を聴いているとき、さらには、聴く前の聴くことを期待しているときに、線条体でドーパミンが放出されることが確認された。
V. N. Salimpoor, M. Benovoy, K. Larcher, A. Dagher & R. J. Zatorre, "Anatomically distinct dopamine release during anticipation and experience of peak emotion to music", Nature Neuroscience 14(2), 2011, pp.257-262.
非特許文献1によれば、ある音楽を好きか否かや、ある音楽に対する期待に応じて、ドーパミンの放出量が変化する傾向があることを利用して、楽曲への時々刻々の印象(好きか否か)や期待が推定できる可能性がある。しかし、ドーパミンの放出量の測定に用いる装置(PET:positron emission tomography)は時間分解能が低く、解析にも時間がかかるため、非特許文献1ではリアルタイムに音楽の好みを推定することはできない。
本発明は、音楽の好みをリアルタイムで推定することができる技術を提供することを目的とする。
上記の課題を解決するために、本発明の第一の態様によれば、印象推定装置は、第1時間区間を第1の音楽を受聴可能なようにヒトに呈示する時間区間とし、第2時間区間を第1の音楽と異なる第2の音楽を受聴可能なようにヒトに呈示する時間区間とし、第1時間区間におけるヒトの瞳孔の大きさの変化を表す第1特徴量と、第2時間区間におけるヒトの瞳孔の大きさの変化を表す第2特徴量と、を抽出する特徴量抽出部と、第1特徴量と第2特徴量との相違の度合いに基づいて、第1の音楽と第2の音楽に対する印象を推定する嗜好推定部とを含む。
上記の課題を解決するために、本発明の第二の態様によれば、印象推定方法は、第1時間区間を第1の音楽を受聴可能なようにヒトに呈示する時間区間とし、第2時間区間を第1の音楽と異なる第2の音楽を受聴可能なようにヒトに呈示する時間区間とし、第1時間区間におけるヒトの瞳孔の大きさの変化を表す第1特徴量と、第2時間区間におけるヒトの瞳孔の大きさの変化を表す第2特徴量と、を抽出する特徴量抽出ステップと、第1特徴量と第2特徴量との相違の度合いに基づいて、第1の音楽と第2の音楽に対する印象を推定する嗜好推定ステップとを含む。
上記の課題を解決するために、本発明の第三の態様によれば、印象推定方法は、モデル記憶部には、ヒトの瞳孔の大きさの変化を表す特徴量と音楽に対する印象との相関性を記述したモデルである嗜好推定モデルが記憶されているものとして、印象推定対象の音楽が受聴可能なようにヒトに呈示されている時間区間におけるヒトの瞳孔の大きさの変化を表す特徴量を抽出する特徴量抽出ステップと、特徴量抽出ステップで抽出した特徴量を入力として、嗜好推定モデルを参照することにより、印象推定対象の音楽に対する印象を推定する嗜好推定ステップとを含む。
本発明によれば、個人毎の音楽の好みをリアルタイムで推定することができるという効果を奏する。
以下、本発明の実施形態について説明する。なお、以下の説明に用いる図面では、同じ機能を持つ構成部や同じ処理を行うステップには同一の符号を記し、重複説明を省略する。
<第一実施形態>
本実施形態では、音を聴いたときの人の瞳孔の大きさの変化に基づいて、その人がその音楽を好んでいるか否かを推定する。まず、瞳孔の大きさの変化について説明する。人がある一点を注視しているとき、瞳孔の大きさは一定ではなく、変化している。図1は瞳孔の大きさの変化を表す図であり、横軸は時間(秒)を、縦軸は瞳孔の大きさを表す。
本実施形態では、音を聴いたときの人の瞳孔の大きさの変化に基づいて、その人がその音楽を好んでいるか否かを推定する。まず、瞳孔の大きさの変化について説明する。人がある一点を注視しているとき、瞳孔の大きさは一定ではなく、変化している。図1は瞳孔の大きさの変化を表す図であり、横軸は時間(秒)を、縦軸は瞳孔の大きさを表す。
瞳孔の大きさは交感神経系の支配を受けた瞳孔散大筋によって拡大(散瞳)し、副交感神経系の支配を受けた瞳孔括約筋によって収縮(縮瞳)する。図1では、破線部分は縮瞳を表し、二重線部分は散瞳を表す。瞳孔の大きさの変化は主に対光反射、輻輳反射、感情による変化の3つに区別される。対光反射は、網膜に入射する光量を制御するために瞳孔の大きさが変化する反応のことで、強い光に対しては縮瞳、暗所では散瞳が生じる。輻輳反射は、焦点を合わせる際に両眼が内転あるいは外転する運動(輻輳運動)に伴って瞳孔径が変化する反応のことで、近くを見るときには縮瞳、遠くを見るときには散瞳が生じる。感情による変化は、上記のいずれにもよらず外界のストレスに対して生じる反応のことで、怒りや驚き、活発な活動に伴って交感神経が優位となる際には散瞳が生じ、リラックスして副交感神経が優位となる際には縮瞳が生じる。本実施形態では、瞳孔の大きさの変化のうち、特に散瞳に関する特徴に基づいて、印象を推定する。
図2は第一実施形態に係る印象推定装置10の機能ブロック図、図3はその処理フローの例を示す図である。
印象推定装置10は、音呈示部11、瞳孔情報取得部12、特徴量抽出部13及び嗜好推定部14を含む。
印象推定装置10は、音呈示部11、瞳孔情報取得部12、特徴量抽出部13及び嗜好推定部14を含む。
<音呈示部11>
音呈示部11は、2つの異なる音楽をそれぞれ別の時間区間において受聴可能なように人(以下、対象者ともいう)に呈示する(s11)。例えば、ヘッドホンやスピーカなどにより、受聴可能な音量でそれぞれの音楽を呈示する。2つの異なる音楽は、同じ楽曲の中の異なる時間区間のものであってもよいし、異なる楽曲の一部または全部であってもよい。一方の音楽を受聴可能なように人に呈示する時間区間を第1時間区間、他方の音楽を受聴可能なように人に呈示する時間区間を第2時間区間とする。なお、第1時間区間と第2時間区間の長さは異なっていても良い。
音呈示部11は、2つの異なる音楽をそれぞれ別の時間区間において受聴可能なように人(以下、対象者ともいう)に呈示する(s11)。例えば、ヘッドホンやスピーカなどにより、受聴可能な音量でそれぞれの音楽を呈示する。2つの異なる音楽は、同じ楽曲の中の異なる時間区間のものであってもよいし、異なる楽曲の一部または全部であってもよい。一方の音楽を受聴可能なように人に呈示する時間区間を第1時間区間、他方の音楽を受聴可能なように人に呈示する時間区間を第2時間区間とする。なお、第1時間区間と第2時間区間の長さは異なっていても良い。
<瞳孔情報取得部12>
瞳孔情報取得部12は、第1時間区間および第2時間区間のそれぞれについて、対象者の瞳孔の大きさを取得し(s12)、特徴量抽出部13へ出力する。例えば、瞳孔の大きさとして、瞳孔径(瞳孔の半径)を用いる場合には、瞳孔径は、赤外線カメラを用いた画像処理法で計測される。第1時間区間および第2時間区間において、対象者には、ある1点を注視してもらうようにし、その時の瞳孔を赤外線カメラを用いて撮像する。そして、撮像した結果を画像処理することで、時間毎(例えば、1000Hz)の瞳孔径の時系列を取得する。なお、左右両方の瞳孔の大きさを取得してもよいし、何れか一方の瞳孔の大きさのみを取得してもよい。本実施形態では、一方の瞳孔の大きさのみを取得するものとする。例えば、瞳孔を撮影した画像に対して、瞳孔にフィッティングした円の半径を用いる。また、瞳孔径は微細に変動するため、所定の時間区間ごとにスムージング(平滑化)した値を用いるとよい。ここで、図1における瞳孔の大きさは、各時刻について取得した瞳孔径の全データの平均を0、標準偏差を1としたときのz-scoreを用いて表したものであり、約150ms間隔でスムージングしたものである。ただし、瞳孔情報取得部12で取得する瞳孔径はz-scoreでなくとも、瞳孔径の値そのものであっても良いし、瞳孔の面積や直径など、瞳孔の大きさに対応する値であれば何でも良い。瞳孔の面積や直径を用いる場合も、時間の経過とともに瞳孔の面積または直径が大きくなる区間が散瞳に対応し、時間の経過とともに瞳孔の面積または直径が小さくなる区間が縮瞳に対応する。すなわち、時間の経過とともに瞳孔の大きさが大きくなる区間が散瞳に対応し、時間の経過とともに瞳孔の大きさが小さくなる区間が縮瞳に対応する。
瞳孔情報取得部12は、第1時間区間および第2時間区間のそれぞれについて、対象者の瞳孔の大きさを取得し(s12)、特徴量抽出部13へ出力する。例えば、瞳孔の大きさとして、瞳孔径(瞳孔の半径)を用いる場合には、瞳孔径は、赤外線カメラを用いた画像処理法で計測される。第1時間区間および第2時間区間において、対象者には、ある1点を注視してもらうようにし、その時の瞳孔を赤外線カメラを用いて撮像する。そして、撮像した結果を画像処理することで、時間毎(例えば、1000Hz)の瞳孔径の時系列を取得する。なお、左右両方の瞳孔の大きさを取得してもよいし、何れか一方の瞳孔の大きさのみを取得してもよい。本実施形態では、一方の瞳孔の大きさのみを取得するものとする。例えば、瞳孔を撮影した画像に対して、瞳孔にフィッティングした円の半径を用いる。また、瞳孔径は微細に変動するため、所定の時間区間ごとにスムージング(平滑化)した値を用いるとよい。ここで、図1における瞳孔の大きさは、各時刻について取得した瞳孔径の全データの平均を0、標準偏差を1としたときのz-scoreを用いて表したものであり、約150ms間隔でスムージングしたものである。ただし、瞳孔情報取得部12で取得する瞳孔径はz-scoreでなくとも、瞳孔径の値そのものであっても良いし、瞳孔の面積や直径など、瞳孔の大きさに対応する値であれば何でも良い。瞳孔の面積や直径を用いる場合も、時間の経過とともに瞳孔の面積または直径が大きくなる区間が散瞳に対応し、時間の経過とともに瞳孔の面積または直径が小さくなる区間が縮瞳に対応する。すなわち、時間の経過とともに瞳孔の大きさが大きくなる区間が散瞳に対応し、時間の経過とともに瞳孔の大きさが小さくなる区間が縮瞳に対応する。
なお、一般に、対光反射に伴う瞳孔の大きさの変化量は、感情による変化量と比較して数倍程度の大きさとなり、瞳孔の大きさの変化量全体に対する大きな要因となる。対光反射および輻輳反射による変化を抑え、目立つ音の知覚に関する成分のみに着目しやすくするために、瞳孔径を取得するときの対象者に呈示する画面の輝度および画面から対象者までの距離は一定に保つものとする。
<特徴量抽出部13>
特徴量抽出部13は、第1時間区間および第2時間区間についての瞳孔の大きさの時系列を受け取り、それぞれの時間区間について、瞳孔の大きさの時系列から、瞳孔の大きさの変化を表す特徴量を抽出し(s13)、嗜好推定部14に出力する。第1時間区間について抽出される特徴量を第1特徴量とし、第2時間区間について抽出される特徴量を第2特徴量とする。
特徴量抽出部13は、第1時間区間および第2時間区間についての瞳孔の大きさの時系列を受け取り、それぞれの時間区間について、瞳孔の大きさの時系列から、瞳孔の大きさの変化を表す特徴量を抽出し(s13)、嗜好推定部14に出力する。第1時間区間について抽出される特徴量を第1特徴量とし、第2時間区間について抽出される特徴量を第2特徴量とする。
特徴量は、音楽に対する印象を推定するための指標ともいえる。言い換えれば、瞳孔の大きさの時系列のうち、散瞳が起きている区間における瞳孔の大きさの変化を表す特徴量であり、具体的には、散瞳の平均速度V、散瞳の振幅A、散瞳が起きているときの瞳孔径の時系列を位置制御系のステップ応答としてモデル化したときの減衰係数ζ、散瞳の発生頻度Pの少なくともいずれか1つ以上を含む特徴量である。振幅Aは、極大点から極小点までの瞳孔径の差である(図1参照)。散瞳の平均速度Vは、(振幅A)/(立ち上がり時間Tp)である。立ち上がり時間Tpは極大点から極小点までの時間である(図1参照)。例えば、特徴量抽出部13は、瞳孔径の時系列から極大点及び極小点を検出し、それを用いて、振幅A、平均速度V、立ち上がり時間Tpを算出する。このとき、振幅が一定の値以上のもののみを算出する構成としてもよい。
なお、縮瞳及び散瞳は、サーボ系としての特徴を示し、面積制御系(三次遅れ系)のステップ応答として記述でき、本実施形態では位置制御系(二次遅れ系)のステップ応答として近似して考える。位置制御系のステップ応答は、固有角振動数をωnとして、
と表される。ただし、tは時刻を表すインデックスであり、sはラプラス変換によるパラメタ(複素数)である。固有角振動数ωnは瞳孔の大きさの変化における応答の速さを表す指標に相当し、減衰係数ζは、瞳孔の大きさの変化における応答の振動性に対応する指標に相当する。
なお、散瞳の平均速度V、散瞳の振幅A、散瞳の減衰係数ζについては、第1時間区間内で複数回の散瞳が発生している場合には、各散瞳の平均速度V、各散瞳の振幅A、各散瞳について位置制御系のステップ応答としてモデル化することで求めた減衰係数ζの、第1時間区間内全てについての代表値(例えば平均値)を、第1時間区間における特徴量とする。第2時間区間における特徴量も同様である。代表値としては、平均値のほかにも、最大値、最小値、時間区間内で最初の散瞳に対応する値などでもよい。
<嗜好推定部14>
嗜好推定部14は、特徴量抽出部13が抽出した第1時間区間と第2時間区間のそれぞれについての特徴量の相違の度合いに基づいて、音呈示部で呈示した2つの異なる音楽のうちの少なくともいずれかについての印象を推定する(s14)。ここで、印象とは、好んでいるか否かに関するものであり、印象が良いとは好んでいることを、印象が悪いとは好んでいないことを意味する。例えば、嗜好推定部14は、対象者が2つの異なる音楽のうちの一方の音楽を他方の音楽と比較して好んでいるか否かを推定する。あるいは、嗜好推定部14は、対象者が2つの異なる音楽のうちのどちらの音楽をより好んでいるかを推定する。
嗜好推定部14は、特徴量抽出部13が抽出した第1時間区間と第2時間区間のそれぞれについての特徴量の相違の度合いに基づいて、音呈示部で呈示した2つの異なる音楽のうちの少なくともいずれかについての印象を推定する(s14)。ここで、印象とは、好んでいるか否かに関するものであり、印象が良いとは好んでいることを、印象が悪いとは好んでいないことを意味する。例えば、嗜好推定部14は、対象者が2つの異なる音楽のうちの一方の音楽を他方の音楽と比較して好んでいるか否かを推定する。あるいは、嗜好推定部14は、対象者が2つの異なる音楽のうちのどちらの音楽をより好んでいるかを推定する。
具体的には、特徴量が散瞳の発生頻度Pである場合には、特徴量が大きいほうの時間区間に呈示した音楽の方が、他方の時間区間に呈示した音楽よりも印象が良い(好んでいる度合いが大きい)と推定する。
あるいは、特徴量が平均速度Vや振幅A、減衰係数ζである場合には、特徴量が小さいほうの時間区間に呈示した音楽の方が、他方の時間区間に呈示した音楽よりも印象が良い(好んでいる度合いが大きい)と推定する。
これは、散瞳の減衰係数ζや発生頻度P、平均速度V、振幅Aと音楽に対する印象との間に、以下のような相関関係があることが、実験により明らかになったことに基づく。
(1)印象が良いとき(良くなるとき)には、減衰係数ζが減少する傾向がある。
(2)印象が良いとき(良くなるとき)には、発生頻度Pが増加する傾向がある。
(3) 印象が良いとき(良くなるとき)には、平均速度Vが減少する傾向がある。
(4) 印象が良いとき(良くなるとき)には、振幅Aが減少する傾向がある。
(1)印象が良いとき(良くなるとき)には、減衰係数ζが減少する傾向がある。
(2)印象が良いとき(良くなるとき)には、発生頻度Pが増加する傾向がある。
(3) 印象が良いとき(良くなるとき)には、平均速度Vが減少する傾向がある。
(4) 印象が良いとき(良くなるとき)には、振幅Aが減少する傾向がある。
なお、散瞳の減衰係数ζや発生頻度P、平均速度V、振幅Aのいずれか1つを単独で用いてもよいし、組み合わせて用いてもよい。例えば、何れか二つを満たせばよい、三つ全てを満たせばよい、等と設定してもよい。すなわち、散瞳の減衰係数ζや発生頻度P、平均速度V、振幅Aのいずれか1つ以上の特徴量の各々に基づき、音楽の印象を推定してもよい。
散瞳の平均速度や振幅は交感神経の活動強度を反映するため、音楽の好みの度合いとの相関がみられるものと考えられる。減衰係数ζは、散瞳を位置制御系(二次遅れ系)のステップ応答としてみたときの応答の振動性に対応する指標である。自分の好きな音楽を聴いているときは、音楽に意識が向けられることで、瞳孔の制御に関わる脳の中枢あるいは瞳孔散大筋(または瞳孔括約筋)にも一時的な影響があらわれ、応答の振動性(減衰係数)の変化として観測できると考えられる。
以下に、図5を用いて実験の一例について説明する。図5Aの波形で表される音楽を被験者に呈示する。被験者は音楽を聴きながら、0〜10の11段階のツマミを回し、音楽に対する「好き嫌いの度合い(rating)」を時々刻々評価する。図5Bは評価結果を示す。なお、ratingは、5を中立(好きでも嫌いでもない状態)とし、大きい値ほど(10に近いほど)、その音楽が好きであることを表す。なお、曲の合間には、評価が0になるように設定した。このときの被験者の瞳孔の大きさから上述の特徴量を測定した。「好き」と判断されている時間帯(この実験ではrating≧7となる時間帯とした)と「嫌い」と判断されている時間帯(この実験ではrating≦4となる時間帯とした)とにおける散瞳の発生頻度、平均速度及び減衰係数をそれぞれ図6A、図6B及び図6Cに表す。発生頻度は、rating≧7またはrating≦4となる時間帯に発生した散瞳の回数をその時間(秒)で割ることで求めた。平均速度および減衰係数は、rating≧7またはrating≦4となる時間帯に発生した1回以上の散瞳の平均速度および減衰係数の平均をそれぞれ用いた。なお、各値の中央の線分は各値の標準偏差を表す。
結果、「好き」と判断されている時間帯には、「嫌い」と判断されている時間帯よりも散瞳の発生頻度が増加し、平均速度及び減衰係数が減少する傾向にあることが確認された。すなわち、「好き」と判断されている時間帯における散瞳の発生頻度と、「嫌い」と判断されている時間帯における散瞳の発生頻度とを比較すると、「好き」と判断されている時間帯における散瞳の発生頻度のほうが、「嫌い」と判断されている時間帯における散瞳の発生頻度よりも大きい傾向にある。また、「好き」と判断されている時間帯における散瞳の平均速度、振幅及び減衰係数と、「嫌い」と判断されている時間帯における散瞳の平均速度、振幅及び減衰係数とをそれぞれ比較すると、「好き」と判断されている時間帯における散瞳の平均速度、振幅及び減衰係数のほうが、「嫌い」と判断されている時間帯における散瞳の平均速度、振幅及び減衰係数よりも小さい傾向にある。
上述の嗜好推定部14の処理は、この知見に基づいて、第1時間区間と第2時間区間に呈示された音楽に対する印象を推定するものである。
<効果>
瞳孔の大きさの変化は、ドーパミン放出量と比較して、個人ごとのデータの評価にも適した指標である。また、瞳孔の大きさの変化は、カメラから取得された情報から高速に解析可能であるため、リアルタイムで測定結果を得ることができる。ゆえに、このような構成により、瞳孔の大きさの変化に基づいて、音楽に対する印象を個人毎にリアルタイムで推定することができる。本実施形態の印象推定装置を利用することで、オンラインで音楽に対する印象を推定することもできるようになる。また、瞳孔の大きさはドーパミンの放出量の測定のような軽い被爆による侵襲性がなく、非侵襲で測定が可能であり、安価な装置で簡単に(対象者を拘束することなく)計測することができるので、低コストで音楽の好みを推定することができる。
瞳孔の大きさの変化は、ドーパミン放出量と比較して、個人ごとのデータの評価にも適した指標である。また、瞳孔の大きさの変化は、カメラから取得された情報から高速に解析可能であるため、リアルタイムで測定結果を得ることができる。ゆえに、このような構成により、瞳孔の大きさの変化に基づいて、音楽に対する印象を個人毎にリアルタイムで推定することができる。本実施形態の印象推定装置を利用することで、オンラインで音楽に対する印象を推定することもできるようになる。また、瞳孔の大きさはドーパミンの放出量の測定のような軽い被爆による侵襲性がなく、非侵襲で測定が可能であり、安価な装置で簡単に(対象者を拘束することなく)計測することができるので、低コストで音楽の好みを推定することができる。
また、ドーパミンの放出量の測定に用いる装置(PET)は時間分解能が低いため粗い時間間隔での特徴量しか得ることができず、時々刻々と変動する音楽に対する印象を高精度に推定することができない。これに対し、瞳孔の大きさは時間分解能が高い特徴量であるため、時々刻々と変動する音楽に対する印象を高精度に推定することができるという利点もある。
<変形例1>
印象推定装置10は、音呈示部11及び瞳孔情報取得部12を含まなくともよい。すなわち、音呈示部11及び瞳孔情報取得部12の少なくとも1つを別装置として構成し、別装置から各時間区間ごとの音楽及び瞳孔の大きさの少なくとも1つを受け取る構成とすればよい。
印象推定装置10は、音呈示部11及び瞳孔情報取得部12を含まなくともよい。すなわち、音呈示部11及び瞳孔情報取得部12の少なくとも1つを別装置として構成し、別装置から各時間区間ごとの音楽及び瞳孔の大きさの少なくとも1つを受け取る構成とすればよい。
<第二実施形態>
第一実施形態と異なる部分を中心に説明する。
第一実施形態の印象推定装置10は、2つの異なる音楽のうちどちらの音楽をより好んでいるかを推定するという相対比較形式であった。第二実施形態の印象推定装置20は、ある1つの音楽を用いて、その音楽に対する印象を推定するものである。第二実施形態の印象推定装置20は、第一実施形態の特徴量抽出部13と嗜好推定部14の代わりに、特徴量抽出部23と嗜好推定部24を含み、さらに、モデル記憶部25を含む(図2参照)。本実施形態では、モデル記憶部25を参照することにより、対象者にとっての音楽の印象を推定する。なお、第二実施形態では1つの音楽(印象を推定する対象となる音楽)のみを呈示すればよいため、音呈示部11と瞳孔情報取得部12において第2時間区間を用いない点が第一実施形態とは異なる。
第一実施形態と異なる部分を中心に説明する。
第一実施形態の印象推定装置10は、2つの異なる音楽のうちどちらの音楽をより好んでいるかを推定するという相対比較形式であった。第二実施形態の印象推定装置20は、ある1つの音楽を用いて、その音楽に対する印象を推定するものである。第二実施形態の印象推定装置20は、第一実施形態の特徴量抽出部13と嗜好推定部14の代わりに、特徴量抽出部23と嗜好推定部24を含み、さらに、モデル記憶部25を含む(図2参照)。本実施形態では、モデル記憶部25を参照することにより、対象者にとっての音楽の印象を推定する。なお、第二実施形態では1つの音楽(印象を推定する対象となる音楽)のみを呈示すればよいため、音呈示部11と瞳孔情報取得部12において第2時間区間を用いない点が第一実施形態とは異なる。
<特徴量抽出部23>
特徴量抽出部23は、第1時間区間についての瞳孔の大きさの時系列を受け取り、第1時間区間について、瞳孔の大きさの時系列から、瞳孔の大きさの変化を表す特徴量を抽出し(s23)、嗜好推定部24に出力する。
特徴量抽出部23は、第1時間区間についての瞳孔の大きさの時系列を受け取り、第1時間区間について、瞳孔の大きさの時系列から、瞳孔の大きさの変化を表す特徴量を抽出し(s23)、嗜好推定部24に出力する。
このとき、第一実施形態と同様に散瞳の平均速度V、散瞳の振幅A、散瞳が起きているときの瞳孔径の時系列を位置制御系のステップ応答としてモデル化したときの減衰係数ζ、発生頻度Pの少なくとも何れか1つ以上を含む特徴量を抽出する。なお、本実施形態では上述の値の少なくとも何れか1つ以上を要素として含むベクトル(以下、「特徴量ベクトル」ともいう)を特徴量として抽出する。あるいは、散瞳の平均速度V、振幅A、減衰係数ζ、発生頻度Pの少なくとも何れか1つに加えて、以下の値を要素として含む特徴量ベクトルを特徴量として抽出しても良い(図1参照)。
(1)散瞳が起きているときの瞳孔径の時系列を位置制御系のステップ応答としてモデル化したときの散瞳の固有角振動数ωn
(2)立ち上がり時間Tp
(3)瞳孔の大きさの変化を表す特徴量として、縮瞳に関するパラメータを要素として含む特徴量ベクトルを抽出してもよい。例えば、縮瞳の平均速度、振幅、発生頻度、減衰係数、固有角振動数、立ち上がり時間、発生頻度に対応するパラメータの何れか一つ以上を、特徴量ベクトルの要素として加えてもよい。
(2)立ち上がり時間Tp
(3)瞳孔の大きさの変化を表す特徴量として、縮瞳に関するパラメータを要素として含む特徴量ベクトルを抽出してもよい。例えば、縮瞳の平均速度、振幅、発生頻度、減衰係数、固有角振動数、立ち上がり時間、発生頻度に対応するパラメータの何れか一つ以上を、特徴量ベクトルの要素として加えてもよい。
<嗜好推定部24>
嗜好推定部24は、特徴量を受け取り、その特徴量に基づいて、音楽に対する印象を推定する(s24)。本実施形態では、抽出された特徴量から嗜好推定モデルを用いて(参照することにより)、印象を推定し、出力する。言い換えれば、嗜好推定部24は、特徴量抽出部23で抽出した特徴量を、モデル記憶部25に記憶された嗜好推定モデル(特徴量から印象を推定するためのモデル)にあてはめることにより、印象を推定する。
嗜好推定部24は、特徴量を受け取り、その特徴量に基づいて、音楽に対する印象を推定する(s24)。本実施形態では、抽出された特徴量から嗜好推定モデルを用いて(参照することにより)、印象を推定し、出力する。言い換えれば、嗜好推定部24は、特徴量抽出部23で抽出した特徴量を、モデル記憶部25に記憶された嗜好推定モデル(特徴量から印象を推定するためのモデル)にあてはめることにより、印象を推定する。
<モデル記憶部25>
モデル記憶部25は、特徴量を入力として、印象を出力するような嗜好推定モデルが予め記録されている。嗜好推定モデルは、予め1人以上の人について取得した特徴量と印象との関係性を機械学習法により学習することで、作成される。つまり、嗜好推定モデルは、特徴量と印象との相関性を記述したモデルである。
モデル記憶部25は、特徴量を入力として、印象を出力するような嗜好推定モデルが予め記録されている。嗜好推定モデルは、予め1人以上の人について取得した特徴量と印象との関係性を機械学習法により学習することで、作成される。つまり、嗜好推定モデルは、特徴量と印象との相関性を記述したモデルである。
例えば、学習用に用意した音楽を対象者に呈示し(図6A参照)ている間の対象者の瞳孔の大きさの時系列情報を取得し、取得した瞳孔の大きさの時系列情報から、特徴量を抽出する。ここで抽出する特徴量は、特徴量抽出部23で抽出する特徴量と同じとする。また、その音楽に対する好き嫌いの度合い(rating)を対象者から取得し、抽出した特徴量と好き嫌いの度合いを組とするデータセットを用意する。
同様の特徴量抽出を複数の異なる音楽について行い、それぞれの音楽についての好き嫌いの度合い(rating)と抽出した特徴量を組とするデータセットを学習用データとして取得する。
この学習用データを入力データとし、機械学習法により、印象と特徴量との関係を学習する。
例えば、機械学習法としてサポートベクターマシン(Support vector machine、以下SVMともいう)等がある。この場合は、音楽に付与する好き嫌いの度合い(rating)を、好き(1)または嫌い(0)の2値として、特徴量ベクトルの次元に対応する空間において、好きな(印象が良い)ときの特徴量ベクトルに対応する点群と、嫌いな(印象が悪い)ときの特徴量ベクトルに対応する点群とを分離する超平面を求めることができる。これにより、得られる嗜好推定モデルに、好き嫌いが未知の特徴量(特徴量抽出部23で得られた特徴量)を入力すると、その特徴量が「好き」に対応するか、「嫌い」に対応するかを推定することができる。
例えば、散瞳の平均速度V,振幅A,減衰係数ζ,発生頻度Pを単独で、または、それらの組合せを、要素として含む特徴量ベクトルを用いて、SVMにより学習を行う。
また、散瞳の平均速度V,振幅A,減衰係数ζ,発生頻度P,固有角振動数ωn,立ち上がり時間Tp,縮瞳に関するパラメータ(例えば、縮瞳の平均速度、振幅、発生頻度、減衰係数、固有角振動数、立ち上がり時間)を要素として含む特徴量ベクトルを用いて、SVMにより学習を行ってもよい。
要素の数を増やすことで、推定の精度を高めることができる。
印象が好き/嫌い、の2値分類に限らず、複数クラス(好き嫌いの度合いに対応するクラス)に分類するようにSVMを構成することも可能である。あるいは、複数クラス(好き嫌いの度合いに対応するクラス)識別分類するような機械学習法であれば、SVMに限らず他の機械学習法を用いてもよい。
なお、学習用データを取得する対象である対象者は、実際に印象を推定する人と同一人物である必要はない。また、複数の人について得られた学習データを基に嗜好推定モデルを学習すると、より精度の高い推定を行うことができる。また、対象者毎に、印象に対応して表れる特徴量が異なる場合があるので、学習データを取得する対象者を印象の推定を行う人と同一人物として対象者毎に、嗜好推定モデルを作成すれば、個人の特性に合わせたより精度の高い推定を行うことができる。
<効果>
このような構成により、第一実施形態と同様の効果を得ることができる。
このような構成により、第一実施形態と同様の効果を得ることができる。
<第三実施形態>
第一実施形態と異なる部分を中心に説明する。
本実施形態では、瞳孔の大きさの変化と、人の眼球の動きの表れる微細な跳躍性眼球運動(以下、マイクロサッカード(microsaccade)ともいう)に基づいて、その人がその音楽を好んでいるか否かを推定する。まず、マイクロサッカードについて説明する。人がある一点を注視しているとき、眼球は完全に動きを止めているわけではなく、固視微動と呼ばれる三種類の眼球運動(ドリフト(drift,trendといってもよい)、トレマ、マイクロサッカード(フリックといってもよい))を行っている。ドリフトは小さな滑らかな動き、トレマは非常に小さな高周波の振動、マイクロサッカードは小さな跳ぶような動きである。図7はマイクロサッカードを表す図であり、横軸は時間(秒)を、縦軸は視野角を表す。詳しく説明すると、マイクロサッカードとは、ある一点を注視している状態において、1〜2秒の間に1回程度、対象者の意思とは関係なく(非随意的)表れる眼球の動きであって、小さな跳ぶような動きのことである(図7の太線部分)。マイクロサッカードは、動きの水平方向の成分、垂直方向の成分のどちらからでも取得することができる。ただし、マイクロサッカードが水平方向に偏向する性質に基づき、本実施形態では、簡単のため水平方向の成分のみを用いる。なお、「水平方向」とは、地面と完全に平行な方向に限定する意味ではなく、顔に対しての水平方向(眼球の配列方向であり、横方向、幅方向といってもよい)や後述する眼球運動取得部32において水平方向と定義付られた方向を含む概念である。
第一実施形態と異なる部分を中心に説明する。
本実施形態では、瞳孔の大きさの変化と、人の眼球の動きの表れる微細な跳躍性眼球運動(以下、マイクロサッカード(microsaccade)ともいう)に基づいて、その人がその音楽を好んでいるか否かを推定する。まず、マイクロサッカードについて説明する。人がある一点を注視しているとき、眼球は完全に動きを止めているわけではなく、固視微動と呼ばれる三種類の眼球運動(ドリフト(drift,trendといってもよい)、トレマ、マイクロサッカード(フリックといってもよい))を行っている。ドリフトは小さな滑らかな動き、トレマは非常に小さな高周波の振動、マイクロサッカードは小さな跳ぶような動きである。図7はマイクロサッカードを表す図であり、横軸は時間(秒)を、縦軸は視野角を表す。詳しく説明すると、マイクロサッカードとは、ある一点を注視している状態において、1〜2秒の間に1回程度、対象者の意思とは関係なく(非随意的)表れる眼球の動きであって、小さな跳ぶような動きのことである(図7の太線部分)。マイクロサッカードは、動きの水平方向の成分、垂直方向の成分のどちらからでも取得することができる。ただし、マイクロサッカードが水平方向に偏向する性質に基づき、本実施形態では、簡単のため水平方向の成分のみを用いる。なお、「水平方向」とは、地面と完全に平行な方向に限定する意味ではなく、顔に対しての水平方向(眼球の配列方向であり、横方向、幅方向といってもよい)や後述する眼球運動取得部32において水平方向と定義付られた方向を含む概念である。
図8は第一実施形態に係る印象推定装置30の機能ブロック図、図9はその処理フローの例を示す図である。
印象推定装置30は、音呈示部11、瞳孔情報取得部12、眼球運動取得部32、特徴量抽出部33及び嗜好推定部34を含む。音呈示部11及び瞳孔情報取得部12の処理内容は第一実施形態と同様である。
印象推定装置30は、音呈示部11、瞳孔情報取得部12、眼球運動取得部32、特徴量抽出部33及び嗜好推定部34を含む。音呈示部11及び瞳孔情報取得部12の処理内容は第一実施形態と同様である。
<眼球運動取得部32>
眼球運動取得部32は、第1時間区間と第2時間区間のそれぞれにおいて、対象者の眼球の位置情報を取得し(s32)、特徴量抽出部33へ出力する。例えば、対象者には、各音楽を呈示している間(第1時間区間と第2時間区間において)は、ある1点を注視してもらうようにし、その時の眼球の動きを赤外線カメラを用いて撮像する。そして、撮像した結果を画像処理することで、時間毎(例えば、1000Hz)の眼球の位置の時系列を眼球の位置情報として取得する。なお、左右両方の眼球の位置情報を取得してもよいし、何れか一方の眼球の位置情報のみを取得してもよい。本実施形態では、一方の眼球の位置情報のみを取得するものとする。
眼球運動取得部32は、第1時間区間と第2時間区間のそれぞれにおいて、対象者の眼球の位置情報を取得し(s32)、特徴量抽出部33へ出力する。例えば、対象者には、各音楽を呈示している間(第1時間区間と第2時間区間において)は、ある1点を注視してもらうようにし、その時の眼球の動きを赤外線カメラを用いて撮像する。そして、撮像した結果を画像処理することで、時間毎(例えば、1000Hz)の眼球の位置の時系列を眼球の位置情報として取得する。なお、左右両方の眼球の位置情報を取得してもよいし、何れか一方の眼球の位置情報のみを取得してもよい。本実施形態では、一方の眼球の位置情報のみを取得するものとする。
<特徴量抽出部33>
特徴量抽出部33は、特徴量抽出部13と同様の処理を行う。つまり、特徴量抽出部33は、第1時間区間および第2時間区間についての瞳孔径の時系列を受け取り、それぞれの時間区間について、瞳孔径の時系列から、瞳孔の大きさの変化を表す特徴量を抽出し(s13)、嗜好推定部34に出力する。さらに、以下の処理を行う。
特徴量抽出部33は、特徴量抽出部13と同様の処理を行う。つまり、特徴量抽出部33は、第1時間区間および第2時間区間についての瞳孔径の時系列を受け取り、それぞれの時間区間について、瞳孔径の時系列から、瞳孔の大きさの変化を表す特徴量を抽出し(s13)、嗜好推定部34に出力する。さらに、以下の処理を行う。
特徴量抽出部33は、第1時間区間と第2時間区間のそれぞれについての眼球の位置情報を受け取り、眼球の位置情報の時系列から、第1時間区間と第2時間区間のそれぞれについてのマイクロサッカードの特徴に対応する特徴量を抽出し(s33)、嗜好推定部34に出力する。
例えば、眼球の位置情報の時系列について1次階差系列を計算し、階差系列の絶対値が所定の閾値を上回る時間区間をマイクロサッカードが起きている区間として検出する。取得された眼球の位置情報にノイズが多く含まれると判断される場合などには、1次階差系列の計算にあたって適当な範囲での移動平均値を用いても良い。検出に用いる閾値には、階差系列の標準偏差の6倍程度の値を用いることが好ましい。
特徴量は、音楽に対する印象を推定するための指標ともいえる。言い換えれば、眼球の位置情報の時系列のうち、眼球の位置が大きく変化する区間(マイクロサッカードが起きている区間)における眼球運動を表す特徴量である。特徴量は、具体的には、マイクロサッカードが起きているときの眼球位置の時系列を位置制御系のステップ応答としてモデル化したときの減衰率λ、もしくは、減衰係数ζ'、または、マイクロサッカードの発生頻度P'の少なくともいずれか1つ以上を含む特徴量である。位置制御系のステップ応答は、固有角振動数をω'nとして、
と表される。ただし、tは時刻を表すインデックスであり、sはラプラス変換によるパラメタ(複素数)である。固有角振動数ω'nはマイクロサッカードの応答の速さを表す指標に相当し、減衰係数ζ'はマイクロサッカードの応答の正確性に対応する指標に相当する。また、Vo, Vmax, Ao, A',T'pはそれぞれ以下を表す(図10参照)。
(1)基準振幅A':マイクロサッカードによる眼球の動きが収束したときの移動量である。
(2)最大速度Vmax:基準振幅A'+オーバーシュートの振幅Aoに達するまでの最大の速度である。
(3)オーバーシュート(overshoot)の振幅Ao:マイクロサッカードによって基準振幅A'を超過した(行き過ぎた)部分の量である。オーバーシュートとは、波形の立ち上がり部分で、波形が基準振幅'Aを超えて突出する現象、または、その突出した波形である。言い換えると、オーバーシュートの振幅とは、突出した部分の量である。
(4)オーバーシュートの速度Vo:基準振幅A+オーバーシュートの振幅Aoから基準振幅A'に収束しようとする際の最大の速度である。
(5)立ち上がり時間T'p:基準振幅A'+オーバーシュートの振幅Aoに達する(立ち上がる)までにかかる時間である。なお、基準振幅A'+オーバーシュートの振幅Aoに達するまでにかかる時間は、最大速度Vmaxからオーバーシュートの速度Voに達するまでにかかる時間と同じ値となる。
(2)最大速度Vmax:基準振幅A'+オーバーシュートの振幅Aoに達するまでの最大の速度である。
(3)オーバーシュート(overshoot)の振幅Ao:マイクロサッカードによって基準振幅A'を超過した(行き過ぎた)部分の量である。オーバーシュートとは、波形の立ち上がり部分で、波形が基準振幅'Aを超えて突出する現象、または、その突出した波形である。言い換えると、オーバーシュートの振幅とは、突出した部分の量である。
(4)オーバーシュートの速度Vo:基準振幅A+オーバーシュートの振幅Aoから基準振幅A'に収束しようとする際の最大の速度である。
(5)立ち上がり時間T'p:基準振幅A'+オーバーシュートの振幅Aoに達する(立ち上がる)までにかかる時間である。なお、基準振幅A'+オーバーシュートの振幅Aoに達するまでにかかる時間は、最大速度Vmaxからオーバーシュートの速度Voに達するまでにかかる時間と同じ値となる。
なお、減衰率λと減衰係数ζ'については、第1時間区間内で複数回のマイクロサッカードが発生している場合には、各マイクロサッカードについて位置制御系のステップ応答としてモデル化することで求めた減衰率λもしくは減衰係数ζ'の、第1時間区間内全てについての代表値(平均値)を、第1時間区間における特徴量とする。第2時間区間における特徴量も同様である。代表値としては、平均値のほかにも、最大値、最小値、時間区間内で最初のマイクロサッカードに対応する値などでもよい。
<嗜好推定部34>
嗜好推定部34は、特徴量抽出部33が抽出した第1時間区間と第2時間区間のそれぞれについての特徴量の相違の度合いに基づいて、音呈示部で呈示した2つの異なる音楽のうちの少なくともいずれかについての印象を推定する(s34)。
嗜好推定部34は、特徴量抽出部33が抽出した第1時間区間と第2時間区間のそれぞれについての特徴量の相違の度合いに基づいて、音呈示部で呈示した2つの異なる音楽のうちの少なくともいずれかについての印象を推定する(s34)。
なお、本実施形態では、第1特徴量及び第2特徴量に(1)平均速度V、振幅A、減衰係数ζ、発生頻度Pのいずれか1つ、または、その組合せと、(2)減衰率λ、減衰係数ζ'、発生頻度P'のいずれか1つ、または、その組合せとが含まれる。
(1)平均速度V、振幅A、減衰係数ζ、発生頻度Pと好みの度合いとの関係は第一実施形態で説明した通りである。
(1)平均速度V、振幅A、減衰係数ζ、発生頻度Pと好みの度合いとの関係は第一実施形態で説明した通りである。
ここで、(2)減衰率λ、減衰係数ζ'、発生頻度P'と好みの度合いとの関係を説明する。
特徴量が減衰率λや発生頻度P'である場合には、特徴量が大きいほうの時間区間に呈示した音楽の方が、他方の時間区間に呈示した音楽よりも印象が良い(好んでいる度合いが大きい)と推定する。
特徴量が減衰率λや発生頻度P'である場合には、特徴量が大きいほうの時間区間に呈示した音楽の方が、他方の時間区間に呈示した音楽よりも印象が良い(好んでいる度合いが大きい)と推定する。
あるいは、特徴量が減衰係数ζ'である場合には、第1特徴量が小さいほうの時間区間に呈示した音楽の方が、他方の時間区間に呈示した音楽よりも印象が良い(好んでいる度合いが大きい)と推定する。
これは、減衰係数ζ'や減衰率λ、発生頻度P'と音楽に対する印象との間に、以下のような相関関係があることが、実験により明らかになったことに基づく。
(1)印象が良いとき(良くなるとき)には、減衰係数ζ'が減少する傾向がある。
(2)印象が良いとき(良くなるとき)には、減衰率λが増加する傾向がある。なお、減衰係数と減衰率は負の相関関係にある。
(3) 印象が良いとき(良くなるとき)には、マイクロサッカードの発生頻度P'が増加する傾向がある。
(1)印象が良いとき(良くなるとき)には、減衰係数ζ'が減少する傾向がある。
(2)印象が良いとき(良くなるとき)には、減衰率λが増加する傾向がある。なお、減衰係数と減衰率は負の相関関係にある。
(3) 印象が良いとき(良くなるとき)には、マイクロサッカードの発生頻度P'が増加する傾向がある。
なお、減衰係数ζ'、減衰率λ、発生頻度P'のいずれか1つを単独で用いてもよいし、組み合わせて用いてもよい。例えば、何れか二つを満たせばよい、三つ全てを満たせばよい、等と設定してもよい。すなわち、減衰係数ζ'、減衰率λ、発生頻度P'のいずれか1つ以上の特徴量の各々に基づき、音楽の印象を推定してもよい。
なお、減衰係数ζ'は、マイクロサッカードを位置制御系(二次遅れ系)のステップ応答としてみたときの、応答の正確性に対応する指標である。自分の好きな音楽を聴いているときは、音楽に意識が向けられることで、マイクロサッカードの制御に関わる脳の中枢あるいは外眼筋にも一時的な影響があらわれ、応答の正確性(減衰係数)の変化として観測できると考えられる。
図5の実験を行った場合のマイクロサッカードの測定結果を図11に示す。「好き」と判断されている時間帯と「嫌い」と判断されている時間帯とにおけるマイクロサッカードの発生頻度及び減衰係数をそれぞれ図12A及び図12Bに表す。
結果、「好き」と判断されている時間帯には、「嫌い」と判断されている時間帯よりもマイクロサッカードの発生頻度及び減衰率が増加し、減衰係数が減少する傾向にあることが確認された。すなわち、「好き」と判断されている時間帯におけるマイクロサッカードの発生頻度及び減衰率と、「嫌い」と判断されている時間帯におけるマイクロサッカードの発生頻度とを比較すると、「好き」と判断されている時間帯におけるマイクロサッカードの発生頻度のほうが、「嫌い」と判断されている時間帯におけるマイクロサッカードの発生頻度よりも大きい傾向にある。また、「好き」と判断されている時間帯におけるマイクロサッカードの減衰係数と、「嫌い」と判断されている時間帯におけるマイクロサッカードの減衰係数とを比較すると、「好き」と判断されている時間帯におけるマイクロサッカードの減衰係数のほうが、「嫌い」と判断されている時間帯におけるマイクロサッカードの減衰係数よりも小さい傾向にある。
上述の嗜好推定部34の処理は、この知見に基づいて、第1時間区間と第2時間区間に呈示された音楽に対する印象を推定する。
本実施形態では、(1)散瞳の平均速度V、振幅A、減衰係数ζ、発生頻度Pのいずれか1つ、または、その組合せにおいて、第一実施形態で説明した要件を満たし、かつ、(2)マイクロサッカードの減衰率λ、減衰係数ζ'、発生頻度P'のいずれか1つ、または、その組合せにおいて、上述の要件を満たせばよい、等と設定してもよい。すなわち、第1時間区間と第2時間区間についての、(1)散瞳の平均速度V、振幅A、減衰係数ζ、発生頻度Pのいずれか1つ以上の特徴量の各々についての相違の度合いと、(2)マイクロサッカードの減衰率λ、減衰係数ζ'、発生頻度P'のいずれか1つ以上の特徴量の各々についての相違の度合いとに基づき、音楽の好みの度合いを推定してもよい。
<効果>
このような構成により、第一実施形態と同様の効果を得ることができる。さらに、マイクロサッカードの特徴を考慮することで、推定精度を向上させることができる。
このような構成により、第一実施形態と同様の効果を得ることができる。さらに、マイクロサッカードの特徴を考慮することで、推定精度を向上させることができる。
<変形例1>
印象推定装置30は、音呈示部11、瞳孔情報取得部12及び眼球運動取得部32を含まなくともよい。すなわち、音呈示部11、瞳孔情報取得部12及び眼球運動取得部32の少なくとも1つを別装置として構成し、別装置から各時間区間ごとの音楽、瞳孔の大きさ及び眼球の位置情報の少なくとも1つを受け取る構成とすればよい。
印象推定装置30は、音呈示部11、瞳孔情報取得部12及び眼球運動取得部32を含まなくともよい。すなわち、音呈示部11、瞳孔情報取得部12及び眼球運動取得部32の少なくとも1つを別装置として構成し、別装置から各時間区間ごとの音楽、瞳孔の大きさ及び眼球の位置情報の少なくとも1つを受け取る構成とすればよい。
<第四実施形態>
第二実施形態と異なる部分を中心に説明する。
第四実施形態の印象推定装置40は、特徴量抽出部23とモデル記憶部25の代わりに、特徴量抽出部43とモデル記憶部45を含み、さらに、眼球運動取得部32を含む(図8参照)。本実施形態では、モデル記憶部45を参照することにより、対象者にとっての音楽の印象を推定する。眼球運動取得部32の処理内容は、第三実施形態で説明した通りである。
第二実施形態と異なる部分を中心に説明する。
第四実施形態の印象推定装置40は、特徴量抽出部23とモデル記憶部25の代わりに、特徴量抽出部43とモデル記憶部45を含み、さらに、眼球運動取得部32を含む(図8参照)。本実施形態では、モデル記憶部45を参照することにより、対象者にとっての音楽の印象を推定する。眼球運動取得部32の処理内容は、第三実施形態で説明した通りである。
<特徴量抽出部43>
特徴量抽出部43は、特徴量抽出部23と同様の処理を行う。つまり、第1時間区間についての瞳孔径の時系列を受け取り、第1時間区間について、瞳孔径の時系列から、瞳孔の大きさの変化を表す特徴量を抽出する(s23)。さらに、以下の処理を行う。
特徴量抽出部43は、特徴量抽出部23と同様の処理を行う。つまり、第1時間区間についての瞳孔径の時系列を受け取り、第1時間区間について、瞳孔径の時系列から、瞳孔の大きさの変化を表す特徴量を抽出する(s23)。さらに、以下の処理を行う。
特徴量抽出部43は、眼球の位置情報を受け取り、眼球の位置情報の時系列から、マイクロサッカードの特徴に対応する特徴量を抽出し(s43)、嗜好推定部24に出力する。
瞳孔の大きさの変化に対応する値とマイクロサッカードの特徴に対応する値とを要素として含む特徴量ベクトルを嗜好推定部24に出力する。
瞳孔の大きさの変化に対応する値として、第二実施形態で説明した値が考えられる。例えば、散瞳の平均速度V、振幅A、減衰係数ζ、散瞳の固有角振動数ωn、立ち上がり時間Tp、縮瞳に関するパラメータ等である。
マイクロサッカードの特徴に対応する値として、第三実施形態と同様にマイクロサッカードの減衰係数ζ'、減衰率λ、発生頻度P'が考えられる。さらに、以下の値が考えられる(図7、10及び12参照)。
(1)基準振幅A':マイクロサッカードによる眼球の動きが収束したときの移動量。
(2)最大速度Vmax:基準振幅A'+オーバーシュートの振幅Aoに達するまでの最大の速度。
(3)立ち上がり時間T'p:基準振幅A'+オーバーシュートの振幅Aoに達する(立ち上がる)までにかかる時間である。なお、基準振幅A'+オーバーシュートの振幅Aoの値は、最大速度Vmaxからオーバーシュートの速度Voに達するまでにかかる時間と同じ値となる。
(4)オーバーシュート(overshoot)の振幅Ao:マイクロサッカードによって基準振幅A'を超過した(行き過ぎた)部分の量である。オーバーシュートとは、波形の立ち上がり部分で、波形が基準振幅A'を超えて突出する現象、または、その突出した波形である。言い換えると、オーバーシュートの振幅とは、突出した部分の量である。
(5)オーバーシュートの速度Vo:基準振幅A'+オーバーシュートの振幅Aoから基準振幅A'に収束しようとする際の最大の速度である。
(6)位置制御系のステップ応答としてモデル化したときの固有角振動数ω'n
(7)マイクロサッカードの前後のドリフトの速度Vd(図12参照)
(2)最大速度Vmax:基準振幅A'+オーバーシュートの振幅Aoに達するまでの最大の速度。
(3)立ち上がり時間T'p:基準振幅A'+オーバーシュートの振幅Aoに達する(立ち上がる)までにかかる時間である。なお、基準振幅A'+オーバーシュートの振幅Aoの値は、最大速度Vmaxからオーバーシュートの速度Voに達するまでにかかる時間と同じ値となる。
(4)オーバーシュート(overshoot)の振幅Ao:マイクロサッカードによって基準振幅A'を超過した(行き過ぎた)部分の量である。オーバーシュートとは、波形の立ち上がり部分で、波形が基準振幅A'を超えて突出する現象、または、その突出した波形である。言い換えると、オーバーシュートの振幅とは、突出した部分の量である。
(5)オーバーシュートの速度Vo:基準振幅A'+オーバーシュートの振幅Aoから基準振幅A'に収束しようとする際の最大の速度である。
(6)位置制御系のステップ応答としてモデル化したときの固有角振動数ω'n
(7)マイクロサッカードの前後のドリフトの速度Vd(図12参照)
<モデル記憶部45>
モデル記憶部45は、特徴量を入力として、印象を出力するような嗜好推定モデルが予め記録されている。本実施形態では、特徴量として、第二実施形態で説明した特徴量に加え、特徴量抽出部43で抽出した特徴量の一部または全部を含む。つまり、特徴量ベクトルの要素として、第二実施形態で説明したものに加え、マイクロサッカードの減衰係数ζ'、減衰率λ、発生頻度P'、基準振幅A'、最大速度Vmax、立ち上がり時間T'p、オーバーシュート(overshoot)の振幅Ao、オーバーシュートの速度Vo、、マイクロサッカードの前後のドリフトの速度Vd(図12参照)の中の一部または全部を含む。
モデル記憶部45は、特徴量を入力として、印象を出力するような嗜好推定モデルが予め記録されている。本実施形態では、特徴量として、第二実施形態で説明した特徴量に加え、特徴量抽出部43で抽出した特徴量の一部または全部を含む。つまり、特徴量ベクトルの要素として、第二実施形態で説明したものに加え、マイクロサッカードの減衰係数ζ'、減衰率λ、発生頻度P'、基準振幅A'、最大速度Vmax、立ち上がり時間T'p、オーバーシュート(overshoot)の振幅Ao、オーバーシュートの速度Vo、、マイクロサッカードの前後のドリフトの速度Vd(図12参照)の中の一部または全部を含む。
要素の数を増やすことで、推定の精度を高めることができる。
なお、顕著度推定モデルは、第二実施形態で説明した方法と同様の方法により作成することができる。
なお、顕著度推定モデルは、第二実施形態で説明した方法と同様の方法により作成することができる。
<効果>
このような構成により、第二実施形態と同様の効果を得ることができる。
このような構成により、第二実施形態と同様の効果を得ることができる。
<その他の変形例>
本発明は上記の実施形態及び変形例に限定されるものではない。例えば、上述の各種の処理は、記載に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。その他、本発明の趣旨を逸脱しない範囲で適宜変更が可能である。
本発明は上記の実施形態及び変形例に限定されるものではない。例えば、上述の各種の処理は、記載に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。その他、本発明の趣旨を逸脱しない範囲で適宜変更が可能である。
<プログラム及び記録媒体>
また、上記の実施形態及び変形例で説明した各装置における各種の処理機能をコンピュータによって実現してもよい。その場合、各装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記各装置における各種の処理機能がコンピュータ上で実現される。
また、上記の実施形態及び変形例で説明した各装置における各種の処理機能をコンピュータによって実現してもよい。その場合、各装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記各装置における各種の処理機能がコンピュータ上で実現される。
この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。
また、このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD−ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させてもよい。
このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶部に格納する。そして、処理の実行時、このコンピュータは、自己の記憶部に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。また、このプログラムの別の実施形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよい。さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるASP(Application Service Provider)型のサービスによって、上述の処理を実行する構成としてもよい。なお、プログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの(コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータ等)を含むものとする。
また、コンピュータ上で所定のプログラムを実行させることにより、各装置を構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。
Claims (7)
- 第1時間区間を第1の音楽を受聴可能なようにヒトに呈示する時間区間とし、第2時間区間を前記第1の音楽と異なる第2の音楽を受聴可能なようにヒトに呈示する時間区間とし、前記第1時間区間における前記ヒトの瞳孔の大きさの変化を表す第1特徴量と、前記第2時間区間における前記ヒトの瞳孔の大きさの変化を表す第2特徴量と、を抽出する特徴量抽出ステップと、
前記第1特徴量と前記第2特徴量との相違の度合いに基づいて、前記第1の音楽と前記第2の音楽に対する印象を推定する嗜好推定ステップとを含み、
前記第1特徴量及び前記第2特徴量は、瞳孔の大きさの変化を位置制御系のステップ応答としてモデル化したときの減衰係数を含み、
前記嗜好推定ステップは、
前記特徴量に含まれる減衰係数が小さい時間区間に呈示された音楽の方が、他方の時間区間に呈示された音楽よりも印象がよいと推定する、および/または、
前記特徴量に含まれる減衰係数が大きい時間区間に呈示された音楽の方が、他方の時間区間に呈示された音楽よりも印象が悪いと推定する、
印象推定方法。 - 請求項1の印象推定方法であって、
前記特徴量抽出ステップにおいて、第1時間区間における前記ヒトの瞳孔の大きさの変化を表し、かつ、第1時間区間における前記ヒトの眼球の動きに表れるマイクロサッカードの特徴に対応する第1特徴量と、第2時間区間における前記ヒトの瞳孔の大きさの変化を表し、かつ、第2時間区間における前記ヒトの眼球の動きに表れるマイクロサッカードの特徴に対応する第2特徴量と、を抽出し、
前記嗜好推定ステップにおいて、第1時間区間における前記ヒトの瞳孔の大きさの変化を表す前記第1特徴量と、第2時間区間における前記ヒトの瞳孔の大きさの変化を表す前記第2特徴量との相違の度合いと、第1時間区間における前記ヒトの眼球の動きに表れるマイクロサッカードの特徴に対応する前記第1特徴量と、第2時間区間における前記ヒトの眼球の動きに表れるマイクロサッカードの特徴に対応する前記第2特徴量との相違の度合いとに基づいて、前記第1の音楽と前記第2の音楽に対する印象を推定する、
印象推定方法。 - モデル記憶部には、ヒトの瞳孔の大きさの変化を位置制御系のステップ応答としてモデル化したときの減衰係数含む特徴量及びヒトの眼球の動きに表れるマイクロサッカードの特徴に対応する特徴量と音楽に対する印象との相関性を記述したモデルである嗜好推定モデルが記憶されているものとして、
印象推定対象の音楽が受聴可能なようにヒトに呈示されている時間区間における前記ヒトの瞳孔の大きさの変化を位置制御系のステップ応答としてモデル化したときの減衰係数を含む特徴量と、前記ヒトの眼球の動きに表れるマイクロサッカードの特徴に対応する特徴量とを抽出する特徴量抽出ステップと、
前記特徴量抽出ステップで抽出した特徴量を入力として、前記嗜好推定モデルを参照することにより、前記印象推定対象の音楽に対する印象を推定する嗜好推定ステップとを含む、
印象推定方法。 - 第1時間区間を第1の音楽を受聴可能なようにヒトに呈示する時間区間とし、第2時間区間を前記第1の音楽と異なる第2の音楽を受聴可能なようにヒトに呈示する時間区間とし、前記第1時間区間における前記ヒトの瞳孔の大きさの変化を表す第1特徴量と、前記第2時間区間における前記ヒトの瞳孔の大きさの変化を表す第2特徴量と、を抽出する特徴量抽出部と、
前記第1特徴量と前記第2特徴量との相違の度合いに基づいて、前記第1の音楽と前記第2の音楽に対する印象を推定する嗜好推定部とを含み、
前記第1特徴量及び前記第2特徴量は、瞳孔の大きさの変化を位置制御系のステップ応答としてモデル化したときの減衰係数を含み、
前記嗜好推定部は、
前記特徴量に含まれる減衰係数が小さい時間区間に呈示された音楽の方が、他方の時間区間に呈示された音楽よりも印象がよいと推定する、および/または、
前記特徴量に含まれる減衰係数が大きい時間区間に呈示された音楽の方が、他方の時間区間に呈示された音楽よりも印象が悪いと推定する、
印象推定装置。 - 請求項4の印象推定装置であって、
前記特徴量抽出部において、第1時間区間における前記ヒトの瞳孔の大きさの変化を表し、かつ、第1時間区間における前記ヒトの眼球の動きに表れるマイクロサッカードの特徴に対応する第1特徴量と、第2時間区間における前記ヒトの瞳孔の大きさの変化を表し、かつ、第2時間区間における前記ヒトの眼球の動きに表れるマイクロサッカードの特徴に対応する第2特徴量と、を抽出し、
前記嗜好推定部において、第1時間区間における前記ヒトの瞳孔の大きさの変化を表す前記第1特徴量と、第2時間区間における前記ヒトの瞳孔の大きさの変化を表す前記第2特徴量との相違の度合いと、第1時間区間における前記ヒトの眼球の動きに表れるマイクロサッカードの特徴に対応する前記第1特徴量と、第2時間区間における前記ヒトの眼球の動きに表れるマイクロサッカードの特徴に対応する前記第2特徴量との相違の度合いとに基づいて、前記第1の音楽と前記第2の音楽に対する印象を推定する、
印象推定装置。 - モデル記憶部には、ヒトの瞳孔の大きさの変化を位置制御系のステップ応答としてモデル化したときの減衰係数含む特徴量及びヒトの眼球の動きに表れるマイクロサッカードの特徴に対応する特徴量と音楽に対する印象との相関性を記述したモデルである嗜好推定モデルが記憶されているものとして、
印象推定対象の音楽が受聴可能なようにヒトに呈示されている時間区間における前記ヒトの瞳孔の大きさの変化を位置制御系のステップ応答としてモデル化したときの減衰係数を含む特徴量と、前記ヒトの眼球の動きに表れるマイクロサッカードの特徴に対応する特徴量とを抽出する特徴量抽出部と、
前記特徴量抽出部で抽出した特徴量を入力として、前記嗜好推定モデルを参照することにより、前記印象推定対象の音楽に対する印象を推定する嗜好推定部とを含む、
印象推定装置。 - 請求項1から3の何れかの印象推定方法をコンピュータに実行させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014005530A JP5718495B1 (ja) | 2014-01-16 | 2014-01-16 | 印象推定装置、その方法、及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014005530A JP5718495B1 (ja) | 2014-01-16 | 2014-01-16 | 印象推定装置、その方法、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP5718495B1 true JP5718495B1 (ja) | 2015-05-13 |
JP2015131070A JP2015131070A (ja) | 2015-07-23 |
Family
ID=53277426
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014005530A Active JP5718495B1 (ja) | 2014-01-16 | 2014-01-16 | 印象推定装置、その方法、及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5718495B1 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6445418B2 (ja) * | 2015-11-11 | 2018-12-26 | 日本電信電話株式会社 | 印象推定装置、印象推定方法、およびプログラム |
JP2017202048A (ja) * | 2016-05-10 | 2017-11-16 | 日本電信電話株式会社 | 特徴量抽出装置、推定装置、それらの方法、およびプログラム |
JP6479708B2 (ja) * | 2016-05-10 | 2019-03-06 | 日本電信電話株式会社 | 特徴量抽出装置、推定装置、それらの方法、およびプログラム |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005143684A (ja) * | 2003-11-13 | 2005-06-09 | Kao Corp | リラックス感評価用瞳孔対光反応計測具 |
JP2009508553A (ja) * | 2005-09-16 | 2009-03-05 | アイモーションズ−エモーション テクノロジー エー/エス | 眼球性質を解析することで、人間の感情を決定するシステムおよび方法 |
-
2014
- 2014-01-16 JP JP2014005530A patent/JP5718495B1/ja active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005143684A (ja) * | 2003-11-13 | 2005-06-09 | Kao Corp | リラックス感評価用瞳孔対光反応計測具 |
JP2009508553A (ja) * | 2005-09-16 | 2009-03-05 | アイモーションズ−エモーション テクノロジー エー/エス | 眼球性質を解析することで、人間の感情を決定するシステムおよび方法 |
Non-Patent Citations (1)
Title |
---|
JPN6014046516; 伊賀富栄: '音楽と自律神経の反応について : 音楽をトレーニングに活用するための一考察' 東海大学スポーツ医科学雑誌 9, 19970320, 50-58, 東海大学スポーツ医科学スポーツ研究所 * |
Also Published As
Publication number | Publication date |
---|---|
JP2015131070A (ja) | 2015-07-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5718493B1 (ja) | 音の顕著度推定装置、その方法、及びプログラム | |
JP6815486B2 (ja) | 精神障害の療法のためのモバイルおよびウェアラブルビデオ捕捉およびフィードバックプラットフォーム | |
US11013449B2 (en) | Methods and systems for decoding, inducing, and training peak mind/body states via multi-modal technologies | |
Mack et al. | The effect of sampling rate and lowpass filters on saccades–a modeling approach | |
Berg et al. | Free viewing of dynamic stimuli by humans and monkeys | |
Gurler et al. | A link between individual differences in multisensory speech perception and eye movements | |
Heisz et al. | More efficient scanning for familiar faces | |
Saez de Urabain et al. | GraFIX: A semiautomatic approach for parsing low-and high-quality eye-tracking data | |
JP7070605B2 (ja) | 注目範囲推定装置、その方法およびプログラム | |
Zhang et al. | The effects of probe similarity on retrieval and comparison processes in associative recognition | |
JP5718494B1 (ja) | 印象推定装置、その方法、及びプログラム | |
JP5718495B1 (ja) | 印象推定装置、その方法、及びプログラム | |
JP6479708B2 (ja) | 特徴量抽出装置、推定装置、それらの方法、およびプログラム | |
JP2019030491A (ja) | 運動パフォーマンス推定装置、トレーニング装置、それらの方法、およびプログラム | |
JP6509712B2 (ja) | 印象推定装置およびプログラム | |
JP7214986B2 (ja) | 反射性判定装置、反射性判定方法、プログラム | |
JP6377545B2 (ja) | 個人識別方法、個人識別装置、プログラム | |
JP2017176580A (ja) | 感情制御装置、感情制御方法、およびプログラム | |
JP5718492B1 (ja) | 音の顕著度推定装置、その方法、及びプログラム | |
WO2020227703A1 (en) | Adaptive psychological assessment tool | |
US20220230749A1 (en) | Systems and methods for ophthalmic digital diagnostics via telemedicine | |
JP6445418B2 (ja) | 印象推定装置、印象推定方法、およびプログラム | |
KR102452100B1 (ko) | 뇌파 및 눈 깜빡임 기반 학습 서비스 제공 방법, 장치 및 시스템 | |
JP2017202048A (ja) | 特徴量抽出装置、推定装置、それらの方法、およびプログラム | |
WO2020036019A1 (ja) | 瞳孔特徴量抽出装置、瞳孔特徴量抽出方法、プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150310 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150318 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5718495 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |