JP5718495B1

JP5718495B1 - 印象推定装置、その方法、及びプログラム

Info

Publication number: JP5718495B1
Application number: JP2014005530A
Authority: JP
Inventors: 惇米家; シンイリャオ; 茂人古川; 牧夫柏野; 俊介木谷
Original assignee: Nippon Telegraph and Telephone Corp
Current assignee: Nippon Telegraph and Telephone Corp
Priority date: 2014-01-16
Filing date: 2014-01-16
Publication date: 2015-05-13
Anticipated expiration: 2034-01-16
Also published as: JP2015131070A

Abstract

【課題】音楽の好みをリアルタイムで推定することができる技術を提供する。【解決手段】印象推定装置は、第１時間区間を第１の音楽を受聴可能なようにヒトに呈示する時間区間とし、第２時間区間を第１の音楽と異なる第２の音楽を受聴可能なようにヒトに呈示する時間区間とし、第１時間区間におけるヒトの瞳孔の大きさの変化を表す第１特徴量と、第２時間区間におけるヒトの瞳孔の大きさの変化を表す第２特徴量と、を抽出する特徴量抽出部と、第１特徴量と第２特徴量との相違の度合いに基づいて、第１の音楽と第２の音楽に対する印象を推定する嗜好推定部とを含む。【選択図】図２

Description

本発明は、音楽に対する印象（好き／嫌い）を推定する技術に関する。

非特許文献１では、好きな音楽を聴いているとき、さらには、聴く前の聴くことを期待しているときに、線条体でドーパミンが放出されることが確認された。

V. N. Salimpoor, M. Benovoy, K. Larcher, A. Dagher & R. J. Zatorre, "Anatomically distinct dopamine release during anticipation and experience of peak emotion to music", Nature Neuroscience 14(2), 2011, pp.257-262.

非特許文献１によれば、ある音楽を好きか否かや、ある音楽に対する期待に応じて、ドーパミンの放出量が変化する傾向があることを利用して、楽曲への時々刻々の印象（好きか否か）や期待が推定できる可能性がある。しかし、ドーパミンの放出量の測定に用いる装置(PET:positron emission tomography)は時間分解能が低く、解析にも時間がかかるため、非特許文献１ではリアルタイムに音楽の好みを推定することはできない。

本発明は、音楽の好みをリアルタイムで推定することができる技術を提供することを目的とする。

上記の課題を解決するために、本発明の第一の態様によれば、印象推定装置は、第１時間区間を第１の音楽を受聴可能なようにヒトに呈示する時間区間とし、第２時間区間を第１の音楽と異なる第２の音楽を受聴可能なようにヒトに呈示する時間区間とし、第１時間区間におけるヒトの瞳孔の大きさの変化を表す第１特徴量と、第２時間区間におけるヒトの瞳孔の大きさの変化を表す第２特徴量と、を抽出する特徴量抽出部と、第１特徴量と第２特徴量との相違の度合いに基づいて、第１の音楽と第２の音楽に対する印象を推定する嗜好推定部とを含む。

上記の課題を解決するために、本発明の第二の態様によれば、印象推定方法は、第１時間区間を第１の音楽を受聴可能なようにヒトに呈示する時間区間とし、第２時間区間を第１の音楽と異なる第２の音楽を受聴可能なようにヒトに呈示する時間区間とし、第１時間区間におけるヒトの瞳孔の大きさの変化を表す第１特徴量と、第２時間区間におけるヒトの瞳孔の大きさの変化を表す第２特徴量と、を抽出する特徴量抽出ステップと、第１特徴量と第２特徴量との相違の度合いに基づいて、第１の音楽と第２の音楽に対する印象を推定する嗜好推定ステップとを含む。

上記の課題を解決するために、本発明の第三の態様によれば、印象推定方法は、モデル記憶部には、ヒトの瞳孔の大きさの変化を表す特徴量と音楽に対する印象との相関性を記述したモデルである嗜好推定モデルが記憶されているものとして、印象推定対象の音楽が受聴可能なようにヒトに呈示されている時間区間におけるヒトの瞳孔の大きさの変化を表す特徴量を抽出する特徴量抽出ステップと、特徴量抽出ステップで抽出した特徴量を入力として、嗜好推定モデルを参照することにより、印象推定対象の音楽に対する印象を推定する嗜好推定ステップとを含む。

本発明によれば、個人毎の音楽の好みをリアルタイムで推定することができるという効果を奏する。

瞳孔の変化を表す図。第一及び第二実施形態に係る印象推定装置の機能ブロック図。第一及び第二実施形態に係る印象推定装置の処理フローの例を示す図。速度が最大となる時刻T_aと立ち上がり時間T_pとを説明するための図。図５Ａは実験において聴取対象となる音楽の波形を示す図、図５Ｂは図５Ａの音楽に対して被験者が評価した評価結果を示す図。実験結果を示す図。マイクロサッカードを表す図。第三及び第四実施形態に係る印象推定装置の機能ブロック図。第三及び第四実施形態に係る印象推定装置の処理フローの例を示す図。基準振幅A'、オーバーシュートの振幅A_o及び立ち上がり時間T_p、最大速度V_max及びオーバーシュートの速度V_oを説明するための図。実験結果を示す図。ドリフトの速度V_dを説明するための図。

以下、本発明の実施形態について説明する。なお、以下の説明に用いる図面では、同じ機能を持つ構成部や同じ処理を行うステップには同一の符号を記し、重複説明を省略する。

＜第一実施形態＞
本実施形態では、音を聴いたときの人の瞳孔の大きさの変化に基づいて、その人がその音楽を好んでいるか否かを推定する。まず、瞳孔の大きさの変化について説明する。人がある一点を注視しているとき、瞳孔の大きさは一定ではなく、変化している。図１は瞳孔の大きさの変化を表す図であり、横軸は時間（秒）を、縦軸は瞳孔の大きさを表す。

瞳孔の大きさは交感神経系の支配を受けた瞳孔散大筋によって拡大（散瞳）し、副交感神経系の支配を受けた瞳孔括約筋によって収縮（縮瞳）する。図１では、破線部分は縮瞳を表し、二重線部分は散瞳を表す。瞳孔の大きさの変化は主に対光反射、輻輳反射、感情による変化の３つに区別される。対光反射は、網膜に入射する光量を制御するために瞳孔の大きさが変化する反応のことで、強い光に対しては縮瞳、暗所では散瞳が生じる。輻輳反射は、焦点を合わせる際に両眼が内転あるいは外転する運動（輻輳運動）に伴って瞳孔径が変化する反応のことで、近くを見るときには縮瞳、遠くを見るときには散瞳が生じる。感情による変化は、上記のいずれにもよらず外界のストレスに対して生じる反応のことで、怒りや驚き、活発な活動に伴って交感神経が優位となる際には散瞳が生じ、リラックスして副交感神経が優位となる際には縮瞳が生じる。本実施形態では、瞳孔の大きさの変化のうち、特に散瞳に関する特徴に基づいて、印象を推定する。

図２は第一実施形態に係る印象推定装置１０の機能ブロック図、図３はその処理フローの例を示す図である。
印象推定装置１０は、音呈示部１１、瞳孔情報取得部１２、特徴量抽出部１３及び嗜好推定部１４を含む。

＜音呈示部１１＞
音呈示部１１は、２つの異なる音楽をそれぞれ別の時間区間において受聴可能なように人（以下、対象者ともいう）に呈示する（ｓ１１）。例えば、ヘッドホンやスピーカなどにより、受聴可能な音量でそれぞれの音楽を呈示する。２つの異なる音楽は、同じ楽曲の中の異なる時間区間のものであってもよいし、異なる楽曲の一部または全部であってもよい。一方の音楽を受聴可能なように人に呈示する時間区間を第１時間区間、他方の音楽を受聴可能なように人に呈示する時間区間を第２時間区間とする。なお、第１時間区間と第２時間区間の長さは異なっていても良い。

＜瞳孔情報取得部１２＞
瞳孔情報取得部１２は、第１時間区間および第２時間区間のそれぞれについて、対象者の瞳孔の大きさを取得し（ｓ１２）、特徴量抽出部１３へ出力する。例えば、瞳孔の大きさとして、瞳孔径（瞳孔の半径）を用いる場合には、瞳孔径は、赤外線カメラを用いた画像処理法で計測される。第１時間区間および第２時間区間において、対象者には、ある１点を注視してもらうようにし、その時の瞳孔を赤外線カメラを用いて撮像する。そして、撮像した結果を画像処理することで、時間毎（例えば、1000Hz）の瞳孔径の時系列を取得する。なお、左右両方の瞳孔の大きさを取得してもよいし、何れか一方の瞳孔の大きさのみを取得してもよい。本実施形態では、一方の瞳孔の大きさのみを取得するものとする。例えば、瞳孔を撮影した画像に対して、瞳孔にフィッティングした円の半径を用いる。また、瞳孔径は微細に変動するため、所定の時間区間ごとにスムージング(平滑化)した値を用いるとよい。ここで、図１における瞳孔の大きさは、各時刻について取得した瞳孔径の全データの平均を０、標準偏差を１としたときのz-scoreを用いて表したものであり、約150ms間隔でスムージングしたものである。ただし、瞳孔情報取得部１２で取得する瞳孔径はz-scoreでなくとも、瞳孔径の値そのものであっても良いし、瞳孔の面積や直径など、瞳孔の大きさに対応する値であれば何でも良い。瞳孔の面積や直径を用いる場合も、時間の経過とともに瞳孔の面積または直径が大きくなる区間が散瞳に対応し、時間の経過とともに瞳孔の面積または直径が小さくなる区間が縮瞳に対応する。すなわち、時間の経過とともに瞳孔の大きさが大きくなる区間が散瞳に対応し、時間の経過とともに瞳孔の大きさが小さくなる区間が縮瞳に対応する。

なお、一般に、対光反射に伴う瞳孔の大きさの変化量は、感情による変化量と比較して数倍程度の大きさとなり、瞳孔の大きさの変化量全体に対する大きな要因となる。対光反射および輻輳反射による変化を抑え、目立つ音の知覚に関する成分のみに着目しやすくするために、瞳孔径を取得するときの対象者に呈示する画面の輝度および画面から対象者までの距離は一定に保つものとする。

＜特徴量抽出部１３＞
特徴量抽出部１３は、第１時間区間および第２時間区間についての瞳孔の大きさの時系列を受け取り、それぞれの時間区間について、瞳孔の大きさの時系列から、瞳孔の大きさの変化を表す特徴量を抽出し（ｓ１３）、嗜好推定部１４に出力する。第１時間区間について抽出される特徴量を第１特徴量とし、第２時間区間について抽出される特徴量を第２特徴量とする。

特徴量は、音楽に対する印象を推定するための指標ともいえる。言い換えれば、瞳孔の大きさの時系列のうち、散瞳が起きている区間における瞳孔の大きさの変化を表す特徴量であり、具体的には、散瞳の平均速度V、散瞳の振幅A、散瞳が起きているときの瞳孔径の時系列を位置制御系のステップ応答としてモデル化したときの減衰係数ζ、散瞳の発生頻度Pの少なくともいずれか１つ以上を含む特徴量である。振幅Aは、極大点から極小点までの瞳孔径の差である（図１参照）。散瞳の平均速度Vは、（振幅A）/(立ち上がり時間T_p)である。立ち上がり時間T_pは極大点から極小点までの時間である（図１参照）。例えば、特徴量抽出部１３は、瞳孔径の時系列から極大点及び極小点を検出し、それを用いて、振幅A、平均速度V、立ち上がり時間T_pを算出する。このとき、振幅が一定の値以上のもののみを算出する構成としてもよい。

なお、縮瞳及び散瞳は、サーボ系としての特徴を示し、面積制御系（三次遅れ系）のステップ応答として記述でき、本実施形態では位置制御系（二次遅れ系）のステップ応答として近似して考える。位置制御系のステップ応答は、固有角振動数をω_ｎとして、

と表される。ここでG(s)は伝達係数,y(t)は位置, y'(t)は速度を表す。減衰係数ζの導出には、速度が最大となる時刻T_aと立ち上がり時間T_pとの比を用いて（図４参照）、

となることを利用する。そして、減衰係数ζ及び固有角振動数ω_ｎは、それぞれ

と表される。ただし、ｔは時刻を表すインデックスであり、ｓはラプラス変換によるパラメタ（複素数）である。固有角振動数ω_ｎは瞳孔の大きさの変化における応答の速さを表す指標に相当し、減衰係数ζは、瞳孔の大きさの変化における応答の振動性に対応する指標に相当する。

なお、散瞳の平均速度V、散瞳の振幅A、散瞳の減衰係数ζについては、第１時間区間内で複数回の散瞳が発生している場合には、各散瞳の平均速度V、各散瞳の振幅A、各散瞳について位置制御系のステップ応答としてモデル化することで求めた減衰係数ζの、第１時間区間内全てについての代表値（例えば平均値）を、第１時間区間における特徴量とする。第２時間区間における特徴量も同様である。代表値としては、平均値のほかにも、最大値、最小値、時間区間内で最初の散瞳に対応する値などでもよい。

＜嗜好推定部１４＞
嗜好推定部１４は、特徴量抽出部１３が抽出した第１時間区間と第２時間区間のそれぞれについての特徴量の相違の度合いに基づいて、音呈示部で呈示した２つの異なる音楽のうちの少なくともいずれかについての印象を推定する（ｓ１４）。ここで、印象とは、好んでいるか否かに関するものであり、印象が良いとは好んでいることを、印象が悪いとは好んでいないことを意味する。例えば、嗜好推定部１４は、対象者が２つの異なる音楽のうちの一方の音楽を他方の音楽と比較して好んでいるか否かを推定する。あるいは、嗜好推定部１４は、対象者が２つの異なる音楽のうちのどちらの音楽をより好んでいるかを推定する。

具体的には、特徴量が散瞳の発生頻度Pである場合には、特徴量が大きいほうの時間区間に呈示した音楽の方が、他方の時間区間に呈示した音楽よりも印象が良い（好んでいる度合いが大きい）と推定する。

あるいは、特徴量が平均速度Vや振幅A、減衰係数ζである場合には、特徴量が小さいほうの時間区間に呈示した音楽の方が、他方の時間区間に呈示した音楽よりも印象が良い（好んでいる度合いが大きい）と推定する。

これは、散瞳の減衰係数ζや発生頻度P、平均速度V、振幅Aと音楽に対する印象との間に、以下のような相関関係があることが、実験により明らかになったことに基づく。
(1)印象が良いとき（良くなるとき）には、減衰係数ζが減少する傾向がある。
(2)印象が良いとき（良くなるとき）には、発生頻度Pが増加する傾向がある。
(3) 印象が良いとき（良くなるとき）には、平均速度Vが減少する傾向がある。
(4) 印象が良いとき（良くなるとき）には、振幅Aが減少する傾向がある。

なお、散瞳の減衰係数ζや発生頻度P、平均速度V、振幅Aのいずれか１つを単独で用いてもよいし、組み合わせて用いてもよい。例えば、何れか二つを満たせばよい、三つ全てを満たせばよい、等と設定してもよい。すなわち、散瞳の減衰係数ζや発生頻度P、平均速度V、振幅Aのいずれか１つ以上の特徴量の各々に基づき、音楽の印象を推定してもよい。

散瞳の平均速度や振幅は交感神経の活動強度を反映するため、音楽の好みの度合いとの相関がみられるものと考えられる。減衰係数ζは、散瞳を位置制御系（二次遅れ系）のステップ応答としてみたときの応答の振動性に対応する指標である。自分の好きな音楽を聴いているときは、音楽に意識が向けられることで、瞳孔の制御に関わる脳の中枢あるいは瞳孔散大筋（または瞳孔括約筋）にも一時的な影響があらわれ、応答の振動性（減衰係数）の変化として観測できると考えられる。

以下に、図５を用いて実験の一例について説明する。図５Ａの波形で表される音楽を被験者に呈示する。被験者は音楽を聴きながら、０〜１０の１１段階のツマミを回し、音楽に対する「好き嫌いの度合い(rating)」を時々刻々評価する。図５Ｂは評価結果を示す。なお、ratingは、５を中立（好きでも嫌いでもない状態）とし、大きい値ほど（１０に近いほど）、その音楽が好きであることを表す。なお、曲の合間には、評価が０になるように設定した。このときの被験者の瞳孔の大きさから上述の特徴量を測定した。「好き」と判断されている時間帯（この実験ではrating≧７となる時間帯とした）と「嫌い」と判断されている時間帯（この実験ではrating≦４となる時間帯とした）とにおける散瞳の発生頻度、平均速度及び減衰係数をそれぞれ図６Ａ、図６Ｂ及び図６Ｃに表す。発生頻度は、rating≧７またはrating≦４となる時間帯に発生した散瞳の回数をその時間（秒）で割ることで求めた。平均速度および減衰係数は、rating≧７またはrating≦４となる時間帯に発生した１回以上の散瞳の平均速度および減衰係数の平均をそれぞれ用いた。なお、各値の中央の線分は各値の標準偏差を表す。

結果、「好き」と判断されている時間帯には、「嫌い」と判断されている時間帯よりも散瞳の発生頻度が増加し、平均速度及び減衰係数が減少する傾向にあることが確認された。すなわち、「好き」と判断されている時間帯における散瞳の発生頻度と、「嫌い」と判断されている時間帯における散瞳の発生頻度とを比較すると、「好き」と判断されている時間帯における散瞳の発生頻度のほうが、「嫌い」と判断されている時間帯における散瞳の発生頻度よりも大きい傾向にある。また、「好き」と判断されている時間帯における散瞳の平均速度、振幅及び減衰係数と、「嫌い」と判断されている時間帯における散瞳の平均速度、振幅及び減衰係数とをそれぞれ比較すると、「好き」と判断されている時間帯における散瞳の平均速度、振幅及び減衰係数のほうが、「嫌い」と判断されている時間帯における散瞳の平均速度、振幅及び減衰係数よりも小さい傾向にある。

上述の嗜好推定部１４の処理は、この知見に基づいて、第１時間区間と第２時間区間に呈示された音楽に対する印象を推定するものである。

＜効果＞
瞳孔の大きさの変化は、ドーパミン放出量と比較して、個人ごとのデータの評価にも適した指標である。また、瞳孔の大きさの変化は、カメラから取得された情報から高速に解析可能であるため、リアルタイムで測定結果を得ることができる。ゆえに、このような構成により、瞳孔の大きさの変化に基づいて、音楽に対する印象を個人毎にリアルタイムで推定することができる。本実施形態の印象推定装置を利用することで、オンラインで音楽に対する印象を推定することもできるようになる。また、瞳孔の大きさはドーパミンの放出量の測定のような軽い被爆による侵襲性がなく、非侵襲で測定が可能であり、安価な装置で簡単に（対象者を拘束することなく）計測することができるので、低コストで音楽の好みを推定することができる。

また、ドーパミンの放出量の測定に用いる装置(PET)は時間分解能が低いため粗い時間間隔での特徴量しか得ることができず、時々刻々と変動する音楽に対する印象を高精度に推定することができない。これに対し、瞳孔の大きさは時間分解能が高い特徴量であるため、時々刻々と変動する音楽に対する印象を高精度に推定することができるという利点もある。

＜変形例１＞
印象推定装置１０は、音呈示部１１及び瞳孔情報取得部１２を含まなくともよい。すなわち、音呈示部１１及び瞳孔情報取得部１２の少なくとも１つを別装置として構成し、別装置から各時間区間ごとの音楽及び瞳孔の大きさの少なくとも１つを受け取る構成とすればよい。

＜第二実施形態＞
第一実施形態と異なる部分を中心に説明する。
第一実施形態の印象推定装置１０は、２つの異なる音楽のうちどちらの音楽をより好んでいるかを推定するという相対比較形式であった。第二実施形態の印象推定装置２０は、ある１つの音楽を用いて、その音楽に対する印象を推定するものである。第二実施形態の印象推定装置２０は、第一実施形態の特徴量抽出部１３と嗜好推定部１４の代わりに、特徴量抽出部２３と嗜好推定部２４を含み、さらに、モデル記憶部２５を含む（図２参照）。本実施形態では、モデル記憶部２５を参照することにより、対象者にとっての音楽の印象を推定する。なお、第二実施形態では１つの音楽（印象を推定する対象となる音楽）のみを呈示すればよいため、音呈示部１１と瞳孔情報取得部１２において第２時間区間を用いない点が第一実施形態とは異なる。

＜特徴量抽出部２３＞
特徴量抽出部２３は、第１時間区間についての瞳孔の大きさの時系列を受け取り、第１時間区間について、瞳孔の大きさの時系列から、瞳孔の大きさの変化を表す特徴量を抽出し（ｓ２３）、嗜好推定部２４に出力する。

このとき、第一実施形態と同様に散瞳の平均速度V、散瞳の振幅A、散瞳が起きているときの瞳孔径の時系列を位置制御系のステップ応答としてモデル化したときの減衰係数ζ、発生頻度Pの少なくとも何れか１つ以上を含む特徴量を抽出する。なお、本実施形態では上述の値の少なくとも何れか１つ以上を要素として含むベクトル（以下、「特徴量ベクトル」ともいう）を特徴量として抽出する。あるいは、散瞳の平均速度V、振幅A、減衰係数ζ、発生頻度Pの少なくとも何れか１つに加えて、以下の値を要素として含む特徴量ベクトルを特徴量として抽出しても良い（図１参照）。

(1)散瞳が起きているときの瞳孔径の時系列を位置制御系のステップ応答としてモデル化したときの散瞳の固有角振動数ω_n
(2)立ち上がり時間T_p
(3)瞳孔の大きさの変化を表す特徴量として、縮瞳に関するパラメータを要素として含む特徴量ベクトルを抽出してもよい。例えば、縮瞳の平均速度、振幅、発生頻度、減衰係数、固有角振動数、立ち上がり時間、発生頻度に対応するパラメータの何れか一つ以上を、特徴量ベクトルの要素として加えてもよい。

＜嗜好推定部２４＞
嗜好推定部２４は、特徴量を受け取り、その特徴量に基づいて、音楽に対する印象を推定する（ｓ２４）。本実施形態では、抽出された特徴量から嗜好推定モデルを用いて（参照することにより）、印象を推定し、出力する。言い換えれば、嗜好推定部２４は、特徴量抽出部２３で抽出した特徴量を、モデル記憶部２５に記憶された嗜好推定モデル（特徴量から印象を推定するためのモデル）にあてはめることにより、印象を推定する。

＜モデル記憶部２５＞
モデル記憶部２５は、特徴量を入力として、印象を出力するような嗜好推定モデルが予め記録されている。嗜好推定モデルは、予め１人以上の人について取得した特徴量と印象との関係性を機械学習法により学習することで、作成される。つまり、嗜好推定モデルは、特徴量と印象との相関性を記述したモデルである。

例えば、学習用に用意した音楽を対象者に呈示し（図６Ａ参照）ている間の対象者の瞳孔の大きさの時系列情報を取得し、取得した瞳孔の大きさの時系列情報から、特徴量を抽出する。ここで抽出する特徴量は、特徴量抽出部２３で抽出する特徴量と同じとする。また、その音楽に対する好き嫌いの度合い(rating)を対象者から取得し、抽出した特徴量と好き嫌いの度合いを組とするデータセットを用意する。

同様の特徴量抽出を複数の異なる音楽について行い、それぞれの音楽についての好き嫌いの度合い(rating)と抽出した特徴量を組とするデータセットを学習用データとして取得する。

この学習用データを入力データとし、機械学習法により、印象と特徴量との関係を学習する。

例えば、機械学習法としてサポートベクターマシン(Support vector machine、以下SVMともいう)等がある。この場合は、音楽に付与する好き嫌いの度合い(rating)を、好き（１）または嫌い（０）の２値として、特徴量ベクトルの次元に対応する空間において、好きな（印象が良い）ときの特徴量ベクトルに対応する点群と、嫌いな（印象が悪い）ときの特徴量ベクトルに対応する点群とを分離する超平面を求めることができる。これにより、得られる嗜好推定モデルに、好き嫌いが未知の特徴量（特徴量抽出部２３で得られた特徴量）を入力すると、その特徴量が「好き」に対応するか、「嫌い」に対応するかを推定することができる。

例えば、散瞳の平均速度V,振幅A,減衰係数ζ,発生頻度Pを単独で、または、それらの組合せを、要素として含む特徴量ベクトルを用いて、SVMにより学習を行う。

また、散瞳の平均速度V,振幅A,減衰係数ζ,発生頻度P,固有角振動数ω_n,立ち上がり時間T_p,縮瞳に関するパラメータ（例えば、縮瞳の平均速度、振幅、発生頻度、減衰係数、固有角振動数、立ち上がり時間)を要素として含む特徴量ベクトルを用いて、SVMにより学習を行ってもよい。

要素の数を増やすことで、推定の精度を高めることができる。

印象が好き／嫌い、の２値分類に限らず、複数クラス（好き嫌いの度合いに対応するクラス）に分類するようにSVMを構成することも可能である。あるいは、複数クラス（好き嫌いの度合いに対応するクラス）識別分類するような機械学習法であれば、SVMに限らず他の機械学習法を用いてもよい。

なお、学習用データを取得する対象である対象者は、実際に印象を推定する人と同一人物である必要はない。また、複数の人について得られた学習データを基に嗜好推定モデルを学習すると、より精度の高い推定を行うことができる。また、対象者毎に、印象に対応して表れる特徴量が異なる場合があるので、学習データを取得する対象者を印象の推定を行う人と同一人物として対象者毎に、嗜好推定モデルを作成すれば、個人の特性に合わせたより精度の高い推定を行うことができる。

＜効果＞
このような構成により、第一実施形態と同様の効果を得ることができる。

＜第三実施形態＞
第一実施形態と異なる部分を中心に説明する。
本実施形態では、瞳孔の大きさの変化と、人の眼球の動きの表れる微細な跳躍性眼球運動（以下、マイクロサッカード(microsaccade)ともいう）に基づいて、その人がその音楽を好んでいるか否かを推定する。まず、マイクロサッカードについて説明する。人がある一点を注視しているとき、眼球は完全に動きを止めているわけではなく、固視微動と呼ばれる三種類の眼球運動（ドリフト(drift,trendといってもよい)、トレマ、マイクロサッカード(フリックといってもよい)）を行っている。ドリフトは小さな滑らかな動き、トレマは非常に小さな高周波の振動、マイクロサッカードは小さな跳ぶような動きである。図７はマイクロサッカードを表す図であり、横軸は時間（秒）を、縦軸は視野角を表す。詳しく説明すると、マイクロサッカードとは、ある一点を注視している状態において、１〜２秒の間に１回程度、対象者の意思とは関係なく（非随意的）表れる眼球の動きであって、小さな跳ぶような動きのことである（図７の太線部分）。マイクロサッカードは、動きの水平方向の成分、垂直方向の成分のどちらからでも取得することができる。ただし、マイクロサッカードが水平方向に偏向する性質に基づき、本実施形態では、簡単のため水平方向の成分のみを用いる。なお、「水平方向」とは、地面と完全に平行な方向に限定する意味ではなく、顔に対しての水平方向（眼球の配列方向であり、横方向、幅方向といってもよい）や後述する眼球運動取得部３２において水平方向と定義付られた方向を含む概念である。

図８は第一実施形態に係る印象推定装置３０の機能ブロック図、図９はその処理フローの例を示す図である。
印象推定装置３０は、音呈示部１１、瞳孔情報取得部１２、眼球運動取得部３２、特徴量抽出部３３及び嗜好推定部３４を含む。音呈示部１１及び瞳孔情報取得部１２の処理内容は第一実施形態と同様である。

＜眼球運動取得部３２＞
眼球運動取得部３２は、第１時間区間と第２時間区間のそれぞれにおいて、対象者の眼球の位置情報を取得し（ｓ３２）、特徴量抽出部３３へ出力する。例えば、対象者には、各音楽を呈示している間（第１時間区間と第２時間区間において）は、ある１点を注視してもらうようにし、その時の眼球の動きを赤外線カメラを用いて撮像する。そして、撮像した結果を画像処理することで、時間毎（例えば、1000Hz）の眼球の位置の時系列を眼球の位置情報として取得する。なお、左右両方の眼球の位置情報を取得してもよいし、何れか一方の眼球の位置情報のみを取得してもよい。本実施形態では、一方の眼球の位置情報のみを取得するものとする。

＜特徴量抽出部３３＞
特徴量抽出部３３は、特徴量抽出部１３と同様の処理を行う。つまり、特徴量抽出部３３は、第１時間区間および第２時間区間についての瞳孔径の時系列を受け取り、それぞれの時間区間について、瞳孔径の時系列から、瞳孔の大きさの変化を表す特徴量を抽出し（ｓ１３）、嗜好推定部３４に出力する。さらに、以下の処理を行う。

特徴量抽出部３３は、第１時間区間と第２時間区間のそれぞれについての眼球の位置情報を受け取り、眼球の位置情報の時系列から、第１時間区間と第２時間区間のそれぞれについてのマイクロサッカードの特徴に対応する特徴量を抽出し（ｓ３３）、嗜好推定部３４に出力する。

例えば、眼球の位置情報の時系列について１次階差系列を計算し、階差系列の絶対値が所定の閾値を上回る時間区間をマイクロサッカードが起きている区間として検出する。取得された眼球の位置情報にノイズが多く含まれると判断される場合などには、１次階差系列の計算にあたって適当な範囲での移動平均値を用いても良い。検出に用いる閾値には、階差系列の標準偏差の6倍程度の値を用いることが好ましい。

特徴量は、音楽に対する印象を推定するための指標ともいえる。言い換えれば、眼球の位置情報の時系列のうち、眼球の位置が大きく変化する区間（マイクロサッカードが起きている区間）における眼球運動を表す特徴量である。特徴量は、具体的には、マイクロサッカードが起きているときの眼球位置の時系列を位置制御系のステップ応答としてモデル化したときの減衰率λ、もしくは、減衰係数ζ'、または、マイクロサッカードの発生頻度P'の少なくともいずれか１つ以上を含む特徴量である。位置制御系のステップ応答は、固有角振動数をω'_ｎとして、

と表される。ここでG(s)は伝達係数,y(t)は位置, y'(t)は速度を表し、

と表される。ただし、ｔは時刻を表すインデックスであり、ｓはラプラス変換によるパラメタ（複素数）である。固有角振動数ω'_ｎはマイクロサッカードの応答の速さを表す指標に相当し、減衰係数ζ'はマイクロサッカードの応答の正確性に対応する指標に相当する。また、V_o, V_max, A_o, A',T'_pはそれぞれ以下を表す（図１０参照）。

（１）基準振幅A':マイクロサッカードによる眼球の動きが収束したときの移動量である。
（２）最大速度V_max:基準振幅A'＋オーバーシュートの振幅A_oに達するまでの最大の速度である。
（３）オーバーシュート(overshoot)の振幅A_o:マイクロサッカードによって基準振幅A'を超過した（行き過ぎた）部分の量である。オーバーシュートとは、波形の立ち上がり部分で、波形が基準振幅'Aを超えて突出する現象、または、その突出した波形である。言い換えると、オーバーシュートの振幅とは、突出した部分の量である。
（４）オーバーシュートの速度V_o:基準振幅A＋オーバーシュートの振幅A_oから基準振幅A'に収束しようとする際の最大の速度である。
（５）立ち上がり時間T'_p:基準振幅A'＋オーバーシュートの振幅A_oに達する（立ち上がる）までにかかる時間である。なお、基準振幅A'＋オーバーシュートの振幅A_oに達するまでにかかる時間は、最大速度V_maxからオーバーシュートの速度V_oに達するまでにかかる時間と同じ値となる。

なお、減衰率λと減衰係数ζ'については、第１時間区間内で複数回のマイクロサッカードが発生している場合には、各マイクロサッカードについて位置制御系のステップ応答としてモデル化することで求めた減衰率λもしくは減衰係数ζ'の、第１時間区間内全てについての代表値（平均値）を、第１時間区間における特徴量とする。第２時間区間における特徴量も同様である。代表値としては、平均値のほかにも、最大値、最小値、時間区間内で最初のマイクロサッカードに対応する値などでもよい。

＜嗜好推定部３４＞
嗜好推定部３４は、特徴量抽出部３３が抽出した第１時間区間と第２時間区間のそれぞれについての特徴量の相違の度合いに基づいて、音呈示部で呈示した２つの異なる音楽のうちの少なくともいずれかについての印象を推定する（ｓ３４）。

なお、本実施形態では、第１特徴量及び第２特徴量に(1)平均速度V、振幅A、減衰係数ζ、発生頻度Pのいずれか１つ、または、その組合せと、(2)減衰率λ、減衰係数ζ'、発生頻度P'のいずれか１つ、または、その組合せとが含まれる。
(1)平均速度V、振幅A、減衰係数ζ、発生頻度Pと好みの度合いとの関係は第一実施形態で説明した通りである。

ここで、(2)減衰率λ、減衰係数ζ'、発生頻度P'と好みの度合いとの関係を説明する。
特徴量が減衰率λや発生頻度P'である場合には、特徴量が大きいほうの時間区間に呈示した音楽の方が、他方の時間区間に呈示した音楽よりも印象が良い（好んでいる度合いが大きい）と推定する。

あるいは、特徴量が減衰係数ζ'である場合には、第１特徴量が小さいほうの時間区間に呈示した音楽の方が、他方の時間区間に呈示した音楽よりも印象が良い（好んでいる度合いが大きい）と推定する。

これは、減衰係数ζ'や減衰率λ、発生頻度P'と音楽に対する印象との間に、以下のような相関関係があることが、実験により明らかになったことに基づく。
(1)印象が良いとき（良くなるとき）には、減衰係数ζ'が減少する傾向がある。
(2)印象が良いとき（良くなるとき）には、減衰率λが増加する傾向がある。なお、減衰係数と減衰率は負の相関関係にある。
(3) 印象が良いとき（良くなるとき）には、マイクロサッカードの発生頻度P'が増加する傾向がある。

なお、減衰係数ζ'、減衰率λ、発生頻度P'のいずれか１つを単独で用いてもよいし、組み合わせて用いてもよい。例えば、何れか二つを満たせばよい、三つ全てを満たせばよい、等と設定してもよい。すなわち、減衰係数ζ'、減衰率λ、発生頻度P'のいずれか１つ以上の特徴量の各々に基づき、音楽の印象を推定してもよい。

なお、減衰係数ζ'は、マイクロサッカードを位置制御系（二次遅れ系）のステップ応答としてみたときの、応答の正確性に対応する指標である。自分の好きな音楽を聴いているときは、音楽に意識が向けられることで、マイクロサッカードの制御に関わる脳の中枢あるいは外眼筋にも一時的な影響があらわれ、応答の正確性（減衰係数）の変化として観測できると考えられる。

図５の実験を行った場合のマイクロサッカードの測定結果を図１１に示す。「好き」と判断されている時間帯と「嫌い」と判断されている時間帯とにおけるマイクロサッカードの発生頻度及び減衰係数をそれぞれ図１２Ａ及び図１２Ｂに表す。

結果、「好き」と判断されている時間帯には、「嫌い」と判断されている時間帯よりもマイクロサッカードの発生頻度及び減衰率が増加し、減衰係数が減少する傾向にあることが確認された。すなわち、「好き」と判断されている時間帯におけるマイクロサッカードの発生頻度及び減衰率と、「嫌い」と判断されている時間帯におけるマイクロサッカードの発生頻度とを比較すると、「好き」と判断されている時間帯におけるマイクロサッカードの発生頻度のほうが、「嫌い」と判断されている時間帯におけるマイクロサッカードの発生頻度よりも大きい傾向にある。また、「好き」と判断されている時間帯におけるマイクロサッカードの減衰係数と、「嫌い」と判断されている時間帯におけるマイクロサッカードの減衰係数とを比較すると、「好き」と判断されている時間帯におけるマイクロサッカードの減衰係数のほうが、「嫌い」と判断されている時間帯におけるマイクロサッカードの減衰係数よりも小さい傾向にある。

上述の嗜好推定部３４の処理は、この知見に基づいて、第１時間区間と第２時間区間に呈示された音楽に対する印象を推定する。

本実施形態では、(1)散瞳の平均速度V、振幅A、減衰係数ζ、発生頻度Pのいずれか１つ、または、その組合せにおいて、第一実施形態で説明した要件を満たし、かつ、(2)マイクロサッカードの減衰率λ、減衰係数ζ'、発生頻度P'のいずれか１つ、または、その組合せにおいて、上述の要件を満たせばよい、等と設定してもよい。すなわち、第１時間区間と第２時間区間についての、(1)散瞳の平均速度V、振幅A、減衰係数ζ、発生頻度Pのいずれか１つ以上の特徴量の各々についての相違の度合いと、(2)マイクロサッカードの減衰率λ、減衰係数ζ'、発生頻度P'のいずれか１つ以上の特徴量の各々についての相違の度合いとに基づき、音楽の好みの度合いを推定してもよい。

＜効果＞
このような構成により、第一実施形態と同様の効果を得ることができる。さらに、マイクロサッカードの特徴を考慮することで、推定精度を向上させることができる。

＜変形例１＞
印象推定装置３０は、音呈示部１１、瞳孔情報取得部１２及び眼球運動取得部３２を含まなくともよい。すなわち、音呈示部１１、瞳孔情報取得部１２及び眼球運動取得部３２の少なくとも１つを別装置として構成し、別装置から各時間区間ごとの音楽、瞳孔の大きさ及び眼球の位置情報の少なくとも１つを受け取る構成とすればよい。

＜第四実施形態＞
第二実施形態と異なる部分を中心に説明する。
第四実施形態の印象推定装置４０は、特徴量抽出部２３とモデル記憶部２５の代わりに、特徴量抽出部４３とモデル記憶部４５を含み、さらに、眼球運動取得部３２を含む（図８参照）。本実施形態では、モデル記憶部４５を参照することにより、対象者にとっての音楽の印象を推定する。眼球運動取得部３２の処理内容は、第三実施形態で説明した通りである。

＜特徴量抽出部４３＞
特徴量抽出部４３は、特徴量抽出部２３と同様の処理を行う。つまり、第１時間区間についての瞳孔径の時系列を受け取り、第１時間区間について、瞳孔径の時系列から、瞳孔の大きさの変化を表す特徴量を抽出する（ｓ２３）。さらに、以下の処理を行う。

特徴量抽出部４３は、眼球の位置情報を受け取り、眼球の位置情報の時系列から、マイクロサッカードの特徴に対応する特徴量を抽出し（ｓ４３）、嗜好推定部２４に出力する。

瞳孔の大きさの変化に対応する値とマイクロサッカードの特徴に対応する値とを要素として含む特徴量ベクトルを嗜好推定部２４に出力する。

瞳孔の大きさの変化に対応する値として、第二実施形態で説明した値が考えられる。例えば、散瞳の平均速度V、振幅A、減衰係数ζ、散瞳の固有角振動数ω_n、立ち上がり時間T_p、縮瞳に関するパラメータ等である。

マイクロサッカードの特徴に対応する値として、第三実施形態と同様にマイクロサッカードの減衰係数ζ'、減衰率λ、発生頻度P'が考えられる。さらに、以下の値が考えられる（図７、１０及び１２参照）。

（１）基準振幅A':マイクロサッカードによる眼球の動きが収束したときの移動量。
（２）最大速度V_max:基準振幅A'＋オーバーシュートの振幅A_oに達するまでの最大の速度。
（３）立ち上がり時間T'_p:基準振幅A'＋オーバーシュートの振幅A_oに達する（立ち上がる）までにかかる時間である。なお、基準振幅A'＋オーバーシュートの振幅A_oの値は、最大速度V_maxからオーバーシュートの速度V_oに達するまでにかかる時間と同じ値となる。
（４）オーバーシュート(overshoot)の振幅A_o:マイクロサッカードによって基準振幅A'を超過した（行き過ぎた）部分の量である。オーバーシュートとは、波形の立ち上がり部分で、波形が基準振幅A'を超えて突出する現象、または、その突出した波形である。言い換えると、オーバーシュートの振幅とは、突出した部分の量である。
（５）オーバーシュートの速度V_o:基準振幅A'＋オーバーシュートの振幅A_oから基準振幅A'に収束しようとする際の最大の速度である。
（６）位置制御系のステップ応答としてモデル化したときの固有角振動数ω'_n
（７）マイクロサッカードの前後のドリフトの速度V_d（図１２参照）

＜モデル記憶部４５＞
モデル記憶部４５は、特徴量を入力として、印象を出力するような嗜好推定モデルが予め記録されている。本実施形態では、特徴量として、第二実施形態で説明した特徴量に加え、特徴量抽出部４３で抽出した特徴量の一部または全部を含む。つまり、特徴量ベクトルの要素として、第二実施形態で説明したものに加え、マイクロサッカードの減衰係数ζ'、減衰率λ、発生頻度P'、基準振幅A'、最大速度V_max、立ち上がり時間T'_p、オーバーシュート(overshoot)の振幅A_o、オーバーシュートの速度V_o、_、マイクロサッカードの前後のドリフトの速度V_d（図１２参照）の中の一部または全部を含む。

要素の数を増やすことで、推定の精度を高めることができる。
なお、顕著度推定モデルは、第二実施形態で説明した方法と同様の方法により作成することができる。

＜効果＞
このような構成により、第二実施形態と同様の効果を得ることができる。

＜その他の変形例＞
本発明は上記の実施形態及び変形例に限定されるものではない。例えば、上述の各種の処理は、記載に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。その他、本発明の趣旨を逸脱しない範囲で適宜変更が可能である。

＜プログラム及び記録媒体＞
また、上記の実施形態及び変形例で説明した各装置における各種の処理機能をコンピュータによって実現してもよい。その場合、各装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記各装置における各種の処理機能がコンピュータ上で実現される。

この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。

また、このプログラムの流通は、例えば、そのプログラムを記録したＤＶＤ、ＣＤ−ＲＯＭ等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させてもよい。

このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶部に格納する。そして、処理の実行時、このコンピュータは、自己の記憶部に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。また、このプログラムの別の実施形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよい。さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるＡＳＰ（Application Service Provider）型のサービスによって、上述の処理を実行する構成としてもよい。なお、プログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの（コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータ等）を含むものとする。

また、コンピュータ上で所定のプログラムを実行させることにより、各装置を構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。

Claims

第１時間区間を第１の音楽を受聴可能なようにヒトに呈示する時間区間とし、第２時間区間を前記第１の音楽と異なる第２の音楽を受聴可能なようにヒトに呈示する時間区間とし、前記第１時間区間における前記ヒトの瞳孔の大きさの変化を表す第１特徴量と、前記第２時間区間における前記ヒトの瞳孔の大きさの変化を表す第２特徴量と、を抽出する特徴量抽出ステップと、
前記第１特徴量と前記第２特徴量との相違の度合いに基づいて、前記第１の音楽と前記第２の音楽に対する印象を推定する嗜好推定ステップとを含み、
前記第１特徴量及び前記第２特徴量は、瞳孔の大きさの変化を位置制御系のステップ応答としてモデル化したときの減衰係数を含み、
前記嗜好推定ステップは、
前記特徴量に含まれる減衰係数が小さい時間区間に呈示された音楽の方が、他方の時間区間に呈示された音楽よりも印象がよいと推定する、および／または、
前記特徴量に含まれる減衰係数が大きい時間区間に呈示された音楽の方が、他方の時間区間に呈示された音楽よりも印象が悪いと推定する、
印象推定方法。
請求項１の印象推定方法であって、
前記特徴量抽出ステップにおいて、第１時間区間における前記ヒトの瞳孔の大きさの変化を表し、かつ、第１時間区間における前記ヒトの眼球の動きに表れるマイクロサッカードの特徴に対応する第１特徴量と、第２時間区間における前記ヒトの瞳孔の大きさの変化を表し、かつ、第２時間区間における前記ヒトの眼球の動きに表れるマイクロサッカードの特徴に対応する第２特徴量と、を抽出し、
前記嗜好推定ステップにおいて、第１時間区間における前記ヒトの瞳孔の大きさの変化を表す前記第１特徴量と、第２時間区間における前記ヒトの瞳孔の大きさの変化を表す前記第２特徴量との相違の度合いと、第１時間区間における前記ヒトの眼球の動きに表れるマイクロサッカードの特徴に対応する前記第１特徴量と、第２時間区間における前記ヒトの眼球の動きに表れるマイクロサッカードの特徴に対応する前記第２特徴量との相違の度合いとに基づいて、前記第１の音楽と前記第２の音楽に対する印象を推定する、
印象推定方法。
モデル記憶部には、ヒトの瞳孔の大きさの変化を位置制御系のステップ応答としてモデル化したときの減衰係数含む特徴量及びヒトの眼球の動きに表れるマイクロサッカードの特徴に対応する特徴量と音楽に対する印象との相関性を記述したモデルである嗜好推定モデルが記憶されているものとして、
印象推定対象の音楽が受聴可能なようにヒトに呈示されている時間区間における前記ヒトの瞳孔の大きさの変化を位置制御系のステップ応答としてモデル化したときの減衰係数を含む特徴量と、前記ヒトの眼球の動きに表れるマイクロサッカードの特徴に対応する特徴量とを抽出する特徴量抽出ステップと、
前記特徴量抽出ステップで抽出した特徴量を入力として、前記嗜好推定モデルを参照することにより、前記印象推定対象の音楽に対する印象を推定する嗜好推定ステップとを含む、
印象推定方法。
第１時間区間を第１の音楽を受聴可能なようにヒトに呈示する時間区間とし、第２時間区間を前記第１の音楽と異なる第２の音楽を受聴可能なようにヒトに呈示する時間区間とし、前記第１時間区間における前記ヒトの瞳孔の大きさの変化を表す第１特徴量と、前記第２時間区間における前記ヒトの瞳孔の大きさの変化を表す第２特徴量と、を抽出する特徴量抽出部と、
前記第１特徴量と前記第２特徴量との相違の度合いに基づいて、前記第１の音楽と前記第２の音楽に対する印象を推定する嗜好推定部とを含み、
前記第１特徴量及び前記第２特徴量は、瞳孔の大きさの変化を位置制御系のステップ応答としてモデル化したときの減衰係数を含み、
前記嗜好推定部は、
前記特徴量に含まれる減衰係数が小さい時間区間に呈示された音楽の方が、他方の時間区間に呈示された音楽よりも印象がよいと推定する、および／または、
前記特徴量に含まれる減衰係数が大きい時間区間に呈示された音楽の方が、他方の時間区間に呈示された音楽よりも印象が悪いと推定する、
印象推定装置。
請求項４の印象推定装置であって、
前記特徴量抽出部において、第１時間区間における前記ヒトの瞳孔の大きさの変化を表し、かつ、第１時間区間における前記ヒトの眼球の動きに表れるマイクロサッカードの特徴に対応する第１特徴量と、第２時間区間における前記ヒトの瞳孔の大きさの変化を表し、かつ、第２時間区間における前記ヒトの眼球の動きに表れるマイクロサッカードの特徴に対応する第２特徴量と、を抽出し、
前記嗜好推定部において、第１時間区間における前記ヒトの瞳孔の大きさの変化を表す前記第１特徴量と、第２時間区間における前記ヒトの瞳孔の大きさの変化を表す前記第２特徴量との相違の度合いと、第１時間区間における前記ヒトの眼球の動きに表れるマイクロサッカードの特徴に対応する前記第１特徴量と、第２時間区間における前記ヒトの眼球の動きに表れるマイクロサッカードの特徴に対応する前記第２特徴量との相違の度合いとに基づいて、前記第１の音楽と前記第２の音楽に対する印象を推定する、
印象推定装置。
モデル記憶部には、ヒトの瞳孔の大きさの変化を位置制御系のステップ応答としてモデル化したときの減衰係数含む特徴量及びヒトの眼球の動きに表れるマイクロサッカードの特徴に対応する特徴量と音楽に対する印象との相関性を記述したモデルである嗜好推定モデルが記憶されているものとして、
印象推定対象の音楽が受聴可能なようにヒトに呈示されている時間区間における前記ヒトの瞳孔の大きさの変化を位置制御系のステップ応答としてモデル化したときの減衰係数を含む特徴量と、前記ヒトの眼球の動きに表れるマイクロサッカードの特徴に対応する特徴量とを抽出する特徴量抽出部と、
前記特徴量抽出部で抽出した特徴量を入力として、前記嗜好推定モデルを参照することにより、前記印象推定対象の音楽に対する印象を推定する嗜好推定部とを含む、
印象推定装置。
請求項１から３の何れかの印象推定方法をコンピュータに実行させるためのプログラム。