JP5941350B2 - 聴覚印象量推定装置及びそのプログラム - Google Patents
聴覚印象量推定装置及びそのプログラム Download PDFInfo
- Publication number
- JP5941350B2 JP5941350B2 JP2012141774A JP2012141774A JP5941350B2 JP 5941350 B2 JP5941350 B2 JP 5941350B2 JP 2012141774 A JP2012141774 A JP 2012141774A JP 2012141774 A JP2012141774 A JP 2012141774A JP 5941350 B2 JP5941350 B2 JP 5941350B2
- Authority
- JP
- Japan
- Prior art keywords
- psychological state
- auditory impression
- acoustic
- amount
- auditory
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Description
聴覚印象とは、聴取者や被験者が感じた音の特徴を言葉で表現(ラベリング)したものである。
聴覚印象量とは、聴覚印象の程度、つまり、聴覚印象を数値化したものである。
聴取者とは、音響信号を実際に聴取する者である。
被験者とは、心理状態遷移モデル又は確率分布モデルを構築するときの主観評価実験の対象者である。
かかる構成によれば、聴覚印象量推定装置は、聴取者の嗜好を心理状態の推定結果に反映させることができる。
なお、嗜好とは、聴取者や被験者の好みを示すものである。
かかる構成によれば、聴覚印象量推定装置は、聴取者の生体情報を心理状態の推定結果に反映させることができる。
かかる構成によれば、聴覚印象量推定装置は、聴取者の心理状態の遷移を詳細に把握することができる。
かかる構成によれば、聴覚印象量推定装置は、聴取者の心理状態の遷移を詳細に把握することができる。
なお、内部状態とは、聴取者や被験者の心理状態を言葉で表現(ラベリング)したものである。ここでは、内部状態とは、心理状態遷移モデルを構成する1単位(1ユニット)のことである。
本願第1発明によれば、聴取者の心理状態が聴覚印象量に反映されるため、正確な聴覚印象量を提示することができる。
本願第2発明によれば、聴取者の心理状態に加えて、聴取者の嗜好が心理状態の推定結果に反映されるため、より正確な聴覚印象量を提示することができる。
本願第4,5発明によれば、聴取者の心理状態の遷移を詳細に把握できるため、より正確な聴覚印象量を提示することができる。
[聴覚印象量推定装置の構成]
図1を参照し、本発明の第1実施形態に係る聴覚印象量推定装置1の構成について説明する。
聴覚印象量推定装置1は、聴取者が再生音場音響信号(音響信号)を聴いたときの聴覚印象量と、臨場感の推定値とを提示するものである。このため、聴覚印象量推定装置1は、音響信号分析手段10と、データベース20と、心理状態推定手段30と、確率分布モデル抽出手段(抽出条件生成手段)40と、聴覚印象量推定手段50とを備える。
なお、設定パラメータ入力手段60及び生体情報測定手段70は、後記する。
再生音場音響信号は、再生音場で収音された音響信号(実際に再現された音響空間で計測された音響信号)である。例えば、再生音場音響信号は、コンサートホールでのオーケストラ生演奏を収音した音響信号を、リビングルームのオーディオ機器により再生して、その再生音を収音した音響信号である。
また、音響空間の計測には、複数のマイクロホンを用いて空間的な情報を取得できる計測装置を用いてもよい。例えば、複数のマイクロホンを配置して、音量や位相を比較することで、音の到来方向を算出することができる。このとき、信号間相関(ダミーヘッドの場合は、両耳間相関)を算出することで、音の拡がり感を空間的な情報として取得できる。
さらに、音響信号分析手段10は、音像の方向を、45°の範囲内で区分された8方向で表してもよい。
評価条件(メタデータ)とは、心理状態遷移モデル21を構築するための主観評価実験を行った条件である。
なお、心理状態遷移モデル21の構築については後記する。
さらに、心理状態は、カテゴリーで区分してもよい。例えば、「抑鬱」というカテゴリーの心理状態には、「気がかりな」、「不安な」、「自信がない」という心理状態が含まれる。また、例えば、「敵意」というカテゴリーの心理状態には、「攻撃的な」、「憎らしい」、「むっとした」という心理状態が含まれる。また、例えば、「倦怠」というカテゴリーの心理状態には、「つまらない」、「疲れた」、「退屈な」という心理状態が含まれる。また、例えば、「活動的快」というカテゴリーの心理状態には、「活気のある」、「気力に満ちた」、「はつらつとした」という心理状態が含まれる。また、例えば、「非活動的快」というカテゴリーの心理状態には、「のんびりした」、「のどかな」、「おっとりした」という心理状態が含まれる。また、例えば、「親和」というカテゴリーの心理状態には、「いとおしい」、「愛らしい」、「すてきな」という心理状態が含まれる(参考文献1参照)。
参考文献1:「多面的感情状態尺度の作成」、寺崎他、心理学研究、第62号、pp.350-356、1992
興味とは、評価対象(再生音場音響信号A及び評価用音響信号)に対する聴取者や被験者の関心を示すものである。例えば、興味の有無は、「興味が有る」を‘0’、「興味が無い」を‘1’のような2値を設定してもよい。また、興味の有無として、「大変興味が有る」、「そこそこ興味が有る」、「全く興味が無い」等に対応する値を段階的に設定してもよい。
聴覚印象とは、聴取者や被験者が感じた音の特徴を言葉で表現(ラベリング)したものであり、例えば、「広がり感」、「明るい」といったものがある。
聴覚印象量とは、聴覚印象の程度、つまり、聴覚印象を数値化したものである。
なお、確率分布モデル23の構築については後記する。
重回帰分析では、複数の観測値(説明変数)から変数(目的変数)を予測するとき、予測誤差が最も少なくなるように寄与率を算出する。本実施形態では、観測値(説明変数)を音響特徴量の確率分布モデル23から求めた聴覚印象量とし、変数(目的変数)を臨場感推定値とした重回帰分析を行う。このことから、重み係数は、データベース20に記憶されている観測値に依存することになる。
以下、図2〜図4を参照し、心理状態遷移モデル21の構築について、第1例〜第3例を説明する(適宜図1参照)。
図2に示すように、第1例の心理状態遷移モデル21は、「感動(ゾクッ)」と、「平常」と、「感動(ジーン)」との間のように、ある心理状態から別の心理状態に遷移する。また、心理状態遷移モデル21は、「平常」を維持するように、同一の心理状態を維持する。
また、丸中の文字が心理状態を示し、心理状態が遷移する経路を矢印で示す(図3も同様)。
また、心理状態の遷移確率をPxとする(x=11,12,13,21,22,31,33)。例えば、遷移確率P11は、「平常」から遷移せずに「平常」を維持する確率を示す。また、例えば、遷移確率P12は、「平常」から「感動(ジーン)」へ遷移する確率を示す。
図3に示すように、第2例の心理状態遷移モデル21は、「感動(ジーン)高」と、「感動(ジーン)中」と、「感動(ジーン)低」との間のように、ある心理状態が段階的に遷移する。
なお、第2例では、遷移確率Pxを第1例と同様に設定できるため、説明及び図示を省略した。
図4に示すように、第3例の心理状態遷移モデル21は、「平常」に含まれる内部状態「無関心」と、「関心」と、「高関心」との間のように、同一の心理状態に含まれる内部状態が遷移する。また、心理状態遷移モデル21は、「平常」に含まれる「高関心」と、「感動」に含まれる内部状態「感動低」との間のように、異なる心理状態に含まれる内部状態でも遷移する。
例えば、心理状態が「平常」であれば、内部状態は、関心が無いことを示す「無関心」と、関心があることを示す「関心」と、関心が高いことを示す「高関心」とになる。
また、例えば、心理状態が「感動」であれば、内部状態は、感動が低いことを示す「感動低」と、感動が高いことを示す「感動高」とになる。
また、例えば、心理状態が「嫌悪」であれば、内部状態は、否定していることを示す「否定」と、険悪なことを示す「険悪」とになる。
また、第3例では、遷移確率Pxを第1例と同様に設定できるため、説明及び図示を省略した。
また、例えば、心理状態遷移モデル21は、前記した第1例〜第3例のうち、任意の手法で構築できる。
確率分布モデル23の構築について説明する。
例えば、聴覚印象の「広がり感」、両耳間相互相関度、音圧レベル、音源の方向、直前の音の広がり、及び、聴取者の嗜好の影響を受けると考えられる。そこで、音響特徴量を「両耳間相互相関度」とし、聴覚印象を「広がり感」として説明する。
心理状態推定手段30は、心理状態遷移モデル21に設定された心理状態の遷移確率と、乱数発生処理で発生させた乱数とによって、聴取者の心理状態を推定するものである。つまり、心理状態推定手段30は、乱数発生処理を用いて確率的に、最も尤からしい聴取者の心理状態を推定する。
図5,図6を参照し、抽出条件を生成する理由について、説明する。
図5(a)に示すように、音響特徴量は、音響信号の時間に応じて変化し、これに伴って聴覚印象量も変化する。このため、感動といった心理状態は、音響信号の途中(例えば、音楽を聴いている途中)で変化することがある。
この図5(a)では、各時間の音響特徴量を実線で図示し、この音響特徴量の平均値を破線で図示した。
この図5(b)では、音響信号の各時間でのモデルデータを黒丸で図示した。つまり、図5(b)の確率分布モデル90では、黒丸のそれぞれが、異なる時間でのモデルデータを示している。
この図5(c)では、ある音響信号を聴取したとき、感動したと回答した被験者から求めた聴覚印象量の平均値を実線で図示し、全聴取者の平均値を破線で図示し、感動しないと回答した被験者から求めた聴覚印象量の平均値を一点鎖線で図示した。
この図6では、評価用音響信号の各時間でのモデルデータを黒丸で図示した。つまり、図6の確率分布モデル23では、黒丸のそれぞれが、異なる時間でのモデルデータを示している。
聴覚印象量推定手段50は、聴覚印象量及び臨場感推定値を算出し、提示するものである。この聴覚印象量推定手段50は、聴覚印象量算出手段51と、臨場感推定値算出手段53と、聴覚印象量提示手段55とを備える。
臨場感推定値算出手段53は、聴覚印象量算出手段51が算出した聴覚印象量に、予め設定された重み係数を乗じた値を、臨場感推定値として算出するものである。
図7を参照し、聴覚印象量算出手段51による聴覚印象量を算出と、臨場感推定値算出手段53による臨場感推定値の算出とを説明する(適宜図1参照)。
聴覚印象量算出手段51は、全てのモデルデータが含まれる確率分布モデル23から、抽出条件に一致するモデルデータを抽出する。例えば、確率分布モデル23に含まれる全モデルデータの心理状態が「感動(ゾクッ)」及び「平常」であり、抽出条件が「感動(ゾクッ)」である場合を考える。この場合、聴覚印象量算出手段51は、確率分布モデル23から、「感動(ゾクッ)」のモデルデータを抽出する。
聴覚印象量提示手段55は、聴覚印象量算出手段51が算出した聴覚印象量と、臨場感推定値算出手段53が算出した臨場感推定値とを提示するものである。ここで、聴覚印象量提示手段55は、聴覚印象量及び臨場感推定値を、グラフィカルな形式で提示する。
図8,図9を参照し、聴覚印象量提示手段55による聴覚印象量及び臨場感推定値の提示について、説明する。
図8に示すように、聴覚印象量提示手段55は、例えば、聴覚印象量及び臨場感推定値を棒グラフ形式で提示する。具体的には、聴覚印象量提示手段55は、聴覚印象量算出手段51が算出した聴覚印象量(例えば、「広がり感」)を、棒グラフ96として提示する。また、聴覚印象量提示手段55は、臨場感推定値算出手段53が算出した臨場感推定値を、棒グラフ97として提示する。このとき、聴覚印象量提示手段55は、確率分布モデル抽出手段40が生成した抽出条件98を提示してもよい。
なお、聴覚印象量推定装置1の動作は、第2実施形態と同様のため、説明を後記する。
[聴覚印象量推定装置の構成]
図10を参照し、本発明の第2実施形態に係る聴覚印象量推定装置1Aの構成について、第1実施形態と異なる点を説明する(適宜図1参照)。
聴覚印象量推定装置1Aは、i種類の音響分析値からj種類の聴覚印象量を算出することが、第1実施形態と異なる(但し、i>1、j>1を満たす整数)。このため、聴覚印象量推定装置1Aは、音響信号分析手段10と、データベース20と、心理状態推定手段30と、確率分布モデル抽出手段40Aと、聴覚印象量推定手段50Aとを備える。
なお、本実施形態では、互いに異なる音響分析値及び聴覚印象量が1対1で対応付けられた確率分布モデルを記憶することとする(つまり、i=j)。
つまり、データベース20は、図10に示すように、1種類目の音響特徴量(音響分析値1)及び1種類目の聴覚印象量(聴覚印象量1)が対応付けられた確率分布モデルQ1を記憶する。
また、データベース20は、2種類目の音響特徴量(音響分析値2)及び2種類目の聴覚印象量(聴覚印象量2)が対応付けられた確率分布モデルQ2を記憶する。
また、データベース20は、3種類目の音響特徴量(音響分析値3)及び3種類目の聴覚印象量(聴覚印象量3)が対応付けられた確率分布モデルQ3を記憶する。
また、データベース20は、4種類目の音響特徴量(音響分析値4)及び4種類目の聴覚印象量(聴覚印象量4)が対応付けられた確率分布モデルQ4を記憶する。
また、データベース20は、i種類目の音響特徴量(音響分析値i)及びj種類目の聴覚印象量(聴覚印象量j)が対応付けられた確率分布モデルQjを記憶する。
聴覚印象量算出手段51Aは、j種類の確率分布モデルQjのそれぞれから、抽出条件に一致するモデルデータを抽出し、抽出したモデルデータを参照して、j種類の聴覚印象量を算出する。
なお、聴覚印象量の算出方法は、聴覚印象量算出手段51と同様のため、説明を省略する。
具体的には、臨場感推定値算出手段53Aは、1種類目の聴覚印象量と、確率分布モデルQ1の重み係数W1との乗算値を算出する。また、臨場感推定値算出手段53Aは、2種類目の聴覚印象量と、確率分布モデルQ2の重み係数W2との乗算値を算出する。また、臨場感推定値算出手段53Aは、3種類目の聴覚印象量と、確率分布モデルQ3の重み係数W3との乗算値を算出する。また、臨場感推定値算出手段53Aは、4種類目の聴覚印象量と、確率分布モデルQ4の重み係数W4との乗算値を算出する。また、臨場感推定値算出手段53Aは、j種類目の聴覚印象量と、確率分布モデルQjの重み係数Wjとの乗算値を算出する。そして、臨場感推定値算出手段53Aは、j個の乗算値を合計し、臨場感推定値を算出する
図11,図12を参照し、聴覚印象量提示手段55Aによる聴覚印象量及び臨場感推定値の提示について、説明する。
聴覚印象量提示手段55Aは、聴覚印象量及び臨場感推定値を、グラフィカルな形式で提示する。ここでは、聴覚印象量として、「移動感」及び「広がり感」を求めたこととする。
また、図12に示すように、聴覚印象量提示手段55Aは、「移動感」と、「広がり感」と、臨場感推定値とを、レーダーチャート形式で提示してもよい。
図13を参照し、聴覚印象量推定装置1Aの全体動作について説明する(適宜図1参照)。
この図13では、聴覚印象量推定装置1Aは、入力された再生音場音響信号から、聴覚印象量及び臨場感推定値をリアルタイムで算出することとする。
聴覚印象量推定装置1Aは、心理状態推定手段30によって、聴取者の心理状態を推定する(ステップS2)。
聴覚印象量推定装置1Aは、確率分布モデル抽出手段40Aによって、抽出条件を生成する(ステップS3)。
聴覚印象量推定装置1Aは、聴覚印象量提示手段55Aによって、リアルタイム処理中の聴覚印象量及び臨場感推定値を提示する(ステップS5)。
再生音場音響信号が末尾に達していない場合(ステップS6でNo)、聴覚印象量推定装置1Aは、全体処理を終了しないと判定し、後記するカウンタci,cjをインクリメントし、ステップS1の処理に戻る。
聴覚印象量推定装置1Aは、聴覚印象量提示手段55Aによって、全体処理終了後の聴覚印象量及び臨場感推定値を提示する(ステップS7)。
図14を参照し、図13の音響信号分析処理(ステップS1)について説明する(適宜図1参照)。
音響信号分析手段10は、再生音場音響信号から所定区間を切り出す(ステップS11)。
なお、音響信号分析手段10は、レベルの時間変化パターン等の音響特徴量を用いる場合、過去区間の再生音場音響信号が必要になるため、ステップS12の処理を行う。
カウンタciが音響特徴量種類数N以下の場合(ステップS13でYes)、音響信号分析手段10は、ステップS14の処理に進む。
なお、音響特徴量種類数Nは、音響分析の対象となる音響特徴量の種類数を示しており、予め設定される(N=i)。
音響信号分析手段10は、ステップS11で切り出した再生音場音響信号をメモリに記憶し、処理を終了する(ステップS15)。
つまり、音響信号分析手段10は、N種類の音響分析値を算出する。
図15を参照し、図11の心理状態推定処理(ステップS2)について説明する(適宜図1参照)。
心理状態推定手段30は、過去に推定した心理状態を、図示を省略したメモリから読み出す(ステップS21)。
カウンタciが聴覚印象種類数L以下の場合(ステップS22でYes)、心理状態推定手段30は、ステップS23の処理に進む。
心理状態推定手段30は、心理状態遷移モデル21に設定された心理状態の遷移確率と、乱数発生処理で発生させた乱数とによって、心理状態を推定する(ステップS23)。
聴覚印象種類数Lは、推定する聴覚印象の種類数を示している(L=j)。
心理状態推定手段30は、ステップS23で推定した心理状態をメモリに記憶し、処理を終了する(ステップS24)。
なお、心理状態推定手段30は、現在の心理状態を推定するため、心理状態推定モデル21において、過去の心理状態から現在の心理状態に至った経路を参照する必要がるため、ステップS24の処理を行う。
図16を参照し、図13の抽出条件生成処理(ステップS3)について説明する(適宜図1参照)。
確率分布モデル抽出手段40Aは、カウンタciが、音響特徴量種類数N及びパラメータ設定種類数Mの加算値以下であるか否かを判定する(ステップS31)。
なお、パラメータ設定種類数Mは、設定パラメータに設定されたパラメータの種類数であり、本実施形態では、設定パラメータを利用しないためゼロである。
確率分布モデル抽出手段40Aは、確率分布モデルに含まれる被験者の心理状態と、心理状態推定手段30で推定された聴取者の心理状態との間で一致する心理状態である抽出条件を、生成する(ステップS32)。
確率分布モデル抽出手段40Aは、ci番目の抽出条件をメモリに記憶し、ステップS21の処理に戻る(ステップS33)。
確率分布モデル抽出手段40Aは、ステップS33で記憶した抽出条件を聴覚印象量推定手段50に出力する(ステップS34)。
図17を参照し、図13の聴覚印象量・臨場感推定値算出処理(ステップS4)について説明する(適宜図1参照)。
聴覚印象量推定手段50Aは、カウンタcjが聴覚印象種類数L以下であるか否かを判定する(ステップS41)。
カウンタcjが聴覚印象種類数L以下の場合(ステップS41でYes)、聴覚印象量推定手段50Aは、ステップS42の処理に進む。
聴覚印象量算出手段51Aは、抽出したモデルデータを参照して、音響分析値に対応するj番目の聴覚印象量を算出し、ステップS31の処理に戻る(ステップS43)。
臨場感推定値算出手段53Aは、各聴覚印象量と、各聴覚印象量を算出した確率分布モデルの重み係数とを乗じた値を、臨場感推定値として算出する(ステップS44)。
図1に戻り、本発明の第3実施形態に係る聴覚印象量推定装置1Bについて、第1実施形態と異なる点を説明する。
ここで、心理状態遷移モデル21Bは、第1実施形態と同様、音響特徴量(例えば、ラウドネス推定値)を評価条件として、心理状態の遷移確率Pxが設定される。
なお、ラウドネス推定値を評価条件とした遷移確率Pxを「遷移確率Px|L」と呼ぶ。
参考文献3:戸梶、“『感動』喚起のメカニズムについて”,認知科学,Vol.8,No.4,pp.360-368,2001
なお、嗜好を評価条件とした遷移確率Pxを「遷移確率Px|p」と呼ぶ。
設定パラメータ入力手段60は、聴取者に依存する設定パラメータを入力するものである。例えば、聴取者が、図示を省略したマウス、キーボードを介して、「穏やか」、「激しい」というように予め定義された嗜好から、この聴取者自身にあった嗜好(例えば、「穏やか」)を入力(選択)する。すると、設定パラメータ入力手段60は、聴取者の嗜好が「穏やか」を示す設定パラメータを生成する。そして、設定パラメータ入力手段60は、生成した設定パラメータを心理状態推定手段30Bに出力する。
興味とは、評価対象(再生音場音響信号A及び評価用音響信号)に対する聴取者や被験者の関心を示すものである。例えば、興味の有無は、「興味が有る」を‘0’、「興味が無い」を‘1’のような2値を設定してもよい。また、興味の有無として、「大変興味が有る」、「そこそこ興味が有る」、「全く興味が無い」等に対応する値を段階的に設定してもよい。
聴取時間帯とは、聴取者や被験者が音(音楽)を聴く時間帯を示すものであり、例えば、「平日の21時から22時」、「休日の10時から12時」といったものがある。
なお、聴取者は、聴取者の嗜好と同様、聴取者の興味及び聴取時間帯といった設定パラメータを設定パラメータ入力手段60に入力(選択)できる。
本発明の第4実施形態に係る聴覚印象量推定装置1Cについて、第3実施形態と異なる点を説明する。
生体情報測定手段70は、聴取者の生体情報を測定するものである。例えば、生体情報測定手段70は、再生音場音響信号を聴いたときの聴取者の生体情報として計測する。そして、生体情報測定手段70は、測定した生体情報を心理状態推定手段30Cに出力する。
図18を参照し、本発明の変形例1に係る聴覚印象量推定装置1について、第1実施形態と異なる点を説明する。
図18に示すように、心理状態遷移モデル21では、「感動(ジーン)」及び「感動(ゾクッ)」というように、2種類の心理状態を強度に応じて段階的に遷移させる点が第1実施形態と異なる。
図19を参照し、本発明の変形例2に係る聴覚印象量推定装置1について、第1実施形態と異なる点を説明する(適宜図1参照)。
この変形例2では、心理状態推定手段30が、音響信号分析手段10から入力された音響分析値に従って、心理状態遷移モデル21の遷移確率を選択することが、第1実施形態と異なる。
図20を参照し、心理状態遷移モデル21に遷移確率を設定する手法を説明する。
図20(b)では、第1被験者の感動の変化を実線で図示し、第2被験者の感動の変化を破線で図示し、第3被験者の感動の変化を一点鎖線で図示した。
図20(c)では、図20(b)の各時刻をサンプル点1〜8として図示した。
以後の説明では、評価用音響信号の聴取開始時、全被験者の感動が低い状態であることとする。
なお、評価用音響信号を別の信号に代えることや、主観評価実験を繰返し行うことで、遷移確率の正確性を向上させることができる。
図21を参照し、音響分析値に従って遷移確率を選択する手法について説明する。
この図21では、心理状態が平常の場合を「常」、心理状態が感動の場合を「感」と略記した。
なお、3,5番目の分割区間は、先頭の分割区間と同様に遷移確率を選択するため、説明を省略した。
前記した各実施形態では、心理状態遷移モデル21及び確率分布モデル23を記憶するデータベースを一体化して説明したが、本発明は、これに限定されない。つまり、本発明は、心理状態遷移モデル21を記憶する心理状態遷移モデルデータベースと、確率分布モデル23を記憶する確率分布モデルデータベースとを別々に構成してもよい。
なお、総合印象とは、個別の印象に対する総合的な印象であり、好ましさ、ふさわしさと言うこともできる。
10 音響信号分析手段
20,20B,20C データベース(心理状態遷移モデルデータベース、確率分布モデルデータベース)
30,30B,30C 心理状態推定手段
40,40A 確率分布モデル抽出手段(抽出条件生成手段)
50,50A 聴覚印象量推定手段
51,51A 聴覚印象量算出手段
53,53A 臨場感推定値算出手段
55,55A 聴覚印象量提示手段
60 設定パラメータ入力手段
70 生体情報測定手段
Claims (6)
- 音響信号が再生されたときの、聴取者が感じた音の特徴の程度を示す聴覚印象量を推定する聴覚印象量推定装置であって、
前記音響信号が入力され、入力された前記音響信号の音響特徴量である音響分析値を、当該音響信号を音響分析して求める音響信号分析手段と、
前記音響特徴量を評価条件とし、前記評価条件毎に心理状態に関する主観評価実験を行って被験者の心理状態の遷移確率を設定した心理状態遷移モデルを、予め記憶する心理状態遷移モデルデータベースと、
前記心理状態遷移モデルに設定された心理状態の遷移確率と、乱数発生処理で発生させた乱数とによって、前記聴取者の心理状態を推定する心理状態推定手段と、
被験者の心理状態毎に前記聴覚印象量に関する主観評価実験を行って前記聴覚印象量と前記音響特徴量とを予め対応付けた確率分布モデルを、記憶する確率分布モデルデータベースと、
前記確率分布モデルに含まれる被験者の心理状態と、前記心理状態推定手段で推定された聴取者の心理状態との間で一致する心理状態である抽出条件を、生成する抽出条件生成手段と、
前記確率分布モデルから、前記抽出条件に対応する聴覚印象量及び音響特徴量を抽出し、抽出した前記聴覚印象量及び前記音響特徴量に、当該音響特徴量の区間毎に予め設定された確率関数を適用することで、前記音響分析値に対応する聴覚印象量を算出する聴覚印象量算出手段と、
を備えることを特徴とする聴覚印象量推定装置。 - 前記聴取者に依存する設定パラメータとして、前記聴取者の嗜好が入力される設定パラメータ入力手段をさらに備え、
前記心理状態遷移モデルデータベースは、前記評価条件に前記音響特徴量及び前記被験者の嗜好が含まれる心理状態遷移モデルを記憶することを特徴とする請求項1に記載の聴覚印象量推定装置。 - 前記聴取者の生体情報を測定する生体情報測定手段をさらに備え、
前記心理状態遷移モデルデータベースは、さらに、前記評価条件に前記被験者の生体情報が含まれる心理状態遷移モデルを記憶することを特徴とする請求項2に記載の聴覚印象量推定装置。 - 前記心理状態遷移モデルデータベースは、前記被験者の心理状態が段階的に遷移する心理状態遷移モデルを記憶することを特徴とする請求項1から請求項3の何れか一項に記載の聴覚印象量推定装置。
- 前記心理状態遷移モデルデータベースは、前記被験者の心理状態に含まれる内部状態が遷移する心理状態遷移モデルを記憶することを特徴とする請求項1から請求項3の何れか一項に記載の聴覚印象量推定装置。
- 音響信号が再生されたときの、聴取者が感じた音の特徴の程度を示す聴覚印象量を推定するために、音響特徴量を評価条件とし、前記評価条件毎に心理状態に関する主観評価実験を行って被験者の心理状態間の遷移確率を求めた心理状態遷移モデルを予め記憶する心理状態遷移モデルデータベースと、前記被験者の心理状態毎に前記聴覚印象量に関する主観評価実験を行って前記聴覚印象量と音響特徴量とを予め対応付けた確率分布モデルを記憶する確率分布モデルデータベースとを備えるコンピュータを、
前記音響信号が入力され、入力された前記音響信号の音響特徴量である音響分析値を、当該音響信号を音響分析して求める音響信号分析手段、
前記心理状態遷移モデルに設定された心理状態の遷移確率と、乱数発生処理で発生させた乱数とによって、前記聴取者の心理状態を推定する心理状態推定手段、
前記確率分布モデルに含まれる被験者の心理状態と、前記心理状態推定手段で推定された聴取者の心理状態との間で一致する心理状態である抽出条件を、生成する抽出条件生成手段、
前記確率分布モデルから、前記抽出条件に対応する聴覚印象量及び音響特徴量を抽出し、抽出した前記聴覚印象量及び前記音響特徴量に、当該音響特徴量の区間毎に予め設定された確率関数を適用することで、前記音響分析値に対応する聴覚印象量を算出する聴覚印象量算出手段、
として機能させるための聴覚印象量推定プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012141774A JP5941350B2 (ja) | 2012-06-25 | 2012-06-25 | 聴覚印象量推定装置及びそのプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012141774A JP5941350B2 (ja) | 2012-06-25 | 2012-06-25 | 聴覚印象量推定装置及びそのプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014006692A JP2014006692A (ja) | 2014-01-16 |
JP5941350B2 true JP5941350B2 (ja) | 2016-06-29 |
Family
ID=50104354
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012141774A Expired - Fee Related JP5941350B2 (ja) | 2012-06-25 | 2012-06-25 | 聴覚印象量推定装置及びそのプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5941350B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6127245B2 (ja) * | 2012-10-12 | 2017-05-17 | 株式会社ジャママ〜る | 評価値収集方法 |
JP2016057570A (ja) * | 2014-09-12 | 2016-04-21 | ヤマハ株式会社 | 音響解析装置 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1244033A3 (en) * | 2001-03-21 | 2004-09-01 | Matsushita Electric Industrial Co., Ltd. | Play list generation device, audio information provision device, system, method, program and recording medium |
JP4246120B2 (ja) * | 2004-07-21 | 2009-04-02 | シャープ株式会社 | 楽曲検索システムおよび楽曲検索方法 |
JP2007041988A (ja) * | 2005-08-05 | 2007-02-15 | Sony Corp | 情報処理装置および方法、並びにプログラム |
JP4027405B2 (ja) * | 2006-11-14 | 2007-12-26 | 松下電器産業株式会社 | 楽曲検索装置、楽曲検索方法、及びそのプログラムと記録媒体 |
JP2008197813A (ja) * | 2007-02-09 | 2008-08-28 | Toshiba Corp | 楽曲提供システムおよび楽曲提供装置 |
-
2012
- 2012-06-25 JP JP2012141774A patent/JP5941350B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2014006692A (ja) | 2014-01-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Kang et al. | Towards soundscape indices | |
Giannoulis et al. | A database and challenge for acoustic scene classification and event detection | |
Cartwright et al. | Social-EQ: Crowdsourcing an Equalization Descriptor Map. | |
McAdams et al. | The psychomechanics of simulated sound sources: Material properties of impacted thin plates | |
Weinzierl et al. | A measuring instrument for the auditory perception of rooms: The Room Acoustical Quality Inventory (RAQI) | |
JP6251145B2 (ja) | 音声処理装置、音声処理方法およびプログラム | |
CN108596016B (zh) | 一种基于深度神经网络的个性化头相关传输函数建模方法 | |
Gontier et al. | Estimation of the perceived time of presence of sources in urban acoustic environments using deep learning techniques | |
Anglada-Tort et al. | Large-scale iterated singing experiments reveal oral transmission mechanisms underlying music evolution | |
Mehrabi et al. | Similarity measures for vocal-based drum sample retrieval using deep convolutional auto-encoders | |
Schneider | Pitch and pitch perception | |
US20100235169A1 (en) | Speech differentiation | |
JP5961048B2 (ja) | 聴覚印象量推定装置及びそのプログラム | |
JP5941350B2 (ja) | 聴覚印象量推定装置及びそのプログラム | |
Francombe et al. | A model of distraction in an audio-on-audio interference situation with music program material | |
Seiça et al. | Contrasts and similarities between two audio research communities in evaluating auditory artefacts | |
Mumtaz et al. | Nonintrusive perceptual audio quality assessment for user-generated content using deep learning | |
Adami et al. | On similarity and density of applause sounds | |
Mo et al. | An investigation into how reverberation effects the space of instrument emotional characteristics | |
JP5658483B2 (ja) | 臨場感推定装置およびそのプログラム | |
CN109119089B (zh) | 对音乐进行通透处理的方法及设备 | |
JP4240878B2 (ja) | 音声認識方法及び音声認識装置 | |
Schmele et al. | Three dimensional sonification of fMRI brain data in the musical composition neurospaces | |
Lindborg | Correlations between acoustic features, personality traits and perception of soundscapes | |
WO2023233979A1 (ja) | 気分推定プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20140328 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150501 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20160223 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160301 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160405 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160426 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160520 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5941350 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |