JP6859283B2 - 好感度推定装置、好感度推定方法、プログラム - Google Patents
好感度推定装置、好感度推定方法、プログラム Download PDFInfo
- Publication number
- JP6859283B2 JP6859283B2 JP2018028932A JP2018028932A JP6859283B2 JP 6859283 B2 JP6859283 B2 JP 6859283B2 JP 2018028932 A JP2018028932 A JP 2018028932A JP 2018028932 A JP2018028932 A JP 2018028932A JP 6859283 B2 JP6859283 B2 JP 6859283B2
- Authority
- JP
- Japan
- Prior art keywords
- favorability
- voice
- speaker
- feature amount
- likability
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Machine Translation (AREA)
Description
有声休止とは、発話中に会話の発言権を維持するために、「あのー」、「えーと」のようなフィラーや単語内の音の伸びとして現れる現象である。この有声休止の頻度と好感度の高い通話・低い通話の関係を分析したところ、図1に示すように差があった。そこで、本実施形態では、発話音声に現れる有声休止の頻度に基づいて好感度を推定する。
(参考非特許文献1:後藤真孝,伊藤克亘,速水悟,“自然発話中の有声休止箇所のリアルタイム検出システム”,電子情報通信学会論文誌D-2,J83-D-2, No.11, pp.2330-2340, 2000.)
好感度推定部140は、好感度推定モデル180を用いて好感度を推定したが、好感度推定モデル180の代わりに、機械学習以外の方法で取得した、発話音声の特徴量と話者の好感度との関連性に基づいて好感度を推定するようにしてもよい。つまり、好感度推定部140は、有声休止頻度と好感度との関連性に基づいて、S130で計算した有声休止頻度pvから、発話音声s(t)(t=0, 1, 2, …, T)の話者の好感度を推定する(S140)。この場合、有声休止頻度と好感度との関連性は図1で説明した知見に基づいて生成することができる。例えば、有声休止頻度が所定の第1の閾値以下である場合、好感度が高いと推定し、有声休止頻度が所定の第2の閾値以上である場合、好感度が低いと推定し、それ以外の場合は好感度が中程度と推定するように関連性を定めることができる。
コールセンターや店頭の窓口において顧客の発話に対して適切に相槌を打つことは、好感度に影響する、つまり、適切な相槌で応対された場合は、好感度が高くなると考えられる。そこで、本実施形態では、発話音声に現れる話者による相槌の頻度に基づいて、好感度を推定する。
好感度推定部240は、好感度推定モデル280を用いて好感度を推定したが、好感度推定モデル280の代わりに、機械学習以外の方法で取得した、発話音声の特徴量と話者の好感度との関連性に基づいて好感度を推定するようにしてもよい。つまり、好感度推定部240は、相槌頻度と好感度との関連性に基づいて、S230で計算した相槌頻度paから、発話音声s(t)(t=0, 1, 2, …, T)の話者の好感度を推定する(S240)。
コールセンターや店頭の窓口の応対におけるオペレータや店員の敬語の使い方の正しさは好感度に影響する、つまり、正しい敬語で応対された場合は、好感度が高くなると考えられる。そこで、本実施形態では、発話音声に現れる敬語を修正した回数に基づいて、好感度を推定する。
(参考非特許文献2:大野満,横山晶一,西原典孝,“日本語敬語表現変換・解析システム”,言語処理学会第9回年次大会発表論文集,pp.218-221, 2003.)
敬語辞書385を用いて、単語認識結果w(j)を正しい敬語に修正し、その結果を修正結果w'(j)とする。敬語辞書385は、例えば、「述語」、「文型」、「動詞/サ変名詞の意味的制約」、「名詞」の項目毎に対応する敬語を登録したデータベースである。
好感度推定部340は、好感度推定モデル380を用いて好感度を推定したが、好感度推定モデル380の代わりに、機械学習以外の方法で取得した、発話音声の特徴量と話者の好感度との関連性に基づいて好感度を推定するようにしてもよい。つまり、好感度推定部340は、敬語修正回数と好感度との関連性に基づいて、S330で計算した敬語修正回数pwから、発話音声s(t)(t=0, 1, 2, …, T)の話者の好感度を推定する(S340)。
第1実施形態では、有声休止の頻度に基づいて好感度を推定したが、ここでは、語尾音声における有声休止の頻度に着目する。これは、「です」、「ます」などの語尾の単語において、「○○ですー」、「○○ますー」といった音を発声すると、顧客には誠実な対応に聞こえず、好感度の低下に大きく影響すると考えられるためである。そこで、本実施形態では、語尾の単語における有声休止に近しい音(語尾伸び現象)に着目、発話音声の語尾に現れる有声休止の頻度に基づいて好感度を推定する。
(1) 語尾単語時間長n=0、語尾有声休止数m=0とする。語尾単語時間長とは、語尾に現れる単語の時間長の合計値であり、語尾有声休止数とは、語尾に現れる有声休止数である。
(2) すべての単語認識結果w(j)(j=1, 2, …, J)に対して、以下の処理を行う。
単語認識結果w(j)が語尾単語辞書Gに含まれる場合、単語開始時刻Ts(j)、単語終了時刻Te(j)をそれぞれフレーム単位の開始時刻sf(j)、フレーム単位の終了時刻ef(j)に変換し、語尾有声休止時間長n、語尾有声休止数mを次式により更新する。
なお、フレーム単位の開始時刻sf(j)、フレーム単位の終了時刻ef(j)は、例えば、F0抽出のフレーム間隔が10msである場合、sf(j)=Ts(j)/0.01、ef(j)=Te(j)/0.01となる。
一方、単語認識結果w(j)が語尾単語辞書Gに含まれない場合は、何もしない。
(3) pv'=m/nとして、語尾有声休止頻度pv'を求める。
好感度推定部440は、好感度推定モデル480を用いて好感度を推定したが、好感度推定モデル480の代わりに、機械学習以外の方法で取得した、発話音声の特徴量と話者の好感度との関連性に基づいて好感度を推定するようにしてもよい。つまり、好感度推定部440は、語尾有声休止頻度と好感度との関連性に基づいて、S430で計算した語尾有声休止頻度pv'から、発話音声s(t)(t=0, 1, 2, …, T)の話者の好感度を推定する(S440)。
第2実施形態では、オペレータや店員の発話における相槌頻度に基づいて好感度を推定したが、ここでは、顧客が話している区間に着目して、相槌の頻度をカウントする。これは、顧客が発話している区間でオペレータや店員が相槌をすると、顧客の話を聞いているという意思表示になり、好感度の向上に大きく影響すると考えられるためである。そこで、本実施形態では、顧客が発話している区間において発話音声に現れる話者による相槌の頻度に基づいて、好感度を推定する。
(1) 相槌回数n=0とする。
(2) すべての単語認識結果w(j)(j=1, 2, …, J)に対して、以下の処理を行う。
単語認識結果w(j)が相槌辞書Uに含まれる場合、単語開始時刻Ts(j)から単語終了時刻Te(j)までの区間を含む顧客発話区間kが存在するか否かを確認し、存在する場合は、相槌回数を増やす。具体的には、相槌回数nを次式により更新する。
一方、単語認識結果w(j)が相槌辞書Uに含まれない場合は、何もしない。
(3) 次式により、顧客発話区間相槌頻度pa'を計算する。
好感度推定部540は、好感度推定モデル580を用いて好感度を推定したが、好感度推定モデル580の代わりに、機械学習以外の方法で取得した、発話音声の特徴量と話者の好感度との関連性に基づいて好感度を推定するようにしてもよい。つまり、好感度推定部540は、顧客発話区間相槌頻度と好感度との関連性に基づいて、S530で計算した顧客発話区間相槌頻度pa'から、発話音声s(t)(t=0, 1, 2, …, T)の話者の好感度を推定する(S540)。
第1実施形態から第5実施形態では、それぞれ1つの特徴量を用いて好感度を推定したが、これらの特徴量の組み合わせを用いて好感度を推定するようにしてもよい。そこで、本実施形態では、第1実施形態から第5実施形態で用いた特徴量すべてを用いて好感度を推定する構成について説明する。
好感度推定部640は、好感度推定モデル680を用いて好感度を推定したが、好感度推定モデル680の代わりに、機械学習以外の方法で取得した、5つの発話音声の特徴量と話者の好感度との関連性に基づいて好感度を推定するようにしてもよい。つまり、好感度推定部540は、5つの特徴量と好感度との関連性に基づいて、S130、S430、S330、S230、S530で計算した特徴量から、発話音声s(t)(t=0, 1, 2, …, T)の話者の好感度を推定する(S640)。
第6実施形態では、第1実施形態から第5実施形態で用いた特徴量すべてを用いて好感度を推定する構成について説明したが、好感度推定に用いる特徴量の組合せはこれに限るものではない。これらの特徴量のうち、少なくとも1つの特徴量を用いて好感度推定を行うことができる。この場合、推定に用いる特徴量の計算に必要となる構成部、好感度推定部、記録部を含むように好感度推定装置を構成すればよい。例えば、これらの5つの特徴量のうち、1つを用いる場合は、それぞれ、第1実施形態から第5実施形態で説明した構成となる。また、発話音声の特徴量と話者の好感度との関連性は、以下のような性質を有する。
(1)好感度推定に用いる特徴量に、発話音声に現れる有声休止の頻度が含まれる場合、有声休止の頻度が小さい場合の方が大きい場合よりも話者の好感度が高いと推定されやすい。
(2)好感度推定に用いる特徴量に、発話音声に現れる話者による相槌の頻度が含まれる場合、相槌の頻度が大きい場合の方が小さい場合よりも話者の好感度が高いと推定されやすい。
(3)好感度推定に用いる特徴量に、発話音声に現れる敬語を修正した回数が含まれる場合、敬語を修正した回数が小さい場合の方が大きい場合よりも話者の好感度が高いと推定されやすい。
(4)好感度推定に用いる特徴量に、発話音声の語尾に現れる有声休止の頻度が含まれる場合、有声休止の頻度が小さい場合の方が大きい場合よりも話者の好感度が高いと推定されやすい。
(5)好感度推定に用いる特徴量に、第2発話音声の発話区間において発話音声に現れる話者による相槌の頻度が含まれる場合、相槌の頻度が大きい場合の方が小さい場合よりも話者の好感度が高いと推定されやすい。
図17は、複数のコールセンターにおける通話(およそ2000通話)について、オペレータの発話中の感謝の言葉(例えば、「ありがとうございます」)、謝罪の言葉(例えば、「申し訳ありません」)、恐縮の言葉(例えば、「恐れ入ります」や「恐縮ですが」)、言い淀みの言葉(例えば、「えーと」)の頻度と好感度の関係を調べた結果を示すものである。具体的には、好感度の高いオペレータと好感度の低いオペレータについてのこれらの言葉の頻度と、その頻度の差についてT検定による有意差が現れるか否かを調べた結果である。ここで、P値が0.05以下であるとき有意差があるといえる。図17を見ると、感謝の言葉、謝罪の言葉、恐縮の言葉については、好感度の高いオペレータの方が好感度の低いオペレータより多い一方で、言い淀みの言葉については、好感度の高いオペレータの方が好感度の低いオペレータより少ないことがわかる。また、謝罪の言葉、恐縮の言葉、言い淀みの言葉については、有意差があることもわかる。
好感度推定部740は、好感度推定モデル780を用いて好感度を推定したが、好感度推定モデル780の代わりに、機械学習以外の方法で取得した、発話音声の特徴量と話者の好感度との関連性に基づいて好感度を推定するようにしてもよい。つまり、好感度推定部740は、キーワード頻度と好感度との関連性に基づいて、S730で計算したキーワード頻度f(k)(k=1, 2, …, K)から、発話音声s(t)(t=0, 1, 2, …, T)の話者の好感度を推定する(S740)。
図20は、図17と同様、複数のコールセンターにおける通話を対象として、オペレータの発話を2〜4の区間に分割し、各分割区間における、好感度の高いオペレータと好感度の低いオペレータについてのキーワードの頻度の差について、T検定による有意差が現れるか否かを調べた結果である。図20を見ると、感謝の言葉は、全体(分割無しの場合)としては、好感度の高いオペレータと好感度の低いオペレータの間に有意差は現れないものの、発話を分割すると、発話後半で差が生じていることがわかる。つまり、2分割した場合は2/2の区間、3分割した場合は3/3の区間、4分割した場合は3/4の区間と4/4の区間で有意差がみられる。これは、好感度の高いオペレータ、好感度の低いオペレータいずれであっても発話前半では、感謝の言葉の頻度は同程度であるが、発話後半になると好感度の高いオペレータが好感度の低いオペレータより高い頻度で感謝の言葉を述べているために有意差が生じていると考えられる。同様に、謝罪の言葉については、発話を2分割した場合は1/2の区間、3分割した場合は1/3の区間、4分割した場合は1/4の区間で有意差がみられる。また、恐縮の言葉については、発話を2分割した場合は1/2の区間と2/2の区間、3分割した場合は1/3の区間と3/3の区間、4分割した場合は1/4の区間と4/4の区間で有意差がみられる。言い淀みの言葉については、発話を2分割した場合は2/2の区間、3分割した場合は2/3の区間と3/3の区間、4分割した場合は3/4の区間で有意差がみられる。
好感度推定部840は、好感度推定モデル880を用いて好感度を推定したが、好感度推定モデル880の代わりに、機械学習以外の方法で取得した、発話音声から生成した分割音声の特徴量と話者の好感度との関連性に基づいて好感度を推定するようにしてもよい。つまり、好感度推定部840は、キーワード頻度と好感度との関連性に基づいて、S730で計算したキーワード頻度f(i, k) (i=0, 1, …, I-1, k=1, 2, …, K)から、発話音声s(t)(t=0, 1, 2, …, T)の話者の好感度を推定する(S840)。
キーワードの属性及び分割数に応じて異なるキーワード頻度が高くなる区間に着目、当該分割区間の分割音声に現れるキーワードの頻度に基づいて好感度の推定を行うようにしてもよい。
声の高さの時間的変化について、好感度の高いオペレータと好感度の低いオペレータの間で違いがみられる。具体的には、顧客対応開始時点では、好感度の高いオペレータ、好感度の低いオペレータいずれも声の高さは一定しているが、時間が経過し、対応の後半になると、好感度の高いオペレータは声の高さを維持している一方で、好感度の低いオペレータは声の高さが変化してくる。
(参考非特許文献3:Florian Eyben, Martin Wollmer, Bjorn Schuller, “openSMILE: the munich versatile and fast open-source audio feature extractor”, Proceedings of the 18th ACM international conference on Multimedia (MM '10), pp.1459-1462, 2010.)
好感度推定部940は、好感度推定モデル980を用いて好感度を推定したが、好感度推定モデル980の代わりに、機械学習以外の方法で取得した、発話音声から生成した分割音声の特徴量と話者の好感度との関連性に基づいて好感度を推定するようにしてもよい。つまり、好感度推定部940は、音響特徴量と好感度との関連性に基づいて、S930で抽出した音響特徴量c(i)(i=0, 1, …, I-1)から、発話音声s(t)(t=0, 1, 2, …, T)の話者の好感度を推定する(S940)。
第8実施形態や第9実施形態では、発話音声を時間長で単純に等分割した分割音声の特徴量を用いて好感度を推定している。しかし、実際のコールセンターでのオペレータの発話は、「オープニング」、「用件確認」、「契約確認」、「用件対応」、「クロージング」などいくつかのフェーズで構成されている。「オープニング」や「クロージング」のような、オペレータによる対応がマニュアル化(テンプレート化)されている区間より、「用件対応」のように、その対応が個別の通話ごとに変わる区間(オペレータによる対応がマニュアル化(テンプレート化)されていない区間)の方が好感度により影響を与える。
(参考非特許文献4:Takaaki Fukutomi, Satoshi Kobashikawa, Taichi Asami, Tsubasa Shinozaki, Hirokazu Masataki and Satoshi Takahashi, “Extracting call-reason segments from contact center dialogs by using automatically acquired boundary expressions”, 2011 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP 2011), pp.5584-5587, 2011.)
好感度推定部1040は、好感度推定モデル1080を用いて好感度を推定したが、好感度推定モデル1080の代わりに、機械学習以外の方法で取得した、発話音声から生成した分割音声の特徴量と話者の好感度との関連性に基づいて好感度を推定するようにしてもよい。つまり、好感度推定部1040は、音響特徴量と好感度との関連性に基づいて、S930で抽出した音響特徴量c(i) (i=0, 1, …, I-1)から、発話音声s(t)(t=0, 1, 2, …, T)の話者の好感度を推定する(S1040)。
第8実施形態で用いたキーワード頻度と第9実施形態で用いた音響特徴量の組み合わせを用いて好感度を推定するようにしてもよい。そこで、本実施形態では、上記2つの特徴量を用いて好感度を推定する構成について説明する。
好感度推定部1140は、好感度推定モデル1180を用いて好感度を推定したが、好感度推定モデル1180の代わりに、機械学習以外の方法で取得した、発話音声から生成した分割音声の特徴量と話者の好感度との関連性に基づいて好感度を推定するようにしてもよい。つまり、好感度推定部1140は、音響特徴量とキーワード頻度の組と好感度との関連性に基づいて、S930で抽出した音響特徴量c(i)(i=0, 1, …, I-1)とS730で計算したキーワード頻度f(i, k) (i=0, 1, …, I-1, k=1, 2, …, K)から、発話音声s(t)(t=0, 1, 2, …, T)の話者の好感度を推定する(S1140)。
(1)好感度推定に用いる特徴量に、発話音声を時間により分割した分割音声に現れるキーワード(感謝、謝罪、恐縮、言い淀みのいずれかを表す言葉)の頻度が含まれる場合、キーワードが感謝を表す言葉である場合は、発話後半の区間の分割音声に現れるキーワードの頻度が大きい場合の方が小さい場合よりも話者の好感度が高いと推定されやすく、キーワードが謝罪を表す言葉である場合は、発話冒頭の区間の分割音声に現れるキーワードの頻度が大きい場合の方が小さい場合よりも話者の好感度が高いと推定されやすく、キーワードが恐縮を表す言葉である場合は、発話冒頭または発話最後の区間の分割音声に現れるキーワードの頻度が大きい場合の方が小さい場合よりも話者の好感度が高いと推定されやすく、キーワードが言い淀みを表す言葉である場合は、発話最後または発話最後の直前の何れかの区間の分割音声に現れるキーワードの頻度が小さい場合の方が大きい場合よりも話者の好感度が高いと推定されやすい。
(2)好感度推定に用いる特徴量に、発話音声を時間により分割した分割音声の声の高さに関する平均が含まれる場合、発話後半の区間の音響特徴量と発話前半の区間の音響特徴量の差が大きい場合の方が小さい場合よりも話者の好感度が低いと推定されやすい。
本発明の装置は、例えば単一のハードウェアエンティティとして、キーボードなどが接続可能な入力部、液晶ディスプレイなどが接続可能な出力部、ハードウェアエンティティの外部に通信可能な通信装置(例えば通信ケーブル)が接続可能な通信部、CPU(Central Processing Unit、キャッシュメモリやレジスタなどを備えていてもよい)、メモリであるRAMやROM、ハードディスクである外部記憶装置並びにこれらの入力部、出力部、通信部、CPU、RAM、ROM、外部記憶装置の間のデータのやり取りが可能なように接続するバスを有している。また必要に応じて、ハードウェアエンティティに、CD−ROMなどの記録媒体を読み書きできる装置(ドライブ)などを設けることとしてもよい。このようなハードウェア資源を備えた物理的実体としては、汎用コンピュータなどがある。
Claims (23)
- 発話音声の特徴量と話者の好感度との関連性に基づいて、発話音声から生成された特徴量から、前記発話音声の話者の好感度を推定する好感度推定部
を含む好感度推定装置であって、
前記特徴量は、発話音声に現れる有声休止の頻度である
好感度推定装置。 - 請求項1に記載の好感度推定装置であって、
前記関連性は、有声休止の頻度が小さい場合の方が大きい場合よりも話者の好感度が高いことを示すものとなりやすいように与えられる
ことを特徴とする好感度推定装置。 - 発話音声の特徴量と話者の好感度との関連性に基づいて、発話音声から生成された特徴量から、前記発話音声の話者の好感度を推定する好感度推定部
を含む好感度推定装置であって、
前記特徴量は、発話音声に現れる話者による相槌の頻度である
好感度推定装置。 - 請求項3に記載の好感度推定装置であって、
前記関連性は、発話音声に現れる話者による相槌の頻度が大きい場合の方が小さい場合よりも話者の好感度が高いことを示すものとなりやすいように与えられる
ことを特徴とする好感度推定装置。 - 発話音声の特徴量と話者の好感度との関連性に基づいて、発話音声から生成された特徴量から、前記発話音声の話者の好感度を推定する好感度推定部
を含む好感度推定装置であって、
前記特徴量は、発話音声に現れる敬語を修正した回数である
好感度推定装置。 - 請求項5に記載の好感度推定装置であって、
前記関連性は、発話音声に現れる敬語を修正した回数が小さい場合の方が大きい場合よりも話者の好感度が高いことを示すものとなりやすいように与えられる
ことを特徴とする好感度推定装置。 - 請求項1または2に記載の好感度推定装置であって、
前記有声休止は、発話音声の語尾に現れるものである
ことを特徴とする好感度推定装置。 - 発話音声の特徴量と話者の好感度との関連性に基づいて、発話音声から生成された特徴量から、前記発話音声の話者の好感度を推定する好感度推定部
を含む好感度推定装置であって、
前記特徴量は、発話音声に現れるキーワードの頻度であり、
前記関連性は、
キーワードが謝罪または恐縮を表す言葉である場合は、発話音声に現れるキーワードの頻度が大きい場合の方が小さい場合よりも話者の好感度が高いことを示すものとなりやすいように与えられ、
キーワードが言い淀みを表す言葉である場合は、発話音声に現れるキーワードの頻度が小さい場合の方が大きい場合よりも話者の好感度が高いことを示すものとなりやすいように与えられる
好感度推定装置。 - 発話音声の特徴量と話者の好感度との関連性に基づいて、発話音声から生成された特徴量から、前記発話音声の話者の好感度を推定する好感度推定部
を含む好感度推定装置であって、
前記特徴量は、発話音声に現れるキーワードの頻度であり、
前記キーワードは、恐縮、言い淀みのいずれかを表す言葉である
好感度推定装置。 - 発話音声の特徴量と話者の好感度との関連性に基づいて、発話音声から生成された特徴量から、前記発話音声の話者の好感度を推定する好感度推定部
を含む好感度推定装置であって、
前記特徴量は、発話音声を時間により分割した分割音声に現れるキーワードの頻度であり、
前記キーワードは、感謝、謝罪、恐縮、言い淀みのいずれかを表す言葉であり、
前記関連性は、
キーワードが感謝を表す言葉である場合は、発話後半の区間の分割音声に現れるキーワードの頻度が大きい場合の方が小さい場合よりも話者の好感度が高いことを示すものとなりやすいように与えられ、
キーワードが謝罪を表す言葉である場合は、発話冒頭の区間の分割音声に現れるキーワードの頻度が大きい場合の方が小さい場合よりも話者の好感度が高いことを示すものとなりやすいように与えられ、
キーワードが恐縮を表す言葉である場合は、発話冒頭または発話最後の区間の分割音声に現れるキーワードの頻度が大きい場合の方が小さい場合よりも話者の好感度が高いことを示すものとなりやすいように与えられ、
キーワードが言い淀みを表す言葉である場合は、発話最後または発話最後の直前の何れかの区間の分割音声に現れるキーワードの頻度が小さい場合の方が大きい場合よりも話者の好感度が高いことを示すものとなるように与えられる
好感度推定装置。 - 発話音声の特徴量と話者の好感度との関連性に基づいて、発話音声から生成された特徴量から、前記発話音声の話者の好感度を推定する好感度推定部
を含む好感度推定装置であって、
前記特徴量は、発話音声を時間により分割した分割音声の音響特徴量であり、
前記音響特徴量は、声の高さに関する平均またはジッタに関する統計量であり、
前記関連性は、
発話後半の区間の音響特徴量と発話前半の区間の音響特徴量の差が大きい場合の方が小さい場合よりも話者の好感度が低いことを示すものとなりやすいように与えられる
好感度推定装置。 - 発話音声の特徴量と話者の好感度との関連性に基づいて、発話音声から生成された特徴量から、発話音声から生成された発話音声の話者の好感度を推定する好感度推定部
を含む好感度推定装置であって、
前記特徴量は、発話音声をフェーズにより分割した分割音声の音響特徴量であり、
前記関連性は、
フェーズがオペレータによる対応がマニュアル化されていない区間である場合の分割音声の音響特徴量の方が、フェーズがオペレータによる対応がマニュアル化されている区間である場合の分割音声の音響特徴量よりも話者の好感度に影響を与えるものとなりやすいように与えられる
好感度推定装置。 - 発話音声の特徴量と話者の好感度との関連性に基づいて、発話音声から生成された特徴量から、前記発話音声の話者の好感度を推定する好感度推定部
を含む好感度推定装置であって、
前記特徴量は、発話音声をオペレータによる対応がマニュアル化されていない区間とオペレータによる対応がマニュアル化されている区間とに区別するように分割した分割音声の音響特徴量である
好感度推定装置。 - 好感度推定装置が、発話音声の特徴量と話者の好感度との関連性に基づいて、発話音声から生成された特徴量から、前記発話音声の話者の好感度を推定する好感度推定ステップ
を含む好感度推定方法であって、
前記特徴量は、発話音声に現れる有声休止の頻度である
好感度推定方法。 - 好感度推定装置が、発話音声の特徴量と話者の好感度との関連性に基づいて、発話音声から生成された特徴量から、前記発話音声の話者の好感度を推定する好感度推定ステップ
を含む好感度推定方法であって、
前記特徴量は、発話音声に現れる話者による相槌の頻度である
好感度推定方法。 - 好感度推定装置が、発話音声の特徴量と話者の好感度との関連性に基づいて、発話音声から生成された特徴量から、前記発話音声の話者の好感度を推定する好感度推定ステップ
を含む好感度推定方法であって、
前記特徴量は、発話音声に現れる敬語を修正した回数である
好感度推定方法。 - 好感度推定装置が、発話音声の特徴量と話者の好感度との関連性に基づいて、発話音声から生成された特徴量から、前記発話音声の話者の好感度を推定する好感度推定ステップ
を含む好感度推定方法であって、
前記特徴量は、発話音声に現れるキーワードの頻度であり、
前記関連性は、
キーワードが謝罪または恐縮を表す言葉である場合は、発話音声に現れるキーワードの頻度が大きい場合の方が小さい場合よりも話者の好感度が高いことを示すものとなりやすいように与えられ、
キーワードが言い淀みを表す言葉である場合は、発話音声に現れるキーワードの頻度が小さい場合の方が大きい場合よりも話者の好感度が高いことを示すものとなりやすいように与えられる
好感度推定方法。 - 好感度推定装置が、発話音声の特徴量と話者の好感度との関連性に基づいて、発話音声から生成された特徴量から、前記発話音声の話者の好感度を推定する好感度推定ステップ
を含む好感度推定方法であって、
前記特徴量は、発話音声に現れるキーワードの頻度であり、
前記キーワードは、恐縮、言い淀みのいずれかを表す言葉である
好感度推定方法。 - 好感度推定装置が、発話音声の特徴量と話者の好感度との関連性に基づいて、発話音声から生成された特徴量から、前記発話音声の話者の好感度を推定する好感度推定ステップ
を含む好感度推定方法であって、
前記特徴量は、発話音声を時間により分割した分割音声に現れるキーワードの頻度であり、
前記キーワードは、感謝、謝罪、恐縮、言い淀みのいずれかを表す言葉であり、
前記関連性は、
キーワードが感謝を表す言葉である場合は、発話後半の区間の分割音声に現れるキーワードの頻度が大きい場合の方が小さい場合よりも話者の好感度が高いことを示すものとなりやすいように与えられ、
キーワードが謝罪を表す言葉である場合は、発話冒頭の区間の分割音声に現れるキーワードの頻度が大きい場合の方が小さい場合よりも話者の好感度が高いことを示すものとなりやすいように与えられ、
キーワードが恐縮を表す言葉である場合は、発話冒頭または発話最後の区間の分割音声に現れるキーワードの頻度が大きい場合の方が小さい場合よりも話者の好感度が高いことを示すものとなりやすいように与えられ、
キーワードが言い淀みを表す言葉である場合は、発話最後または発話最後の直前の何れかの区間の分割音声に現れるキーワードの頻度が小さい場合の方が大きい場合よりも話者の好感度が高いことを示すものとなるように与えられる
好感度推定方法。 - 好感度推定装置が、発話音声の特徴量と話者の好感度との関連性に基づいて、発話音声から生成された特徴量から、前記発話音声の話者の好感度を推定する好感度推定ステップ
を含む好感度推定方法であって、
前記特徴量は、発話音声を時間により分割した分割音声の音響特徴量であり、
前記音響特徴量は、声の高さに関する平均またはジッタに関する統計量であり、
前記関連性は、
発話後半の区間の音響特徴量と発話前半の区間の音響特徴量の差が大きい場合の方が小さい場合よりも話者の好感度が低いことを示すものとなりやすいように与えられる
好感度推定方法。 - 好感度推定装置が、発話音声の特徴量と話者の好感度との関連性に基づいて、発話音声から生成された特徴量から、前記発話音声の話者の好感度を推定する好感度推定ステップ
を含む好感度推定方法であって、
前記特徴量は、発話音声をフェーズにより分割した分割音声の音響特徴量であり、
前記関連性は、
フェーズがオペレータによる対応がマニュアル化されていない区間である場合の分割音声の音響特徴量の方が、フェーズがオペレータによる対応がマニュアル化されている区間である場合の分割音声の音響特徴量よりも話者の好感度に影響を与えるものとなりやすいように与えられる
好感度推定方法。 - 好感度推定装置が、発話音声の特徴量と話者の好感度との関連性に基づいて、発話音声から生成された特徴量から、前記発話音声の話者の好感度を推定する好感度推定ステップ
を含む好感度推定方法であって、
前記特徴量は、発話音声をオペレータによる対応がマニュアル化されていない区間とオペレータによる対応がマニュアル化されている区間とに区別するように分割した分割音声の音響特徴量である
好感度推定方法。 - 請求項1ないし13のいずれか1項に記載の好感度推定装置としてコンピュータを機能させるためのプログラム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017229980 | 2017-11-30 | ||
JP2017229980 | 2017-11-30 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019101399A JP2019101399A (ja) | 2019-06-24 |
JP6859283B2 true JP6859283B2 (ja) | 2021-04-14 |
Family
ID=66976945
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018028932A Active JP6859283B2 (ja) | 2017-11-30 | 2018-02-21 | 好感度推定装置、好感度推定方法、プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6859283B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7528638B2 (ja) | 2020-08-26 | 2024-08-06 | トヨタ自動車株式会社 | コミュニケーションシステム |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3848076B2 (ja) * | 1999-11-18 | 2006-11-22 | 株式会社東芝 | 仮想生物システム及び仮想生物システムにおけるパタン学習方法 |
JP3705587B2 (ja) * | 2001-11-07 | 2005-10-12 | 松下電器産業株式会社 | 情報配信システムおよび情報配信方法 |
WO2014069121A1 (ja) * | 2012-10-31 | 2014-05-08 | 日本電気株式会社 | 会話分析装置及び会話分析方法 |
JP6192126B2 (ja) * | 2015-04-16 | 2017-09-06 | トヨタ自動車株式会社 | 着信通知制御システム |
JP6585733B2 (ja) * | 2015-11-17 | 2019-10-02 | 株式会社ソニー・インタラクティブエンタテインメント | 情報処理装置 |
JP6751305B2 (ja) * | 2016-03-28 | 2020-09-02 | 株式会社富士通エフサス | 分析装置、分析方法および分析プログラム |
-
2018
- 2018-02-21 JP JP2018028932A patent/JP6859283B2/ja active Active
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7528638B2 (ja) | 2020-08-26 | 2024-08-06 | トヨタ自動車株式会社 | コミュニケーションシステム |
Also Published As
Publication number | Publication date |
---|---|
JP2019101399A (ja) | 2019-06-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11755756B1 (en) | Sensitive data management | |
KR101942521B1 (ko) | 음성 엔드포인팅 | |
US11005995B2 (en) | System and method for performing agent behavioral analytics | |
US10839335B2 (en) | Call center agent performance scoring and sentiment analytics | |
US10592611B2 (en) | System for automatic extraction of structure from spoken conversation using lexical and acoustic features | |
WO2010021368A1 (ja) | 言語モデル作成装置、言語モデル作成方法、音声認識装置、音声認識方法、プログラム、および記録媒体 | |
US10096315B2 (en) | Acoustic model training | |
US11354754B2 (en) | Generating self-support metrics based on paralinguistic information | |
JPWO2019017462A1 (ja) | 満足度推定モデル学習装置、満足度推定装置、満足度推定モデル学習方法、満足度推定方法、およびプログラム | |
JP6812381B2 (ja) | 音声認識精度劣化要因推定装置、音声認識精度劣化要因推定方法、プログラム | |
Buß et al. | Evaluation and optimisation of incremental processors | |
JP2014235345A (ja) | 音声処理装置、方法およびプログラム | |
Kopparapu | Non-linguistic analysis of call center conversations | |
JP2012248065A (ja) | 怒り感情推定装置、怒り感情推定方法およびそのプログラム | |
CN109300468B (zh) | 一种语音标注方法及装置 | |
JP6996570B2 (ja) | 緊急度推定装置、緊急度推定方法、プログラム | |
CN104700831B (zh) | 分析音频文件的语音特征的方法和装置 | |
JP2014002237A (ja) | 音声認識単語追加装置とその方法とプログラム | |
JP6859283B2 (ja) | 好感度推定装置、好感度推定方法、プログラム | |
US9697825B2 (en) | Audio recording triage system | |
Tarján et al. | A bilingual study on the prediction of morph-based improvement. | |
CN112837688B (zh) | 语音转写方法、装置、相关系统及设备 | |
JP2009075249A (ja) | 書き起こし内容確認方法、書き起こし内容確認装置、コンピュータプログラム | |
JP7028203B2 (ja) | 音声認識装置、音声認識方法、プログラム | |
CN108364654B (zh) | 语音处理方法、介质、装置和计算设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200219 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20201117 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20201201 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210122 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210323 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210325 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6859283 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |