JP2017116716A - コミュニケーションスキル評価システム、コミュニケーションスキル評価装置及びコミュニケーションスキル評価プログラム - Google Patents
コミュニケーションスキル評価システム、コミュニケーションスキル評価装置及びコミュニケーションスキル評価プログラム Download PDFInfo
- Publication number
- JP2017116716A JP2017116716A JP2015251546A JP2015251546A JP2017116716A JP 2017116716 A JP2017116716 A JP 2017116716A JP 2015251546 A JP2015251546 A JP 2015251546A JP 2015251546 A JP2015251546 A JP 2015251546A JP 2017116716 A JP2017116716 A JP 2017116716A
- Authority
- JP
- Japan
- Prior art keywords
- participant
- utterance
- probability
- conversation
- next speaker
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Telephonic Communication Services (AREA)
Abstract
Description
従来からある次話者及び発話開始タイミングの予測技術は、会話の参加者の視線、呼吸、頭部動作などの非言語情報と、話者交替の状況の一般的なルールをモデル化したものである。従って、次話者及び発話開始タイミングの予測結果が、実際の次話者や発話開始タイミングと合致しないということは、一般的なルールを逸脱した状況が発生したことを意味する。よって、予測結果に反して発話を行った人物や、発話を行えなかった人物は、一般的な会話のルールに乗っ取って発話を行えないことから、コミュニケーションスキル(以下、「スキル」とも記載する。)が低いと考えられる。
受信部51は、音声入力装置2から会話中の参加者の音声データを受信し、参加者の識別情報と、その参加者の音声データとを対応付けた音声情報を記憶部52に書き込む。音声データには、音声が得られた時刻の情報が含まれる。また、受信部51は、計測装置3から会話中の各参加者の非言語行動に関する計測結果を示すデータを受信し、参加者の識別情報と、その参加者の時系列の非言語行動の計測結果のデータとを対応付けた計測情報を記憶部52に書き込む。
第1パラメータ算出部551は、各参加者の第1パラメータS1を算出する。参加者Uiの第1パラメータS1を第1パラメータSi 1と記載する。第1パラメータSi 1は、参加者Uiが発話した際に、次話者推定部54が推定したその発話時刻における次話者確率Pi n+1(t)がどれくらい高かったかを示す。第1パラメータSi 1は、参加者Uiが発話者である発話IPUi 2〜IPUi m+1(mはN以下の整数)を利用すると、以下の式(1)のように算出される。式(1)において、ti j+1は、参加者Uiが発話者である発話IPUi j+1の発話開始時刻である。右辺のΣの中の式は、参加者Uiが発話IPUj+1を開始した時刻ti j+1の次話者確率Pi j+1(t)がどれくらい高かったかを示す。1/Lは、次話者確率の期待値である。なお、以下の式(1)の右辺の算出結果を発話数mにより除算した値を、第1パラメータSi 1として用いてもよい。第1パラメータSi 1の値が大きいほど、参加者Uiのコミュニケーションスキルが高いことを表す。
コミュニケーションスキル評価システム1は、会話中の各参加者の音声のデータ及び非言語行動のデータと、会話中の映像データを収集する(ステップS105)。すなわち、音声入力装置2は、会話中の各参加者の音声のデータを送信し、計測装置3は、会話中に計測した各参加者の非言語行動のデータを送信する。受信部51は、音声入力装置2から受信した参加者の音声のデータに基づいて音声情報を記憶部52に書き込む。さらに、受信部51は、計測装置3から受信した各参加者の非言語行動の計測結果を示すデータに基づいて計測情報を記憶部52に書き込む。
また、コミュニケーションスキル評価装置は、参加者が発話したときの当該参加者の次話者確率と、次話者確率の期待値との乖離に基づき、参加者が発話したときの当該参加者の次話者確率が高いほど、コミュニケーションスキルが高いことを表す値となるように当該参加者のスキル判別パラメータの値を算出する。
また、コミュニケーションスキル評価装置は、参加者が発話しなかったときの当該参加者の次話者確率と、次話者確率の期待値との乖離に基づいて、参加者が発話しなかったときの当該参加者の次話者確率が低いほど、コミュニケーションスキルが高いことを表す値となるように当該参加者のスキル判別パラメータの値を算出する。
(参考文献2)石井亮,外4名,“複数人対話における注視遷移パターンに基づく次話者と発話タイミングの予測”,人工知能学会研究会資料,SIG-SLUD-B301-06, pp.27-34, 2013.
会話の参加者の呼吸動作は次発話者と発話のタイミングに深い関連性がある。このことを利用して、会話の参加者の呼吸動作をリアルタイムに計測し、計測された呼吸動作から発話の開始直前に行われる特徴的な呼吸動作を検出し、この呼吸動作を基に次発話者とその発話タイミングを高精度に算出する。具体的には、発話開始直前におこなわれる呼吸動作の特徴として、発話を行っている発話者は、継続して発話する際(発話者継続時)には、発話終了直後にすぐに急激に息を吸い込む。逆に発話者が次に発話を行わない際(発話者交替時)には、発話者継続時に比べて、発話終了時から間を空けて、ゆっくりと息を吸い込む。また、発話者交替時に、次に発話をおこなう次発話者は、発話を行わない非発話者に比べて大きく息を吸い込む。このような発話の前におこなわれる呼吸は、発話開始に対しておおよそ決められたタイミングで行われる。このように、発話の直前に次発話者は特徴的な息の吸い込みを行うため、このような息の吸い込みの情報は、次発話者とその発話タイミングを予測するのに有用である。本次話者推定技術では、人物の息の吸い込みに着目し、息の吸い込み量や吸い込み区間の長さ、タイミングなどの情報を用いて、次発話者と発話タイミングを予測する。
・MINa,k:参加者Paの息の吸い込み開始時のRSP値Ra,t、すなわち、息の吸い込み区間Ia,kのRSP値Ra,tの最小値。
・MAXa,k:参加者Paの息の吸い込み終了時のRSP値Ra,t、すなわち、息の吸い込み区間Ia,kのRSP値Ra,tの最大値。
・AMPa,k:参加者Paの息の吸い込み区間Ia,kのRSP値Ra,tの振幅、すなわち、MAXa,k−MINa,kで算出される値。吸い込み区間Ia,kでの息の吸い込み量を表す。
・DURa,k:参加者Paの息の吸い込み区間Ia,kの長さ、すなわち、息の吸い込み区間Ia,kの終了位置の離散時刻te(k)から開始位置の離散時刻ts(k)を減じて得られる値te(k)−ts(k)。
・SLOa,k:参加者Paの息の吸い込み区間Ia,kにおけるRSP値Ra,tの単位時間当たりの傾きの平均値、すなわち、AMPa,k/DURa,kで算出される値。吸い込み区間Ia,kでの息の吸い込み量の時間変化を表す。
・INT1a,k:手前の発話区間Ukの終了時刻tue(k)(発話区間末)から参加者Paの息の吸い込みが開始されるまでの間隔、すなわち、息の吸い込み区間Ia,kの開始位置の離散時刻ts(k)から発話区間Ukの終了時刻tue(k)を減じて得られる値ts(k)−tue(k)。発話区間Ukと吸い込み区間Ia,kとの時間関係を表す。
・INT2a,k:参加者Paの息の吸い込み終了時から次発話者の発話区間Uk+1が開始されるまでの間隔、すなわち、次発話者の発話区間Uk+1の開始時刻tus(k+1)から息の吸い込み区間Ia,kの終了位置の離散時刻te(k)を減じて得られる値tus(k+1)−te(k)。発話区間Uk+1と吸い込み区間Ia,kとの時間関係を表す。パラメータλ’a,kにINT2a,kを加えたものをパラメータλa,kと表記する。
上述した実施形態のコミュニケーションスキル評価装置5の次話者推定部54が推定する参加者Uiの次話者確率Pi n+1(t)は、参加者Uiが本次話者推定技術における参加者Paである場合、確率P1a×確率P2a(t)により算出される。
視線行動をさらに利用する場合、各参加者Pa(ただし、a=1,…,A)には注視対象検出装置がさらに装着される。注視対象検出装置は、参加者Paが誰を注視しているか(注視対象)を検出し、参加者Paおよび各離散時刻tでの注視対象Ga,tを表す情報を推定装置に送る。推定装置は、注視対象情報G1,t,…,GA,t、発話区間Uk、および話者情報Pukを入力とし、発話区間終了前後における注視対象ラベル情報θv,k(ただし、v=1,…,V、Vは注視対象ラベルの総数)を生成する。注視対象ラベル情報は、発話区間Ukの終了時点Tseに対応する時間区間における参加者の注視対象を表す情報である。ここでは、終了時点Tseを含む有限の時間区間における参加者Paの注視対象をラベル付けした注視対象ラベル情報θv,kを例示する。この場合、例えば、発話区間Ukの終了時点Tseよりも前の時点Tse−Tbから終了時点Tseよりも後の時点Tse+Taまでの区間に出現した注視行動を扱う。Tb,Taは0以上の任意の値でよいが、目安として、Tbは0秒〜2.0秒、Taは0秒〜3.0秒程度にするのが適当である。
・ラベルS:話者(すなわち、話者である参加者Pukを表す)
・ラベルLξ:非話者(ただし、ξは互いに異なる非話者である参加者を識別し、ξ=1,…,A−1である。例えば、ある参加者が、非話者P2、非話者P3、の順に注視をしていたとき、非話者P2にL1というラベル、非話者P3にL2というラベルが割り当てられる。)
・ラベルX:誰も見ていない
・INT1(=ET_RGL−ST_RGL):注視対象ラベルRGLの開始時刻ST_RGLと終了時刻ET_RGLの間隔
・INT2(=ST_U−ST_RGL):注視対象ラベルRGLの開始時刻ST_RGLが発話区間の開始時刻ST_Uよりもどれくらい前であったか
・INT3(=ET_U−ST_RGL):注視対象ラベルRGLの開始時刻ST_RGLが発話区間の終了時刻ET_Uよりもどれくらい前であったか
・INT4(=ET_RGL−ST_U):注視対象ラベルRGLの終了時刻ET_RGLが発話区間の開始時刻ST_Uよりもどれくらい後であったか
・INT5(=ET_U−ET_RGL):注視対象ラベルRGLの終了時刻ET_RGLが発話区間の終了時刻ET_Uよりもどれくらい前であったか
・INT6(=ST_RGL−ST_RGL’):注視対象ラベルRGLの開始時刻ST_RGLが他の注視対象ラベルRGL’の開始時刻ST_RGL’よりもどれくらい後であったか
・INT7(=ET_RGL’−ST_RGL):注視対象ラベルRGLの開始時刻ST_RGLが他の注視対象ラベルRGL’の終了時刻ET_RGL’よりもどれくらい前であったか
・INT8(=ET_RGL−ST_RGL’):注視対象ラベルRGLの終了時刻ET_RGLが注視対象ラベルRGL’の開始時刻ST_RGL’よりもどれくらい後であったか
・INT9(=ET_RGL−ET_RGL’):注視対象ラベルRGLの終了時刻ET_RGLが注視対象ラベルRGL’の終了時刻ET_RGL’よりもどれくらい後であったか
・INT1=ET_SL1−ST_SL1
・INT2=ST_U−ST_SL1
・INT3=ET_U−ST_SL1
・INT4=ET_SL1−ST_U
・INT5=ET_U−ET_SL1
・INT6=ST_SL1−ST_LL1
・INT7=ET_LL1−ST_SL1
・INT8=ET_SL1−ST_LL1
・INT9=ET_SL1−ET_LL1
2 音声入力装置
3 計測装置
5 コミュニケーションスキル評価装置
51 受信部
52 記憶部
53 発話区間検出部
54 次話者推定部
55 評価部
551 第1パラメータ算出部
552 第2パラメータ算出部
553 評価結果出力部
Claims (7)
- 会話中の参加者の音声データを入力する音声入力部と、
会話中の前記参加者の非言語行動を計測する計測部と、
前記音声データに基づいて各発話の開始及び終了の時刻と発話した参加者とを検出する発話区間検出部と、
前記計測部による計測結果に基づいて、会話中の各発話の終了後に前記参加者それぞれが次に発話を行う確率である次話者確率を推定する次話者推定部と、
前記参加者のコミュニケーションスキルを定量的に表すスキル判別パラメータの値を、会話中に前記参加者が発話したとき又は前記参加者が発話しなかったときの前記参加者の前記次話者確率に基づいて算出する評価部と、
を備えることを特徴とするコミュニケーションスキル評価システム。 - 会話中の参加者の音声データに基づいて各発話の開始及び終了の時刻と発話した参加者とを検出する発話区間検出部と、
前記参加者の会話中の非言語行動の計測結果に基づいて、会話中の各発話の終了後に前記参加者それぞれが次に発話を行う確率である次話者確率を推定する次話者推定部と、
前記参加者のコミュニケーションスキルを定量的に表すスキル判別パラメータの値を、会話中に前記参加者が発話したとき又は前記参加者が発話しなかったときの前記参加者の前記次話者確率に基づいて算出する評価部と、
を備えることを特徴とするコミュニケーションスキル評価装置。 - 前記評価部は、前記参加者が発話したときの当該参加者の前記次話者確率が高いほど、コミュニケーションスキルが高いことを表す値となるように当該参加者の前記スキル判別パラメータの値を算出する、
ことを特徴とする請求項2に記載のコミュニケーションスキル評価装置。 - 前記評価部は、前記参加者が発話したときの当該参加者の前記次話者確率と、次話者確率の期待値との乖離に基づいて当該参加者の前記スキル判別パラメータの値を算出する、
ことを特徴とする請求項3に記載のコミュニケーションスキル評価装置。 - 前記評価部は、前記参加者が発話しなかったときの当該参加者の前記次話者確率が低いほど、コミュニケーションスキルが高いことを表す値となるように当該参加者の前記スキル判別パラメータの値を算出する、
ことを特徴とする請求項2から請求項4のいずれか一項に記載のコミュニケーションスキル評価装置。 - 前記評価部は、前記参加者が発話しなかったときの当該参加者の前記次話者確率と、次話者確率の期待値との乖離に基づいて当該参加者の前記スキル判別パラメータの値を算出する、
ことを特徴とする請求項5に記載のコミュニケーションスキル評価装置。 - コンピュータに、
会話中の参加者の音声データに基づいて各発話の開始及び終了の時刻と発話者とを検出する発話区間検出ステップと、
前記参加者の会話中の非言語行動の計測結果に基づいて、会話中の各発話の終了後に前記参加者それぞれが次に発話を行う確率である次話者確率を推定する次話者推定ステップと、
前記参加者のコミュニケーションスキルを定量的に表すスキル判別パラメータの値を、会話中に前記参加者が発話したとき又は前記参加者が発話しなかったときの前記参加者の前記次話者確率に基づいて算出する評価ステップと、
を実行させるためのコミュニケーションスキル評価プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015251546A JP6363986B2 (ja) | 2015-12-24 | 2015-12-24 | コミュニケーションスキル評価システム、コミュニケーションスキル評価装置及びコミュニケーションスキル評価プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015251546A JP6363986B2 (ja) | 2015-12-24 | 2015-12-24 | コミュニケーションスキル評価システム、コミュニケーションスキル評価装置及びコミュニケーションスキル評価プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017116716A true JP2017116716A (ja) | 2017-06-29 |
JP6363986B2 JP6363986B2 (ja) | 2018-07-25 |
Family
ID=59234724
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015251546A Active JP6363986B2 (ja) | 2015-12-24 | 2015-12-24 | コミュニケーションスキル評価システム、コミュニケーションスキル評価装置及びコミュニケーションスキル評価プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6363986B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019093392A1 (ja) * | 2017-11-10 | 2019-05-16 | 日本電信電話株式会社 | コミュニケーションスキル評価システム、装置、方法、及びプログラム |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010536053A (ja) * | 2007-07-06 | 2010-11-25 | ゼロ・トゥ・ワン・テクノロジー | 電子的に会話を解析する方法および対応するシステム |
US20140297277A1 (en) * | 2013-03-28 | 2014-10-02 | Educational Testing Service | Systems and Methods for Automated Scoring of Spoken Language in Multiparty Conversations |
JP2014238525A (ja) * | 2013-06-10 | 2014-12-18 | 日本電信電話株式会社 | 推定装置、推定方法、およびプログラム |
-
2015
- 2015-12-24 JP JP2015251546A patent/JP6363986B2/ja active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010536053A (ja) * | 2007-07-06 | 2010-11-25 | ゼロ・トゥ・ワン・テクノロジー | 電子的に会話を解析する方法および対応するシステム |
US20140297277A1 (en) * | 2013-03-28 | 2014-10-02 | Educational Testing Service | Systems and Methods for Automated Scoring of Spoken Language in Multiparty Conversations |
JP2014238525A (ja) * | 2013-06-10 | 2014-12-18 | 日本電信電話株式会社 | 推定装置、推定方法、およびプログラム |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019093392A1 (ja) * | 2017-11-10 | 2019-05-16 | 日本電信電話株式会社 | コミュニケーションスキル評価システム、装置、方法、及びプログラム |
JPWO2019093392A1 (ja) * | 2017-11-10 | 2020-10-22 | 日本電信電話株式会社 | コミュニケーションスキル評価システム、装置、方法、及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP6363986B2 (ja) | 2018-07-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6923827B2 (ja) | コミュニケーションスキル評価システム、装置、方法、及びプログラム | |
Pentland | Social signal processing [exploratory DSP] | |
Ishii et al. | Analysis of respiration for prediction of" who will be next speaker and when?" in multi-party meetings | |
JP2017118364A (ja) | コミュニケーションシステム、コミュニケーション装置およびコミュニケーションプログラム | |
US9876901B1 (en) | Conversational call quality evaluator | |
JP6397250B2 (ja) | 集中度推定装置、方法及びプログラム | |
WO2020148920A1 (ja) | 情報処理装置、情報処理方法、及び情報処理プログラム | |
JP5989603B2 (ja) | 推定装置、推定方法、およびプログラム | |
JP2017009825A (ja) | 会話状況分析装置および会話状況分析方法 | |
Włodarczak et al. | Respiratory turn-taking cues | |
JP2018077791A (ja) | 推定方法及び推定システム | |
JP6363987B2 (ja) | 音声処理システム、音声処理装置および音声処理プログラム | |
JP2018171683A (ja) | ロボットの制御プログラム、ロボット装置、及びロボットの制御方法 | |
Byun et al. | Honest signals in video conferencing | |
JP6480351B2 (ja) | 発話制御システム、発話制御装置及び発話制御プログラム | |
JP6383349B2 (ja) | コミュニケーションスキル評価システム、コミュニケーションスキル評価装置及びコミュニケーションスキル評価プログラム | |
JP6363986B2 (ja) | コミュニケーションスキル評価システム、コミュニケーションスキル評価装置及びコミュニケーションスキル評価プログラム | |
JP6445473B2 (ja) | 会話支援システム、会話支援装置及び会話支援プログラム | |
JP2016042345A (ja) | 推定装置、その方法およびプログラム | |
JP7364348B2 (ja) | サービス提供装置、サービス提供システム、および、サービス提供方法 | |
JP6335157B2 (ja) | 会話支援システム、会話支援装置及び会話支援プログラム | |
Tahir et al. | Real-time sociometrics from audio-visual features for two-person dialogs | |
Lu et al. | Prediction of head motion from speech waveforms with a canonical-correlation-constrained autoencoder | |
Chen et al. | Inference of conversation partners by cooperative acoustic sensing in smartphone networks | |
Brueckner et al. | Spotting social signals in conversational speech over IP: A deep learning perspective |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20170828 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20180613 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20180626 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180629 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6363986 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |