JP4437224B2 - 同調度検出装置および同調度検出プログラム - Google Patents

同調度検出装置および同調度検出プログラム Download PDF

Info

Publication number
JP4437224B2
JP4437224B2 JP2004074781A JP2004074781A JP4437224B2 JP 4437224 B2 JP4437224 B2 JP 4437224B2 JP 2004074781 A JP2004074781 A JP 2004074781A JP 2004074781 A JP2004074781 A JP 2004074781A JP 4437224 B2 JP4437224 B2 JP 4437224B2
Authority
JP
Japan
Prior art keywords
capturing
comparison
utterance
voice
subject
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2004074781A
Other languages
English (en)
Other versions
JP2005265982A (ja
Inventor
紀子 鈴木
恭弘 片桐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ATR Advanced Telecommunications Research Institute International
Original Assignee
ATR Advanced Telecommunications Research Institute International
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ATR Advanced Telecommunications Research Institute International filed Critical ATR Advanced Telecommunications Research Institute International
Priority to JP2004074781A priority Critical patent/JP4437224B2/ja
Publication of JP2005265982A publication Critical patent/JP2005265982A/ja
Application granted granted Critical
Publication of JP4437224B2 publication Critical patent/JP4437224B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Description

この発明は、同調度検出装置または同調度検出プログラムに関し、特にたとえば、2人の被験者の対話の同調度を検出する、同調度検出装置または同調度検出プログラムに関する。
従来のこの種の同調度検出方法が、非特許文献1および非特許文献2に開示されている。この従来技術は、子供がコンピュータと対話を行う際に、コンピュータが出力する対話パターンの変化に対して子供の反応がどのように変化(同調)するかを検出しようとするものである。
Courtney Darves and Sharon Oviatt,"Adaptation of Users’ Spoken Dialogue Patterns in a Conversational Interface",アメリカ合衆国,2002年9月17日 Rachel Coulston, Sharon Oviatt and Courtney Darves, "Amplitude convergence in children’s conversational speech with animated personas", アメリカ合衆国,2002年9月17日
しかし、従来技術では、コンピュータと子供との同調度を検出するもので、またその同調度の検出はリアルタイム処理ではなく、オフライン処理(バッチ処理)にて対話後に一括して行われる。したがって、対話の同調度をリアルタイムで把握することはできない。
それゆえに、この発明の主たる目的は、コンピュータと人との対話ではなく、人間同士の対話の同調度をリアルタイムで把握することができる、同調度検出装置または同調度検出プログラムを提供することである。
請求項1の発明に従う同調度検出装置は、第1被験者の発話音声である第1発話音声を取り込む第1取り込み手段、第1被験者と対話する第2被験者の発話音声である第2発話音声を取り込む第2取り込み手段、第1発話音声の韻律パラメータ値と第2発話音声の韻律パラメータ値との差分を閾値と比較する比較手段、および比較手段の比較結果に応じて異なるメッセージを出力する出力手段を備える。
第1被験者および第2被験者が対話するとき、第1被験者の第1発話音声および第2被験者の第2発話音声は、第1取り込み手段および第2取り込み手段によってそれぞれ取り込まれる。第1発話音声の韻律パラメータ値と第2発話音声の韻律パラメータ値との差分は、比較手段によって閾値と比較される。出力手段によって出力されるメッセージは、比較手段の比較結果に応じて異なる。これによって、第1被験者および第2被験者の対話の同調度をリアルタイムで把握することができる。
請求項2の発明に従う同調度検出装置は、請求項1に従属し、韻律パラメータ値は声量,発話速度および応答遅れ時間の少なくとも1つを含む。韻律パラメータを増やすことによって、対話の同調度の検出精度を向上させることができる。
請求項3の発明に従う同調度検出装置は、請求項2に従属し、比較手段は同じ韻律パラメータ毎に比較を行い、出力手段は、少なくとも1つの比較結果が所定条件を満たすとき第1メッセージを出力する第1メッセージ出力手段、および全ての比較結果が所定条件を満たさないとき第2メッセージを出力する第2メッセージ出力手段を含む。これによって、いずれか1つの韻律パラメータに関する比較結果が所定条件を満たされたときに、同調が確保されたとみなされ、第1メッセージが出力される。
請求項4の発明に従う同調度検出装置は、請求項2または3に従属し、比較手段は、応答遅れ時間の比較に優先して声量の比較を行い、声量の比較に優先して発話速度の比較を行う。これによって、優先度の高い韻律パラメータに関する比較結果が所定条件を満たせば、優先度の低い韻律パラメータに関する比較結果に関係なく、第1メッセージが出力される。
請求項5に従う同調度検出装置は、請求項1ないし4のいずれかに従属し、第1取り込み手段および第2取り込み手段を部屋の中に配置し、出力手段を前記部屋の外に配置するようにした。これによって、部屋の外部からの観察が可能となる。
請求項6の発明に従う同調度検出装置は、請求項5に従属し、部屋を複数用意し、各々の部屋の中に第1取り込み手段および第2取り込み手段を配置し、各々の部屋の外に出力手段を配置するようにした。これによって、どの部屋の対話が盛り上がっているかを容易に把握することができる。
請求項7の発明に従う同調度検出プログラムは、同調度検出装置のプロセサに実行させる同調度検出プログラムであって、第1被験者の発話音声である第1発話音声を取り込む第1取り込みステップ、第1被験者と対話する第2被験者の発話音声である第2発話音声を取り込む第2取り込みステップ、第1発話音声の韻律パラメータ値と第2発話音声の韻律パラメータ値との差分を閾値と比較する比較ステップ、および比較ステップの比較結果に応じて異なるメッセージを出力する出力ステップを備える。
この発明によれば、第1発話音声の韻律パラメータ値と第2発話音声の韻律パラメータ値との差分を閾値と比較し、比較結果に応じて異なるメッセージを出力するようにしたため、第1被験者および第2被験者の対話の同調度をリアルタイムで把握することができる。
この発明の上述の目的,その他の目的,特徴および利点は、図面を参照して行う以下の実施例の詳細な説明から一層明らかとなろう。
図1を参照して、この実施例の同調度検出装置10は、被験者Aの発話音声を取り込むマイク18と、被験者Bの発話音声を取り込むマイク20とを含む。マイク18によって取り込まれた発話音声は、A/D変換器14を介してCPU12に与えられ、メモリ22に書き込まれる。また、マイク20によって取り込まれた発話音声は、A/D変換器16およびCPU12を介してメモリ22に書き込まれる。
CPU12は、メモリ22に確保された発話音声データに基づいて、被験者AおよびBのコミュニケーションが同調しているか否か、つまり被験者AおよびBの会話が盛り上がっているか否かを判別する。CPU12は、コミュニケーションの同調が検出されたときランプ24を点灯させ、コミュニケーションの同調が検出されなくなったときランプ24を消灯させる。
CPU12は、具体的には、図3に示すフロー図に従う処理を実行する。なお、被験者AおよびBの発話音声データは、別のタスクによってメモリ22に蓄積される。また、これらの処理を実行するための制御プログラムは、メモリ22に記憶されている。
まずステップS1で、メモリ22に確保された最新のT1秒(=30秒)の被験者Aの発話音声データに基づいて、発話音声の韻律パラメータ、すなわち被験者Aの発話速度Va,声量Paおよび応答遅れ時間(発話間隔)Taを検出する。ステップS3では、メモリ22に確保された最新のT1秒の被験者Bの発話音声データに基づいて、被験者Bの発話速度Vb,声量Pbおよび応答遅れ時間Tbの韻律パラメータを検出する。
ここで、発話速度の単位は、“mora/sec”であり、声量の単位は“dB”であり、そして応答遅れ時間の単位は“sec”である。また、応答遅れ時間とは、被験者AおよびBの一方の発話が終了してから被験者AおよびBの他方の発話が開始されるまでの時間のことである。
なお、発話速度および応答遅れ時間の検出に必要な音素および有声音区間は、既存の音声特徴抽出法に従って抽出される。音声特徴抽出法については、特開平7−295588号公報および特開平10−70790号公報や、次の参考文献に詳しく述べられている。
[参考文献]
鹿野清宏,伊藤克亘,河原達也,武田一哉,山本幹雄,「IT Text 音声認識システム」,情報処理学会編集,オーム社
ステップS5では、検出された発話速度VaおよびVbの差分絶対値を閾値THv(=0.1mora/sec)と比較する。ステップS7では、検出された声量PaおよびPbの差分絶対値を閾値THp(=0.2dB)と比較する。ステップS9では、検出された応答遅れ時間TaおよびTbの差分絶対値を閾値THt(=0.05sec)と比較する。
ステップS5で|Va−Vb|<THvと判断されるか、ステップS7で|Pa−Pb|<THpと判断されるか、あるいはステップS9で|Ta−Tb|<THtと判断されると、ステップS11でランプ24を点灯させる。これに対して、ステップS5で|Va−Vb|≧THvと判断され、ステップS7で|Pa−Pb|≧THpと判断され、そしてステップS9で|Ta−Tb|≧THtと判断されると、ステップS13でランプ24を消灯させる。
つまり、ステップS5,S7およびS9のいずれにおいてもNOであれば、被験者AおよびBのコミュニケーションは同調していない、すなわち会話が弾んでいないとみなし、ステップS13でランプ24を消灯させる。これに対して、ステップS5,S7およびS9のいずれかでもYESであれば、被験者AおよびBのコミュニケーションは弾んでいるとみなし、ステップS11でランプ24を点灯させる。
ステップS11またはS13の処理が完了すると、被験者AおよびBが対話をしない非発話期間がT2秒(たとえば600秒)に達したか否かをステップS15で判別する。ここでNOであれば、メモリ22に新たに蓄積されたT1秒分の発話音声データについて上述の処理を実行するべく、ステップS1に戻る。一方、ステップS15でYESと判断されると、処理を終了する。
かかる同調度検出装置10は、具体的には、図2に示すような形態で使用される。図2によれば、テーブル26と2つの椅子28および30が部屋100の中に準備される。被験者Aは椅子28に座り、被験者Bは椅子30に座る。マイク18はテーブル26上の被験者Aの近傍に配置され、マイク20はテーブル26上の被験者Bの近傍に配置される。ランプ24は、部屋100の外側(具体的には出入り口100aが設けられた壁100b)に設置される。部屋100の外部に居る観察者は、部屋100の中での被験者AおよびBの会話の盛り上がりの程度(同調度)を、ランプ24の点灯/消灯によって把握する。
この実施例によれば、発話速度,声量,応答遅れ時間の3つの韻律パラメータを用いるようにしたため、同調度の検出精度を向上させることができる。また、同調度の検出結果に応じてランプ24を点灯/消灯させるようにしたため、対話の同調度をリアルタイムで容易に判別することができる。
なお、図4に示すように複数の部屋100,100,…を用意すれば、各々の部屋100毎のコミュニケーションの同調度を視覚的に観察することができ、同調度を観察するときの利便性が向上する。つまり、どの部屋の対話が盛り上がっているかを容易に把握することができる。
また、この実施例では、対話の同調度をランプの点灯/消灯のような可視メッセージによって表現するようにしているが、可視メッセージに代えてあるいは可視メッセージとともに、可聴メッセージによって同調度を表現するようにしてもよい。
さらに、この実施例では、対話の同調度を検出するにあたって、発話速度→声量→応答遅れ時間の順で比較処理を行うようにしたが(S7, S9, S11)、比較処理の順序はこれに限られるものではない。また、対話の同調度の検出は、発話速度,声量および応答遅れ時間のうち、任意の1つによっても、あるいは任意の2つの組み合わせによっても、可能であることは言うまでもない。
この発明の一実施例の構成を示すブロック図である。 図1実施例の使用状態の一例を示す図解図である。 図1実施例に適用されるCPUの動作の一部を示すフロー図である。 図1実施例の使用状態の他の一例を示す図解図である。
符号の説明
10 … 同調度検出装置
12 … CPU
18,20 … マイク
22 … メモリ
24 … 表示装置

Claims (7)

  1. 第1被験者の発話音声である第1発話音声を取り込む第1取り込み手段、
    前記第1被験者と対話する第2被験者の発話音声である第2発話音声を取り込む第2取り込み手段、
    前記第1発話音声の韻律パラメータ値と前記第2発話音声の韻律パラメータ値との差分を閾値と比較する比較手段、および
    前記比較手段の比較結果に応じて異なるメッセージを出力する出力手段を備える、同調度検出装置。
  2. 前記韻律パラメータ値は発話速度,声量および応答遅れ時間の少なくとも1つを含む、請求項1記載の同調度検出装置。
  3. 前記比較手段は同じ韻律パラメータ毎に比較を行い、
    前記出力手段は、少なくとも1つの比較結果が所定条件を満たすとき第1メッセージを出力する第1メッセージ出力手段、および全ての比較結果が前記所定条件を満たさないとき第2メッセージを出力する第2メッセージ出力手段を含む、請求項2記載の同調度検出装置。
  4. 前記比較手段は、前記応答遅れ時間の比較に優先して前記声量の比較を行い、前記声量の比較に優先して前記発話速度の比較を行う、請求項2または3記載の同調度検出装置。
  5. 前記第1取り込み手段および前記第2取り込み手段を部屋の中に配置し、前記出力手段を前記部屋の外に配置するようにした、請求項1ないし4のいずれかに記載の同調度検出装置。
  6. 前記部屋を複数用意し、
    各々の前記部屋の中に前記第1取り込み手段および前記第2取り込み手段を配置し、各々の前記部屋の外に前記出力手段を配置するようにした、請求項5記載の同調度検出装置。
  7. 同調度検出装置のプロセサに実行させる同調度検出プログラムであって、
    第1被験者の発話音声である第1発話音声を取り込む第1取り込みステップ、
    前記第1被験者と対話する第2被験者の発話音声である第2発話音声を取り込む第2取り込みステップ、
    前記第1発話音声の韻律パラメータ値と前記第2発話音声の韻律パラメータ値との差分を閾値と比較する比較ステップ、および
    前記比較ステップの比較結果に応じて異なるメッセージを出力する出力ステップを備える、同調度検出プログラム。
JP2004074781A 2004-03-16 2004-03-16 同調度検出装置および同調度検出プログラム Expired - Fee Related JP4437224B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004074781A JP4437224B2 (ja) 2004-03-16 2004-03-16 同調度検出装置および同調度検出プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004074781A JP4437224B2 (ja) 2004-03-16 2004-03-16 同調度検出装置および同調度検出プログラム

Publications (2)

Publication Number Publication Date
JP2005265982A JP2005265982A (ja) 2005-09-29
JP4437224B2 true JP4437224B2 (ja) 2010-03-24

Family

ID=35090640

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004074781A Expired - Fee Related JP4437224B2 (ja) 2004-03-16 2004-03-16 同調度検出装置および同調度検出プログラム

Country Status (1)

Country Link
JP (1) JP4437224B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013164468A (ja) * 2012-02-09 2013-08-22 Fuji Xerox Co Ltd 音声解析装置、音声解析システムおよびプログラム

Also Published As

Publication number Publication date
JP2005265982A (ja) 2005-09-29

Similar Documents

Publication Publication Date Title
JP6502249B2 (ja) 音声認識方法及び音声認識装置
EP3373301A1 (en) Apparatus, robot, method and recording medium having program recorded thereon
WO2008069187A1 (ja) プレゼンテーション支援装置および方法並びにプログラム
US10553240B2 (en) Conversation evaluation device and method
JP5431282B2 (ja) 音声対話装置、方法、プログラム
JP6585733B2 (ja) 情報処理装置
JP4973664B2 (ja) 文書読上げ装置、文書読上げ装置を制御する制御方法及び文書読上げ装置を制御する制御プログラム
JP2010232780A (ja) 通信制御装置、通信制御方法、及び通信制御プログラム
JP2015219440A (ja) 操作補助装置および操作補助方法
KR20220140599A (ko) 대화의 사람 참가자를 대신하여 생성된 합성 스피치 오디오 데이터
JP6270661B2 (ja) 音声対話方法、及び音声対話システム
JP2019197182A (ja) 音声対話システム、音声対話方法及びプログラム
JPH08146991A (ja) 情報処理装置及びその制御方法
JP2012163692A (ja) 音声信号処理システム、音声信号処理方法および音声信号処理方法プログラム
JP2008003517A (ja) 音声対話装置、音声対話方法、およびプログラム
JP4437224B2 (ja) 同調度検出装置および同調度検出プログラム
JP2004021121A (ja) 音声対話制御装置
JP2007168972A (ja) エレベータ制御装置
JP6736225B2 (ja) 対話装置、対話装置の制御方法およびプログラム
JP2001125584A (ja) 言い淀み検出方法及び装置
JP2008241890A (ja) 音声対話装置および方法
JP2010206365A (ja) 対話装置
JP2011175304A (ja) 音声対話装置および方法
JP6183147B2 (ja) 情報処理装置、プログラム、及び方法
JP2005283646A (ja) 音声認識率推定装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20061221

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20091027

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20091208

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20091210

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130115

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees