JP2014086832A - 会議支援装置、その方法及びプログラム - Google Patents

会議支援装置、その方法及びプログラム Download PDF

Info

Publication number
JP2014086832A
JP2014086832A JP2012233525A JP2012233525A JP2014086832A JP 2014086832 A JP2014086832 A JP 2014086832A JP 2012233525 A JP2012233525 A JP 2012233525A JP 2012233525 A JP2012233525 A JP 2012233525A JP 2014086832 A JP2014086832 A JP 2014086832A
Authority
JP
Japan
Prior art keywords
native
native speaker
speaker
speakers
speech
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2012233525A
Other languages
English (en)
Other versions
JP5889162B2 (ja
Inventor
Naomi Yamashita
直美 山下
Toshihiro Takada
敏弘 高田
Atsushi Yamato
淳司 大和
Shigeki Aoyanagi
滋己 青柳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2012233525A priority Critical patent/JP5889162B2/ja
Publication of JP2014086832A publication Critical patent/JP2014086832A/ja
Application granted granted Critical
Publication of JP5889162B2 publication Critical patent/JP5889162B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

【課題】母語者と非母語者とが参加する会議において、非母語者が話し易い状態を作り、効果的に非母語者を支援する技術を提供する。
【解決手段】会議支援装置は、母語者の発話に対する母語者音声信号を、非母語者の発話に対する非母語者音声信号よりも遅延させ、遅延母語者音声信号を生成する遅延部と、非母語者音声信号と遅延母語者音声信号とを合成する第一合成部と、少なくとも2つ以上の母語者音声信号を合成する第二合成部とを含む。
【選択図】図3

Description

本発明は、会議システムに関する。
非母語により会話をする場合、一時的に思考力が低下することが知られている(非特許文献1参照)。
Takano, Y. and Noda, A., "A temporary decline of thinking ability during foreign language processing", Journal of Cross-Cultural Psychology, 1993, vol. 24, no. 4, 445-462
そのため、非母語で会議に参加することは、大変な困難を伴う。しかしながら、母語を話す者(以下「母語者」という)と非母語を話す者(以下「非母語者」という)とが参加する会議において、効果的に非母語者を支援する技術はほとんど見当たらない。
本発明は、母語者と非母語者とが参加する会議において、非母語者が話し易い状態を作り、効果的に非母語者を支援する技術を提供することを目的とする。
上記の課題を解決するために、本発明の第一の態様によれば、会議支援装置は、母語者の発話に対する母語者音声信号を、非母語者の発話に対する非母語者音声信号よりも遅延させ、遅延母語者音声信号を生成する遅延部と、非母語者音声信号と遅延母語者音声信号とを合成する第一合成部と、少なくとも2つ以上の母語者音声信号を合成する第二合成部とを含む。
上記の課題を解決するために、本発明の第二の態様によれば、会議支援方法は、母語者の発話に対する母語者音声信号を、非母語者の発話に対する非母語者音声信号よりも遅延させ、遅延母語者音声信号を生成する遅延ステップと、非母語者音声信号と遅延母語者音声信号とを合成する第一合成ステップと、少なくとも2つ以上の母語者音声信号を合成する第二合成ステップとを含む。
本発明によれば、非母語者に付加的な処理時間を与え、非母語者を効果的に支援することができる。
対面会議及び電話会議における理解度を示す図。 対面会議及び電話会議における発言度を示す図。 会議支援装置の機能ブロック図。 会議支援装置の処理フローを示す図。 母語者端末のマイクロホンで収音される音声信号と、非母語者端末のスピーカで再生される再生信号と、母語者端末のスピーカで再生される再生信号との関係を示す。 母語者端末のマイクロホンで収音される音声信号とスピーカで再生される再生信号と、非母語者端末のスピーカで再生される再生信号との関係を示す。 4つの母語者端末及び1つの非母語者端末とインターネットを介して接続された会議支援装置の機能ブロック図。 遅延時間と、母語者の会話衝突率、話者交代頻度、話し易さ、理解し易さ及びフラストレーションとの関係を示す図。 遅延時間と、非母語者の自発的発話率、話し易さ、理解し易さ及びフラストレーションとの関係を示す図。
以下、本発明の実施形態について説明する。なお、以下の説明に用いる図面では、同じ機能を持つ構成部や同じ処理を行うステップには同一の符号を記し、重複説明を省略する。
<第一実施形態>
<第一実施形態のポイント>
母語者と非母語者とが参加する会議において、非母語者は、会議の内容を理解するために、及び、会議において発言するために、大変な困難を伴う。さらに、対面会議ではほぼ問題なく会議に参加し議論できていても、多人数音声会議になると、たちまち理解度が低減し、発言権を得ることが困難になってしまう非母語者が大半であると考えられる。このことを検証するために、発明者等は以下の調査を実施した。
対面会議及び電話会議に参加した7名の日本人にアンケートを行い、各会議における理解度(会議の内容をどの程度理解できたかを表す)及び発言度(言いたいことのどの程度発言できたかを表す)を回答してもらった。図1は対面会議及び電話会議における理解度を、図2は対面会議及び電話会議における発言度を示す。なお、7名の日本人は、それぞれ日本のコンピュータ科学研究団体(HCI,HRI,AI等)に属し、各団体において積極的役割を担っている。また彼らは、10回以上、国際的な委員会のメンバーとして従事したことがあり、少なくとも3回以上電話会議に参加したことがある。また、彼らの平均海外滞在日数は2年であった。つまり、彼らは十分な英会話力を備えていると考えられる。
図1及び図2から、電話会議における彼らの理解度及び発言度は、対面会議におけるそれと比べ、低いことが分かる。サンプル数は、少ないものの、様々な技術分野の日本の代表者とも言える人々の実に70%が、電話会議において、言いたいことの半分も言えていないと感じている。このような状況が続くと、非母語者の電話会議における存在感が急激に低下してしまう。
これは、会議中に非母語者が複数の高度な情報処理を並列に行わなければならない過負荷な状態に陥っていることに加え、電話会議において非母語者の聞き取り能力が低下することに起因すると考えられる。そこで、第一実施形態では、電話会議において、非母語者に付加的なリソース(処理時間)を与える方法を提案する。
<第一実施形態に係る会議支援装置100>
図3は会議支援装置100の機能ブロック図を、図4はその処理フローを示す。
本実施形態では、M人の母語者とN人の非母語者とが参加する電話会議を想定している。ただし、Mを2以上の整数、Nを1以上の整数とする。
会議支援装置100は、遅延部110、第一合成部120及び第二合成部130を含む。
会議支援装置100は、母語者端末1〜1からそれぞれインターネット3を介して母語者の発話に対する母語者音声信号m11〜m1Mを受け取る。また、非母語者端末2〜2からそれぞれインターネット3を介して非母語者の発話に対する非母語者音声信号m21〜m2Nを受け取る。
会議支援装置100は、各母語者端末1〜1及び各非母語者端末2〜2に対して、それぞれ各端末自身から得られた音声信号を除く音声信号を合成した再生信号p11〜p1M及びp21〜p2Nを、インターネット3を介して送信する。例えば、再生信号p11は、母語者音声信号m11以外の音声信号、つまり、母語者音声信号m12〜m1M及び非母語者音声信号m21〜m2Nを合成したものである。
各母語者端末1〜1及び各非母語者端末2〜2は、それぞれ母語者及び非母語者により操作される。各母語者端末1〜1及び各非母語者端末2〜2は、それぞれマイクロホンとスピーカを含み、マイクロホンにより音を収音して音声信号を生成して出力することができ、また、スピーカにより受け取った再生信号を再生することができる。さらに、ディスプレイやカメラを含み、映像を送受信し、表示する構成としてもよい。例えば、各端末は、固定電話、携帯電話、コンピュータ等からなる。
会議支援装置100は、遅延部110と第一合成部120と第二合成部130とを含む。
遅延部110は、母語者音声信号号m11〜m1Mを受け取り、母語者音声信号号m11〜m1Mを非母語者音声信号m21〜m2Nよりも遅延させ、遅延母語者音声信号m’11〜m’1Mを生成し(s1)、第一合成部120に出力する。なお、遅延時間(例えば0.2秒や0.4秒)は、利用者により、調整できるものとする。例えば、母語者音声信号号m11〜m1Mを受け取った後、母語者音声信号号m11〜m1Mを一時的に記憶しておき、遅延時間経過後に、第一合成部120に出力する。この場合、遅延時間経過後の母語者音声信号号m11〜m1Mが、前述の遅延母語者音声信号m’11〜m’1Mである。
第一合成部120は、遅延母語者音声信号m’11〜m’1Mと非母語者音声信号m21〜m2Nとを受け取り、これらの信号をリアルタイムに合成し(s2)、母語者端末1〜1に対する再生信号p11〜p1Mを生成し、出力する。なお、遅延母語者音声信号m’1s(ただし、s=1,2,…,M)を除く、他の全ての遅延母語者音声信号m’11〜m’1(s−1)、m’1(s+1)〜m’1Mと、非母語者音声信号m21〜m2Nとを合成し、再生信号p1sを生成する。
第二合成部130は、母語者音声信号m11〜m1Mと非母語者音声信号m21〜m2Nとを受け取り、これらの信号をリアルタイムに合成し(s3)、非母語者端末2〜2に対する再生信号p21〜p2Nを生成し、出力する。なお、母語者音声信号m11〜m1Mと、非母語者音声信号m1t(ただし、t=1,2,…,N)を除く、他の全ての非母語者音声信号m11〜m1(t−1)、m1(t+1)〜m1Nとを合成し、再生信号p1tを生成する。
図5は、母語者端末1のマイクロホンで収音される音声信号m11と、非母語者端末2〜2のスピーカで再生される再生信号p21〜p2Nと、母語者端末1〜1のスピーカで再生される再生信号p12〜p2Mとの関係を示す。図5に示すとおり、非母語者端末2〜2では、母語者端末1〜1よりも早く音声信号m11に対応する再生信号p21〜p2Nを再生するため、非母語者は母語者よりも早く発話の内容を聞くことができ、非母語者は付加的な処理時間を与えられる。この付加的な処理時間により、非母語者の理解し易さだけでなく、話し易さも向上すると考えられる。
図6は、母語者端末1のマイクロホンで収音される音声信号m11とスピーカで再生される再生信号p11と、母語者端末1のマイクロホンで収音される音声信号m12とスピーカで再生される再生信号p12と、非母語者端末2〜2のスピーカで再生される再生信号p21〜p2Nとの関係を示す。他者の発言の文末に、文頭を重ねて発言する場合があるが、重なった部分は聞き取りづらく、補完しなければならず、非母語者にとっては理解し易さを低減させる大きな要因となる。しかし、会議支援装置100を用いた場合には、図6に示すとおり、再生信号には重なった部分が発生しづらく、そのような問題は生じづらい。
<効果>
このような構成により、リアルタイムの電話会議において、非母語者に付加的な処理時間を与えることができる。母語者間のネットワークに人工的に遅延を挿入しているので、母語者の発話を非母語者は他の母語者よりも遅延時間分、早く聞くことができる。その結果、非母語者が発話しやすくなる。
<シミュレーション結果>
5人で1グループとし、14グループ(合計70人)に対して、会議支援装置100を用いて、電話会議を実施した。各グループは4人の母語者と1人の非母語者とからなる。図7は、4つの母語者端末1〜1及び1つの非母語者端末2とインターネット3を介して接続された会議支援装置100の機能ブロック図を示す。母語者の母語を英語とし、非母語者の母語を日本語とした。非母語者として、英語での日常会話を行うに十分な英会話力があるものを選出した。
各グループに対して、遅延時間を0秒、0.2秒、0.4秒に変えて、3回、電話会議を行った。
図8は、遅延時間と、母語者の会話衝突率、話者交代頻度、話し易さ、理解し易さ及びフラストレーションとの関係を示す図である。電話会議の音声データを用いて、会話衝突率及び話者交代頻度を求め、電話会議に参加する母語者に対するアンケートにより、話し易さ、理解し易さ、フラストレーションを求めた。なお、話し易さ、理解し易さ、フラストレーションは5段階評価を行い、話し易さ及び理解し易さは数値が高いほうがよく、フラストレーションは数値が低いほうがよい。
会話衝突率とは、複数の母語者が同時に会話を始める確率を表している。具体的には、各電話会議において、複数の母語者が同時に会話を始める回数を、話者交代が行われた回数で割って求める。図8に示すように、遅延時間が長くなるにつれ、会話衝突率が大きくなっている。遅延時間が長くなると、他の母語者が会話を始めていることを認知せずに、母語者が会話を始める可能性が高くなるため、会話衝突率が高くなる。
話者交代頻度は、母語者間において1分間に話者が交代した回数を表す。話者交代頻度が低いことは、交代するのが難しいことを示している。図8に示すように、遅延時間が長くなるにつれ、話者交代頻度が小さくなっている。遅延時間が長くなると、他の母語者が適切なタイミングで会話に入ることができず、同じ母語者が話し続けるため、話者交代頻度が小さくなる。
このような理由により、遅延時間が0.4秒になると、話し易さが低くなり、フラストレーションが大きくなる。ただし、話し易さ、理解し易さ、フラストレーションについては、遅延時間が0秒と0.2秒の間で大きな差はない。
図9は、遅延時間と、非母語者の自発的発話率、話し易さ、理解し易さ及びフラストレーションとの関係を示す図である。電話会議の音声データを用いて、自発的発話率を求め、電話会議に参加する非母語者に対するアンケートにより、話し易さ、理解し易さ、フラストレーションを求めた。
自発的発話率は、非母語者が発話した全回数に対する、非母語者が自発的に発話した回数の割合を表す。遅延時間が0.2秒のときに最も自発的発話率が高いことが分かる。話し易さ、理解し易さ及びフラストレーションに関しても、遅延時間が0.2秒のときが最もよい。これは、遅延時間が長くなり、非母語者に付加的な処理時間を与えることができたとしても、母語者間の発話権獲得の競争が激化し、母語者にとってストレスとなるなどの悪影響が出始め、非母語者にも間接的に悪影響を与えるからであると考えられる。よって、遅延時間は0秒より大きく、0.4秒以下程度で設定するのがよく、特に0.2秒前後のときに、最も効果的に母語者を支援することができる。ただし、電話会議システム自体に生じる処理遅延や伝送遅延により、参加者にとって最もストレスの小さい遅延時間は変わるため、電話会議システムの特性に合わせて適宜設定すればよい。
<変形例>
第一実施形態では、インターネットで接続された遠隔会議システムの場合(電話会議の場合)について説明しているが、これは本発明の一例である。対面会議においても本発明を適用することはできる。例えば、円卓を囲み、マイクロホンとスピーカを含むヘッドセットを、直接、または、前述の母語者端末や非母語者端末を介して間接的に、会議支援装置と接続してもよい。母語者の口元が見え、口の動きと音声とがずれる為、遅延に対してストレスを感じる場合もあるが、非母語者が話し易くなるという効果を得ることはできる。
本実施形態では、第二合成部130は、母語者音声信号m11〜m1Mと非母語者音声信号m21〜m2Nとをリアルタイムに合成し、再生信号p21〜p2Nを生成しているが、N=1の場合(つまり、非母語者音声信号が一つの場合)、再生信号p21に非母語者音声信号m21を含む必要がないため、シミュレーションの場合と同様に(図7参照)、母語者音声信号m11〜m1Mのみをリアルタイムに合成すればよい。よって、第二合成部130は、少なくとも2つ以上の前記母語者音声信号を合成する。なお、M=1の場合(母語者が1人しかいない場合)、遅延母語者音声信号を含む再生信号を再生する母語者端末が存在しなくなる。そのため、本発明の効果を得ることができない。よって、前述の通り、Mは2以上の整数とする。
会議支援装置100は、種々の方法により、受信した音声信号を母語者音声信号または非母語者音声信号と判定する。例えば、母語者に対する母語者音声信号を、事前に設定された母語者端末に対する音声信号としたり、母語者に手動でスイッチを押してもらいスイッチがONの参加者に対する音声信号としたりする方法が考えられる。また、他にも、音声信号から流暢度合いを求め、流暢度合いに基づき、自動的に母語者音声信号を認識して、母語者音声信号に遅延を与えてもよい。つまり、予め母語者端末と非母語者端末とを設けてもよいし、スイッチ等により発話者が手動で各端末を母語者端末または非母語者端末と設定してもよいし、入力される音声信号の流暢度合いに基づき会議支援装置側で自動的に、その音声信号を母語者音声信号または非母語者音声信号であると判定する構成としてもよい。
<その他の変形例>
本発明は上記の実施形態及び変形例に限定されるものではない。例えば、上述の各種の処理は、記載に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。その他、本発明の趣旨を逸脱しない範囲で適宜変更が可能である。
<プログラム及び記録媒体>
上述した会議支援装置は、コンピュータにより機能させることもできる。この場合はコンピュータに、目的とする装置(各種実施形態で図に示した機能構成をもつ装置)として機能させるためのプログラム、またはその処理手順(各実施形態で示したもの)の各過程をコンピュータに実行させるためのプログラムを、CD−ROM、磁気ディスク、半導体記憶装置などの記録媒体から、あるいは通信回線を介してそのコンピュータ内にダウンロードし、そのプログラムを実行させればよい。

Claims (4)

  1. 母語者の発話に対する母語者音声信号を、非母語者の発話に対する非母語者音声信号よりも遅延させ、遅延母語者音声信号を生成する遅延部と、
    前記非母語者音声信号と前記遅延母語者音声信号とを合成する第一合成部と、
    少なくとも2つ以上の前記母語者音声信号を合成する第二合成部とを含む、
    会議支援装置。
  2. 請求項1記載の会議支援装置であって、
    前記遅延部において、遅延させる時間が0.2秒である、
    会議支援装置。
  3. 母語者の発話に対する母語者音声信号を、非母語者の発話に対する非母語者音声信号よりも遅延させ、遅延母語者音声信号を生成する遅延ステップと、
    前記非母語者音声信号と前記遅延母語者音声信号とを合成する第一合成ステップと、
    少なくとも2つ以上の前記母語者音声信号を合成する第二合成ステップとを含む、
    会議支援方法。
  4. 請求項1または2記載の会議支援装置として、コンピュータを機能させるためのプログラム。
JP2012233525A 2012-10-23 2012-10-23 会議支援装置、会議支援システム、その方法及びプログラム Active JP5889162B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012233525A JP5889162B2 (ja) 2012-10-23 2012-10-23 会議支援装置、会議支援システム、その方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012233525A JP5889162B2 (ja) 2012-10-23 2012-10-23 会議支援装置、会議支援システム、その方法及びプログラム

Publications (2)

Publication Number Publication Date
JP2014086832A true JP2014086832A (ja) 2014-05-12
JP5889162B2 JP5889162B2 (ja) 2016-03-22

Family

ID=50789534

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012233525A Active JP5889162B2 (ja) 2012-10-23 2012-10-23 会議支援装置、会議支援システム、その方法及びプログラム

Country Status (1)

Country Link
JP (1) JP5889162B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019146055A (ja) * 2018-02-22 2019-08-29 クラリオン株式会社 通話装置、及び通話装置の制御方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007212967A (ja) * 2006-02-13 2007-08-23 Yamaha Corp 話速変換装置
US20110246172A1 (en) * 2010-03-30 2011-10-06 Polycom, Inc. Method and System for Adding Translation in a Videoconference

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007212967A (ja) * 2006-02-13 2007-08-23 Yamaha Corp 話速変換装置
US20110246172A1 (en) * 2010-03-30 2011-10-06 Polycom, Inc. Method and System for Adding Translation in a Videoconference
JP2011209731A (ja) * 2010-03-30 2011-10-20 Polycom Inc ビデオ会議に翻訳を追加するための方法及びシステム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019146055A (ja) * 2018-02-22 2019-08-29 クラリオン株式会社 通話装置、及び通話装置の制御方法

Also Published As

Publication number Publication date
JP5889162B2 (ja) 2016-03-22

Similar Documents

Publication Publication Date Title
US10224057B1 (en) Presentation of communications
US11710488B2 (en) Transcription of communications using multiple speech recognition systems
US11782674B2 (en) Centrally controlling communication at a venue
Yamashita et al. Lost in transmittance: how transmission lag enhances and deteriorates multilingual collaboration
JP2004304601A (ja) Tv電話装置、tv電話装置のデータ送受信方法
JP4802370B2 (ja) 通信制御装置および方法、記録媒体、並びにプログラム
WO2019240035A1 (ja) 会話補助装置、会話補助方法及びプログラム
JP2014167517A (ja) 会話提供システム、ゲーム提供システム、会話提供方法、ゲーム提供方法及びプログラム
JP5889162B2 (ja) 会議支援装置、会議支援システム、その方法及びプログラム
CN112688965A (zh) 一种会议音频共享方法、装置、电子设备及存储介质
JP2019176375A (ja) 動画出力装置、動画出力方法および動画出力プログラム
JP2011118632A (ja) 発話の予備動作検出及び伝達方法及び装置及びプログラム
JP2003283672A (ja) 電話会議装置
US20200184973A1 (en) Transcription of communications
US11094328B2 (en) Conferencing audio manipulation for inclusion and accessibility
JP2000333150A (ja) テレビ会議システム
JP6390607B2 (ja) プログラム及び遠隔会議方法
JP2014150442A (ja) 通話システム及び通話中継方法
WO2024084855A1 (ja) 遠隔会話支援方法、遠隔会話支援装置、遠隔会話システム、及び、プログラム
CN113079267B (zh) 房间内的音频会议
US20240046540A1 (en) Speech image providing method and computing device for performing the same
JP6922551B2 (ja) 音声処理装置、音声処理プログラム、及び音声処理方法
JP5210788B2 (ja) 音声信号通信システム、音声合成装置、音声合成処理方法、音声合成処理プログラム、並びに該プログラムを格納した記録媒体
JP2008211400A (ja) 定型メッセージ機能付きPoCシステム、通信方法、通信プログラム、端末、PoCサーバ
JP2023047178A (ja) 情報処理装置及び情報処理プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150122

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20151125

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20151201

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160119

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160209

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160216

R150 Certificate of patent or registration of utility model

Ref document number: 5889162

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150