JP6079535B2 - 通信端末、通信端末の出力制御方法、通信端末の出力制御用プログラム - Google Patents

通信端末、通信端末の出力制御方法、通信端末の出力制御用プログラム Download PDF

Info

Publication number
JP6079535B2
JP6079535B2 JP2013203432A JP2013203432A JP6079535B2 JP 6079535 B2 JP6079535 B2 JP 6079535B2 JP 2013203432 A JP2013203432 A JP 2013203432A JP 2013203432 A JP2013203432 A JP 2013203432A JP 6079535 B2 JP6079535 B2 JP 6079535B2
Authority
JP
Japan
Prior art keywords
communication terminal
user
terminal
communication
gaze
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2013203432A
Other languages
English (en)
Other versions
JP2015070472A (ja
Inventor
さゆり 柚木▲崎▼
さゆり 柚木▲崎▼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
JVCKenwood Corp
Original Assignee
JVCKenwood Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by JVCKenwood Corp filed Critical JVCKenwood Corp
Priority to JP2013203432A priority Critical patent/JP6079535B2/ja
Publication of JP2015070472A publication Critical patent/JP2015070472A/ja
Application granted granted Critical
Publication of JP6079535B2 publication Critical patent/JP6079535B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • User Interface Of Digital Computer (AREA)
  • Telephone Function (AREA)
  • Telephonic Communication Services (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Description

本発明は、複数の相手と同時に通話可能な通信端末、通信端末の出力制御方法、通信端末の出力制御用プログラムに関する。
従来、遠隔地にいる複数の相手と同時にコミュニケーションをとるための手段として、会議システムやビデオチャットシステムなどがある。これらのシステムでは、通信ネットワーク上に構築された仮想空間を複数の通信端末で共有し、各通信端末の利用者に対応する画像情報をそれぞれの通信端末に表示させつつ、相互に通話を可能にしている。
このように、通話中の複数の相手に対応する画像情報をそれぞれの通信端末に表示させることで、臨場感のあるコミュニケーション空間を提供することができる。
特開平11−234640号公報
これらのシステムを用いて複数の相手と通話を行う場合、複数の人の音声が同時に発生すると、会話の内容が聞き取りづらくなる。
そこで、通信端末を利用するユーザが注視している特定の相手の音声を大きくすることで、注視度合いの高い相手の発言の内容を聞き取り易くする技術がある。
しかしこの技術を用いた場合、通信端末を利用するユーザが注視している相手の音声のみを大きくするため、この相手が他の誰かと会話をしているときに、この会話の相手(ユーザが注視している相手と会話している人)の音声は聞こえにくくなる。そのため、自然な会話に聞こえなくなるという問題があった。
また、通信端末を利用するユーザが、この会話の相手の音声も聞き取り易くするためには、当該ユーザが注視している人とその会話の相手とを、会話に合わせて交互に注視しなくてはならないという問題があった。
よって本発明は、通信システムを利用した、複数の相手との同時通話をしやすくするための、通信端末、通信端末の出力制御方法、通信端末の出力制御用プログラムを提供することを目的とする。
上記目的を達成するための本発明の通信端末(10)は、第1の通信端末および第2の通信端末を少なくとも含む他の通信端末と通信する自通信端末において、前記第1の通信端末の表示部に表示される前記第2の通信端末のユーザに係る表示情報に対する、前記第1の通信端末のユーザの注視度合いが高いほど、前記自通信端末から前記自通信端末のユーザへと出力される、前記第2の通信端末に係る音声の音量が大きくなるように出力を調整すことを特徴とする。
を実行させることを特徴とする通信端末の出力制御用プログラム。
また本発明の通信端末の出力制御方法は、第1の通信端末および第2の通信端末を少なくとも含む他の通信端末と通信する自通信端末の出力制御方法において、表示された前記第2の通信端末のユーザに係る表示情報に対する、前記第1の通信端末のユーザの注視度合いが高いほど、前記第2の通信端末に係る音声の音量が大きくなるように出力を調整することを特徴とする。
また本発明の通信端末の出力制御用プログラムは、第1の通信端末および第2の通信端末を少なくとも含む他の通信端末と通信する自通信端末のコンピュータに、表示された前記第2の通信端末のユーザに係る表示情報に対する、前記第1の通信端末のユーザの注視度合いが高いほど、前記第2の通信端末に係る音声の音量が大きくなるように出力を調整する出力制御ステップを実行させることを特徴とする。
本発明の通信端末、通信端末の出力制御方法、通信端末の出力制御用プログラムによれば、通信システムを利用した、複数の相手との同時通話をしやすくすることができる。
本発明の第1実施形態および第2実施形態による通信端末を利用した通信システムの構成を示す全体図である。 本発明の第1実施形態および第2実施形態による通信端末の構成を示すブロック図である。 本発明の第1実施形態および第2実施形態による通信端末に接続されたサービス管理サーバの構成を示すブロック図である。 本発明の第1実施形態および第2実施形態による通信端末の動作を示すフローチャートである。 本発明の第1実施形態および第2実施形態による通信端末の表示部に、複数の通話相手に対応する画像情報が表示された状態を示す画面構成図である。 本発明の第1実施形態および第2実施形態による通信端末の音声制御部で注視点の検出期間および注視評価情報の生成タイミングを示すグラフである。 本発明の第1実施形態による通信端末を利用するユーザ間の注視状態および発声状態を示す説明図(上段)、および、各通信端末における音声出力状態を示す説明図(下段)である。 本発明の第2実施形態による通信端末を利用するユーザ間の注視状態および発声状態を示す説明図(上段)、および、各通信端末における音声出力状態を示す説明図(下段)である。
本発明の実施形態として、ユーザXと、ユーザAと、ユーザBと、ユーザCと、ユーザDとが、自身が所持する通信端末を用い、サービス管理サーバにより提供される同時通話サービスを利用して、ネットワーク上の仮想空間で会話を行う場合について説明する。なお、これは一例であり、通信方法は、インターネットを介した通信であってもよいし、電話回線を介した通信であってもよい。また、各通信端末間で直接通信してもよい。
《第1実施形態》
〈第1実施形態による通信端末を利用した通信システムの構成〉
本発明の第1実施形態による通信端末を利用した通信システムに構成について、図1を参照して説明する。
本実施形態による通信システム1は、ユーザXが利用する通信端末10X、ユーザAが利用する通信端末10A、ユーザBが利用する通信端末10B、ユーザCが利用する通信端末10C、およびユーザDが利用する通信端末10Dと、サービス管理サーバ20とが、ネットワーク30を介して接続されている。
各通信端末10X、10A〜10Dの構成を、図2に示す。通信端末10X、10A〜10Dはそれぞれ、操作入力部11と、表示部12と、音声入力部13と、注視点検知部14と、音声制御部15と、音声出力部16とを有する。なお、各通信端末10X、10A〜10Dは、少なくとも、注視点検知部、注視評価情報生成部、及び注視評価情報補正部などを有していればよく、必ずしも全く同じ通信端末でなくてもよい。
操作入力部11は操作ボタンやキーボード等の入力インタフェースで構成され、ユーザによる操作内容を入力する。
表示部12はモニタで構成され、ネットワーク30を介して他の通信端末を利用するユーザ(以降、「他端末ユーザ」と称する。)を示す画像情報(表示情報)を表示する。この画像情報はアイコンであってもよいし、ユーザの画像であってもよいし、ユーザを撮影した動画であってもよい。
音声入力部13は例えばマイクで構成され、自通信端末を利用するユーザ(以降、「自端末ユーザ」と称する。)が発した音声を電気信号へと変換し、その音声信号をデータ化して音声情報として、サービス管理サーバ20に送信する。
注視点検知部14は撮像装置等を用いて構成され、自端末ユーザの視線を検知することで、自端末ユーザが注視している表示部12内の位置を示す座標情報(以下、「注視点」と称する。)を検知する。なお、ユーザの注視している位置を検出する方法については公知の種々の方法を用いることができる。
音声制御部15はCPUやメモリ等で構成され、注視評価情報生成部151と、注視評価情報補正部152と、出力制御部としての音量決定部153とを有する。
注視評価情報生成部151は、注視点検知部14で検知された自端末ユーザの注視点から注視評価情報を生成し、サービス管理サーバ20に送信する。注視評価情報は、他端末ユーザごとの、自端末ユーザの注視度合いを評価した値で示される。
注視評価情報補正部152は、複数の他端末ユーザの注視評価情報をサービス管理サーバ20から取得し、これらに基づいて、注視評価情報生成部151で生成された注視評価情報を補正する。このように、注視評価情報補正部152は、他の通信端末における注視度合いを示す情報を取得する取得部としての機能も有する。
音量決定部153は、注視評価情報補正部152で補正された後の注視評価情報に基づいて他端末ユーザごとの音声の音量を決定する。
音声出力部16はスピーカで構成され、サービス管理サーバ20から他端末ユーザの音声情報を受信し、音量決定部153で決定された音量に調整して出力する。
サービス管理サーバ20は同時通話サービスを提供し、図3に示すように、通信制御部21と、画像管理部22と、音声管理部23と、注視評価情報管理部24とを有する。
通信制御部21は、同時通話サービスを利用する通信端末間の通信を確立させる。
画像管理部22は、当該同時通話サービスのユーザにより予め登録された、ユーザ自身を示す画像情報を記憶する。また、通信制御部21により複数の通信端末間で通信が確立されたときに、それぞれの通信端末に、通信先となる通信端末のユーザを示す画像情報を送信する。
音声管理部23は、通信制御部21により複数の通信端末間で通信が確立されたときに、それぞれの通信端末で入力された音声情報を受信し、通信先の通信端末に送信する。
注視評価情報管理部24は、通信制御部21により複数の通信端末間で通信が確立されたときに、それぞれの通信端末で入力された注視評価情報を受信し、通信先の通信端末に送信する。
〈第1実施形態による通信システムの動作〉
次に、本実施形態による通信システム1において、通信端末10X、10A〜10Dが同時通話サービスを利用して同時通話を行う際に、各通信端末で実行される処理について図4のフローチャートを参照して説明する。以下、通信端末10X、10A〜10Dのいずれかを、「通信端末10」と称して説明する。
まず、通信端末10の操作入力部11から、自端末ユーザの操作により同時通話サービスの利用要求が入力されると、ネットワーク30を介してサービス管理サーバ20にアクセスされる。そして、サービス管理サーバ20の通信制御部21により、通話先となる複数の通信端末10との通信が確立される(ステップS1)。本実施形態においては、通信端末10X、10A〜10Dの5台が、同時通話可能な状態で相互に通信が確立されたものとする。
通信端末10X、10A〜10D間で通信が確立されると、画像管理部22からそれぞれの通信端末10に、通信先となる他の通信端末10のユーザを示す画像情報が送信される。例えば、通信端末10Xには、通信先となる他の通信端末10A〜10DのユーザA〜Dを示す画像情報が送信される。
各通信端末10では、サービス管理サーバ20から送信された他の通信端末10のユーザを示す画像情報が受信され(ステップS2)、表示部12で同一画面上に表示される(ステップS3)。
一例として、通信端末10Xの表示部12に他の通信端末10A〜10Dのユーザを示す画像情報が表示されたときの画面表示図を、図5に示す。
図5の画面表示図には、ユーザAを示す画像情報121Aと、ユーザBを示す画像情報121Bと、ユーザCを示す画像情報121Cと、ユーザDを示す画像情報121Dと、各ユーザの氏名情報を一覧表示した氏名情報欄122とが表示されている。
また通信端末10X、10A〜10D間で通信が確立されると、これらの通信端末間での音声情報の送受信が開始され(ステップS4)、各通信端末10の音声入力部13から入力された自端末ユーザの音声情報がサービス管理サーバ20に送信される。サービス管理サーバ20で受信された音声情報は、他の通信端末10に送信される。
次に注視点検知部14において、自端末ユーザの視線を検出することで、自端末ユーザの注視点が検知される(ステップS5)。注視点の検知には既知の技術が利用され、例えば通信端末10に設置された撮像装置(図示せず)で撮影されたユーザの顔の映像情報から角膜(黒目)と強膜(白目)の光に対する反射率の差を利用して眼球運動を測定することにより行われる。
次に注視評価情報生成部151において、注視点検知部14で検知された注視点の情報に基づいて、自端末ユーザによる各他端末ユーザに対する注視度合いを評価した注視評価情報が生成される。この注視評価情報は、自端末ユーザが、表示部12内に表示された画像情報のうち、どの他端末ユーザの画像情報をどの程度注視しているかを評価することにより生成される。生成された注視評価情報はサービス管理サーバ20に送信され、注視評価情報管理部24で取得される(ステップS6)。
本実施形態においては、各通信端末10において、図6に示すように最新の5秒間に検知された注視点の情報に基づいて、1秒ごとに注視評価情報が生成され、サービス管理サーバ20に送信される。
図6において、各太線で示す期間(t0〜t5、t1〜t6、t2〜t7・・・)が注視点の検知対象期間であり、各期間の終点(t5、t6、t7・・・)が注視評価情報の生成およびサービス管理サーバ20への送信タイミングである。
サービス管理サーバ20では、注視評価情報管理部24において各通信端末10で生成された注視評価情報が取得されると、それぞれの通信端末に対し、他の通信端末10の注視評価情報が送信される。
つまり、通信端末10Xに対しては通信端末10A〜10Dの注視評価情報が送信され、通信端末10Aに対しては通信端末10Xおよび10B〜Dの注視評価情報が送信され、通信端末10Bに対しては通信端末10Xおよび10A、10C、10Dの注視評価情報が送信され、通信端末10Cに対しては通信端末10Xおよび10A、10B、10Dの注視評価情報が送信され、通信端末10Dに対しては通信端末10Dおよび10A〜10Cの注視評価情報が送信される。
各通信端末10では、サービス管理サーバ20から送信された他の通信端末10の注視評価情報が、注視評価情報補正部152で取得される(ステップS7)。そして注視評価情報補正部152により、取得された他の通信端末10の注視評価情報に基づいて、注視評価情報生成部151で生成された自端末ユーザの注視評価情報が補正される(ステップS8)。
次に、音量決定部153において、注視評価情報の値が高い程、音量が大きくなるように、他端末ユーザごとの音声の音量が決定される(ステップS9)。
そして音声出力部16により、サービス管理サーバ20から受信された他端末ユーザの音声情報が、それぞれ決定された音量に調整されて出力される(ステップS10)。
上述したステップS5〜S10の処理は、通話接続が切断されるまで繰り返される(ステップS11)。
上述したステップS6〜S9で実行される注視評価情報の生成処理、補正処理、および音量決定処理について、図7に示す具体例を参照して説明する。
本例では、図7の上段に示すように、ユーザAとユーザBとが会話をしているときに、注視点の検知対象とした5秒間のうち、ユーザXがユーザAの画像情報を4秒間注視し、ユーザAがユーザBの画像情報を4秒間注視し、ユーザBがユーザAの画像情報を5秒間注視し、ユーザCがユーザXの画像情報を5秒間注視した場合を示している。
この場合に、通信端末10Xでは、自端末ユーザXが他端末ユーザAを5秒中4秒注視していることから、他端末ユーザAに対する注視評価情報は「80%」として生成され、自端末ユーザAが他端末ユーザB、C、およびDを5秒中全く注視していない(0秒)ことから、他端末ユーザB、C、およびDに対する注視評価情報が「0%」として生成される。
同様に通信端末10Aでは、他端末ユーザBに対する注視評価情報が「80%」として生成され、他端末ユーザX、C、およびDに対する注視評価情報が「0%」として生成される
同様に通信端末10Bでは、他端末ユーザAに対する注視評価情報が「100%」として生成され、他端末ユーザX、C、およびDに対する注視評価情報が「0%」として生成される。
同様に通信端末10Cでは、他端末ユーザCに対する注視評価情報が「100%」として生成され、他端末ユーザA、B、およびDに対する注視評価情報が「0%」として生成される。
同様に通信端末10Dでは、他端末ユーザX、およびA〜Cのすべてに対する注視評価情報が、「0%」として生成される。
これらの注視評価情報はサービス管理サーバ20に送信され、それぞれ他の通信端末10に送信される。
サービス管理サーバ20から各通信端末10の注視評価情報が送信されることにより、通信端末10Xでは、通信端末10A〜10Dで生成された注視評価情報が取得され、通信端末10Aでは、通信端末10Xおよび10B〜10Dで生成された注視評価情報が取得され、通信端末10Bでは、通信端末10X、10A、10C、および10Dで生成された注視評価情報が取得され、通信端末10Cでは、通信端末10X、10A、10B、および10Dで生成された注視評価情報が取得され、通信端末10Dでは、通信端末10X、10A〜10Cで生成された注視評価情報が取得される。
このとき、各通信端末10から見て自端末ユーザの注視評価情報の値が最も高いユーザの通信端末10を第1の通信端末とし、当該第1の通信端末のユーザの注視評価情報の値が最も高いユーザが利用する通信端末10を第2の通信端末とする。
そして、各通信端末10において、第2の通信端末のユーザに対する第1の通信端末のユーザの注視評価情報の値に、第1の通信端末のユーザに対する自端末ユーザの注視評価情報の値を掛け合わせた値が算出され、算出された値で第2の通信端末のユーザに対する自端末ユーザの注視評価情報が補正される。
例えば、通信端末10Xでは、通信端末10B(第2の通信端末)のユーザBに対する通信端末10A(第1の通信端末)のユーザAの注視評価情報「80%」に、通信端末10A(第1の通信端末)のユーザAに対する自端末ユーザXの注視評価情報「80%」を掛け合わせた値「64%」が算出され、他端末ユーザBに対する自端末ユーザXの注視評価情報が、「0%」から算出された値「64%」に補正される。
同様にして、通信端末10Cでは、通信端末10A(第2の通信端末)のユーザAに対する通信端末10X(第1の通信端末)のユーザXの注視評価情報「80%」に、通信端末10X(第1の通信端末)のユーザXに対する自端末ユーザCの注視評価情報「100%」を掛け合わせた値「80%」が算出され、他端末ユーザAに対する自端末ユーザCの注視評価情報が、「0%」から算出された値「80%」に補正される。
ここでさらに、第2の通信端末のユーザの注視評価情報の値が最も高いユーザが利用する通信端末10を第3の通信端末とし、第3の通信端末のユーザに対する第2の通信端末のユーザの注視評価情報の値に、第2の通信端末のユーザに対する第1の通信端末のユーザの注視評価情報の値、および第1の通信端末のユーザに対する自端末ユーザの注視評価情報の値が掛け合わせた値が算出され、算出された値で第3の通信端末のユーザに対する自端末ユーザの注視評価情報を補正するようにしてもよい。
例えば、通信端末10Cにおいて、通信端末10B(第3の通信端末)のユーザBに対する通信端末10A(第2の通信端末)のユーザAの注視評価情報「80%」に、通信端末10A(第2の通信端末)のユーザAに対する通信端末10X(第1の通信端末)のユーザXの注視評価情報「80%」および通信端末10X(第1の通信端末)のユーザXに対する自端末ユーザCの注視評価情報「100%」を掛け合わせた値「64%」が算出され、他端末ユーザBに対する自端末ユーザCの注視評価情報が、「0%」から算出された値「64%」に補正される。
次に、各通信端末10の音量決定部153において、補正処理後の注視評価情報が高い程、音量が大きくなるように、他端末ユーザごとの音声の音量が決定される。
本実施例においては、注視評価情報が0%〜10%の他端末ユーザからの入力音声情報を、自通信端末10の最大増幅率の10%の増幅率で増幅することが決定され、注視評価情報が10%以上の他端末ユーザからの入力音声情報を、注視評価情報と同値の増幅率で増幅するように決定される。
例えば、通信端末10Xでは、他端末ユーザAからの入力音声情報を自通信端末10Xの最大増幅率の80%の増幅率で増幅することが決定され、他端末ユーザBからの入力音声情報を64%の増幅率で増幅することが決定され、他端末ユーザCおよびDからの入力音声情報を10%の増幅率で増幅することが決定される。
同様に通信端末10Aでは、他端末ユーザBからの入力音声情報を自通信端末10Aの最大増幅率の80%の増幅率で増幅することが決定され、他端末ユーザX、C、およびDからの入力音声情報を10%で増幅することが決定される。
同様に通信端末10Bでは、他端末ユーザAからの入力音声情報を自通信端末10Bの最大増幅率の100%の増幅率で増幅することが決定され、他端末ユーザX、C、およびDからの入力音声情報を10%で増幅することが決定される。
同様に通信端末10Cでは、他端末ユーザXからの入力音声情報を自通信端末10Cの最大増幅率の100%の増幅率で増幅することが決定され、他端末ユーザAからの入力音声情報を80%で増幅することが決定され、他端末ユーザBからの入力音声情報を64%で増幅することが決定され、他端末ユーザDからの入力音声情報を10%で増幅することが決定される。
同様に通信端末10Dでは、他端末ユーザX、およびA〜Cからの入力音声情報を自通信端末10Dの最大増幅率の10%で増幅することが決定される。
図7の下段に示した棒グラフは、各通信端末10で決定された、他端末ユーザごとの入力音声情報の増幅率を示したものである。
各通信端末10では、サービス管理サーバ20から受信された他端末ユーザの入力音声情報が、それぞれ決定された増幅率で増幅されて音声出力部16から出力される。
以上の本実施形態によれば、通信システムを利用して複数の相手との同時通話を行う際に、自端末ユーザが高い関心を示し注視している相手の音声だけではなく、自端末ユーザが注視している相手と会話をしている相手の音声をも音量を大きくし、聞き取り易くすることができる。
上述した第1実施形態において、第2の通信端末のユーザに対する第1の通信端末のユーザの注視評価情報や、第3の通信端末のユーザに対する第2の通信端末のユーザの注視評価情報を考慮して、他端末ユーザに対する自通信端末の注視評価情報を補正する場合について説明したが、さらに第4の通信端末のユーザに対する第3の通信端末のユーザの注視評価情報、第5の通信端末のユーザに対する第4の通信端末のユーザの注視評価情報・・・のように連鎖して取得される他端末ユーザの注視評価情報を考慮して、他端末ユーザに対する自端末ユーザの注視評価情報を補正するようにしてもよい。
このとき、連鎖により自通信端末からの距離(何台の通信端末を経由しているか)が離れる程、強制的に音量が低くなるようにしてもよい。このように構成することにより、自通信端末に関連が強い程、注視評価情報の値が大きくなるように音量を調整することができ、より自然で臨場感のある仮想空間を提供することができる。なお、少なくとも、他の通信端末における注視度合いを示す情報に基づいて、自通信端末から自通信端末のユーザへと出力される、他の通信端末に係る出力を調整すれば、複数の相手との同時通話をしやすくすることができるが、自通信端末の視線位置も用いると、更に、同時通話をしやすくすることができる。
《第2実施形態》
本発明の第2実施形態による通信端末として、第1実施形態で説明した処理に加え、自端末ユーザに対して高い関心を示す他端末ユーザの音声をも聞き取り易くするように処理を行う通信端末について説明する。
本実施形態による通信端末を利用した通信システムの構成は、第1実施形態で説明した通信システム1の構成と同様であるため、詳細な説明は省略する。
本実施形態による通信システム1において、各通信端末10で実行される処理のうち、図4のステップS1〜S7に該当する処理は第1実施形態で説明した場合と同様であるため、詳細な説明は省略する。
本実施形態において、ステップS8の注視評価情報が補正されるときの処理について、図8の具体例を用いて説明する。
本例では、図8の上段に示すように、ユーザAとユーザBとが会話をしているときに、注視点の検知対象とした5秒間のうち、ユーザXがユーザAの画像情報を4秒間注視し、ユーザAがユーザBの画像情報を4秒間注視し、ユーザBがユーザAの画像情報を5秒間注視し、ユーザCがユーザXの画像情報を5秒間注視し、さらに、ユーザXが発声している場合を示している。
この場合に、各通信端末10では、第1実施形態と同様に注視評価情報の生成処理および補正処理が行われ、さらに、自端末ユーザからの注視評価情報は高くないが、自端末ユーザに対する注視評価情報が高く、且つ、発声している他端末ユーザに対する注視評価情報を高くするように補正される。
例えば図8の例では、ユーザAに対するユーザXの注視評価情報は「80%」と最も高く、且つ、ユーザXが発声していことからユーザXがユーザAに声掛けをしていると判断される。この場合、ユーザAはユーザXの画像情報を注視していないが、ユーザXからの声掛けにユーザAが気付き易くするために、通信端末10Aで生成されたユーザXに対する注視評価情報が「0%」から、ユーザAに対するユーザXの注視評価情報と同値の「80%」に補正される。
そして、各通信端末10の音量決定部153において、補正処理後の注視評価情報が高い程、音量が大きくなるように他端末ユーザごとの音声の音量が決定され、これに基づいて他端末ユーザの音声情報が音声出力部16から出力される。
以上の本実施形態によれば、通信システムを利用して複数の相手との同時通話を行う際に、自端末ユーザが高い関心を示し注視している相手の音声、および自端末ユーザが注視している相手と会話をしている相手の音声の音量を大きくして聞き取り易くするとともに、自端末ユーザに対して声掛けをしている相手の音声の音量も大きくし、聞き取り易くすることができる。
上述した第1実施形態および第2実施形態においては、複数の他端末ユーザの音声の音量を調整する際に、自通信端末の最大増幅率に対する各他端末ユーザの入力音声情報の増幅率を変更させる場合について説明したが、自通信端末の最大音声レベルに対する各他端末ユーザの音声情報の音声レベルの割合を変更させることで調整してもよい。
また、上述した第1実施形態および第2実施形態において、いずれかのユーザが注視していた他端末ユーザから視線を外したときに、これに伴って直ちに音量が調整されてしまうと、数秒間余所見をしただけでも会話中の相手の音声がぶつ切りになってしまい、会話が聞き取りづらくなる可能性がある。
そのため各通信端末において、いずれかの他端末ユーザの入力音声情報を所定値以上の大きい音量から所定以下の小さい音量に変更する際は、所定時間(例えば10秒間)をかけて段階的にフェードアウトするように音量を低下させてもよい。このように調整することにより、より自然で臨場感のある仮想空間を提供することができる。
さらに各通信端末において、一連の会話中に所定回数以上、注視した特定の他端末ユーザがいることが検知された場合には、当該他端末ユーザに対する関心が高いと判断し、当該他端末ユーザの入力音声情報を所定値以上の音量から小さい音量の調整する際は、より長い時間(例えば20秒)を掛けて徐々にフェードアウトするように音量を低下させるようにしてもよい。
また上述した第1実施形態および第2実施形態においては、予めサービス管理サーバに登録された他端末ユーザを示す画像情報を取得して、自通信端末の表示部に表示する場合について説明したが、各通信端末に搭載された撮像装置で撮影されたユーザの画像情報を、サービス管理サーバを介して受信し、表示するようにしてもよい。
また上述した第1実施形態および第2実施形態においては、各通信端末で生成された注視評価情報がサービス管理サーバに送信される場合について説明したが、各通信端末で検知された注視点(自端末ユーザが注視している表示部内の位置を示す座標情報)をサービス管理サーバに送信し、サービス管理サーバで注視評価情報を生成して他の通信端末に送信するようにしてもよい。
また上述した第1実施形態および第2実施形態においては、注視評価情報に基づいて他の通信端末から受信した音声の音量を調整する場合について説明したが、当該注視評価情報に基づいて、表示部に表示された各ユーザを示す表示情報の表示状態(大きさ、輝度、色彩、鮮明度等)を調整するようにしてもよい。
1…通信システム
10、10A、10B、10C、10D、10X…通信端末
11…操作入力部
12…表示部
13…音声入力部
14…注視点検知部
15…音声制御部
16…音声出力部
20…サービス管理サーバ
21…通信制御部
22…画像管理部
23…音声管理部
24…注視評価情報管理部
30…ネットワーク
121A、121B、121C、121D…画像情報
122…氏名情報欄
151…注視評価情報生成部
152…注視評価情報補正部
153…音量決定部

Claims (6)

  1. 第1の通信端末および第2の通信端末を少なくとも含む他の通信端末と通信する自通信端末において、
    前記第1の通信端末の表示部に表示される前記第2の通信端末のユーザに係る表示情報に対する、前記第1の通信端末のユーザの注視度合いが高いほど、前記自通信端末から前記自通信端末のユーザへと出力される、前記第2の通信端末に係る音声の音量が大きくなるように出力を調整することを特徴とする通信端末。
  2. 前記第1の通信端末のユーザの注視度合いに基づいて、前記自通信端末の表示部に表示する前記第2の通信端末のユーザに係る表示情報の表示状態を調整することを特徴とする請求項1に記載の通信端末。
  3. 前記第1の通信端末のユーザに係る表示情報に対する前記自通信端末のユーザの注視度合いと、前記第1の通信端末のユーザの注視度合いとに基づいて、前記自通信端末から出力される、前記第2の通信端末に係る出力を調整する
    ことを特徴とする請求項1または2に記載の通信端末。
  4. 第1の通信端末および第2の通信端末を少なくとも含む他の通信端末と通信する自通信端末において、
    前記第1の通信端末のユーザの前記第2の通信端末に対する注視度合いが高いほど、自通信端末における、前記第2の通信端末に係る音声の音量が大きくなるように出力を調整することを特徴とする通信端末。
  5. 第1の通信端末および第2の通信端末を少なくとも含む他の通信端末と通信する自通信端末の出力制御方法において、
    表示された前記第2の通信端末のユーザに係る表示情報に対する、前記第1の通信端末のユーザの注視度合いが高いほど、前記第2の通信端末に係る音声の音量が大きくなるように出力を調整することを特徴とする通信端末の出力制御方法。
  6. 第1の通信端末および第2の通信端末を少なくとも含む他の通信端末と通信する自通信端末のコンピュータに、
    表示された前記第2の通信端末のユーザに係る表示情報に対する、前記第1の通信端末のユーザの注視度合いが高いほど、前記第2の通信端末に係る音声の音量が大きくなるように出力を調整する出力制御ステップ
    を実行させることを特徴とする通信端末の出力制御用プログラム。
JP2013203432A 2013-09-30 2013-09-30 通信端末、通信端末の出力制御方法、通信端末の出力制御用プログラム Active JP6079535B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013203432A JP6079535B2 (ja) 2013-09-30 2013-09-30 通信端末、通信端末の出力制御方法、通信端末の出力制御用プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013203432A JP6079535B2 (ja) 2013-09-30 2013-09-30 通信端末、通信端末の出力制御方法、通信端末の出力制御用プログラム

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2017007512A Division JP2017103801A (ja) 2017-01-19 2017-01-19 通信端末、通信端末の制御方法、通信端末の制御プログラム

Publications (2)

Publication Number Publication Date
JP2015070472A JP2015070472A (ja) 2015-04-13
JP6079535B2 true JP6079535B2 (ja) 2017-02-15

Family

ID=52836757

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013203432A Active JP6079535B2 (ja) 2013-09-30 2013-09-30 通信端末、通信端末の出力制御方法、通信端末の出力制御用プログラム

Country Status (1)

Country Link
JP (1) JP6079535B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7292343B2 (ja) * 2021-09-27 2023-06-16 ソフトバンク株式会社 情報処理装置、情報処理方法及び情報処理プログラム

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0730877A (ja) * 1993-07-12 1995-01-31 Oki Electric Ind Co Ltd 多地点間マルチメディア通信会議システム
JPH07162532A (ja) * 1993-12-07 1995-06-23 Nippon Telegr & Teleph Corp <Ntt> 多地点間通信会議コミュニケーション支援装置
JP4501037B2 (ja) * 1998-02-17 2010-07-14 ソニー株式会社 通信制御システムと通信装置および通信方法
JP4465880B2 (ja) * 1998-10-09 2010-05-26 ソニー株式会社 通信装置及び方法
JP2010200150A (ja) * 2009-02-26 2010-09-09 Toshiba Corp 端末、サーバ、会議システム、会議方法、会議プログラム
JP2010237884A (ja) * 2009-03-31 2010-10-21 Brother Ind Ltd 表示制御装置、表示制御方法、表示制御プログラム
JP2012165170A (ja) * 2011-02-07 2012-08-30 Nippon Telegr & Teleph Corp <Ntt> 会議装置、会議方法および会議プログラム

Also Published As

Publication number Publication date
JP2015070472A (ja) 2015-04-13

Similar Documents

Publication Publication Date Title
US8878678B2 (en) Method and apparatus for providing an intelligent mute status reminder for an active speaker in a conference
US10425239B2 (en) Crowd-sourced audio quality feedback in a conferencing system
US20160212374A1 (en) Displaying Video Call Data
US10586131B2 (en) Multimedia conferencing system for determining participant engagement
US20080134265A1 (en) Image display system
WO2018120127A1 (zh) 虚拟现实设备及其来电管理方法
JP2010074494A (ja) 会議支援装置
US20230410815A1 (en) Transcription generation technique selection
KR101376292B1 (ko) 통화 중 감정 분석 서비스 제공 방법 및 장치
US10469800B2 (en) Always-on telepresence device
CN107734153B (zh) 一种通话控制方法、终端及计算机可读存储介质
JP6079535B2 (ja) 通信端末、通信端末の出力制御方法、通信端末の出力制御用プログラム
US20180376212A1 (en) Modifying display region for people with vision impairment
JP2017103801A (ja) 通信端末、通信端末の制御方法、通信端末の制御プログラム
JP7095356B2 (ja) 通信端末及び会議システム
CN110825979A (zh) 一种备注方法、装置及移动终端
CN111835617A (zh) 用户头像调整方法、装置及电子设备
US11783837B2 (en) Transcription generation technique selection
US20230230416A1 (en) Establishing private communication channels
JP2016096395A (ja) テレビ会議装置、テレビ会議システム及びプログラム
TWI810104B (zh) 具通訊功能的互動數位相框系統及其方法
JP5177146B2 (ja) コミュニケーションシステム及びコミュニケーションプログラム
CN114125735B (zh) 耳机连接方法及装置、计算机可读存储介质和电子设备
US11627361B2 (en) Method to acoustically detect a state of an external media device using an identification signal
JP4850509B2 (ja) 通信端末装置及び通信端末装置における画像表示方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20151029

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160822

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160830

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160923

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20161018

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20161201

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20161220

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170102

R150 Certificate of patent or registration of utility model

Ref document number: 6079535

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150