JP2001274912A - 遠隔地会話制御方法および遠隔地会話システムならびに遠隔地会話制御プログラムを記録した記録媒体 - Google Patents

遠隔地会話制御方法および遠隔地会話システムならびに遠隔地会話制御プログラムを記録した記録媒体

Info

Publication number
JP2001274912A
JP2001274912A JP2000082535A JP2000082535A JP2001274912A JP 2001274912 A JP2001274912 A JP 2001274912A JP 2000082535 A JP2000082535 A JP 2000082535A JP 2000082535 A JP2000082535 A JP 2000082535A JP 2001274912 A JP2001274912 A JP 2001274912A
Authority
JP
Japan
Prior art keywords
conversation
participant
speaker
conference
participants
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2000082535A
Other languages
English (en)
Inventor
Hiroshi Hasegawa
浩 長谷川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Seiko Epson Corp
Original Assignee
Seiko Epson Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Seiko Epson Corp filed Critical Seiko Epson Corp
Priority to JP2000082535A priority Critical patent/JP2001274912A/ja
Publication of JP2001274912A publication Critical patent/JP2001274912A/ja
Withdrawn legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】離れた場所にいる複数(3人以上)の人が電話
回線などを使って音声による会議を行う際、誰が誰に話
しているのかなど状況を掴みにくい問題がある。 【解決手段】ある会議グループに属する会議参加者間の
情報を制御する会議制御サーバを有し、この会議制御サ
ーバは、当該会議グループに属する会議参加者の人数な
ど会議参加者に関する情報を把握する会話参加者管理部
42と、その会話参加者管理部42からの情報を受けて
当該会議グループにおける各会議参加者の仮想的なレイ
アウト情報を生成する仮想的レイアウト情報生成部43
と、ある会議参加者が発話したとき、その発話者の発話
する音声データおよび前記各会議参加者の仮想的なレイ
アウト情報に基づいて、当該発話者の音声が他の会議参
加者にはそれぞれどのように聞こえるかを求め、それを
個々の会議参加者対応の立体的な音声データとして出力
する音場生成部45とを有し、その立体的な音声データ
を個々の会議参加者に送出する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、複数の人が公衆電
話回線などを利用して音声のみで会議などの会話を可能
とする遠隔地会話制御方法および遠隔地会話システム並
びに遠隔地会話制御プログラムを記録した記録媒体に関
する。
【0002】
【従来の技術】遠隔地にいる複数の人が居ながらにして
会議などを行えるシステムとしては、従来より、テレビ
ジョン(TVという)会話システムや、TV電話会話シ
ステムなどがある。
【0003】これらのシステムはともにTVを用いてい
るので、お互いの顔を見ながら会話が行えるのが特徴
で、また、会議に必要な資料などをお互いに指示しなが
ら会話ができることから臨場感のある会話が可能とな
る。
【0004】しかし、これらシステムは、画像の伝送が
必要となるため、情報量が多く情報伝送に大きなコスト
がかかるという問題があり、さらに、現状の電話回線な
どを利用する場合には、伝送品質に問題もある。また、
相手側に自分の姿が見えるということは、上述したよう
な利点も多い反面、自分の居る場所や身につけている衣
服が他の会話参加者に見られるため、状況によっては、
好ましくない場合もあり、気軽に使えるシステムとは必
ずしもいえない。
【0005】これに対して、複数のユーザが電話などを
用いて音声のみによる会話システムもある。このような
音声のみによる会話システムは、会議といったかしこま
ったものばかりではなく、複数の知人と何らかのことに
ついて相談し合うといった日常の話し合いなどにも手軽
に利用できるのが特徴である。
【0006】
【発明が解決しようとする課題】しかしながら、このよ
うな音声のみを用いた会話システムは、現状では、モノ
ラルの音声のみを用いた通信であるため、会話参加者が
3人程度で、しかも、お互いによく知ったもの同志なら
それ程の問題はないが、会話参加者が多かったり、顔見
知りでない参加者が多い場合には、今、発話しているの
は誰なのか、主に誰に向かって発話しているのかなどの
状況をつかみにくいという問題がある。このため、効率
の良い会話進行が行えず、適切な話し合いができないの
が実情である。
【0007】そこで本発明は、離れた場所にいる複数
(3人以上)の人が音声のみによる会話を実現し、しか
も、発話している人が誰なのかや、主に誰に向かって発
話しているのかなどを容易に判別できるようにすること
で、音声のみであっても臨場感ある会話を可能とするこ
とを目的としている。
【0008】
【課題を解決するための手段】上述した目的を達成する
ために、本発明の遠隔地会話制御方法は、離れた位置に
いる少なくとも3人を1つの会話グループとしてこの会
話グループに属するそれぞれの会話参加者が所定のネッ
トワークを利用して当該会話グループに属する会話参加
者同志の会話を可能とする遠隔地会話制御方法であっ
て、前記会話グループに属する会話参加者の人数など会
話参加者に関する情報を把握し、それによって、当該会
話グループに属する各会話参加者の仮想的な配置などを
示す仮想的なレイアウト情報を生成し、当該会話グルー
プ内のある会話参加者が発話したとき、その発話者の発
話する音声データおよび前記各会話参加者の仮想的な配
置を示す仮想的なレイアウト情報に基づいて、当該発話
者の音声が他の会話参加者にはそれぞれどのように聞こ
えるかを求め、それを個々の会話参加者対応の立体的な
音声データとして出力し、その立体的な音声データを個
々の会話参加者に送出するようにしている。
【0009】また、本発明の遠隔地会話システムは、
【請求項22】 離れた位置にいる少なくとも3人を1
つの会話グループとしてこの会話グループに属するそれ
ぞれの会話参加者が所定のネットワークを利用して当該
会話グループに属する会話参加者同志の会話を可能とす
る遠隔地会話システムであって、前記会話グループに属
する会話参加者間の情報の制御を行う会話制御サーバを
有し、この会話制御サーバは、前記会話グループに属す
る会話参加者の人数など会話参加者に関する情報を把握
する会話参加者管理部と、この会話参加者管理部からの
情報を受けて当該会話グループに属する各会話参加者の
仮想的な配置などを示す仮想的なレイアウト情報を生成
する仮想的レイアウト情報生成部と、前記会話グループ
内のある会話参加者が発話したとき、その発話者の発話
する音声データおよび前記各会話参加者の仮想的なレイ
アウト情報に基づいて、当該発話者の音声が他の会話参
加者にはそれぞれどのように聞こえるかを求め、それを
個々の会話参加者対応の立体的な音声データとして出力
する音場生成部とを有している。
【0010】また、本発明の遠隔地会話制御プログラム
を記録した記録媒体は、離れた位置にいる少なくとも3
人を1つの会話グループとしてこの会話グループに属す
るそれぞれの会話参加者が所定のネットワークを利用し
て当該会話グループに属する会話参加者同志の会話を可
能とする遠隔地会話制御プログラムを記録した記録媒体
であって、その遠隔地会話制御プログラムは、前記会話
グループに属する会話参加者の人数など会話参加者に関
する情報を把握する手順と、それによって、当該会話グ
ループに属する各会話参加者の仮想的な配置などを示す
レイアウト情報を生成する手順と、当該会話グループ内
のある会話参加者が発話したとき、その発話者の発話す
る音声データおよび前記各会話参加者の仮想的なレイア
ウト情報に基づいて、当該発話者の音声が他の会話参加
者にはそれぞれどのように聞こえるかを求め、それを個
々の会話参加者対応の立体的な音声データとして出力す
る手順と、その立体的な音声データを個々の会話参加者
に送出する手順とを含んでいる。
【0011】これら各発明において、前記各会話参加者
の仮想的な配置は、前記会話グループに属する各会話参
加者が円卓を囲むような配置としている。
【0012】また、前記発話者の音声が他の会話参加者
にはそれぞれどのように聞こえるかを求める際、前記発
話者からの音声データに加えて、前記各会話参加者の仮
想的な配置上で当該発話者がどの会議参加者の方向を向
いて発話しているかを示す発話者の向きに関する情報を
用いる。
【0013】そして、前記発話者の向きに関する情報
は、個々の会話参加者の身体の動きに応じた角度検出が
可能なセンサを、個々の会話参加者の座る椅子または個
々の会話参加者の身体に設け、このセンサ出力により得
るようにしている。
【0014】また、前記発話者の音声が他の会話参加者
にはそれぞれどのように聞こえるかを求める際、前記発
話者からの音声データに加えて、前記各会話参加者の仮
想的な配置上で当該発話者がどの会話参加者の方向にど
れだけ移動したかを示す移動情報を用いる。
【0015】そして、前記どの会話参加者の方向にどれ
だけ移動したかの設定が可能な操作部を有するユーザイ
ンタフェースを個々の会話参加者ごとに用意するように
している。
【0016】さらに、上述した各発明において、前記発
話者の発話相手とされた会話参加者に対しては、当該発
話者からの音声の音量を大きくして出力することも可能
である。
【0017】このように本発明は、ある会話グループに
属する会話参加者の人数など会話参加者に関する情報に
基づいて、当該会話グループに属する各会話参加者の仮
想的な配置などを示す仮想的なレイアウト情報を生成す
る。そして、当該会話グループに属する会話参加者のな
かの誰かが発話したとき、その発話者の発話する音声デ
ータおよび前記仮想的なレイアウト情報に基づいて、当
該発話者の音声が他の会話参加者にはそれぞれどのよう
に聞こえるかを求め、それを個々の会話参加者対応の立
体的な音声データとして出力し、その立体的な音声デー
タを個々の会話参加者に送出するようにしている。
【0018】これによって、個々の会話参加者は、自分
の脳裏に各会話参加者の仮想的な配置を描きながら会話
を行うことができ、しかも、それぞれの位置にいる会議
参加者からの音声の聞こえ方が異なるので、現在、どの
会話参加者が発話しているのかを容易に判別することが
でき、音声だけであっても臨場感のある会話が可能とな
る。
【0019】また、各会話参加者の仮想的な配置は、前
記会話グループに属する各会話参加者が円卓を囲むよう
な配置とすることにより、各会話参加者は、自分を含め
た各会話参加者がどのような配置となっているのかを把
握しやすくなり、それを脳裏に描いて会話を行うことに
より、現在、どの会話参加者が発話しているのかを、よ
り一層、容易に判別することができ、より臨場感のある
会話が可能となる。
【0020】また、発話者の音声が他の会話参加者には
それぞれどのように聞こえるかを求める際、前記発話者
からの音声データに加えて、前記各会話参加者の仮想的
な配置上で当該発話者がどの会話参加者の方向を向いて
発話しているかを示す発話者の向きに関する情報を用い
るようにしているので、当該発話者が他の会話参加者の
うちのある特定の会話参加者に対して発話する場合、そ
の発話相手となる特定の会話参加者は、発話者があたか
も自分に話しかけているような感覚を持つことができ、
臨場感のある会話が可能となる。
【0021】また、このとき、その発話相手となる特定
の会話参加者に対しては、発話者からの音声の音量を大
きくすることで、より臨場感のある会話が可能となる。
【0022】なお、発話者の向きに関する情報は、個々
の会話参加者の身体の動きに応じた角度検出が可能なセ
ンサからの出力により得るようにしている。したがっ
て、ある特定の相手に発話する際、その発話者は各会話
参加者の仮想的な配置を脳裏に描きながら発話相手の方
に向くだけで、その向きが考慮された個々の会話参加者
対応の立体的な音声データを生成することができる。
【0023】また、前記発話者の音声が他の会話参加者
にはそれぞれどのように聞こえるかを求める際、前記発
話者からの音声データに加えて、前記各会話参加者の仮
想的な配置上で当該発話者がどの会話参加者の方向にど
れだけ移動したかを示す移動情報を用いるようにしてい
る。
【0024】これによって、当該発話者が他の会話参加
者のうちのある特定の会話参加者に対して発話する場
合、その発話相手に向かって近づいた状態で発話するよ
うな状況を作り出すことができ、音声のみの会話であっ
ても、より臨場感のある会話が可能となる。
【0025】なお、前記会話参加者の向きに関する情報
と当該発話者が発話相手に向かって移動したと仮定した
場合の移動量の両方を設定可能な操作部を有するユーザ
インタフェースを個々の会話参加者ごとに用意すること
で、各会話参加者は、どの発話相手にどの程度移動する
かの設定を容易に行うことができる。
【0026】また、このとき、前述同様、その発話相手
となる特定の会議参加者に対しては、発話者からの音声
の音量を大きくすることも可能で、それによって、ある
特定のの相手と直ぐそばで会話を行っているような状況
を得ることができる。
【0027】
【発明の実施の形態】以下、本発明の実施の形態につい
て説明する。なお、この実施の形態で説明する内容は、
本発明の遠隔地会話制御方法、遠隔地会話システムにつ
いての説明であるとともに、本発明の遠隔地会話制御プ
ログラムを記録した記録媒体における遠隔会話制御プロ
グラムの具体的な処理内容をも含むものである。
【0028】本発明は、前述したように、複数の人が公
衆電話回線などを用いて音声のみによる会話(ここでは
会議として説明する)を可能とするものである。
【0029】図1はこの実施の形態における遠隔地会議
システムの実施の形態を概略的に示すもので、ここで
は、会議参加者はA,B,C,Dの4人とし、これら会
議参加者A,B,C,Dは、公衆回線1(LANなどの
専用回線でもよいがここでは公衆電話回線とする)によ
って音声のみによる会議を行うものとし、それぞれの参
加者A,B,C,Dはそれぞれ音声入力用のマイクロホ
ン2と他の参加者からの音声が立体的に聞こえるように
ステレオヘッドホン3を装着している。なお、音が立体
的に聞こえるものであればヘッドホンでなくてもよく、
各会議参加者近傍にステレオ再生可能な2つのスピーカ
を設置することも可能である。
【0030】また、この公衆回線1には、各会議参加者
間の情報の制御を行う会話制御サーバ(ここでは電話会
議サーバと呼ぶ)4が接続され、この電話会議サーバ4
は、個々の会議参加者の音声を入力して立体的な音声デ
ータ(これについては後に説明する)を生成してそれを
各会議参加者に配信する処理を行うもので、この電話会
議サーバ4によって本発明の遠隔地会話システムが実現
できる。この電話会議サーバ4については後に詳細に説
明する。以下、本発明の実施の形態について説明する。
【0031】〔第1の実施の形態〕まず、本発明の第1
の実施の形態について説明する。図2は、この第1の実
施の形態を説明するための概略的な構成図であり、各会
議参加者側(この図2では会議参加者Aについてのみを
示している)は、図1で示したマイクロホン2とステレ
オヘッドホン3の他に、音声入力部11、回線インタフ
ェース部12、復号化部13、左側の音声出力部14
L、右側の音声出力部14Rなどを有する。なお、他の
会議参加者B,C,Dも同様に、マイクロホン2、ステ
レオヘッドホン3、音声入力部11、復号化部13、左
右の音声出力部14L,14Rを有した構成となってい
るが、この図2では、これら他の会議参加者B,C,D
についての図示は省略されている。
【0032】各会議参加者A,B,C,Dのうち、音声
を発した会議参加者(発話者という)からの音声はマイ
クロホン2を通して対応する音声入力部11で処理され
たのち、回線インタフェース12を介して公衆回線1に
送出され(この音声データはモノラルである)、図1で
示した電話会議サーバ4に送られる。
【0033】電話会議サーバ4は、発話者からの音声デ
ータをこの図2では図示されていない回線インタフェー
スを介して受け取り、この第1の実施の形態による立体
音声データ化処理(この処理内容については後に詳細に
説明する)を行う。そして、立体音声データとされた音
声データは、この図2では図示されていない符号化部で
符号化されたのち、公衆回線1に送出される。
【0034】そして、会議参加者側では、回線インタフ
ェース12を介して送られてきた立体音声データを受け
取る。その立体音声データは、復号化部13において復
号化されたのち、左側音声出力部14Lと右側音声出力
部14Rを経てステレオヘッドホン3から立体音声とし
て出力される。
【0035】図3は電話会議サーバ4の構成を示す図で
あり、図1で示した公衆回線1との接続を可能とするた
めの回線インターフェース部41、ある1つの会議グル
ープに属する会議グループ構成人数など会議参加者に関
する情報を把握する参加者管理部42、この参加者管理
部42からの会議参加者情報に基づいて当該会議グルー
プにおける各会議参加者の仮想的な配置などを示す仮想
的なレイアウト情報を生成する仮想的レイアウト情報生
成部43、立体音声を生成するに必要な音声データを記
憶する音声データ記憶部44、当該会議グループ内のあ
る会議参加者が発話したとき、その発話者の発話する音
声データと上述の各会議参加者の仮想的なレイアウト情
報に基づいて当該発話者の音声が他の会議参加者にはそ
れぞれどのように聞こえるかを計算して求め、それを個
々の会議参加者対応の立体的な音声データとして出力す
る音場生成部45、この音場生成部45で生成された立
体的な音声データを公衆回線1に載せることができるよ
うに符号化する符号化部46などを有した構成となって
いる。
【0036】音場生成部45は、それぞれの会議参加者
に対応して音場生成処理を行うための立体音声データ生
成部45A,45B,45C,45Dを有し、自分以外
の他の会議参加者からの音声データ(モノラル音声デー
タ)を入力し、仮想的レイアウト情報生成部43からの
仮想的なレイアウト情報に基づいて上述したような立体
音声データを生成する。
【0037】また、参加者管理部42は、この会議にど
のような参加者がいるかを、電話会議サーバ4への接続
状態など(回線インターフェース部41からの情報な
ど)により把握する。この場合、A,B,C,Dという
4人がこの電話会議サーバ4に対してアクセスしたこと
を参加者管理部42が認識し、このA,B,C,Dの4
人が会議参加者であることを知る。
【0038】仮想的レイアウト情報生成部43は、参加
者管理部42からの会議参加者についての情報を得る
と、それぞれの会議参加者をどのような配置とするかを
決定するとともに、発話者がどの会議者の方を向いてい
るかや、発話者がどの会議者に向かってどの程度移動し
たかなどを示す情報を考慮した仮想的なレイアウト情報
を生成する。ただし、この第1の実施の形態では、これ
ら発話者がどの会議者の方を向いているかや、どの会議
者に向かってどの程度移動したかなどを示す情報は考慮
せず、それぞれの会議参加者をどのような配置としたか
を示す会議参加者の配置情報を仮想的なレイアウト情報
として出力する。なお、上述の発話者がどの会議者の方
を向いているかや、発話者がどの会議者に向かってどの
程度移動したかなどを示す情報については、第2の実施
の形態、第3の実施の形態で説明する。
【0039】ところで、各会議者の配置の一例としては
図4に示すような仮想的な配置をここでは考える。すな
わち、会議参加者A,B,C,Dが円卓20を囲むよう
に座るような配置とし、参加者Aを基準に見た場合、会
議参加者Aから時計方向回りに、B,C,Dという順序
でそれぞれ等間隔に円卓20を囲むような仮想的な会議
場の配置を生成する。この仮想的レイアウト情報生成部
43によって生成された各会議参加者の配置など仮想的
なレイアウト情報は音場生成部45のそれぞれの立体音
データ生成部45A,45B,45C,75Dに与えら
れる。
【0040】この音場生成部45では、仮想的レイアウ
ト情報生成部43で生成された会議参加者の仮想的なレ
イアウト情報(この第1の実施の形態では各会議参加者
者の仮想的な配置情報)に基づいて、それぞれの会議参
加者に対して、現在、発話している会議参加者(発話
者)からの音声がどのように聞こえてくるかを計算して
求める。これは、音像定位制御技術を用いることで実現
できる。この音像定位制御技術というのは、簡単にいえ
ば、ある聴取者の特定方向から音が聞こえて来るような
知覚をその聴取者に生じさせるように音を再生する技術
であり、通常、聴取者はステレオヘッドホンを用いて音
を聴取する。
【0041】これは、音源の周波数成分の位相遅れや左
右の時間差、音量差などを制御することによって、本
来、モノラルで立体感のない音源の位置を擬似的に得る
ことができるようにしたものである。この技術を用いる
と、音源の位置の情報を得ることができるため、複数の
音源の聴き分けを容易に行うことができる。なお、この
音像定位制御技術については、「音響システムとディジ
タル処理」(電子情報通信学会 大賀寿郎 山崎芳男
金田豊共著)の231頁から236頁にも記載されてい
る既存の技術であるので、ここでは詳細には説明しな
い。
【0042】本発明では、図4に示すような会議参加者
の仮想的な配置についての情報およびそれぞれの会議参
加者からの音声データに基づいて、音像定位制御技術を
用いることで音場生成処理を行い、ある会議参加者の声
が他の会議参加者から見た場合、ある特定の方向から聞
こえてくるような立体的な音声データを生成してそれを
出力する。
【0043】図5はこの第1の実施の形態における音声
データの処理の流れを示すもので、この図5および前述
した図1から図4を参照しながら動作を説明する。な
お、図5では処理の流れ方向が図面の左から右方向であ
るため、図5において、会議参加者A,B,C,Dの各
音声入力側(マイクロホン2側)が図示の左端、各音声
出力入力側(ステレオヘッドホン3側)が図示の右端に
示されている。また、図5において、破線で囲った部分
が電話会議サーバ4が行う処理を示している。
【0044】まず、参加者管理部42は、この会議にど
のような参加者がいるかを、電話会議サーバ4への接続
状態など(回線インターフェース部41からの情報な
ど)により把握する。この場合、A,B,C,Dという
4人がこの電話会議サーバ4にアクセスを行ったことを
参加者管理部42が認識し、このA,B,C,Dの4人
が会議参加者であることを知る。
【0045】仮想的レイアウト情報生成部43は参加者
管理部42からの会議参加者についての情報を得ると、
それぞれの参加者をどのような配置とするかを決定す
る。ここでは、図4に示すような配置を決定したとす
る。すなわち、会議参加者A,B,C,Dが、参加者A
を基準に見た場合、Aから時計方向回りに、B,C,D
という順序で円卓20を囲むようにそれぞれ等間隔に位
置している仮想的なレイアウト情報を生成する。このよ
うに生成された会議参加者の仮想的なレイアウト情報は
音場生成部45におけるそれぞれの立体音声データ生成
部45A,45B,45C,45Dに与えられる。
【0046】これら各立体音声データ生成部45A,4
5B,45C,45Dでは、仮想的レイアウト情報生成
部43で生成された会議参加者の仮想的なレイアウト情
報と自分以外の他の会議参加者からの音声データに基づ
いて、それぞれの会議参加者に対して他の会議参加者か
らの音声がどのように聞こえてくるかを計算して求め
る。
【0047】たとえば、会議参加者Aが発話したとする
と、その音声データは図3で示す音声データ記憶部44
に保持されたのち、他の会議参加者B,C,D対応に設
けられた立体音声データ生成部45B,45C,45D
に送られる。この各立体音声データ生成部45B,45
C,45Dでは、各会議参加者の仮想的なレイアウト情
報に基づいて、会議参加者B,C,Dに対し、発話者で
ある会議参加者Aの音声がどの方向から聞こえてくるか
を計算して求める。
【0048】なお、ある発話者からの音声データは、図
3で示されるように、電話会議サーバ4の音声データ記
憶部44に一旦保持されるが、この音声データ記憶部4
4は参加者管理部42から何人の参加者が存在している
かの情報を得て、それぞれの参加者対応の記憶領域に音
声データを記憶して行く。このとき、それぞれの各立体
音声データ生成部45A,45B,45C,45Dで立
体音声データを生成する際、ある短い時間単位ごとに立
体音声データ生成処理を行うので、音声データ記憶部4
4のそれぞれの会議参加者対応の記憶領域は、ある短い
時間単位ごとの立体音声データ生成処理に必要な音声デ
ータを保持できる程度の容量があればよい。
【0049】ところで、ここでは、図4に示すような各
会議参加者の仮想的な配置を仮定しているので、会議参
加者Aからの音声が、会議参加者Bに対しては右斜め方
向から、会議参加者Cに対しては正面方向から、会議参
加者Dに対しては左斜め方向からそれぞれ聞こえてくる
ような音場生成処理を行う。このように、会議参加者
B,C,D対応の各立体音声データ生成部45B,45
C,45Dでは、参加者Aからの音声が特定の方向から
聞こえてくるような立体的な音声データを生成し、それ
らの立体音声データを公衆回線1に載せることができる
ように符号化部46で符号化したのち、図5では図示さ
れていない回線インターフェース41を介して、会議参
加者B,C,Dのそれぞれのステレオヘッドホン3に出
力する。
【0050】これによって、この例では、会議参加者B
にとっては会議参加者Aの音声が右斜め方向から聞こ
え、会議参加者Cにとっては会議参加者Aの音声が正面
方向から聞こえ、会議参加者Dにとっては会議参加者A
の音声が左斜め方向から聞こえてくるように感じる。
【0051】これは、他の会議参加者が発話した場合に
も同様の処理がなされ、他の会議参加者はその発話者の
音声が特定の方向から聞こえてくるように感じる。
【0052】たとえば、参加者Bが発話した場合には、
会議参加者Aにとっては会議参加者Bの音声は左斜め方
向から聞こえ、会議参加者Cにとっては会議参加者Bの
音声は右斜め方向から聞こえ、会議参加者Dにとっては
会議参加者Bの音声は正面方向から聞こえてくるように
感じる。また、参加者Cが発話した場合には、会議参加
者Aにとっては会議参加者Cの音声は正面方向から聞こ
え、会議参加者Bにとっては会議参加者Cの音声は左斜
め方向から聞こえ、会議参加者Dにとっては会議参加者
Aの音声は右斜め方向から聞こえてくるように感じる。
また、参加者Dが発話した場合には、会議参加者Aにと
っては会議参加者Dの音声は右斜め方向から聞こえ、会
議参加者Bにとっては会議参加者Dの音声は正面方向か
ら聞こえ、会議参加者Cにとっては会議参加者Dの音声
は左斜め方向から聞こえてくるように感じる。
【0053】このように、音場生成処理を行うことによ
って発話者の音声が特定の方向から聞こえてくるような
状況を作り出すことができる。これにより、会議の始め
にそれぞれの会議者参加者がたとえば自己紹介などを
し、さらに、それぞれの会議参加者が何回か発話してい
くうちに、それぞれの会議参加者は、自分以外の他の会
議参加者がどのような位置にいるかがわかってくるの
で、その仮想的な配置を脳裏に描きながら会議を行うこ
とができるようになる。
【0054】たとえば、この例では、会議参加者Aから
みれば、会議参加者Bは自分の右斜め方向に位置し、会
議参加者Cは自分の正面に位置し、会議参加者Dは自分
の左斜め方向に位置しているということがわかり、自分
を含めた4人の会議参加者があたかも円卓20を囲んで
会議しているかのような感覚を持つことができる。これ
は、他の会議参加者も同様で、自分の右斜め側には誰が
いて、正面には誰がいて、左斜め側には誰がいるという
ことが各自のステレオヘッドホン3から出力される立体
的な音声によって判断することができる。このように、
各会議参加者の配置を自分の脳裏に描きながら会議を進
めることにより、たとえ、顔見知りでないもの同志が会
議を行う場合であっても、今、発言している会議参加者
は誰かというのがわかり、円滑な会議進行が可能とな
る。
【0055】なお、この第1の実施の形態では、ある会
議参加者の発言した音声データは、通常の電話と同じモ
ノラルな音声データであるので、符号化などの処理を行
うことなくそのまま公衆電話回線などに載せることは可
能であるが、場合によっては符号化して送るようにする
ことも可能である。
【0056】〔第2の実施の形態〕この第2の実施の形
態は、上述した第1の実施の形態で説明した内容に、発
話している会議参加者(発話者)がどの会議参加者の方
向を向いて発話しているかを示す情報を加えたものであ
る。
【0057】図6は、この第2の実施の形態を説明する
ための概略的な構成図であり、図2とほぼ同様の構成で
あるが、この第2の実施の形態では、発話者がどの会議
参加者の方向を向いて発話しているかを示す情報が必要
となるため、その情報を得るための手段が各会議参加者
ごとに設けられる。なお、この図6では、参加者Aにつ
いてのみが図示され、他の会議参加者(この場合、会議
参加者B,C,D)についての図示は省略されている
が、他の会議参加者も同様の構成となっている。
【0058】この発話者がどの会議参加者の方向を向い
て発話しているかを示す情報を得るための手段として
は、たとえば、各会議参加者の座る回転可能な椅子(図
示せず)に角度センサを設けるようにしてもよく、ある
いは、各会議参加者が装着するステレオヘッドホン3に
加速度センサを設けるようにしてもよく、その手段は種
々考えられる。要は、各会議参加者がどのような方向を
向いているかを検出できるものであればよいが、この実
施の形態では、図6に示すように、図示されていない各
会議参加者の座る椅子に角度センサ30を取り付け、そ
の角度センサ30からの信号により、その会議参加者が
どの方向を向いたかの情報を方向検出部31によって得
る。
【0059】なお、その方向検出部31から得られる情
報は、たとえば、基準位置に対してどちらに何度向きを
変えたかの角度情報である。ここでの基準位置とは図4
のような円卓20を囲んだ配置を考えた場合、それぞれ
の会議参加者が円卓20の中心方向oに向いている状態
であるとする。たとえば、基準位置から時計方向回りに
30度向きを変えた場合は+30度、基準位置から反時
計方向回りに30度向きを変えた場合は−30度という
ような角度情報とすることが考えられる。
【0060】この図6が図2と異なるのは、上述したよ
うに角度情報を得るために角度センサ30および方向検
出部31を設けたことと、その角度情報を公衆回線1に
載せるためには符号化する必要があることから、符号化
部32を設けることにある。その他の部分は図2と同じ
であるので、同じ部分の説明はここでは省略する。
【0061】図7はこの第2の実施の形態における電話
会議サーバ4の構成を示す図であり、図3で示した第1
の実施の形態における電話会議サーバ4と同じ構成要素
を多く有するが、この第2の実施の形態においては、電
話会議サーバ4に対して、各会議参加者A,B,C,D
から音声データのみならず、椅子に取り付けられた角度
センサ30からの角度情報が与えられる。
【0062】この図7で示す第2の実施の形態における
電話会議サーバ4は、図3で示した第1の実施の形態に
おける電話会議サーバ4の構成と同様に、回線インター
フェース部41、参加者管理部42、仮想的レイアウト
情報生成部43、音声データ記憶部44、音場生成部4
5(立体音声データ生成部45A,45B,45C,4
5Dを有する)、符号化部46を有し、その他に、この
第3の実施の形態において必要な構成要素として、各会
議参加者側から符号化されて送られてくる音声データお
よび角度情報を復号化する復号化部47、復号化された
角度情報を保持する角度情報記憶部48が設けられる。
【0063】上述した角度情報記憶部48に記憶された
角度情報は、仮想的レイアウト情報生成部43に送られ
る。これによって、仮想的レイアウト情報生成部43
は、図4に示すような各会議参加者A,B,C,Dの配
置において、角度情報記憶部48から読み出された角度
情報に基づいて各会議参加者A,B,C,Dがどのよう
な方向を向いて発言しているかの情報を考慮した仮想的
なレイアウト情報を生成する。
【0064】そして、各立体音声データ生成部45A,
45B,45C,45Dでは、発話者の音声データとそ
の発話者がどのような方向を向いて発言しているかの情
報を考慮した仮想的なレイアウト情報に基づいて、その
音声が他の会議参加者にはどのように聞こえるかを計算
して求め、求められた立体音声データを符号化部46で
符号化して回線インタフェース41を介して出力する。
【0065】図8はこの第2の実施の形態における音声
データの処理の流れを示すもので、第1の実施の形態で
用いた図5に対応するものである。この図8が図5と大
きく異なるのは、前述したように、それぞれの会議参加
者からは、音声データの他に角度情報が出力され、これ
らの情報を符号化したのちに、公衆回線1に送出する処
理が加わることであり、また、電話会議サーバ4側で
は、会議参加者側から送られてきた情報を復号化して、
音声データと角度情報とを取り出す処理を行ったのち
に、この角度情報を用いて各会議参加者A,B,C,D
がどのような方向を向いて発言しているかの情報を考慮
した仮想的なレイアウト情報を生成して、その角度情報
が考慮された仮想的なレイアウト情報と会議参加者から
の音声情報に基づいて音場生成を行うことが第1の実施
の形態と異なっている。その他の処理は第1の実施の形
態と殆ど同じであるので、同じ処理についてはここでは
詳細には説明しない。以下、この図8とすでに説明した
図7、図6、図4、図1などを参照しながら説明する。
【0066】たとえば今、会議参加者Aが図4に示すよ
うな仮想的な配置において、会議参加者Bの方を向いて
Bに向かって発話することを考える。この状態を図9に
示す。この図9における各会議参加者の配置関係は図4
と同じである。会議参加者Aは円卓の中心oを向いてい
る状態を初期状態とする。その初期状態から、会議参加
者Aは仮想的な配置を脳裏に描きながら自分の椅子を回
して会議参加者Bの方向に向いたとする。このときの椅
子の回転角度が基準線Lに対して、−θであったとする
と、それが図6に示す角度センサ30で検出され方向検
出部31から角度情報して出力される。
【0067】この状態で会議参加者Aは会議参加者Bに
対して発話すると、その音声データと角度情報は符号化
されて公衆回線1に送出され、電話会議サーバ4に送ら
れる。電話会議サーバ4では、送られてきた会議参加者
Aからの情報を図7で示した復号化部47で復号化し、
音声データと角度情報とを取り出す。その音声データ
は、音声データ記憶部44に保持されたのち、自分以外
の立体音声データ生成部(この場合は、立体音声データ
生成部45B,45C,45D)に送られ、角度情報は
角度情報記憶部48に保持されたのち、仮想的レイアウ
ト情報生成部43に送られる。
【0068】これによって、会議参加者B,C,Dに対
応する立体音声データ生成部45B,45C,45Dで
は、会議参加者Aからの音声データと仮想的レイアウト
情報生成部43からの会議参加者Aがどの方向を向いた
かを示す角度情報を考慮した仮想的なレイアウト情報か
ら、それぞれの会議参加者B,C,Dには会議参加者A
の音声がどのように聞こえてくるかを計算し、各会議参
加者B,C,Dごとの立体音声データを得る。
【0069】すなわち、この例では、会議参加者Aが会
議参加者Bの方向を向いて発言した場合であり、このよ
うな場合においては、会議参加者Bに対しては会議者参
加者Aの音声はどのように聞こえ、同様に、会議参加者
Cに対しては会議者参加者Aの音声はどのように聞こ
え、同様に、会議参加者Dに対しては会議者参加者Aの
音声はどのように聞こえるかを計算して求める。
【0070】このようにして、各会議参加者B,C,D
に対する会議参加者Aの立体音声データを得て、それぞ
れの立体音声データは符号化されたのち、公衆回線1上
に送出され各会議参加者B,C,Dに送られる。
【0071】各会議参加者B,C,Dでは、電話会議サ
ーバ4から送られてきた立体的な音声データをそれぞれ
のヘッドホン3で聞くことにより、会議参加者Aの音声
がそれぞれの会議参加者B,C,Dによって聞こえ方が
大きく異なる。この場合は、特に会議参加者Bには、会
議参加者Aがあたかも自分の方を向いて発言しているよ
うに聴こえる。
【0072】このような制御を行うことで、発話者が特
定の会議参加者に向かって発話すると、発話者以外のそ
れぞれの会議参加者には発話者からの音声の聞こえ方が
それぞれ変わってくるため、現在、どの会議参加者が発
話しているかを、より明確に区別することができ、特
に、発話相手となる会議参加者は発話者が自分に向かっ
て発話しているということが明確にわかり、会議の進行
がより円滑になる。
【0073】なお、このとき、主な発話相手となった会
議参加者(上述した例では、会議参加者B)に対する音
量を大きくする制御を加えるようにすることも可能で、
それによって、お互いに顔を向かい合わせて会話してい
るかのような臨場感のある会話が可能となる。
【0074】〔第3の実施の形態〕この第3の実施の形
態は、会議参加者が仮想的に配置された仮想会議の場に
おいて、その仮想会議の場で自分が他の会議参加者の誰
かに向かって移動できるような状況を仮想的に作り出す
ことを可能としたものである。
【0075】図10は、この第3の実施の形態を説明す
るための概略的な構成図であり、図6とほぼ同様の構成
であるが、この第3の実施の形態では、発話している会
議参加者がどの会議参加者に向かってどの程度移動した
かを示す情報が必要となるため、その情報を得るための
手段が各会議参加者ごとに設けられる。なお、この図1
0では、参加者Aについてのみが図示され、他の会議参
加者(この場合、会議参加者B,C,D)についての図
示は省略されているが、他の会議参加者も同様の構成と
なっている。
【0076】このどの会議参加者がどの会議参加者に向
かってどの程度移動したかを示す情報(以下、どの方向
にどの程度移動したかを示す情報を総合して移動情報と
いう)を得るための手段としては、たとえば、図10に
示すようなユーザインタフェース50が考えられる。こ
の図10で示したユーザインタフェース50としては、
左右と上下の4方向を向いた矢印形状の操作ボタンBT
1,BT2,BT3,BT4からなる移動情報設定手段
51や、360度の任意の方向に傾倒操作可能な操作レ
バー52aを有するジョイスティックのような移動情報
設定手段52などが考えられる。
【0077】これらのユーザインタフェースにおいて、
4つの操作ボタンBT1,BT2,BT3,BT4から
なる移動情報設定手段51は、これらの操作ボタンBT
1,BT2,BT3,BT4を選択操作することによっ
て、4方向の指示が可能であるので、図4に示すような
会議参加者の配置であればこの移動情報設定手段51で
十分である。また、任意の方向に傾倒操作可能な操作レ
バー52aを有するジョイスティックのような移動情報
設定手段52は、操作レバー52aを傾倒操作すること
によって360度の任意の方向を指示することができる
ので、多数の会議参加者が円卓を囲むような場合にも適
用できる。
【0078】なお、移動情報設定手段51は、たとえ
ば、図4のような会議参加者配置を想定したとき、自分
(会議参加者Aとする)が、たとえば、主な会話相手と
して会議参加者Bを選び、かつ、会議参加者Bの方に向
かって移動したい場合には、図4のような会議参加者配
置を脳裏に描きながら操作ボタンBT2を押し、主な会
話相手として会議参加者Cを選び、かつ、会議参加者C
の方に向かって移動したい場合には、図4のような会議
参加者配置を脳裏に描きながら操作ボタンBT3を押
し、主な会話相手として会議参加者Dを選び、かつ、会
議参加者Dの方に向かって移動したい場合には、図4の
ような会議参加者配置を脳裏に描きながら操作ボタンB
T4を押す。そして、それぞれの操作ボタンBT1,B
T2,BT3,BT4を押している時間が移動量を表す
ようにする。
【0079】一方、移動情報設定手段52は、垂直方向
に設けられた操作レバー52aを任意の方向に傾倒する
ことができるようになっていて、その操作レバー52a
を傾倒する方向によって、主な会話相手を選択すること
ができる。
【0080】ここでは、図4のような会議参加者配置を
想定しているので、自分(会議参加者がAとする)が、
たとえば、主な会話相手として会議参加者Bを選び、か
つ、会議参加者Bの方に向かって移動したい場合には、
図4のような会議参加者の仮想的な配置を脳裏に描きな
がら操作レバー52aを会議参加者B方向に傾倒し、主
な会話相手として会議参加者Cを選び、かつ、会議参加
者Cの方に向かって移動したい場合には、図4のような
会議参加者の仮想的な配置を脳裏に描きながら操作レバ
ー52aを会議参加者C方向に傾倒し、主な会話相手と
して会議参加者Dを選び、かつ、会議参加者Dの方に向
かって移動したい場合には、図4のような会議参加者の
仮想的な配置を脳裏に描きながら操作レバー52aを会
議参加者D方向に傾倒する。そして、操作レバー52a
をそれぞれの方向に傾倒したときその傾倒している時間
が移動量を表すようにする。
【0081】そして、発話者によりこのようなユーザイ
ンタフェース50の操作がなされると、移動量検出部5
3からその操作に応じた移動情報が出力され、その移動
情報は音声データとともに符号化不32で符号化された
のち、回線インタフェース部12を介して公衆回線1に
送出される。
【0082】なお、移動情報を設定する手段は、その他
の手段を用いてもよい。要は、各会議参加者がどの方向
に、どの程度移動したかを示す情報を得られるものであ
ればよい。
【0083】ところで、図10が図6と異なるのは、上
述したように角度情報の代わりに各会議参加者がユーザ
インタフェース50を操作することによって移動情報検
出部53から得られる移動情報を用いる点であり、その
他の部分は図6と同じであるので、同じ部分の説明はこ
こでは省略する。
【0084】図11はこの第3の実施の形態における電
話会議サーバ4の構成を示す図であり、構成的には第2
の実施の形態で用いた図7と殆ど同じであるので、同じ
部分には同一符号を付すことでその説明は省略する。こ
の図11では、各会議参加者からは、音声データの他
に、上述したように、図10で示したようなユーザイン
タフェース50を各会議参加者が操作することによる移
動情報が出力される。この移動情報は音声データととも
に符号化されたのち、公衆回線1に送出される。そし
て、電話会議サーバ4では、送られてきた符号化後の音
声データおよび移動情報を回線インタフェース41を介
して受け、復号化部47によって復号化したのち、音声
データは音声データ記憶部44によって保持し、移動情
報は移動情報記憶部48で保持する。
【0085】そして、仮想的レイアウト情報生成部43
は、図4に示すような各会議参加者A,B,C,Dの配
置において、移動情報記憶部48から読み出された移動
情報に基づいて、ある発話者がどのような方向にどれだ
け移動したかの情報を考慮した仮想的なレイアウト情報
を生成する。
【0086】そして、各立体音声データ生成部45A,
45B,45C,45Dでは、その発話者の音声データ
と当該発話者の移動情報(どのような方向にどれだけ移
動したか情報)が考慮された仮想的なレイアウト情報に
基づいて、その音声が他の会議参加者にはどのように聞
こえるかを計算して求め、求められた立体的な音声デー
タを符号化部46で符号化して回線インタフェース41
を介して出力する。
【0087】図12はこの第3の実施の形態における音
声データの処理の流れを示すもので、第2の実施の形態
で用いた図8に対応するものである。この図12は図8
と殆ど同じであり、前述したように、それぞれの会議参
加者からは、角度情報の代わりに移動情報が出力される
点が異なり、この移動情報を考慮した仮想的なレイアウ
ト情報を生成して、その仮想的なレイアウト情報と会議
参加者からの音声データに基づいて音場生成を行う。そ
れ以外は図8と殆ど同じであるので、同じ処理について
はここでは詳細には説明しない。
【0088】たとえば今、会議参加者Aが図4に示した
各会議参加者の仮想的な配置を自分の脳裏に描いて、そ
の仮想的な配置において会議参加者Bに向かって発話
し、かつ、会議参加者Aは会議参加者Bの方向に近づい
て行き、Bに近い位置で発話をしようとする状況を作り
出すことを考える。
【0089】会議参加者Aは自分に用意されたユーザイ
ンタフェース50(移動情報設定手段52とする)にお
いて、自分の脳裏に描いた会議参加者の仮想的な配置に
おいて、会議参加者Bの方向に操作レバー52aを傾倒
操作する。このとき、どの程度、会議参加者Bに近づく
かは、ここでは操作レバー52aの傾倒操作時間で決ま
るとしているので、適当な時間だけ操作レバー52aを
傾倒操作する。
【0090】この状態で会議参加者Aは会議参加者Bに
対して発話を行うと、その音声データと移動情報は符号
化されて、公衆回線1に送出され、電話会議サーバ4に
送られる。電話会議サーバ4では、送られてきた会議参
加者Aからの情報を復号化し、音声データと移動情報と
を取り出す。その音声データは、自分以外の音場生成部
に送られ、移動情報は仮想的レイアウト情報生成部43
に送られる。そして、この仮想的レイアウト情報生成部
43からは、移動情報を考慮したレイアウト情報を生成
して、それを会議参加者B,C,Dに対応する立体音声
データ生成部45B,45C,45Dに送る。
【0091】これによって、立体音声データ生成部45
B,45C,45Dでは、会議参加者Aからの音声デー
タと会議参加者Aがどの方向にどの程度移動したかを示
す移動情報とから、それぞれの会議参加者には会議参加
者Aの音声がどのように聞こえてくるかを計算し、各会
議参加者B,C,Dごとの立体音声データを得る。
【0092】すなわち、この例では、会議参加者Aが会
議参加者Bの方向に所定量移動して発話した場合であ
り、このような場合においては、会議参加者Bに対して
は会議者参加者Aの音声はどのように聞こえ、同様に、
会議参加者Cに対しては会議者参加者Aの音声はどのよ
うに聞こえ、同様に、会議参加者Dに対しては会議者参
加者Aの音声はどのように聞こえるかを計算して求め
る。
【0093】このようにして、各会議参加者B,C,D
に対する会議参加者Aの立体音声データを得て、それぞ
れの立体音声データは符号化されたのち、公衆回線1上
に送出され各会議参加者B,C,Dに送られる。
【0094】各会議参加者B,C,Dでは、このような
立体的な音声データをそれぞれが装着しているステレオ
ヘッドホン3で聞くことにより、会議参加者Aの音声が
それぞれの会議参加者B,C,Dによって聞こえ方が大
きく異なる。この場合は、特に会議参加者Bには、会議
参加者Aがあたかも自分の近くまで移動してきて自分に
向かって発話しているように聞こえる。
【0095】このような制御を行うことで、発話者が特
定の会議参加者に向かって発言すると、発話者以外のそ
れぞれの会議参加者には発話者からの音声の聞こえ方が
それぞれ変わってくるため、現在、どの会議参加者が発
話しているかを、より明確に区別することができ、特
に、発話相手となる会議参加者は発話者が自分の近くま
で移動してきて自分に向かって話しかけているように聞
こえ、臨場感のある会話が可能となる。
【0096】なお、このとき、第2の実施の形態同様、
主な発言相手となった会議参加者(上述した例では、会
議参加者B)に対する音量を大きくする制御を加えるよ
うにすることも可能で、それによって、誰に向かって発
話しているのかがより明確になる。
【0097】なお、本発明は以上説明した実施の形態に
限定されるものではなく、本発明の要旨を逸脱しない範
囲で種々変形実施可能となるものである。たとえば、こ
れまで説明した各実施の形態において、電話会議サーバ
4は専用に設けられた電話会議サーバを使用した例で説
明したが、これは、専用のものではなく、図13に示す
ように、ある会議参加者が電話会議サーバを兼用するよ
うなシステムも構築できる。図13の例では、会議参加
者Aが電話会議サーバを兼用したシステムを示してい
る。このようなシステムであっても前述の実施の形態で
説明したような処理は可能となる。
【0098】また、以上説明した本発明の処理を行う遠
隔地会話制御プログラムは、フロッピィディスク、光デ
ィスク、ハードディスクなどの記録媒体に記録させてお
くことができ、本発明はその記録媒体をも含むものであ
る。また、ネットワークから処理プログラムを得るよう
にしてもよい。
【0099】
【発明の効果】以上説明したように本発明によれば、あ
る会話グループに属する会話参加者の人数など会話参加
者に関する情報に基づいて、当該会話グループに属する
各会話参加者の仮想的な配置などを示す仮想的なレイア
ウト情報を生成する。そして、当該会話グループに属す
る会話参加者のなかの誰かが発話したとき、その発話者
の発話する音声データおよび仮想的なレイアウト情報に
基づいて、当該発話者の音声が他の会話参加者にはそれ
ぞれどのように聞こえるかを求め、それを個々の会話参
加者対応の立体的な音声データとして出力し、その立体
的な音声データを個々の会話参加者に送出するようにし
ている。
【0100】これによって、個々の会話参加者は、自分
の脳裏に各会話参加者の仮想的な配置を描きながら会話
を行うことができ、しかも、それぞれの位置にいる会議
参加者からの音声の聞こえ方が異なるので、現在、どの
会話参加者が発話しているのかを容易に判別することが
でき、音声だけであっても臨場感のある会話が可能とな
る。
【0101】また、発話者の音声が他の会話参加者には
それぞれどのように聞こえるかを求める際、前記発話者
からの音声データに加えて、前記各会話参加者の仮想的
な配置上で当該発話者がどの会話参加者の方向を向いて
発話しているかを示す発話者の向きに関する情報を用い
るようにしているので、当該発話者が他の会話参加者の
うちのある特定の会話参加者に対して発話する場合、そ
の発話相手となる特定の会話参加者は、発話者があたか
も自分に話しかけているような感覚を持つことができ、
臨場感のある会話が可能となる。このとき、その発話相
手となる特定の会議参加者に対しては、発話者からの音
声の音量を大きくすることも可能で、それによって、あ
る特定のの相手と直ぐそばで会話を行っているような状
況を得ることができる。
【0102】また、前記発話者の音声が他の会話参加者
にはそれぞれどのように聞こえるかを求める際、前記発
話者からの音声データに加えて、前記各会話参加者の仮
想的な配置上で当該発話者がどの会話参加者の方向にど
れだけ移動したかを示す移動情報を用いるようにしてい
る。
【0103】これによって、当該発話者が他の会話参加
者のうちのある特定の会話参加者に対して発話する場
合、その発話相手に向かって近づいた状態で発話するよ
うな状況を作り出すことができ、音声のみの会話であっ
ても、より臨場感のある会話が可能となる。また、この
とき、前述同様、その発話相手となる特定の会議参加者
に対しては、発話者からの音声の音量を大きくすること
も可能で、それによって、ある特定のの相手と直ぐそば
で会話を行っているような状況を得ることができる。
【図面の簡単な説明】
【図1】本発明の遠隔地会話システムの概略構成を示す
図である。
【図2】本発明の第1の実施の形態による遠隔地会話シ
ステムのある会議参加者(会議参加者A)側の構成を示
す図である。
【図3】本発明の第1の実施の形態による遠隔地会話シ
ステムにおいて用いられる電話会議サーバの構成を示す
図である。
【図4】本発明における各会議参加者の仮想的な配置例
を示す図である。
【図5】本発明の第1の実施の形態による遠隔地会話シ
ステムの処理の流れを説明する図である。
【図6】本発明の第2の実施の形態による遠隔地会話シ
ステムのある会議参加者(会議参加者A)側の構成を示
す図である。
【図7】本発明の第2の実施の形態による遠隔地会話シ
ステムにおいて用いられる電話会議サーバの構成を示す
図である。
【図8】本発明の第2の実施の形態による遠隔地会話シ
ステムの処理の流れを説明する図である。
【図9】本発明の第2の実施の形態において発話しよう
とする会議参加者が発話相手となる会議参加者の方向に
向きを変える動作例を図4で示した各会議参加者の仮想
的な配置例を用いて説明する図である。
【図10】本発明の第3の実施の形態による遠隔地会話
システムのある会議参加者(会議参加者A)側の構成を
示す図である。
【図11】本発明の第3の実施の形態による遠隔地会話
システムにおいて用いられる電話会議サーバの構成を示
す図である。
【図12】本発明の第3の実施の形態による遠隔地会話
システムの処理の流れを説明する図である。
【図13】図1で示した本発明の遠隔地会話システムの
変形例の概略構成を示す図である。
【符号の説明】
1 公衆回線 2 マイクロホン 3 ステレオヘッドホン 4 電話会議サーバ 30 角度センサ 42 参加者管理部 43 仮想的レイアウト情報生成部 45 音場生成部 45A,45B,45C,45D 立体音声データ生成
部 50 ユーザインタフェース A,B,C,D 会議参加者
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) H04S 7/00 H04S 7/00 Z

Claims (21)

    【特許請求の範囲】
  1. 【請求項1】 離れた位置にいる少なくとも3人を1つ
    の会話グループとしてこの会話グループに属するそれぞ
    れの会話参加者が所定のネットワークを利用して当該会
    話グループに属する会話参加者同志の会話を可能とする
    遠隔地会話制御方法であって、 前記会話グループに属する会話参加者の人数など会話参
    加者に関する情報を把握し、 それによって、当該会話グループに属する各会話参加者
    の仮想的な配置などを示す仮想的なレイアウト情報を生
    成し、 当該会話グループ内のある会話参加者が発話したとき、
    その発話者の発話する音声データおよび前記各会話参加
    者の仮想的な配置を示す仮想的なレイアウト情報に基づ
    いて、当該発話者の音声が他の会話参加者にはそれぞれ
    どのように聞こえるかを求め、それを個々の会話参加者
    対応の立体的な音声データとして出力し、その立体的な
    音声データを個々の会話参加者に送出することを特徴と
    する遠隔地会話制御方法。
  2. 【請求項2】 前記各会話参加者の仮想的な配置は、前
    記会話グループに属する各会話参加者が円卓を囲むよう
    な配置であることを特徴とする請求項1に記載の遠隔地
    会話制御方法。
  3. 【請求項3】 前記発話者の音声が他の会話参加者には
    それぞれどのように聞こえるかを求める際、前記発話者
    からの音声データに加えて、前記各会話参加者の仮想的
    な配置上で当該発話者がどの会議参加者の方向を向いて
    発話しているかを示す発話者の向きに関する情報を用い
    ることを特徴とする請求項1または2記載の遠隔地会話
    制御方法。
  4. 【請求項4】 前記発話者の向きに関する情報は、個々
    の会話参加者の身体の動きに応じた角度検出が可能なセ
    ンサを、個々の会話参加者の座る椅子または個々の会話
    参加者の身体に設け、このセンサ出力により得ることを
    特徴とする請求項3記載の遠隔地会話制御方法。
  5. 【請求項5】 前記発話者の音声が他の会話参加者には
    それぞれどのように聞こえるかを求める際、前記発話者
    からの音声データに加えて、前記各会話参加者の仮想的
    な配置上で当該発話者がどの会話参加者の方向にどれだ
    け移動したかを示す移動情報を用いることを特徴とする
    請求項1または2記載の遠隔地会話制御方法。
  6. 【請求項6】 前記どの会話参加者の方向にどれだけ移
    動したかの設定が可能な操作部を有するユーザインタフ
    ェースを個々の会話参加者ごとに用意することを特徴と
    する請求項5記載の遠隔地会話制御方法。
  7. 【請求項7】 前記発話者の発話相手とされた会話参加
    者に対しては、当該発話者からの音声の音量を大きくし
    て出力することを特徴とする請求項3から6のいずれか
    に記載の遠隔地会話制御方法。
  8. 【請求項8】 離れた位置にいる少なくとも3人を1つ
    の会話グループとしてこの会話グループに属するそれぞ
    れの会話参加者が所定のネットワークを利用して当該会
    話グループに属する会話参加者同志の会話を可能とする
    遠隔地会話システムであって、 前記会話グループに属する会話参加者間の情報の制御を
    行う会話制御サーバを有し、この会話制御サーバは、 前記会話グループに属する会話参加者の人数など会話参
    加者に関する情報を把握する会話参加者管理部と、 この会話参加者管理部からの情報を受けて当該会話グル
    ープに属する各会話参加者の仮想的な配置などを示す仮
    想的なレイアウト情報を生成する仮想的レイアウト情報
    生成部と、 前記会話グループ内のある会話参加者が発話したとき、
    その発話者の発話する音声データおよび前記各会話参加
    者の仮想的なレイアウト情報に基づいて、当該発話者の
    音声が他の会話参加者にはそれぞれどのように聞こえる
    かを求め、それを個々の会話参加者対応の立体的な音声
    データとして出力する音場生成部と、 を有することを特徴とする遠隔地会話システム。
  9. 【請求項9】 前記各会話参加者の仮想的な配置は、前
    記会話グループに属する各会話参加者が円卓を囲むよう
    な配置であることを特徴とする請求項8に記載の遠隔地
    会話システム。
  10. 【請求項10】 前記発話者の音声が他の会話参加者に
    はそれぞれどのように聞こえるかを求める際、前記発話
    者からの音声データに加えて、前記各会話参加者の仮想
    的な配置上で当該発話者がどの会議参加者の方向を向い
    て発話しているかを示す発話者の向きに関する情報を用
    いることを特徴とする請求項8または9記載の遠隔地会
    話システム。
  11. 【請求項11】 前記発話者の向きに関する情報は、個
    々の会話参加者の身体の動きに応じた角度検出が可能な
    センサを、個々の会話参加者の座る椅子または個々の会
    話参加者の身体に設け、このセンサ出力により得ること
    を特徴とする請求項10記載の遠隔地会話システム。
  12. 【請求項12】 前記発話者の音声が他の会話参加者に
    はそれぞれどのように聞こえるかを求める際、前記発話
    者からの音声データに加えて、前記各会話参加者の仮想
    的な配置上で当該発話者がどの会話参加者の方向にどれ
    だけ移動したかを示す移動情報を用いることを特徴とす
    る請求項8または9記載の遠隔地会話システム。
  13. 【請求項13】 前記どの会話参加者の方向にどれだけ
    移動したかの設定が可能な操作部を有するユーザインタ
    フェースを個々の会話参加者ごとに用意することを特徴
    とする請求項12記載の遠隔地会話システム。
  14. 【請求項14】 前記発話者の発話相手とされた会話参
    加者に対しては、当該発話者からの音声の音量を大きく
    して出力することを特徴とする請求項10から13のい
    ずれかに記載の遠隔地会話システム。
  15. 【請求項15】 離れた位置にいる少なくとも3人を1
    つの会話グループとしてこの会話グループに属するそれ
    ぞれの会話参加者が所定のネットワークを利用して当該
    会話グループに属する会話参加者同志の会話を可能とす
    る遠隔地会話制御プログラムを記録した記録媒体であっ
    て、その遠隔地会話制御プログラムは、 前記会話グループに属する会話参加者の人数など会話参
    加者に関する情報を把握する手順と、 それによって、当該会話グループに属する各会話参加者
    の仮想的な配置などを示すレイアウト情報を生成する手
    順と、 当該会話グループ内のある会話参加者が発話したとき、
    その発話者の発話する音声データおよび前記各会話参加
    者の仮想的なレイアウト情報に基づいて、当該発話者の
    音声が他の会話参加者にはそれぞれどのように聞こえる
    かを求め、それを個々の会話参加者対応の立体的な音声
    データとして出力する手順と、 その立体的な音声データを個々の会話参加者に送出する
    手順と、 を含むことを特徴とする遠隔地会話制御プログラムを記
    録した記録媒体。
  16. 【請求項16】 前記各会話参加者の仮想的な配置は、
    前記会話グループに属する各会話参加者が円卓を囲むよ
    うな配置であることを特徴とする請求項15に記載の遠
    隔地会話制御プログラムを記録した記録媒体。
  17. 【請求項17】 前記発話者の音声が他の会話参加者に
    はそれぞれどのように聞こえるかを求める際、前記発話
    者からの音声データに加えて、前記各会話参加者の仮想
    的な配置上で当該発話者がどの会議参加者の方向を向い
    て発話しているかを示す発話者の向きに関する情報を用
    いることを特徴とする請求項15または16記載の遠隔
    地会話制御プログラムを記録した記録媒体。
  18. 【請求項18】 前記発話者の向きに関する情報は、個
    々の会話参加者の身体の動きに応じた角度検出が可能な
    センサを、個々の会話参加者の座る椅子または個々の会
    話参加者の身体に設け、このセンサ出力により得ること
    を特徴とする請求項17記載の遠隔地会話制御プログラ
    ムを記録した記録媒体。
  19. 【請求項19】 前記発話者の音声が他の会話参加者に
    はそれぞれどのように聞こえるかを求める際、前記発話
    者からの音声データに加えて、前記各会話参加者の仮想
    的な配置上で当該発話者がどの会話参加者の方向にどれ
    だけ移動したかを示す移動情報を用いることを特徴とす
    る請求項15または16記載の遠隔地会話制御プログラ
    ムを記録した記録媒体。
  20. 【請求項20】 前記どの会話参加者の方向にどれだけ
    移動したかの設定が可能な操作部を有するユーザインタ
    フェースを個々の会話参加者ごとに用意することを特徴
    とする請求項19記載の遠隔地会話制御プログラムを記
    録した記録媒体。
  21. 【請求項21】 前記発話者の発話相手とされた会話参
    加者に対しては、当該発話者からの音声の音量を大きく
    して出力することを特徴とする請求項17から20のい
    ずれかに記載の遠隔地会話制御プログラムを記録した記
    録媒体。
JP2000082535A 2000-03-23 2000-03-23 遠隔地会話制御方法および遠隔地会話システムならびに遠隔地会話制御プログラムを記録した記録媒体 Withdrawn JP2001274912A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000082535A JP2001274912A (ja) 2000-03-23 2000-03-23 遠隔地会話制御方法および遠隔地会話システムならびに遠隔地会話制御プログラムを記録した記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000082535A JP2001274912A (ja) 2000-03-23 2000-03-23 遠隔地会話制御方法および遠隔地会話システムならびに遠隔地会話制御プログラムを記録した記録媒体

Publications (1)

Publication Number Publication Date
JP2001274912A true JP2001274912A (ja) 2001-10-05

Family

ID=18599326

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000082535A Withdrawn JP2001274912A (ja) 2000-03-23 2000-03-23 遠隔地会話制御方法および遠隔地会話システムならびに遠隔地会話制御プログラムを記録した記録媒体

Country Status (1)

Country Link
JP (1) JP2001274912A (ja)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7047052B2 (en) 2002-07-19 2006-05-16 Hitachi, Ltd. Cellular phone terminal
WO2006080133A1 (ja) * 2005-01-25 2006-08-03 Matsushita Electric Industrial Co., Ltd. 音声対話装置
JP2007081649A (ja) * 2005-09-13 2007-03-29 Hitachi Ltd 音声通話システムおよび音声通話中におけるコンテンツの提供方法
JP2009261010A (ja) * 2009-08-04 2009-11-05 Panasonic Corp 音声対話装置
WO2012066734A1 (ja) * 2010-11-15 2012-05-24 パナソニック株式会社 音声コミュニケーション装置および音声コミュニケーション方法
JP2014207568A (ja) * 2013-04-12 2014-10-30 富士通株式会社 情報処理装置、音声処理方法、及び音声処理プログラム
JP2015515800A (ja) * 2012-03-23 2015-05-28 ドルビー ラボラトリーズ ライセンシング コーポレイション 2dまたは3d会議シーンにおける語り手の配置
US9084062B2 (en) 2010-06-30 2015-07-14 Panasonic Intellectual Property Management Co., Ltd. Conversation detection apparatus, hearing aid, and conversation detection method
WO2022054899A1 (ja) * 2020-09-10 2022-03-17 ソニーグループ株式会社 情報処理装置、情報処理端末、情報処理方法、およびプログラム
US11764984B2 (en) 2021-07-30 2023-09-19 Sharp Kabushiki Kaisha Teleconference method and teleconference system

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7047052B2 (en) 2002-07-19 2006-05-16 Hitachi, Ltd. Cellular phone terminal
US8014884B2 (en) 2005-01-25 2011-09-06 Panasonic Corporation Audio conversation apparatus
WO2006080133A1 (ja) * 2005-01-25 2006-08-03 Matsushita Electric Industrial Co., Ltd. 音声対話装置
US8712564B2 (en) 2005-01-25 2014-04-29 Panasonic Corporation Audio conversation apparatus
JP2007081649A (ja) * 2005-09-13 2007-03-29 Hitachi Ltd 音声通話システムおよび音声通話中におけるコンテンツの提供方法
JP4608400B2 (ja) * 2005-09-13 2011-01-12 株式会社日立製作所 音声通話システムおよび音声通話中におけるコンテンツの提供方法
JP2009261010A (ja) * 2009-08-04 2009-11-05 Panasonic Corp 音声対話装置
JP4700126B2 (ja) * 2009-08-04 2011-06-15 パナソニック株式会社 音声対話装置
US9084062B2 (en) 2010-06-30 2015-07-14 Panasonic Intellectual Property Management Co., Ltd. Conversation detection apparatus, hearing aid, and conversation detection method
WO2012066734A1 (ja) * 2010-11-15 2012-05-24 パナソニック株式会社 音声コミュニケーション装置および音声コミュニケーション方法
JP2015515800A (ja) * 2012-03-23 2015-05-28 ドルビー ラボラトリーズ ライセンシング コーポレイション 2dまたは3d会議シーンにおける語り手の配置
JP2014207568A (ja) * 2013-04-12 2014-10-30 富士通株式会社 情報処理装置、音声処理方法、及び音声処理プログラム
WO2022054899A1 (ja) * 2020-09-10 2022-03-17 ソニーグループ株式会社 情報処理装置、情報処理端末、情報処理方法、およびプログラム
US11764984B2 (en) 2021-07-30 2023-09-19 Sharp Kabushiki Kaisha Teleconference method and teleconference system

Similar Documents

Publication Publication Date Title
JP4745375B2 (ja) 対話型立体的オーディオビジュアル・システム
JP2975687B2 (ja) 第1局・第2局間に音声信号とビデオ信号とを送信する方法、局、テレビ会議システム、第1局・第2局間に音声信号を伝送する方法
WO2011153907A1 (zh) 一种播放远端与会人员音频的方法、装置及远程视频会议系统
JP2001274912A (ja) 遠隔地会話制御方法および遠隔地会話システムならびに遠隔地会話制御プログラムを記録した記録媒体
JP4992591B2 (ja) 通信システム及び通信端末
JP2006254064A (ja) 遠隔会議システム、音像位置割当方法および音質設定方法
CA2664514A1 (en) Method and apparatus for recording, transmitting, and playing back sound events for communication applications
EP3745695B1 (en) Electronic collaboration and communication method and system to facilitate communication with hearing or speech impaired participants
KR20030054103A (ko) 가상 환경에서 참여자간의 의사전달 장치 및 방법
CN110891216A (zh) 一种耳机装置
JP2006279492A (ja) 電話会議システム
JP3898673B2 (ja) 音声通信システム、方法及びプログラム並びに音声再生装置
WO2022054900A1 (ja) 情報処理装置、情報処理端末、情報処理方法、およびプログラム
CN110856068B (zh) 一种耳机装置的通话方法
JP2008067078A (ja) 携帯端末装置
JP2006094315A (ja) 立体音響再生システム
JPH03252258A (ja) 指向性再生装置
WO2023286320A1 (ja) 情報処理装置および方法、並びにプログラム
JP2997590B2 (ja) 電子会議システムおよび端末装置
Goose et al. Conferencing3: 3D audio conferencing and archiving services for handheld wireless devices
US11764984B2 (en) Teleconference method and teleconference system
JP4849494B2 (ja) 遠隔会議システム、音像位置割当方法および音質設定方法
WO2022118671A1 (ja) 情報処理装置、情報処理方法、およびプログラム
Kilgore et al. The Vocal Village: enhancing collaboration with spatialized audio
JP2023107364A (ja) コミュニケーション装置及びコミュニケーション方法

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20070605