JP2001274912A

JP2001274912A - 遠隔地会話制御方法および遠隔地会話システムならびに遠隔地会話制御プログラムを記録した記録媒体

Info

Publication number: JP2001274912A
Application number: JP2000082535A
Authority: JP
Inventors: Hiroshi Hasegawa; 浩長谷川
Original assignee: Seiko Epson Corp
Current assignee: Seiko Epson Corp
Priority date: 2000-03-23
Filing date: 2000-03-23
Publication date: 2001-10-05

Abstract

(57)【要約】【課題】離れた場所にいる複数（３人以上）の人が電話
回線などを使って音声による会議を行う際、誰が誰に話
しているのかなど状況を掴みにくい問題がある。【解決手段】ある会議グループに属する会議参加者間の
情報を制御する会議制御サーバを有し、この会議制御サ
ーバは、当該会議グループに属する会議参加者の人数な
ど会議参加者に関する情報を把握する会話参加者管理部
４２と、その会話参加者管理部４２からの情報を受けて
当該会議グループにおける各会議参加者の仮想的なレイ
アウト情報を生成する仮想的レイアウト情報生成部４３
と、ある会議参加者が発話したとき、その発話者の発話
する音声データおよび前記各会議参加者の仮想的なレイ
アウト情報に基づいて、当該発話者の音声が他の会議参
加者にはそれぞれどのように聞こえるかを求め、それを
個々の会議参加者対応の立体的な音声データとして出力
する音場生成部４５とを有し、その立体的な音声データ
を個々の会議参加者に送出する。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、複数の人が公衆電
話回線などを利用して音声のみで会議などの会話を可能
とする遠隔地会話制御方法および遠隔地会話システム並
びに遠隔地会話制御プログラムを記録した記録媒体に関
する。

【０００２】

【従来の技術】遠隔地にいる複数の人が居ながらにして
会議などを行えるシステムとしては、従来より、テレビ
ジョン（ＴＶという）会話システムや、ＴＶ電話会話シ
ステムなどがある。

【０００３】これらのシステムはともにＴＶを用いてい
るので、お互いの顔を見ながら会話が行えるのが特徴
で、また、会議に必要な資料などをお互いに指示しなが
ら会話ができることから臨場感のある会話が可能とな
る。

【０００４】しかし、これらシステムは、画像の伝送が
必要となるため、情報量が多く情報伝送に大きなコスト
がかかるという問題があり、さらに、現状の電話回線な
どを利用する場合には、伝送品質に問題もある。また、
相手側に自分の姿が見えるということは、上述したよう
な利点も多い反面、自分の居る場所や身につけている衣
服が他の会話参加者に見られるため、状況によっては、
好ましくない場合もあり、気軽に使えるシステムとは必
ずしもいえない。

【０００５】これに対して、複数のユーザが電話などを
用いて音声のみによる会話システムもある。このような
音声のみによる会話システムは、会議といったかしこま
ったものばかりではなく、複数の知人と何らかのことに
ついて相談し合うといった日常の話し合いなどにも手軽
に利用できるのが特徴である。

【０００６】

【発明が解決しようとする課題】しかしながら、このよ
うな音声のみを用いた会話システムは、現状では、モノ
ラルの音声のみを用いた通信であるため、会話参加者が
３人程度で、しかも、お互いによく知ったもの同志なら
それ程の問題はないが、会話参加者が多かったり、顔見
知りでない参加者が多い場合には、今、発話しているの
は誰なのか、主に誰に向かって発話しているのかなどの
状況をつかみにくいという問題がある。このため、効率
の良い会話進行が行えず、適切な話し合いができないの
が実情である。

【０００７】そこで本発明は、離れた場所にいる複数
（３人以上）の人が音声のみによる会話を実現し、しか
も、発話している人が誰なのかや、主に誰に向かって発
話しているのかなどを容易に判別できるようにすること
で、音声のみであっても臨場感ある会話を可能とするこ
とを目的としている。

【０００８】

【課題を解決するための手段】上述した目的を達成する
ために、本発明の遠隔地会話制御方法は、離れた位置に
いる少なくとも３人を１つの会話グループとしてこの会
話グループに属するそれぞれの会話参加者が所定のネッ
トワークを利用して当該会話グループに属する会話参加
者同志の会話を可能とする遠隔地会話制御方法であっ
て、前記会話グループに属する会話参加者の人数など会
話参加者に関する情報を把握し、それによって、当該会
話グループに属する各会話参加者の仮想的な配置などを
示す仮想的なレイアウト情報を生成し、当該会話グルー
プ内のある会話参加者が発話したとき、その発話者の発
話する音声データおよび前記各会話参加者の仮想的な配
置を示す仮想的なレイアウト情報に基づいて、当該発話
者の音声が他の会話参加者にはそれぞれどのように聞こ
えるかを求め、それを個々の会話参加者対応の立体的な
音声データとして出力し、その立体的な音声データを個
々の会話参加者に送出するようにしている。

【０００９】また、本発明の遠隔地会話システムは、

【請求項２２】離れた位置にいる少なくとも３人を１
つの会話グループとしてこの会話グループに属するそれ
ぞれの会話参加者が所定のネットワークを利用して当該
会話グループに属する会話参加者同志の会話を可能とす
る遠隔地会話システムであって、前記会話グループに属
する会話参加者間の情報の制御を行う会話制御サーバを
有し、この会話制御サーバは、前記会話グループに属す
る会話参加者の人数など会話参加者に関する情報を把握
する会話参加者管理部と、この会話参加者管理部からの
情報を受けて当該会話グループに属する各会話参加者の
仮想的な配置などを示す仮想的なレイアウト情報を生成
する仮想的レイアウト情報生成部と、前記会話グループ
内のある会話参加者が発話したとき、その発話者の発話
する音声データおよび前記各会話参加者の仮想的なレイ
アウト情報に基づいて、当該発話者の音声が他の会話参
加者にはそれぞれどのように聞こえるかを求め、それを
個々の会話参加者対応の立体的な音声データとして出力
する音場生成部とを有している。

【００１０】また、本発明の遠隔地会話制御プログラム
を記録した記録媒体は、離れた位置にいる少なくとも３
人を１つの会話グループとしてこの会話グループに属す
るそれぞれの会話参加者が所定のネットワークを利用し
て当該会話グループに属する会話参加者同志の会話を可
能とする遠隔地会話制御プログラムを記録した記録媒体
であって、その遠隔地会話制御プログラムは、前記会話
グループに属する会話参加者の人数など会話参加者に関
する情報を把握する手順と、それによって、当該会話グ
ループに属する各会話参加者の仮想的な配置などを示す
レイアウト情報を生成する手順と、当該会話グループ内
のある会話参加者が発話したとき、その発話者の発話す
る音声データおよび前記各会話参加者の仮想的なレイア
ウト情報に基づいて、当該発話者の音声が他の会話参加
者にはそれぞれどのように聞こえるかを求め、それを個
々の会話参加者対応の立体的な音声データとして出力す
る手順と、その立体的な音声データを個々の会話参加者
に送出する手順とを含んでいる。

【００１１】これら各発明において、前記各会話参加者
の仮想的な配置は、前記会話グループに属する各会話参
加者が円卓を囲むような配置としている。

【００１２】また、前記発話者の音声が他の会話参加者
にはそれぞれどのように聞こえるかを求める際、前記発
話者からの音声データに加えて、前記各会話参加者の仮
想的な配置上で当該発話者がどの会議参加者の方向を向
いて発話しているかを示す発話者の向きに関する情報を
用いる。

【００１３】そして、前記発話者の向きに関する情報
は、個々の会話参加者の身体の動きに応じた角度検出が
可能なセンサを、個々の会話参加者の座る椅子または個
々の会話参加者の身体に設け、このセンサ出力により得
るようにしている。

【００１４】また、前記発話者の音声が他の会話参加者
にはそれぞれどのように聞こえるかを求める際、前記発
話者からの音声データに加えて、前記各会話参加者の仮
想的な配置上で当該発話者がどの会話参加者の方向にど
れだけ移動したかを示す移動情報を用いる。

【００１５】そして、前記どの会話参加者の方向にどれ
だけ移動したかの設定が可能な操作部を有するユーザイ
ンタフェースを個々の会話参加者ごとに用意するように
している。

【００１６】さらに、上述した各発明において、前記発
話者の発話相手とされた会話参加者に対しては、当該発
話者からの音声の音量を大きくして出力することも可能
である。

【００１７】このように本発明は、ある会話グループに
属する会話参加者の人数など会話参加者に関する情報に
基づいて、当該会話グループに属する各会話参加者の仮
想的な配置などを示す仮想的なレイアウト情報を生成す
る。そして、当該会話グループに属する会話参加者のな
かの誰かが発話したとき、その発話者の発話する音声デ
ータおよび前記仮想的なレイアウト情報に基づいて、当
該発話者の音声が他の会話参加者にはそれぞれどのよう
に聞こえるかを求め、それを個々の会話参加者対応の立
体的な音声データとして出力し、その立体的な音声デー
タを個々の会話参加者に送出するようにしている。

【００１８】これによって、個々の会話参加者は、自分
の脳裏に各会話参加者の仮想的な配置を描きながら会話
を行うことができ、しかも、それぞれの位置にいる会議
参加者からの音声の聞こえ方が異なるので、現在、どの
会話参加者が発話しているのかを容易に判別することが
でき、音声だけであっても臨場感のある会話が可能とな
る。

【００１９】また、各会話参加者の仮想的な配置は、前
記会話グループに属する各会話参加者が円卓を囲むよう
な配置とすることにより、各会話参加者は、自分を含め
た各会話参加者がどのような配置となっているのかを把
握しやすくなり、それを脳裏に描いて会話を行うことに
より、現在、どの会話参加者が発話しているのかを、よ
り一層、容易に判別することができ、より臨場感のある
会話が可能となる。

【００２０】また、発話者の音声が他の会話参加者には
それぞれどのように聞こえるかを求める際、前記発話者
からの音声データに加えて、前記各会話参加者の仮想的
な配置上で当該発話者がどの会話参加者の方向を向いて
発話しているかを示す発話者の向きに関する情報を用い
るようにしているので、当該発話者が他の会話参加者の
うちのある特定の会話参加者に対して発話する場合、そ
の発話相手となる特定の会話参加者は、発話者があたか
も自分に話しかけているような感覚を持つことができ、
臨場感のある会話が可能となる。

【００２１】また、このとき、その発話相手となる特定
の会話参加者に対しては、発話者からの音声の音量を大
きくすることで、より臨場感のある会話が可能となる。

【００２２】なお、発話者の向きに関する情報は、個々
の会話参加者の身体の動きに応じた角度検出が可能なセ
ンサからの出力により得るようにしている。したがっ
て、ある特定の相手に発話する際、その発話者は各会話
参加者の仮想的な配置を脳裏に描きながら発話相手の方
に向くだけで、その向きが考慮された個々の会話参加者
対応の立体的な音声データを生成することができる。

【００２３】また、前記発話者の音声が他の会話参加者
にはそれぞれどのように聞こえるかを求める際、前記発
話者からの音声データに加えて、前記各会話参加者の仮
想的な配置上で当該発話者がどの会話参加者の方向にど
れだけ移動したかを示す移動情報を用いるようにしてい
る。

【００２４】これによって、当該発話者が他の会話参加
者のうちのある特定の会話参加者に対して発話する場
合、その発話相手に向かって近づいた状態で発話するよ
うな状況を作り出すことができ、音声のみの会話であっ
ても、より臨場感のある会話が可能となる。

【００２５】なお、前記会話参加者の向きに関する情報
と当該発話者が発話相手に向かって移動したと仮定した
場合の移動量の両方を設定可能な操作部を有するユーザ
インタフェースを個々の会話参加者ごとに用意すること
で、各会話参加者は、どの発話相手にどの程度移動する
かの設定を容易に行うことができる。

【００２６】また、このとき、前述同様、その発話相手
となる特定の会議参加者に対しては、発話者からの音声
の音量を大きくすることも可能で、それによって、ある
特定のの相手と直ぐそばで会話を行っているような状況
を得ることができる。

【００２７】

【発明の実施の形態】以下、本発明の実施の形態につい
て説明する。なお、この実施の形態で説明する内容は、
本発明の遠隔地会話制御方法、遠隔地会話システムにつ
いての説明であるとともに、本発明の遠隔地会話制御プ
ログラムを記録した記録媒体における遠隔会話制御プロ
グラムの具体的な処理内容をも含むものである。

【００２８】本発明は、前述したように、複数の人が公
衆電話回線などを用いて音声のみによる会話（ここでは
会議として説明する）を可能とするものである。

【００２９】図１はこの実施の形態における遠隔地会議
システムの実施の形態を概略的に示すもので、ここで
は、会議参加者はＡ，Ｂ，Ｃ，Ｄの４人とし、これら会
議参加者Ａ，Ｂ，Ｃ，Ｄは、公衆回線１（ＬＡＮなどの
専用回線でもよいがここでは公衆電話回線とする）によ
って音声のみによる会議を行うものとし、それぞれの参
加者Ａ，Ｂ，Ｃ，Ｄはそれぞれ音声入力用のマイクロホ
ン２と他の参加者からの音声が立体的に聞こえるように
ステレオヘッドホン３を装着している。なお、音が立体
的に聞こえるものであればヘッドホンでなくてもよく、
各会議参加者近傍にステレオ再生可能な２つのスピーカ
を設置することも可能である。

【００３０】また、この公衆回線１には、各会議参加者
間の情報の制御を行う会話制御サーバ（ここでは電話会
議サーバと呼ぶ）４が接続され、この電話会議サーバ４
は、個々の会議参加者の音声を入力して立体的な音声デ
ータ（これについては後に説明する）を生成してそれを
各会議参加者に配信する処理を行うもので、この電話会
議サーバ４によって本発明の遠隔地会話システムが実現
できる。この電話会議サーバ４については後に詳細に説
明する。以下、本発明の実施の形態について説明する。

【００３１】〔第１の実施の形態〕まず、本発明の第１
の実施の形態について説明する。図２は、この第１の実
施の形態を説明するための概略的な構成図であり、各会
議参加者側（この図２では会議参加者Ａについてのみを
示している）は、図１で示したマイクロホン２とステレ
オヘッドホン３の他に、音声入力部１１、回線インタフ
ェース部１２、復号化部１３、左側の音声出力部１４
Ｌ、右側の音声出力部１４Ｒなどを有する。なお、他の
会議参加者Ｂ，Ｃ，Ｄも同様に、マイクロホン２、ステ
レオヘッドホン３、音声入力部１１、復号化部１３、左
右の音声出力部１４Ｌ，１４Ｒを有した構成となってい
るが、この図２では、これら他の会議参加者Ｂ，Ｃ，Ｄ
についての図示は省略されている。

【００３２】各会議参加者Ａ，Ｂ，Ｃ，Ｄのうち、音声
を発した会議参加者（発話者という）からの音声はマイ
クロホン２を通して対応する音声入力部１１で処理され
たのち、回線インタフェース１２を介して公衆回線１に
送出され（この音声データはモノラルである）、図１で
示した電話会議サーバ４に送られる。

【００３３】電話会議サーバ４は、発話者からの音声デ
ータをこの図２では図示されていない回線インタフェー
スを介して受け取り、この第１の実施の形態による立体
音声データ化処理（この処理内容については後に詳細に
説明する）を行う。そして、立体音声データとされた音
声データは、この図２では図示されていない符号化部で
符号化されたのち、公衆回線１に送出される。

【００３４】そして、会議参加者側では、回線インタフ
ェース１２を介して送られてきた立体音声データを受け
取る。その立体音声データは、復号化部１３において復
号化されたのち、左側音声出力部１４Ｌと右側音声出力
部１４Ｒを経てステレオヘッドホン３から立体音声とし
て出力される。

【００３５】図３は電話会議サーバ４の構成を示す図で
あり、図１で示した公衆回線１との接続を可能とするた
めの回線インターフェース部４１、ある１つの会議グル
ープに属する会議グループ構成人数など会議参加者に関
する情報を把握する参加者管理部４２、この参加者管理
部４２からの会議参加者情報に基づいて当該会議グルー
プにおける各会議参加者の仮想的な配置などを示す仮想
的なレイアウト情報を生成する仮想的レイアウト情報生
成部４３、立体音声を生成するに必要な音声データを記
憶する音声データ記憶部４４、当該会議グループ内のあ
る会議参加者が発話したとき、その発話者の発話する音
声データと上述の各会議参加者の仮想的なレイアウト情
報に基づいて当該発話者の音声が他の会議参加者にはそ
れぞれどのように聞こえるかを計算して求め、それを個
々の会議参加者対応の立体的な音声データとして出力す
る音場生成部４５、この音場生成部４５で生成された立
体的な音声データを公衆回線１に載せることができるよ
うに符号化する符号化部４６などを有した構成となって
いる。

【００３６】音場生成部４５は、それぞれの会議参加者
に対応して音場生成処理を行うための立体音声データ生
成部４５Ａ，４５Ｂ，４５Ｃ，４５Ｄを有し、自分以外
の他の会議参加者からの音声データ（モノラル音声デー
タ）を入力し、仮想的レイアウト情報生成部４３からの
仮想的なレイアウト情報に基づいて上述したような立体
音声データを生成する。

【００３７】また、参加者管理部４２は、この会議にど
のような参加者がいるかを、電話会議サーバ４への接続
状態など（回線インターフェース部４１からの情報な
ど）により把握する。この場合、Ａ，Ｂ，Ｃ，Ｄという
４人がこの電話会議サーバ４に対してアクセスしたこと
を参加者管理部４２が認識し、このＡ，Ｂ，Ｃ，Ｄの４
人が会議参加者であることを知る。

【００３８】仮想的レイアウト情報生成部４３は、参加
者管理部４２からの会議参加者についての情報を得る
と、それぞれの会議参加者をどのような配置とするかを
決定するとともに、発話者がどの会議者の方を向いてい
るかや、発話者がどの会議者に向かってどの程度移動し
たかなどを示す情報を考慮した仮想的なレイアウト情報
を生成する。ただし、この第１の実施の形態では、これ
ら発話者がどの会議者の方を向いているかや、どの会議
者に向かってどの程度移動したかなどを示す情報は考慮
せず、それぞれの会議参加者をどのような配置としたか
を示す会議参加者の配置情報を仮想的なレイアウト情報
として出力する。なお、上述の発話者がどの会議者の方
を向いているかや、発話者がどの会議者に向かってどの
程度移動したかなどを示す情報については、第２の実施
の形態、第３の実施の形態で説明する。

【００３９】ところで、各会議者の配置の一例としては
図４に示すような仮想的な配置をここでは考える。すな
わち、会議参加者Ａ，Ｂ，Ｃ，Ｄが円卓２０を囲むよう
に座るような配置とし、参加者Ａを基準に見た場合、会
議参加者Ａから時計方向回りに、Ｂ，Ｃ，Ｄという順序
でそれぞれ等間隔に円卓２０を囲むような仮想的な会議
場の配置を生成する。この仮想的レイアウト情報生成部
４３によって生成された各会議参加者の配置など仮想的
なレイアウト情報は音場生成部４５のそれぞれの立体音
データ生成部４５Ａ，４５Ｂ，４５Ｃ，７５Ｄに与えら
れる。

【００４０】この音場生成部４５では、仮想的レイアウ
ト情報生成部４３で生成された会議参加者の仮想的なレ
イアウト情報（この第１の実施の形態では各会議参加者
者の仮想的な配置情報）に基づいて、それぞれの会議参
加者に対して、現在、発話している会議参加者（発話
者）からの音声がどのように聞こえてくるかを計算して
求める。これは、音像定位制御技術を用いることで実現
できる。この音像定位制御技術というのは、簡単にいえ
ば、ある聴取者の特定方向から音が聞こえて来るような
知覚をその聴取者に生じさせるように音を再生する技術
であり、通常、聴取者はステレオヘッドホンを用いて音
を聴取する。

【００４１】これは、音源の周波数成分の位相遅れや左
右の時間差、音量差などを制御することによって、本
来、モノラルで立体感のない音源の位置を擬似的に得る
ことができるようにしたものである。この技術を用いる
と、音源の位置の情報を得ることができるため、複数の
音源の聴き分けを容易に行うことができる。なお、この
音像定位制御技術については、「音響システムとディジ
タル処理」（電子情報通信学会大賀寿郎山崎芳男
金田豊共著）の２３１頁から２３６頁にも記載されてい
る既存の技術であるので、ここでは詳細には説明しな
い。

【００４２】本発明では、図４に示すような会議参加者
の仮想的な配置についての情報およびそれぞれの会議参
加者からの音声データに基づいて、音像定位制御技術を
用いることで音場生成処理を行い、ある会議参加者の声
が他の会議参加者から見た場合、ある特定の方向から聞
こえてくるような立体的な音声データを生成してそれを
出力する。

【００４３】図５はこの第１の実施の形態における音声
データの処理の流れを示すもので、この図５および前述
した図１から図４を参照しながら動作を説明する。な
お、図５では処理の流れ方向が図面の左から右方向であ
るため、図５において、会議参加者Ａ，Ｂ，Ｃ，Ｄの各
音声入力側（マイクロホン２側）が図示の左端、各音声
出力入力側（ステレオヘッドホン３側）が図示の右端に
示されている。また、図５において、破線で囲った部分
が電話会議サーバ４が行う処理を示している。

【００４４】まず、参加者管理部４２は、この会議にど
のような参加者がいるかを、電話会議サーバ４への接続
状態など（回線インターフェース部４１からの情報な
ど）により把握する。この場合、Ａ，Ｂ，Ｃ，Ｄという
４人がこの電話会議サーバ４にアクセスを行ったことを
参加者管理部４２が認識し、このＡ，Ｂ，Ｃ，Ｄの４人
が会議参加者であることを知る。

【００４５】仮想的レイアウト情報生成部４３は参加者
管理部４２からの会議参加者についての情報を得ると、
それぞれの参加者をどのような配置とするかを決定す
る。ここでは、図４に示すような配置を決定したとす
る。すなわち、会議参加者Ａ，Ｂ，Ｃ，Ｄが、参加者Ａ
を基準に見た場合、Ａから時計方向回りに、Ｂ，Ｃ，Ｄ
という順序で円卓２０を囲むようにそれぞれ等間隔に位
置している仮想的なレイアウト情報を生成する。このよ
うに生成された会議参加者の仮想的なレイアウト情報は
音場生成部４５におけるそれぞれの立体音声データ生成
部４５Ａ，４５Ｂ，４５Ｃ，４５Ｄに与えられる。

【００４６】これら各立体音声データ生成部４５Ａ，４
５Ｂ，４５Ｃ，４５Ｄでは、仮想的レイアウト情報生成
部４３で生成された会議参加者の仮想的なレイアウト情
報と自分以外の他の会議参加者からの音声データに基づ
いて、それぞれの会議参加者に対して他の会議参加者か
らの音声がどのように聞こえてくるかを計算して求め
る。

【００４７】たとえば、会議参加者Ａが発話したとする
と、その音声データは図３で示す音声データ記憶部４４
に保持されたのち、他の会議参加者Ｂ，Ｃ，Ｄ対応に設
けられた立体音声データ生成部４５Ｂ，４５Ｃ，４５Ｄ
に送られる。この各立体音声データ生成部４５Ｂ，４５
Ｃ，４５Ｄでは、各会議参加者の仮想的なレイアウト情
報に基づいて、会議参加者Ｂ，Ｃ，Ｄに対し、発話者で
ある会議参加者Ａの音声がどの方向から聞こえてくるか
を計算して求める。

【００４８】なお、ある発話者からの音声データは、図
３で示されるように、電話会議サーバ４の音声データ記
憶部４４に一旦保持されるが、この音声データ記憶部４
４は参加者管理部４２から何人の参加者が存在している
かの情報を得て、それぞれの参加者対応の記憶領域に音
声データを記憶して行く。このとき、それぞれの各立体
音声データ生成部４５Ａ，４５Ｂ，４５Ｃ，４５Ｄで立
体音声データを生成する際、ある短い時間単位ごとに立
体音声データ生成処理を行うので、音声データ記憶部４
４のそれぞれの会議参加者対応の記憶領域は、ある短い
時間単位ごとの立体音声データ生成処理に必要な音声デ
ータを保持できる程度の容量があればよい。

【００４９】ところで、ここでは、図４に示すような各
会議参加者の仮想的な配置を仮定しているので、会議参
加者Ａからの音声が、会議参加者Ｂに対しては右斜め方
向から、会議参加者Ｃに対しては正面方向から、会議参
加者Ｄに対しては左斜め方向からそれぞれ聞こえてくる
ような音場生成処理を行う。このように、会議参加者
Ｂ，Ｃ，Ｄ対応の各立体音声データ生成部４５Ｂ，４５
Ｃ，４５Ｄでは、参加者Ａからの音声が特定の方向から
聞こえてくるような立体的な音声データを生成し、それ
らの立体音声データを公衆回線１に載せることができる
ように符号化部４６で符号化したのち、図５では図示さ
れていない回線インターフェース４１を介して、会議参
加者Ｂ，Ｃ，Ｄのそれぞれのステレオヘッドホン３に出
力する。

【００５０】これによって、この例では、会議参加者Ｂ
にとっては会議参加者Ａの音声が右斜め方向から聞こ
え、会議参加者Ｃにとっては会議参加者Ａの音声が正面
方向から聞こえ、会議参加者Ｄにとっては会議参加者Ａ
の音声が左斜め方向から聞こえてくるように感じる。

【００５１】これは、他の会議参加者が発話した場合に
も同様の処理がなされ、他の会議参加者はその発話者の
音声が特定の方向から聞こえてくるように感じる。

【００５２】たとえば、参加者Ｂが発話した場合には、
会議参加者Ａにとっては会議参加者Ｂの音声は左斜め方
向から聞こえ、会議参加者Ｃにとっては会議参加者Ｂの
音声は右斜め方向から聞こえ、会議参加者Ｄにとっては
会議参加者Ｂの音声は正面方向から聞こえてくるように
感じる。また、参加者Ｃが発話した場合には、会議参加
者Ａにとっては会議参加者Ｃの音声は正面方向から聞こ
え、会議参加者Ｂにとっては会議参加者Ｃの音声は左斜
め方向から聞こえ、会議参加者Ｄにとっては会議参加者
Ａの音声は右斜め方向から聞こえてくるように感じる。
また、参加者Ｄが発話した場合には、会議参加者Ａにと
っては会議参加者Ｄの音声は右斜め方向から聞こえ、会
議参加者Ｂにとっては会議参加者Ｄの音声は正面方向か
ら聞こえ、会議参加者Ｃにとっては会議参加者Ｄの音声
は左斜め方向から聞こえてくるように感じる。

【００５３】このように、音場生成処理を行うことによ
って発話者の音声が特定の方向から聞こえてくるような
状況を作り出すことができる。これにより、会議の始め
にそれぞれの会議者参加者がたとえば自己紹介などを
し、さらに、それぞれの会議参加者が何回か発話してい
くうちに、それぞれの会議参加者は、自分以外の他の会
議参加者がどのような位置にいるかがわかってくるの
で、その仮想的な配置を脳裏に描きながら会議を行うこ
とができるようになる。

【００５４】たとえば、この例では、会議参加者Ａから
みれば、会議参加者Ｂは自分の右斜め方向に位置し、会
議参加者Ｃは自分の正面に位置し、会議参加者Ｄは自分
の左斜め方向に位置しているということがわかり、自分
を含めた４人の会議参加者があたかも円卓２０を囲んで
会議しているかのような感覚を持つことができる。これ
は、他の会議参加者も同様で、自分の右斜め側には誰が
いて、正面には誰がいて、左斜め側には誰がいるという
ことが各自のステレオヘッドホン３から出力される立体
的な音声によって判断することができる。このように、
各会議参加者の配置を自分の脳裏に描きながら会議を進
めることにより、たとえ、顔見知りでないもの同志が会
議を行う場合であっても、今、発言している会議参加者
は誰かというのがわかり、円滑な会議進行が可能とな
る。

【００５５】なお、この第１の実施の形態では、ある会
議参加者の発言した音声データは、通常の電話と同じモ
ノラルな音声データであるので、符号化などの処理を行
うことなくそのまま公衆電話回線などに載せることは可
能であるが、場合によっては符号化して送るようにする
ことも可能である。

【００５６】〔第２の実施の形態〕この第２の実施の形
態は、上述した第１の実施の形態で説明した内容に、発
話している会議参加者（発話者）がどの会議参加者の方
向を向いて発話しているかを示す情報を加えたものであ
る。

【００５７】図６は、この第２の実施の形態を説明する
ための概略的な構成図であり、図２とほぼ同様の構成で
あるが、この第２の実施の形態では、発話者がどの会議
参加者の方向を向いて発話しているかを示す情報が必要
となるため、その情報を得るための手段が各会議参加者
ごとに設けられる。なお、この図６では、参加者Ａにつ
いてのみが図示され、他の会議参加者（この場合、会議
参加者Ｂ，Ｃ，Ｄ）についての図示は省略されている
が、他の会議参加者も同様の構成となっている。

【００５８】この発話者がどの会議参加者の方向を向い
て発話しているかを示す情報を得るための手段として
は、たとえば、各会議参加者の座る回転可能な椅子（図
示せず）に角度センサを設けるようにしてもよく、ある
いは、各会議参加者が装着するステレオヘッドホン３に
加速度センサを設けるようにしてもよく、その手段は種
々考えられる。要は、各会議参加者がどのような方向を
向いているかを検出できるものであればよいが、この実
施の形態では、図６に示すように、図示されていない各
会議参加者の座る椅子に角度センサ３０を取り付け、そ
の角度センサ３０からの信号により、その会議参加者が
どの方向を向いたかの情報を方向検出部３１によって得
る。

【００５９】なお、その方向検出部３１から得られる情
報は、たとえば、基準位置に対してどちらに何度向きを
変えたかの角度情報である。ここでの基準位置とは図４
のような円卓２０を囲んだ配置を考えた場合、それぞれ
の会議参加者が円卓２０の中心方向ｏに向いている状態
であるとする。たとえば、基準位置から時計方向回りに
３０度向きを変えた場合は＋３０度、基準位置から反時
計方向回りに３０度向きを変えた場合は−３０度という
ような角度情報とすることが考えられる。

【００６０】この図６が図２と異なるのは、上述したよ
うに角度情報を得るために角度センサ３０および方向検
出部３１を設けたことと、その角度情報を公衆回線１に
載せるためには符号化する必要があることから、符号化
部３２を設けることにある。その他の部分は図２と同じ
であるので、同じ部分の説明はここでは省略する。

【００６１】図７はこの第２の実施の形態における電話
会議サーバ４の構成を示す図であり、図３で示した第１
の実施の形態における電話会議サーバ４と同じ構成要素
を多く有するが、この第２の実施の形態においては、電
話会議サーバ４に対して、各会議参加者Ａ，Ｂ，Ｃ，Ｄ
から音声データのみならず、椅子に取り付けられた角度
センサ３０からの角度情報が与えられる。

【００６２】この図７で示す第２の実施の形態における
電話会議サーバ４は、図３で示した第１の実施の形態に
おける電話会議サーバ４の構成と同様に、回線インター
フェース部４１、参加者管理部４２、仮想的レイアウト
情報生成部４３、音声データ記憶部４４、音場生成部４
５（立体音声データ生成部４５Ａ，４５Ｂ，４５Ｃ，４
５Ｄを有する）、符号化部４６を有し、その他に、この
第３の実施の形態において必要な構成要素として、各会
議参加者側から符号化されて送られてくる音声データお
よび角度情報を復号化する復号化部４７、復号化された
角度情報を保持する角度情報記憶部４８が設けられる。

【００６３】上述した角度情報記憶部４８に記憶された
角度情報は、仮想的レイアウト情報生成部４３に送られ
る。これによって、仮想的レイアウト情報生成部４３
は、図４に示すような各会議参加者Ａ，Ｂ，Ｃ，Ｄの配
置において、角度情報記憶部４８から読み出された角度
情報に基づいて各会議参加者Ａ，Ｂ，Ｃ，Ｄがどのよう
な方向を向いて発言しているかの情報を考慮した仮想的
なレイアウト情報を生成する。

【００６４】そして、各立体音声データ生成部４５Ａ，
４５Ｂ，４５Ｃ，４５Ｄでは、発話者の音声データとそ
の発話者がどのような方向を向いて発言しているかの情
報を考慮した仮想的なレイアウト情報に基づいて、その
音声が他の会議参加者にはどのように聞こえるかを計算
して求め、求められた立体音声データを符号化部４６で
符号化して回線インタフェース４１を介して出力する。

【００６５】図８はこの第２の実施の形態における音声
データの処理の流れを示すもので、第１の実施の形態で
用いた図５に対応するものである。この図８が図５と大
きく異なるのは、前述したように、それぞれの会議参加
者からは、音声データの他に角度情報が出力され、これ
らの情報を符号化したのちに、公衆回線１に送出する処
理が加わることであり、また、電話会議サーバ４側で
は、会議参加者側から送られてきた情報を復号化して、
音声データと角度情報とを取り出す処理を行ったのち
に、この角度情報を用いて各会議参加者Ａ，Ｂ，Ｃ，Ｄ
がどのような方向を向いて発言しているかの情報を考慮
した仮想的なレイアウト情報を生成して、その角度情報
が考慮された仮想的なレイアウト情報と会議参加者から
の音声情報に基づいて音場生成を行うことが第１の実施
の形態と異なっている。その他の処理は第１の実施の形
態と殆ど同じであるので、同じ処理についてはここでは
詳細には説明しない。以下、この図８とすでに説明した
図７、図６、図４、図１などを参照しながら説明する。

【００６６】たとえば今、会議参加者Ａが図４に示すよ
うな仮想的な配置において、会議参加者Ｂの方を向いて
Ｂに向かって発話することを考える。この状態を図９に
示す。この図９における各会議参加者の配置関係は図４
と同じである。会議参加者Ａは円卓の中心ｏを向いてい
る状態を初期状態とする。その初期状態から、会議参加
者Ａは仮想的な配置を脳裏に描きながら自分の椅子を回
して会議参加者Ｂの方向に向いたとする。このときの椅
子の回転角度が基準線Ｌに対して、−θであったとする
と、それが図６に示す角度センサ３０で検出され方向検
出部３１から角度情報して出力される。

【００６７】この状態で会議参加者Ａは会議参加者Ｂに
対して発話すると、その音声データと角度情報は符号化
されて公衆回線１に送出され、電話会議サーバ４に送ら
れる。電話会議サーバ４では、送られてきた会議参加者
Ａからの情報を図７で示した復号化部４７で復号化し、
音声データと角度情報とを取り出す。その音声データ
は、音声データ記憶部４４に保持されたのち、自分以外
の立体音声データ生成部（この場合は、立体音声データ
生成部４５Ｂ，４５Ｃ，４５Ｄ）に送られ、角度情報は
角度情報記憶部４８に保持されたのち、仮想的レイアウ
ト情報生成部４３に送られる。

【００６８】これによって、会議参加者Ｂ，Ｃ，Ｄに対
応する立体音声データ生成部４５Ｂ，４５Ｃ，４５Ｄで
は、会議参加者Ａからの音声データと仮想的レイアウト
情報生成部４３からの会議参加者Ａがどの方向を向いた
かを示す角度情報を考慮した仮想的なレイアウト情報か
ら、それぞれの会議参加者Ｂ，Ｃ，Ｄには会議参加者Ａ
の音声がどのように聞こえてくるかを計算し、各会議参
加者Ｂ，Ｃ，Ｄごとの立体音声データを得る。

【００６９】すなわち、この例では、会議参加者Ａが会
議参加者Ｂの方向を向いて発言した場合であり、このよ
うな場合においては、会議参加者Ｂに対しては会議者参
加者Ａの音声はどのように聞こえ、同様に、会議参加者
Ｃに対しては会議者参加者Ａの音声はどのように聞こ
え、同様に、会議参加者Ｄに対しては会議者参加者Ａの
音声はどのように聞こえるかを計算して求める。

【００７０】このようにして、各会議参加者Ｂ，Ｃ，Ｄ
に対する会議参加者Ａの立体音声データを得て、それぞ
れの立体音声データは符号化されたのち、公衆回線１上
に送出され各会議参加者Ｂ，Ｃ，Ｄに送られる。

【００７１】各会議参加者Ｂ，Ｃ，Ｄでは、電話会議サ
ーバ４から送られてきた立体的な音声データをそれぞれ
のヘッドホン３で聞くことにより、会議参加者Ａの音声
がそれぞれの会議参加者Ｂ，Ｃ，Ｄによって聞こえ方が
大きく異なる。この場合は、特に会議参加者Ｂには、会
議参加者Ａがあたかも自分の方を向いて発言しているよ
うに聴こえる。

【００７２】このような制御を行うことで、発話者が特
定の会議参加者に向かって発話すると、発話者以外のそ
れぞれの会議参加者には発話者からの音声の聞こえ方が
それぞれ変わってくるため、現在、どの会議参加者が発
話しているかを、より明確に区別することができ、特
に、発話相手となる会議参加者は発話者が自分に向かっ
て発話しているということが明確にわかり、会議の進行
がより円滑になる。

【００７３】なお、このとき、主な発話相手となった会
議参加者（上述した例では、会議参加者Ｂ）に対する音
量を大きくする制御を加えるようにすることも可能で、
それによって、お互いに顔を向かい合わせて会話してい
るかのような臨場感のある会話が可能となる。

【００７４】〔第３の実施の形態〕この第３の実施の形
態は、会議参加者が仮想的に配置された仮想会議の場に
おいて、その仮想会議の場で自分が他の会議参加者の誰
かに向かって移動できるような状況を仮想的に作り出す
ことを可能としたものである。

【００７５】図１０は、この第３の実施の形態を説明す
るための概略的な構成図であり、図６とほぼ同様の構成
であるが、この第３の実施の形態では、発話している会
議参加者がどの会議参加者に向かってどの程度移動した
かを示す情報が必要となるため、その情報を得るための
手段が各会議参加者ごとに設けられる。なお、この図１
０では、参加者Ａについてのみが図示され、他の会議参
加者（この場合、会議参加者Ｂ，Ｃ，Ｄ）についての図
示は省略されているが、他の会議参加者も同様の構成と
なっている。

【００７６】このどの会議参加者がどの会議参加者に向
かってどの程度移動したかを示す情報（以下、どの方向
にどの程度移動したかを示す情報を総合して移動情報と
いう）を得るための手段としては、たとえば、図１０に
示すようなユーザインタフェース５０が考えられる。こ
の図１０で示したユーザインタフェース５０としては、
左右と上下の４方向を向いた矢印形状の操作ボタンＢＴ
１，ＢＴ２，ＢＴ３，ＢＴ４からなる移動情報設定手段
５１や、３６０度の任意の方向に傾倒操作可能な操作レ
バー５２ａを有するジョイスティックのような移動情報
設定手段５２などが考えられる。

【００７７】これらのユーザインタフェースにおいて、
４つの操作ボタンＢＴ１，ＢＴ２，ＢＴ３，ＢＴ４から
なる移動情報設定手段５１は、これらの操作ボタンＢＴ
１，ＢＴ２，ＢＴ３，ＢＴ４を選択操作することによっ
て、４方向の指示が可能であるので、図４に示すような
会議参加者の配置であればこの移動情報設定手段５１で
十分である。また、任意の方向に傾倒操作可能な操作レ
バー５２ａを有するジョイスティックのような移動情報
設定手段５２は、操作レバー５２ａを傾倒操作すること
によって３６０度の任意の方向を指示することができる
ので、多数の会議参加者が円卓を囲むような場合にも適
用できる。

【００７８】なお、移動情報設定手段５１は、たとえ
ば、図４のような会議参加者配置を想定したとき、自分
（会議参加者Ａとする）が、たとえば、主な会話相手と
して会議参加者Ｂを選び、かつ、会議参加者Ｂの方に向
かって移動したい場合には、図４のような会議参加者配
置を脳裏に描きながら操作ボタンＢＴ２を押し、主な会
話相手として会議参加者Ｃを選び、かつ、会議参加者Ｃ
の方に向かって移動したい場合には、図４のような会議
参加者配置を脳裏に描きながら操作ボタンＢＴ３を押
し、主な会話相手として会議参加者Ｄを選び、かつ、会
議参加者Ｄの方に向かって移動したい場合には、図４の
ような会議参加者配置を脳裏に描きながら操作ボタンＢ
Ｔ４を押す。そして、それぞれの操作ボタンＢＴ１，Ｂ
Ｔ２，ＢＴ３，ＢＴ４を押している時間が移動量を表す
ようにする。

【００７９】一方、移動情報設定手段５２は、垂直方向
に設けられた操作レバー５２ａを任意の方向に傾倒する
ことができるようになっていて、その操作レバー５２ａ
を傾倒する方向によって、主な会話相手を選択すること
ができる。

【００８０】ここでは、図４のような会議参加者配置を
想定しているので、自分（会議参加者がＡとする）が、
たとえば、主な会話相手として会議参加者Ｂを選び、か
つ、会議参加者Ｂの方に向かって移動したい場合には、
図４のような会議参加者の仮想的な配置を脳裏に描きな
がら操作レバー５２ａを会議参加者Ｂ方向に傾倒し、主
な会話相手として会議参加者Ｃを選び、かつ、会議参加
者Ｃの方に向かって移動したい場合には、図４のような
会議参加者の仮想的な配置を脳裏に描きながら操作レバ
ー５２ａを会議参加者Ｃ方向に傾倒し、主な会話相手と
して会議参加者Ｄを選び、かつ、会議参加者Ｄの方に向
かって移動したい場合には、図４のような会議参加者の
仮想的な配置を脳裏に描きながら操作レバー５２ａを会
議参加者Ｄ方向に傾倒する。そして、操作レバー５２ａ
をそれぞれの方向に傾倒したときその傾倒している時間
が移動量を表すようにする。

【００８１】そして、発話者によりこのようなユーザイ
ンタフェース５０の操作がなされると、移動量検出部５
３からその操作に応じた移動情報が出力され、その移動
情報は音声データとともに符号化不３２で符号化された
のち、回線インタフェース部１２を介して公衆回線１に
送出される。

【００８２】なお、移動情報を設定する手段は、その他
の手段を用いてもよい。要は、各会議参加者がどの方向
に、どの程度移動したかを示す情報を得られるものであ
ればよい。

【００８３】ところで、図１０が図６と異なるのは、上
述したように角度情報の代わりに各会議参加者がユーザ
インタフェース５０を操作することによって移動情報検
出部５３から得られる移動情報を用いる点であり、その
他の部分は図６と同じであるので、同じ部分の説明はこ
こでは省略する。

【００８４】図１１はこの第３の実施の形態における電
話会議サーバ４の構成を示す図であり、構成的には第２
の実施の形態で用いた図７と殆ど同じであるので、同じ
部分には同一符号を付すことでその説明は省略する。こ
の図１１では、各会議参加者からは、音声データの他
に、上述したように、図１０で示したようなユーザイン
タフェース５０を各会議参加者が操作することによる移
動情報が出力される。この移動情報は音声データととも
に符号化されたのち、公衆回線１に送出される。そし
て、電話会議サーバ４では、送られてきた符号化後の音
声データおよび移動情報を回線インタフェース４１を介
して受け、復号化部４７によって復号化したのち、音声
データは音声データ記憶部４４によって保持し、移動情
報は移動情報記憶部４８で保持する。

【００８５】そして、仮想的レイアウト情報生成部４３
は、図４に示すような各会議参加者Ａ，Ｂ，Ｃ，Ｄの配
置において、移動情報記憶部４８から読み出された移動
情報に基づいて、ある発話者がどのような方向にどれだ
け移動したかの情報を考慮した仮想的なレイアウト情報
を生成する。

【００８６】そして、各立体音声データ生成部４５Ａ，
４５Ｂ，４５Ｃ，４５Ｄでは、その発話者の音声データ
と当該発話者の移動情報（どのような方向にどれだけ移
動したか情報）が考慮された仮想的なレイアウト情報に
基づいて、その音声が他の会議参加者にはどのように聞
こえるかを計算して求め、求められた立体的な音声デー
タを符号化部４６で符号化して回線インタフェース４１
を介して出力する。

【００８７】図１２はこの第３の実施の形態における音
声データの処理の流れを示すもので、第２の実施の形態
で用いた図８に対応するものである。この図１２は図８
と殆ど同じであり、前述したように、それぞれの会議参
加者からは、角度情報の代わりに移動情報が出力される
点が異なり、この移動情報を考慮した仮想的なレイアウ
ト情報を生成して、その仮想的なレイアウト情報と会議
参加者からの音声データに基づいて音場生成を行う。そ
れ以外は図８と殆ど同じであるので、同じ処理について
はここでは詳細には説明しない。

【００８８】たとえば今、会議参加者Ａが図４に示した
各会議参加者の仮想的な配置を自分の脳裏に描いて、そ
の仮想的な配置において会議参加者Ｂに向かって発話
し、かつ、会議参加者Ａは会議参加者Ｂの方向に近づい
て行き、Ｂに近い位置で発話をしようとする状況を作り
出すことを考える。

【００８９】会議参加者Ａは自分に用意されたユーザイ
ンタフェース５０（移動情報設定手段５２とする）にお
いて、自分の脳裏に描いた会議参加者の仮想的な配置に
おいて、会議参加者Ｂの方向に操作レバー５２ａを傾倒
操作する。このとき、どの程度、会議参加者Ｂに近づく
かは、ここでは操作レバー５２ａの傾倒操作時間で決ま
るとしているので、適当な時間だけ操作レバー５２ａを
傾倒操作する。

【００９０】この状態で会議参加者Ａは会議参加者Ｂに
対して発話を行うと、その音声データと移動情報は符号
化されて、公衆回線１に送出され、電話会議サーバ４に
送られる。電話会議サーバ４では、送られてきた会議参
加者Ａからの情報を復号化し、音声データと移動情報と
を取り出す。その音声データは、自分以外の音場生成部
に送られ、移動情報は仮想的レイアウト情報生成部４３
に送られる。そして、この仮想的レイアウト情報生成部
４３からは、移動情報を考慮したレイアウト情報を生成
して、それを会議参加者Ｂ，Ｃ，Ｄに対応する立体音声
データ生成部４５Ｂ，４５Ｃ，４５Ｄに送る。

【００９１】これによって、立体音声データ生成部４５
Ｂ，４５Ｃ，４５Ｄでは、会議参加者Ａからの音声デー
タと会議参加者Ａがどの方向にどの程度移動したかを示
す移動情報とから、それぞれの会議参加者には会議参加
者Ａの音声がどのように聞こえてくるかを計算し、各会
議参加者Ｂ，Ｃ，Ｄごとの立体音声データを得る。

【００９２】すなわち、この例では、会議参加者Ａが会
議参加者Ｂの方向に所定量移動して発話した場合であ
り、このような場合においては、会議参加者Ｂに対して
は会議者参加者Ａの音声はどのように聞こえ、同様に、
会議参加者Ｃに対しては会議者参加者Ａの音声はどのよ
うに聞こえ、同様に、会議参加者Ｄに対しては会議者参
加者Ａの音声はどのように聞こえるかを計算して求め
る。

【００９３】このようにして、各会議参加者Ｂ，Ｃ，Ｄ
に対する会議参加者Ａの立体音声データを得て、それぞ
れの立体音声データは符号化されたのち、公衆回線１上
に送出され各会議参加者Ｂ，Ｃ，Ｄに送られる。

【００９４】各会議参加者Ｂ，Ｃ，Ｄでは、このような
立体的な音声データをそれぞれが装着しているステレオ
ヘッドホン３で聞くことにより、会議参加者Ａの音声が
それぞれの会議参加者Ｂ，Ｃ，Ｄによって聞こえ方が大
きく異なる。この場合は、特に会議参加者Ｂには、会議
参加者Ａがあたかも自分の近くまで移動してきて自分に
向かって発話しているように聞こえる。

【００９５】このような制御を行うことで、発話者が特
定の会議参加者に向かって発言すると、発話者以外のそ
れぞれの会議参加者には発話者からの音声の聞こえ方が
それぞれ変わってくるため、現在、どの会議参加者が発
話しているかを、より明確に区別することができ、特
に、発話相手となる会議参加者は発話者が自分の近くま
で移動してきて自分に向かって話しかけているように聞
こえ、臨場感のある会話が可能となる。

【００９６】なお、このとき、第２の実施の形態同様、
主な発言相手となった会議参加者（上述した例では、会
議参加者Ｂ）に対する音量を大きくする制御を加えるよ
うにすることも可能で、それによって、誰に向かって発
話しているのかがより明確になる。

【００９７】なお、本発明は以上説明した実施の形態に
限定されるものではなく、本発明の要旨を逸脱しない範
囲で種々変形実施可能となるものである。たとえば、こ
れまで説明した各実施の形態において、電話会議サーバ
４は専用に設けられた電話会議サーバを使用した例で説
明したが、これは、専用のものではなく、図１３に示す
ように、ある会議参加者が電話会議サーバを兼用するよ
うなシステムも構築できる。図１３の例では、会議参加
者Ａが電話会議サーバを兼用したシステムを示してい
る。このようなシステムであっても前述の実施の形態で
説明したような処理は可能となる。

【００９８】また、以上説明した本発明の処理を行う遠
隔地会話制御プログラムは、フロッピィディスク、光デ
ィスク、ハードディスクなどの記録媒体に記録させてお
くことができ、本発明はその記録媒体をも含むものであ
る。また、ネットワークから処理プログラムを得るよう
にしてもよい。

【００９９】

【発明の効果】以上説明したように本発明によれば、あ
る会話グループに属する会話参加者の人数など会話参加
者に関する情報に基づいて、当該会話グループに属する
各会話参加者の仮想的な配置などを示す仮想的なレイア
ウト情報を生成する。そして、当該会話グループに属す
る会話参加者のなかの誰かが発話したとき、その発話者
の発話する音声データおよび仮想的なレイアウト情報に
基づいて、当該発話者の音声が他の会話参加者にはそれ
ぞれどのように聞こえるかを求め、それを個々の会話参
加者対応の立体的な音声データとして出力し、その立体
的な音声データを個々の会話参加者に送出するようにし
ている。

【０１００】これによって、個々の会話参加者は、自分
の脳裏に各会話参加者の仮想的な配置を描きながら会話
を行うことができ、しかも、それぞれの位置にいる会議
参加者からの音声の聞こえ方が異なるので、現在、どの
会話参加者が発話しているのかを容易に判別することが
でき、音声だけであっても臨場感のある会話が可能とな
る。

【０１０１】また、発話者の音声が他の会話参加者には
それぞれどのように聞こえるかを求める際、前記発話者
からの音声データに加えて、前記各会話参加者の仮想的
な配置上で当該発話者がどの会話参加者の方向を向いて
発話しているかを示す発話者の向きに関する情報を用い
るようにしているので、当該発話者が他の会話参加者の
うちのある特定の会話参加者に対して発話する場合、そ
の発話相手となる特定の会話参加者は、発話者があたか
も自分に話しかけているような感覚を持つことができ、
臨場感のある会話が可能となる。このとき、その発話相
手となる特定の会議参加者に対しては、発話者からの音
声の音量を大きくすることも可能で、それによって、あ
る特定のの相手と直ぐそばで会話を行っているような状
況を得ることができる。

【０１０２】また、前記発話者の音声が他の会話参加者
にはそれぞれどのように聞こえるかを求める際、前記発
話者からの音声データに加えて、前記各会話参加者の仮
想的な配置上で当該発話者がどの会話参加者の方向にど
れだけ移動したかを示す移動情報を用いるようにしてい
る。

【０１０３】これによって、当該発話者が他の会話参加
者のうちのある特定の会話参加者に対して発話する場
合、その発話相手に向かって近づいた状態で発話するよ
うな状況を作り出すことができ、音声のみの会話であっ
ても、より臨場感のある会話が可能となる。また、この
とき、前述同様、その発話相手となる特定の会議参加者
に対しては、発話者からの音声の音量を大きくすること
も可能で、それによって、ある特定のの相手と直ぐそば
で会話を行っているような状況を得ることができる。

【図面の簡単な説明】

【図１】本発明の遠隔地会話システムの概略構成を示す
図である。

【図２】本発明の第１の実施の形態による遠隔地会話シ
ステムのある会議参加者（会議参加者Ａ）側の構成を示
す図である。

【図３】本発明の第１の実施の形態による遠隔地会話シ
ステムにおいて用いられる電話会議サーバの構成を示す
図である。

【図４】本発明における各会議参加者の仮想的な配置例
を示す図である。

【図５】本発明の第１の実施の形態による遠隔地会話シ
ステムの処理の流れを説明する図である。

【図６】本発明の第２の実施の形態による遠隔地会話シ
ステムのある会議参加者（会議参加者Ａ）側の構成を示
す図である。

【図７】本発明の第２の実施の形態による遠隔地会話シ
ステムにおいて用いられる電話会議サーバの構成を示す
図である。

【図８】本発明の第２の実施の形態による遠隔地会話シ
ステムの処理の流れを説明する図である。

【図９】本発明の第２の実施の形態において発話しよう
とする会議参加者が発話相手となる会議参加者の方向に
向きを変える動作例を図４で示した各会議参加者の仮想
的な配置例を用いて説明する図である。

【図１０】本発明の第３の実施の形態による遠隔地会話
システムのある会議参加者（会議参加者Ａ）側の構成を
示す図である。

【図１１】本発明の第３の実施の形態による遠隔地会話
システムにおいて用いられる電話会議サーバの構成を示
す図である。

【図１２】本発明の第３の実施の形態による遠隔地会話
システムの処理の流れを説明する図である。

【図１３】図１で示した本発明の遠隔地会話システムの
変形例の概略構成を示す図である。

【符号の説明】

１公衆回線２マイクロホン３ステレオヘッドホン４電話会議サーバ３０角度センサ４２参加者管理部４３仮想的レイアウト情報生成部４５音場生成部４５Ａ，４５Ｂ，４５Ｃ，４５Ｄ立体音声データ生成
部５０ユーザインタフェースＡ，Ｂ，Ｃ，Ｄ会議参加者

───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.⁷ 識別記号ＦＩテーマコート゛(参考）Ｈ０４Ｓ 7/00 Ｈ０４Ｓ 7/00 Ｚ

Claims

【特許請求の範囲】

【請求項１】離れた位置にいる少なくとも３人を１つ
の会話グループとしてこの会話グループに属するそれぞ
れの会話参加者が所定のネットワークを利用して当該会
話グループに属する会話参加者同志の会話を可能とする
遠隔地会話制御方法であって、前記会話グループに属する会話参加者の人数など会話参
加者に関する情報を把握し、それによって、当該会話グループに属する各会話参加者
の仮想的な配置などを示す仮想的なレイアウト情報を生
成し、当該会話グループ内のある会話参加者が発話したとき、
その発話者の発話する音声データおよび前記各会話参加
者の仮想的な配置を示す仮想的なレイアウト情報に基づ
いて、当該発話者の音声が他の会話参加者にはそれぞれ
どのように聞こえるかを求め、それを個々の会話参加者
対応の立体的な音声データとして出力し、その立体的な
音声データを個々の会話参加者に送出することを特徴と
する遠隔地会話制御方法。
【請求項２】前記各会話参加者の仮想的な配置は、前
記会話グループに属する各会話参加者が円卓を囲むよう
な配置であることを特徴とする請求項１に記載の遠隔地
会話制御方法。
【請求項３】前記発話者の音声が他の会話参加者には
それぞれどのように聞こえるかを求める際、前記発話者
からの音声データに加えて、前記各会話参加者の仮想的
な配置上で当該発話者がどの会議参加者の方向を向いて
発話しているかを示す発話者の向きに関する情報を用い
ることを特徴とする請求項１または２記載の遠隔地会話
制御方法。
【請求項４】前記発話者の向きに関する情報は、個々
の会話参加者の身体の動きに応じた角度検出が可能なセ
ンサを、個々の会話参加者の座る椅子または個々の会話
参加者の身体に設け、このセンサ出力により得ることを
特徴とする請求項３記載の遠隔地会話制御方法。
【請求項５】前記発話者の音声が他の会話参加者には
それぞれどのように聞こえるかを求める際、前記発話者
からの音声データに加えて、前記各会話参加者の仮想的
な配置上で当該発話者がどの会話参加者の方向にどれだ
け移動したかを示す移動情報を用いることを特徴とする
請求項１または２記載の遠隔地会話制御方法。
【請求項６】前記どの会話参加者の方向にどれだけ移
動したかの設定が可能な操作部を有するユーザインタフ
ェースを個々の会話参加者ごとに用意することを特徴と
する請求項５記載の遠隔地会話制御方法。
【請求項７】前記発話者の発話相手とされた会話参加
者に対しては、当該発話者からの音声の音量を大きくし
て出力することを特徴とする請求項３から６のいずれか
に記載の遠隔地会話制御方法。
【請求項８】離れた位置にいる少なくとも３人を１つ
の会話グループとしてこの会話グループに属するそれぞ
れの会話参加者が所定のネットワークを利用して当該会
話グループに属する会話参加者同志の会話を可能とする
遠隔地会話システムであって、前記会話グループに属する会話参加者間の情報の制御を
行う会話制御サーバを有し、この会話制御サーバは、前記会話グループに属する会話参加者の人数など会話参
加者に関する情報を把握する会話参加者管理部と、この会話参加者管理部からの情報を受けて当該会話グル
ープに属する各会話参加者の仮想的な配置などを示す仮
想的なレイアウト情報を生成する仮想的レイアウト情報
生成部と、前記会話グループ内のある会話参加者が発話したとき、
その発話者の発話する音声データおよび前記各会話参加
者の仮想的なレイアウト情報に基づいて、当該発話者の
音声が他の会話参加者にはそれぞれどのように聞こえる
かを求め、それを個々の会話参加者対応の立体的な音声
データとして出力する音場生成部と、を有することを特徴とする遠隔地会話システム。
【請求項９】前記各会話参加者の仮想的な配置は、前
記会話グループに属する各会話参加者が円卓を囲むよう
な配置であることを特徴とする請求項８に記載の遠隔地
会話システム。
【請求項１０】前記発話者の音声が他の会話参加者に
はそれぞれどのように聞こえるかを求める際、前記発話
者からの音声データに加えて、前記各会話参加者の仮想
的な配置上で当該発話者がどの会議参加者の方向を向い
て発話しているかを示す発話者の向きに関する情報を用
いることを特徴とする請求項８または９記載の遠隔地会
話システム。
【請求項１１】前記発話者の向きに関する情報は、個
々の会話参加者の身体の動きに応じた角度検出が可能な
センサを、個々の会話参加者の座る椅子または個々の会
話参加者の身体に設け、このセンサ出力により得ること
を特徴とする請求項１０記載の遠隔地会話システム。
【請求項１２】前記発話者の音声が他の会話参加者に
はそれぞれどのように聞こえるかを求める際、前記発話
者からの音声データに加えて、前記各会話参加者の仮想
的な配置上で当該発話者がどの会話参加者の方向にどれ
だけ移動したかを示す移動情報を用いることを特徴とす
る請求項８または９記載の遠隔地会話システム。
【請求項１３】前記どの会話参加者の方向にどれだけ
移動したかの設定が可能な操作部を有するユーザインタ
フェースを個々の会話参加者ごとに用意することを特徴
とする請求項１２記載の遠隔地会話システム。
【請求項１４】前記発話者の発話相手とされた会話参
加者に対しては、当該発話者からの音声の音量を大きく
して出力することを特徴とする請求項１０から１３のい
ずれかに記載の遠隔地会話システム。
【請求項１５】離れた位置にいる少なくとも３人を１
つの会話グループとしてこの会話グループに属するそれ
ぞれの会話参加者が所定のネットワークを利用して当該
会話グループに属する会話参加者同志の会話を可能とす
る遠隔地会話制御プログラムを記録した記録媒体であっ
て、その遠隔地会話制御プログラムは、前記会話グループに属する会話参加者の人数など会話参
加者に関する情報を把握する手順と、それによって、当該会話グループに属する各会話参加者
の仮想的な配置などを示すレイアウト情報を生成する手
順と、当該会話グループ内のある会話参加者が発話したとき、
その発話者の発話する音声データおよび前記各会話参加
者の仮想的なレイアウト情報に基づいて、当該発話者の
音声が他の会話参加者にはそれぞれどのように聞こえる
かを求め、それを個々の会話参加者対応の立体的な音声
データとして出力する手順と、その立体的な音声データを個々の会話参加者に送出する
手順と、を含むことを特徴とする遠隔地会話制御プログラムを記
録した記録媒体。
【請求項１６】前記各会話参加者の仮想的な配置は、
前記会話グループに属する各会話参加者が円卓を囲むよ
うな配置であることを特徴とする請求項１５に記載の遠
隔地会話制御プログラムを記録した記録媒体。
【請求項１７】前記発話者の音声が他の会話参加者に
はそれぞれどのように聞こえるかを求める際、前記発話
者からの音声データに加えて、前記各会話参加者の仮想
的な配置上で当該発話者がどの会議参加者の方向を向い
て発話しているかを示す発話者の向きに関する情報を用
いることを特徴とする請求項１５または１６記載の遠隔
地会話制御プログラムを記録した記録媒体。
【請求項１８】前記発話者の向きに関する情報は、個
々の会話参加者の身体の動きに応じた角度検出が可能な
センサを、個々の会話参加者の座る椅子または個々の会
話参加者の身体に設け、このセンサ出力により得ること
を特徴とする請求項１７記載の遠隔地会話制御プログラ
ムを記録した記録媒体。
【請求項１９】前記発話者の音声が他の会話参加者に
はそれぞれどのように聞こえるかを求める際、前記発話
者からの音声データに加えて、前記各会話参加者の仮想
的な配置上で当該発話者がどの会話参加者の方向にどれ
だけ移動したかを示す移動情報を用いることを特徴とす
る請求項１５または１６記載の遠隔地会話制御プログラ
ムを記録した記録媒体。
【請求項２０】前記どの会話参加者の方向にどれだけ
移動したかの設定が可能な操作部を有するユーザインタ
フェースを個々の会話参加者ごとに用意することを特徴
とする請求項１９記載の遠隔地会話制御プログラムを記
録した記録媒体。
【請求項２１】前記発話者の発話相手とされた会話参
加者に対しては、当該発話者からの音声の音量を大きく
して出力することを特徴とする請求項１７から２０のい
ずれかに記載の遠隔地会話制御プログラムを記録した記
録媒体。