WO2007007444A1

WO2007007444A1 - 音声伝達システム、および通信会議装置

Info

Publication number: WO2007007444A1
Application number: PCT/JP2006/304994
Authority: WO
Inventors: Yasutaka Iwasaki
Original assignee: Yamaha Corporation
Priority date: 2005-07-08
Filing date: 2006-03-14
Publication date: 2007-01-18
Also published as: US20090110212A1; CN101218853B; CN101218853A; EP1906707B1; US8208664B2; EP1906707A4; EP1906707A1; JP2007019907A

Abstract

　音声伝達システムにおいて、通信会議装置の制御部は、スピーカアレイから端末ユニットに測定用音波を発し、返答がなされるまでの時間を測定して端末ユニットの位置を検出する。制御部は、端末ユニットの位置にマイクアレイのマイク感度が向くように指向特性を設定し、収音した音声を他の通信会議装置に送信する。受信側の通信会議装置においては、受信した音声が送信側における端末ユニットの位置から発せられるかのようにスピーカアレイの指向特性を設定する。

Description

明細書

音声伝達システム、および通信会議装置

技術分野

[0001] この発明は、音声伝達システムに関し、特に音源の位置を検出して臨場感ある音場制御を行う音声伝達システムに関する。

本願は、 2005年 7月 8日に出願された特願 2005— 199683号に基づき優先権を主張し、その内容をここに援用する。

背景技術

[0002] 通信会議システムは、複数個のマイクで会議参加者の音声を収音し、ミキシングした後に伝送するように構成されているものが一般的である。受信側においては、全てのスピーカから同一の音量、位相で音声が再生される。このような通信会議システムの場合、会議参加者の誰が音声を発しても、同一の音像で再生されるため、受信側にとつて誰が発話したのかがわかりにくかった。

[0003] また、受信側においては、スピーカの音量が固定されているので、送信側の会議参加者が複数人であれば、それぞれの発声音量やマイクとの距離の違いによってスピ一力からの音量が大きく変化する。

[0004] このような事情に基づき、マイク入力信号の時間波形や周波数スペクトルから発話者と発話者の位置を判定する音声電話会議装置が提案されている (例えば特許文献 1参照）。

特許文献 1 :特開平 9一 261351号公報

発明の開示

発明が解決しょうとする課題

[0005] 特許文献 1に記載の音声電話会議装置は、マイク入力信号の時間波形や周波数スペクトルから発話者と発話者の位置を判定し、音声データとともに位置情報を送信する。受信側は、受信した位置情報に基づいて各スピーカの音量を制御する。また、各マイクのうち、最大入力のマイクから音声を収音するように切り換えスィッチを備え、受信側は、収音したマイクに対応するスピーカから発音するように設定する。 [0006] し力ながら、位置情報に基づレ、て各スピーカ（ステレオスピーカ）の音量を制御するだけでは、臨場感のある音場 (例えば奥行き感等）を実現することができなかった。

[0007] また、各マイクは、各マイクのうち、最大入力のマイクから音声を収音するように切り換えスィッチを備えている。し力ながら、複数人が同時に発話した場合は短時間のうちにこの切り換えを行う必要があり、正確な音声を送信できないという問題もあった

[0008] この発明は、簡易な構成でありながら臨場感ある音場制御をすることができる音声伝達システムを提供することを目的とする。課題を解決するための手段

[0009] この発明の音声伝達システムは、第 1の場所に設置された複数のマイクユニットからなるマイクアレイと、第 2の場所に設置された複数のスピーカユニットからなるスピーカアレイと、第 1の場所に存在する音源位置を検出する位置検出手段と、前記位置検出手段が検出した音源の位置に前記マイクアレイの指向特性を設定するマイク側信号処理手段と、前記指向特性で前記マイクアレイが収音した音声データを、前記指向特性の情報とともに送信する送信手段と、前記送信手段が送信した音声データを指向特性情報とともに受信する受信手段と、前記指向特性情報に基づいて前記第 1 の場所における音源位置に仮想的な音源が形成されるように前記スピーカアレイの指向特性を設定するスピーカ側信号処理手段とを備える。

[0010] この発明において、第 1の場所 (送信側）における音源の位置を特定し、その位置にマイク感度の指向特性を設定する。収音した音声データを、その指向特性とともに第 2の場所 (受信側）に送信する。受信側においては指向特性に基づいて、送信側における音源位置に仮想音源を形成する。例えば、受信側から見て右側奥 (送信側では左側手前）に位置する発話者が音声を発したとき、右側から音声が再生されるようにする。

[0011] また、この発明の音声伝達システムは、第 1の場所に設置された複数のマイクュニットからなる第 1のマイクアレイと、第 2の場所に設置された複数のスピーカユニットからなる第 2のスピーカアレイと、第 1の場所に存在する音源位置を検出する第 1の位置検出手段と、前記第 1の位置検出手段が検出した音源の位置に前記第 1のマイクアレイの指向特性を設定する第 1のマイク側信号処理手段と、前記指向特性で前記第 1のマイクアレイが収音した音声データを前記指向特性の情報とともに送信する第 1の送信手段と、前記第 1の送信手段が送信した音声データを指向特性情報とともに受信する第 2の受信手段と、前記指向特性情報に基づいて前記第 1の場所における音源位置に仮想的な音源が形成されるように前記第 2のスピーカアレイの指向特性を設定する第 2のスピーカ側信号処理手段と、第 2の場所に設置された複数のマイクユニットからなる第 2のマイクアレイと、第 1の場所に設置された複数のスピーカュニットからなる第 1のスピーカアレイと、第 2の場所に存在する音源位置を検出する第 2の位置検出手段と、前記第 2の位置検出手段が検出した音源の位置に前記第 2のマイクアレイの指向特性を設定する第 2のマイク側信号処理手段と、前記指向特性で前記第 2のマイクアレイが収音した音声データを前記指向特性の情報とともに送信する第 2の送信手段と、前記第 2の送信手段が送信した音声データを指向特性情報とともに受信する第 1の受信手段と、前記指向特性情報に基づいて前記第 2の場所における音源位置に仮想的な音源が形成されるように前記第 1のスピーカアレイの指向特性を設定する第 1のスピーカ側信号処理手段とを備える。

[0012] この発明においては、第 1の場所から第 2の場所に収音した音声データをその指向特性とともに送信し、一方で、第 2の場所から第 1の場所に収音した音声データをその指向特性とともに送信する。第 1の場所、第 2の場所のそれぞれにおいて、送信側における音源位置に仮想音源を形成する。

[0013] この発明において、前記位置検出手段は複数の音源位置を検出し、前記マイク側信号処理手段は複数の音源位置に前記マイクアレイの指向特性をそれぞれ設定し、前記情報送信手段は複数の音声データをそれぞれの指向特性の情報とともに送信し、前記情報受信手段は複数の音声データをそれぞれの指向特性の情報とともに受信し、前記スピーカ側信号処理手段は複数の音源位置に仮想的な音源が形成されるように前記スピーカアレイの指向特性を設定してもよい。

[0014] この場合、音声伝達システムは、送信側における複数の音源位置を検出してマイク感度の指向特性を設定する。また、このシステムは、収音した複数の音声データをそれぞれの指向特性とともに受信側に送信する。受信側においてはそれぞれの指向特性に基づレ、て、送信側における複数の音源位置にそれぞれ仮想音源を形成する

[0015] この発明の通信会議装置は、上述した第 1のマイクアレイ、第 1のスピーカアレイ、第 1の位置検出手段、第 1のマイク側信号処理手段、第 1の情報送信手段、第 1の情報受信手段、および第 1のスピーカ側信号処理手段を一体に備える。

発明の効果

[0016] 以上のようにこの発明によれば、送信側において音源の位置を特定するとともにその音源にマイク感度の指向特性を設定し、受信側においては送信側の音源位置に仮想音源を形成するようにスピーカアレイの指向特性を設定するので、簡易な構成でありながら臨場感ある通信会議を実現することができる。

図面の簡単な説明

[0017] [図 1]図 1は、本発明の実施形態に係る通信会議システムの構成を示す概略図である。

[図 2]図 2は、本発明の実施形態に係る通信会議装置および端末ユニットを示すプロック図である。

[図 3]図 3は、図 2に示された端末ユニットの位置測定を示す図である。

[図 4A]図 4Aは、本発明の実施形態における送信側マイクアレイの指向特性を説明する図である。

[図 4B]図 4Bは、本発明の実施形態における受信側スピーカアレイの指向特性を説明する図である。

[図 5A]図 5Aは、本発明の実施形態に用いられる送受信パケットの例を示す図である [図 5B]図 5Bは、本発明の実施形態に用いられる送受信パケットの例を示す図である [図 5C]図 5Cは、本発明の実施形態に用いられる送受信パケットの例を示す図である [図 5D]図 5Dは、本発明の実施形態に用いられる送受信パケットの例を示す図である園 6]図 6は、本発明の実施形態における位置測定動作を示すフローチャートである園 7]図 7は、本発明の実施形態における会議開始時の動作を示すフローチャートである。

園 8]図 8は、本発明の実施形態における送信側の動作を示すフローチャートである園 9]図 9は、本発明の実施形態における受信側の動作を示すフローチャートである符号の説明

1 通 1§会議装置

2 端末ユニット

11 マイクアレイ

12 スピーカアレイ

13 赤外線通信部

14 制御部

21 端末ユニットマイク

22 端末ユニット制御部

23 端末ユニット赤外線通信部

24 ユーザインタフェース

発明を実施するための最良の形態

[0019] 図 1は、本発明の実施形態に係る通信会議システムの構成を示す概略図である。

同図に示すように、この通信会議システムは、複数の会議室にそれぞれ設置される通信会議装置 1、および各会議参加者が携帯する端末ユニット 2を備えている。

[0020] 通信会議装置 1は、各会議室にそれぞれ設置されている。通信会議装置 1はネットワーク (LAN、またはインターネット）や電話回線を介してそれぞれ接続されてレ、る。端末ユニット 2は、会議参加者が携帯するリモコンである。会議参加者は、この端末ュニット 2を用いて会議の開始通知等を行う。この端末ユニット 2は、各会議参加者が携帯するようにしてもよいし、机上に設置するようにしてもよい。また、会議参加者全員分の端末ユニット 2を備えている必要はなぐ各会議室にそれぞれ 1、または複数備えていればよい。

[0021] 図 2は、通信会議装置 1、および端末ユニット 2の構成を示すブロック図である。同図に示すように、通信会議装置 1は、音声を収音するマイクアレイ 11、音声を出力するスピーカアレイ 12、端末ユニット 2と情報通信する赤外線通信部 13、通信会議装置 1を制御する制御部 14、および他の通信会議装置と情報通信するデータ送受信部 1 5を備えている。端末ユニット 2は、音声を入力する端末ユニットマイク 21、端末ュニットを制御する端末ユニット制御部 22、通信会議装置 1と情報通信する端末ユニット赤外線通信部 23、およびユーザが操作入力するユーザインタフェース 24を備えている

[0022] 通信会議装置 1の制御部 14は、マイクアレイ 11、スピーカアレイ 12、赤外線通信部 13、およびデータ送受信部 15に接続されている。また、端末ユニット制御部 22は、端末ユニットマイク 21、端末ユニット赤外線通信部 23、およびユーザインタフェース 2 4に接続されている。

[0023] 通信会議装置 1の制御部 14は、マイクアレイ 11とスピーカアレイ 12の指向性を制御する。マイクアレイ 11およびスピーカアレイ 12が複数のマイクユニット（スピーカュニット）をマトリクス状ほたはライン状、ハニカム状）に配列した構成であるため、これらの遅延量を制御することで指向性を制御することができる。

[0024] 例えば、端部のスピーカユニットから最初に音声を出力し、隣のスピーカユニットから順次所定の遅延時間で音声を出力すると、これらの音声の合成波面はその遅延時間に応じて傾斜するので、音声ビームを斜め方向に向けることができる。このようにして、スピーカアレイの遅延量をコントロールし、通信会議装置 1の前面にいる会議参加者に対し、音像定位させることができる。

[0025] 同様に、マイクアレイにおいては、それぞれのマイクユニットの遅延量をコントロールすることで、所定の方向にマイク感度を向けることができる。

[0026] 制御部 14は、マイクアレイ 11から入力された音声をデータ送受信部 15に送信する。なお、制御部 14は必要に応じて AZDコンバータを内蔵しており、収音した音声をデータ送受信部 15に音声データとして送信するものである。データ送受信部 15は、ネットワーク接続された他の会議室の通信会議装置 1のデータ送受信部 15に音声データを送信する。音声データを受信した他の会議室のデータ送受信部 15は、接続されている制御部 14に音声データを送信する。これを受信した制御部 14は、音声データを D/A変換してスピーカアレイ 12に出力し、音声を出力する。このようにして会議参加者の発した音声をマイクアレイ 11で収音し、他の会議室のスピーカアレイ 12 から放音する。

[0027] 端末ユニット制御部 22は、ユーザインタフェース 24から入力された操作に従って種々の動作を行う。会議参加者がユーザインタフェース 24から会議開始の通知を行うと、端末ユニット制御部 22は、端末ユニット赤外線送受信部 23を介して、通信会議装置 1に会議開始通知を送信する。赤外線通信部 13を介して会議開始通知を受信した通信会議装置 1の制御部 14は、他の会議室への接続要求をデータ送受信部 15 に送信する。データ送受信部 15は、他の会議室のデータ送受信部 15と通信を開始する。

[0028] また、会議参加者がユーザインタフェース 24から音量変更の指示を行うと、端末ュニット制御部 22は、端末ユニット赤外線送受信部 23を介して通信会議装置 1に音量変更の指示情報を送信する。

[0029] 端末ユニットマイク 21は、通信会議装置 1からの音波を受信するものである。本実施形態の通信会議システムは、以下のような動作を行う。制御部 14は、スピーカァレィ 12のうち、いずれかのスピーカユニットから音波を発するとともにカウンタ（タイマ）をスタートする。この音波を端末ユニットマイク 21を介して受信した端末ユニット制御部 22は、端末ユニット赤外線通信部 23を介して通信会議装置 1に受信信号を送信する。

赤外線通信部 13を介して受信信号を受信した制御部 14は、カウンタをストップし、音波を発してから受信信号を受信するまでの時間を測定することで、スピーカュニットと端末ユニット 2の距離を測定する。このような距離測定を複数のスピーカユニットで測定し、端末ユニット 2の位置を特定する。

[0030] 図 3に端末ユニットの位置測定の詳細を示す。同図に示すように、通信会議装置 1 の前面には複数（同図においては 2つ）のマイクユニット 11A (マイクユニット 11B)と複数のスピーカユニット 12A (スピーカユニット 12B)が備えられてレ、る。

[0031] 同図において、マイクユニット 11A、スピーカユニット 12Aの中心位置と他方のマイクユニット 11B、スピーカユニット 12Bの中心位置との距離を Wとする。また、一方のマイクユニット 11A、スピーカユニット 12Aの中心位置と端末ユニット 2との距離を D1 とし、他方のマイクユニット 11B、スピーカユニット 12Bの中心位置と端末ユニット 2との距離を D2とする。この Wと D1の間に描かれる頂点の内角を Θとする。

この Θは、以下の余弦定理により求めることができる。

[0032] [数 1]

D2² = D1² + W² - 2x DlxW cos(<9)

[0033] ここで、通信会議装置 1の中心位置座標を (0, 0)とする。すると、端末ユニット 2の存在する位置座標 (XI , Y1)は、以下のような式で表される。

[0034] [数 2]

Xl = Dl x cos(0)- W /2

Yl = Dl x sin (の

[0035] このようにして通信会議装置 1は、端末ユニット 2の位置を測定することができる。この位置測定は、端末ユニット 2が複数ある場合には全ての端末ユニット 2について行う。各会議参加者毎に端末ユニット 2を有する場合にはそれぞれの端末ユニット 2の存在する位置を会議参加者の位置とみなす。また、端末ユニット 2が会議参加者の数よりも少なレ、、または端末ユニット 2が 1つである場合には、それぞれの会議参加者の位置で上記位置測定を行い、測定したそれぞれの位置情報を会議参加者の位置として通信会議装置 1のメモリ（図示せず）に記憶しておく。

[0036] なお、位置測定は上記の手法に限らず、例えば画像認識により位置を特定する等、他の手法であってもよい。

[0037] 以上のようにして測定した端末ユニット 2の位置に関する情報に基づいて、制御部 1 4は、マイクアレイ 11の指向性をコントロールする。例えば、端末ユニット 2の位置にマイクアレイ 11の感度が向くように設定し、発話者の音声を効率よく収音する。また、通信会議装置 1から遠い位置に対してはマイクアレイ 11のゲインを上げる。

[0038] また、それぞれの端末ユニット 2の位置情報（会議参加者の位置情報）は、他の会議室の通信会議装置 1に送信する。他の会議室における通信会議装置 1の制御部 1 4は、受信した端末ユニット 2の位置情報に応じてスピーカアレイ 12の指向特性を設定する。上述したように、送信側の端末ユニット 2 (会議参加者）の位置座標を特定できるので、送信側から見てこの位置座標から音声が発せられるようにスピーカアレイの指向特性をコントロールして音像定位させる。

[0039] 図 4Aおよび 4Bは、指向特性を説明する図である。図 4Aは、送信側のマイクアレイ

11の指向特性を示した図である。同図において、会議参加者が発した音声は、最も近いマイクユニットから順に到達するが、それぞれのマイクユニットに遅延を与え、音源から発せられた音声が同位相で出力されるようにする。各マイクユニットから同位相で音声が出力されるので、これらをミキシングするとその音声が強調されることとなる。ここで、他の位置から発せられた音声は、各マイクユニットから異なる位相で出力されるのでミキシングすると打ち消されることとなり、音源の方向にのみマイクの主感度を向けることができる。

[0040] 図 4Bは、受信側のスピーカアレイ 12の指向特性を示した図である。同図において、受信した音声データをそれぞれのスピーカユニットから出力する。このとき、図 4Aに示したような通信会議装置 1と端末ユニット 2の位置関係で、仮想音源を形成する。この仮想音源に最も近い位置のスピーカユニットから最初に音声を出力し、隣のスピー力ユニットから順に遅延して出力する。このように、順次遅延させることにより、音声が発話者の位置から発せられたかのような音像定位をさせることができる。

[0041] このような制御を行うために、通信会議装置 1の間で送受信するデータについて説明する。図 5A〜5Dは、送受信パケットの例を示した図である。通信会議装置 1は T CP/IPを用いてパケット送受信を行う。同図に示すヘッダ部、およびフッタ部は、 T CP/IPのヘッダ、フッタ（通信制御用の情報）である。

[0042] 図 5Aは、音声データが含まれるパケットの 1例を示す。図 5Aに示すように、データ部には位置情報在無データ、位置情報 X、位置情報 Y、および音声データが含まれている。位置情報在無データは、上述した各会議参加者の位置情報 (位置座標）がパケット中に含まれているか否力を示すデータであり、通信会議装置 1の制御部 14 は、これを参照することで、スピーカアレイ 12の指向特性のコントロールをするか否かを決定する。位置情報がパケット中に含まれてレ、ないと位置情報在無データに示されている場合は、受信した音声データを全てのスピーカユニットで均一に再生する。

[0043] 位置情報 X、および位置情報 Yは、上述した各会議参加者の位置座標を示すデータである。制御部 14は、この情報に基づいてスピーカアレイ 12の指向特性をコント口ールし、この位置から発話音声が聞こえているかのように音像定位させる。

[0044] また、会議開始時に位置情報を送受信するようにして、会議中はデータ部に各会議参加者を識別する情報と音声データを付与して送受信するようにしてもょレ、。図 5Bは会議開始時に送受信するパケットの例を示した図である。図 5Cは、会議中に送受信するパケットの例を示した図である。図 5Bに示すように、会議開始時には、各会議参加者を識別する識別情報と、この識別情報に対応する位置情報を送受信する。このパケットを受信した制御部 14は、それぞれの会議参加者の識別情報と位置情報を対応付けてメモリに記憶する。

[0045] 図 5Cに示すように、会議中は各会議参加者を識別する識別情報と、この識別情報に対応する音声データを送受信する。このパケットを受信した制御部 14は、受信した識別情報に対応する位置情報をメモリから参照し、この位置情報に基づいてスピー力アレイ 12の指向特性をコントロールし、受信した音声データを再生する。

[0046] 会議中に会議参加者の位置が変更された場合は、位置情報変更を示すパケットを送受信する。図 5Dは、位置情報変更を示すパケットの例を示す。図 5Dに示すように、会議中に会議参加者の位置が変更された場合は、位置情報変更パケットである旨を示す位置情報変更データと、位置が変更された会議参加者を識別する識別情報と、この識別情報に対応する位置情報とを送受信する。このパケットを受信した制御部 14は、受信した識別情報と位置情報を対応付けてメモリ内容を更新する。

[0047] なお、送信側（収音側）のマイクアレイと受信側（再生側）のスピーカアレイの数が同一であり、アレイ配置が同一である場合（各スピーカユニットとマイクユニットが 1対 1に対応する場合）には、マイクアレイの遅延量とスピーカアレイの遅延量を同一とすることで、位置情報を送受信しなくとも発話者の位置から音声が聞こえるように音像定位させること力 Sできる。

[0048] 次に、本実施形態の通信会議システムの動作について詳細に説明する。図 6は、位置測定動作を示すフローチャートである。この動作は、会議参加者が会議前にあらかじめ端末ユニット 2を用いて、位置測定モードを指示したときに行う。まず、端末ュニット 2からレジスト情報を取得する（slO)。レジスト情報は、各端末ユニット 2の存在を示す情報であり、それぞれの端末ユニット 2から送信される。これを受信することで通信会議装置 1は会議室内の端末ユニット 2の数を認識することができる。レジスト情報は通信会議装置 1に内蔵のメモリに記憶される。

[0049] 受信したレジスト情報について、メモリ内に登録済であるか否かを判断し (s l l)、登録されてレ、なければレジスト情報をメモリに登録する（s 12)。登録されてレ、れば s 12 の処理は行わなレ、で次の処理に進む。

[0050] その後、端末ユニット 2からスタート信号が受信されたか否かを判断する（s l 3)。端末ユニット 2からスタート信号が送信されていなければレジスト情報の取得から処理を繰り返す。

[0051] 端末ユニット 2からスタート信号が送信され、これを受信した場合、スピーカアレイ 12 のいずれかのスピーカユニットから測定用音波を発してカウンタをスタートする（s l4) 。この測定用音波はどのような音声波形であってもよいが、例えば可聴外の正弦波とする。その後、この音波を検出した端末ユニット 2から音波が到達したことを示す音波到達信号が送信されてくるので、これを受信し、カウンタをストップする（si 5)。これにより端末ユニット 2との距離を測定する。音波到達信号を受信した後、端末ユニット 2 に測定が終了したことを通知する（s i 6)。

[0052] その後、再測定が必要であるか否力、を判断する（si 7)。通信会議装置 1は、レジスト情報を取得したときに、会議室の端末ユニット 2の数を管理しているので、全ての端末ユニット 2の距離を測定した場合に再測定が必要でないと判断し、未測定の端末ユニット 2が存在すれば該当する端末ユニット 2にスタート信号送信要求を通知し (si 8)、スタート信号が受信されたか否かの判断から処理を繰り返す（sl 8→s l 3)。再測定が必要でないと判断した場合は動作を終了する。

[0053] 図 7は、会議開始時の動作を示すフローチャートである。まず、端末ユニット 2から会議開始信号が受信されたか否力を判断する (s20)。会議開始信号が受信されるまでこの判断を繰り返す。会議開始信号が受信されれば、端末ユニット 2の位置測定がすでにされているか否力を判断する（s21)。位置測定がされていなければ会議中に送受信するパケットに位置情報を付加しないよう設定する（s22)。位置測定がされてレ、なければ一般的な通信会議システムと同様に、各マイクユニットで収音した音声をミキシング後、他の会議室に送信し、全てのスピーカユニットから均一音量で音声を再生する。

[0054] 位置測定がされていれば、それぞれの会議参加者にマイク感度が向くように、位置情報に基づいて各マイクユニットの遅延量を設定 (s23)その後、各位置情報と各マイクユニットの遅延量を対応付けてメモリに保存する（s24)。

[0055] 次に会議中の動作について説明する。図 8は、送信側の動作を示すフローチャートである。図 9は、受信側の動作を示すフローチャートである。図 8において、まず他の会議室の受信側の通信会議装置 1と接続されているか否力を判断する（s30)。他の会議室の通信会議装置 1と接続されていなければ接続を開始する（s31)。接続されていればその後の処理に進む。

[0056] その後、音声が入力されたか否かを判断し (s32)、音声が入力されるまでこの判断を繰り返す。音声が入力されれば、入力された音声と位置情報をパケット化し (s33) 、受信側の通信会議装置 1に送信する (s34)。

[0057] 図 9において、受信側の通信会議装置 1は、送信されてきたパケットを受信する（s4 0)。パケット内に位置情報が含まれているか否力を判断する（s41)。位置情報が含まれていれば、この位置情報に応じてスピーカアレイ 12の指向特性を制御する（s42 )。その後、音声を再生する（s43)。位置情報が含まれていなければ、スピーカアレイ 12の指向特性の制御を行わないで、全てのスピーカアレイ 12で均一音量、遅延量で音声を再生する（s41→s43)。

[0058] なお、送信側のマイクアレイの数と、受信側のスピーカアレイの数が同一であり、ァレイ配置が同一である場合 (各スピーカユニットとマイクユニットが 1対 1に対応する場合）には、位置情報を送受信せずとも、遅延量を同一とすることで音像定位を行うことができる。 [0059] 以上のように、本実施形態の通信会議システムは、通信会議装置 1と端末ユニット 2 の距離を測定して会議参加者の位置を特定し、この位置情報を送受信することで、受信側においては、会話音声が発話者の位置から発せられるかのような音像定位をさせること力できる。これにより、臨場感のある音場制御が可能となり、また、テレビ電話等の映像データを送受信する場合であれば、映像中の発話者から音声が発せられるかのような制御もでき、より臨場感ある通信会議システムとなる。

[0060] なお、音像定位は、送信側の発話者の位置から発せられるように制御する例に限るものではない。例えば音像の奥行き (Y座標）は考慮せず、左右の定位だけを制御するようにしてもよい。

産業上の利用可能性

[0061] この発明は、音源の位置を検出して臨場感ある音場制御を行う通信会議システム等の音声伝達システムに適用することができ、この発明によれば、簡易な構成でありながら臨場感ある通信会議を実現することができる。

Claims

請求の範囲

[1] 第 1の場所に設置された複数のマイクユニットからなるマイクアレイと、

第 2の場所に設置された複数のスピーカユニットからなるスピーカアレイと、第 1の場所に存在する音源位置を検出する位置検出手段と、

前記位置検出手段が検出した音源の位置に前記マイクアレイの指向特性を設定するマイク側信号処理手段と、

前記指向特性で前記マイクアレイが収音した音声データを、前記指向特性の情報とともに送信する送信手段と、

前記送信手段が送信した音声データを、指向特性情報とともに受信する受信手段と、

前記指向特性情報に基づいて、前記第 1の場所における音源位置に仮想的な音源が形成されるように、前記スピーカアレイの指向特性を設定するスピーカ側信号処理手段と、

を備えた音声伝達システム。

[2] 第 1の場所に設置された複数のマイクユニットからなる第 1のマイクアレイと、

第 2の場所に設置された複数のスピーカユニットからなる第 2のスピーカアレイと、第 1の場所に存在する音源位置を検出する第 1の位置検出手段と、

前記第 1の位置検出手段が検出した音源の位置に前記第 1のマイクアレイの指向特性を設定する第 1のマイク側信号処理手段と、

前記指向特性で前記第 1のマイクアレイが収音した音声データを、前記指向特性の情報とともに送信する第 1の送信手段と、

前記第 1の送信手段が送信した音声データを、指向特性情報とともに受信する第 2 の受信手段と、

前記指向特性情報に基づいて、前記第 1の場所における音源位置に仮想的な音源が形成されるように、前記第 2のスピーカアレイの指向特性を設定する第 2のスピー力側信号処理手段と、

第 2の場所に設置された複数のマイクユニットからなる第 2のマイクアレイと、第 1の場所に設置された複数のスピーカユニットからなる第 1のスピーカアレイと、第 2の場所に存在する音源位置を検出する第 2の位置検出手段と、前記第 2の位置検出手段が検出した音源の位置に前記第 2のマイクアレイの指向特性を設定する第 2のマイク側信号処理手段と、

前記指向特性で前記第 2のマイクアレイが収音した音声データを、前記指向特性の情報とともに送信する第 2の送信手段と、

前記第 2の送信手段が送信した音声データを、指向特性情報とともに受信する第 1 の受信手段と、

前記指向特性情報に基づいて、前記第 2の場所における音源位置に仮想的な音源が形成されるように、前記第 1のスピーカアレイの指向特性を設定する第 1のスピー力側信号処理手段と、

を備えた音声伝達システム。

[3] 前記位置検出手段は、複数の音源位置を検出し、

前記マイク側信号処理手段は、複数の音源位置に前記マイクアレイの指向特性をそれぞれ設定し、

前記情報送信手段は、複数の音声データを、それぞれの指向特性の情報とともに送信し、

前記情報受信手段は、複数の音声データを、それぞれの指向特性の情報とともに受信し、

前記スピーカ側信号処理手段は、複数の音源位置に仮想的な音源が形成されるように、前記スピーカアレイの指向特性を設定する請求項 1または請求項 2に記載の音声伝達システム。

[4] 請求項 2に記載の第 1のマイクアレイ、第 1のスピーカアレイ、第 1の位置検出手段、第 1のマイク側信号処理手段、第 1の情報送信手段、第 1の情報受信手段、および第 1のスピーカ側信号処理手段を一体に備えた通信会議装置。