JP2004274147A

JP2004274147A - 音場定位型多地点通話システム

Info

Publication number: JP2004274147A
Application number: JP2003058648A
Authority: JP
Inventors: Masaaki Takizawa; 正明滝沢; Satoshi Endo; 智遠藤; Yukio Takahashi; 幸夫高橋; Toru Odaka; 徹小高
Original assignee: Hitachi Communication Technologies Ltd
Current assignee: Hitachi Ltd
Priority date: 2003-03-05
Filing date: 2003-03-05
Publication date: 2004-09-30

Abstract

【課題】目的は通話者がそれぞれ遠隔地であっても、擬似的に通話者の位置を会議室のような空間に配置し、あたかも円卓を囲んで会話するような状態にすることができ、互いに各通話者を認識にして臨場感を与えるとともに、利便性の向上を図ることができる音場定位型多地点通話システムを提供する。
【解決手段】携帯網やＩＰ（ＩｎｔｅｒｎｅｔＰｒｏｔｏｃｏｌ）網等の電話網ＮＷと、電話網ＮＷに接続し、マイクを有するステレオヘッドセット３ａ〜３ｅを備えた携帯電話機等で構成された音声通話端末２ａ〜２ｅと、電話網ＮＷに接続し、サービスセンタに設置された音声サーバ等で構成されたステレオ音声発生手段９、合成手段１０を備えた音声合成装置４とから構築する。
【選択図】図１

Description

【０００１】
【発明の属する技術分野】
本発明は地理的に離れている複数（３人以上）の通話者が同時に会話を可能とする音場定位型多地点通話システムに係り、特に通話の音声信号をステレオ化することにより、各通話者の位置を擬似的に定位させ、あたかも会議テーブルについて会話するように、各通話者を容易に特定できる音場定位型多地点通話システムに関する。
【０００２】
【従来の技術】
従来の多地点通話システムは、「特許文献１」に開示されているように、上り１チャネル、下り２チャネルの音声チャネルを有する複数の通話端末と、多地点にある複数の通話端末を接続して３話者以上の多地点通話を仲介し、任意の通話端末から上り１チャネルの音声信号を他の任意の通話端末への下り２チャネルの音声信号として任意のレベル比で２チャネルにデマルチプレクスし、１つの通話端末に対して他の複数の通話端末からの音声信号をミキシングする多地点通話サーバとを備え、通話を行っている各通話者の音声に仮想的に音像の定位を確立し、複人数の通話から個々の通話者の音声を容易に聞取り可能となるものが知られている。
【０００３】
このように、従来の多地点通話システムは、通話の複数の参加者が左右の特定位置に居るものと想定し、左に居ると想定した参加者からの音声信号は、左側の音声信号を右側の音声信号よりも大きく設定し、右に居ると想定した参加者からの音声信号は、右側の音声信号を左側の音声信号よりも大きく設定して合成し、音声信号レベルの差異によって参加者が左右に居るように聞き手に認識させるようにしている。
【０００４】
【特許文献１】
特開平１１−６８９７７号公報
【０００５】
【発明が解決しようとする課題】
「特許文献１」に開示された従来の多地点通話システムは、通話者の音声信号レベルを左右で異ならせることにより、通話者の位置を認識するものであるが、人間の聴覚は、単純な左右の音量のバランスだけで、話者（または、音源）の位置を同定しているのではなく、音声の周波数特性によって話者（または、音源）の方向や位置までも認識しているので、左右音量のバランスのみでは話者（または、音源）の方向や位置を正確に認識することが難しい。
【０００６】
人間の耳の構造上、耳に垂直に入る音声は、比較的周波数特性を持たずに聞き取ることができる。一方、反対側からの音声は、顔や頭の表面に沿って耳に廻り込む（回折現象）ので、低周波成分が回り込み難いために減衰する周波数特性を持って聞き取ることになる。
【０００７】
また、比較的遠距離からの音声は、近距離からの音声と比較して、顔や頭の表面に沿って耳に廻り込む角度が小さいので、低周波成分の減衰が少なくなり、高周波成分との減衰の差異は小さい。人間の耳と音声には、このような関係があるので、左右の耳に聞かせる音声信号に周波数特性（特に、低周波成分）の差異を設定することにより、通話者（音源）の方向や位置を識別できることになる。
【０００８】
この発明はこのような課題を解決するためになされたもので、その目的は通話者がそれぞれ遠隔地であっても、擬似的に通話者の位置を会議室のような空間に配置し、あたかも円卓を囲んで会話するような状態にすることができ、互いに各通話者を認識にして臨場感を与えるとともに、利便性の向上を図ることができる音場定位型多地点通話システムを提供することにある。
【０００９】
【課題を解決するための手段】
前記課題を解決するためこの発明に係る音場定位型多地点通話システムは、マイクを有するステレオヘッドセットを備えた複数の音声通話端末と、複数の音声通話端末から送信されるモノラル音声信号を合成し、ステレオ音声信号を複数の音声通話端末に送信する音声合成装置と、モノラル音声信号およびステレオ音声を伝送する電話網とからなる音場定位型多地点通話システムであって、音声合成装置は、複数の音声通話端末からのモノラル音声信号に互いに異なる周波数特性の減衰量を設定し、それぞれ左右の音声信号を生成するステレオ音声信号生成手段と、ステレオ音声信号生成手段から供給される複数の音声通話端末に対応したステレオ音声信号を合成する合成手段とを備えたことを特徴とする。
【００１０】
この発明に係る音場定位型多地点通話システムの音声合成装置は、複数の音声通話端末からのモノラル音声信号に互いに異なる周波数特性の減衰量を設定し、それぞれ左右の音声信号を生成するステレオ音声信号生成手段と、ステレオ音声信号生成手段から供給される複数の音声通話端末に対応したステレオ音声信号を合成する合成手段とを備えたので、左右音声信号の周波数特性の違いにより、複数の音声通話端末の通話者があたかも円卓を囲んで会話するように擬似的に配置し、通話者がそれぞれ遠隔地であっても、擬似的に通話者の位置を会議室のような空間に配置し、あたかも円卓を囲んで会話するような状態することができ、互いに各通話者を認識にして臨場感を与えるとともに、利便性の向上を図ることができる。
【００１１】
また、この発明に係るステレオ音声生成手段は、カットオフ周波数または減衰量の一方または双方を可変可能なフィルタ手段を備えたことを特徴とする。
【００１２】
この発明に係るステレオ音声生成手段は、カットオフ周波数または減衰量の一方または双方を可変可能なフィルタ手段を備えたので、モノラル音声信号から周波数特性の異なる左音声信号および右音声信号を生成することができ、通話者の擬似的な位置を任意に設定することができる。
【００１３】
さらに、この発明に係るステレオ音声生成手段は、モノラル音声信号をフーリエ変換するフーリエ変換手段と、フーリエ変換された周波数スペクトラムに異なる周波数係数を重み付けする重み付け手段と、重み付けされた周波数スペクトラムをステレオ音声信号に変換する逆フーリエ変換手段とを備えたことを特徴とする。
【００１４】
この発明に係るステレオ音声生成手段は、モノラル音声信号をフーリエ変換するフーリエ変換手段と、フーリエ変換された周波数スペクトラムに異なる周波数係数を重み付けする重み付け手段と、重み付けされた周波数スペクトラムをステレオ音声信号に変換する逆フーリエ変換手段とを備えたので、モノラル音声信号から周波数特性の異なる左音声信号および右音声信号を生成することができ、通話者の擬似的な位置を任意に設定することができる。
【００１５】
また、この発明に係る合成手段は、通話者自身に対応するステレオ音声信号を、通話者自身に送信しないことを特徴とする。
【００１６】
この発明に係る合成手段は、通話者自身に対応するステレオ音声信号を、通話者自身に送信しないので、各通話者は、自身の音声を受聴することなく、他の通話者全員のステレオ音声信号を受聴することができ、自然で臨場感のある会話をすることができる。
【００１７】
【発明の実施の形態】
以下、この発明の実施の形態を添付図面に基づいて説明する。なお、本発明は互いに離れた位置の通話者が、あたかも会議室のような空間で、円卓を囲んで会話するような、自然で臨場感のある通話が可能になるものである。
【００１８】
例えば、何らかの障害対策時に、関連部門のメンバーが会話しながら作業する場面を想定すると、サービス要員、品質保証要員、統制ＳＥ（システムエンジニア）の３者が地理的に隔たりを意識せずに、相談しながら作業できる環境を提供するような場合に適用し、従来から利用されている３者通話より自然で臨場感があって多人数で利用でき、通常の電話では不自然で結局実際に合って打合せをすることになるという不便を解消し、遠隔多地点通話を円滑に実行することができる。
【００１９】
図１はこの発明に係る音場定位型多地点通話システムの一実施の形態構成図である。図１において、音場定位型多地点通話システム１は、携帯網やＩＰ（ＩｎｔｅｒｎｅｔＰｒｏｔｏｃｏｌ）網等の電話網ＮＷと、電話網ＮＷに接続し、マイクを有するステレオヘッドセット３ａ〜３ｅを備えた携帯電話機等で構成された音声通話端末２ａ〜２ｅと、電話網ＮＷに接続し、サービスセンタに設置された音声サーバ等で構成された音声合成装置４とから構築する。なお、音声通話端末２ａ〜２ｅは、５台で構成したが、６台以上であってもよい。
【００２０】
音声通話端末２ａ〜２ｅは、それぞれ遠隔地にあり、通話の際には、モノラル音声信号を電話網ＮＷを介して音声合成装置４に送信し、音声合成装置４から電話網ＮＷを介して送信されてくるステレオ音声信号をステレオヘッドセット３ａ〜３ｅで受聴する。
【００２１】
音声合成装置４は、音声通話端末２ａ〜２ｅから電話網ＮＷを介して送信されてくるモノラル音声信号に互いに異なる周波数特性の減衰量を設定し、それぞれ左右の音声信号を生成するステレオ音声信号生成手段と、ステレオ音声信号生成手段から供給される複数の音声通話端末２ａ〜２ｅに対応したステレオ音声信号を合成する合成手段を備える。
【００２２】
ステレオ音声生成手段は、カットオフ周波数または減衰量の一方または双方を可変可能なフィルタ手段を備え、モノラル音声信号から周波数特性の異なる左音声信号および右音声信号を生成する。
【００２３】
また、ステレオ音声生成手段は、モノラル音声信号をフーリエ変換するフーリエ変換手段と、フーリエ変換された周波数スペクトラムに異なる周波数係数を重み付けする重み付け手段と、重み付けされた周波数スペクトラムをステレオ音声信号に変換する逆フーリエ変換手段とを備え、モノラル音声信号から周波数特性の異なる左音声信号および右音声信号を生成する。
【００２４】
合成手段は、通話者自身に対応するステレオ音声信号を、通話者自身に送信しないので、各通話者は、自身の音声を受聴することなく、他の通話者全員のステレオ音声信号を受聴することができる。
【００２５】
このように、音声合成装置４は、音声通話端末２ａ〜２ｅから電話網ＮＷを介して送信されてくる各通話者のモノラル音声信号を取り込み、立体音場に通話者をそれぞれ分離されたステレオ音源として定位させる。
【００２６】
また、音声合成装置４は、モノラル音声信号を合成した２チャネルのステレオ音声信号をそれぞれの通話者宛てに通話者自身の音声成分（ステレオ音声信号）を除いた他の全通話者の合成したステレオ音声信号を電話網ＮＷを介して音声通話端末２ａ〜２ｅに送信することにより、各通話者が自分の居る位置を基準とした近くに居る他の通話者のステレオ音声を聞くことができるので、自然で臨場感のある通話を実現することができる。
【００２７】
次に、音声合成装置４の立体音場に通話者をそれぞれ分離された音源として定位させ、ステレオ音声信号を合成する方法について説明する。まず、通話者が３人の場合について説明する。
【００２８】
図２はこの発明に係る音声合成装置の一実施の形態通話者の音場同定モデル図である。図２において、音場同定モデル５は、音声通話端末２ａ，２ｂ，２ｃを利用する３通話者をそれぞれ三角形の頂点に配置し、音場Ａ（通話者Ａ）、音場Ｂ（通話者Ｂ）および音場Ｃ（通話者Ｃ）を同定する。
【００２９】
図３は図２のモデルの一実施の形態特定音場までの音声経路パターン図である。図３において、音場同定モデル６は、音場Ａ（通話者Ａ）の左右の耳に相当する部分（擬似耳）をＡＥＬ，ＡＥＲ、音場Ｂ（通話者Ｂ）の口に相当する部分（擬似口）の音源をＢＯ、左右の耳に相当する部分（擬似耳）をＢＥＬ，ＢＥＲ、音場Ｃ（通話者Ｃ）の口に相当する部分（擬似口）の音源をＣＯ、左右の耳に相当する部分（擬似耳）をＣＥＬ，ＣＥＲとしてモデル化する。
【００３０】
音場Ａ（通話者Ａ）の左耳ＡＥＬに入る音声は、音場Ｂ（通話者Ｂ）の音源（擬似口ＢＯ）から音声経路ＤＢＲを通ってくる音源の右音声と、音場Ｃ（通話者Ｃ）の音源（擬似口ＣＯ）から音声経路ＤＣＲを通ってくる音源の右音声との合成された音声となる。
【００３１】
一方、音場Ａ（通話者Ａ）の右耳ＡＥＲに入る音声は、音場Ｂ（通話者Ｂ）の音源（擬似口ＢＯ）から音声経路ＤＢＬを通ってくる音源の左音声と、音場Ｃ（通話者Ｃ）の音源（擬似口ＣＯ）から音声経路ＤＣＬを通ってくる音源の左音声との合成された音声となる。
【００３２】
音場Ａ（通話者Ａ）の左耳ＡＥＬおよび右耳ＡＥＲに入力する音場Ｂ（通話者Ｂ）の音声は、右耳ＡＥＲ（耳の孔）には、音声経路ＤＢＬを通ってくる音源の左音声が直線的（ストレート）に到達するため、低周波成分から高周波成分まで平坦（フラット）の周波数特性で到達するが、左耳ＡＥＬ（耳の孔）には、音声経路ＤＢＲを通ってくる音源の右音声が顔や頭を廻り込む（回折する）ため、回折現象によって高周波成分への影響は少ないが、低周波成分が減衰された周波数特性で到達することになる。
【００３３】
一方、音場Ａ（通話者Ａ）の左耳ＡＥＬおよび右耳ＡＥＲに入力する音場Ｃ（通話者Ｃ）の音声は、右耳ＡＥＲ（耳の孔）には、音声経路ＤＣＬを通ってくる音源の左音声が顔や頭を廻り込む（回折する）ため、回折現象によって高周波成分への影響は少ないが、低周波成分が減衰された周波数特性で到達するが、左耳ＡＥＬ（耳の孔）には、音声経路ＤＣＲを通ってくる音源の右音声が直線的（ストレート）に到達するため、低周波成分から高周波成分まで平坦（フラット）の周波数特性で到達することになる。
【００３４】
なお、音場Ａ（通話者Ａ）の左耳ＡＥＬおよび右耳ＡＥＲに入力する音声は、音場Ｂ（通話者Ｂ）または音場Ｃ（通話者Ｃ）を右耳ＡＥＲと左耳ＡＥＬを結ぶ直線方向に近づけて配置するほど、音場Ｂ（通話者Ｂ）から左耳ＡＥＬ（耳の孔）に到達する音声の低周波成分の減衰量が右耳ＡＥＲ（耳の孔）に到達する音声よりも著しく大きな周波数特性となり、音場Ｃ（通話者Ｃ）から右耳ＡＥＲ（耳の孔）に到達する音声の低周波成分の減衰量が左耳ＡＥＬ（耳の孔）に到達する音声よりも著しく大きな周波数特性となる。
【００３５】
また、音場Ａ（通話者Ａ）の左耳ＡＥＬおよび右耳ＡＥＲに入力する音声は、音場Ｂ（通話者Ｂ）または音場Ｃ（通話者Ｃ）を音場Ａ（通話者Ａ）の正面に配置した場合には、音場Ｂ（通話者Ｂ）または音場Ｃ（通話者Ｃ）から左耳ＡＥＬ（耳の孔）および右耳ＡＥＲ（耳の孔）に到達する音声が直線的（ストレート）になるので、低周波成分から高周波成分に亘って減衰はなく、周波数特性が平坦（フラット）になる。
【００３６】
図４は図２のモデルの全音場までの音声経路パターン図である。図４の音場同定モデル７において、音場Ａ（通話者Ａ）〜音場Ｃ（通話者Ｃ）相互間の音声経路は、音場Ａ（通話者Ａ）の音源（擬似口ＡＯ）とし、音場Ｂ（通話者Ｂ）の左右の耳（擬似耳）をＢＥＬ，ＢＥＲ、音場Ｃ（通話者Ｃ）の左右の耳（擬似耳）をＣＥＬ，ＣＥＲとすると、音場Ｂ（通話者Ｂ）を中心とした左右の耳ＢＥＬ，ＢＥＲに入る音場Ａ（通話者Ａ）および音場Ｃ（通話者Ｃ）の音声経路、および音場Ｃ（通話者Ｃ）を中心とした左右の耳ＣＥＬ，ＣＥＲに入る音場Ａ（通話者Ａ）および音場Ｂ（通話者Ｃ）の音声経路も図３に示す音声経路と同様になる。
【００３７】
このように、音場Ａ（通話者Ａ）〜音場Ｃ（通話者Ｃ）の左右の耳に到達する音声は、低周波成分の減衰量によって音源の方向を特定（推定）することができるので、図１に示す音声通話端末２ａ〜２ｃのステレオヘッドセット３ａ〜３ｃの左右に送信する左音声信号および右音声信号の周波数特性を設定することにより、図２に示す音場Ａ（通話者Ａ）〜音場Ｃ（通話者Ｃ）の音場を定位することができる。
【００３８】
図５はこの発明に係る音声合成装置の一実施の形態３者通話音声信号図である。図５において、音声通話端末２ａ（通話者Ａ）に送信する通話音声信号は、ステレオヘッドセット３ａの右ヘッドホンに対して図３に示す音場Ｂ（通話者Ｂ）の音源ＢＯから通話経路ＤＢＬを通る音源ＢＯの左音声に対応する音声信号ＢＬｆ１と、音場Ｃ（通話者Ｃ）の音源ＣＯから通話経路ＤＣＬを通る音源ＣＯの左音声に対応する音声信号ＣＬｆ１を合成し、音声信号Ａ（右）＝ＢＬｆ１＋ＣＬｆ１を送信する。
【００３９】
一方、音声通話端末２ａ（通話者Ａ）に送信する通話音声信号は、ステレオヘッドセット３ａの左ヘッドホンに対して図３に示す音場Ｂ（通話者Ｂ）の音源ＢＯから通話経路ＤＢＲを通る音源ＢＯの右音声に対応する音声信号ＢＲｆ１と、音場Ｃ（通話者Ｃ）の音源ＣＯから通話経路ＤＣＲを通る音源ＣＯの右音声に対応する音声信号ＣＲｆ１を合成して音声信号Ａ（左）＝ＢＲｆ１＋ＣＲｆ１を送信する。つまり、音声合成装置４から音声通話端末２ａに送信する音声信号は、音声信号Ａ（左）と音声信号Ａ（右）を合成したステレオ音声信号を送信する。なお、図中の音声信号Ａ（左）と音声信号Ａ（右）で、「０」の記載は、音場Ａ（通話者Ａ）には、音場Ａ（通話者Ａ）自身の音声信号を送信しないことを表わす。また、音声信号のＬｆ１，Ｒｆ１，Ｌｆ２，Ｒｆ２は、周波数特性を有するものであり、音場Ａ〜音場Ｃの配置関係に伴い、それぞれ異なる特性を表わす。
【００４０】
ステレオ音声信号を受信した音声通話端末２ａは、図２に示す三角形の頂点に音声通話端末２ｂおよび音声通話端末２ｃの音場Ｂおよび音場Ｃがあり、あたかも通話者Ａ、通話者Ｂおよび通話者Ｃが同一会議室の空間で、円卓を囲んで会話しているような環境で、自然に臨場感のある通話（会話）をすることができる。
【００４１】
音声合成装置４は、音声通話端末２ｂおよび音声通話端末２ｃに対しても音声通話端末２ａと同様に、ステレオ音声信号を送信する。
【００４２】
図６はこの発明に係る音声合成装置の一実施の形態要部ブロック構成図である。図６において、音声合成装置４は、音声通話端末２ａ〜２ｃを対象とし、通信インタフェース８ａ〜８ｃ、ステレオ音声信号生成手段９および合成手段１０を備える。
【００４３】
通信インタフェース８ａ〜８ｃは、音声通話端末２ａ〜２ｃと音声合成装置４とのインタフェースを取る。
【００４４】
ステレオ音声生信号成手段９は、フィルタ手段１１ａ〜１１ｃを備える。フィルタ手段１１ａ〜１１ｃは、それぞれカットオフ周波数または減衰量のいずれか（一方）または双方を可変可能な２個のハイパスフィルタ（ＨＰＦ）を備え、通信インタフェース８ａ〜８ｃから供給される音声通話端末２ａ〜２ｃからのモノラル音声信号に低周波特性の異なるフィルタリングを施し、フィルタリングを施した２種の音声信号をステレオ音声信号として合成手段１０に供給する。
【００４５】
図９はこの発明に係るフィルタ手段の一実施の形態周波数（ｆ）−減衰量（Ｄ）特性図である。図９において、フィルタ手段１１ａ〜１１ｃは、それぞれ２種のハイパスフィルタ（ＨＰＦ）を備え、音声通話端末２ａ〜２ｃから供給されるモノラル音声信号（Ｆ０特性図）にカットオフ周波数ｆｃ１とｆｃ２（減衰量３ｄｂ）のフィルタリングを施したＦ１特性図およびＦ２特性図の周波数特性を有する２種の音声信号をステレオ信号として生成する。
【００４６】
合成手段１０は、フィルタ手段１１ａ〜１１ｃから供給されるステレオ音声信号を合成（加算）し、加算したステレオ信号の右音声信号Ａ（右），Ｂ（右），Ｃ（右）および左音声信号Ａ（左），Ｂ（左），Ｃ（左）を通信インタフェース８ａ〜８ｃを介して音声通話端末２ａ〜２ｃに送信する。
【００４７】
例えば、音声通話端末２ａ（音場Ａに対応）に送信するステレオ音声信号は、右音声信号Ｂ（右），Ｃ（右）と左音声信号Ｂ（左），Ｃ（左）であり、右音声信号Ａ（右）および左音声信号Ａ（左）は、音声通話端末２ａ（音場Ａに対応）自身の音声信号なので、通話者Ａが聞き取る必要がなく、むしろ聞き取ると不自然な通話になるため、音声通話端末２ａ（音場Ａに対応）への送信を禁止する。
【００４８】
音声通話端末２ｂ（音場Ｂに対応）または音声通話端末２ｃ（音場Ｃに対応）に送信するステレオ音声信号も同様に、右音声信号Ｃ（右），Ａ（右）と左音声信号Ｃ（左），Ａ（左）、または右音声信号Ａ（右），Ｂ（右）と左音声信号Ａ（左），Ｂ（左）である。また、音声通話端末２ｂ（音場Ｂに対応）には、右音声信号Ｂ（右）および左音声信号Ｂ（左）の送信を禁止し、音声通話端末２ｃ（音場Ｃに対応）には、右音声信号Ｃ（右）および左音声信号Ｃ（左）の送信を禁止する。
【００４９】
このように、この発明に係るステレオ音声生成手段９は、カットオフ周波数または減衰量の一方または双方を可変可能なフィルタ手段１１ａ〜１１ｃを備えたので、モノラル音声信号から周波数特性の異なる左音声信号および右音声信号を生成することができ、通話者の擬似的な位置を任意に設定することができる。
【００５０】
図７はこの発明に係る音声合成装置の別実施の形態要部ブロック構成図である。図７において、音声合成装置１２は、音声通話端末２ａ〜２ｃを対象とし、通信インタフェース８ａ〜８ｃ、ステレオ音声信号生成手段１３および合成手段１０を備える。
【００５１】
ステレオ音声信号生成手段１３は、フーリエ変換手段１４ａ〜１４ｃ、重み付け手段１５ａ〜１５ｃ、逆フーリエ変換手段１６ａ〜１６ｃを備える。
【００５２】
フーリエ変換手段１４ａ〜１４ｃは、音声通話端末２ａ〜２ｃから供給されるモノラル音声信号にフーリエ変換を施し、周波数スペクトラムを重み付け手段１５ａ〜１５ｃに提供する。
【００５３】
重み付け手段１５ａ〜１５ｃは、周波数係数を格納するメモリおよび乗算機能を備え、重み付け手段１５ａ〜１５ｃから提供される周波数スペクトラムの各周波数成分、特に低周波成分に予めメモリに格納した周波数係数を乗算して重み付けし、低周波スペクトラムの減衰した２種の周波数スペクトラムを合成手段１０に供給する。
【００５４】
図１０はこの発明に係るステレオ音声信号生成手段の一実施の形態周波数（ｆ）−スペクトラム（Ｓ）特性図である。図１０において、フーリエ変換手段１４ａ〜１４ｃは、それぞれ１個のフーリエ変換器（または、フーリエ変換機能）と、図２に示す通話者（Ａ〜Ｃ）の音場同定モデルの低周波スペクトラムを減衰させる周波数に対応した周波数係数を格納するメモリと、格納した周波数係数を乗算する乗算器（または、乗算機能）との構成により、フーリエ変換器から供給されるフラットなスペクトラム（Ｇ０特性図）に異なる２種の周波数係数で重み付けを施した２種のＧ１特性図およびＧ２特性図の周波数スペクトラムをステレオ・スペクトラム信号として合成手段１０に供給する。
【００５５】
また、逆フーリエ変換手段１６ａ〜１６ｃは、合成手段１０で合成された自身（例えば、通話者Ａ）を除く、他の通話者（通話者Ｂおよび通話者Ｃ）の合成されたステレオ・スペクトラム信号に逆フーリエ変換を施し、合成されたステレオ音声信号を音声通話端末２ａ〜２ｃに送信する。
【００５６】
合成手段１０は、重み付け手段１５ａ〜１５ｃから提供される周波数スペクトラムの各周波数成分を合成（加算）し、加算したステレオ・スペクトラム信号の右スペクトラム信号Ａ（右），Ｂ（右），Ｃ（右）および左スペクトラム信号Ａ（左），Ｂ（左），Ｃ（左）を逆フーリエ変換手段１６ａ〜１６ｃに提供する。
【００５７】
例えば、音声通話端末２ａ（音場Ａに対応）に送信するステレオ・スペクトラム信号は、右スペクトラム信号Ｂ（右），Ｃ（右）と左スペクトラムＢ（左），Ｃ（左）であり、右スペクトラム信号Ａ（右）および左スペクトラム信号Ａ（左）は、音声通話端末２ａ（音場Ａに対応）自身の音声信号に対応するので、通話者Ａが聞き取る必要がなく、むしろ聞き取ると不自然な通話になるため、音声通話端末２ａ（音場Ａに対応）への送信を禁止する。
【００５８】
音声通話端末２ｂ（音場Ｂに対応）または音声通話端末２ｃ（音場Ｃに対応）に送信する音声通話端末２ｂ（音場Ｂに対応）または音声通話端末２ｃ（音場Ｃに対応）に送信するステレオ・スペクトラム信号も同様に、右スペクトラム信号Ｃ（右），Ａ（右）と左スペクトラム信号Ｃ（左），Ａ（左）、または右スペクトラム信号Ａ（右），Ｂ（右）と左スペクトラム信号Ａ（左），Ｂ（左）である。また、音声通話端末２ｂ（音場Ｂに対応）には、右スペクトラム信号Ｂ（右）および左スペクトラム信号Ｂ（左）の送信を禁止し、音声通話端末２ｃ（音場Ｃに対応）には、右スペクトラム信号Ｃ（右）および左スペクトラム信号Ｃ（左）の送信を禁止する。
【００５９】
このように、この発明に係るステレオ音声生成手段１３は、モノラル音声信号をフーリエ変換するフーリエ変換手段１４ａ〜１４ｃと、フーリエ変換された周波数スペクトラムに異なる周波数係数を重み付けする重み付け手段１５ａ〜１５ｃと、重み付けされた周波数スペクトラムをステレオ音声信号に変換する逆フーリエ変換手段１６ａ〜１６ｃとを備えたので、モノラル音声信号から周波数特性の異なる左音声信号および右音声信号を生成することができ、通話者の擬似的な位置を任意に設定することができる。
【００６０】
図８はこの発明に係る合成手段の実施の形態基本構成図である。図８において、通話者Ａからのモノラル音声信号は、２種ハイパスフィルタ（ＨＰＦ）でフィルタリングされ、低周波数成分が減衰された２種の周波数特性（ＡＬｆ１、ＡＲｆ１）を有するステレオ音声信号となる。
【００６１】
続いて、通話者Ａを除いた通話者Ｂおよび通話者Ｃの周波数特性（ＢＬｆ１，ＢＲｆ１、ＣＬｆ１，ＣＲｆ１）の音声信号が加算器Σで合成され、左音声信号Ａ（左）および右音声信号Ａ（右）がステレオ音声として出力される。
【００６２】
また、通話者Ｂを除いた通話者Ｃおよび通話者Ａの周波数特性（ＣＬｆ１，ＣＲｆ１、ＡＬｆ１，ＡＲｆ１）の音声信号が加算器Σで合成され、左音声信号Ｂ（左）および右音声信号Ｂ（右）がステレオ音声として出力される。
【００６３】
さらに、通話者Ｃを除いた通話者Ａおよび通話者Ｂの周波数特性（ＡＬｆ１，ＡＲｆ１、ＢＬｆ１，ＢＲｆ１）の音声信号が加算器Σで合成され、左音声信号Ｃ（左）および右音声信号Ｃ（右）がステレオ音声として出力される。
【００６４】
このように、この発明に係る合成手段１０は、通話者自身に対応するステレオ音声信号を、通話者自身に送信しないので、各通話者は、自身の音声を受聴することなく、他の通話者全員のステレオ音声信号を受聴することができ、自然で臨場感のある会話をすることができる。
【００６５】
図１１はこの発明に係る同定モデルの別実施の形態特定音場までの音声経路パターン図である。なお、同定モデルは、通話者Ａ，Ｂ，Ｃ，Ｄ，Ｅの５人の場合を示す。
【００６６】
図１２はこの発明に係る音声合成装置の一実施の形態５者通話音声信号図である。音声通話端末２ａ（通話者Ａ）に送信する通話音声信号は、ステレオヘッドセット３ａの右ヘッドホンに対して図１１に示す音場Ｂ（通話者Ｂ）の音源ＢＯから通話経路ＤＢＬを通る音源ＢＯの左音声に対応する音声信号ＢＬｆ１と、音場Ｃ（通話者Ｃ）の音源ＣＯから通話経路ＤＣＬを通る音源ＢＯの左音声に対応する音声信号ＣＬｆ１と、音場Ｄ（通話者Ｄ）の音源ＤＯから通話経路ＤＤＬを通る音源ＤＯの左音声に対応する音声信号ＤＬｆ１と、音場Ｅ（通話者Ｅ）の音源ＥＯから通話経路ＤＥＬを通る音源ＥＯの左音声に対応する音声信号ＥＬｆ１を合成し、音声信号Ａ（右）＝ＢＬｆ１＋ＣＬｆ１＋ＤＬｆ１＋ＥＬｆ１を送信する。
【００６７】
一方、音声通話端末２ａ（通話者Ａ）に送信する通話音声信号は、ステレオヘッドセット３ａの左ヘッドホンに対して図１１に示す音場Ｂ（通話者Ｂ）の音源ＢＯから通話経路ＤＢＲを通る音源ＢＯの右音声に対応する音声信号ＢＲｆ１と、音場Ｃ（通話者Ｃ）の音源ＣＯから通話経路ＤＣＲを通る音源ＣＯの右音声に対応する音声信号ＣＲｆ１と、音場Ｄ（通話者Ｄ）の音源ＤＯから通話経路ＤＤＲを通る音源ＤＯの右音声に対応する音声信号ＤＲｆ１と、音場Ｅ（通話者Ｅ）の音源ＥＯから通話経路ＤＥＲを通る音源ＥＯの右音声に対応する音声信号ＥＲｆ１を合成して音声信号Ａ（左）＝ＢＲｆ１＋ＣＲｆ１＋ＤＲｆ１＋ＥＲｆ１を送信する。つまり、音声合成装置４から音声通話端末２ａに送信する音声信号は、音声信号Ａ（左）と音声信号Ａ（右）を合成したステレオ音声信号を送信する。
【００６８】
同様に、音声合成装置４から音声通話端末２ｂ〜２ｅに送信する音声信号は、それぞれ音声信号Ｂ（左）と音声信号Ｂ（右）、音声信号Ｃ（左）と音声信号Ｃ（右）、音声信号Ｄ（左）と音声信号Ｄ（右）、音声信号Ｅ（左）と音声信号Ｅ（右）を合成したステレオ音声信号を送出する。
【００６９】
このように、この発明に係る音場定位型多地点通話システム１の音声合成装置４，１２は、複数の音声通話端末２ａ〜２ｅからのモノラル音声信号に互いに異なる周波数特性の減衰量を設定し、それぞれ左右の音声信号を生成するステレオ音声信号生成手段９，１３と、ステレオ音声信号生成手段９，１３から供給される複数の音声通話端末２ａ〜２ｅに対応したステレオ音声信号を合成する合成手段１０とを備えたので、左右音声信号の周波数特性の違いにより、複数の音声通話端末の通話者があたかも円卓を囲んで会話するように擬似的に配置し、通話者がそれぞれ遠隔地であっても、擬似的に通話者の位置を会議室のような空間に配置し、あたかも円卓を囲んで会話するような状態にすることができ、互いに各通話者を認識にして臨場感を与えるとともに、利便性の向上を図ることができる。
【００７０】
なお、本実施の形態では、音声通話端末２ａ〜２ｅ（通話者Ａ〜Ｅ）の５台（または、５人）としたが、６台（または、６人）以上であってもよい。
【００７１】
【発明の効果】
以上説明したように、この発明に係る音場定位型多地点通話システムの音声合成装置は、複数の音声通話端末からのモノラル音声信号に互いに異なる周波数特性の減衰量を設定し、それぞれ左右の音声信号を生成するステレオ音声信号生成手段と、ステレオ音声信号生成手段から供給される複数の音声通話端末に対応したステレオ音声信号を合成する合成手段とを備えたので、左右音声信号の周波数特性の違いにより、複数の音声通話端末の通話者があたかも円卓を囲んで会話するように擬似的に配置し、通話者がそれぞれ遠隔地であっても、擬似的に通話者の位置を会議室のような空間に配置し、あたかも円卓を囲んで会話するような状態にすることができ、互いに各通話者を認識にして臨場感を与えるとともに、利便性の向上を図ることができる。
【００７２】
また、この発明に係るステレオ音声生成手段は、カットオフ周波数または減衰量の一方または双方を可変可能なフィルタ手段を備えたので、モノラル音声信号から周波数特性の異なる左音声信号および右音声信号を生成することができ、通話者の擬似的な位置を任意に設定することができる。
【００７３】
さらに、この発明に係るステレオ音声生成手段は、モノラル音声信号をフーリエ変換するフーリエ変換手段と、フーリエ変換された周波数スペクトラムに異なる周波数係数を重み付けする重み付け手段と、重み付けされた周波数スペクトラムをステレオ音声信号に変換する逆フーリエ変換手段とを備えたので、モノラル音声信号から周波数特性の異なる左音声信号および右音声信号を生成することができ、通話者の擬似的な位置を任意に設定することができる。
【００７４】
また、この発明に係る合成手段は、通話者自身に対応するステレオ音声信号を、通話者自身に送信しないので、各通話者は、自身の音声を受聴することなく、他の通話者全員のステレオ音声信号を受聴することができ、自然で臨場感のある会話をすることができる。
【図面の簡単な説明】
【図１】この発明に係る音場定位型多地点通話システムの一実施の形態構成図
【図２】この発明に係る音声合成装置の一実施の形態通話者の音場同定モデル図
【図３】図２のモデルの一実施の形態特定音場までの音声経路パターン図
【図４】図２のモデルの全音場までの音声経路パターン図
【図５】この発明に係る音声合成装置の一実施の形態３者通話音声信号図
【図６】この発明に係る音声合成装置の一実施の形態要部ブロック構成図
【図７】この発明に係る音声合成装置の別実施の形態要部ブロック構成図
【図８】この発明に係る合成手段の実施の形態基本構成図
【図９】この発明に係るフィルタ手段の一実施の形態周波数（ｆ）−減衰量（Ｄ）特性図
【図１０】この発明に係るステレオ音声信号発生手段の一実施の形態周波数（ｆ）−スペクトラム（Ｓ）特性図
【図１１】この発明に係る同定モデルの別実施の形態特定音場までの音声経路パターン図
【図１２】この発明に係る音声合成装置の一実施の形態５者通話音声信号図
【符号の説明】
１音場定位型多地点通話システム
２ａ〜２ｅ音声通話端末
３ａ〜３ｅステレオヘッドセット
４，１２音声合成装置
５，６，７音場同定モデル
８ａ〜８ｃ通信インタフェース
９，１３ステレオ音声信号生成手段
１０合成手段
１１ａ〜１１ｃフィルタ手段
１４ａ〜１４ｃフーリエ変換手段
１５ａ〜１５ｃ重み付け手段
１６ａ〜１６ｃ逆フーリエ変換手段

Claims

マイクを有するステレオヘッドセットを備えた複数の音声通話端末と、前記複数の音声通話端末から送信されるモノラル音声信号を合成し、ステレオ音声信号を前記複数の音声通話端末に送信する音声合成装置と、モノラル音声信号およびステレオ音声を伝送する電話網と、からなる音場定位型多地点通話システムであって、
前記音声合成装置は、前記複数の音声通話端末からのモノラル音声信号に互いに異なる周波数特性の減衰量を設定し、それぞれ左右の音声信号を生成するステレオ音声信号生成手段と、前記ステレオ音声信号生成手段から供給される前記複数の音声通話端末に対応したステレオ音声信号を合成する合成手段と、を備えたことを特徴とする音場定位型多地点通話システム。
前記ステレオ音声生成手段は、カットオフ周波数または減衰量の一方または双方を可変可能なフィルタ手段を備えたことを特徴とする請求項１記載の音場定位型多地点通話システム。
前記ステレオ音声生成手段は、モノラル音声信号をフーリエ変換するフーリエ変換手段と、フーリエ変換された周波数スペクトラムに異なる周波数係数を重み付けする重み付け手段と、重み付けされた周波数スペクトラムをステレオ音声信号に変換する逆フーリエ変換手段と、を備えたことを特徴とする請求項１記載の音場定位型多地点通話システム。
前記合成手段は、通話者自身に対応するステレオ音声信号を、通話者自身に送信しないことを特徴とする請求項１記載の音場定位型多地点通話システム。