JP2004274147A - 音場定位型多地点通話システム - Google Patents
音場定位型多地点通話システム Download PDFInfo
- Publication number
- JP2004274147A JP2004274147A JP2003058648A JP2003058648A JP2004274147A JP 2004274147 A JP2004274147 A JP 2004274147A JP 2003058648 A JP2003058648 A JP 2003058648A JP 2003058648 A JP2003058648 A JP 2003058648A JP 2004274147 A JP2004274147 A JP 2004274147A
- Authority
- JP
- Japan
- Prior art keywords
- sound
- voice
- stereo
- signal
- caller
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Telephonic Communication Services (AREA)
- Stereophonic System (AREA)
Abstract
【解決手段】携帯網やIP(Internet Protocol)網等の電話網NWと、電話網NWに接続し、マイクを有するステレオヘッドセット3a〜3eを備えた携帯電話機等で構成された音声通話端末2a〜2eと、電話網NWに接続し、サービスセンタに設置された音声サーバ等で構成されたステレオ音声発生手段9、合成手段10を備えた音声合成装置4とから構築する。
【選択図】 図1
Description
【発明の属する技術分野】
本発明は地理的に離れている複数(3人以上)の通話者が同時に会話を可能とする音場定位型多地点通話システムに係り、特に通話の音声信号をステレオ化することにより、各通話者の位置を擬似的に定位させ、あたかも会議テーブルについて会話するように、各通話者を容易に特定できる音場定位型多地点通話システムに関する。
【0002】
【従来の技術】
従来の多地点通話システムは、「特許文献1」に開示されているように、上り1チャネル、下り2チャネルの音声チャネルを有する複数の通話端末と、多地点にある複数の通話端末を接続して3話者以上の多地点通話を仲介し、任意の通話端末から上り1チャネルの音声信号を他の任意の通話端末への下り2チャネルの音声信号として任意のレベル比で2チャネルにデマルチプレクスし、1つの通話端末に対して他の複数の通話端末からの音声信号をミキシングする多地点通話サーバとを備え、通話を行っている各通話者の音声に仮想的に音像の定位を確立し、複人数の通話から個々の通話者の音声を容易に聞取り可能となるものが知られている。
【0003】
このように、従来の多地点通話システムは、通話の複数の参加者が左右の特定位置に居るものと想定し、左に居ると想定した参加者からの音声信号は、左側の音声信号を右側の音声信号よりも大きく設定し、右に居ると想定した参加者からの音声信号は、右側の音声信号を左側の音声信号よりも大きく設定して合成し、音声信号レベルの差異によって参加者が左右に居るように聞き手に認識させるようにしている。
【0004】
【特許文献1】
特開平11−68977号公報
【0005】
【発明が解決しようとする課題】
「特許文献1」に開示された従来の多地点通話システムは、通話者の音声信号レベルを左右で異ならせることにより、通話者の位置を認識するものであるが、人間の聴覚は、単純な左右の音量のバランスだけで、話者(または、音源)の位置を同定しているのではなく、音声の周波数特性によって話者(または、音源)の方向や位置までも認識しているので、左右音量のバランスのみでは話者(または、音源)の方向や位置を正確に認識することが難しい。
【0006】
人間の耳の構造上、耳に垂直に入る音声は、比較的周波数特性を持たずに聞き取ることができる。一方、反対側からの音声は、顔や頭の表面に沿って耳に廻り込む(回折現象)ので、低周波成分が回り込み難いために減衰する周波数特性を持って聞き取ることになる。
【0007】
また、比較的遠距離からの音声は、近距離からの音声と比較して、顔や頭の表面に沿って耳に廻り込む角度が小さいので、低周波成分の減衰が少なくなり、高周波成分との減衰の差異は小さい。人間の耳と音声には、このような関係があるので、左右の耳に聞かせる音声信号に周波数特性(特に、低周波成分)の差異を設定することにより、通話者(音源)の方向や位置を識別できることになる。
【0008】
この発明はこのような課題を解決するためになされたもので、その目的は通話者がそれぞれ遠隔地であっても、擬似的に通話者の位置を会議室のような空間に配置し、あたかも円卓を囲んで会話するような状態にすることができ、互いに各通話者を認識にして臨場感を与えるとともに、利便性の向上を図ることができる音場定位型多地点通話システムを提供することにある。
【0009】
【課題を解決するための手段】
前記課題を解決するためこの発明に係る音場定位型多地点通話システムは、マイクを有するステレオヘッドセットを備えた複数の音声通話端末と、複数の音声通話端末から送信されるモノラル音声信号を合成し、ステレオ音声信号を複数の音声通話端末に送信する音声合成装置と、モノラル音声信号およびステレオ音声を伝送する電話網とからなる音場定位型多地点通話システムであって、音声合成装置は、複数の音声通話端末からのモノラル音声信号に互いに異なる周波数特性の減衰量を設定し、それぞれ左右の音声信号を生成するステレオ音声信号生成手段と、ステレオ音声信号生成手段から供給される複数の音声通話端末に対応したステレオ音声信号を合成する合成手段とを備えたことを特徴とする。
【0010】
この発明に係る音場定位型多地点通話システムの音声合成装置は、複数の音声通話端末からのモノラル音声信号に互いに異なる周波数特性の減衰量を設定し、それぞれ左右の音声信号を生成するステレオ音声信号生成手段と、ステレオ音声信号生成手段から供給される複数の音声通話端末に対応したステレオ音声信号を合成する合成手段とを備えたので、左右音声信号の周波数特性の違いにより、複数の音声通話端末の通話者があたかも円卓を囲んで会話するように擬似的に配置し、通話者がそれぞれ遠隔地であっても、擬似的に通話者の位置を会議室のような空間に配置し、あたかも円卓を囲んで会話するような状態することができ、互いに各通話者を認識にして臨場感を与えるとともに、利便性の向上を図ることができる。
【0011】
また、この発明に係るステレオ音声生成手段は、カットオフ周波数または減衰量の一方または双方を可変可能なフィルタ手段を備えたことを特徴とする。
【0012】
この発明に係るステレオ音声生成手段は、カットオフ周波数または減衰量の一方または双方を可変可能なフィルタ手段を備えたので、モノラル音声信号から周波数特性の異なる左音声信号および右音声信号を生成することができ、通話者の擬似的な位置を任意に設定することができる。
【0013】
さらに、この発明に係るステレオ音声生成手段は、モノラル音声信号をフーリエ変換するフーリエ変換手段と、フーリエ変換された周波数スペクトラムに異なる周波数係数を重み付けする重み付け手段と、重み付けされた周波数スペクトラムをステレオ音声信号に変換する逆フーリエ変換手段とを備えたことを特徴とする。
【0014】
この発明に係るステレオ音声生成手段は、モノラル音声信号をフーリエ変換するフーリエ変換手段と、フーリエ変換された周波数スペクトラムに異なる周波数係数を重み付けする重み付け手段と、重み付けされた周波数スペクトラムをステレオ音声信号に変換する逆フーリエ変換手段とを備えたので、モノラル音声信号から周波数特性の異なる左音声信号および右音声信号を生成することができ、通話者の擬似的な位置を任意に設定することができる。
【0015】
また、この発明に係る合成手段は、通話者自身に対応するステレオ音声信号を、通話者自身に送信しないことを特徴とする。
【0016】
この発明に係る合成手段は、通話者自身に対応するステレオ音声信号を、通話者自身に送信しないので、各通話者は、自身の音声を受聴することなく、他の通話者全員のステレオ音声信号を受聴することができ、自然で臨場感のある会話をすることができる。
【0017】
【発明の実施の形態】
以下、この発明の実施の形態を添付図面に基づいて説明する。なお、本発明は互いに離れた位置の通話者が、あたかも会議室のような空間で、円卓を囲んで会話するような、自然で臨場感のある通話が可能になるものである。
【0018】
例えば、何らかの障害対策時に、関連部門のメンバーが会話しながら作業する場面を想定すると、サービス要員、品質保証要員、統制SE(システムエンジニア)の3者が地理的に隔たりを意識せずに、相談しながら作業できる環境を提供するような場合に適用し、従来から利用されている3者通話より自然で臨場感があって多人数で利用でき、通常の電話では不自然で結局実際に合って打合せをすることになるという不便を解消し、遠隔多地点通話を円滑に実行することができる。
【0019】
図1はこの発明に係る音場定位型多地点通話システムの一実施の形態構成図である。図1において、音場定位型多地点通話システム1は、携帯網やIP(Internet Protocol)網等の電話網NWと、電話網NWに接続し、マイクを有するステレオヘッドセット3a〜3eを備えた携帯電話機等で構成された音声通話端末2a〜2eと、電話網NWに接続し、サービスセンタに設置された音声サーバ等で構成された音声合成装置4とから構築する。なお、音声通話端末2a〜2eは、5台で構成したが、6台以上であってもよい。
【0020】
音声通話端末2a〜2eは、それぞれ遠隔地にあり、通話の際には、モノラル音声信号を電話網NWを介して音声合成装置4に送信し、音声合成装置4から電話網NWを介して送信されてくるステレオ音声信号をステレオヘッドセット3a〜3eで受聴する。
【0021】
音声合成装置4は、音声通話端末2a〜2eから電話網NWを介して送信されてくるモノラル音声信号に互いに異なる周波数特性の減衰量を設定し、それぞれ左右の音声信号を生成するステレオ音声信号生成手段と、ステレオ音声信号生成手段から供給される複数の音声通話端末2a〜2eに対応したステレオ音声信号を合成する合成手段を備える。
【0022】
ステレオ音声生成手段は、カットオフ周波数または減衰量の一方または双方を可変可能なフィルタ手段を備え、モノラル音声信号から周波数特性の異なる左音声信号および右音声信号を生成する。
【0023】
また、ステレオ音声生成手段は、モノラル音声信号をフーリエ変換するフーリエ変換手段と、フーリエ変換された周波数スペクトラムに異なる周波数係数を重み付けする重み付け手段と、重み付けされた周波数スペクトラムをステレオ音声信号に変換する逆フーリエ変換手段とを備え、モノラル音声信号から周波数特性の異なる左音声信号および右音声信号を生成する。
【0024】
合成手段は、通話者自身に対応するステレオ音声信号を、通話者自身に送信しないので、各通話者は、自身の音声を受聴することなく、他の通話者全員のステレオ音声信号を受聴することができる。
【0025】
このように、音声合成装置4は、音声通話端末2a〜2eから電話網NWを介して送信されてくる各通話者のモノラル音声信号を取り込み、立体音場に通話者をそれぞれ分離されたステレオ音源として定位させる。
【0026】
また、音声合成装置4は、モノラル音声信号を合成した2チャネルのステレオ音声信号をそれぞれの通話者宛てに通話者自身の音声成分(ステレオ音声信号)を除いた他の全通話者の合成したステレオ音声信号を電話網NWを介して音声通話端末2a〜2eに送信することにより、各通話者が自分の居る位置を基準とした近くに居る他の通話者のステレオ音声を聞くことができるので、自然で臨場感のある通話を実現することができる。
【0027】
次に、音声合成装置4の立体音場に通話者をそれぞれ分離された音源として定位させ、ステレオ音声信号を合成する方法について説明する。まず、通話者が3人の場合について説明する。
【0028】
図2はこの発明に係る音声合成装置の一実施の形態通話者の音場同定モデル図である。図2において、音場同定モデル5は、音声通話端末2a,2b,2cを利用する3通話者をそれぞれ三角形の頂点に配置し、音場A(通話者A)、音場B(通話者B)および音場C(通話者C)を同定する。
【0029】
図3は図2のモデルの一実施の形態特定音場までの音声経路パターン図である。図3において、音場同定モデル6は、音場A(通話者A)の左右の耳に相当する部分(擬似耳)をAEL,AER、音場B(通話者B)の口に相当する部分(擬似口)の音源をBO、左右の耳に相当する部分(擬似耳)をBEL,BER、音場C(通話者C)の口に相当する部分(擬似口)の音源をCO、左右の耳に相当する部分(擬似耳)をCEL,CERとしてモデル化する。
【0030】
音場A(通話者A)の左耳AELに入る音声は、音場B(通話者B)の音源(擬似口BO)から音声経路DBRを通ってくる音源の右音声と、音場C(通話者C)の音源(擬似口CO)から音声経路DCRを通ってくる音源の右音声との合成された音声となる。
【0031】
一方、音場A(通話者A)の右耳AERに入る音声は、音場B(通話者B)の音源(擬似口BO)から音声経路DBLを通ってくる音源の左音声と、音場C(通話者C)の音源(擬似口CO)から音声経路DCLを通ってくる音源の左音声との合成された音声となる。
【0032】
音場A(通話者A)の左耳AELおよび右耳AERに入力する音場B(通話者B)の音声は、右耳AER(耳の孔)には、音声経路DBLを通ってくる音源の左音声が直線的(ストレート)に到達するため、低周波成分から高周波成分まで平坦(フラット)の周波数特性で到達するが、左耳AEL(耳の孔)には、音声経路DBRを通ってくる音源の右音声が顔や頭を廻り込む(回折する)ため、回折現象によって高周波成分への影響は少ないが、低周波成分が減衰された周波数特性で到達することになる。
【0033】
一方、音場A(通話者A)の左耳AELおよび右耳AERに入力する音場C(通話者C)の音声は、右耳AER(耳の孔)には、音声経路DCLを通ってくる音源の左音声が顔や頭を廻り込む(回折する)ため、回折現象によって高周波成分への影響は少ないが、低周波成分が減衰された周波数特性で到達するが、左耳AEL(耳の孔)には、音声経路DCRを通ってくる音源の右音声が直線的(ストレート)に到達するため、低周波成分から高周波成分まで平坦(フラット)の周波数特性で到達することになる。
【0034】
なお、音場A(通話者A)の左耳AELおよび右耳AERに入力する音声は、音場B(通話者B)または音場C(通話者C)を右耳AERと左耳AELを結ぶ直線方向に近づけて配置するほど、音場B(通話者B)から左耳AEL(耳の孔)に到達する音声の低周波成分の減衰量が右耳AER(耳の孔)に到達する音声よりも著しく大きな周波数特性となり、音場C(通話者C)から右耳AER(耳の孔)に到達する音声の低周波成分の減衰量が左耳AEL(耳の孔)に到達する音声よりも著しく大きな周波数特性となる。
【0035】
また、音場A(通話者A)の左耳AELおよび右耳AERに入力する音声は、音場B(通話者B)または音場C(通話者C)を音場A(通話者A)の正面に配置した場合には、音場B(通話者B)または音場C(通話者C)から左耳AEL(耳の孔)および右耳AER(耳の孔)に到達する音声が直線的(ストレート)になるので、低周波成分から高周波成分に亘って減衰はなく、周波数特性が平坦(フラット)になる。
【0036】
図4は図2のモデルの全音場までの音声経路パターン図である。図4の音場同定モデル7において、音場A(通話者A)〜音場C(通話者C)相互間の音声経路は、音場A(通話者A)の音源(擬似口AO)とし、音場B(通話者B)の左右の耳(擬似耳)をBEL,BER、音場C(通話者C)の左右の耳(擬似耳)をCEL,CERとすると、音場B(通話者B)を中心とした左右の耳BEL,BERに入る音場A(通話者A)および音場C(通話者C)の音声経路、および音場C(通話者C)を中心とした左右の耳CEL,CERに入る音場A(通話者A)および音場B(通話者C)の音声経路も図3に示す音声経路と同様になる。
【0037】
このように、音場A(通話者A)〜音場C(通話者C)の左右の耳に到達する音声は、低周波成分の減衰量によって音源の方向を特定(推定)することができるので、図1に示す音声通話端末2a〜2cのステレオヘッドセット3a〜3cの左右に送信する左音声信号および右音声信号の周波数特性を設定することにより、図2に示す音場A(通話者A)〜音場C(通話者C)の音場を定位することができる。
【0038】
図5はこの発明に係る音声合成装置の一実施の形態3者通話音声信号図である。図5において、音声通話端末2a(通話者A)に送信する通話音声信号は、ステレオヘッドセット3aの右ヘッドホンに対して図3に示す音場B(通話者B)の音源BOから通話経路DBLを通る音源BOの左音声に対応する音声信号BLf1と、音場C(通話者C)の音源COから通話経路DCLを通る音源COの左音声に対応する音声信号CLf1を合成し、音声信号A(右)=BLf1+CLf1を送信する。
【0039】
一方、音声通話端末2a(通話者A)に送信する通話音声信号は、ステレオヘッドセット3aの左ヘッドホンに対して図3に示す音場B(通話者B)の音源BOから通話経路DBRを通る音源BOの右音声に対応する音声信号BRf1と、音場C(通話者C)の音源COから通話経路DCRを通る音源COの右音声に対応する音声信号CRf1を合成して音声信号A(左)=BRf1+CRf1を送信する。つまり、音声合成装置4から音声通話端末2aに送信する音声信号は、音声信号A(左)と音声信号A(右)を合成したステレオ音声信号を送信する。なお、図中の音声信号A(左)と音声信号A(右)で、「0」の記載は、音場A(通話者A)には、音場A(通話者A)自身の音声信号を送信しないことを表わす。また、音声信号のLf1,Rf1,Lf2,Rf2は、周波数特性を有するものであり、音場A〜音場Cの配置関係に伴い、それぞれ異なる特性を表わす。
【0040】
ステレオ音声信号を受信した音声通話端末2aは、図2に示す三角形の頂点に音声通話端末2bおよび音声通話端末2cの音場Bおよび音場Cがあり、あたかも通話者A、通話者Bおよび通話者Cが同一会議室の空間で、円卓を囲んで会話しているような環境で、自然に臨場感のある通話(会話)をすることができる。
【0041】
音声合成装置4は、音声通話端末2bおよび音声通話端末2cに対しても音声通話端末2aと同様に、ステレオ音声信号を送信する。
【0042】
図6はこの発明に係る音声合成装置の一実施の形態要部ブロック構成図である。図6において、音声合成装置4は、音声通話端末2a〜2cを対象とし、通信インタフェース8a〜8c、ステレオ音声信号生成手段9および合成手段10を備える。
【0043】
通信インタフェース8a〜8cは、音声通話端末2a〜2cと音声合成装置4とのインタフェースを取る。
【0044】
ステレオ音声生信号成手段9は、フィルタ手段11a〜11cを備える。フィルタ手段11a〜11cは、それぞれカットオフ周波数または減衰量のいずれか(一方)または双方を可変可能な2個のハイパスフィルタ(HPF)を備え、通信インタフェース8a〜8cから供給される音声通話端末2a〜2cからのモノラル音声信号に低周波特性の異なるフィルタリングを施し、フィルタリングを施した2種の音声信号をステレオ音声信号として合成手段10に供給する。
【0045】
図9はこの発明に係るフィルタ手段の一実施の形態周波数(f)−減衰量(D)特性図である。図9において、フィルタ手段11a〜11cは、それぞれ2種のハイパスフィルタ(HPF)を備え、音声通話端末2a〜2cから供給されるモノラル音声信号(F0特性図)にカットオフ周波数fc1とfc2(減衰量3db)のフィルタリングを施したF1特性図およびF2特性図の周波数特性を有する2種の音声信号をステレオ信号として生成する。
【0046】
合成手段10は、フィルタ手段11a〜11cから供給されるステレオ音声信号を合成(加算)し、加算したステレオ信号の右音声信号A(右),B(右),C(右)および左音声信号A(左),B(左),C(左)を通信インタフェース8a〜8cを介して音声通話端末2a〜2cに送信する。
【0047】
例えば、音声通話端末2a(音場Aに対応)に送信するステレオ音声信号は、右音声信号B(右),C(右)と左音声信号B(左),C(左)であり、右音声信号A(右)および左音声信号A(左)は、音声通話端末2a(音場Aに対応)自身の音声信号なので、通話者Aが聞き取る必要がなく、むしろ聞き取ると不自然な通話になるため、音声通話端末2a(音場Aに対応)への送信を禁止する。
【0048】
音声通話端末2b(音場Bに対応)または音声通話端末2c(音場Cに対応)に送信するステレオ音声信号も同様に、右音声信号C(右),A(右)と左音声信号C(左),A(左)、または右音声信号A(右),B(右)と左音声信号A(左),B(左)である。また、音声通話端末2b(音場Bに対応)には、右音声信号B(右)および左音声信号B(左)の送信を禁止し、音声通話端末2c(音場Cに対応)には、右音声信号C(右)および左音声信号C(左)の送信を禁止する。
【0049】
このように、この発明に係るステレオ音声生成手段9は、カットオフ周波数または減衰量の一方または双方を可変可能なフィルタ手段11a〜11cを備えたので、モノラル音声信号から周波数特性の異なる左音声信号および右音声信号を生成することができ、通話者の擬似的な位置を任意に設定することができる。
【0050】
図7はこの発明に係る音声合成装置の別実施の形態要部ブロック構成図である。図7において、音声合成装置12は、音声通話端末2a〜2cを対象とし、通信インタフェース8a〜8c、ステレオ音声信号生成手段13および合成手段10を備える。
【0051】
ステレオ音声信号生成手段13は、フーリエ変換手段14a〜14c、重み付け手段15a〜15c、逆フーリエ変換手段16a〜16cを備える。
【0052】
フーリエ変換手段14a〜14cは、音声通話端末2a〜2cから供給されるモノラル音声信号にフーリエ変換を施し、周波数スペクトラムを重み付け手段15a〜15cに提供する。
【0053】
重み付け手段15a〜15cは、周波数係数を格納するメモリおよび乗算機能を備え、重み付け手段15a〜15cから提供される周波数スペクトラムの各周波数成分、特に低周波成分に予めメモリに格納した周波数係数を乗算して重み付けし、低周波スペクトラムの減衰した2種の周波数スペクトラムを合成手段10に供給する。
【0054】
図10はこの発明に係るステレオ音声信号生成手段の一実施の形態周波数(f)−スペクトラム(S)特性図である。図10において、フーリエ変換手段14a〜14cは、それぞれ1個のフーリエ変換器(または、フーリエ変換機能)と、図2に示す通話者(A〜C)の音場同定モデルの低周波スペクトラムを減衰させる周波数に対応した周波数係数を格納するメモリと、格納した周波数係数を乗算する乗算器(または、乗算機能)との構成により、フーリエ変換器から供給されるフラットなスペクトラム(G0特性図)に異なる2種の周波数係数で重み付けを施した2種のG1特性図およびG2特性図の周波数スペクトラムをステレオ・スペクトラム信号として合成手段10に供給する。
【0055】
また、逆フーリエ変換手段16a〜16cは、合成手段10で合成された自身(例えば、通話者A)を除く、他の通話者(通話者Bおよび通話者C)の合成されたステレオ・スペクトラム信号に逆フーリエ変換を施し、合成されたステレオ音声信号を音声通話端末2a〜2cに送信する。
【0056】
合成手段10は、重み付け手段15a〜15cから提供される周波数スペクトラムの各周波数成分を合成(加算)し、加算したステレオ・スペクトラム信号の右スペクトラム信号A(右),B(右),C(右)および左スペクトラム信号A(左),B(左),C(左)を逆フーリエ変換手段16a〜16cに提供する。
【0057】
例えば、音声通話端末2a(音場Aに対応)に送信するステレオ・スペクトラム信号は、右スペクトラム信号B(右),C(右)と左スペクトラムB(左),C(左)であり、右スペクトラム信号A(右)および左スペクトラム信号A(左)は、音声通話端末2a(音場Aに対応)自身の音声信号に対応するので、通話者Aが聞き取る必要がなく、むしろ聞き取ると不自然な通話になるため、音声通話端末2a(音場Aに対応)への送信を禁止する。
【0058】
音声通話端末2b(音場Bに対応)または音声通話端末2c(音場Cに対応)に送信する音声通話端末2b(音場Bに対応)または音声通話端末2c(音場Cに対応)に送信するステレオ・スペクトラム信号も同様に、右スペクトラム信号C(右),A(右)と左スペクトラム信号C(左),A(左)、または右スペクトラム信号A(右),B(右)と左スペクトラム信号A(左),B(左)である。また、音声通話端末2b(音場Bに対応)には、右スペクトラム信号B(右)および左スペクトラム信号B(左)の送信を禁止し、音声通話端末2c(音場Cに対応)には、右スペクトラム信号C(右)および左スペクトラム信号C(左)の送信を禁止する。
【0059】
このように、この発明に係るステレオ音声生成手段13は、モノラル音声信号をフーリエ変換するフーリエ変換手段14a〜14cと、フーリエ変換された周波数スペクトラムに異なる周波数係数を重み付けする重み付け手段15a〜15cと、重み付けされた周波数スペクトラムをステレオ音声信号に変換する逆フーリエ変換手段16a〜16cとを備えたので、モノラル音声信号から周波数特性の異なる左音声信号および右音声信号を生成することができ、通話者の擬似的な位置を任意に設定することができる。
【0060】
図8はこの発明に係る合成手段の実施の形態基本構成図である。図8において、通話者Aからのモノラル音声信号は、2種ハイパスフィルタ(HPF)でフィルタリングされ、低周波数成分が減衰された2種の周波数特性(ALf1、ARf1)を有するステレオ音声信号となる。
【0061】
続いて、通話者Aを除いた通話者Bおよび通話者Cの周波数特性(BLf1,BRf1、CLf1,CRf1)の音声信号が加算器Σで合成され、左音声信号A(左)および右音声信号A(右)がステレオ音声として出力される。
【0062】
また、通話者Bを除いた通話者Cおよび通話者Aの周波数特性(CLf1,CRf1、ALf1,ARf1)の音声信号が加算器Σで合成され、左音声信号B(左)および右音声信号B(右)がステレオ音声として出力される。
【0063】
さらに、通話者Cを除いた通話者Aおよび通話者Bの周波数特性(ALf1,ARf1、BLf1,BRf1)の音声信号が加算器Σで合成され、左音声信号C(左)および右音声信号C(右)がステレオ音声として出力される。
【0064】
このように、この発明に係る合成手段10は、通話者自身に対応するステレオ音声信号を、通話者自身に送信しないので、各通話者は、自身の音声を受聴することなく、他の通話者全員のステレオ音声信号を受聴することができ、自然で臨場感のある会話をすることができる。
【0065】
図11はこの発明に係る同定モデルの別実施の形態特定音場までの音声経路パターン図である。なお、同定モデルは、通話者A,B,C,D,Eの5人の場合を示す。
【0066】
図12はこの発明に係る音声合成装置の一実施の形態5者通話音声信号図である。音声通話端末2a(通話者A)に送信する通話音声信号は、ステレオヘッドセット3aの右ヘッドホンに対して図11に示す音場B(通話者B)の音源BOから通話経路DBLを通る音源BOの左音声に対応する音声信号BLf1と、音場C(通話者C)の音源COから通話経路DCLを通る音源BOの左音声に対応する音声信号CLf1と、音場D(通話者D)の音源DOから通話経路DDLを通る音源DOの左音声に対応する音声信号DLf1と、音場E(通話者E)の音源EOから通話経路DELを通る音源EOの左音声に対応する音声信号ELf1を合成し、音声信号A(右)=BLf1+CLf1+DLf1+ELf1を送信する。
【0067】
一方、音声通話端末2a(通話者A)に送信する通話音声信号は、ステレオヘッドセット3aの左ヘッドホンに対して図11に示す音場B(通話者B)の音源BOから通話経路DBRを通る音源BOの右音声に対応する音声信号BRf1と、音場C(通話者C)の音源COから通話経路DCRを通る音源COの右音声に対応する音声信号CRf1と、音場D(通話者D)の音源DOから通話経路DDRを通る音源DOの右音声に対応する音声信号DRf1と、音場E(通話者E)の音源EOから通話経路DERを通る音源EOの右音声に対応する音声信号ERf1を合成して音声信号A(左)=BRf1+CRf1+DRf1+ERf1を送信する。つまり、音声合成装置4から音声通話端末2aに送信する音声信号は、音声信号A(左)と音声信号A(右)を合成したステレオ音声信号を送信する。
【0068】
同様に、音声合成装置4から音声通話端末2b〜2eに送信する音声信号は、それぞれ音声信号B(左)と音声信号B(右)、音声信号C(左)と音声信号C(右)、音声信号D(左)と音声信号D(右)、音声信号E(左)と音声信号E(右)を合成したステレオ音声信号を送出する。
【0069】
このように、この発明に係る音場定位型多地点通話システム1の音声合成装置4,12は、複数の音声通話端末2a〜2eからのモノラル音声信号に互いに異なる周波数特性の減衰量を設定し、それぞれ左右の音声信号を生成するステレオ音声信号生成手段9,13と、ステレオ音声信号生成手段9,13から供給される複数の音声通話端末2a〜2eに対応したステレオ音声信号を合成する合成手段10とを備えたので、左右音声信号の周波数特性の違いにより、複数の音声通話端末の通話者があたかも円卓を囲んで会話するように擬似的に配置し、通話者がそれぞれ遠隔地であっても、擬似的に通話者の位置を会議室のような空間に配置し、あたかも円卓を囲んで会話するような状態にすることができ、互いに各通話者を認識にして臨場感を与えるとともに、利便性の向上を図ることができる。
【0070】
なお、本実施の形態では、音声通話端末2a〜2e(通話者A〜E)の5台(または、5人)としたが、6台(または、6人)以上であってもよい。
【0071】
【発明の効果】
以上説明したように、この発明に係る音場定位型多地点通話システムの音声合成装置は、複数の音声通話端末からのモノラル音声信号に互いに異なる周波数特性の減衰量を設定し、それぞれ左右の音声信号を生成するステレオ音声信号生成手段と、ステレオ音声信号生成手段から供給される複数の音声通話端末に対応したステレオ音声信号を合成する合成手段とを備えたので、左右音声信号の周波数特性の違いにより、複数の音声通話端末の通話者があたかも円卓を囲んで会話するように擬似的に配置し、通話者がそれぞれ遠隔地であっても、擬似的に通話者の位置を会議室のような空間に配置し、あたかも円卓を囲んで会話するような状態にすることができ、互いに各通話者を認識にして臨場感を与えるとともに、利便性の向上を図ることができる。
【0072】
また、この発明に係るステレオ音声生成手段は、カットオフ周波数または減衰量の一方または双方を可変可能なフィルタ手段を備えたので、モノラル音声信号から周波数特性の異なる左音声信号および右音声信号を生成することができ、通話者の擬似的な位置を任意に設定することができる。
【0073】
さらに、この発明に係るステレオ音声生成手段は、モノラル音声信号をフーリエ変換するフーリエ変換手段と、フーリエ変換された周波数スペクトラムに異なる周波数係数を重み付けする重み付け手段と、重み付けされた周波数スペクトラムをステレオ音声信号に変換する逆フーリエ変換手段とを備えたので、モノラル音声信号から周波数特性の異なる左音声信号および右音声信号を生成することができ、通話者の擬似的な位置を任意に設定することができる。
【0074】
また、この発明に係る合成手段は、通話者自身に対応するステレオ音声信号を、通話者自身に送信しないので、各通話者は、自身の音声を受聴することなく、他の通話者全員のステレオ音声信号を受聴することができ、自然で臨場感のある会話をすることができる。
【図面の簡単な説明】
【図1】この発明に係る音場定位型多地点通話システムの一実施の形態構成図
【図2】この発明に係る音声合成装置の一実施の形態通話者の音場同定モデル図
【図3】図2のモデルの一実施の形態特定音場までの音声経路パターン図
【図4】図2のモデルの全音場までの音声経路パターン図
【図5】この発明に係る音声合成装置の一実施の形態3者通話音声信号図
【図6】この発明に係る音声合成装置の一実施の形態要部ブロック構成図
【図7】この発明に係る音声合成装置の別実施の形態要部ブロック構成図
【図8】この発明に係る合成手段の実施の形態基本構成図
【図9】この発明に係るフィルタ手段の一実施の形態周波数(f)−減衰量(D)特性図
【図10】この発明に係るステレオ音声信号発生手段の一実施の形態周波数(f)−スペクトラム(S)特性図
【図11】この発明に係る同定モデルの別実施の形態特定音場までの音声経路パターン図
【図12】この発明に係る音声合成装置の一実施の形態5者通話音声信号図
【符号の説明】
1 音場定位型多地点通話システム
2a〜2e 音声通話端末
3a〜3e ステレオヘッドセット
4,12 音声合成装置
5,6,7 音場同定モデル
8a〜8c 通信インタフェース
9,13 ステレオ音声信号生成手段
10 合成手段
11a〜11c フィルタ手段
14a〜14c フーリエ変換手段
15a〜15c 重み付け手段
16a〜16c 逆フーリエ変換手段
Claims (4)
- マイクを有するステレオヘッドセットを備えた複数の音声通話端末と、前記複数の音声通話端末から送信されるモノラル音声信号を合成し、ステレオ音声信号を前記複数の音声通話端末に送信する音声合成装置と、モノラル音声信号およびステレオ音声を伝送する電話網と、からなる音場定位型多地点通話システムであって、
前記音声合成装置は、前記複数の音声通話端末からのモノラル音声信号に互いに異なる周波数特性の減衰量を設定し、それぞれ左右の音声信号を生成するステレオ音声信号生成手段と、前記ステレオ音声信号生成手段から供給される前記複数の音声通話端末に対応したステレオ音声信号を合成する合成手段と、を備えたことを特徴とする音場定位型多地点通話システム。 - 前記ステレオ音声生成手段は、カットオフ周波数または減衰量の一方または双方を可変可能なフィルタ手段を備えたことを特徴とする請求項1記載の音場定位型多地点通話システム。
- 前記ステレオ音声生成手段は、モノラル音声信号をフーリエ変換するフーリエ変換手段と、フーリエ変換された周波数スペクトラムに異なる周波数係数を重み付けする重み付け手段と、重み付けされた周波数スペクトラムをステレオ音声信号に変換する逆フーリエ変換手段と、を備えたことを特徴とする請求項1記載の音場定位型多地点通話システム。
- 前記合成手段は、通話者自身に対応するステレオ音声信号を、通話者自身に送信しないことを特徴とする請求項1記載の音場定位型多地点通話システム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003058648A JP2004274147A (ja) | 2003-03-05 | 2003-03-05 | 音場定位型多地点通話システム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003058648A JP2004274147A (ja) | 2003-03-05 | 2003-03-05 | 音場定位型多地点通話システム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2004274147A true JP2004274147A (ja) | 2004-09-30 |
Family
ID=33121710
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003058648A Pending JP2004274147A (ja) | 2003-03-05 | 2003-03-05 | 音場定位型多地点通話システム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2004274147A (ja) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2006080133A1 (ja) * | 2005-01-25 | 2006-08-03 | Matsushita Electric Industrial Co., Ltd. | 音声対話装置 |
JP2006279492A (ja) * | 2005-03-29 | 2006-10-12 | Tsuken Denki Kogyo Kk | 電話会議システム |
JP2009033298A (ja) * | 2007-07-25 | 2009-02-12 | Nec Corp | 通信システム及び通信端末 |
JP2009261010A (ja) * | 2009-08-04 | 2009-11-05 | Panasonic Corp | 音声対話装置 |
JP2016048534A (ja) * | 2013-12-25 | 2016-04-07 | キヤノンマーケティングジャパン株式会社 | 情報処理システム、その制御方法、及びプログラム、並びに情報処理装置、その制御方法、及びプログラム |
JP2021524612A (ja) * | 2018-07-09 | 2021-09-13 | コーニンクレッカ フィリップス エヌ ヴェKoninklijke Philips N.V. | オーディオ装置、オーディオ配信システム及びその動作方法 |
-
2003
- 2003-03-05 JP JP2003058648A patent/JP2004274147A/ja active Pending
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2006080133A1 (ja) * | 2005-01-25 | 2006-08-03 | Matsushita Electric Industrial Co., Ltd. | 音声対話装置 |
US8014884B2 (en) | 2005-01-25 | 2011-09-06 | Panasonic Corporation | Audio conversation apparatus |
US8712564B2 (en) | 2005-01-25 | 2014-04-29 | Panasonic Corporation | Audio conversation apparatus |
JP2006279492A (ja) * | 2005-03-29 | 2006-10-12 | Tsuken Denki Kogyo Kk | 電話会議システム |
JP2009033298A (ja) * | 2007-07-25 | 2009-02-12 | Nec Corp | 通信システム及び通信端末 |
JP2009261010A (ja) * | 2009-08-04 | 2009-11-05 | Panasonic Corp | 音声対話装置 |
JP4700126B2 (ja) * | 2009-08-04 | 2011-06-15 | パナソニック株式会社 | 音声対話装置 |
JP2016048534A (ja) * | 2013-12-25 | 2016-04-07 | キヤノンマーケティングジャパン株式会社 | 情報処理システム、その制御方法、及びプログラム、並びに情報処理装置、その制御方法、及びプログラム |
JP2021524612A (ja) * | 2018-07-09 | 2021-09-13 | コーニンクレッカ フィリップス エヌ ヴェKoninklijke Philips N.V. | オーディオ装置、オーディオ配信システム及びその動作方法 |
JP7354225B2 (ja) | 2018-07-09 | 2023-10-02 | コーニンクレッカ フィリップス エヌ ヴェ | オーディオ装置、オーディオ配信システム及びその動作方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4255461B2 (ja) | 電話会議用のステレオ・マイクロフォン処理 | |
EP2158752B1 (en) | Methods and arrangements for group sound telecommunication | |
CN103220491B (zh) | 用于操作会议系统的方法以及用于会议系统的装置 | |
EP1902597B1 (en) | A spatial audio processing method, a program product, an electronic device and a system | |
US20080273683A1 (en) | Device method and system for teleconferencing | |
Rämö et al. | Digital augmented reality audio headset | |
US20080004866A1 (en) | Artificial Bandwidth Expansion Method For A Multichannel Signal | |
US20070109977A1 (en) | Method and apparatus for improving listener differentiation of talkers during a conference call | |
US8515091B2 (en) | Forwarding an audio signal in an immersive audio conference system | |
TWM626327U (zh) | 用於在分別對應於複數個使用者的複數個通訊裝置之間分配音訊信號之系統 | |
CN110891216A (zh) | 一种耳机装置 | |
JP2006279492A (ja) | 電話会議システム | |
JP2004274147A (ja) | 音場定位型多地点通話システム | |
CN110856068B (zh) | 一种耳机装置的通话方法 | |
US20120150542A1 (en) | Telephone or other device with speaker-based or location-based sound field processing | |
Rothbucher et al. | Integrating a HRTF-based sound synthesis system into Mumble | |
JP2023155921A (ja) | 情報処理装置、情報処理端末、情報処理方法、およびプログラム | |
JP5022468B2 (ja) | 場内拡声装置 | |
JP2019066601A (ja) | 音響処理装置、プログラム及び方法 | |
US20100272249A1 (en) | Spatial Presentation of Audio at a Telecommunications Terminal | |
Shabtai et al. | Spherical array processing with binaural sound reproduction for improved speech intelligibility | |
CN218788831U (zh) | 耳机与基于耳机的组网通信系统 | |
AU2019204126B2 (en) | Communication device with spatial source separation, communication system, and related method | |
JP2662824B2 (ja) | 会議通話端末装置 | |
Lokki et al. | Problem of far-end user’s voice in binaural telephony |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060301 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20080205 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080401 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080602 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20080701 |