JP4552876B2 - 音声信号送受信装置及び音声会議装置 - Google Patents

音声信号送受信装置及び音声会議装置 Download PDF

Info

Publication number
JP4552876B2
JP4552876B2 JP2006069640A JP2006069640A JP4552876B2 JP 4552876 B2 JP4552876 B2 JP 4552876B2 JP 2006069640 A JP2006069640 A JP 2006069640A JP 2006069640 A JP2006069640 A JP 2006069640A JP 4552876 B2 JP4552876 B2 JP 4552876B2
Authority
JP
Japan
Prior art keywords
sound
unit
signal
speaker
audio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2006069640A
Other languages
English (en)
Other versions
JP2007251406A (ja
Inventor
章生 山根
利晃 石橋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yamaha Corp
Original Assignee
Yamaha Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yamaha Corp filed Critical Yamaha Corp
Priority to JP2006069640A priority Critical patent/JP4552876B2/ja
Publication of JP2007251406A publication Critical patent/JP2007251406A/ja
Application granted granted Critical
Publication of JP4552876B2 publication Critical patent/JP4552876B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
  • Telephone Function (AREA)

Description

この発明は、複数の相手方の音声信号送受信装置から受信した音声信号をマルチチャンネルで放音部に入力するとともに、収音部から入力したユーザの音声信号を相手方の音声信号送受信装置に送信する音声信号送受信装置及び音声会議装置に関し、特に収音部から入力した音声信号に対するエコーキャンセルの処理に関する。
近年、音声会議システム等において、例えば3箇所以上の場所に配置された音声信号送受信装置(例えば音声会議装置)を用いて、3箇所以上の場所に居るユーザの間でも同時に音声会議を行うシステムが提案されている。このシステムでは、各音声信号送受信装置は通信機能、収音機能及び放音機能を備える。そして、各音声信号送受信装置は相互に通信を行い、この通信によってマルチチャンネルで受信した音声を放音部で放音するとともに収音部で収音した音声を相手方の音声信号送受信装置に送信する。これによって、各ユーザは、会議の相手方に対して自己の音声を聴取させることができるとともに、マルチチャンネルで放音された複数の相手方の音声を聴取することができるため、3箇所以上の場所に居るユーザの間でも同時に音声会議を行うことができる。
上述したような遠隔会議用の音声信号送受信装置では、通常の電話等のようにユーザが受話器を手で持つタイプではなく、ハンズフリータイプであることが多い。この様なハンズフリータイプでは、通常は放音部が無指向性のラウドスピーカで構成され、収音部も無指向性のマイクロフォンで構成される。そして、放音部及び収音部が近接して配置されることが多い。このため、放音部から放音された音声が収音部に回り込み易く、回り込み音声が再伝搬されてエコーが生じ易い。このため、音声信号送受信装置はエコー成分を除去する機能を備える。
ここで、従来の音声信号送受信装置では、マルチチャンネルで音声信号を受信するため、放音部は各チャンネルに対応する個数の無指向性スピーカを備え、各チャンネルの音声信号が対応するスピーカに入力される。このため、エコーキャンセル処理では、各チャンネルの音声信号と収音部から入力した音声信号との相関性を検出して、この相関性を基にエコーキャンセルを行う。
例えば、特許文献1では、音声信号送受信装置は、各スピーカに入力するマルチチャンネルの音声信号と収音部から入力される音声信号との各相関によって、各スピーカからの音声が収音部に入力されるまでの各遅延時間を検出する。そして、音声信号送受信装置は、各遅延時間を用いて各スピーカからのエコー成分と収音部からの音声信号との間の相関性をみて、これによって各エコー成分を効果的に除去するための各エコー抑圧ゲインを算出して、収音部からの音声信号を周波数領域信号に変換したものに乗算する。この後、音声信号送受信装置は周波数領域信号を時間軸信号に変換して相手方の音声信号送受信装置に送信する。
また、特許文献2では、音声信号送受信装置は、各スピーカに入力するマルチチャンネルの音声信号と収音部から入力される音声信号とを周波数帯域毎の信号に分割する。そして、音声信号送受信装置は、各帯域毎に各スピーカに入力するマルチチャンネルの音声信号と収音部から入力される音声信号との相関を求め、これを基に各エコー成分を模擬した各擬似エコー信号を生成する。音声信号送受信装置はこの各擬似エコー信号を収音部から入力される音声信号から除去する。
特開2002−237769号公報 特開平10−93680号公報
上述した従来の音声信号送受信装置では、各スピーカは無指向性のラウドスピーカであるため、ラウドスピーカの近くに収音部が配されていると、出力されて直ぐの音声が収音部に回り込む。出力されて直ぐの音声はあまり減衰されていないため、これらの音声成分が加算されて収音部に入力されると、各スピーカからの音声が渾然となった状態で(相互相関性の高い状態で)収音部に入力され易い。例えば、チャンネル1で会話の音声信号が送信され、チャンネル2では会話の音声信号は送信されず環境音等のレベルの小さい音声信号のみが送信された場合に、チャンネル1の音声とチャンネル2の音声とがあまり減衰されていない状態で加算されると、チャンネル2の音声成分を判別することが困難になる。
また、各スピーカに入力する音声信号は異なった相手方の音声信号送受信装置から受信した音声であり、異なった音声信号である。このため、各スピーカから出力された音声が加算されて収音部に入力されると、各スピーカからの音声が相互相関性の高い状態で収音部に入力されることがある。このため、上記各遅延時間や各エコー抑圧ゲインの算出のときに、対応するスピーカに入力する信号と収音部からの入力信号との相関のみを検出するだけでは、精度良くこの相関を検出することが困難である。
上述の問題を解決するために、従来の音声信号送受信装置では、他のスピーカからのエコー成分を考慮して(他のスピーカに入力する音声信号を考慮して)、対応するスピーカに入力する信号と収音部からの入力信号との相関を検出しなくてはならなかった。
このため、チャンネル数が増加するほど、各擬似エコー信号の生成や各エコー抑圧ゲインの算出のときに考慮すべきエコー成分の種類が増える。このことから、チャンネル数が増加するほど、エコーキャンセルのための処理が複雑化してしまい、処理時間が長時間化してしまう。そして、処理時間が長時間化してしまうと、音声相互通信に必須であるリアルタイム性が損なわれる。
そこで、本発明は、上記課題を解決するために、マルチチャンネルで受信した各音声信号をスピーカから音声を出力する音声信号送受信装置及び音声会議装置において、簡易なエコーキャンセル処理で精度良くエコーキャンセルをするものを提供することを目的としている。
上記課題を解決するために本発明では以下の手段を採用している。
(1)本発明は、複数のスピーカユニットが配列されてなるスピーカアレイを接続し、複数の相手方から受信した受信音声信号の音声がそれぞれ別にビーム化するように、該各受信音声信号に遅延時間を付与して前記スピーカアレイに入力する放音部と、収音した音声の送信音声信号を生成する収音部と、前記送信音声信号に対して、各スピーカユニットから前記収音部への音声の回りこみによるエコーをキャンセルする処理を施す複数の適応型エコーキャンセラと、を備え、前記複数の適応型エコーキャンセラは、それぞれ各スピーカユニットに供給する音声信号に基づいて擬似エコー信号を生成する適応フィルタを備え、当該適応フィルタは、生成した擬似エコー信号を前記送信音声信号から減算した各系統の残差信号と前記各スピーカユニットに供給する音声信号とに基づいて、フィルタ係数を更新する音声信号送受信装置である。
上記本発明の構成によれば、放音部によって、複数の相手方から受信したマルチチャネルの音声信号の音声がそれぞれ別にビーム化するように、前記各受信音声信号に遅延時間が付与されてスピーカアレイ、すなわち各スピーカユニットに入力される。これによって、スピーカアレイからの音声ビームが音場における特定の領域に指向するように制御され、スピーカアレイからは特定の領域に指向するように音声ビームが出力される。
収音部では、ユーザの音声とともに各スピーカユニットからの音声が入力される。ここで、上述したように、各スピーカユニットからの音声ビームは指向性を持ったものであり、特定の領域に指向する。このため、スピーカアレイから放音されて直ぐの音声の収音部への回り込みを少なくすることが可能となる。
スピーカアレイから放音されて直ぐの音声信号はレベルが大きいため、各スピーカユニットからの音声成分が渾然した状態となり易く、何れのスピーカに由来する成分であるかを判別することが困難となる。このため、スピーカアレイから放音されて直ぐの音声の回り込みを防ぎ、特定の領域からの音声に特化して収音することで、収音部に入力される各スピーカユニットからの音声成分の相互相関性を低めることが可能となる。
また、各スピーカユニットに入力される各信号は同一の信号で異なった遅延時間が付与されたものである。このため、各スピーカユニットからの音声成分が加算されても渾然とした状態になりにくく、これによっても、各音声成分の相関性を低めることができる。
収音部によって、入力した音声の送信音声信号が生成される。適応型エコーキャンセラは、各スピーカユニットに対応するように複数段配され、各適応型エコーキャンセラによって、送信音声信号に対して対応するスピーカユニットから前記収音部への回り込みによるエコーをキャンセルする処理が行われる。
ここで、上述したように各スピーカユニットから収音部に入力された各音声成分は相互相関性が低い。このため、各スピーカユニットに入力する音声信号と収音部から入力された音声信号との相関を検出するときに、他のスピーカユニットからのエコー成分を考慮しなくても精度良く相関を検出することが可能となる。
これによって、各適応型エコーキャンセラは、他のスピーカユニットに入力する音声信号を考慮しなくても、比較的精度良くエコーキャンセルを行うことができる。すなわち、各適応型エコーキャンセラは、対応するスピーカユニットに入力する音声信号及び収音部から入力した音声信号を処理するだけの簡易な構成でも、比較的精度良くエコーキャンセルを行うことが可能となる。
また、スピーカアレイを用いてマルチチャンネルの音声を出力するため、チャンネル数だけスピーカユニットを配設しなくても、異なった位置に音声を定位させることが可能となる。このため、適応型エコーキャンセラはスピーカユニットの個数だけあればよく、チャンネル数の如何に関わらず同じエコーキャンセル処理によって効果的にエコーキャンセルを行うことが可能となる。
(2)本発明では、上記音声信号送受信装置において、前記収音部は、複数配列されたマイクロフォンからなるマイクアレイを接続し、前記各マイクロフォンから入力した各信号に対して所定の遅延時間で位相制御を行って、この位相制御した各信号を加算合成して前記送信信号を生成する。
この構成によれば、複数のマイクロフォンからの信号が特定の領域から各マイクロフォンに入力されるまでの遅延時間で位相制御されることによって、効果的に特定の領域からの音声に特化して収音することが可能となる。これによって、更に、スピーカアレイから放音されて直ぐの音声の収音部への回り込みを少なくすることが可能となり、より精度良く擬似エコー成分を生成することが可能となる。
そして、このような構成の音声信号送受信装置を音声会議装置に適用することで、音声会議装置において、チャンネル数の如何に関わらず同じエコーキャンセル処理によって効果的にエコーキャンセルを行うことが可能となる。このため、多地点間で音声会議を行う場合でも簡易な処理で精度良くエコーキャンセルを行うことが可能となる。
本発明によれば、各スピーカユニットから収音部に入力された音声成分の相互相関性を低めることができる。このため、スピーカユニットに対応して複数段配置された、各適応型エコーキャンセラによってエコーキャンセル処理を行うときに、他のスピーカユニットからのエコー成分を考慮しなくても精度良く擬似エコー信号を生成することができる。
また、チャンネル数に関わらず、エコーキャンセル処理は同一の処理でよいため、チャンネル数の増加に関わらず比較的簡易な処理で精度良くエコーキャンセルを行うことができる。
(第1の実施形態)
以下に、図1を参照して本発明の第1の実施形態を説明する。
図1は、第1の実施形態にかかる音声信号送受信装置100の基本的な構成を示すブロック図である。音声信号送受信装置100は、複数の相手方の音声信号送受信装置100(以下、「相手方装置100A」と記載する)との間で相互通信を行うことで音声信号を送受信する機能を備え、複数の相手方装置100Aのそれぞれから音声信号を受信して別々のチャンネルの音声として放音するとともに、ユーザの音声信号を送信する。
音声信号送受信装置100は、上記機能を実現するため、スピーカアレイ1、マイクアレイ2、通信部3、信号処理部4、信号処理部5及びエコーキャンセル部6を備える。
スピーカアレイ1は、複数のスピーカユニットSP(SP1〜SPn)がライン状に配列されてなる。マイクアレイ2は、複数のマイクM(M1〜Mn)がライン状に配列されてなる。通信部3は、入力部10に接続された広域ネットワーク等の通信網を介して複数の相手方の音声信号送受信装置100との間で通信を行うための通信インタフェース回路である。通信部3に入力された複数の相手方の音声信号送受信装置100Aからの音声信号は信号処理部4に入力される。ここでは、音声信号X1〜X3までの3台の相手方装置100Aから音声信号が入力される。
信号処理部4は、本願発明の放音部として機能し、音声信号X1〜X3を各スピーカユニットSPに対応させて分岐し、分岐した各信号に対して音場における特定の位置に指向するような遅延時間を付与した後に同じスピーカユニットSPに対応する信号同士を加算合成して音声信号S1(t)〜Sn(t)を生成する。信号処理部4は、音声信号S1(t)〜Sn(t)をそれぞれ対応するスピーカユニットSPに対して出力する。音声信号S1(t)〜Sn(t)は、図略のD/Aコンバータによってアナログ音声信号に変換された後に各スピーカユニットSPに入力される。
これによって、各スピーカユニットSPからは特定の領域に指向する音声ビームが出力される。マイクアレイ2では、ユーザの音声とともに各スピーカユニットSPからの音声成分が収音される。各マイクMに入力された音声は音声信号として信号処理部5に入力される。
信号処理部5は、本願発明の収音部として機能し、各マイクMから入力された各信号を所定の遅延時間で位相制御を行った後、加算合成する。この遅延時間として、所望の収音領域からの音声が各マイクMに到達するまでの時間の差分が設定される。この差分とは、所望の収音領域に最も近いマイクMに音声が到達する時間を基準時間として、この基準時間からの遅れ時間である。これにより、位相制御後の各信号は、特定の領域からの音声信号のみが位相が合致し、その他の領域からの音声信号は位相が逆となる。これによって、加算合成後の音声信号Min(t)は、特定の領域からの音声成分のみが残ることになり、特定の領域からの音声に特化して収音することができる。信号処理部5は、加算合成後の音声信号Min(t)をエコーキャンセル部6に出力する。
エコーキャンセル部6は、本願発明の適応型エコーキャンセラに対応する擬似エコー信号生成部7を各スピーカユニットSPに対応する複数段備える。各擬似エコー信号生成部7を区別する場合には、対応するスピーカユニットSP1〜nと同じ数字を添え字として付す。各擬似エコー信号生成部7−1〜7−nは、適応フィルタ8及び加算部8Aを備える。複数の適応フィルタ8や加算部8Aをそれぞれ区別する場合には、擬似エコー信号生成部7−1〜7−nと同様の添え字を付す。各適応フィルタ8−1〜8−nには、対応する各スピーカユニットSP1〜SPnに入力される音声信号S1(t)〜Sn(t)が分岐されて入力される。
各適応フィルタ8−1〜8−nには、対応するスピーカユニットSP1〜SPnからマイクアレイ2までの伝達関数を模擬したフィルタ係数が設定されている。これによって、適応フィルタ8−1〜8−nを通過した音声信号S1(t)〜Sn(t)は、各適応フィルタ8−1〜8−nに対応するスピーカユニットSP1〜SPnからのエコー信号を模擬した擬似エコー信号となる。
また、適応フィルタ8は、フィルタ係数を算出して自己設定する機能を備える。このため、加算部8A−1〜8A−nには、音声信号Min(t)が入力されるとともに、適応フィルタ8−1〜8−nから出力された擬似エコー信号が入力される。そして、加算部8A−1〜8A−nは音声信号Min(t)から擬似エコー信号を減算し、減算した残差信号を適応フィルタ8−1〜8−nに入力する。適応フィルタ8−1〜8−nは、入力した残差信号と入力した音声信号S1(t)〜Sn(t)を用いて、適応型アルゴリズム(例えば学習同定法)を用いてフィルタ係数を算出し、算出したフィルタ係数を自己設定する。
エコーキャンセル部6は擬似エコー信号生成部7−1〜7−nに対応する個数の加算部9(9〜9)を備える。加算部9には、適応フィルタ8−1及び適応フィルタ8−2から擬似エコー信号が入力される。また、加算部9〜9n−1は、一つ大きい数字の添え字が付された適応フィルタ8−3〜8−nからそれぞれ擬似エコー信号が入力される。加算部9は入力した各擬似エコー信号を加算して下段の加算部9に出力する。
加算部9〜9n−1は、上段の加算部9〜9n−2から加算後の擬似エコー信号を入力し、適応フィルタ8(適応フィルタ8−3〜8−n)から入力した擬似エコー信号と合成して下段の加算部9〜9に出力する。これによって、加算部9には、適応フィルタ8−1〜8−nからの全ての擬似エコー信号を加算した信号Y(t)が上段の加算部9n−1から入力される。これとともに、加算部9には、信号処理部5から音声信号Min(t)が入力される。
加算部9は、音声信号Min(t)から信号Y(t)を減算して、音声信号Mout(t)として通信部3に出力する。これによって、マイクアレイ2から入力した音声信号から各スピーカユニットSP1〜SPnに起因するエコー成分を除去することができる。音声信号Mout(t)は、通信部3によって相手方の音声信号送受信装置100に送信される。
上述したようにマイクアレイ2は指向性を持ち、特定の領域からの音声に特化して収音する。このため、スピーカアレイ1から放音されて直ぐの音声のマイクアレイ2への回り込みを少なく収音することが可能となる。また、マイクアレイ2によって特定の領域からの音声に特化して収音するため、マイクアレイ2に入力される各スピーカユニットからの音声成分を相互相関性の低い状態で入力することができる。
また、上述したように各スピーカユニットSPに入力される各信号は同一の信号で異なった遅延時間が付与されたものである。このため、各スピーカユニットからの音声成分が加算されても渾然とした状態になりにくく、これによっても、各音声成分の相互相関性を低めることができる。
上述のように、各スピーカからの音声成分の相関性の低い状態でマイクアレイ2に入力されるため、各擬似エコー信号の生成のときに他のスピーカユニットSPからのエコー成分を考慮しなくても、精度良く擬似エコー信号を生成することができる。これによって、擬似エコー信号生成部7をスピーカユニットSP1〜SPnに対応する複数段配置するだけの簡易な処理で比較的精度良く擬似エコー信号を生成することができる。
また、各チャンネルの音声信号は互いに加算合成されて、遅延時間が付与されて各スピーカユニットSP1〜SPnに入力され、この遅延時間によって異なった位置で音像定位するように制御される。このため、チャンネル数に関わらず、エコーキャンセル処理は同一の処理でよいため、チャンネル数の増加に関わらず比較的簡易な処理で精度良く擬似エコー信号を生成することができる。
(第2の実施形態)
第2の実施形態では、上述したような音声信号送受信装置100が音声会議装置100´に適用され、複数台(3台以上)の音声会議装置100´で音声会議システム200が構成されている。以下に、図2〜図4を用いて本発明の第2の実施形態にかかる音声会議システム200を説明する。
図2は、音声会議システム200を概略的に示す図である。音声会議システム200は、複数の会議地点に居る複数の会議出席者h(h1〜h4)の間で音声会議を行うためのシステムである。音声会議システム200は、各会議地点に配置された複数の音声会議装置100´がネットワークNに接続されたシステムである。このネットワークNは、例えば、インターネットやLAN等の広域ネットワーク等である。
各音声会議装置100´は、ネットワークNに接続された他(相手方)の音声会議装置100´(相手方装置100A´)と通信する機能を備え、この通信によって会議用音声信号を相互に送受信する。この通信のために用いられる通信プロトコルは、特に限定されないが例えば、TCP(Transmission Control Protocol)/IP(Internet Protocol)等が用いられる。
図3は、図2で示す音声会議装置100´を上方から見た外観及び音声会議用音声の伝搬及び収音範囲を示す図である。本図では、音声会議装置100´は、会議机上に配置されることで、着座した会議出席者hの頭部近傍の高さ位置で配置されている。なお、同図において、説明の便宜のために、会議机の後方側をY、前方側を−Y、右側をX、左側を−Xと記載する。
音声会議装置100´は、長尺の略直方体状である筐体1aの−Y方向上段にスピーカアレイ1´を備える。なお、スピーカアレイ1´は筐体1aに内蔵されているため、本来外観視できないが、同図では、説明の便宜のため透視的に記載している。また、同様に説明の便宜のため、本来−Y方向に位置するスピーカアレイ1´を筐体1aのY方向に記載している。
スピーカアレイ1´は、長尺方向に亘ってライン状に配列された複数のスピーカユニットSP(SP1〜SPn)から成る。各スピーカユニットSPは前方に放音面が位置する様に配置され、各スピーカユニットSPに音声信号が入力されると、スピーカアレイ1´から音声ビームが−Y方向に向かうように出力される。このスピーカアレイ1´からの音声ビームは、相手方装置100A´から受信した相手方通話者の音声を内容とする。
各スピーカユニットSPに与える音声信号に付加する遅延時間によって、スピーカアレイ1´からの音声ビームの指向性を制御し、音声ビームを仮想点音源Pに焦点させることができるとともに、この仮想点音源Pの位置を任意の位置に変えることができる。これによって、会議出席者hに仮想点音源Pから会議用音声が聴こえるように認識させることができる。
本実施形態では、同図に示すように複数の相手方の音声会議装置100´からマルチチャンネルで受信した音声を、異なった位置(P1〜P3)に音像定位させるように、各チャンネルのオーディオ信号に遅延時間が付与されて各スピーカユニットSPに出力される。これによって、会議出席者hは、各チャンネルの音声が何れの相手方の音声会議装置100´から送信された音声であるかを容易に識別することができる。
また、筐体1aの−Y方向の下段、すなわちスピーカアレイ1´の下段にはマイクアレイ2´が配設されている。なお、マイクアレイ2´は筐体1aに内蔵されているため、本来外観視できないが、同図では、説明の便宜のため透視的に記載している。また、正確にはマイクアレイ2´の上側にスピーカアレイ1´が重なって位置するが、同図では説明の便宜のため、スピーカアレイ1´とマイクアレイ2´とがY−Y方向で並列するように図示する。
マイクアレイ2´は、長尺方向に亘ってライン状に配列された複数のマイクM(M1〜Mn)から成る。各マイクMは収音側が前方に向くように配置されている。マイクアレイ2´は、会議出席者hの位置P10への指向性を持たせた収音ビームによって探査位置の音声に特化して音声を収音することができる。すなわち、音声会議装置100´は、第1の実施形態で上述した位相制御を各マイクMで収音した音声信号に対して行うとともに、各マイクMで収音した音声信号同士を位相調整後に重ね合わせて合成する。これによって、マイクアレイ2によって位置P10からの音声に特化して音声を収音することができる。
この収音した音声は、エコーキャンセル処理が施された後に、複数の相手方装置100A´に送信される。このエコーキャンセル処理は、第1の実施形態で記載したエコーキャンセル処理と同様である。
すなわち、本音声会議装置100´でも、マルチチャンネルの音声信号をスピーカアレイ1´に入力してスピーカアレイ1´から音声に指向性を持たせて出力する。これとともに、マイクアレイ2´によって音声ビームが指向する特定の領域(位置P10)からの音声に指向して収音する。このため、第1の実施形態と同様に、スピーカアレイ1´から出力されて直ぐの音声のマイクアレイ2´への回り込みが少なく、マイクアレイ2´には位置P10からの音声が特化して入力される。これによって、各スピーカユニットSPからの各音声成分は相互相関性の低い状態でマイクアレイ2´に入力される。
また、各スピーカユニットSPに入力される信号は、同一の信号に異なった遅延時間が付与されてものであるため、これによっても、各スピーカユニットSPからの音声成分の相互相関性も低められる。
上記から、第2の実施形態でも、第1の実施形態と同様の簡易なエコーキャンセル処理を用いても精度良くエコーキャンセルを行うことができる。
図4は、図2で示す音声会議装置100´の構成を示すブロック図である。音声会議装置100´は、第1の実施形態と同じエコーキャンセル部6を備えるとともに、相手方装置100A´からの音声を放音するために、スピーカアレイ1´の他に、入出力インタフェース11、信号振分部12、遅延部13、加算部14、D/Aコンバータ15、アンプ16及びコントロール部17を備える。
入出力インタフェース11は、接続端子18に接続された通信ケーブル(図略)等を介してネットワークNに接続され、このネットワークNに接続された相手方装置100A´との間でデジタル音声信号の送受信を行う。入出力インタフェース11は、受信した音声信号をエコーキャンセル部6を介して信号振分部12に入力する。
信号振分部12は、例えばDSP(Digital Signal Processor) 等で実現され、入力した受信音声信号に含まれる送信元IDを参照して、この送信元IDに対応する遅延部13のチャンネルに受信音声信号を入力させる処理を実行する。なお、この送信元IDは例えばIPアドレス等であり、複数台の音声会議装置100´の相互間の通信の際に通信データに含めて送信される。また、信号振分部12には、送信元IDとこの送信元IDに対応する遅延部13のチャンネルとが対応付けて設定されている。信号振分部12はこの設定に基づいて、受信した音声信号を遅延部の各チャンネルに振り分けて入力する。
遅延部13は、本願発明の放音部として機能し、複数チャンネル(n個のチャンネル)設けられている。このn個のチャンネルを区別する場合には、チャンネル番号を添え字として付して遅延部131〜13nと記載する。この複数チャンネルの遅延部131〜13nは、スピーカユニットSP1〜SPnの個数分だけ(8個)設けられている。以下、それぞれの遅延部13を区別する場合には、スピーカユニットSP1〜SPnのうち対応するものと同様の数字を添え字として付す。例えば、スピーカユニットSP1に対応する遅延部13は、遅延部13−1と記載する。また、1チャンネルのスピーカユニットSP1に対応する遅延部13は、遅延部131−1と記載する。各遅延部13−1〜13−8に仮想点音源Pからの音声が各スピーカユニットSPに至るまでの遅延時間(例えば図3で示すような遅延時間)を設定することで、仮想点音源Pに音像定位させることができる。
そして、各チャンネルの遅延部131〜13nは、仮想点音源P1〜P3に対応している。すなわち、各チャンネルには、それぞれ異なった仮想点音源Pで音声ビームを焦点させるような遅延時間が設定されており、入力した信号に設定された遅延時間を付与する。また、各チャンネルはそれぞれ異なった送信元に対応付けられており、信号振分部12から上述したように対応する送信元の受信音声信号が入力される。これによって、異なった送信元からの受信音声信号には、異なった仮想点音源Pに音像定位するような遅延時間が付与されることになる。このため、異なった相手方装置100A´から受信した音声を異なった仮想点音源Pに焦点させることができる。
各チャンネルの遅延部13−1〜13−nは、それぞれ対応する加算部14に遅延時間を付与した音声信号を入力する。加算部14は、本願発明の放音部として機能し、遅延部13−1〜13−nの個数だけ設けられている。なお、これらの加算部14を識別する場合には、対応する遅延部13−1〜13−nと同じ添え字を付す。これらの加算部14−1〜14−nは、それぞれ対応する遅延部13から遅延時間の付与された受信音声信号が入力される。各加算部14は、入力された各チャンネルからの音声信号を合成して対応するD/Aコンバータ15に出力する。
D/Aコンバータ15は、本願発明の放音部として機能し、加算部14−1〜14−nの個数だけ設けられている。なお、これらのD/Aコンバータ15を識別する場合には、対応する加算部14−1〜14−nと同じ添え字を付す。各D/Aコンバータ15−1〜15−nは、それぞれ対応する加算部14から遅延時間の付与された受信音声信号が入力される。D/Aコンバータ15−1〜15−8は入力されたデジタルの受信音声信号をアナログに変換して対応するアンプ16に出力する。
アンプ16は、本願発明の放音部として機能し、入力した音声信号の信号レベルを増幅する。アンプ16は、スピーカユニットSP1〜SPnに対応する個数だけ設けられている。以下、それぞれのアンプ16を区別する場合には、スピーカユニットSP1〜SPnのうち対応するものと同様の数字を添え字として付す。
アンプ16−1〜アンプ16−nは、加算部14−1〜14−nからD/Aコンバータ15(15−1〜15−n)を介して受信音声信号が入力される。アンプ16−1〜アンプ16−nは、入力された受信音声信号の信号レベルを増幅して対応するスピーカユニットSP1〜SPnに出力する。これによって、スピーカユニットSP1〜SPnから受信音声信号の音声が放音され、音声会議装置100´からの相手方の話声が放音される。
コントロール部17は、例えばCPU(Central Processing Unit)やメモリ等の記憶部やユーザの操作を受け付ける操作部等を備える。メモリで記憶するプログラムを実行することで、コントロール部17は例えば相手方装置100A´との間の通話等、音声会議装置100´の各部の動作を制御する。
また、コントロール部17は、音声会議の事前設定を遅延部13の各チャンネルや信号振分部12に行うための処理を実行する。具体的には、コントロール部17は、操作部を用いてユーザに選択された相手方装置100A´の送信元IDと遅延部13のチャンネルと対応付け、この対応付けを信号振分部12に設定する。この設定によって、上述したように信号振分部12では、入力した受信音声信号の送信元IDが参照されて、この送信元IDに対応するチャンネルに音声信号が入力される。また、コントロール部17は、仮想点音源P1〜P3の位置で音声ビームを焦点させるような遅延時間を相手方装置100A´毎に算出して、遅延部13の対応するチャンネルに設定する。
この設定によって、遅延部13の対応するチャンネルに入力された受信音声信号は、各チャンネルに対応する遅延時間が付与されることになり、互いに異なった仮想点音源P1〜P3で音像が定位することになる。
また、音声会議装置100´は、相手方装置100A´に会議出席者hの音声信号を出力するための構成として、マイクアレイ2´及び上記構成に加えて、マイクアンプ21、A/D変換部22、収音ビーム形成部23、及び、バンドパスフィルタ24を備える。
マイクアンプ21は、本願発明の収音部として機能し、マイクアレイ2の各マイクMで収音した音声の各信号がマイクアレイ2から入力され、この各入力信号を増幅する。A/D変換部22は、本願発明の収音部として機能し、マイクアンプ21から入力された増幅後の各アナログ信号をデジタル信号に変換する。A/D変換部22は変換後の各デジタル信号を収音ビーム形成部23に出力する。
収音ビーム形成部23は、本願発明の収音部として機能し、位相補正部231及び加算部232を備える。位相補正部231は、A/D変換部22から入力された各デジタル信号の位相調整を行い、加算部232は位相補正後の各デジタル信号を加算合成する。この位相調整は、上述したように、探査位置からの音声が各マイクMに至るまでの遅延時間D11〜D18を用いて行われる。これによって、入力信号のうち探査位置からの音声成分の位相を合致させ、その他の成分の位相を不一致にさせることができる。
このため、加算合成後の音声信号Min(t)は、探査位置からの音声成分のレベルが強められ、その他の成分のレベルは弱められることになる。これによって、探査位置からの音声に特化して音声を収音することができる収音ビームが形成される。この探査位置は、上述したように、会議出席者hの位置とされる。加算部232は加算合成後の音声信号をバンドパスフィルタ24に出力する。
なお、位相補正部231は、例えば、シフトレジスタ等の遅延時間バッファメモリ(図略)等で実現される。遅延時間バッファメモリは、A/D変換部22から入力された各デジタル信号を格段に記憶するとともに、この記憶された値が位相補正の分だけ遅延させて読み出されて加算部232に出力する。これによって、所定の遅延時間で位相補正を行うことができるようになっている。
また、この位相補正はコントロール部17によって制御される。すなわち、コントロール部17は会議出席者hの位置P10を焦点位置とする収音ビームを形成するように位相補正を制御する。
バンドパスフィルタ24は、入力した音声信号に対して、人の音声の周波数帯域の他の周波数帯域をカットするためのフィルタ係数を畳み込み演算してエコーキャンセル部6に出力する。これによって、人の音声の周波数帯域の成分のみが抽出されて、音声信号Min(t)としてエコーキャンセル部6に出力される。
エコーキャンセル部6は、第1の実施形態と同様の構成である。図1を参照して、エコーキャンセル部6は、擬似エコー信号生成部7−1〜7−nを備え、各擬似エコー信号生成部7−1〜7−nは適応フィルタ8(8−1〜8−n)を備える。適応フィルタ8−1〜8−nには、それぞれ対応するスピーカユニットSP1〜SPnに出力する音声信号S1(t)〜Sn(t)が入力される。
第2の実施形態では、加算部14−1〜14−nから対応するD/Aコンバータに入力される音声信号S1(t)〜Sn(t)が適応フィルタ8−1〜8−nに入力される。適応フィルタ8−1〜8−nは、第1の実施形態と同様に音声信号S1(t)〜Sn(t)を設定されているフィルタ係数で畳み込み演算を行って、擬似エコー信号を生成して対応する加算部8A−1〜8A−nに入力するとともに、対応する加算部9〜9n−1に出力する。
加算部9〜9n−1によって各エコー擬似信号が加算されて、加算部9nに入力される。これとともに、加算部9には、音声信号Min(t)がバンドパスフィルタ24から入力される。加算部9は、入力された音声信号Min(t)から各エコー擬似信号が加算された合成擬似エコー信号を減算して、音声信号Mout(t)を入出力インタフェース11に出力する。これによって、音声信号Mout(t)から各スピーカユニットSPからのエコー成分を除くことができる。
また、適応フィルタ8−1〜8−nは、対応するスピーカユニットSP1〜SPnからマイクアレイ2´までの伝達関数を模擬したフィルタ係数を第1の実施形態と同様にして算出し、自己設定する。すなわち、加算部8A−1〜8A−nには、音声信号Min(t)がバンドパスフィルタ24から入力されるとともに、対応する適応フィルタ8−1〜8−nから模擬信号がそれぞれ入力される。加算部8A−1〜8A−nは、入力された音声信号Min(t)から模擬信号を減算し、この残差信号を適応フィルタ8−1〜8−nに出力する。適応フィルタ8−1〜8−nは、入力された残差信号と音声信号S1(t)〜Sn(t)とを用いて適応アルゴリズムによってフィルタ係数を算出し、算出したフィルタ係数を自己設定する。
上述したように、第2の実施形態でも、第1の実施形態と同様の作用効果、すなわちチャンネル数の増加に関わらず比較的簡易な処理で精度良く擬似エコー信号を生成することができるという作用効果を奏する。音声会議装置100´は、会議出席者hの間で音声会議を行うためのものであるため、参加可能な会議出席者数が多い方が好ましく、多地点との間で音声会議を行うことができることが好ましい。
ここで、従来技術のようにチャンネル数の増加にともなってエコーキャンセル処理が複雑になると、これによって音声会議のリアルタイム性を維持することが困難になり、このことでチャンネル数に制限がおきてしまう。
このため、第2の実施形態では、音声信号送受信装置100を音声会議装置100´に適用したことで、上記チャンネル数の増加に関わらず比較的簡易な処理で精度良く擬似エコー信号を生成することができる。この様にチャンネル数が増加してもリアルタイム性を維持することができるとともに、スピーカアレイ1´を用いて各チャンネルの音声を容易に異なった仮想点音源に定位させることができるため、本音声会議装置100´では多チャンネル化を図ることができ、音声会議に参加できる会議出席者hの人数を拡大することができる。
本実施形態は、以下の変形例を採用することができる。
(1)本実施形態では、スピーカユニットSPをライン状に配列したスピーカアレイ1、1´を用いているが、本発明はこのスピーカアレイ1、1´の構成に限定されない。例えば、マトリクス状や、ハニカム状、円状に配列されたスピーカユニットSPを備えたスピーカアレイを用いてもよい。
(2)また、本実施形態では、マイクアレイ2、2´を用いているが、本発明はマイクアレイ2、2´に代えて、他の指向性を持つマイクロフォンを用いてもよい。
(3)本実施形態では、本発明のスピーカ装置を音声会議装置に適用した場合について説明したが、これに限定されない。本発明は、複数の相手方の音声信号送受信装置と通信する機能を備え、通信によって受信した音声を放音するとともに、収音したユーザの音声を通信によって相手方の音声信号送受信装置に送信する機能を備えた音声信号送受信装置に適用すればよく、例えば、ハンズフリーで複数の話者と通話できる電話機等に適用してもよい。
第1の実施形態にかかる音声信号送受信装置の基本的な構成を示すブロック図である。 第2の実施形態にかかる音声会議システムを概略的に示す図である。 図2で示す音声会議装置を上方から見た外観及び音声会議用音声の伝搬及び収音範囲を示す図である。 図2で示す音声会議装置の構成を示すブロック図である。
符号の説明
1−スピーカアレイ 2−マイクアレイ 3−通信部 4−信号処理部(放音部) 5−信号処理部(収音部) 6−エコーキャンセル部 7−擬似エコー信号生成部(適応型エコーキャンセラ) 8(8−1〜8−n)−適応フィルタ 13−遅延部(放音部) 14−加算部(放音部) 15−D/Aコンバータ(放音部) 16−アンプ(放音部) 21−マイクアンプ(収音部) 22−A/D変換部(収音部) 23−収音ビーム形成部(収音部) 100−音声信号送受信装置 ,100´−音声会議装置 100A,100A´−相手方装置 M−マイク SP−スピーカユニット

Claims (2)

  1. 複数のスピーカユニットが配列されてなるスピーカアレイを接続し、複数の相手方から受信した受信音声信号の音声がそれぞれ別にビーム化するように、該各受信音声信号に遅延時間を付与して前記スピーカアレイに入力する放音部と、
    収音した音声の送信音声信号を生成する収音部と、
    前記送信音声信号に対して、各スピーカユニットから前記収音部への音声の回りこみによるエコーをキャンセルする処理を施す複数の適応型エコーキャンセラと、
    を備え
    前記複数の適応型エコーキャンセラは、それぞれ各スピーカユニットに供給する音声信号に基づいて擬似エコー信号を生成する適応フィルタを備え、当該適応フィルタは、生成した擬似エコー信号を前記送信音声信号から減算した各系統の残差信号と前記各スピーカユニットに供給する音声信号とに基づいて、フィルタ係数を更新する音声信号送受信装置。
  2. 前記収音部は、複数配列されたマイクロフォンからなるマイクアレイを接続し、前記各マイクロフォンから入力した各信号に対して所定の遅延時間で位相制御を行って、この位相制御した各信号を加算合成して前記送信音声信号を生成する、
    請求項1に記載の音声信号送受信装置。
JP2006069640A 2006-03-14 2006-03-14 音声信号送受信装置及び音声会議装置 Expired - Fee Related JP4552876B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006069640A JP4552876B2 (ja) 2006-03-14 2006-03-14 音声信号送受信装置及び音声会議装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006069640A JP4552876B2 (ja) 2006-03-14 2006-03-14 音声信号送受信装置及び音声会議装置

Publications (2)

Publication Number Publication Date
JP2007251406A JP2007251406A (ja) 2007-09-27
JP4552876B2 true JP4552876B2 (ja) 2010-09-29

Family

ID=38595266

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006069640A Expired - Fee Related JP4552876B2 (ja) 2006-03-14 2006-03-14 音声信号送受信装置及び音声会議装置

Country Status (1)

Country Link
JP (1) JP4552876B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108271006A (zh) * 2018-03-30 2018-07-10 云南秀达科技有限公司 监控摄像头用无线人声拾音器及其高清晰人声监控摄像头
JP7445975B2 (ja) 2020-10-30 2024-03-08 株式会社カスクアコースティクス マイクロホンアレイ装置、音場制御システム、音場収録システム、及び音場再生システム
CN117981352A (zh) * 2021-10-22 2024-05-03 阿里巴巴(中国)有限公司 会议终端及回声消除方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01114150A (ja) * 1987-10-27 1989-05-02 Nec Corp 多チャネル用音声会議装置
JPH07240722A (ja) * 1994-02-28 1995-09-12 Toshiba Corp 音声符号復号化装置、音声符号化装置及び音声復号化装置
JPH09130306A (ja) * 1995-10-31 1997-05-16 Toshiba Corp 拡声通話装置およびエコーキャンセラ
JPH1155931A (ja) * 1997-07-30 1999-02-26 Isuzu Motors Ltd 渦電流式減速装置の制動ドラム
JP2002237769A (ja) * 2001-02-08 2002-08-23 Nippon Telegr & Teleph Corp <Ntt> 多チャネル反響抑圧方法、その装置、そのプログラム及びその記録媒体
JP2003102085A (ja) * 2001-07-11 2003-04-04 Yamaha Corp 複数チャンネルエコーキャンセル方法、複数チャンネル音声伝送方法、ステレオエコーキャンセラ、ステレオ音声伝送装置および伝達関数演算装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01114150A (ja) * 1987-10-27 1989-05-02 Nec Corp 多チャネル用音声会議装置
JPH07240722A (ja) * 1994-02-28 1995-09-12 Toshiba Corp 音声符号復号化装置、音声符号化装置及び音声復号化装置
JPH09130306A (ja) * 1995-10-31 1997-05-16 Toshiba Corp 拡声通話装置およびエコーキャンセラ
JPH1155931A (ja) * 1997-07-30 1999-02-26 Isuzu Motors Ltd 渦電流式減速装置の制動ドラム
JP2002237769A (ja) * 2001-02-08 2002-08-23 Nippon Telegr & Teleph Corp <Ntt> 多チャネル反響抑圧方法、その装置、そのプログラム及びその記録媒体
JP2003102085A (ja) * 2001-07-11 2003-04-04 Yamaha Corp 複数チャンネルエコーキャンセル方法、複数チャンネル音声伝送方法、ステレオエコーキャンセラ、ステレオ音声伝送装置および伝達関数演算装置

Also Published As

Publication number Publication date
JP2007251406A (ja) 2007-09-27

Similar Documents

Publication Publication Date Title
US11037544B2 (en) Sound output device, sound output method, and sound output system
EP1070417B1 (en) Echo cancellation
US8391472B2 (en) Acoustic echo cancellation solution for video conferencing
JP4929740B2 (ja) 音声会議装置
JP5177820B2 (ja) 強調された主観的ステレオオーディオのためのシステムと方法
JP2008154056A (ja) 音声会議装置および音声会議システム
JP4701962B2 (ja) 回帰音除去装置
AU2016201028A1 (en) Signal enhancement using wireless streaming
JPH10190848A (ja) 音響エコーキャンセル方法とそのシステム
WO2008001659A1 (fr) Dispositif d&#39;émission/réception de son
JP5644382B2 (ja) 音声処理装置
JP4552876B2 (ja) 音声信号送受信装置及び音声会議装置
KR101721621B1 (ko) 마이크 스피커 일체형 오디오 증폭 장치
JP2008294690A (ja) 音声会議装置および音声会議システム
TW200835374A (en) System and method for utilizing omni-directional microphones for speech enhancement
JP5082878B2 (ja) 音声会議装置
JP4872636B2 (ja) 音声会議装置、音声会議システムおよび放収音ユニット
Buchner et al. Full-duplex communication systems using loudspeaker arrays and microphone arrays
JP4929673B2 (ja) 音声会議装置
JP6389080B2 (ja) ボイスキャンセリング装置
JP2004274147A (ja) 音場定位型多地点通話システム
WO2023042699A1 (ja) 音信号処理方法および音信号処理システム
JP2011228899A (ja) 場内拡声装置
WO2012001804A1 (ja) 通話装置、通話方法、及び通話プログラム
JP2007300552A (ja) 音声信号送受信装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090120

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100208

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100223

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100426

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20100426

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100622

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100705

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130723

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees