JP2008022360A - 音声通信装置、および音声通信システム - Google Patents
音声通信装置、および音声通信システム Download PDFInfo
- Publication number
- JP2008022360A JP2008022360A JP2006193124A JP2006193124A JP2008022360A JP 2008022360 A JP2008022360 A JP 2008022360A JP 2006193124 A JP2006193124 A JP 2006193124A JP 2006193124 A JP2006193124 A JP 2006193124A JP 2008022360 A JP2008022360 A JP 2008022360A
- Authority
- JP
- Japan
- Prior art keywords
- sound
- voice
- speech speed
- conference
- speed conversion
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Circuit For Audible Band Transducer (AREA)
- Telephonic Communication Services (AREA)
- Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
Abstract
【課題】比較的簡素なシステム構成で、特定話者の発話音声の話速を変換し、さらに聞き手毎に個別調整することができる音声通信システム、および音声通信装置を提供する。
【解決手段】地点bの会議者Jの声が聴き取り難く、地点aの会議者A,Gが話速変換調整を行うと、音声会議装置111Aは、スピーカアレイの各スピーカから放音される音声を調整することで、会議者A,Gに対応する方位Dir11,Dir18への放音音声のみをそれぞれの話速変換量に基づいて話速変換する。話速変換量はネットワークサーバ101に送信され、ネットワークサーバ101は会議者Jに対する話速変換要求数が所定数になると、会議者Jに対応する方位Dir24からの収音信号を話速変換するように指示するデータを音声会議装置111Bに与える。音声会議装置111Bは、方位Dir24からの収音信号を話速変換して、各音声会議装置111A,111Cに送信する。
【選択図】図1
【解決手段】地点bの会議者Jの声が聴き取り難く、地点aの会議者A,Gが話速変換調整を行うと、音声会議装置111Aは、スピーカアレイの各スピーカから放音される音声を調整することで、会議者A,Gに対応する方位Dir11,Dir18への放音音声のみをそれぞれの話速変換量に基づいて話速変換する。話速変換量はネットワークサーバ101に送信され、ネットワークサーバ101は会議者Jに対する話速変換要求数が所定数になると、会議者Jに対応する方位Dir24からの収音信号を話速変換するように指示するデータを音声会議装置111Bに与える。音声会議装置111Bは、方位Dir24からの収音信号を話速変換して、各音声会議装置111A,111Cに送信する。
【選択図】図1
Description
この発明は、ネットワークを介して相互に音声信号を通信することで遠隔地会議などを行う音声通信システム、およびこの音声通信システムで用いる音声通信装置に関するものである。
複数の地点をネットワークで接続して音声会議やチャットを行う音声通信システムが各種考案されている。
例えば、特許文献1では、それぞれの話者が音声通信装置に相当するパソコンを個別にネットワークへ接続し、仮想会議室で互いに会議をするシステムが開示されている。
そして、特許文献1では、それぞれの話者が個別に音声通信装置を操作して、受信音声信号の音質、音量、音響を調整して放音することで、各話者単位で臨場感の有る会議を行えるものである。
特開平8−125761号公報
しかしながら、多地点間通信の音声会議においては、各話者によって声の音量、会話速度が異なるため、特定の話者の発言が聴き取り難い場合がある。特許文献1の音声通信システムでは、放音の音質、音量、音響を調整して、特定の話者の声が小さすぎる場合に、聞き取り易いように調整することができるが、個別調整ができないために他の話者の音声も大きくなってしまう。また、会話速度が速すぎてその話者の発言が聴き取り難い場合に、その発言内容を把握し易くするように調整することができなかった。
また、特許文献1の音声通信システムでは、話者毎に音声通信装置を設置しなければならず、会議規模が大きくなると音声通信システムの規模が大幅に大きくなってしまうという問題点が有った。
さらには、1つの音声通信装置に複数の会議者が在席していても、所定方向への放音制御を行うことができないので、全会議者に対して同じ音声しか提供することができなかった。
本発明は、会議者数に影響されにくい比較的簡素なシステム構成で、特定話者の発話音声の話速を変換し、さらに聞き手毎に個別調整することができる音声通信システム、およびこの音声通信システムに用いる音声通信装置を提供することを目的とする。
(1)この発明の音声通信装置は、複数のスピーカを配列してなるスピーカアレイと、放音される音声信号の話速変換量の設定を複数のユーザ方向毎に受け付ける操作受付手段と、前記複数のユーザ方向毎に放音ビームを形成するとともに、前記操作受付手段で受け付けた前記ユーザ方向毎の話速変換量に基づき、指定されたユーザ方向への放音ビームを調整するように、入力した音声信号を話速変換、および遅延して前記複数のスピーカに与える放音制御手段と、を備えたことを特徴とする。
(2)また、この発明の音声通信装置は、複数のマイクを配列してなるマイクアレイと、前記複数のユーザ方向に対して収音ビームを形成するとともに、該収音ビーム強度を比較することで話者方位を同定し、話者方位とともに該話者方位の収音ビームに基づく音声信号を所定の話速変換量で話速変換して外部に出力する収音制御部と、を備えたことを特徴とする。
(3)また、この発明の音声通信システムは、サーバ装置、および複数の請求項2に記載の音声通信装置を相互に接続した音声通信システムであって、各音声通信装置は、前記操作受付部が受け付けた話速変換量を、前記サーバ装置に送信するサーバ通信部を備え、前記サーバ装置は、各音声通信装置から送られてきた話速変換量に基づき、各話者方位毎の基本話速変換量を決定して各音声通信装置に配信する話速変換量決定手段を備え、前記音声通信装置のサーバ通信部は、さらにサーバ装置から前記基本話速変換量を受信し、前記収音制御部は、前記話者方位の収音ビームに基づく音声信号を、前記サーバ装置から受信した基本話速変換量で話速変換して外部に出力することを特徴とする。
この発明では、複数の聴者が話速変換を指定し、話速変換量を指定すると、該当する複数の聴者が在席する位置に配置された各音声通信装置は話速変換操作を受け付ける。各音声通信装置は、この話速変換量をネットワークサーバに送信し、ネットワークサーバはこれを受信する。ネットワークサーバは、受信した話速変換量を比較し、同じ傾向の内容(例えば、全てが遅くするように指定するもの)の受付数が所定値以上であるかどうかを判定する。ここで、所定値とは、例えば、現在ネットワークに接続して会議(音声通信)を行っている会議者(話者)の過半数等で設定する。ネットワークサーバは、所定値以上であると判定すると、該当する話者方位に対して設定された基本話速変換量(例えば平均値)を、該当する音声通信装置に送信する。基本話速変換量を受信した音声通信装置は、該当方位(話者方位)から得られる収音ビームが選択され音声通信信号に変換される際に、当該音声通信信号を時間軸に伸長して、ネットワークに出力する。これにより、所定値以上の聴者が特定話者の音声に対して話速変換する場合に、話者の音声を収音する時に一括して話速変換することができる。
(4)また、この発明の音声通信システムは、各音声通信装置の放音制御部は、他の装置から入力した話者方位毎の音声信号を、前記操作受付部で受け付けたユーザ方向毎の話速変換量と前記基本話速変換量の差分の話速変換量で、前記ユーザ方向毎に話速変換することを特徴とする。
この発明では、前述のような収音時の話速変換を行うと、特定話者からの音声通信信号が収音話速変換量で話速変換された状態で他の各音声通信装置に入力される。この際、各音声通信装置には、ネットワークサーバから同じ収音話速変換量が与えられる。各音声通信装置は、この収音話速変換量と、自装置に操作入力された話速変換量との差分を求める。各音声通信装置は、差分結果に基づいて、話速変換を指定した方位への放音ビームを形成する。これにより、話速変換を指定した聴者に対して、収音話速変換量と指定された話速変換量とが重畳した状態で放音ビームが形成されるのではなく、元々の指定した話速変換量に基づく放音ビームが形成される。
(5)また、この発明の音声通信システムは、各音声通信装置の放音制御部は、他の装置から入力した話者方位毎の音声信号を、話速変換量を受け付けていないユーザ方向について、前記基本話速変換量を打ち消す話速変換量で話速変換することを特徴とする。
この発明では、該当話者の在席する音声通信装置以外の各音声通信装置は、収音話速変換量を取得すると、当該収音話速変換量を打ち消す伸長、圧縮処理を行う。各音声通信装置は、収音話速変換量で話速変換された音声通信信号を入力すると、話速変換の指定を行っていない方位の放音ビームに対して収音話速変換量を打ち消すように伸長、圧縮処理を行う。これにより、話速変換の指定操作を行っていない聴者に対して、収音話速変換量による話速変換を行う以前の通常の話速の話者音声に基づく放音ビームが形成される。
(6)また、この発明の音声通信システムは、各音声通信装置の収音制御部は、前記外部に出力する音声信号を、話速変換してから出力するとともに、話速変換しない音声信号も同時出力し、前記放音制御部は、話速変換量を受け付けていないユーザ方向について、他の装置から入力した前記話速変換しない音声信号で、話速変換せずに放音ビームを生成することを特徴とする。
この発明では、収音話速変換を行う音声通信装置は、話速変換済みの音声通信信号とともに、話速変換をしない音声通信信号をネットワークに出力する。
各音声通信装置は、収音話速変換量で話速変換された音声通信信号、および話速変換をしない音声通信信号を入力すると、話速変換の指定を行っていない方位の放音ビームに対して話速変換をしない音声通信信号をスピーカに供給する。これにより、一旦伸長された音声通信信号を、受信側で圧縮して音質低下することを防止する。
この発明によれば、話者(聴者)の1人1人に対して音声通信装置を配分することなく、1つの音声通信装置に対して複数の話者(聴者)を在席させても、各聴者毎に所望の話速で、話者の発声音を話速変換することができる。
また、この発明によれば、所定値以上の聴者が特定話者からの音声について話速変換を指定した場合に、特定話者から音声を収音する時に一元して話速変換することで、全員に対して同時に話速変換済みの音声を発信することができる。これは、例えば、聴き取りづらいけれど話速変換の指定操作の方法が分からない人がいたり、聴き取りづらいけれど敢えて話速変換の指定操作を行わない人がいる場合に、これらの人々に対しても聴き取りやすい音声を提供することができる。
また、この発明によれば、話速変換の指定操作を行っていない聴者に対しては、特定話者の音声を元のままで放音することができる。これは、例えば、話速変換の指定操作を行っていない人は特に問題なく聴き取れているとする場合に、話速変換を行いたい人には話速変換済み音声を提供し、話速変換の指定操作を行っていない人には元の話速のままの音声を提供することができる。
以下の実施形態では、具体的な音声通信システムの例として、音声会議システムについて、図を参照して説明する。
図1は、本実施形態の音声会議システムの構成図である。
図2(A)は図1に示す音声会議システム中の地点aの構成を示す図であり、(B)は図2(A)に示すリモコン装置120(120A〜120G)の平面図である。
図3は本実施形態の音声会議装置111(111A〜111C)の両側面図と底面図とを示し、図4は、図3に示す音声会議装置の主要構成を示すブロック図である。
図5は本実施形態のネットワークサーバ101の主要構成を示すブロック図である。
図2(A)は図1に示す音声会議システム中の地点aの構成を示す図であり、(B)は図2(A)に示すリモコン装置120(120A〜120G)の平面図である。
図3は本実施形態の音声会議装置111(111A〜111C)の両側面図と底面図とを示し、図4は、図3に示す音声会議装置の主要構成を示すブロック図である。
図5は本実施形態のネットワークサーバ101の主要構成を示すブロック図である。
本実施形態の音声会議システムは、ネットワーク100に接続された音声会議装置111A〜111Cと、ネットワークサーバ101とを備える。
音声会議装置111A〜111Cは、それぞれ離れた地点a〜cにそれぞれ配置されている。地点aには音声会議装置111Aが配置され、地点bには音声会議装置111Bが配置され、地点cには音声会議装置111Cが配置されている。
地点aには、音声会議装置111Aが配置されており、該音声会議装置111Aを囲むように、会議者A〜Gの7人が、音声会議装置111Aに対してそれぞれ方位Dir11〜Dir16,Dir18で在席している。地点bには、音声会議装置111Bが配置されており、該音声会議装置111Bを囲むように、会議者H〜会議者Lの5人が、音声会議装置111Bに対して、それぞれ方位Dir21,Dir22,Dir24,Dir26,Dir28で在席している。地点cには、音声会議装置111Cが配置されており、該音声会議装置111Cを囲むように、会議者M,N,P,Qが音声会議装置111Cに対して、それぞれ方位Dir31,Dir34,Dir36,Dir38で在席している。
ここで、各会議者は音声会議装置を囲んで在席するとともに、それぞれの手元に放音調整用のリモコン120を備えている。例えば、図2に示すように、地点aの場合、音声会議装置111Aを囲んで会議者A〜Gが在席し、各会議者A〜Gがそれぞれにリモコン120A〜120Gを持っている。
リモコン120は、例えば、図2(B)に示すように、表示部121、選択ボタン122、実行ボタン123、調整キー124、リモコン信号送信部125を備える。表示部121には、現在設定されている「話速」が表示される。なお、「話速」以外にも「音量」や「音質」等の設定項目が表示されるようにしてもよい。
そして、会議者が、選択ボタン122で調整したい放音特性(「話速」)を選択し、調整キー124で所望速度に調整することができる。「話速」は、例えば、「+1」や「−3」等の現在値に対する相対値で設定される。なお、ここで示す相対値は、実際の話速変換度を示す数値(2倍速等)ではなく、会議者が調整したい速度の目安(例えば5段階程度)を示すものである。実際の話速変換処理においては、音声区間の先頭部分(例えば700ms程度)を1〜2倍程度の伸長率で話速変換し、それ以後の音声については話速変換しない、または圧縮して出力する、といった処理を行う。詳細は後述する。
そして、会議者が実行ボタン123で調整を確定すると、リモコン信号送信部125から赤外線等のリモコン通信信号が音声会議装置111のリモコン送受信部20に送信される。音声会議装置111A〜111Cは、このリモコン信号から、後述する「音声会議装置毎の個別処理」または「ネットワークサーバによる一括処理」のいずれかに基づいて、放音音声を会議者毎に設定する。
図3に示すように、本実施形態の音声会議装置111は、外観機構的に、筐体112、脚部113、操作部114を備える。
筐体112は一方向に長尺な略直方体形状からなり、筐体112の長尺な辺(面)の両端部には、筐体112の下面を設置面から所定間隔離間する所定高さの脚部113が設置されている。なお、以下の説明では、筐体112の四側面のうち、長尺な面を長尺面、短尺な面を短尺面と称する。
筐体112は一方向に長尺な略直方体形状からなり、筐体112の長尺な辺(面)の両端部には、筐体112の下面を設置面から所定間隔離間する所定高さの脚部113が設置されている。なお、以下の説明では、筐体112の四側面のうち、長尺な面を長尺面、短尺な面を短尺面と称する。
筐体112の上面における長尺な方向の一方端には、複数のボタンや表示画面からなる操作部114が設置されている。これら操作部114は筐体112内に設置されたメイン制御部10に接続し、会議者からの操作入力を受け付けて、メイン制御部10に出力するとともに、操作内容や実行モード等を表示画面に表示する。
筐体112における操作部114が設置された側の短尺面には、図示しないが、ネットワーク接続端子等の各種入出力インターフェース端子が設置されている。
筐体112の下面には、同形状からなるスピーカSP1〜SP16が設置されている。これらスピーカSP1〜SP16は長尺方向に沿って一定の間隔で直線状に設置されており、これによりスピーカアレイが構成される。筐体112の一方の長尺面には、同形状からなるマイクMIC101〜MIC116が設置されている。これらマイクMIC101〜MIC116は長尺方向に沿って一定の間隔で直線状に設置されており、これによりマイクアレイが構成される。また、筐体112の他方の長尺面にも、同形状からなるマイクMIC201〜MIC216が設置されている。これらマイクMIC201〜MIC216も長尺方向に沿って一定の間隔で直線状に設置されており、これによりマイクアレイが構成される。そして、筐体112の下面側には、これらスピーカアレイおよびマイクアレイを覆う形状で形成され、パンチメッシュされた下面グリル(図示せず)が設置されている。なお、本実施形態では、スピーカアレイのスピーカ数を16本とし、各マイクアレイのマイク数をそれぞれ16本としたが、これに限ることなく、仕様に応じてスピーカ数およびマイク数は適宜設定すればよい。また、各スピーカ間隔および各マイク間隔は一定ではなくてもよく、例えば、長尺方向に沿って中央部で密に配置され、両端部に向かうに従って疎に配置されるような態様でもよい。
音声会議装置111A〜111Cは、図4に示すように、メイン制御部10、通信制御部11、放音制御部12、D/Aコンバータ13、放音アンプ(AMP)14、収音アンプ(AMP)15、A/Dコンバータ16、収音制御部17、エコーキャンセル部18、音声信号補正部19、リモコン送受信部20、操作部114、スピーカSP1〜SP16、マイクMIC101〜MIC116、MIC201〜MIC216、を備える。
メイン制御部10は、音声会議装置111A〜111Cの全体制御を行うとともに、操作部114から入力される電源オン/オフ等の制御に基づいて、装置の各種制御を行う。
マイクMIC101〜MIC116、MIC201〜MIC216は、自装置の周囲に在席する話者からの発声音を含む周囲の音を収音して電気的な収音信号に変換し、収音アンプ15に与える。収音アンプ15は収音信号を増幅してA/Dコンバータ16に与え、A/Dコンバータ16は、アナログ形式の収音信号をディジタル変換して、収音制御部17に出力する。
収音制御部17は、各マイクMIC101〜MIC116,MIC201〜MIC216の収音信号に対して遅延処理等を行い、各会議者のいる方位を含む所定方位に強い指向性を有する収音ビーム信号を生成する。例えば、図1の音声会議装置111Aであれば、会議者Aの方位に対応する収音方位Dir11、会議者Bの方位に対応する収音方位Dir12、会議者Cの方位に対応する収音方位Dir13、会議者Dの方位に対応する収音方位Dir14、会議者Eの方位に対応する収音方位Dir15、会議者Fの方位に対応する収音方位Dir16、会議者Gの方位に対応する収音方位Dir18を含む、所定の収音方位Dir11〜Dir18のそれぞれに強い指向性を有する収音ビーム信号を生成する。収音制御部17は、生成した各方位の収音ビーム信号の振幅を比較し、最も振幅の大きい収音ビーム信号を選択して、エコーキャンセル部18に出力する。また、収音制御部17は、選択した収音ビーム信号に対応する収音方位Dirを抽出して、話者方位データとしてメイン制御部10に与える。メイン制御部10は、この話者方位データを通信制御部11に与える。
エコーキャンセル部18は、二つのエコーキャンセラ181,182からなり、各エコーキャンセラ181,182はそれぞれ適応型フィルタとポストプロセッサとを備える。エコーキャンセラ181は、適応型フィルタで音声信号S1に基づく擬似回帰音信号を生成して、ポストプロセッサで収音制御部17から出力された収音ビーム信号から、音声信号S1の擬似回帰音信号を減算して、エコーキャンセラ182のポストプロセッサに出力する。エコーキャンセラ182は、適応型フィルタで音声信号S2に基づく擬似回帰音信号を生成して、ポストプロセッサで減算された収音ビーム信号から、音声信号S2の議事回帰音信号を減算して、音声信号補正部19に出力する。これにより、スピーカSPからマイクMICへの回り込み音を抑圧する。
音声信号補正部19は、エコーキャンセル後の収音ビーム信号に、必要に応じて話速変換処理を行うことで音声通信信号を生成する。話速変換処理の要否、話速変換量は、メイン制御部10により指示される。音声信号補正部19は、この音声通信信号を通信制御部11に出力する。
通信制御部11は、音声信号補正部19からの音声通信信号に対して、メイン制御部10からの話者方位データと、装置の認識データとなる装置データとを添付して、ネットワーク通信形式に変換し、ネットワーク100を介して他の装置に送信する。
また、通信制御部11は、ネットワーク100を介して他の装置から音声ファイルを受信する。通信制御部11は、受信した音声ファイルを、ネットワーク形式のデータから一般的な音声信号に変換して、エコーキャンセル部18を介して放音制御部12に出力する。ここで、通信制御部11は、受け付けた音声ファイルに含まれる装置データおよび話者方位データから送信元の音声会議装置を同定して、それぞれの音声会議装置の音声信号毎に出力する。例えば、本実施形態の音声会議装置111Aの場合、音声会議装置111Bからの音声信号S1と、音声会議装置111Cからの音声信号S2とを放音制御部12に出力する。また、装置データおよび話者方位データは、メイン制御部10にも入力される。
メイン制御部10は、装置データ、話者方位データ、および自装置の各聴者の方位(例えば上記Dir11〜Dir18)を示す聴者の方位データ、およびリモコン送受信部20から受け付けた「話速」の相対値(以下、放音調整データと言う)に基づいて、放音制御部12が各スピーカSP1〜SP16に与える音声信号をコントロールする。放音制御部12は、メイン制御部10の制御に従って、入力された音声信号に対して話速変換処理や遅延処理を行って、音声会議装置の周りに在席する各会議者へ個別の特性で強い指向性を有する放音ビームを形成するように、各スピーカSP1〜SP16に対応する放音信号を生成する。
各D/Aコンバータ13は、入力された放音信号をディジタル−アナログ変換して、各放音アンプ14に与え、各放音アンプ14はアナログ化された放音信号を増幅して、各スピーカSP1〜SP16に与える。各スピーカSP1〜SP16は、入力された電気的な音声信号を音声に変換して放音する。
これにより、他装置から送信された発話者の音声は、各会議者へ同時に且つ個別に、受け付けられた放音調整データに対応する放音音声で提供される。すなわち、各会議者に対して、それぞれに適切な話速で音声を放音することができる。
一方、放音時には、メイン制御部10は、リモコン送受信部20を介して放音調整データを受け付けると、当該放音調整データに、聴者の方位データと対応する話者方位データを関連付けして通信制御部11に与える。通信制御部11は、話者方位データ、およびこれに関連付けられた放音調整データをネットワーク100を介してネットワークサーバ101に送信する。ネットワークサーバ101では、各音声通信装置から受信した放音調整データを集計する。
図5に示すように、ネットワークサーバ101は、ネットワーク制御部102と会議情報記憶部103とを備える。
ネットワーク制御部102はネットワーク100全体の制御を行う。また、各装置から送信された上記放音調整データを会議情報記憶部103に記録する。会議情報記憶部103は、現在会議に参加している会議者数を記憶し、放音調整データに基づく調整内容を記憶する。また、通信会議装置間で送受信された音声を、議事録として音声DBに記憶する。ネットワーク制御部102は、会議情報記憶部103に記憶された各情報に基づき、特定話者に対する話速変換の要求数が所定閾値以上であれば、その話者の収音音声を話速変換するように指示する収音話速変換データを生成して、各音声会議装置に送信する。この際、収音話速変換データには、話速変換の対象となる音声会議装置を示す装置データと対象の話者方位データとが添付される。なお、この収音話速変換データの送信履歴も会議情報記憶部103に記憶される。
ネットワーク制御部102はネットワーク100全体の制御を行う。また、各装置から送信された上記放音調整データを会議情報記憶部103に記録する。会議情報記憶部103は、現在会議に参加している会議者数を記憶し、放音調整データに基づく調整内容を記憶する。また、通信会議装置間で送受信された音声を、議事録として音声DBに記憶する。ネットワーク制御部102は、会議情報記憶部103に記憶された各情報に基づき、特定話者に対する話速変換の要求数が所定閾値以上であれば、その話者の収音音声を話速変換するように指示する収音話速変換データを生成して、各音声会議装置に送信する。この際、収音話速変換データには、話速変換の対象となる音声会議装置を示す装置データと対象の話者方位データとが添付される。なお、この収音話速変換データの送信履歴も会議情報記憶部103に記憶される。
各音声通信装置のメイン制御部10は、収音時に、ネットワークサーバ101から与えられた収音話速変換データが自装置に対応するものであるかを検出する。そして、自装置に対する収音話速変換データであれば、当該収音話速変換データを音声信号補正部19に与える。音声信号補正部19は、メイン制御部10からの収音話速変換データと話者方位データとに基づいて、指定された特定話者に対応するエコーキャンセル後の収音ビーム信号に、話速変換処理を行い、音声通信信号を生成する。
また、メイン制御部10は、放音時には、リモコン送受信部20から受け付けた放音調整データと、ネットワークサーバ101から与えられる収音話速変換データとに基づいて、放音制御データを生成する。この放音制御データとしては、前記収音話速変換データに含まれる話速変換相対値から放音調整データに含まれる話速変換相対値を差分したもの等を用いる。そして、メイン制御部10は、この放音制御データを放音制御部12に与える。
なお、収音話速変換データが、自装置を対象とするものではなく、ネットワーク100に接続する他装置を対象とするものであれば、メイン制御部10は、収音話速変換データを音声信号補正部19には与えず、音声信号補正部19は、入力された収音ビーム信号をそのまま音声通信信号として出力する。このような構成を用いることで、他の各音声会議装置で個別に放音調整せずに、収音側の音声会議装置で音声を話速変換して送信することができる。すなわち、収音側の音声会議装置で、他の各音声会議装置の会議者に対して一括して音の補正(話速変換)を行うことができる。
次に、音声通信システムの具体的な動作について説明する。
図6はネットワークサーバ101の収音話速変換設定フローを示すフローチャートである。
図6はネットワークサーバ101の収音話速変換設定フローを示すフローチャートである。
ネットワーク制御部102は、ネットワーク100を介して各音声会議装置から放音調整データを順次受信する(S201)。また、同時に、ネットワーク制御部102は、それぞれの放音調整データに対応する話者方位データ(装置データを含む)を検出する(S202)。ここで、話者方位データとは、送信元の音声会議装置から送信される音声ファイルに添付された特定話者を指定する方位データであり、放音調整データを取得した時点で、ネットワーク100にて送受信される音声ファイルから取得する。
ネットワーク制御部102は、各放音調整データを解析して、放音調整内容を取得して、話者方位データに関連付けして調整内容DBに記憶する(S203)。ここで、放音調整内容とは、発信元方位データ、および話速変換設定量で表され、話速変換設定量は、現在値に対する大小により設定される。なお、発信元方位データとは、放音調整データが発信された聴者の方位を特定する方位データであり、各音声会議装置からの放音調整データに関連付けして送信されるものである。
ネットワーク制御部102は、話者方位データ毎に発信元方位データ数をカウントして、同じ話者方位データに対する発信元方位データが所定閾値以上であることを検出すると(S204)、該当する話者方位データに対応する方位からの音声を収音時に話速変換する収音話速変換データを生成する(S205)。この収音話速変換データは、装置データを含む話速変換対象方位データ、および「話速」を備え、「話速」とは、放音調整データと同様に現在値に対する相対値で設定される。なお、本説明では特定の話者方位データに対する発信元方位データ数が所定閾値以上になる場合に収音話速変換データを生成する例を示したが、予め記憶している会議者数に基づき、発信元方位データ数が会議者数の過半数に達した場合に収音話速変換データを生成するようにしてもよい。なお、ネットワーク制御部102は、収音話速変換データを生成すると、会議情報記憶部103に記録する。
ネットワーク制御部102は、ネットワーク100を介して、収音話速変換データを各音声会議装置111A〜111Cに送信する(S206)。
次に、音声会議装置における放音調整および収音話速変換のより具体的な方法について図を参照して説明する。
図7は音声会議装置の放収音処理を示すフローチャートである。
各音声会議装置111は、通信制御部11での音声ファイルの受信状況、および、収音制御部17での収音状況に基づいて、自装置が収音状態、放音状態、待受状態のいずれの状態であるかを判断する(S1)。ここで、放音状態であれば以下に示す放音処理を行い、収音状態であれば以下に示す収音処理を行い、待受状態であれば放音状態または収音状態になるまで状態検出を繰り返す。
図7は音声会議装置の放収音処理を示すフローチャートである。
各音声会議装置111は、通信制御部11での音声ファイルの受信状況、および、収音制御部17での収音状況に基づいて、自装置が収音状態、放音状態、待受状態のいずれの状態であるかを判断する(S1)。ここで、放音状態であれば以下に示す放音処理を行い、収音状態であれば以下に示す収音処理を行い、待受状態であれば放音状態または収音状態になるまで状態検出を繰り返す。
このような放音、収音、待受処理の状態で、ネットワークサーバ101から収音話速変換データを受信したり、会議者(リモコン)から放音制御の操作入力が行われると、音声会議装置は、図8に示す割込処理を実行する。
図8は音声会議装置の放音調整変更、収音話速変換変更の割込処理を示すフローチャートである。
音声会議装置111は、電源ON状態であれば、放音、収音、待受のいずれの状態であっても、随時ネットワークサーバ101およびリモコン120からの割り込み処理を受け付けられる状態で動作する。そして、音声会議装置111は割込を検出すると(S101)、当該割込処理の種別を判別する(S102)。
図8は音声会議装置の放音調整変更、収音話速変換変更の割込処理を示すフローチャートである。
音声会議装置111は、電源ON状態であれば、放音、収音、待受のいずれの状態であっても、随時ネットワークサーバ101およびリモコン120からの割り込み処理を受け付けられる状態で動作する。そして、音声会議装置111は割込を検出すると(S101)、当該割込処理の種別を判別する(S102)。
具体的には、リモコン120からのリモコン通信信号を検出すると、音声会議装置111はユーザ割込であることを検出する。そして、音声会議装置111は、リモコン120により設定された放音調整内容を受け付ける(S103)。この際、音声会議装置111は、装置周囲に配置されたいずれのリモコン120からのリモコン通信信号であるかを同時に検出する。
音声会議装置111は、放音を行う各方位(会議者方位)に対してそれぞれ放音調整フラグを備えている。音声会議装置111は、送信元のリモコン120に対応する方位に対して、放音調整フラグをON状態にする(S104)。
そして、音声会議装置111は、受け付けた放音調整内容から放音調整データを生成して記憶し(S105)、放音調整データと発信元の方位データとを関連付けして、通信制御部11を介してネットワークサーバ101に送信する(S106)。
一方、通信制御部11にてネットワークサーバ101からの収音話速変換データを検出すると、音声会議装置111はサーバ割込であることを検出し、受信した収音話速変換データを受け付ける(S107)。音声会議装置111は、収音話速変換データを解析して、装置データから自装置を対象とする収音話速変換データであるかどうかを検出する(S108)。
音声会議装置111は、自装置を対象とする収音話速変換データであれば、収音話速変換データから話者方位データを取得する。音声会議装置111は、各方位に対してそれぞれ収音話速変換フラグを備えており、取得した話者方位データに対応する方位に対して収音話速変換フラグをON状態にする(S109)。そして、音声会議装置111は収音話速変換データを記憶する(S110)。
このように、音声会議装置111は、放音時には放音調整内容に基づいて放音調整フラグを設定し、収音時には自装置が話速変換対象であれば収音話速変換フラグを設定する。
図7に示すフローに戻り、自装置が放音状態であることを検出すると、音声会議装置111のメイン制御部10は、ネットワークサーバ101から収音話速変換データを取得しているかどうかを検出する(S2)。メイン制御部10は、収音話速変換データを取得して記憶していれば、放音を行う各方位に対して放音調整データを受け付けているかどうかを検出する(S4)。メイン制御部10は、放音調整データを受け付けていなければ、すなわち全ての方位に対して放音調整フラグがOFF状態であることを確認すれば、収音話速変換データに基づいて、放音をする全方位に対して同等の話速変換量からなる放音制御データを生成し、放音制御部12に与える(S6)。
また、メイン制御部10は、放音調整データを受け付けていれば、収音話速変換データによる話速変換量を基準量として、該基準量から放音調整データに基づく話速変換量を差分した差分値を、放音調整フラグがON状態にある方位毎に設定することで放音制御データを生成し、放音制御部12に与える(S7)。すなわち、放音調整データを受け付けた方位(放音調整フラグがON状態の方位)には、差分値に基づく話速変換を行い、放音調整データを受け付けていない方位(放音調整フラグがOFF状態の方位)には、収音話速変換データに基づく話速変換を行う放音制御データを与える。
また、メイン制御部10は、収音話速変換データがない場合にも、放音を行う各方位に対して放音調整データを受け付けているかどうかを検出する(S5)。メイン制御部10は、放音調整データを受け付けていなければ、すなわち、全方位に対して放音調整フラグがOFF状態であれば、全方位に対して受信した音声通信信号をそのまま放音する放音制御データを生成し、放音制御部12に与える。なお、この場合、特に放音制御データを与えなくても良い。
また、メイン制御部10は、収音話速変換データが無い場合で、放音調整データを受け付けている場合には、放音調整フラグがON状態である各方位の話速変換量を設定した放音制御データを生成して、放音制御部12に与える(S8)。すなわち、放音調整データを受け付けた方位(放音調整フラグがON状態の方位)には、放音調整データに基づく話速変換を行い、放音調整データを受け付けていない方位(放音調整フラグがOFF状態の方位)には、そのまま放音する放音制御データを与える。
放音制御部12は、与えられた放音制御データに基づいて音声信号を話速変換した後に、各方位へ所望の放音ビームが形成されるように、各スピーカSP1〜SP16に与える放音信号を生成して出力する(S11)。
ここで、話速変換処理について詳細に説明する。話速変換処理は、単に音声信号を低速で出力するのではなく、以下のようにして行う。すなわち、話速変換処理は、音声信号を1周期の波形に切りわけ、各周期波形の前後1区間を合成した新たな周期波形を生成し、各周期波形の間に新たに合成した周期波形を挿入することで信号の周期波形数を増やして、音程を保ちつつ信号を時間伸長する処理である。
図9(A)は伸長処理の手順を示すフローチャートである。また、同図(B)は伸長方法を説明する図である。同図(A)において、まず入力音声信号の先頭部分の1周期のサンプル数(サンプリング周波数×1/信号周波数)を検出する(s91)。この1周期分のサンプルデータである周期波形を2つ取り出して、同図(B)に示すように、1つめの周期波形Aに対して減衰利得係数を乗算することによって減衰波を作成し、2つめの周期波形Bに対して増加利得係数を乗算することによって増加波を作成する(s92)。そして、これらを加算合成することによってAとBの中間の形状の周期波形を合成する(s93)。この合成波形を図10(A)に示すように周期波形Aと周期波形Bとの間に挿入して出力する(s94)ことによって音響的に自然な時間伸長を行う。
なお、音声データを圧縮する場合には、図10(B)に示すように、上記s93で合成したAとBの中間の形状の合成波形を周期波形A,Bに代えて出力することにより、音声データを時間軸方向に1/2倍に圧縮することができる。
また、この話速変換処理を行う周期を規定することで、変換速度を可変とすることができる。例えば、図10(C)に示すように、周期毎に周期波形を2つ合成し、各周期波形の間に挿入することで、音声データを時間軸方向に2倍に伸長することができ、同図(D)に示すように、2周期毎に周期波形を2つ合成することで、3/2倍に伸長することができる。これらの伸長率が上記話速変換設定量(相対値)に対応している。例えば話速変換量+5は2倍伸長、+4は3/2倍伸長、+3は4/3倍伸長、+2は5/4倍伸長、+1は6/5倍伸長、といった様に対応している。
また、話速変換は、音声区間の先頭部分(例えば700msec)のみを伸長して、それ以後を通常速度で出力するようにし、必要以上に伸長しないようにする。なお、先頭部分を伸長し、それ以後を圧縮するようにしてもよい。音声区間、雑音区間の区別は、音声信号の周期性から判断すればよい。例えば、音声信号を所定長に分割して対応するサンプルデータを乗算または減算するなどして相関値を算出する。図11に示すように、この相関値が所定閾値よりも低い場合に雑音区間、高い場合に音声区間と判断する。音声等の周期性の多い音声信号の場合
相関値は高くなり、雑音等の周期性の少ない音声信号の場合相関値は低くなる。
相関値は高くなり、雑音等の周期性の少ない音声信号の場合相関値は低くなる。
なお、本実施形態では、音声区間の先頭部分700msecについて話速変換する例を示したが、さらに長い区間長を話速変換するようにしてもよいし、短い区間長を話速変換するようにしてもよい。また、話速変換設定量に応じて、話速変換を行う区間長を変更するようにしてもよい。例えば、話速変換量+5は700msec、+4は600msec、+3は500msecといった様に区間長を設定してもよい。また、話速変換を行う区間中でも、伸長率を変更するようにしてもよい。例えば、区間長が700msecであった場合に、最初の600msecを2倍伸長、続く100msecを3/2倍伸長といった伸長率で話速変換する。
次に、図7のs1において、自装置が収音状態であることを検出すると、音声会議装置111のメイン制御部10は、ネットワークサーバ101から収音話速変換データを取得しているかどうかを検出する(S3)。収音話速変換データを受け付けており、自装置に対する収音話速変換データであることを検出すると、すなわち、いずれかの方位に対して収音話速変換フラグがON状態であることを検出すると、メイン制御部10は、収音話速変換データに基づく収音話速変換制御データを音声信号補正部19に与える。音声信号補正部19は、収音話速変換制御データが与えられていれば、収音話速変換フラグがON状態である方位からの収音ビーム信号を話速変換し(S9)、音声通信信号を生成する。
また、メイン制御部10は収音話速変換データを取得していなければ、音声信号補正部19に対して特に制御を行わない。音声信号補正部19は、収音話速変換制御データが与えられていなけれれば、収音ビーム信号を話速変換せずに、そのまま音声通信信号として生成する。
通信制御部11は、これらの音声通信信号に話者方位データおよび装置データを添付してネットワーク100に送信する(S10)。
次に、このような構成を用いた場合の実際の放収音の状況を、図1、図12〜図15を参照して説明する。
なお、以下の説明では、地点bの会議者Jの声が聴き取り難い状況を例に示したものである。
なお、以下の説明では、地点bの会議者Jの声が聴き取り難い状況を例に示したものである。
(1)放音調整個別対応
図12は放音調整個別対応の場合の放収音状況を示した図である。
図12は放音調整個別対応の場合の放収音状況を示した図である。
図12に示すように、地点bの会議者Jが発言中に、地点aの会議者Aと会議者Gとがリモコン120を操作して放音調整を行った場合、地点aの音声会議装置111Aは、各リモコン120で操作された放音調整内容を取得する。この場合、会議者Aに対して、話速を「+4」にする放音調整内容と、会議者Gに対して、話速を「+2」にする放音調整内容とを取得する。音声会議装置111Aは、これら放音調整内容を放音調整データとして、ネットワークサーバ101に送信するとともに、会議者A,Gのそれぞれに該当する方位Dir11,Dir18に対して放音調整フラグをONに設定する。そして、音声会議装置111Aは、受信した音声通信信号から話者データを取得して、会議者Jの声であることを検出すると、方位Dir11,Dir18への放音音声を、それぞれの放音調整内容に従って話速変換して放音する。
これにより、会議者A,Gには、会議者Jの声が、指定した話速変換量に従って話速変換(伸長)された状態で聴くことができる。会議者Aには、話速が「4」遅く、すなわち3/2倍伸長された状態で会議者Jの声が聞こえる。会議者Gには、話速が「2」遅く、すなわち5/4倍伸長された状態で会議者Jの声が聞こえる。他の会議者(地点aの会議者B〜会議者F、地点cの会議者M〜会議者Q)には、会議者Jの声が調整されることなく、そのまま聞こえる。
この場合、放音調整を行った会議者が、全体の会議者に対して少数派であるので、ネットワークサーバ101は、会議者Jの音声を収音時に一括して話速変換する制御を行わない。
このように、特定会議者(話者)に対して放音調整を行う会議者(聴者)数が極少ない場合には、それぞれの聴者がいる音声会議装置で聴者毎に話速変換を行う。これにより、話速変換したい聴者にのみ話速変換量に応じた放音を行うことができる。
(2)収音話速変換一括対応
図13、図14は、収音話速変換一括対応の場合の放収音状況を示した図であり、図13が一括話速変換前、図14が一括話速変換後の状況を示す。
図13、図14は、収音話速変換一括対応の場合の放収音状況を示した図であり、図13が一括話速変換前、図14が一括話速変換後の状況を示す。
図13に示すように、地点bの会議者Jが発言中に、地点aの会議者Aと会議者Gとがそれぞれのリモコン120を操作して放音調整を行った場合、地点aの音声会議装置111Aは、各リモコン120で操作された放音調整内容を取得する。この場合、会議者Aに対して、話速を「+4」にする放音調整内容を取得し、会議者Gに対して、話速を「+2」にする放音調整内容を取得する。音声会議装置111Aは、これら放音調整内容を放音調整データとして、ネットワークサーバ101に送信するとともに、会議者A,Gのそれぞれに該当する方位Dir11,Dir18に対して放音調整フラグをONに設定する。
同様に、地点cの会議者Mと会議者Nと会議者Qとがそれぞれのリモコン120を操作して放音調整を行った場合、地点cの音声会議装置111Cは、各リモコン120で操作された放音調整内容を取得する。この場合、会議者Mに対して、話速を「+1」にする放音調整内容を取得し、会議者Nに対して、話速を「+2」にする放音調整内容を取得し、会議者Qに対して、話速を「+1」にする放音調整内容を取得する。音声会議装置111Cは、これら放音調整内容を放音調整データとして、ネットワークサーバ101に送信するとともに、会議者M,N,Qにそれぞれ該当する方位Dir31,Dir34,Dir38に対して放音調整フラグをONに設定する。そして、音声会議装置111A,111Cは、受信した音声通信信号から話者データを取得して、会議者Jの声であることを検出すると、方位Dir11,Dir18,Dir31,Dir34,Dir38への放音音声を、それぞれの放音調整内容に従って話速変換して放音する。
これにより、会議者A,G,M,N,Qには、会議者Jの声が、指定した放音調整内容に従って話速変換された状態で聴ける。会議者Aには、話速が「4」遅く、すなわち3/2倍伸長された状態で会議者Jの声が聞こえる。会議者Gには、話速が「2」遅く、すなわち5/4倍伸長された状態で会議者Jの声が聞こる。また、会議者Mには、話速が「1」遅く、すなわち6/5倍伸長された状態で会議者Jの声が聞こえる。会議者Nには、話速が「2」大きく、すなわち5/4倍伸長された状態で会議者Jの声が聞こえる。会議者Mには、話速が「1」大きく、6/5倍伸長された状態で会議者Jの声が聞こえる。
ネットワークサーバ101は、会議者Jに対する放音調整データの数が、会議者数の過半数を超えたことを検出すると、これら放音調整データの各話速変換量を取得し、平均値処理する。図13の例であれば、話速が「+2」と算出される。ネットワークサーバ101は、このように算出した各調整量を用いて収音話速変換データを生成し、話速変換対象となる話者データ(方位データ)を添付して各音声会議装置111A〜111Cに与える。
話速変換対象の会議者Jが在席する音声会議装置111Bは、受信した収音話速変換データに基づいて、会議者Jから収音した収音ビーム信号を話速変換して、ネットワーク100に送信する。この例では、会議者Jの収音ビーム信号の話速を「+2」として5/4倍伸長して送信する。
このままでは、音声会議装置111A,111Cで放音調整済みの方位では、放音調整内容と収音話速変換内容とが加算された状態で放音されるので、必要以上に話速変換された音となってしまう。
そこで、音声会議装置111Aは、受信した収音話速変換データの各話速変換量と予め設定記憶した放音調整データの各話速変換量とを差分し、この差分値により設定される話速変換量から話速変換を行う。具体的には、図14に示すように、会議者Aには、話速「4−2」=「+2」に話速変換量を変更する。会議者Gには、話速「2−2」=「0」に話速変換量を変更する。そして、この変更された話速変換量に基づいて、話速変換された状態(話速「+2」)の音声通信信号を放音調整する。これにより、会議者A,Gは、自身が調整した内容に応じた会議者Jの声を聞くことができる。
また、音声会議装置111Cは、音声会議装置111Aと同様に、差分値により設定される話速変換量から放音調整を行う。具体的には、会議者Mには、話速「1−2」=「−1」に話速変換量を変更する。話速変換量が「−1」の場合は、5/6倍に圧縮処理を行う。会議者Nには、話速「2−2」=「0」に話速変換量を変更する。つまり、話速変換を行わない。会議者Qには、話速「1−2」=「−1」に話速変換量を変更する。そして、この変更された話速変換量に基づいて、話速変換された状態(話速「+2」)の音声通信信号を話速変換する。これにより、会議者M,N,Qも、自身が調整した内容に応じた会議者Jの声を聞くことができる。
また、他の会議者(地点aの会議者B〜会議者F、地点cの会議者P)には、会議者Jの声が、収音側で話速変換された状態で聞こえる。
これにより、放音調整した各会議者(聴者)には、会議者(聴者)が設定した話速で話者の音声を聞かせることができ、放音調整していない会議者(聴者)に対しても話速変換された聴き取り易いであろう音で話者の音声を聞かせることができる。
なお、上記例においては、各話速変換量を取得し、平均値処理する例について説明したが、最も話速変換量の小さい値を収音話速変換データに採用するようにしてもよい。この場合、放音側の話速変換量の差分値は必ずプラスとなるため、一度伸長した音声信号が放音調整によって元通りに圧縮されることがなくなり、音質の低下を防止することができる。
なお、放音調整を行っていない会議者は、会議者Jの声を聴き取りにくいとは感じていない場合もある。
この場合、図15に示すように、放音調整していない会議者に対して逆変換(圧縮処理)をかけるようにしてもよい。
図15は、図13、図14と同様な場合で且つ逆変換を行う場合の放収音状況を示した図である。
放音調整した会議者に対する放音調整の方法は、図13の場合と同じであるので説明は省略する。
音声通信信号を受信する側の音声会議装置111A,111Cは、ネットワークサーバ101から収音話速変換データを取得すると、当該収音話速変換データの各話速変換量を逆に変換する逆話速変換用放音調整データを生成する。図15の例であれば、話速変換量である話速「+2」に対して、逆話速変換量として、話速「−2」を設定する。
音声会議装置111Aは、図13の場合と異なり、全ての会議者A〜Gに対応する方位Dir11〜Dir16,Dir18に対して放音調整フラグをONにし、放音調整が指定されていない会議者B〜Fに対しては、逆話速変換用放音調整データを適用する。これにより、会議者B〜Fには、話速変換される前の通常速度の会議者Jの音声を聞かせることができる。同様に、音声会議装置111Cも、放音調整が指定されていない会議者Pに対しては、逆話速変換用放音調整データを適用する。これにより、会議者Pにも、話速変換される前の通常速度の会議者Jの音声を聞かせることができる。
これにより、放音調整を行っていない人は、会議者Jの声が聴き取り難い訳ではないという判断があるものとして、そのままの音声を放音することができる。
なお、このような調整不必要の場合、リモコン120の調整不必要のボタンやコマンドを予め設けておけば、調整不必要かどうかをより明確に判断することができる。
また、図16に示すように、収音側の音声会議装置111Bが、収音した収音ビーム信号を話速変換してネットワーク100に送信するとともに、話速変換を行わない信号を同時送信するようにしてもよい。この場合、音声会議装置111Aは、放音調整が指定されていない会議者B〜Fに対しては、受信した2つの信号のうち、話速変換が行われていない信号を放音に用いる。これにより、会議者B〜Fには、話速変換される前の通常速度の会議者Jの音声を聞かせることができる。同様に、音声会議装置111Cも、放音調整が指定されていない会議者Pに対しては、話速変換が行われていない信号を放音に用いる。これにより、会議者Pにも、話速変換される前の通常速度の会議者Jの音声を聞かせることができる。なお、この場合、図5で示したネットワークサーバ101で会議情報記憶部103に記憶される音声は、送信側で話速変換を行わない信号を記憶するようにすればよい。
以上のように、本実施形態の構成および処理を用いることにより、遠隔地間で会議を行うような場合に、比較的簡素なシステムで、特定話者の声を聴者毎に違う話速で聞かせることができる。
なお、前述の説明では、話速以外の調整例を示さなかったが、その他、音量、音質等の調整を行うようにしてもよい。また、予め聴き取りやすい声質を記憶しておき、適宜声質を選択することで、選択した声質で話者の音声を放音することもできる。例えば、テレビアナウンサーのフォルマント情報を記憶しておき、この声質が選択されれば、特定話者の音声をフォルマント変換して放音すればよい。
また、前述の説明において、ネットワークサーバ101は、収音話速変換データや放音調整データを対応する話者方位データとともに、会議情報記憶部103に記憶しておいても良い。そして、次回以降、同じメンバで会議が行われる場合に、ネットワークサーバ101は、この話者方位データと収音話速変換データ、放音調整データを読み出して、音声会議装置111A〜111Cに送信する。各音声会議装置111A〜111Cは、取得した収音話速変換データ、放音調整データに基づいて、収音、放音する。これにより、次回以降は、会議の最初から、各会議者が自分の好みの音声で話者の発言を聞くことができる。
100−ネットワーク
101−ネットワークサーバ
111A,111B,111C−音声会議装置
101−ネットワークサーバ
111A,111B,111C−音声会議装置
Claims (6)
- 複数のスピーカを配列してなるスピーカアレイと、
放音される音声信号の話速変換量の設定を複数のユーザ方向毎に受け付ける操作受付手段と、
前記複数のユーザ方向毎に放音ビームを形成するとともに、前記操作受付手段で受け付けた前記ユーザ方向毎の話速変換量に基づき、指定されたユーザ方向への放音ビームを調整するように、入力した音声信号を話速変換、および遅延して前記複数のスピーカに与える放音制御手段と、
を備えた音声通信装置。 - 複数のマイクを配列してなるマイクアレイと、
前記複数のユーザ方向に対して収音ビームを形成するとともに、該収音ビーム強度を比較することで話者方位を同定し、話者方位とともに該話者方位の収音ビームに基づく音声信号を所定の話速変換量で話速変換して外部に出力する収音制御部と、
を備えた請求項1に記載の音声通信装置。 - サーバ装置、および複数の請求項2に記載の音声通信装置を相互に接続した音声通信システムであって、
各音声通信装置は、前記操作受付部が受け付けた話速変換量を、前記サーバ装置に送信するサーバ通信部を備え、
前記サーバ装置は、各音声通信装置から送られてきた話速変換量に基づき、各話者方位毎の基本話速変換量を決定して各音声通信装置に配信する話速変換量決定手段を備え、
前記音声通信装置のサーバ通信部は、さらにサーバ装置から前記基本話速変換量を受信し、
前記収音制御部は、前記話者方位の収音ビームに基づく音声信号を、前記サーバ装置から受信した基本話速変換量で話速変換して外部に出力する音声通信システム。 - 各音声通信装置の放音制御部は、他の装置から入力した話者方位毎の音声信号を、前記操作受付部で受け付けたユーザ方向毎の話速変換量と前記基本話速変換量の差分の話速変換量で、前記ユーザ方向毎に話速変換する請求項3に記載の音声通信システム。
- 各音声通信装置の放音制御部は、他の装置から入力した話者方位毎の音声信号を、話速変換量を受け付けていないユーザ方向について、前記基本話速変換量を打ち消す話速変換量で話速変換する請求項4に記載の音声通信システム。
- 各音声通信装置の収音制御部は、前記外部に出力する音声信号を、話速変換してから出力するとともに、話速変換しない音声信号も同時出力し、
前記放音制御部は、話速変換量を受け付けていないユーザ方向について、他の装置から入力した前記話速変換しない音声信号で、話速変換せずに放音ビームを生成する請求項4に記載の音声通信システム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006193124A JP2008022360A (ja) | 2006-07-13 | 2006-07-13 | 音声通信装置、および音声通信システム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006193124A JP2008022360A (ja) | 2006-07-13 | 2006-07-13 | 音声通信装置、および音声通信システム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2008022360A true JP2008022360A (ja) | 2008-01-31 |
Family
ID=39077987
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006193124A Pending JP2008022360A (ja) | 2006-07-13 | 2006-07-13 | 音声通信装置、および音声通信システム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2008022360A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013211764A (ja) * | 2012-03-30 | 2013-10-10 | Brother Ind Ltd | 音声制御装置、音声制御方法、及び音声制御プログラム |
-
2006
- 2006-07-13 JP JP2006193124A patent/JP2008022360A/ja active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013211764A (ja) * | 2012-03-30 | 2013-10-10 | Brother Ind Ltd | 音声制御装置、音声制御方法、及び音声制御プログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3972921B2 (ja) | 音声集音装置とエコーキャンセル処理方法 | |
EP2011366B1 (en) | Sound pickup device and voice conference apparatus | |
US8666047B2 (en) | High quality audio conferencing with adaptive beamforming | |
US20050213747A1 (en) | Hybrid monaural and multichannel audio for conferencing | |
WO2007088730A1 (ja) | 音声会議装置 | |
US20050281421A1 (en) | First person acoustic environment system and method | |
JPH0870494A (ja) | 音声作動スイッチング装置 | |
JP2008288785A (ja) | テレビ会議装置 | |
JP2006121709A (ja) | 天井マイクロホンアセンブリ | |
CN108235181B (zh) | 在音频处理装置中降噪的方法 | |
JP2006238254A (ja) | 拡声システム | |
JP4894353B2 (ja) | 放収音装置 | |
JP5295115B2 (ja) | 補聴器の駆動方法および補聴器 | |
JP4882757B2 (ja) | 音声会議システム | |
JP2008034979A (ja) | 音声通信装置、および音声通信システム | |
JP2007329753A (ja) | 音声通信装置および音声通信システム | |
JP2006211156A (ja) | 音響装置 | |
CN109920442B (zh) | 一种麦克风阵列语音增强的方法和系统 | |
JP2008022360A (ja) | 音声通信装置、および音声通信システム | |
JP2008017126A (ja) | 音声会議システム | |
US20080192945A1 (en) | Audio system and method | |
WO2009110576A1 (ja) | 収音装置 | |
JP2011199697A (ja) | ヘッドフォン | |
JP4929673B2 (ja) | 音声会議装置 | |
JP2007258951A (ja) | 通信会議装置 |