JP2007274462A - テレビ会議装置、テレビ会議システム - Google Patents
テレビ会議装置、テレビ会議システム Download PDFInfo
- Publication number
- JP2007274462A JP2007274462A JP2006098989A JP2006098989A JP2007274462A JP 2007274462 A JP2007274462 A JP 2007274462A JP 2006098989 A JP2006098989 A JP 2006098989A JP 2006098989 A JP2006098989 A JP 2006098989A JP 2007274462 A JP2007274462 A JP 2007274462A
- Authority
- JP
- Japan
- Prior art keywords
- speaker
- data
- image
- conference
- direction data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Telephonic Communication Services (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
Abstract
【課題】視覚的にも聴覚的にも臨場感溢れるテレビ会議を実現できるテレビ会議装置を提供する。
【解決手段】放音制御部2は相手先の話者方向データD1Bに基づいて話者方向に応じた仮想音源を設定するように相手先の話者音声信号S1Bを遅延・ゲイン制御する。画像データ処理部9は話者方向データD1Bから個別映像データP2Bを選択して全面表示し、全体映像データP1Bを別枠で表示する。話者方向検出部5は話者方向を検出して収音方向データD11Aを生成し、収音ビーム生成部6は送信用の話者音声信号S1Aを生成するとともに詳細収音方向データD12Aを生成する。送信音声データ生成部8は収音方向データD11Aと詳細収音方向データD12Aとから話者方向データD1Aを生成する。画像データ処理部9は、カメラCAM1の画像で全体映像データP1Aを生成し、カメラCAM11〜CAM13の画像で個別映像データP2nAを生成する。
【選択図】図2
【解決手段】放音制御部2は相手先の話者方向データD1Bに基づいて話者方向に応じた仮想音源を設定するように相手先の話者音声信号S1Bを遅延・ゲイン制御する。画像データ処理部9は話者方向データD1Bから個別映像データP2Bを選択して全面表示し、全体映像データP1Bを別枠で表示する。話者方向検出部5は話者方向を検出して収音方向データD11Aを生成し、収音ビーム生成部6は送信用の話者音声信号S1Aを生成するとともに詳細収音方向データD12Aを生成する。送信音声データ生成部8は収音方向データD11Aと詳細収音方向データD12Aとから話者方向データD1Aを生成する。画像データ処理部9は、カメラCAM1の画像で全体映像データP1Aを生成し、カメラCAM11〜CAM13の画像で個別映像データP2nAを生成する。
【選択図】図2
Description
この発明は、ネットワーク等を介して複数の地点間で行うテレビ会議に用いるテレビ会議装置およびこのテレビ会議装置を用いたテレビ会議システムに関するものである。
従来、遠隔地間でテレビ会議を行う方法として、テレビ会議を行う地点毎にテレビ会議装置を設置して、これらテレビ会議装置をネットワークで接続し、音声信号と映像信号とを通信する方法がある。そして、このようなテレビ音声会議に利用される技術が各種考案されている。
特許文献1は、相手先の話者の映像の切り替えを受信側の会議者が行い、切り替わって表示される映像が中心となるように音声が調整されるものである。
特許文献2は、2チャンネルのスピーカの音量を調整することで音源定位を行うものである。
特許文献3は、複数の独立マイクの収音信号に基づいて話者方向を検出し、当該話者の映像を抽出するものである。
特開平1−280982号公報
特開平7−264700号公報
特開平4−109784号公報
しかしながら、特許文献1の技術では、相手先の話者の映像の切り替えを受信側が行わなければならない。このため、相手先に複数の話者が居て、頻繁に話者が切り替わる場合に、話者の切り替わりに対して、映像の切り替えを追随させていくことは困難であった。
また、特許文献2の装置では、R/Lの2チャンネルのスピーカの音量バランスを調整することで音源定位を行うので、正確な音源定位を行うことができない。また、話者同士で予め基準点を設定しておかなければならなかった。さらに、映像が切り替わるものではないので、会議者に視覚的な臨場感を与えることができなかった。
また、特許文献3の装置では、相手先会議者それぞれをピックアップした画像が表示画面に切り替わりながら表示するため、相手先の全体の様子が分からず、視覚的な臨場感が低いものとなっていた。また、どの話者の発声音も同じ方向から聞こえるので、聴覚的な臨場感を与えることができなかった。
したがって、この発明の目的は、それぞれに複数の話者が存在するテレビ会議の時に、視覚的にも聴覚的にも臨場感溢れるテレビ会議を実現できるテレビ会議装置およびテレビ会議システムを提供することにある。
この発明のテレビ会議装置は、複数のマイクが配列されたマイクアレイと、会議者全体を撮像範囲とした全体画像を生成する全体撮像手段と、各会議者をそれぞれ個別に撮像して各会議者に関連付けされた個別画像を生成する複数の特定会議者撮像手段と、複数のマイクの収音信号に基づいて話者方向を検出して、話者方向データを生成する話者方向検出手段と、検出された話者方向に応じて話者音声信号を生成する話者音声信号生成手段と、全体画像、各個別画像、話者音声信号、および話者方向データを送信する送信手段と、を備えたことを特徴としている。
この構成では、マイクアレイの各マイクが複数の会議者の内の話者の発声音を収音し、話者方向検出手段は、各マイクの収音信号に基づいて話者方向を検出して、特定の会議者方向に一致する話者方向データを生成する。また、話者音声信号生成手段は、検出された話者方向に指向性が向けられた話者音声信号を生成する。この収音処理と同時に会議者を撮像する。会議者の画像として、全体撮像手段は、会議者全体が映る画像を撮像し、各特定会議者撮像手段は、それぞれに対応する会議者のみが映る画像を撮像する。ここで、各会議者の画像はそれぞれの会議者の方向と関連付けされて取得される。送信手段は、全体画像、各個別画像、話者音声信号、話者方向データを1グループとして送信する。
これらデータを相手先のテレビ会議装置が受信すると、話者方向データから対応する個別画像を取得することができ、相手先テレビ会議装置で話者音声信号と個別画像とが関連付けされた状態で相手先会議者へ出力される。
また、この発明のテレビ会議装置の送信手段は、話者方向データに対応する個別画像のみを送信することを特徴としている。
この構成では、検出した話者の個別画像のみが送信されるので、通信データ量が低減される。
また、この発明のテレビ会議装置は、複数のスピーカが配列されたスピーカアレイと、相手先の会議者全体を撮像範囲とした全体画像と、各会議者の個別画像とを表示する表示手段と、相手先装置からの全体画像、各個別画像、話者音声信号、および話者方向データを受信する受信手段と、相手先からの話者方向データに基づく特定位置に音源定位を行うように話者音声信号に信号処理を施して前記複数のスピーカに与える放音制御手段と、話者方向データに対応する個別画像データを選択して、全体画像とともに表示手段に与える表示制御手段と、を備えたことを特徴としている。
この構成では、受信手段は、相手先装置からの全体画像、各個別画像、話者音声信号、および話者方向データを受信する。放音制御手段は、話者方向データに基づいて、スピーカアレイの各スピーカに出力する各話者音声信号に遅延制御や振幅制御等の信号処理を加えて、話者方向に対応する音源定位を行う。各スピーカが与えられた音声信号を放音することで、話者方向に対応する仮想音源位置から放音されたように会議者には聞こえる。表示制御手段は、相手先会議者毎の個別画像から、話者方向データに対応する会議者の個別画像を選択して表示手段に与える。表示手段は、相手先会議者全員が映る全体画像を表示するとともに、選択した個別画像を別枠で拡大するなどして表示する。これにより、相手先の会議室の様子や、実際に発言している話者の位置、様子が、視覚的にも聴覚的にも臨場感有る状態で再現される。
また、この発明のテレビ会議装置は、複数のマイクが配列されたマイクアレイと、会議者全体を撮像範囲とした全体画像を生成する全体撮像手段と、各会議者をそれぞれ個別に撮像して各会議者に関連付けされた個別画像を生成する複数の特定会議者撮像手段と、複数のマイクの収音信号に基づいて話者方向を検出して、話者方向データを生成する話者方向検出手段と、検出された話者方向に応じて話者音声信号を生成する話者音声信号生成手段と、全体画像、各個別画像、話者音声信号、および話者方向データを送信する送信手段と、複数のスピーカが配列されたスピーカアレイと、相手先の会議者全体を撮像範囲とした全体画像と、相手先の各会議者の個別画像とを表示する表示手段と、相手先装置からの全体画像、各個別画像、話者音声信号、および話者方向データを受信する受信手段と、相手先からの話者方向データに基づく特定位置に音源定位を行うように相手先からの話者音声信号に信号処理を施して複数のスピーカに与える放音制御手段と、相手先からの話者方向データに対応する個別画像データを選択して、相手先からの全体画像とともに前記表示手段に与える表示制御手段と、を備えたことを特徴としている。
この構成では、前述の話者方向の検出及び話者方向からの収音と、話者方向に対応する音源定位および話者方向への画像の切り替えとをともに行うことができる。
また、この発明のテレビ会議システムは、互いに前述のテレビ会議装置を備えるとともに、これらテレビ会議装置同士をネットワークで接続して、相互に全体画像、各個別画像、話者音声信号、話者方向データを送受信することを特徴としている。
この構成では、互いに前述のテレビ会議装置を備えることで、双方向で臨場感溢れる画像の表示および音声の出力が行われる。
この発明によれば、会議者全体の状況が分かるとともに、話者の切り替わりに追随して画像と再生音源方向とが切り替わるので、視覚的且つ聴覚的に非常に臨場感溢れるテレビ会議を実現することができる。
本発明の実施形態に係るテレビ会議装置およびテレビ会議システムについて図を参照して説明する。
図1は、本実施形態のテレビ会議装置を正面に見て3人の会議者が着席している状態を示す図である。
図2は、遠隔の2地点でテレビ会議を行うテレビ会議システムの概念図である。
図3は、テレビ会議装置101の表示、放音状態を示す概念図である。
図1は、本実施形態のテレビ会議装置を正面に見て3人の会議者が着席している状態を示す図である。
図2は、遠隔の2地点でテレビ会議を行うテレビ会議システムの概念図である。
図3は、テレビ会議装置101の表示、放音状態を示す概念図である。
テレビ会議装置100は、例えば会議室の壁面等に配置されており、正面に複数のマイクMIC1〜MIC12、スピーカSP1〜SP10、カメラCAM1、CAM11〜CAM13、ディスプレイDisp1を備える。テレビ会議装置100の最下段には、スピーカSP1〜SP10が水平に等間隔で配置されており、これらによりスピーカアレイが構成される。スピーカアレイの上段には、マイクMIC1〜MIC12が水平に所定間隔で配置されており、これらによりマイクアレイが構成される。マイクアレイの上段には、各会議者の撮影用であるカメラCAM11〜CAM13が配置されており、カメラCAM11は会議者201を略正面に撮影するように配置され、カメラCAM12は会議者202を略正面に撮影するように配置され、カメラCAM13は会議者203を略正面に撮影するように配置されている。これらカメラCAM11〜CAM13群の上段には、会議室全体を撮影する広角のカメラCAM1が設置されており、カメラCAM1は、会議者201〜203の全員を常時撮影する。カメラCAM1の上方には、液晶ディスプレイ等からなるディスプレイDisp1が配置されており、ネットワークで接続された相手先のテレビ会議装置からの映像を会議者201〜203に向けて表示する。
そして、図2に示すように、遠隔の2地点にある各会議室に同仕様からなるテレビ会議装置100とテレビ会議装置101を配置し、ネットワーク500で接続する。テレビ会議装置100の正面には、会議者201〜203が着席し、テレビ会議装置101の正面には、会議者301〜303が着席する。この場合、具体的な放収音方法、表示方法は後述するが、テレビ会議装置100は、会議者201〜203の発声音を収音して、話者方向を検出するとともに話者の音声を高いS/N比で収音して話者音声信号を取得する。また、テレビ会議装置100は、会議者201〜203の個別の映像と、会議者201〜203を含む全体映像とを撮像する。テレビ会議装置100は、話者音声信号、個別映像、全体映像、話者方向データを、ネットワーク500を介してテレビ会議装置101に送信する。テレビ会議装置101は、テレビ会議装置100からの各データを受信すると、話者方向データから発言中の会議者(図3では会議者203)を特定して、図3に示すように会議者203のズームアップ映像を全面表示するとともに、会議者201〜203を含む全体映像を画面下部の別枠に表示する。また、テレビ会議装置101は、話者方向データに基づいてスピーカアレイの各スピーカから放音される音声を制御することで、会議者203に対応付けされた仮想音源に音源定位を行う。すなわち、各会議者301〜303に対して、会議者203に対応する方向から音が聞こえるように制御する。このように、会議者全体の様子が分かるとともに、話者の表情をアップで見え、且つ話者に応じて異なる方向から発生音が聞こえる。これにより、視覚的且つ聴覚的に非常に臨場感溢れる会議を各会議者に提供することができる。
次に、具体的なテレビ会議装置100の構成および各データ処理の方法を説明する。
図4はテレビ会議装置100の機能ブロック図である。
図4に示すように、テレビ会議装置100は、前述のスピーカSP1〜SP10、マイクMIC1〜MIC12、カメラCAM1,CAM11〜CAM13、表示部Disp1の他に、入出力I/F1、放音制御部2、D/A変換部3、A/D変換部4、話者方向検出部5、収音ビーム生成部6、エコーキャンセル部7、送信音声データ生成部8、画像データ処理部9を備える。
図4はテレビ会議装置100の機能ブロック図である。
図4に示すように、テレビ会議装置100は、前述のスピーカSP1〜SP10、マイクMIC1〜MIC12、カメラCAM1,CAM11〜CAM13、表示部Disp1の他に、入出力I/F1、放音制御部2、D/A変換部3、A/D変換部4、話者方向検出部5、収音ビーム生成部6、エコーキャンセル部7、送信音声データ生成部8、画像データ処理部9を備える。
(1)データ受信〜画像表示・放音の処理
入出力I/F1は、ネットワークに接続し、相手先テレビ会議装置から送信されるネットワーク通信データ形式からなる前述の各データを受信して、話者音声信号S1B、話者方向データD1B、全体映像データP1B、各個別映像データP2nB(例えば、相手先も同様に3台の個別映像用カメラを備える場合には、P21B〜P23B)に変換する。入出力I/F1は、話者音声信号S1Bを、エコーキャンセル回路7を介して放音制御部2に出力し、全体映像データP1B、各個別映像データP2nBを画像データ処理部9に出力する。入出力I/F1は、話者方向データD1Bを放音制御部2と画像データ処理部9とに出力する。
入出力I/F1は、ネットワークに接続し、相手先テレビ会議装置から送信されるネットワーク通信データ形式からなる前述の各データを受信して、話者音声信号S1B、話者方向データD1B、全体映像データP1B、各個別映像データP2nB(例えば、相手先も同様に3台の個別映像用カメラを備える場合には、P21B〜P23B)に変換する。入出力I/F1は、話者音声信号S1Bを、エコーキャンセル回路7を介して放音制御部2に出力し、全体映像データP1B、各個別映像データP2nBを画像データ処理部9に出力する。入出力I/F1は、話者方向データD1Bを放音制御部2と画像データ処理部9とに出力する。
画像データ処理部9は、入力された個別映像データP2nB群から、話者方向データD1Bに対応する個別映像データP2B(図3では会議者203の個別映像)を選択し、表示部Disp1に出力する。これとともに、画像データ処理部9は、全体映像データP1Bを表示部Disp1の所定位置(図3では下部)に表示枠を設けて、この表示枠に全体映像を表示する制御(OSD表示制御等)を行う。これにより、相手先会議室の全体映像を表示するとともに、発言中の話者のズームアップ映像を表示することができる。この結果、自装置側の会議者に、相手先会議室の状況を容易に分からせるとともに、誰が発言中であるのかを明確に分からせることができる。
図5は放音制御部2の構成を示すブロック図である。
放音制御部2は、仮想音源設定部21、デジタルフィルタ(D−FILTER)22A〜22J、ゲインコントールアンプ23A〜23Jを備える。仮想音源設定部21は、話者方向データD1Bに基づいて、図3に示すような仮想音源に音源定位する設定を行う。具体的には、仮想音源設定部21は、スピーカアレイの各スピーカSP1〜SP10とそれぞれ対応するデジタルフィルタ22A〜22Jに、音源定位位置から各スピーカSP1〜SP10までの距離の逆数に応じた遅延量をそれぞれ設定する。また、仮想音源設定部21は、各スピーカSP1〜SP10とそれぞれ対応するゲインコントールアンプ23A〜23Jに、音源定位位置から各スピーカSP1〜SP10までの距離の逆数に応じた音圧減衰ゲインを設定する。
放音制御部2は、仮想音源設定部21、デジタルフィルタ(D−FILTER)22A〜22J、ゲインコントールアンプ23A〜23Jを備える。仮想音源設定部21は、話者方向データD1Bに基づいて、図3に示すような仮想音源に音源定位する設定を行う。具体的には、仮想音源設定部21は、スピーカアレイの各スピーカSP1〜SP10とそれぞれ対応するデジタルフィルタ22A〜22Jに、音源定位位置から各スピーカSP1〜SP10までの距離の逆数に応じた遅延量をそれぞれ設定する。また、仮想音源設定部21は、各スピーカSP1〜SP10とそれぞれ対応するゲインコントールアンプ23A〜23Jに、音源定位位置から各スピーカSP1〜SP10までの距離の逆数に応じた音圧減衰ゲインを設定する。
デジタルフィルタ22A〜22Jにはそれぞれ話者音声信号S1Bが入力される。デジタルフィルタ22A〜22Jは、仮想音源設定部21から与えられた遅延量に応じて、話者音声信号S1Bを遅延させて出力する。ゲインコントールアンプ23A〜23Jは、仮想音源設定部21から与えられた音圧減衰ゲインに応じて、各デジタルフィルタ22A〜22Jから入力された話者音声信号をゲインコントロールして出力する。
D/A変換部3は、各スピーカSP1〜SP10に対応するD/A変換器31、出力アンプ32を備える。D/A変換器31は、遅延、振幅制御された各話者音声信号をデジタル−アナログ変換し、出力アンプ32は所定増幅率で各話者音声信号を増幅して、スピーカSP1〜SP10に出力する。
スピーカアレイの各スピーカSP1〜SP10は、入力された話者音声信号を音声変換して放音する。
スピーカアレイの各スピーカSP1〜SP10は、入力された話者音声信号を音声変換して放音する。
このように、話者音声信号の遅延、振幅制御を行って、アレイ化されたスピーカSP1〜SP10で放音することにより、図3に示すように、会議者301〜303には、相手先の会議者203の位置に対応する仮想音源から音声が聞こえるようにすることができる。
(2)収音・撮像〜データ送信の処理
マイクアレイの各マイクMIC1〜MIC12は、自装置の前に居る会議者(話者)の発声音を収音して電気変換することで収音音声信号を生成する。
A/D変換部4は、各マイクMIC1〜MIC12にそれぞれ対応して収音アンプ41、A/D変換器42を備える。収音アンプ41は、例えばローノイズアンプLNAで構成され、収音音声信号を増幅し、A/D変換器42は、増幅された収音音声信号をアナログ−デジタル変換して、話者方向検出部5と収音ビーム生成部6に出力する。
マイクアレイの各マイクMIC1〜MIC12は、自装置の前に居る会議者(話者)の発声音を収音して電気変換することで収音音声信号を生成する。
A/D変換部4は、各マイクMIC1〜MIC12にそれぞれ対応して収音アンプ41、A/D変換器42を備える。収音アンプ41は、例えばローノイズアンプLNAで構成され、収音音声信号を増幅し、A/D変換器42は、増幅された収音音声信号をアナログ−デジタル変換して、話者方向検出部5と収音ビーム生成部6に出力する。
図6は、話者方向検出部5と収音ビーム生成部6との構成を示すブロック図である。
話者方向検出部5は、検出用ビーム形成部51、バンドパスフィルタBPF52、ビーム方向選択部53を備える。検出用ビーム形成部51は、各マイクMIC1〜MIC12で収音され、前述の各信号処理が行われた収音信号を用いて、テレビ会議装置の正面の水平方向に対して異なる方向に指向性を有する検出用収音ビーム信号MB1〜MB10を形成する。バンドパスフィルタBPF52は、各検出用収音ビーム信号MB1〜MB10を帯域通過処理して出力する。ここで、通過帯域は、人の発声音の周波数帯域のうちの所定周波数帯域が設定される。ビーム方向選択部53は、各検出用収音ビーム信号MB1〜MB10の信号強度比較を行い、最も強い信号強度の収音ビーム信号を選択する。ビーム方向選択部53は、選択した収音ビーム信号に対応する収音方向を取得し、収音方向データD11Aとして送信音声データ生成部8に出力するとともに、取得した収音方向のパラメータを、収音ビーム生成部6の取得用ビーム形成部61に与える。
話者方向検出部5は、検出用ビーム形成部51、バンドパスフィルタBPF52、ビーム方向選択部53を備える。検出用ビーム形成部51は、各マイクMIC1〜MIC12で収音され、前述の各信号処理が行われた収音信号を用いて、テレビ会議装置の正面の水平方向に対して異なる方向に指向性を有する検出用収音ビーム信号MB1〜MB10を形成する。バンドパスフィルタBPF52は、各検出用収音ビーム信号MB1〜MB10を帯域通過処理して出力する。ここで、通過帯域は、人の発声音の周波数帯域のうちの所定周波数帯域が設定される。ビーム方向選択部53は、各検出用収音ビーム信号MB1〜MB10の信号強度比較を行い、最も強い信号強度の収音ビーム信号を選択する。ビーム方向選択部53は、選択した収音ビーム信号に対応する収音方向を取得し、収音方向データD11Aとして送信音声データ生成部8に出力するとともに、取得した収音方向のパラメータを、収音ビーム生成部6の取得用ビーム形成部61に与える。
収音ビーム生成部6は、取得用ビーム形成部61と話者音声信号形成部62とを備える。取得用ビーム形成部61は、ビーム方向選択部53から与えられた収音方向パラメータに対応する領域をさらに細分化するように収音ビーム信号MB101〜104を形成する。話者音声信号形成部62は、収音ビーム信号MB101〜104の信号強度を比較して、信号強度の高い二つの収音ビーム信号を選択する。話者音声信号形成部62は、選択した二つの収音ビーム信号の信号強度比を取得し、信号強度比に応じた合成比で、選択した二つの収音ビーム信号を合成して、送信用の話者音声信号S1Aとして出力する。また、話者音声信号形成部62は、選択した二つの収音ビーム信号に応じた詳細な収音方向を取得して、詳細収音方向データD12Aとして送信音声データ生成部8に出力する。
エコーキャンセル回路7は、適応型フィルタ71、ポストプロセッサ72を備える。適応型フィルタ71は、受信した相手先の話者音声信号S1Bに基づいて擬似回帰音信号を生成してポストプロセッサ72に出力する。ポストプロセッサ72は、送信用の話者音声信号S1Aから擬似回帰音信号を減算して送信音声データ生成部8に出力する。これにより、スピーカから放音された相手先の話者音声信号S1Bがマイクに回り込むことにより、話者音声信号S1Aに含まれる回帰音を除去することができる。
送信音声データ生成部8は、収音方向データD11A、詳細収音方向データD12Aに基づいて話者方向データD1Aを生成する。送信音声データ生成部8は、話者音声信号S1Aと話者方向データD1Aとで送信用話者音声データを生成して入出力I/F1に出力する。
カメラCAM1は、自装置の前に居る全ての会議者が含まれる範囲を撮像して、撮像データを画像データ処理部9に出力する。
カメラCAM11〜CAM13は、それぞれに割り当てられた会議者のみを撮像して、撮像データを画像データ処理部9に出力する。
画像データ処理部9は、カメラCAM1の撮像データで、所定画像データ形式の全体映像データP1Aを生成する。画像データ処理部9は、各カメラCAM11〜CAM13の撮像データで、所定画像データ形式の個別映像データP2nA(P21A〜P23A)を生成するとともに、各個別映像データP2nAに撮像方向データを関連付けする。画像データ処理部9は、全体映像データP1Aと、それぞれに撮像方向データが関連付けされた各個別映像データP2nAとを入出力I/F1に出力する。
入出力I/F1は、話者音声信号S1Aと話者方向データD1Aとを含む送信用話者音声データと、全体映像データP1Aと、それぞれに撮像方向データが関連付けされた各個別映像データP2nAとを、所定のネットワーク通信データ形式に変換し、ネットワークを介して相手先のテレビ会議装置に送信する。
相手先のテレビ会議装置は、これらのデータを受信すると、前述のように画像表示、放音を行う。
以上のように、本実施形態の構成および処理方法を用いることで、相手先の複数人の会議者の様子を見ながら、発言中の話者の映像がクローズアップされて表示されるとともに、当該話者の位置に対応する方向から話者の発言を聴くことができる。これにより、視覚的、聴覚的に、非常に臨場感溢れるテレビ会議を行うことができる。
なお、前述の説明では、各個別画像データを全て送信する構成を示したが、図7に示すような構成のテレビ会議装置を用いて、話者に対応する個別画像データのみを送信するようにしてもよい。
図7は、テレビ会議装置の他の構成を示すブロック図である。図7に示すテレビ会議装置の話者方向検出部5は、取得した収音方向のパラメータを、収音ビーム生成部6に与えるとともに、画像データ処理部9に与える。画像データ処理部9は、与えられた収音方向のパラメータと同じ方向を示す撮像方向データを検出し、当該方向に対応する個別映像データP2Aを選択して出力する。一方、表示画像データ処理部9は、相手先から個別映像データP2Bを受け付けると、表示器Disp1に全面表示させる。その他の構成については図4に示したテレビ会議装置と同じである。
このような構成とすることで、ネットワークで送受信するデータ量が抑圧されて高速なデータ送受信を行うことができ、より快適にテレビ会議を行うことができる。
また、前述の説明では、個別画像を全面表示し、全体画像を別枠表示する例を示したが、図8に示すように、全体画像を全面表示し、個別画像を別枠でクローズアップ表示するようにしてもよい。図8は表示方法の他の一例を示す図である。さらには、全体画像と個別画像とが同時に画面上に表示される形式であれば、その他の表示方法を用いても良い。
また、前述の説明で、個別画像撮像用のカメラ数や、ビームの形成本数は一例であり、所望とする仕様に応じて、これらの数量は適宜設定すればよい。
また、前述の説明では、マイクアレイおよびスピーカアレイの上方にディスプレイDisp1を配置した例を示したが、マイクアレイおよびスピーカアレイの下方にディスプレイDisp1を配置してもよい。
100,101−テレビ会議装置、1−入出力I/F、2−放音制御部、3−D/A変換部、4−A/D変換部、5−話者方向検出部、6−収音ビーム生成部、7−エコーキャンセル部、8−送信音声データ生成部、9−画像データ処理部、SP1〜SP10−スピーカ、MIC1〜MIC12−マイク、CAM1,CAM11〜CAM13−カメラ、Disp1−表示部、201〜203,301〜303−会議者、500−ネットワーク
Claims (5)
- 複数のマイクが配列されたマイクアレイと、
会議者全体を撮像範囲とした全体画像を生成する全体撮像手段と、
各会議者をそれぞれ個別に撮像して各会議者に関連付けされた個別画像を生成する複数の特定会議者撮像手段と、
前記複数のマイクの収音信号に基づいて話者方向を検出して、話者方向データを生成する話者方向検出手段と、
検出された話者方向に応じて話者音声信号を生成する話者音声信号生成手段と、
前記全体画像、各個別画像、話者音声信号、および話者方向データを送信する送信手段と、
を備えたテレビ会議装置。 - 前記送信手段は、前記話者方向データに対応する個別画像のみを送信する請求項1に記載のテレビ会議装置。
- 複数のスピーカが配列されたスピーカアレイと、
相手先の会議者全体を撮像範囲とした全体画像と、各会議者の個別画像とを表示する表示手段と、
相手先装置からの全体画像、各個別画像、話者音声信号、および話者方向データを受信する受信手段と、
前記話者方向データに基づく特定位置に音源定位を行うように前記話者音声信号に信号処理を施して前記複数のスピーカに与える放音制御手段と、
前記話者方向データに対応する個別画像データを、前記全体画像とともに前記表示手段に与える表示制御手段と、
を備えたテレビ会議装置。 - 複数のスピーカが配列されたスピーカアレイと、
相手先の会議者全体を撮像範囲とした全体画像と、相手先の各会議者の個別画像とを表示する表示手段と、
相手先装置からの全体画像、各個別画像、話者音声信号、および話者方向データを受信する受信手段と、
前記相手先からの話者方向データに基づく特定位置に音源定位を行うように前記相手先からの話者音声信号に信号処理を施して前記複数のスピーカに与える放音制御手段と、
前記相手先からの話者方向データに対応する個別画像データを前記相手先からの全体画像とともに前記表示手段に与える表示制御手段と、
を備えた請求項1または請求項2に記載のテレビ会議装置。 - 互いに請求項4に記載のテレビ会議装置を備えるとともに、
これらテレビ会議装置同士をネットワークで接続して、相互に全体画像、各個別画像、話者音声信号、話者方向データを送受信するテレビ会議システム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006098989A JP2007274462A (ja) | 2006-03-31 | 2006-03-31 | テレビ会議装置、テレビ会議システム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006098989A JP2007274462A (ja) | 2006-03-31 | 2006-03-31 | テレビ会議装置、テレビ会議システム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2007274462A true JP2007274462A (ja) | 2007-10-18 |
Family
ID=38676777
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006098989A Pending JP2007274462A (ja) | 2006-03-31 | 2006-03-31 | テレビ会議装置、テレビ会議システム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2007274462A (ja) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010041190A (ja) * | 2008-08-01 | 2010-02-18 | Yamaha Corp | 音響装置及びプログラム |
JP2012049965A (ja) * | 2010-08-30 | 2012-03-08 | Nippon Telegr & Teleph Corp <Ntt> | 音場収音再生装置、方法及びプログラム |
WO2012142975A1 (zh) * | 2011-04-22 | 2012-10-26 | 华为终端有限公司 | 会场终端音频信号处理方法及会场终端和视讯会议系统 |
WO2012169095A1 (ja) * | 2011-06-08 | 2012-12-13 | パナソニック株式会社 | 音声信号処理装置および音声信号処理方法 |
EP2571259A1 (en) | 2011-09-13 | 2013-03-20 | Sony Corporation | Signal processing apparatus, signal processing method, and program |
CN103856740A (zh) * | 2012-12-05 | 2014-06-11 | 联想(北京)有限公司 | 一种信息处理的方法及视频会议系统 |
US9595259B2 (en) | 2014-08-29 | 2017-03-14 | Honda Motor Co., Ltd. | Sound source-separating device and sound source-separating method |
US10425726B2 (en) | 2015-10-26 | 2019-09-24 | Sony Corporation | Signal processing device, signal processing method, and program |
JP2020088516A (ja) * | 2018-11-20 | 2020-06-04 | 株式会社竹中工務店 | テレビ会議システム |
-
2006
- 2006-03-31 JP JP2006098989A patent/JP2007274462A/ja active Pending
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010041190A (ja) * | 2008-08-01 | 2010-02-18 | Yamaha Corp | 音響装置及びプログラム |
JP2012049965A (ja) * | 2010-08-30 | 2012-03-08 | Nippon Telegr & Teleph Corp <Ntt> | 音場収音再生装置、方法及びプログラム |
WO2012142975A1 (zh) * | 2011-04-22 | 2012-10-26 | 华为终端有限公司 | 会场终端音频信号处理方法及会场终端和视讯会议系统 |
WO2012169095A1 (ja) * | 2011-06-08 | 2012-12-13 | パナソニック株式会社 | 音声信号処理装置および音声信号処理方法 |
EP2571259A1 (en) | 2011-09-13 | 2013-03-20 | Sony Corporation | Signal processing apparatus, signal processing method, and program |
CN103856740A (zh) * | 2012-12-05 | 2014-06-11 | 联想(北京)有限公司 | 一种信息处理的方法及视频会议系统 |
US9595259B2 (en) | 2014-08-29 | 2017-03-14 | Honda Motor Co., Ltd. | Sound source-separating device and sound source-separating method |
US10425726B2 (en) | 2015-10-26 | 2019-09-24 | Sony Corporation | Signal processing device, signal processing method, and program |
JP2020088516A (ja) * | 2018-11-20 | 2020-06-04 | 株式会社竹中工務店 | テレビ会議システム |
JP7070910B2 (ja) | 2018-11-20 | 2022-05-18 | 株式会社竹中工務店 | テレビ会議システム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5857674B2 (ja) | 画像処理装置、及び画像処理システム | |
JP2007274462A (ja) | テレビ会議装置、テレビ会議システム | |
JP5028944B2 (ja) | 音声会議装置及び音声会議システム | |
JP2008288785A (ja) | テレビ会議装置 | |
EP2153693B1 (en) | Hearing aid system establishing a conversation group among hearing aids used by different users | |
US10685641B2 (en) | Sound output device, sound output method, and sound output system for sound reverberation | |
EP2293559A2 (en) | Apparatus, system and method for video call | |
JP2008312002A (ja) | テレビ会議装置 | |
JP2007274463A (ja) | 遠隔会議装置 | |
WO2012142975A1 (zh) | 会场终端音频信号处理方法及会场终端和视讯会议系统 | |
JP4411959B2 (ja) | 音声集音・映像撮像装置 | |
JP4892927B2 (ja) | 撮影装置、および通信会議システム | |
JPH09275533A (ja) | 信号処理装置 | |
JP2009049734A (ja) | カメラ付きマイクロフォン、カメラ付きマイクロフォンの制御プログラムおよびテレビ会議システム | |
JP5120020B2 (ja) | 画像付音声通信システム、画像付音声通信方法およびプログラム | |
JPH11234640A (ja) | 通信制御システム | |
JP4708960B2 (ja) | 情報伝達システム及び音声可視化装置 | |
JP2014072835A (ja) | 会議装置 | |
JP6835205B2 (ja) | 撮影収音装置、収音制御システム、撮影収音装置の制御方法、及び収音制御システムの制御方法 | |
JP2006339869A (ja) | 映像信号と音響信号の統合装置 | |
JP6353700B2 (ja) | 遠距離点間双方向コミュニケーションシステムおよび遠距離点間双方向コミュニケーション方法 | |
JP2011055103A (ja) | 集合住宅インターホンシステム | |
JP2009027246A (ja) | テレビ会議装置 | |
JP2011163776A (ja) | 音源モニタリング装置 | |
JP2021176212A (ja) | 仮想的空間接続装置 |