JP5353854B2 - 遠隔会議装置 - Google Patents

遠隔会議装置 Download PDF

Info

Publication number
JP5353854B2
JP5353854B2 JP2010218746A JP2010218746A JP5353854B2 JP 5353854 B2 JP5353854 B2 JP 5353854B2 JP 2010218746 A JP2010218746 A JP 2010218746A JP 2010218746 A JP2010218746 A JP 2010218746A JP 5353854 B2 JP5353854 B2 JP 5353854B2
Authority
JP
Japan
Prior art keywords
microphone
wearer
specified
image
specifying
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2010218746A
Other languages
English (en)
Other versions
JP2012074950A (ja
Inventor
浩志 大野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Brother Industries Ltd
Original Assignee
Brother Industries Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Brother Industries Ltd filed Critical Brother Industries Ltd
Priority to JP2010218746A priority Critical patent/JP5353854B2/ja
Publication of JP2012074950A publication Critical patent/JP2012074950A/ja
Application granted granted Critical
Publication of JP5353854B2 publication Critical patent/JP5353854B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Circuit For Audible Band Transducer (AREA)
  • Telephonic Communication Services (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Description

本発明は、複数の拠点にそれぞれ配設されて、各拠点間でネットワークを介して実行される遠隔会議に用いられる遠隔会議装置に関する。
従来、ユーザの画像や音声を入出力可能な会議端末を各拠点に設置し、各拠点のユーザの画像や音声が会議端末で合成出力される遠隔会議システムが知られている。このような遠隔会議システムにおいて、会議テーブルと会議参加者との距離に応じて、会議テーブルに設けられた複数のマイクロホンを自動的に切り換えるマイクロホン自動切換装置が知られている(例えば、特許文献1参照)。
特開昭57−119595号公報
近年では、会議端末がユーザの音声を取得するためのマイクとして、従来の有線マイクと併せて、無線マイクも使用される場合がある。この場合、例えば無線マイクを身に付けたユーザが有線マイクに近づくと、有線マイクと無線マイクとの両方に同一ユーザの音声が入力されてしまい、他の会議端末で合成出力される音声にエコーのような雑音が含まれるおそれがあった。
本発明は、上述した課題を解決するためになされたものであり、有線マイクと無線マイクとが併用される場合でも、合成出力される音声の品質劣化を抑制することができる遠隔会議装置を提供することを目的とする。
本発明の一態様に係る遠隔会議装置は、ネットワークを介して接続された相手側端末との間で、少なくとも音声を送受信する遠隔会議装置であって、有線で接続された第1マイクから音声を取得する第1音声取得手段と、無線で接続された第2マイクから音声を取得する第2音声取得手段と、遠隔会議に参加する人間の数である人数を特定する人数特定手段と、前記第2マイクとの無線通信によって、前記第2音声取得手段と接続されている前記第2マイクの数であるマイク数を特定するマイク数特定手段と、前記人数特定手段によって特定された前記人数と、前記マイク数特定手段によって特定された前記マイク数とに基づいて、前記第1マイクの集音性能を調整する集音性能調整手段とを備えている。
上記遠隔会議装置では、有線で接続された第1マイクと、無線で接続された第2マイクとを用いて、音声を取得可能である。遠隔会議に参加する人数と、第2マイクとの無線通信によって特定されたマイク数とに基づいて、第1マイクの集音性能が調整される。したがって、遠隔会議装置を使用するユーザの人数と、ユーザが使用可能な無線マイクの数量とに応じて、第1マイクの集音性能を最適化することができる。ひいては、有線の第1マイクと無線の第2マイクとが併用される場合でも、合成出力される音声の品質劣化を抑制できる。
本態様の遠隔会議装置において、前記集音性能調整手段は、前記マイク数特定手段によって特定された前記マイク数が、前記人数特定手段によって特定された前記人数以上である場合、前記第1マイクによる集音を中止させてもよい。これによれば、第2マイクの数量がユーザの人数以上である場合、全てのユーザがそれぞれ第2マイクを使用可能であるため、第1マイクによる集音が中止される。したがって、同一の音声が第1マイクおよび第2マイクで重複して集音されることを抑制できる。ひいては、遠隔会議で出力される音声に、エコーやノイズが生じにくくすることができる。
本態様の遠隔会議装置において、接続されたカメラから画像を取得する画像取得手段と、前記マイク数特定手段によって特定された前記マイク数が前記人数特定手段によって特定された前記人数未満である場合に、前記画像取得手段によって取得された前記画像に基づいて、前記第2マイクが装着されていない前記人間である非装着者を特定する非装着者特定手段と、前記画像取得手段によって取得された前記画像に基づいて、前記非装着者特定手段によって特定された前記非装着者と前記第1マイクとの離間距離を特定する距離特定手段とを備え、前記集音性能調整手段は、前記距離特定手段によって特定された前記離間距離が所定値未満である場合は、前記第1マイクの集音性能を低くしてもよい。
これによれば、第2マイクの数量がユーザの人数未満である場合、第2マイクの非装着者と第1マイクとの離間距離が特定される。この離間距離が所定値未満である場合は、第1マイクの集音性能が低くされる。したがって、第2マイクの装着者が第1マイクから離間した位置に存在する場合、その装着者の音声は第2マイクのみによって集音される。その結果、第2マイクの装着者の音声が、第1マイクおよび第2マイクで重複して集音されにくくすることができる。
本態様の遠隔会議装置において、前記距離特定手段は、前記非装着者特定手段によって特定された前記非装着者が複数である場合、前記第1マイクから最も離間している前記非装着者を基準に前記離間距離を特定してもよい。これによれば、第1マイクから最も離間している非装着者を基準に、第1マイクとの離間距離が特定される。したがって、第2マイクの非装着者が複数存在する場合でも、第1マイクの集音性能を適切に調整することができる。
本態様の遠隔会議装置において、前記距離特定手段は、前記画像取得手段によって取得された前記画像に含まれる前記非装着者の表示サイズに基づいて、前記離間距離を特定してもよい。これによれば、非装着者の離間距離を、遠隔会議装置に接続されているカメラを使用して特定することができる。
本態様の遠隔会議装置において、前記第2マイクの発光態様に基づいて、前記画像取得手段によって取得された前記画像における前記第2マイクの表示位置を検出する位置検出手段と、前記位置検出手段によって検出された前記第2マイクの表示位置と、前記画像取得手段によって取得された前記画像における前記人間の表示位置とに基づいて、前記第2マイクが装着されている前記人間である装着者を特定する装着者特定手段とを備え、前記非装着者特定手段は、前記画像に映し出される前記人間のうちで、前記装着者特定手段によって特定された前記装着者以外を前記非装着者に特定してもよい。
これによれば、画像における第2マイクの表示位置が、第2マイクの発光態様に基づいて特定される。さらに、画像における第2マイクの表示位置と人間の表示位置とに基づいて、第2マイクの装着者が特定され、ひいては第2マイクの非装着者が特定される。したがって、第2マイクの発光態様に基づいて、画像中のいずれの人間に第2マイクが装着されているかを正確に特定することができる。
本態様の遠隔会議装置において、前記人数特定手段は、前記画像取得手段によって取得された前記画像を解析して、前記人数を特定してもよい。この場合、遠隔会議に参加する人数を、遠隔会議装置に接続されているカメラを使用して特定することができる。
テレビ会議システム1の全体構成図である。 テレビ会議端末3の電気的構成を示すブロック図である。 テレビ会議端末3の会議環境を示す平面図である。 図3に示す会議環境を撮影した画像データ100を例示する図である。 マイク調整処理を示すフローチャートである。 他の会議環境を撮影した画像データ100を例示する図である。
本発明を具体化した実施の形態について、図面を参照して説明する。参照する図面は、本発明が採用しうる技術的特徴を説明するために用いられるものであり、単なる説明例である。
図1を参照して、テレビ会議システム1の構成について説明する。テレビ会議システム1では、複数のテレビ会議端末がネットワーク2を介して接続されている。テレビ会議システム1では、複数のテレビ会議端末によってネットワーク2を介して画像および音声が互いに送受信されることで、各テレビ会議端末が設置されている拠点間で公知のテレビ会議が実施される。
図1に示す例では、3台のテレビ会議端末3,4,5がネットワーク2に接続されているが、ネットワーク2に接続されるテレビ会議端末の数量は限定されない。以下の説明では、テレビ会議端末3を中心に説明するが、他のテレビ会議端末4,5についても同様である。また、テレビ会議端末3が設置されている拠点を「自拠点」といい、他のテレビ会議端末4,5が設置されている拠点を「他拠点」という。
図2を参照して、テレビ会議端末3の電気的構成について、図2を参照して説明する。テレビ会議端末3は、ノート型のパーソナルコンピュータ31(以下、PC31という)と、入出力装置34(以下、IO装置34という。)とを備えている。IO装置34は、自拠点に存在するユーザの画像や音声を取得したり、他拠点のユーザの音声を出力したりする。PC31は、ネットワーク2に接続して、他のテレビ会議端末4,5と各種データの通信を行ったり、他拠点のユーザの画像を表示したりする。
PC31の電気的構成の詳細について説明する。PC31は、PC31の制御を司るコントローラとしてのCPU8を備えている。CPU8には、ROM312、RAM313、ハードディスクドライブ314(以下、HDD314という。)、通信インターフェイス315(以下、通信I/F315という。)、入力部316、CD−ROMドライブ317、映像デコーダ320、電源制御部322、およびUSB(Universal Serial Bus)インターフェイス325(以下、USB−I/F325という。)が、各々接続されている。
HDD314には、CPU8にテレビ会議を実行させるプログラムや、テレビ会議に必要なデータが記憶されている。テレビ会議の実行時には、自拠点で取得される音声や画像のデータ、および他拠点から取得された音声や画像のデータも、HDD314も格納される。本実施形態では、テレビ会議を実行させるプログラムや、テレビ会議に必要なデータなどが、あらかじめCD−ROM318に記憶されている。CD−ROMドライブ317は、CD−ROM318からこれらのプログラムやデータ等を読み出して、HDD314にセットアップすることができる。
通信I/F315は、ネットワーク2を介したデータ通信を行うためのインターフェイスである。入力部316は、ユーザが各種の入力指示を行う操作部であり、例えばマウス、キーボード、タッチパネルなどである。映像デコーダ320は、画像データを復号化してディスプレイ319に表示させる。本実施形態では、映像デコーダ320が、ネットワーク2を介して他のテレビ会議端末4,5から受信された画像データを復号して、PC31に外付けされているディスプレイ319に表示する。これによって、自拠点のユーザは、テレビ会議の画像(つまり、他拠点に存在するユーザの画像)を見ることができる。
電源制御部322は、PC31に内蔵された電池(図示外)の電力を、CPU8やその他の各種デバイスに供給して駆動させる。電源制御部322は、ACアダプタ(図示外)と接続されることによって、電池を充電することが可能である。USB−I/F325は、USBケーブル326を介して、後述するIO装置34のUSB−I/F351に接続されている。
IO装置34の電気的構成の詳細について説明する。IO装置34は、IO装置34の制御を司るコントローラとしてのCPU9を備えている。CPU9には、ROM342、RAM343、映像エンコーダ345、音声エンコーダ346、音声デコーダ349、電源制御部353、およびUSB−I/F351が、各々接続されている。映像エンコーダ345は、カメラ344に接続されている。音声エンコーダ346および音声デコーダ349は、それぞれエコーキャンセラ347に接続されている。本実施形態では、CPU9に後述のマイク調整処理(図5参照)を実行させるプログラムが、ROM342に記憶されている。
映像エンコーダ345は、カメラ344によって撮像される画像を符号化して、画像データを作成する。つまり、カメラ344で撮像された自拠点の画像データが、映像エンコーダ345によって作成される。本実施形態では、作成された画像データは、USBケーブル326を介してIO装置34からPC31に転送され、さらにネットワーク2を介して他のテレビ会議端末4,5に送信される。
エコーキャンセラ347は、エコーやハウリングの発生を防止する回路である。エコーキャンセラ347には、スピーカ350、有線マイクインターフェイス358(以下、有線マイクI/F358という。)、および無線マイクインターフェイス368(以下、無線マイクI/F368という。)が、各々接続されている。スピーカ350は、他拠点の音声(例えば、テレビ会議時に他拠点に存在するユーザの音声)を出力する。
有線マイクI/F358は、外付けの有線マイク360と有線接続されている。有線マイク360は、その設置箇所を中心として相対的に広い集音範囲を集音可能である。本実施形態では、有線マイクI/F358は、有線マイク360で集音された自拠点の音声(詳細には、テレビ会議時に自拠点に存在するユーザの音声)を、有線マイク360から有線通信で取得する。さらに、本実施形態の有線マイクI/F358は、CPU9からの指示に応じて、無線マイク370の集音性能を変更することができるが、詳細は後述する。
無線マイクI/F368は、無線通信によって、所定の通信範囲内に存在する無線マイク370に接続されている。無線マイク370は、その設置箇所を中心として相対的に狭い集音範囲を集音可能である。本実施形態では、無線マイクI/F368は、無線マイク370を装着しているユーザの音声を、無線マイク370から無線通信で取得する。さらに、本実施形態の無線マイク370には、外部に向けて発光するLEDが設けられている。
音声エンコーダ346は、有線マイク360で収集された音声と、無線マイクI/F368によって取得された音声(つまり、無線マイク370で収集された音声)とを符号化して、音声データを作成する。本実施形態では、作成された音声データは、USBケーブル326を介してIO装置34からPC31に転送され、さらにネットワーク2を介して他のテレビ会議端末4,5に送信される。
音声デコーダ349は、音声データを復号化してスピーカ350に出力させる。本実施形態では、音声デコーダ349が、ネットワーク2およびUSBケーブル326を介して他のテレビ会議端末4,5から受信された音声データを復号して、スピーカ350から音声として出力させる。これによって、自拠点のユーザは、テレビ会議の音声(つまり、他拠点に存在するユーザの音声)を聞くことができる。
電源制御部353は、接続されているACアダプタ(図示外)の電力を、CPU9やその他の各種デバイスに供給して駆動させる。USB−I/F351は、USBケーブル326を介して、PC31のUSB−I/F325に接続されている。
図3および図4を参照して、テレビ会議システム1における各拠点の会議環境の一例について説明する。図3および図4に示す会議環境では、テレビ会議端末3が設置されている自拠点で、5人のユーザがテレビ会議に参加している。より具体的には、会議テーブルTの前端側(図3では下側)に、テレビ会議端末3が設置されている。テレビ会議端末3よりも後方側(図3では上側)に、5人のユーザが会議テーブルTを囲んで着席している。
図3に示すように、5人のユーザのうち、テレビ会議端末3から最も離間した位置に存在するユーザAは、テレビ会議端末3と正対する会議テーブルTの後端側に席っている。ユーザAの前側には、ユーザBとユーザCとが会議テーブルTを挟んで向かい合って座っている。さらに、ユーザBの前側にはユーザDが座っており、ユーザCの前側にはユーザEが座っている。ユーザDとユーザEは、会議テーブルTを挟んで向かい合っており、5人のユーザのうちでテレビ会議端末3から最も近接した位置に存在している。
テレビ会議端末3のIO装置34は、自拠点全体の画像及び音声をバランスよく取得するために、会議テーブルTの前端側の中央部に設置されている。そして、カメラ344および有線マイク360が、それぞれ会議テーブルTの後方側に向けられている。また、テレビ会議端末3のPC31は、IO装置34の背後に設置された大型のディスプレイ319に接続されている。ディスプレイ319も、カメラ344および有線マイク360と同様に、会議テーブルTの後方側に向けられている。
このような会議環境のもと、テレビ会議の実行時には、他拠点の画像がディスプレイ319に表示され、かつ他拠点の音声がスピーカ350から出力される。そのため、自拠点のユーザA〜Eが会議テーブルTの前端側を向いた状態で、テレビ会議が進行する。このとき、ユーザA〜Eの表情が、カメラ344の正面側から撮影されて、他拠点で表示される。
また、有線マイク360には、自拠点でテレビ会議に参加する全ユーザを含む集音範囲(例えば、前方側の10メートル)内の音声を集音することを想定して、あらかじめノーマルの集音性能が標準設定してある。有線マイク360の集音性能は、少なくとも有線マイク360の集音範囲を規定する各種要素を含み、この集音性能が高いほど集音範囲が広くなる。集音範囲を規定する各種要素としては、有線マイク360の入力感度、ダイナミックレンジ、周波数特性、指向特性などが例示される。
したがって、有線マイク360にノーマルの集音性能が設定されている状態では、有線マイク360の前方側10メートルの範囲内に存在するユーザA〜Eの声が集音されて、他拠点で出力される。これにより、相手方の拠点に存在するユーザの画像および音声を確実に認識できるため、自拠点および他拠点の間でテレビ会議がスムーズに進行する。ただし、本実施形態では、有線マイク360の集音性能が変更されると、後述するように有線マイク360の集音範囲も変更される。
さらに、5人のユーザのうち、ユーザAおよびユーザBは、それぞれ小型・軽量の無線マイク370(例えば、ピンマイク型の無線マイク)を装着している。つまり、ユーザA,Bの音声は、有線マイク360で集音できない場合でも、無線マイク370で集音可能である。その結果、ユーザAおよびユーザBの音声は、他のユーザよりも確実に集音されて他拠点に出力される。
図3に示す自拠点の会議環境では、カメラ344によって図4に示す画像データ100が取得されて、他拠点で表示される。画像データ100では、5人のユーザA〜Eが撮影されており、カメラ344からの離間距離に応じて表示サイズが異なる。例えば、カメラ344から最も遠いユーザAは相対的に小さく表示され、カメラ344から最も近いユーザD,Eは相対的に大きく表示される。さらに、画像データ100では、ユーザA,Bに装着された2つの無線マイク370も映し出されている。特に、無線マイク370に設けられたLED(図示外)によって、無線マイク370の装着位置を容易に認識できるようになっている。
図5を参照して、テレビ会議端末3で実行されるマイク調整処理について説明する。本処理は、テレビ会議システム1でテレビ会議が実行されている間、ROM342に記憶されているプログラムに基づいてCPU9によって実行される。なお、本処理の開始時には、有線マイク360にノーマルの集音性能が設定されている。
図5に示すマイク調整処理では、まずカメラ344から自拠点を撮影した画像が取得される(S1)。ステップS1で取得された画像について公知の画像認識が実行され、画像中に含まれる人間の数(人数)が特定される(S3)。無線マイクI/F368を介した無線通信によって、通信範囲内にある無線マイク370の数(マイク数)が特定される(S5)。例えば、無線マイク370との間で実行される無線通信のプロトコルによって、無線マイク370から返信されたマイクIDの数量を割り出せばよい。ステップS5で特定されたマイク数が、ステップS3で特定された人数未満である否かが判断される(S7)。
マイク数が人数以上である場合(S7:NO)、自拠点に存在する全てのユーザが無線マイク370を着用していると推定することができる。この場合、有線マイク360で集音される音声と、無線マイク370で集音される音声とが重複して、エコーやノイズを生じやすい状態になりやすい。そのため、有線マイク360の集音性能がオフに設定される(S9)。例えば、有線マイク360で集音されなくするために、有線マイク360を電源OFFにする。これにより、自拠点に存在するユーザの音声は、各ユーザが着用している無線マイク370のみで集音されるため、他拠点のユーザがテレビ会議の音声を聞き取りやすくなる。ステップS9の実行後、処理はステップS1に戻る。
一方、マイク数が人数未満である場合(S7:YES)、ステップS1で取得された画像について公知の画像認識が実行され、画像中に含まれる無線マイク370が検出される(S11)。例えば、画像中における無線マイク370の表示位置が、無線マイク370が備えるLED(図示外)の発光パターンによって特定される。そして、全ての無線マイク370が検出されたか否かが判断される(S13)。具体的には、ステップS5で特定されたマイク数と同数の無線マイク370が画像中から検出された場合、全ての無線マイク370が検出されたと判断される(S13:YES)。
この場合、無線マイク370の装着者が特定される(S15)。例えば、ステップS1で取得された画像中で、ステップS11で検出された無線マイク370と表示位置が重複する人物が、無線マイク370の装着者として特定される。そして、ステップS11で検出された無線マイク370の全てについて、それぞれの装着者が特定されたか否かが判断される(S17)。全ての無線マイク370について装着者が特定された場合(S17:YES)、無線マイク370の非装着者が特定される(S19)。具体的には、ステップS1で取得された画像中に含まれる人物のうちで、ステップS15で特定された装着者を除く人物が、無線マイク370の非装着者として特定される。
ステップS19で特定された非装着者のうち、有線マイク360から最も遠くに位置する非装着者までの離間距離が特定される(S21)。例えば、ステップS1で取得された画像中に含まれる非装着者のうちで、最も小さく表示されている非装着者までの離間距離が、公知の画像処理に基づく測距法で特定される。なお、ステップS19で特定された非装着者が一人の場合には、その非装着者までの離間距離が特定される。
ステップS21で特定された離間距離が、所定値未満であるか否かが判断される(S23)。例えば、ステップS21で特定された離間距離が5メートル以内である場合は、所定値未満であると判断される(S23:YES)。この場合、最も遠くに位置する非装着者が有線マイク360から近い位置に存在しているため、有線マイク360の集音性能を低くしても全てのユーザの音声を確実に集音可能である。よって、有線マイク360の集音性能がダウンに設定される(S25)。例えば、有線マイク360の集音範囲が狭くなるように、有線マイク360の入力感度が低く設定される。これにより、有線マイク360から離間した位置に存在する装着者の音声は、無線マイク370のみによって集音されるため、装着者の音声が重複して集音されにくくすることができる。
一方、全ての無線マイク370が検出されなかった場合(S13:NO)、および全ての無線マイク370について装着者が特定されなかった場合(S17:NO)、いずれも有線マイク360の集音性能がノーマルに設定される(S27)。つまり、有線マイク360の集音性能がノーマルに設定されている場合には、その集音性能がノーマルのまま維持される。一方、有線マイク360の集音性能がオフまたはダウンに設定されている場合には、その集音性能がノーマルにリセットされる。
また、離間距離が所定値以上である場合は(S23:NO)、最も遠くに位置する非装着者が有線マイク360から遠い位置にいるため、有線マイク360の集音性能が低くすると、その非装着者の音声を集音できないおそれがある。この場合も、有線マイク360の集音性能がノーマルに設定される(S27)。ステップS27の実行後、処理がステップS1に戻る。そして、ステップS1にて所定間隔で画像が取得されるごとに、上記処理が繰り返される。
例えば、図3に示す自拠点の会議環境では、以下のように有線マイク360の集音性能が調整される。すなわち、カメラ344によって、図4に示す画像データ100が取得される(S1)。画像データ100の画像認識で人数「5」が特定され、無線マイク370との無線通信でマイク数「2」が特定される(S3、S5)。マイク数は人数よりも少ないから、画像データ100に基づいて2つの無線マイク370の表示位置が検出され、各無線マイク370の装着者としてユーザA,Bが特定される(S7:YES、S11、S13:YES、S15)。また、無線マイク370の非装着者として、ユーザC,D,Eが特定される(S17:YES、S19)。
ユーザC,D,Eのうち、有線マイク360から最も遠くに位置するユーザCまでの離間距離が、画像データ100に映し出されたユーザCの表示サイズに基づいて特定される(S21)。例えば、ユーザCの離間距離が4メートルに特定されたものとする。この場合、ユーザCの離間距離は所定値(例えば、5メートル)未満であるから、有線マイク360の集音性能がダウンに設定される(S23:YES、S25)。その結果、有線マイク360から近い位置に存在するユーザB〜Dの音声は、有線マイク360で集音される。一方、有線マイク360から遠い位置に存在するユーザAの音声は、無線マイク370によって集音される。よって、少なくともユーザAの音声については重複して集音されることが抑制され、テレビ会議の音声品質が向上する。
一方、図6に示す自拠点の会議環境は、図3に示す会議環境と同様であるが、無線マイク370がユーザB,Eに着用されている点が異なる。この場合、無線マイク370の装着者としてユーザB,Eが特定され、無線マイク370の非装着者としてユーザA,C,Dが特定される(S7〜S19)。ユーザA,C,Dのうち、有線マイク360から最も遠くに位置するユーザAまでの離間距離が、画像データ100に映し出されたユーザAの表示サイズに基づいて特定される(S21)。例えば、ユーザAの離間距離が7メートルに特定されたものとする。この場合、ユーザAの離間距離は所定値以上であるから、有線マイク360の集音性能はノーマルに設定される(S23:NO)。その結果、全てのユーザA〜Eの音声は有線マイク360で集音されるため、有線マイク360から遠い位置に存在するユーザAの音声も確実に集音できる。
上記の例では、無線マイク370の非装着者が複数検出された場合には、有線マイク360から最も離間している非装着者を基準に離間距離が特定されるので、有線マイク360の集音性能が適切に調整することができる。また、テレビ会議端末3が備えるカメラ344を使用して、画像に含まれる非装着者の表示サイズに基づいて離間距離を特定できる。さらに、無線マイク370の発光態様に基づいて、画像中のいずれのユーザに無線マイク370が装着されているかを正確に特定することができる。
以上説明したように、本実施形態のテレビ会議端末3によれば、有線マイク360と無線マイク370とを用いて、自拠点に存在するユーザの音声を取得可能である。カメラ344から取得された画像に基づいて特定されたユーザの人数と、無線マイク370との無線通信によって特定されたマイク数とに基づいて、有線マイク360の集音性能が調整される。したがって、テレビ会議端末3を使用するユーザの人数と、ユーザが使用可能な無線マイク370の数量とに応じて、有線マイク360の集音性能を最適化することができる。ひいては、有線マイク360と無線マイク370とが併用される場合でも、合成出力される音声の品質劣化を抑制できる。
上記実施形態において、テレビ会議端末3、4、5が、本発明の「遠隔会議装置」にそれぞれ相当する。有線マイク360が本発明の「第1マイク」に相当し、有線マイクI/F358が本発明の「第1音声取得手段」に相当する。無線マイク370が本発明の「第2マイク」に相当し、無線マイクI/F368が本発明の「第2音声取得手段」に相当する。ステップS1を実行するCPU9が、本発明の「画像取得手段」に相当する。ステップS3を実行するCPU9が、本発明の「人数特定手段」に相当する。ステップS5を実行するCPU9が、本発明の「マイク数特定手段」に相当する。ステップS9、S25を実行するCPU9が、本発明の「集音性能調整手段」にそれぞれ相当する。
さらに、ステップS19を実行するCPU9が、本発明の「非装着者特定手段」に相当する。ステップS21を実行するCPU9が、本発明の「距離特定手段」に相当する。ステップS11を実行するCPU9が、本発明の「位置検出手段」に相当する。ステップS15を実行するCPU9が、本発明の「装着者特定手段」に相当する。
なお、本発明は上記実施形態に限定されるものではなく、発明の要旨を変更しない範囲での変更が可能である。例えば、有線マイク360の集音性能は、さまざまな手法で調整することができる。具体的には、ステップS9において、有線マイク360の集音性能をオフにするために、有線マイク360を電源OFFするのに代えて、有線マイク360の入力感度をゼロに変更してもよい。また、ステップS25において、有線マイク360の集音性能をダウンにするために、有線マイク360の入力感度を低くするのに代えて、有線マイク360のダイナミックレンジを低くしてもよい。
また、上記実施形態では、最も遠くに位置する非装着者の離間距離が所定値以上である場合(S23:NO)、有線マイク360の集音性能がノーマルに設定されているが(S27)、これに代えて有線マイク360の集音性能をアップに設定されてもよい。例えば、有線マイク360の集音範囲が広くなるように、有線マイク360の入力感度が高く設定される等である。これにより、有線マイク360から離間した位置に存在する非装着者の音声を、有線マイク360で確実に集音することができる。
また、上記実施形態では、遠隔会議に参加する人数が画像認識によって特定されているが(S3)、他の手法で人数が特定されてもよい。例えば、遠隔会議に参加する人数を、ユーザが入力部316を用いて入力してもよいし、テレビ会議端末3に予め登録されている会議予定表から特定してもよい。また、遠隔会議に参加するユーザが無線タグを携行している場合、テレビ会議端末3がRFIDで無線タグを検出して人数を特定してもよい。
1 テレビ会議システム
2 ネットワーク
3 テレビ会議端末
4 テレビ会議端末
5 テレビ会議端末
9 CPU
31 パーソナルコンピュータ
34 入出力装置
100 画像データ
319 ディスプレイ
344 カメラ
358 有線マイクインターフェイス
360 有線マイク
368 無線マイクインターフェイス
370 無線マイク

Claims (7)

  1. ネットワークを介して接続された相手側端末との間で、少なくとも音声を送受信する遠隔会議装置であって、
    有線で接続された第1マイクから音声を取得する第1音声取得手段と、
    無線で接続された第2マイクから音声を取得する第2音声取得手段と、
    遠隔会議に参加する人間の数である人数を特定する人数特定手段と、
    前記第2マイクとの無線通信によって、前記第2音声取得手段と接続されている前記第2マイクの数であるマイク数を特定するマイク数特定手段と、
    前記人数特定手段によって特定された前記人数と、前記マイク数特定手段によって特定された前記マイク数とに基づいて、前記第1マイクの集音性能を調整する集音性能調整手段と
    を備えたことを特徴とする遠隔会議装置。
  2. 前記集音性能調整手段は、前記マイク数特定手段によって特定された前記マイク数が、前記人数特定手段によって特定された前記人数以上である場合、前記第1マイクによる集音を中止させることを特徴とする請求項1に記載の遠隔会議装置。
  3. 接続されたカメラから画像を取得する画像取得手段と、
    前記マイク数特定手段によって特定された前記マイク数が前記人数特定手段によって特定された前記人数未満である場合に、前記画像取得手段によって取得された前記画像に基づいて、前記第2マイクが装着されていない前記人間である非装着者を特定する非装着者特定手段と、
    前記画像取得手段によって取得された前記画像に基づいて、前記非装着者特定手段によって特定された前記非装着者と前記第1マイクとの離間距離を特定する距離特定手段とを備え、
    前記集音性能調整手段は、前記距離特定手段によって特定された前記離間距離が所定値未満である場合は、前記第1マイクの集音性能を低くすることを特徴とする請求項1または2に記載の遠隔会議装置。
  4. 前記距離特定手段は、前記非装着者特定手段によって特定された前記非装着者が複数である場合、前記第1マイクから最も離間している前記非装着者を基準に前記離間距離を特定することを特徴とする請求項3に記載の遠隔会議装置。
  5. 前記距離特定手段は、前記画像取得手段によって取得された前記画像に含まれる前記非装着者の表示サイズに基づいて、前記離間距離を特定することを特徴とする請求項3または4に記載の遠隔会議装置。
  6. 前記第2マイクの発光態様に基づいて、前記画像取得手段によって取得された前記画像における前記第2マイクの表示位置を検出する位置検出手段と、
    前記位置検出手段によって検出された前記第2マイクの表示位置と、前記画像取得手段によって取得された前記画像における前記人間の表示位置とに基づいて、前記第2マイクが装着されている前記人間である装着者を特定する装着者特定手段とを備え、
    前記非装着者特定手段は、前記画像に映し出される前記人間のうちで、前記装着者特定手段によって特定された前記装着者以外を前記非装着者に特定することを特徴とする請求項3〜5のいずれかに記載の遠隔会議装置。
  7. 前記人数特定手段は、前記画像取得手段によって取得された前記画像を解析して、前記人数を特定することを特徴とする請求項3〜6のいずれかに記載の遠隔会議装置。
JP2010218746A 2010-09-29 2010-09-29 遠隔会議装置 Expired - Fee Related JP5353854B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010218746A JP5353854B2 (ja) 2010-09-29 2010-09-29 遠隔会議装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010218746A JP5353854B2 (ja) 2010-09-29 2010-09-29 遠隔会議装置

Publications (2)

Publication Number Publication Date
JP2012074950A JP2012074950A (ja) 2012-04-12
JP5353854B2 true JP5353854B2 (ja) 2013-11-27

Family

ID=46170697

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010218746A Expired - Fee Related JP5353854B2 (ja) 2010-09-29 2010-09-29 遠隔会議装置

Country Status (1)

Country Link
JP (1) JP5353854B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014165887A (ja) * 2013-02-27 2014-09-08 Saxa Inc 会議端末、およびプログラム
JP2019175159A (ja) * 2018-03-28 2019-10-10 カシオ計算機株式会社 電子機器、音声入力感度制御方法、及び音声入力感度制御プログラム

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08256316A (ja) * 1995-03-17 1996-10-01 Toshiba Corp 通信会議システム
JP2006054567A (ja) * 2004-08-10 2006-02-23 Sony Corp ビデオカメラ装置
JP2009156888A (ja) * 2007-12-25 2009-07-16 Sanyo Electric Co Ltd 音声補正装置及びそれを備えた撮像装置並びに音声補正方法
JP2009272812A (ja) * 2008-05-02 2009-11-19 Yamaha Corp マイクシステム
JP5409656B2 (ja) * 2009-01-22 2014-02-05 パナソニック株式会社 補聴装置
JP2010206365A (ja) * 2009-03-02 2010-09-16 Brother Ind Ltd 対話装置

Also Published As

Publication number Publication date
JP2012074950A (ja) 2012-04-12

Similar Documents

Publication Publication Date Title
US9860486B2 (en) Communication apparatus, communication method, and communication system
JP6760267B2 (ja) 情報処理装置、制御方法、およびプログラム
US8581700B2 (en) Wearable device
KR101176732B1 (ko) 이동장치 상의 음성 향상 복합 센서에 대한 방법 및 장치
US8451315B2 (en) System and method for distributed meeting capture
CN106463108A (zh) 提供与干扰的隔离
JP2016213674A (ja) 表示制御システム、表示制御装置、表示制御方法、及びプログラム
JP5556719B2 (ja) 遠隔会議装置
CN105874517B (zh) 提供更加安静的开放空间工作环境的服务器
JP5353854B2 (ja) 遠隔会議装置
JP6290827B2 (ja) オーディオ信号を処理する方法及び補聴器システム
JP4501037B2 (ja) 通信制御システムと通信装置および通信方法
JP5515728B2 (ja) 端末装置、処理方法および処理プログラム
US20120013750A1 (en) Sound Optimization Via Camera
JP2022054192A (ja) リモート会議システム、サーバ、写真撮影装置、音声出力方法、及びプログラム
US11553158B2 (en) Information processing apparatus, information processing method, and program
JP2011066467A (ja) テレビ会議端末装置、テレビ会議端末装置の音声制御方法、音声制御プログラム
JP5598394B2 (ja) 会議端末装置、会議端末制御方法、及び会議端末制御プログラム、
WO2018173139A1 (ja) 撮影収音装置、収音制御システム、撮影収音装置の制御方法、及び収音制御システムの制御方法
JP6569853B2 (ja) 指向性制御システム及び音声出力制御方法
JP2017163466A (ja) 情報処理装置および会議システム
JP2004023180A (ja) 音声伝送装置、音声伝送方法及びプログラム
JP6680031B2 (ja) 会議用装置、送信方法、およびコンピュータプログラム
JP2003244669A (ja) 視線検出機能を有するテレビ会議システム
JPS62209985A (ja) テレビ会議装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120914

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130718

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130730

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130812

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees