JP4255461B2 - 電話会議用のステレオ・マイクロフォン処理 - Google Patents

電話会議用のステレオ・マイクロフォン処理 Download PDF

Info

Publication number
JP4255461B2
JP4255461B2 JP2005189507A JP2005189507A JP4255461B2 JP 4255461 B2 JP4255461 B2 JP 4255461B2 JP 2005189507 A JP2005189507 A JP 2005189507A JP 2005189507 A JP2005189507 A JP 2005189507A JP 4255461 B2 JP4255461 B2 JP 4255461B2
Authority
JP
Japan
Prior art keywords
microphone
signal
audio
channel
microphones
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2005189507A
Other languages
English (en)
Other versions
JP2006020314A (ja
Inventor
ケイ トリュオン クワン
チュー ピーター
エイ パチーノ マイケル
Original Assignee
ポリコム・インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ポリコム・インコーポレイテッド filed Critical ポリコム・インコーポレイテッド
Publication of JP2006020314A publication Critical patent/JP2006020314A/ja
Application granted granted Critical
Publication of JP4255461B2 publication Critical patent/JP4255461B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/56Arrangements for connecting several subscribers to a common circuit, i.e. affording conference facilities
    • H04M3/568Arrangements for connecting several subscribers to a common circuit, i.e. affording conference facilities audio processing specific to telephonic conferencing, e.g. spatial distribution, mixing of participants
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/14Systems for two-way working
    • H04N7/141Systems for two-way working between two video terminals, e.g. videophone
    • H04N7/142Constructional details of the terminal equipment, e.g. arrangements of the camera and the display
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R27/00Public address systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/005Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/56Arrangements for connecting several subscribers to a common circuit, i.e. affording conference facilities

Description

本発明は、一般的に、電話会議に関し、特に、電話会議におけるオーディオの構成部分に関する。
電話会議は、事業組織、政府機関及び教育機関における通信にとって、長年にわたって重要なツールとなっている。電話会議の機器には多くの種類のものが存在する。1つの種類の電話会議装置は、リアルタイム画像や生の会話を伝送するビデオ会議装置である。ビデオ会議装置は通常、ビデオ処理構成部分及びオーディオ処理構成部分を備える。ビデオ処理構成部分は、会議の参加者のリアルタイム画像を捕らえるカメラと、会議の参加者のリアルタイム画像又は文書の静止画像を近端若しくは遠端から示すビデオ・ディスプレイとを含み得る。ビデオ会議装置のオーディオ部分は通常、会議の参加者の音声信号を捕らえる1つ又は複数のマイクロフォンと、遠端での参加者の音声を再生する拡声器とを含む。場合によっては、より一般的にスピーカフォンとして知られているオーディオ会議装置が代わりに用いられている。スピーカフォンは、2つ以上の場所での人々の間の会話のみを伝送する。
多くの人々が会議場所での電話会議に参加する場合、単一のマイクロフォンの会議装置は多くの課題を有する。マイクロフォンの近くに座っている人々の音声は強い信号をもたらし得る一方、マイクロフォンから遠く離れた場所に座っている人々の音声は弱い信号をもたらし得る。システムの利得は通常、強い信号がシステムを飽和させないように、又はシステムを不安定な状態にさせないように制限される。この利得の制限が理由で、マイクロフォンから遠く離れた場所に座っている人々の音声は、理解できるには弱すぎる場合がある。
会議室の周りに配置される複数のマイクロフォンを用いてこの課題を軽減し得る。複数のマイクロフォンが会議室の周りに配置される場合、どの話者にも話者の音声を捕らえることができるほど十分に近いものが1つ存在することになる。全てのマイクロフォンからの信号はミキシングしてオーディオ信号を生成することになり、オーディオ信号は処理されて、会議の遠端に伝送される。このようにして、全ての話者の音声は同様な強さを有する。しかし、全てのマイクロフォン信号をミキシングすることはなお、それ自体の課題を有する。全ての話者が全て同時に話している訳ではない。マイクロフォンの近くで話している人が誰もいない場合、そのマイクロフォンからの信号は実質的に雑音である。全てのマイクロフォンからの信号が全て一緒にミキシングされる場合、多数の雑音信号が1つ又は少数の音声信号とミキシングされ、信号対雑音比(SNR)を削減する。全ての参加者の音声を会議の遠端にいる関係者に理解させることが可能な会議装置を有することが望ましい。
SNRを向上させるよう、マイクロフォン・ゲーティング又は動的ミキシングが一部の先行技術の電話会議装置によって用いられている。マイクロフォン・ゲーティングが複数のマイクロフォンを備えている電話会議装置に適用される場合、十分強い信号を備えているマイクロフォンのみが「ゲーティング」される、すなわち、他のマイクロフォン信号とミキシングされてオーディオ信号を形成する。マイクロフォンにおける信号が強いことは、信号が、背景雑音のみならず、話者からのものであるということを示す。マイクロフォンにおける信号が弱い場合、そのことは話者が近くにいないということを示す場合があり、信号が主に背景雑音からのものであるということを示す場合がある。これらのマイクロフォンは閉じた状態にある、すなわちそれらの信号は他の「ゲーティング」されたマイクロフォン信号とミキシングされることから排除される。マイクロフォンのゲーティング手法はSNRを向上させるが、依然として、人間の耳が分かることが可能な非常に現実的な音響を備えるものでない。
ステレオ・オーディオ・システムとマルチチャンネル・オーディオ・システムは、より現実的な音響を再生することが可能である。ステレオの音響は、種々の音源間の空間的な関係を再生する。この空間的な関係によって、音声を種々の人々から区別し、よりよく分かるようにすることを容易にすることが可能である。ステレオ音をビデオ会議装置とオーディオ会議装置との何れかの電話会議装置に含めることが望ましい。
電話会議機能を向上させることが可能な方法及び装置を有することが望ましい。
本発明の一実施例によれば、複数のマイクロフォンを備えている電話会議装置では、複数のオーディオ・チャンネルが会議場所間で維持され、交換される。オーディオ・チャンネル毎の最善の信号レベルを備えているマイクロフォンが選択される(ゲーティングされる)一方、全ての別のマイクロフォンは、最善の信号対雑音比が達成されるように無視される(閉じた状態にされる)。
一実施例によれば、最善のマイクロフォンは帯域制限解析を用いて選択し得る。複数のマイクロフォンからの一時間間隔についての各信号は、多くの部分帯域に分割される。部分帯域毎に、最も強い信号が選択され、一投票が、この部分集合の元のマイクロフォンに与えられる。全ての部分帯域についてのマイクロフォン毎の投票が集約される。最も多くの投票を有するマイクロフォンがその時間間隔について選択される。代替策では、投票数が閾値を超える場合にのみ、マイクロフォンがその時間間隔について選択される。十分に大きな投票数を有するマイクロフォンが何らない場合、最後の時間間隔について選択されたマイクロフォンが選択される。別の代替策では、最も多くの投票を備えている1つのマイクロフォンのみを選択するよりも、いくつかのマイクロフォンを選択し得る。これらのマイクロフォンは、最小の投票閾値を超える投票を各々が有する場合に選択される。別の代替策では、ゲーティングされた状態(利得=1)と閉じた状態(利得=0)との間の中間利得が用いられる。
別の実施例によれば、1つのマイクロフォンからの信号を、2つ以上のオーディオ・チャンネルに用い得る、すなわちオーディオ・パニングに用い得る。1つのオーディオ・チャンネルに対するマイクロフォン信号の一部分を、マイクロフォンの相対位置に応じてミキシングする場合がある。同様に、いくつかのマイクロフォンからの信号をミキシングして1つのオーディオ・チャンネル信号を形成し得る。ミキシングの量はマイクロフォンの相対位置によって変わってくる。
好適実施例の以下の詳細説明を添付図面に関して検討する場合に本発明がよりよく分かり得る。
本発明による方法及び装置は電話会議装置におけるオーディオ・システムを改良させることになる。電話会議装置は、ビデオ・システムとオーディオ・システムとの両方を含むビデオ会議装置又は、オーディオ会議装置、すなわちオーディオ・システムのみを有するスピーカフォンであり得る。
図1は、会議室におけるビデオ会議の通常の配置を示す。ビデオ会議機器は、ビデオ表示画面101、ビデオ表示画面101上のビデオ・カメラ105、拡声器102及び104、並びに会議テーブル119の前にあるマイクロフォン112、114、116、111、113及び115を含む。マイクロフォン112、114及び116は右マイクロフォン110として一緒にグループ化される一方、マイクロフォン111、113及び115は左マイクロフォン120としてグループ化される。単純にするよう、図1に示す部分はこれらのみである。これらの部分は、中央モジュールに全て接続されている。中央モジュールは、全ての信号処理回路、制御回路、ネットワーク・インタフェース等を含む。図5は、中央モジュールをもう少し詳細に示した、ビデオ会議装置を示す構成図である。会議の参加者121、122及び123は、会議テーブル119の前に座っている。この配置では、この場所での会議参加者の前に6つのマイクロフォンがある。
図2は、より大きな会議室の別の配置を示す。ビデオ表示画面201及びスイバル・ビデオ・カメラ241が会議室の前にある。拡声器が会議室の周りに配置されている。そのうちの2つ、202及び204を示す。又、マイクロフォン212、214、216、218、222、224、226、211、213、215、217、221、223及び225を含む多くのマイクロフォンが会議室に散在している。図1に示す配置と同様に、マイクロフォンは、右マイクロフォン群及び左マイクロフォン群に分割される。各マイクロフォン群は1つのオーディオ・チャンネルに用いられる。会議の参加者は、会議室において、マイクロフォンとともに配置されている場合がある。それらのうちの3つ、231、233及び235を示す。
図5は、図1及び図2の配置において用い得るビデオ会議装置500の構成図を示す。ビデオ会議装置500は、内部の拡声器422及び424、内部のマイクロフォン432及び434、設置されたカメラ412に対する接続並びに設置された表示画面410に対する接続を有する中央モジュール440を有する。中央モジュール440は追加のビデオ構成部分用及びオーディオ構成部分用の多くのインタフェース、すなわち、ビデオ入力インタフェース441、ビデオ出力インタフェース442、オーディオ入力インタフェース445及びオーディオ出力インタフェース446を有する。各インタフェースは、複数のオーディオ・チャンネル又はビデオ・チャンネルに対する接続を有する。例えば、ビデオ入力インタフェース441は、2つの追加のビデオ・カメラからのビデオ信号を受け入れることが可能である。ビデオ出力インタフェース442は2つのビデオ・チャンネル、4つのモニタまでを出力し得る。オーディオ入力インタフェース445は、4つまでのオーディオ・チャンネルにグループ化することが可能な12のマイクロフォンまでを受け入れ得る。オーディオ出力インタフェース446は、更に5つのオーディオ・チャンネルを出力し得る。信号処理及び制御は、中間部451、452、453及び454を介して種々のオーディオ/ビデオの構成部分又はインタフェースに結合される処理装置450によって行われる。これらの中間部は、DACやADCなどの信号変換を行う。これらは別個のブロックとして示しているが、単一モジュール又は集積チップに集積することが可能である。処理装置450は、RAM456及びフラッシュ・メモリ457によってサポートされる。信号処理プログラムはフラッシュ・メモリ457に記憶さえ得る。特定の場合に用い得る構成部分プロファイルをフラッシュ・メモリ457にも記憶させることが可能である。中央モジュール440は、ディジタル・ネットワーク用の1つのインタフェース443、及び通常、POTS(一般電話サービス)回線に接続するアナログ・ネットワーク用の別のインタフェース444の、いくつかのネットワーク・インタフェースを有する。このインタフェース444は、オーディオ・チャンネル毎に1本の回線の、少なくとも2本のPOTS回線を有する。ディジタル・インタフェース443は、ISDN、イーサネット(登録商標)又はUSBなどの種々のディジタル接続をサポートし得る。ISDN接続は、ISDNネットワークを介したビデオ会議接続に主に用いられる。イーサネット(登録商標)接続又はLAN接続は、インターネットを介したビデオ会議又は企業ネットワーク上の内部的なビデオ会議に主に用いられる。USB接続を用いて、追加のカメラ、マイクロフォン、追加の文書等を備えているコンピュータなどの追加のオーディオ/ビデオ・メディア・ストリームを交換するのに用い得る。
図1及び図2における配置では、全ての参加者の音声を、少なくとも1つのマイクロフォンによって捕らえ得る。各マイクロフォンからオーディオ信号が収集され、一緒にミキシングされて、各オーディオ・チャンネルにおいて単一のオーディオ信号を形成する場合、話者の音声は、電話会議の遠端に送信し、その遠端での拡声器によって再生することが可能である。図1及び図2における配置の各々では、本発明によれば、複数のマイクロフォンからの信号が選択され、ミキシングされて、少なくとも2つのオーディオ・チャンネルを形成する。
本発明の実施例によれば、マイクロフォンの全てが同様に扱われる訳でない。各マイクロフォンは、マイクロフォンでの信号品質によってゲーティングされるか閉じた状態にされる。各マイクロフォンは特定のオーディオ・チャンネルに割り当て得る。
例えば、図1を参照すれば、2つのオーディオ・チャンネルが保持されている。右のオーディオ・チャンネルは、マイクロフォン112、114及び116を有する。左オーディオ・チャンネルは、マイクロフォン111、113及び115を有する。話者121が話している場合、マイクロフォン112からのオーディオ信号は右チャンネルについて最も強く、マイクロフォン111は左チャンネルについて最も強い信号を有する。よって、マイクロフォン112からのオーディオ信号が右チャンネルを表すよう選択される一方、マイクロフォン111からのオーディオ信号が左オーディオ・チャンネルを表すものとして選択される。信号処理は図3に示す流れ図をたどり得る。単純にするよう、1つの信号経路のみを示す、すなわち、ビデオ会議の近端場所での音声が捕らえられ、処理され、遠端に送信され、それは処理され、再生される。反対方向、すなわち、遠端から近端まで、の方向である以外はこれと同じ別の信号経路が存在する。図3に示す流れ図では、近端でのマイクロフォンのうちの全てからのオーディオ信号の全てが収集され、オーディオ・チャンネル毎の調停器142及び141に送られる。調停器142又は141は、種々のマイクロフォンからの各オーディオ信号の強度を比較する。各チャンネルからの最強オーディオ信号が選択され、ミキサ152に送られる。ミキサ152は、電話ネットワーク又はデータ・ネットワーク153を介して送信するうえで適切な形式にオーディオ信号をフォーマッティングするか変換する更なる処理を行うことになる。例えば、各オーディオ・チャンネルは別個のアナログ電話回線を用いて遠端とオーディオ信号を交換し得る。又は、各オーディオ・チャンネルをディジタル・データ・パケットとして符号化し、復号化するよう遠端に送信し得る。フォーマッティングされたデータは遠端プロセッサ154に送信される。左チャンネルのオーディオ信号と右チャンネルのオーディオ信号とが埋め込まれるフォーマッティング・データを遠端プロセッサ154が受信すると、遠端プロセッサはこれらの2つのチャンネルを分割する。チャンネル毎のオーディオ信号は更に処理される、例えば、右チャンネルはプロセッサ162に進み、左チャンネルはプロセッサ161に進む。オーディオ信号は増幅され、再コンディショニングされた後、拡声器172及び171に入力され、音声として再生される。
一部の場合には、チャンネル毎に2つ以上のマイクロフォン信号を選択し得る。例えば、同じ会議場所で同時に2者以上の話者が話している場合、それらの話者に近いマイクロフォンからの信号は、各話者の音声を聴くことが可能であるようにオーディオ・チャンネルについてオーディオ信号にミキシングすることとする。この場合、誰かが話しているということを示す、十分に高い信号強度を有するマイクロフォン信号は全て、調停器142及び141によって選択され、更に処理される。
なお図3を参照すれば、調停器142、ミキサ152、遠端ミキサ154の相当部分、及びプロセッサ162などの、種々の構成部分を別個の構成部分として示す。それらは物理的に別個の構成部分であり得る。それらは更に、なお少ない構成部分に合成してもよく集約してもよい。
上記のマイクロフォン信号の調停又は選択は簡単である。本発明の別の実施例によれば、種々のマイクロフォンからのオーディオ信号又は調停信号の選択は、より良好なオーディオ品質及び柔軟性を達成するよう更に工夫をこらしている。この実施例では、マイクロフォン信号毎に部分帯域解析が行われ、調停及び選択が部分帯域レベルで行われる。図4は、オーディオ信号の一オーディオ・チャンネルについての処理を示す。同様な処理を何れかのオーディオ・チャネルに用いることが可能である。図3におけるシステムと同様に、マイクロフォン112、114及び116などのマイクロフォン全てからのオーディオ信号が収集される。オーディオ信号は、瞬間的にではなく、一度に1つの時間フレームを処理する。1つの時間フレームについて、オーディオ信号が種々のマイクロフォンから収集されると、各マイクロフォン信号は複数の部分帯域に分割される。図4において示す例では、1つの時間フレームは20ミリ秒であり、部分帯域は、50ヘルツずつ間隔があいて、50の帯域を生成する、500ヘルツから3000ヘルツまでに及ぶ。各マイクロフォン信号は周波数分割器181によって分割される。オーディオ信号の各部分帯域は、その特定の帯域について帯域調停器182に収集される。例えば、全ての3000ヘルツの帯域信号が図4に示すように調停器182で収集される。各マイクロフォンからの特定の部分帯域毎の部分帯域エネルギが解析される。部分帯域毎に、マイクロフォンのうちの1つが最大エネルギを有することになる。よって、各部分帯域は最善のマイクロフォンに1票を入れる。全ての50の帯域の投票を数えれば、マイクロフォンのうちの1つが最大の投票数を有することになる。上記と同様に、一話者のみが話している一部の場合には、1つのマイクロフォンが1つのオーディオ・チャネルに対して選択され、2者以上の話者が話している別の場合には、複数のマイクロフォンが選択される。
1つのマイクロフォンが受信する投票数が閾値を超える場合、そのマイクロフォンが現在の時間間隔に対するマイクロフォンとして選択される。いくつかのマイクロフォンが閾値を超える投票を受信する場合、これらのいくつかのマイクロフォンを選択することが可能である。最高数の投票を備えているマイクロフォンが閾値よりもなお少ない場合、先行する時間間隔における最善のマイクロフォンが選択される。閾値は会議に適合するよう調節可能である。一実施例では、閾値は16である。この部分帯域解析方法は、個々の会議の状況毎に、かつ、会議の何れかの期間中に、最善のマイクロフォンをより好適に示す一話者から別の話者へのよりスムーズな移行を備える。
本発明の上記実施例では、マイクロフォン信号を選択して特定のオーディオ・チャンネルについてのオーディオ信号を形成する工程は、2つのオーディオ・チャネルのシステムにおける左チャンネルについて、
Figure 0004255461
の公式で表す場合があり、その場合、Left_audio_signalは左オーディオ・チャンネルについてのオーディオ信号であり、Gain_leftはi番目のマイクロフォン信号の利得であり、Mic_Leftはi番目のマイクロフォン信号である。Gain_leftが実質的にゼロである場合、i番目のマイクロフォンからのマイクロフォン信号は「廃棄される」。Gain_leftが実施的に1である場合、i番目のマイクロフォンからのマイクロフォン信号が「選択される」。複数のマイクロフォンが選択される場合、選択されるマイクロフォンの利得は約1/nであり、nは選択されるマイクロフォンの数である。
マイクロフォンの利得の判定は、単一のマイクロフォンの選択についても複数の信号の選択についてもより容易に実施し得る。マイクロフォン信号が選択される場合、利得はゼロよりもかなり大きい、例えば、単一の信号が選択される場合、利得は0.8よりも大きい。2つのマイクロフォン信号が選択される場合、少なくとも1つのマイクロフォンの利得は0.4よりも大きい。信号が廃棄される場合、利得は実質的にゼロに等しい。例えば、図1に示す例では、マイクロフォン111のマイクロフォン利得は0.95であり、マイクロフォン113及び115のマイクロフォン利得は、1つのマイクロフォンのみが選択される場合、各々、0.025である。利得の分布は、2つのマイクロフォンが選択される場合、0.45、0.45、0.1又は0.7、0.3、0.0であり得る。
図2を参照すれば、多数のマイクロフォンを用いて多くの人々を大会議室に収容している。この会議室では、一話者が特に1つのマイクロフォンの近くに位置している、例えば、話者231がマイクロフォン223に対して非常に近いところに位置している。よって、話者231が話している場合、マイクロフォン223からの信号は飛びぬけて最強の信号である。この信号は左オーディオ・チャンネルに割り当てられる。右オーディオ・チャンネルでは、マイクロフォン216からの信号が最も強いものであり得るので、それが右チャンネルを表すよう選択される。しかし、マイクロフォン216からの1つとマイクロフォン223からの1つのこれらの2つの信号は強度が大きく異なるので、遠端で再生される場合、話者231が会議室の左遠端に位置しているかのように聞こえることになる。これによって、オーディオ画像に歪みをもたらし、話者231がマイクロフォン223でではなく、マイクロフォン215又は225の近くで話しているように聞こえるようにする。これによって、遠端での参加者における混乱をもたらし得る。リアルタイム・ビデオ画像に示す相対位置は、音による相対位置に一致するものでない。
本発明の一実施例によれば、そのようなオーディオ画像の歪みがオーディオ・パニングによって削減されるか除去される。「パニング」は、2チャンネルのオーディオ・システムを前提とすれば、信号を取り込んで、その一部分を左チャンネルに分配し、その残りを右チャンネルに分配するということを意味する。なお図2を参照すれば、左オーディオ・チャンネルにマイクロフォン223信号を専ら用い、右オーディオ・チャンネルにマイクロフォン216信号を専ら用いるかわりに、これらの信号をあるかたちで合成したものがチャンネル毎に用いられる。マイクロフォン223からの信号の一部分がマイクロフォン216からの信号の一部分とミキシングされて右のオーディオ・チャンネル信号を形成する。このようにして、SNRを大いに失うことなく右のオーディオ・チャンネルの信号がより強いものとなる。同様に、マイクロフォン223からの信号は、左のオーディオ・チャンネルにおける信号が強すぎないように、左オーディオ・チャンネル信号に用いられる前に多少減衰される。
ミキシングの量とその割合はマイクロフォンの相対位置に応じて変わってくる。図2に示す例では、マイクロフォン223は会議室の中心、すなわちカメラ視野の中心線からθ度離れている。よって、このマイクロフォンはカメラ視野の中心に対してθ度パニングされる。同様に、マイクロフォン216は、中心線からθ度離れている。このマイクロフォンがオーディオ・チャンネルに用いられる場合、θ度パニングされる。マイクロフォン信号を左オーディオ・チャンネルと右オーディオ・チャンネルとの両方にパニングすることによって、話者231のオーディオ画像が中心線からθ度離れているように再位置設定される。よって、話者231のオーディオ画像はビデオ・ディスプレイ上のビデオ画像に一致する。オーディオ・パニングは、音楽ミキシングにおいて周知であり、オーディオ画像を再位置設定するのに用いられる。マイクロフォンの位置が既知であるので、位置設定角θ又はθは既知である。マイクロフォン信号を調節させてそのようなオーディオ画像の再位置設定を達成する工程は周知である。このことは、本明細書及び特許請求の範囲ではより詳細に説明するものでない。
複数のマイクロフォン信号が単一のオーディオ・チャンネルに対してゲーティングされる場合、各マイクロフォン信号をパニングして上記のオーディオ画像歪みがないようにする場合がある。ゲーティングされたマイクロフォン信号の各々は減衰され、オーディオ・チャンネル間で配分される。その場合、各オーディオ・チャンネルにおいては、ゲーティングされた信号は全て、ミキシングされ、バランスがとられる。例えば、なお図2を参照すれば、話者233も話者231も話している場合、マイクロフォン211及び223が左チャンネルに選択される一方、右チャンネルにはマイクロフォン216を選択し得る。マイクロフォン211、233及び216からのマイクロフォン信号各々は、各マイクロフォンの位置によって左チャンネルと右チャンネルにパニングされる。
同様に、話者234及び233が同時に話している場合、マイクロフォン212及び233が、右チャンネルと左チャンネルとの各々に選択される。両方の信号を別のチャンネルにパニングして話者のオーディオ画像を適切に配置させることになる。
上記例では、2つのオーディオ・チャンネルが活用される。電話会議装置において帯域及び処理能力が十分ある場合、更に多くのオーディオ・チャンネルを設定し、遠端電話会議装置に送信し得る。複数のオーディオ・チャンネルはより現実的でかつ真に迫った音を再生することになる。例えば、5チャンネルのオーディオ・システムは非常に現実的な音響を備えることが可能である。
ステレオ・オーディオ・システムは、ビデオ会議がいくつかの会議場所を有する場合に特に有用である。図2に示す配置を参照すれば、ビデオ表示画面201はいくつかのウィンドウに分割する場合があり、その各々は各場所での参加者を示す。例えば、図6に示すように、第1の遠端場所は画面201上の左側のウィンドウ242上に示し、第2の遠端場所は画面201上の右側のウィンドウ243上に示す。近端場所は、画面201の最下部の小挿入部244として示し得る。会議に関する現在の状態の情報を表示する更に2つのウィンドウ245及び246が画面201の最下部にある。各遠端場所から受信される2つのオーディオ・チャンネルは拡声器202及び204によって再生される。第1の遠端場所からのオーディオ信号はわずかに左にパニングされる場合がある一方、第2の遠端場所から受信されるオーディオ信号はわずかに右にパニングされる場合がある。このようにして、遠端場所毎のオーディオ画像は、各場所内の個々の話者が隔てられることに加え、お互いに隔てられる。各話者のオーディオ画像は画面201上に示す自らのビデオ画像に一致する。遠端での各話者からの音声は、空間的に異なるので、別の話者の音声とミキシングされる場合よりもずっとよく分かる。
上記電話会議装置における音響信号を更に精緻化するよう、マイクロフォン信号は、ステレオ・エコー除去、ステレオAGC、ストレオ雑音抑制やその他の信号などの追加の音響信号処理を経る場合がある。これらの追加の音響信号処理はマイクロフォン信号の先行処理によって選択し得る。例えば、雑音抑制アルゴリズムは、各マイクロフォンに特有な雑音スペクトル形状を有することになる。マイクロフォン毎の雑音スペクトル形状は、音響信号プロセッサによってアクセス可能なメモリ・モジュールに記憶される。したがって、どのマイクロフォンが選択されるかに基づいて、音響プロセッサは雑音スペクトル形状を用いてその特定のマイクロフォンに対する雑音を削減し得る。ステレオAGCは、マイクロフォン信号調停器に送られる前にマイクロフォン信号を再コンディショニングするよう起動される場合がある。ステレオAGCはマイクロフォン上の利得を調節して話者の音声の変動する音量を補償し得る。音量の高い話者の場合、信号のピークが切断されることのないように利得をより低く調節し得る。音量の低い話者の場合、信号強度が強度閾値に達し、信号を調停器によって選択可能であるように利得をより高く調節し得る。信号強度が十分でない場合、音量の低い話者の音声を、それが背景雑音であるかのように、調停器によって廃棄し得る。
同様に、マイクロフォン・プロファイルをマイクロフォン毎に記憶させ得る。このプロファイルは、特定のマイクロフォンに必要な処理のみが用いられるように更なる信号処理中に用いる場合があり、不必要な処理や有用でない処理をしなくてよいようにしている。マイクロフォン毎のマイクロフォン・プロファイルは、その位置や関連するパニング因子を含み得る。その位置や関連するパニング因子はパニング処理中に用いられて、信号を、2つ以上のオーディオ・チャンネルが用いられる場合、全てのオーディオ・チャンネルにパニングする。プロファイルは、雑音抑制に用いられる雑音スペクトルを含み得る。このプロファイルは更に、AGCに用いられる周波数応答スペクトルを含み得る。
上記の2つのビデオ会議装置は、お互いに接続される場合、図7に示すような、より好適なビデオ会議システムを形成する。図7に示す会議システムは2つの場所を有し、その各々は図2に示すビデオ会議装置を有する。近端中央モジュール440は、各装置上のネットワーク・インタフェース(図示せず)を介して遠端中央モジュール740に接続される。中央モジュール440及び740は、図7に示す構成部分に結合される。単純にするよう、構成部分と中央モジュールとの間の接続は示していない。このビデオ会議システムは、参加者全てが同じ会議室において会議を行っているように、参加者全てに対してずっと好適な会議の体験をもたらすことが可能である。
本発明の実施例は、マルチチャンネル・オーディオ処理を用いて電話会議の各場所での、ステレオ音又はマルチチャンネル・サラウンド音などのより現実的な、真に迫る音の再生を備える。本発明の実施例は、電話会議中に種々の話者の種々の場所を区別する人間の両耳聴の空間的区別を利用し、音声の明瞭度を向上させる。本発明の実施例は、会議システム内の多くのマイクロフォンから最善のオーディオ信号を選択するうえでの種々の方法を用いる。本発明の実施例は電話会議の品質を大いに向上させる。
本発明の例示的実施例を示し、説明したが、種々の変更をその実施例において本発明の趣旨及び範囲から逸脱することなく行うことが可能であることが分かるものである。
会議室におけるビデオ会議装置の通常の配置を示す図である。 複数のマイクロフォン及び拡声器を含み、マイクロフォン・パニング手法を用いたステレオ・オーディオ・システムを備えている大会議室を示す図である。 マイクロフォン信号の調停と、2つのオーディオ・チャンネルを備えている会議室におけるオーディオ再生とを示す流れ図である。 マイクロフォン信号の部分帯域の調停と、左オーディオ・チャンネルについての再ミキシング及びオーディオ再生とを示す流れ図である。 複数のオーディオ・チャンネルを備えているビデオ会議装置を示す構成図である。 2つの遠端場所を備えているビデオ会議装置のビデオ画面を示す図である。 1つの近端場所と1つの遠端場所とを備えているビデオ会議システムを示す図である。
符号の説明
101 ビデオ表示画面
102 拡声器
104 拡声器
105 ビデオ・カメラ
110 右マイクロフォン
111 マイクロフォン
112 マイクロフォン
113 マイクロフォン
114 マイクロフォン
115 マイクロフォン
116 マイクロフォン
119 会議テーブル
120 左マイクロフォン
121 会議参加者
122 会議参加者
123 会議参加者
141 調停器
142 調停器
152 ミキサ
153 ネットワーク
154 遠端プロセッサ
161 プロセッサ
162 プロセッサ
171 拡声器
172 拡声器
181 周波数分割器
182 調停器
183 周波数分割器
184 ミキサ
201 ビデオ表示画面
202 拡声器
204 拡声器
211 マイクロフォン
212 マイクロフォン
213 マイクロフォン
214 マイクロフォン
215 マイクロフォン
216 マイクロフォン
217 マイクロフォン
218 マイクロフォン
221 マイクロフォン
222 マイクロフォン
223 マイクロフォン
224 マイクロフォン
225 マイクロフォン
226 マイクロフォン
231 会議参加者
233 会議参加者
234 会議参加者
241 ビデオ表示画面
242 ウィンドウ
243 ウィンドウ
244 挿入部
245 ウィンドウ
246 ウィンドウ
410 表示画面
412 カメラ
422 拡声器
424 拡声器
432 マイクロフォン
434 マイクロフォン
440 中央モジュール
441 ビデオ入力インタフェース
442 ビデオ出力インタフェース
443 インタフェース
444 インタフェース
445 オーディオ入力インタフェース
446 オーディオ出力インタフェース
450 プロセッサ装置
451 中間部
452 中間部
453 中間部
454 中間部
456 RAM
457 フラッシュ・メモリ
500 ビデオ会議装置
701 ビデオ表示画面
702 拡声器
704 拡声器
711 マイクロフォン
712 マイクロフォン
714 マイクロフォン
715 マイクロフォン
716 マイクロフォン
717 マイクロフォン
718 マイクロフォン
719 マイクロフォン
721 マイクロフォン
722 マイクロフォン
723 マイクロフォン
724 マイクロフォン
725 マイクロフォン
726 マイクロフォン
732 会議参加者
733 会議参加者
734 会議参加者
740 中央モジュール

Claims (8)

  1. 電話会議におけるマルチチャンネル・オーディオ信号を処理する方法であって:
    複数のチャンネルについて、1つの時間フレームについてマイクロフォン信号を蓄積する工程と、
    該時間フレームにおける各マイクロフォン信号を複数の周波数帯域制限部分帯域に分割する工程と、
    部分帯域毎に、全てのマイクロフォンからの部分帯域信号を比較する工程と、
    最大の信号エネルギを有するマイクロフォンに一票を与える工程と、
    マイクロフォン毎に全ての部分帯域について投票を全て加算する工程と、
    投票数が該時間フレームに対する投票閾値を超えるマイクロフォン信号を選択する工程と、
    チャンネル毎にオーディオ信号を、該1つ又は複数の選択されるマイクロフォン信号から形成する工程と、
    チャンネル毎の該オーディオ信号を遠端に送る工程とを備えることを特徴とする方法。
  2. 請求項1記載の方法であって:
    投票数が該時間フレームに対する投票閾値を超えるマイクロフォンが2つ以上選択された場合、投票数が最大の1つのマイクロフォン信号が保持され、選択された他のマイクロフォン信号が廃棄されることを特徴とする方法。
  3. 請求項1記載の方法であって:
    該時間フレームに対する該閾値を超える投票を有するマイクロフォンが何らない場合、直前時間フレームについて選択されたマイクロフォンが選択されることを特徴とする方法。
  4. 請求項1記載の方法であって:
    該時間フレームにおける各マイクロフォン信号を複数の周波数帯域制限部分帯域に分割する工程が、各マイクロフォン信号を少なくとも50の部分帯域に分割するものであり、該投票閾値が16であることを特徴とする方法。
  5. 請求項1記載の方法であって、
    上記1つのオーディオ・チャンネルについて選択されたマイクロフォン信号を選択されたマイクロフォンの位置に基づいて他のオーディオ・チャンネルにパニングする工程を、上記形成する工程の後に、かつ、上記送る工程の前に、更に備えることを特徴とする方法。
  6. 請求項1記載の方法であって、
    会議参加者の画像をビデオ・ディスプレイ上に示す工程と、
    選択されたマイクロフォン信号のレベルを、話者の像位置と、該ビデオ・ディスプレイ上に示される該話者のビデオ画像位置とを一致させるよう調節する工程とを、上記形成する工程の後に、かつ、上記送る工程の前に、更に備えることを特徴とする方法。
  7. 請求項1記載の方法であって、自動利得制御、又は雑音抑制を行う工程を、上記形成する工程の後に、かつ、上記送る工程の前に、更に備えることを特徴とする方法。
  8. 請求項1記載の方法であって、選択されたマイクロフォンのプロファイルを取り出す工程及び、該選択されたマイクロフォンの該取り出されたプロファイルによって該オーディオ信号を処理する工程を、上記形成する工程の後に、かつ、上記送る工程の前に、更に備えることを特徴とする方法。
JP2005189507A 2004-06-30 2005-06-29 電話会議用のステレオ・マイクロフォン処理 Expired - Fee Related JP4255461B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US10/881,008 US8687820B2 (en) 2004-06-30 2004-06-30 Stereo microphone processing for teleconferencing

Publications (2)

Publication Number Publication Date
JP2006020314A JP2006020314A (ja) 2006-01-19
JP4255461B2 true JP4255461B2 (ja) 2009-04-15

Family

ID=34981971

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005189507A Expired - Fee Related JP4255461B2 (ja) 2004-06-30 2005-06-29 電話会議用のステレオ・マイクロフォン処理

Country Status (5)

Country Link
US (1) US8687820B2 (ja)
EP (1) EP1613124B1 (ja)
JP (1) JP4255461B2 (ja)
CN (1) CN100484177C (ja)
TW (1) TWI264934B (ja)

Families Citing this family (85)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8233642B2 (en) * 2003-08-27 2012-07-31 Sony Computer Entertainment Inc. Methods and apparatuses for capturing an audio signal based on a location of the signal
US8139793B2 (en) * 2003-08-27 2012-03-20 Sony Computer Entertainment Inc. Methods and apparatus for capturing audio signals based on a visual image
US8160269B2 (en) * 2003-08-27 2012-04-17 Sony Computer Entertainment Inc. Methods and apparatuses for adjusting a listening area for capturing sounds
US20070223732A1 (en) * 2003-08-27 2007-09-27 Mao Xiao D Methods and apparatuses for adjusting a visual image based on an audio signal
US8116500B2 (en) * 2004-10-15 2012-02-14 Lifesize Communications, Inc. Microphone orientation and size in a speakerphone
US8054336B2 (en) * 2004-10-15 2011-11-08 Lifesize Communications, Inc. High definition pan tilt zoom camera with embedded microphones and thin cable for data and power
US8237770B2 (en) 2004-10-15 2012-08-07 Lifesize Communications, Inc. Audio based on speaker position and/or conference location
US20060132595A1 (en) * 2004-10-15 2006-06-22 Kenoyer Michael L Speakerphone supporting video and audio features
US7970151B2 (en) * 2004-10-15 2011-06-28 Lifesize Communications, Inc. Hybrid beamforming
US7692683B2 (en) * 2004-10-15 2010-04-06 Lifesize Communications, Inc. Video conferencing system transcoder
US7688345B2 (en) * 2004-10-15 2010-03-30 Lifesize Communications, Inc. Audio output in video conferencing and speakerphone based on call type
US7667728B2 (en) * 2004-10-15 2010-02-23 Lifesize Communications, Inc. Video and audio conferencing system with spatial audio
US7473040B2 (en) * 2004-10-15 2009-01-06 Lifesize Communications, Inc. High definition camera pan tilt mechanism
US7903137B2 (en) * 2004-10-15 2011-03-08 Lifesize Communications, Inc. Videoconferencing echo cancellers
US7720232B2 (en) * 2004-10-15 2010-05-18 Lifesize Communications, Inc. Speakerphone
US7760887B2 (en) * 2004-10-15 2010-07-20 Lifesize Communications, Inc. Updating modeling information based on online data gathering
US7717629B2 (en) * 2004-10-15 2010-05-18 Lifesize Communications, Inc. Coordinated camera pan tilt mechanism
US7826624B2 (en) * 2004-10-15 2010-11-02 Lifesize Communications, Inc. Speakerphone self calibration and beam forming
US7720236B2 (en) * 2004-10-15 2010-05-18 Lifesize Communications, Inc. Updating modeling information based on offline calibration experiments
US7472058B2 (en) * 2004-12-28 2008-12-30 Cyberlink Corp. Automatic audio source detection for capture devices
US7970049B2 (en) * 2005-01-05 2011-06-28 Creative Technology Ltd Method and apparatus for encoding video in conjunction with a host processor
US8514929B2 (en) * 2005-01-05 2013-08-20 Creative Technology Ltd Combined audio/video/USB device
US8457614B2 (en) 2005-04-07 2013-06-04 Clearone Communications, Inc. Wireless multi-unit conference phone
US7970150B2 (en) * 2005-04-29 2011-06-28 Lifesize Communications, Inc. Tracking talkers using virtual broadside scan and directed beams
US7593539B2 (en) * 2005-04-29 2009-09-22 Lifesize Communications, Inc. Microphone and speaker arrangement in speakerphone
US7991167B2 (en) * 2005-04-29 2011-08-02 Lifesize Communications, Inc. Forming beams with nulls directed at noise sources
US20060248210A1 (en) * 2005-05-02 2006-11-02 Lifesize Communications, Inc. Controlling video display mode in a video conferencing system
US7697827B2 (en) 2005-10-17 2010-04-13 Konicek Jeffrey C User-friendlier interfaces for a camera
US7692680B2 (en) * 2006-04-20 2010-04-06 Cisco Technology, Inc. System and method for providing location specific sound in a telepresence system
JP4984683B2 (ja) * 2006-06-29 2012-07-25 ヤマハ株式会社 放収音装置
US8738368B2 (en) * 2006-09-21 2014-05-27 GM Global Technology Operations LLC Speech processing responsive to a determined active communication zone in a vehicle
JP4449987B2 (ja) * 2007-02-15 2010-04-14 ソニー株式会社 音声処理装置、音声処理方法およびプログラム
US7924995B2 (en) * 2007-03-19 2011-04-12 Avaya Inc. Teleconferencing system with multi-channel imaging
US8237765B2 (en) * 2007-06-22 2012-08-07 Lifesize Communications, Inc. Video conferencing device which performs multi-way conferencing
JP2009010808A (ja) * 2007-06-29 2009-01-15 Yamaha Corp 拡声装置
JP2009020291A (ja) * 2007-07-11 2009-01-29 Yamaha Corp 音声処理装置および通信端末装置
US8139100B2 (en) 2007-07-13 2012-03-20 Lifesize Communications, Inc. Virtual multiway scaler compensation
US8073125B2 (en) * 2007-09-25 2011-12-06 Microsoft Corporation Spatial audio conferencing
US8954324B2 (en) * 2007-09-28 2015-02-10 Qualcomm Incorporated Multiple microphone voice activity detector
US8379823B2 (en) * 2008-04-07 2013-02-19 Polycom, Inc. Distributed bridging
US20100057472A1 (en) * 2008-08-26 2010-03-04 Hanks Zeng Method and system for frequency compensation in an audio codec
US8514265B2 (en) 2008-10-02 2013-08-20 Lifesize Communications, Inc. Systems and methods for selecting videoconferencing endpoints for display in a composite video image
US20100110160A1 (en) * 2008-10-30 2010-05-06 Brandt Matthew K Videoconferencing Community with Live Images
US8456510B2 (en) 2009-03-04 2013-06-04 Lifesize Communications, Inc. Virtual distributed multipoint control unit
US8643695B2 (en) 2009-03-04 2014-02-04 Lifesize Communications, Inc. Videoconferencing endpoint extension
US8140715B2 (en) * 2009-05-28 2012-03-20 Microsoft Corporation Virtual media input device
US8350891B2 (en) * 2009-11-16 2013-01-08 Lifesize Communications, Inc. Determining a videoconference layout based on numbers of participants
US8219394B2 (en) * 2010-01-20 2012-07-10 Microsoft Corporation Adaptive ambient sound suppression and speech tracking
CN101877643B (zh) * 2010-06-29 2014-12-10 中兴通讯股份有限公司 多点混音远景呈现方法、装置及系统
CN102340729B (zh) * 2010-07-19 2014-05-14 中国电信股份有限公司 音频信号的处理和还原方法与系统
CN102480671B (zh) * 2010-11-26 2014-10-08 华为终端有限公司 视频通信中的音频处理方法和装置
CN102056053B (zh) * 2010-12-17 2015-04-01 中兴通讯股份有限公司 一种多话筒混音方法及装置
US20120262536A1 (en) * 2011-04-14 2012-10-18 Microsoft Corporation Stereophonic teleconferencing using a microphone array
KR20120128542A (ko) * 2011-05-11 2012-11-27 삼성전자주식회사 멀티 채널 에코 제거를 위한 멀티 채널 비-상관 처리 방법 및 장치
EP2597850A1 (en) 2011-11-24 2013-05-29 Alcatel Lucent Method and arrangement for echo cancellation in conference systems
US20130162752A1 (en) * 2011-12-22 2013-06-27 Advanced Micro Devices, Inc. Audio and Video Teleconferencing Using Voiceprints and Face Prints
US9071892B2 (en) * 2012-05-14 2015-06-30 General Motors Llc Switching between acoustic parameters in a convertible vehicle
US9641933B2 (en) * 2012-06-18 2017-05-02 Jacob G. Appelbaum Wired and wireless microphone arrays
WO2014046916A1 (en) 2012-09-21 2014-03-27 Dolby Laboratories Licensing Corporation Layered approach to spatial audio coding
WO2014064325A1 (en) * 2012-10-26 2014-05-01 Nokia Corporation Media remixing system
US9210269B2 (en) * 2012-10-31 2015-12-08 Cisco Technology, Inc. Active speaker indicator for conference participants
CN103856740B (zh) * 2012-12-05 2017-05-24 联想(北京)有限公司 一种信息处理的方法及视频会议系统
EP2939407B1 (en) * 2012-12-27 2017-02-22 Robert Bosch GmbH Conference system and process for voice activation in the conference system
US20140278380A1 (en) * 2013-03-14 2014-09-18 Dolby Laboratories Licensing Corporation Spectral and Spatial Modification of Noise Captured During Teleconferencing
JP5862585B2 (ja) * 2013-03-22 2016-02-16 トヨタ自動車株式会社 コミュニケーションシステム及びロボット
US9742573B2 (en) * 2013-10-29 2017-08-22 Cisco Technology, Inc. Method and apparatus for calibrating multiple microphones
US9351060B2 (en) 2014-02-14 2016-05-24 Sonic Blocks, Inc. Modular quick-connect A/V system and methods thereof
US9685730B2 (en) 2014-09-12 2017-06-20 Steelcase Inc. Floor power distribution system
US9584910B2 (en) 2014-12-17 2017-02-28 Steelcase Inc. Sound gathering system
CN105072299B (zh) * 2015-08-07 2017-12-26 河北远东通信系统工程有限公司 一种利用单声卡实现两路通话的方法
WO2017157443A1 (en) * 2016-03-17 2017-09-21 Sonova Ag Hearing assistance system in a multi-talker acoustic network
US10887628B1 (en) * 2016-04-27 2021-01-05 United Services Automobile Services (USAA) Systems and methods for adaptive livestreaming
CN105791607B (zh) * 2016-04-28 2018-06-19 沈阳大学 一种智能会议终端系统
US11188289B2 (en) 2016-07-29 2021-11-30 Hewlett-Packard Development Company, L.P. Identification of preferred communication devices according to a preference rule dependent on a trigger phrase spoken within a selected time from other command data
CN107889022B (zh) * 2016-09-30 2021-03-23 松下电器产业株式会社 噪音抑制装置以及噪音抑制方法
US10165159B2 (en) 2016-10-04 2018-12-25 Avaya Inc. System and method for enhancing video conferencing experience via a moving camera
US9942517B1 (en) * 2016-10-04 2018-04-10 Avaya Inc. Multi-mode video conferencing system
US10887467B2 (en) 2018-11-20 2021-01-05 Shure Acquisition Holdings, Inc. System and method for distributed call processing and audio reinforcement in conferencing environments
DE102019106794B4 (de) * 2019-03-18 2021-05-06 RF360 Europe GmbH Cu-basierte Elektrode mit verbesserter Leistungsbeständigkeit
US11765522B2 (en) 2019-07-21 2023-09-19 Nuance Hearing Ltd. Speech-tracking listening device
CN111294681B (zh) * 2020-02-28 2021-10-22 联想(北京)有限公司 教室终端系统及其控制方法、控制器与主控设备
CN111432160A (zh) * 2020-04-01 2020-07-17 广州市百果园信息技术有限公司 一种实现多人通话的方法、装置、服务器和存储介质
US11308971B2 (en) 2020-07-15 2022-04-19 Bank Of America Corporation Intelligent noise cancellation system for video conference calls in telepresence rooms
CN113965715B (zh) * 2021-09-13 2022-11-11 荣耀终端有限公司 一种设备协同控制方法和装置
CN114501238B (zh) * 2022-03-28 2022-09-13 广州迈聆信息科技有限公司 一种麦克风通道确定方法、装置、会议终端及介质

Family Cites Families (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB1329575A (en) * 1970-01-26 1973-09-12 Reid A A L Group communication apparatus
US3755625A (en) * 1971-10-12 1973-08-28 Bell Telephone Labor Inc Multimicrophone loudspeaking telephone system
US4449238A (en) 1982-03-25 1984-05-15 Bell Telephone Laboratories, Incorporated Voice-actuated switching system
US4515721A (en) * 1982-09-27 1985-05-07 Jordan Chemical Company Process for the production of fatty acid esters of hydroxyalkyl sulfonate salts
US4658425A (en) 1985-04-19 1987-04-14 Shure Brothers, Inc. Microphone actuation control system suitable for teleconference systems
JPS647791A (en) * 1987-06-30 1989-01-11 Nec Corp Multiscreen video conference method and device therefor
US5060273A (en) 1989-10-11 1991-10-22 Lester Audio Laboratories, Inc. Sound mixing processor, method and system
US5121426A (en) * 1989-12-22 1992-06-09 At&T Bell Laboratories Loudspeaking telephone station including directional microphone
US5206913A (en) 1991-02-15 1993-04-27 Lectrosonics, Inc. Method and apparatus for logic controlled microphone equalization
US5259035A (en) 1991-08-02 1993-11-02 Knowles Electronics, Inc. Automatic microphone mixer
US5335011A (en) 1993-01-12 1994-08-02 Bell Communications Research, Inc. Sound localization system for teleconferencing using self-steering microphone arrays
US5631967A (en) 1993-11-24 1997-05-20 Intel Corporation Processing audio signals using a state variable
US5506910A (en) 1994-01-13 1996-04-09 Sabine Musical Manufacturing Company, Inc. Automatic equalizer
US5561737A (en) 1994-05-09 1996-10-01 Lucent Technologies Inc. Voice actuated switching system
US5828756A (en) 1994-11-22 1998-10-27 Lucent Technologies Inc. Stereophonic acoustic echo cancellation using non-linear transformations
US5889843A (en) * 1996-03-04 1999-03-30 Interval Research Corporation Methods and systems for creating a spatial auditory environment in an audio conference system
US5848146A (en) 1996-05-10 1998-12-08 Rane Corporation Audio system for conferencing/presentation room
US5715319A (en) 1996-05-30 1998-02-03 Picturetel Corporation Method and apparatus for steerable and endfire superdirective microphone arrays with reduced analog-to-digital converter and computational requirements
US5858756A (en) 1997-04-29 1999-01-12 Incyte Pharmaceuticals, Inc. Human lysophospholipase
US5991385A (en) 1997-07-16 1999-11-23 International Business Machines Corporation Enhanced audio teleconferencing with sound field effect
JP3157769B2 (ja) * 1998-03-02 2001-04-16 静岡日本電気株式会社 Tv音声制御装置
US6895093B1 (en) 1998-03-03 2005-05-17 Texas Instruments Incorporated Acoustic echo-cancellation system
US6173059B1 (en) 1998-04-24 2001-01-09 Gentner Communications Corporation Teleconferencing system with visual feedback
US6049607A (en) 1998-09-18 2000-04-11 Lamar Signal Processing Interference canceling method and apparatus
US6618073B1 (en) 1998-11-06 2003-09-09 Vtel Corporation Apparatus and method for avoiding invalid camera positioning in a video conference
US6408327B1 (en) 1998-12-22 2002-06-18 Nortel Networks Limited Synthetic stereo conferencing over LAN/WAN
US7260231B1 (en) * 1999-05-26 2007-08-21 Donald Scott Wedge Multi-channel audio panel
US6496201B1 (en) 1999-09-30 2002-12-17 International Business Machines Corporation System and user interface for multiparty conferencing
GB0121206D0 (en) 2001-08-31 2001-10-24 Mitel Knowledge Corp System and method of indicating and controlling sound pickup direction and location in a teleconferencing system
US7333622B2 (en) * 2002-10-18 2008-02-19 The Regents Of The University Of California Dynamic binaural sound capture and reproduction
US7428000B2 (en) * 2003-06-26 2008-09-23 Microsoft Corp. System and method for distributed meetings
US7515721B2 (en) * 2004-02-09 2009-04-07 Microsoft Corporation Self-descriptive microphone array

Also Published As

Publication number Publication date
TWI264934B (en) 2006-10-21
JP2006020314A (ja) 2006-01-19
CN1716986A (zh) 2006-01-04
US20060013416A1 (en) 2006-01-19
EP1613124A2 (en) 2006-01-04
EP1613124A3 (en) 2009-09-16
TW200610373A (en) 2006-03-16
US8687820B2 (en) 2014-04-01
CN100484177C (zh) 2009-04-29
EP1613124B1 (en) 2017-07-26

Similar Documents

Publication Publication Date Title
JP4255461B2 (ja) 電話会議用のステレオ・マイクロフォン処理
US11282532B1 (en) Participant-individualized audio volume control and host-customized audio volume control of streaming audio for a plurality of participants who are each receiving the streaming audio from a host within a videoconferencing platform, and who are also simultaneously engaged in remote audio communications with each other within the same videoconferencing platform
EP2158752B1 (en) Methods and arrangements for group sound telecommunication
CN103220491B (zh) 用于操作会议系统的方法以及用于会议系统的装置
JP3483086B2 (ja) 音声電話会議装置
JP2002511714A (ja) 通信会議システム
WO2008004056A2 (en) Artificial bandwidth expansion method for a multichannel signal
US11521636B1 (en) Method and apparatus for using a test audio pattern to generate an audio signal transform for use in performing acoustic echo cancellation
EP2084937B1 (de) Verfahren und vorrichtung zur aufnahme, übertragung und wiedergabe von schallereignissen für kommunikationsanwendungen
DE102022204702A1 (de) Verfahren und system zur verarbeitung von entfernter aktiver sprache während eines anrufs
TW202234864A (zh) 在多方會議環境中音訊信號之處理和分配
CN108109630A (zh) 一种音频的处理方法、装置和媒体服务器
JP2005039461A (ja) 音声通信システム、方法及びプログラム並びに音声再生装置
JP2004274147A (ja) 音場定位型多地点通話システム
CN116471263B (zh) 一种视讯系统的实时音频择路方法
CN216122672U (zh) 会议系统及远程会议平台
JPH07226930A (ja) 通信会議システム
GB2591557A (en) Audio conferencing in a room
Aoki et al. Audio teleconferencing system with sound localization effect
DE10052992C2 (de) Verfahren für die raumgerechte Wiedergabe von Toninformationen bei Videokonferenzen
CN113556503A (zh) 会议系统、远程会议平台及音频处理方法
JPH04137686U (ja) テレビ会議システムの自動送信画像選択装置
KR20060081966A (ko) 원격회의를 위한 음상 정위 시스템
JP2001217942A (ja) 双方向通信システム
JPS6047580A (ja) テレビ会議装置

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070529

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20070815

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20070820

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20071024

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20071029

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071127

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080115

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20080414

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20080417

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080515

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20080701

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080929

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20081106

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090120

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090127

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120206

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130206

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130206

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140206

Year of fee payment: 5

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees