JP2008245250A - 音声会議装置 - Google Patents

音声会議装置 Download PDF

Info

Publication number
JP2008245250A
JP2008245250A JP2008010131A JP2008010131A JP2008245250A JP 2008245250 A JP2008245250 A JP 2008245250A JP 2008010131 A JP2008010131 A JP 2008010131A JP 2008010131 A JP2008010131 A JP 2008010131A JP 2008245250 A JP2008245250 A JP 2008245250A
Authority
JP
Japan
Prior art keywords
microphone
speaker
acoustic
omnidirectional
loudspeaker
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2008010131A
Other languages
English (en)
Other versions
JP2008245250A5 (ja
JP5082878B2 (ja
Inventor
Tadamichi Tokuda
肇道 徳田
Natsuyuki Ono
奈津志 小野
Ryoichi Yushimo
良一 湯下
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP2008010131A priority Critical patent/JP5082878B2/ja
Priority to US12/037,426 priority patent/US8111838B2/en
Priority to PCT/JP2008/000388 priority patent/WO2008120436A2/en
Publication of JP2008245250A publication Critical patent/JP2008245250A/ja
Publication of JP2008245250A5 publication Critical patent/JP2008245250A5/ja
Application granted granted Critical
Publication of JP5082878B2 publication Critical patent/JP5082878B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Details Of Audible-Bandwidth Transducers (AREA)
  • Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Telephone Set Structure (AREA)
  • Telephone Function (AREA)

Abstract

【課題】ラウドスピーカとの音響結合を小さくし、かつ使用者が違和感を覚えることが無く、各集音部の感度特性のバラつきと経年変化を低減し、高品質な全二重動作を可能とする。
【解決手段】集音部2a〜2dの音響的中心82a〜82dとラウドスピーカ30の音響的中心83とを結ぶ放射線81a〜81dと直交しかつ集音部2a〜2dの音響的中心82a〜82dを通過する直交線84a〜84dを境界として、その境界よりもラウドスピーカ側に形成される感度特性85a〜85dの面積が他方より小さくなるよう集音部2a〜2dの感度特性を形成する感度特性形成手段と、を設ける。
【選択図】図8

Description

本発明は、通信手段を用いて遠隔地同士の音声会議を可能とする音声会議装置に関するものである。
近年、通信手段を用いて遠隔地同士の音声会議を可能とする音声会議装置が普及しつつある。このような音声会議装置は、それぞれの設置場所において複数の人がいても使用できるよう設計されていることが望ましい。代表的な例としては、可聴音を電気信号に変換する複数のマイクロホン装置と、電気信号を可聴音に変換するラウドスピーカと、それらマイクロホン装置とラウドスピーカとを電話回線に電気的に接続する音声通信網とからなり、マイクロホン装置は少なくとも一方向から放散する音に対し他の方向からのそれよりも高感度であるような指向性ポーラー感度特性を有し、さらにそのポーラー感度特性は、主ローブ、サイドローブ、及びローブのペア間にあるヌルを有し、ラウドスピーカは、主ローブと隣接するサイドローブの間にある上記ポーラー感度特性のヌルの位置に配置されたテレカンファレンス装置がある(例えば特許文献1参照)。
このテレカンファレンス装置が備えるラウドスピーカは主ローブと隣接サイドローブのポーラー感度パターンのヌルに設置されおり、その結果ラウドスピーカとマイクロホンの間の音響結合が実質上減少するので、全二重動作、すなわち互いに相手の音声をラウドスピーカより出力させて話を聞きながらマイクロホンを用いて発音することが可能である。さらにこのテレカンファレンス装置は、壁もしくは天井からの直接通話の反響から来る無方向音声をマイクロホンがピックアップすることにより起こる室内の残響や室内雑音を低減するための第1のエコーキャンセラや、送信チャネルと受信チャネルを電話回線に接続するハイブリッド回路からの電気的エコー(ハイブリッドエコー)を低減するための第2のエコーキャンセラを有している。これらの構成により、さらに高品質な全二重動作を可能にする。
特公平7−61098号公報
しかしながら、テレカンファレンス装置で使用される各マイクロホンの指向性ポーラー感度特性には製造上の特性バラつきが存在し、主ローブ・サイドローブの大きさやヌルの位置がマイクロホンによって異なる。この特性バラつきを低減するためには、各マイクロホンの取り付け角度の微調整や集音感度の微調整、さらに場合によっては取り付けるマイクロホンの選別を行わなければならない。これらはテレカンファレンス装置の製造工数の増加や使用されるマイクロホンの歩留まりの低下を引き起こし、装置全体の製造コストの増加につながる。
また、このようなマイクロホンの指向性ポーラー感度特性は、経年変化により主ローブ・サイドローブの大きさやヌルの位置が変化する。そうするとテレカンファレンス装置の全二重動作の品質が低下する。
さらに、装置を使用するユーザは通常、マイクロホンに対する正面方向、すなわちこのテレカンファレンス装置においては各マイクロホンの中心と装置の中心(つまりラウドスピーカの中心)とを結ぶ線上にマイクロホンの主ローブがあるものと考えるはずである。しかしながら、このテレカンファレンス装置の主ローブは前記線上と直交する方向にある。つまり、ユーザが自分の音声を集音してくれていると考えていたのとは別のマイクの集音感度のほうが実際には高い、ということが発生し得る。このことはユーザに違和感を与え、装置自体が自ら有している複数のマイクロホンを用いて話者選択制御を行う場合に誤動作を引き起こしてしまう要因となり得る。
この主ローブの設定方向に関する問題を回避するためには、主ローブと逆方向にヌルを有するマイクロホンの主ローブを各マイクロホンの中心と装置の中心すなわちラウドスピーカの中心とを結ぶ線上に配置し、かつそのマイクロホンのヌルの方向にラウドスピーカを配置することが望ましい。しかしながら、そのような指向性ポーラー感度特性を有するマイクロホンを使用したとしても、各マイクロホンの指向性ポーラー感度特性にはやはり前述の製造上の特性バラつきが存在し、装置の製造工数の増加や使用されるマイクロホンの歩留まりの低下を引き起こし、装置全体の製造コストの増加につながる。
また、上記従来の構成を有するテレカンファレンス装置は室内の残響や室内雑音を低減するための第1のエコーキャンセラを有しているが、実際にはこの他に装置筐体内での反射や振動による残響も存在する。これらの残響は、例えラウドスピーカから出力された同じ音により発生したものであってもマイクロホンへの到達時間が異なるため、第1のエコーキャンセラによる残響低減処理を困難かつ複雑なものとし、場合によっては処理が発散したり処理不能に陥ったりすることになる。
また、上記従来の構成を有するテレカンファレンス装置のエコーキャンセラは、基本的にマイクロホンとラウドスピーカとの間に挿入されているものであり、ラウドスピーカでの電気信号から空気振動への変換時における音響的ひずみ(ラウドスピーカの固有振動数や周波数特性に起因する)によるエコー信号や、ラウドスピーカの振動に伴うテレカンファレンス装置の筐体振動などによるエコー信号などのいわゆる非線形エコーに対してはエコーキャンセル効果が得られにくいという課題を有していた。特に安価なラウドスピーカにおいては高周波ひずみが問題となっていた。
本発明は、ユーザに違和感を与えたり誤動作を引き起こしたりすること無く、各集音部の指向性ポーラー感度特性のバラつきと経年変化が低減でき、残響低減処理の負担を低減でき、高品質な全二重動作が可能となる音声会議装置を提供することを目的とする。
この課題を解決するため、本発明は、送話音声信号を集音するための複数の無指向性マイクロホン装置からなるマイクユニットと、受話音声信号を拡声するためのラウドスピーカと、前記送話音声信号および受話信号を送受信するための通信手段とを有し、さらに前記マイクユニットの音響的中心における収音方向を角度とし感度の大きさを半径方向として前記マイクユニットの感度特性を表現する場合に、前記マイクユニットの音響的中心と前記ラウドスピーカの音響的中心とを結ぶ放射線と直交しかつ前記マイクユニットの音響的中心を通過する直交線を境界として、前記境界よりも前記ラウドスピーカ側に形成される感度特性の面積が他方より小さくなるよう前記マイクユニットの感度特性を形成する感度特性形成手段と、を設けた。
この構成により、ラウドスピーカとの音響結合が小さくなり、かつ使用者が違和感を覚えることが無く、各集音部の感度特性のバラつきと経年変化も低減される。
本発明によれば、ラウドスピーカとの音響結合が小さくなり、かつ使用者が違和感を覚えることが無く、各集音部の感度特性のバラつきと経年変化も低減されるので、高品質な全二重動作が可能となる。さらには、感度特性の主ローブが使用者にとって潜在的に感じるのとは全く異なる方向に形成されることによる予期しない誤動作、例えば誤った残響処理や指向調整制御の不具合などを防ぐことが出来る。またさらには、非線形エコーについても低減することができる。
第1の発明は、送話音声信号を集音するための複数の無指向性マイクロホン装置からなるマイクユニットと、受話音声信号を拡声するためのラウドスピーカと、送話音声信号および受話信号を送受信するための通信手段とを有し、さらにマイクユニットの音響的中心における収音方向を角度とし感度の大きさを半径方向としてマイクユニットの感度特性を表現する場合に、マイクユニットの音響的中心とラウドスピーカの音響的中心とを結ぶ放射線と直交しかつマイクユニットの音響的中心を通過する直交線を境界として、境界よりもラウドスピーカ側に形成される感度特性の面積が他方より小さくなるようマイクユニットの感度特性を形成する感度特性形成手段と、を設けた。
これにより、マイクユニットとラウドスピーカとの音響結合が小さくなり、かつ使用者が違和感を覚えることが無く、各集音部の感度特性のバラつきと経年変化も低減されるので、高品質な全二重動作が可能となる。さらには、感度特性の主ローブが使用者にとって潜在的に感じるのとは全く異なる方向に形成されることによる予期しない誤動作、例えば誤った残響処理や指向調整制御の不具合などを低減することが出来る。またさらには、非線形エコーについても低減することができる。
第2の発明は、第1の発明において、複数のマイクロホンのうち少なくとも一つは他よりラウドスピーカに近い位置に配置した構成とした。
これにより、マイクユニットの音響的中心とラウドスピーカの音響的中心とを結ぶ放射線と直交する線を境界として、その境界よりもラウドスピーカ側に形成される感度特性の面積が他方より小さくなるので、マイクユニットとラウドスピーカとの音響結合を小さくできる。
第3の発明は、第2の発明において、複数のマイクロホンの集音口を有する面と複数のマイクロホンを保護するためのマイクユニット保護部材上面との距離は、マイクロホンのそれ以外の面と保護部材との距離よりも小さくなる構成とした。
これにより、マイクユニットはラウドスピーカからの一次粗密波を主に集音することができ、マイクユニット内での反射音が拾いにくくなるので、残響低減処理の負担が低減され、さらに高品質な全二重動作が可能となる。
第4の発明は、第2の発明において、マイクユニットは2つの無指向性マイクロホン装置がマイクユニットの音響的中心とラウドスピーカの音響的中心とを結ぶ放射線上に並べて配置された構成とした。
これにより、最小個数の無指向性マイクロホンにてマイクユニットを構成可能であり、従って安価な装置コストで高品質な全二重動作が可能となる。
第5の発明は、第4の発明において、2つの無指向性マイクロホン装置の音響的中心間の距離dは、サンプリング周波数をFs、音速をc、最高処理可能周波数をf、その波長をλとした場合に、d=c/2Fs=c/4f=(1/4)λとなるように構成した。
これにより、音声通話として十分な音質感が得られ、かつ残響低減処理の負担や誤動作が軽減されるので、高品質な全二重動作が可能となる。さらには、特に高周波ひずみに対する非線形エコーの低減効果が増す。
第6の発明は、第5の発明において、マイクユニットの2つの無指向性マイクロホン装置の音響的中心間の距離dを、2つの無指向性マイクロホン装置の延長線と、スピーカの音響的中心とマイクロホン装置とを結ぶ線が交差する角度をθとして、d’=d/cosθへと補正するように構成した。
これにより、2つの無指向性マイクロホン装置の延長線がスピーカの音響的中心を通らない場合においても、スピーカの音響的中心から見た2つの無指向性マイクロホン装置の間隔が、第5の発明の条件を満たすので、十分な指向特性を得ることが可能となる。
第7の発明は、第5の発明において、マイクユニットの2つの無指向性マイクロホン装置の音響的中心間の距離dを、電気雑音や量子化雑音に対する音響信号のSN比が確保される距離d'>dへと補正するように構成した。
これにより、固定小数点演算による量子化雑音や電気基板の雑音など、雑音の影響が無視できない条件において、可能な範囲で十分な指向特性を得る事が出来る。
第8の発明は、第7の発明において、マイクユニットの2つの無指向性マイクロホン装置の音響的中心間の距離dを、電気雑音に対する音響信号のSN比が35dB以上になる距離d'>dへと補正するように構成した。
これにより、一般的な16ビット固定小数点演算による量子化雑音の下限値である35dBよりも音響信号のSN比が上回るため、16ビット固定小数点演算における最大限の指向特性を得る事が可能となる。
第9の発明は、第4の発明において、感度特性形成手段は、2つの無指向性マイクロホンのうちラウドスピーカに近い側にある無指向性マイクロホンからの入力を一定時間遅延させて出力する第一の遅延手段と、2つの無指向性マイクロホンのうちラウドスピーカから遠い側にある無指向性マイクロホンからの入力を一定時間遅延させて出力する第二の遅延手段と、ラウドスピーカから遠い側にある無指向性マイクロホンからの入力に対し第一の遅延手段の出力を減算する第一の演算手段と、ラウドスピーカに近い側にある無指向性マイクロホンからの入力に対し第二の遅延手段の出力を減算する第二の演算手段と、第二の演算手段の出力を入力し適応学習を行う適応フィルタ手段と、第一の遅延手段の出力から適応フィルタ手段の出力を減算する第三の演算手段と、を有する構成とした。
これにより、ラウドスピーカに近い側のマイクロホンの入力はラウドスピーカからの受話者の音声が強調され、他のマイクロホンの入力は送話者の音声が強調されるので、受話者音声信号と送話者の残響音の減算が容易となり、スピーカ部から複数のマイクロホンに入力される音声がさらに打ち消されるとともに、音声会議装置の周辺環境により発生する残響音も低減され、音声会議装置の使用者(送話者)の音声が極めて明瞭に、相手側の音声会議装置へと送出される。
第10の発明は、第9の発明において、第一および第二の遅延手段の遅延時間τは、サンプリング周波数をFs、最高処理可能周波数をfとした場合に、τ=d/cとなるように構成した。
これにより、送話者の音声および受話者の音声強調処理が最適となり、残響低減処理の負担がより軽減されるので、より高品質な全二重動作が可能となる。
第11の発明は、第2の発明において、マイクユニットは装置筐体上面から見てラウドスピーカの音響的中心の同心円面上に複数配置され、それらのマイクユニットの感度特性は互いに略同一であり、かつそれらのマイクユニットの音響的中心とラウドスピーカの音響的中心とを結ぶ放射線が隣接するマイクユニットの音響的中心とラウドスピーカの音響的中心とを結ぶ線となす角度は同一である構成とした。
これにより、あらゆる方向に存在する送話者の音声の集音不均一が低減され、さらに高品質な全二重動作が可能である。
第12の発明は、第11の発明において、マイクユニットを4つ配置する構成とした。
これにより、上から俯瞰すれば圧倒的に長方形または正方形が多いテーブルや部屋の各辺からの集音の均一化を最小のマイクユニット数で実現でき、安価な装置コストでさらに高品質な全二重動作が可能となる。
第13の発明は、第4の発明において、2つの無指向性マイクロホン装置の音響的中心間の距離xが、サンプリング周波数をFs、音速をc、最高処理可能周波数をf、その波長をλとした場合にx=hc/2Fs=hc/4f=(1/4)hλ(但しh<1)とするように構成した。
これにより、マイクユニットに配置された2つのマイクロホンの間の距離がさらに縮まるので、それぞれのマイクロホンに異なる反射音が入力するのを低減することができ、さらに高品質な全二重動作が可能となる。さらには、特に高周波ひずみに対する非線形エコーの低減効果が増す。
第14の発明は、第9の発明において、前記マイクユニット2つの無指向性マイクロホン装置の音響的中心間の距離をd、音速をcとした場合、前記第一の遅延手段の遅延時間τ1はτ1=d/cとなり、前記第二の遅延手段の遅延時間τ2は、2つの無指向性マイクロホン装置の延長線と、マイクロホン装置と通話者とを結ぶ線分との角度をθとして、τ2=d・cosθ/cとなるように構成した。
これにより、通話者の2つの無指向性マイクロホン装置の延長線上に位置しないような装置構成・デザイン構成の場合でも、τ2を通話者の音声が2つの無指向性マイクロホン装置にそれぞれ到達する時間の差に一致させる事が出来るので、通話者の音声をクリアに収音する事が可能になる。
第15の発明は、第9の発明において、前記マイクユニット2つの無指向性マイクロホン装置の音響的中心間の距離をd、音速をcとした場合、前記第一の遅延手段の遅延時間τ1は、2つの無指向性マイクロホン装置の延長線と、スピーカ中心とマイクロホン装置とを結ぶ線が交差する角度をθ1として、τ1=d・cosθ1/cとなり、前記第二の遅延手段の遅延時間τ2は、2つの無指向性マイクロホン装置の延長線と、マイクロホン装置と通話者とを結ぶ線分との角度をθ2として、τ2=d・cosθ2/cとなるように構成した。
これにより、通話者、およびスピーカの音響的中心が、2つの無指向性マイクロホン装置の延長線上にそれぞれ位置しないような装置構成・デザイン構成の場合でも、τ1はスピーカの信号が2つの無指向性マイクロホン装置に到達する時間の差に一致し、τ2は通話者の音声が2つの無指向性マイクロホン装置に到達する時間の差に一致させる事が出来るので、スピーカより再生された音声と通話者の音声とを正確に分離する事が可能となる。
以下、本発明の実施の形態について図面を用いて説明する。
(実施の形態1)
図1は、本発明の実施の形態1における音声会議装置の斜視図、図2は、本発明の実施の形態1における音声会議装置の上面図であり、図1の音声会議装置を上面から見た図である。
図1、図2において、1は音声会議装置、2a〜2dは使用者の音声を集音するための集音部、3は受話音声を再生するスピーカ部、4は発信/着信や各種設定などの操作を行う操作ボタン、5は通話や設定の状態などを表示する表示装置、6または7は相手側回線と接続する通信ケーブルである。6はEthernet(登録商標)ケーブル、7は電話線であり、6と7は通信手段に応じていずれか一方が使用される。実際には互いに離れた2つ以上の音声会議装置が通信手段を介し接続され使用される。
図3及び図4は、本発明の実施の形態1における2つの音声会議装置を接続した構成例を示す図であり、2つの音声会議装置1a、1bがEthernet(登録商標)ケーブル6を使用して接続された時の様子を示している。
図3に示す音声会議装置1aおよび1bは、図1における音声会議装置1と同一のものである。音声会議装置1aおよび1bはそれぞれEthernet(登録商標)ケーブル6aおよび6bによりゲートウェイ10aおよび10bを介してインターネット11に接続され、互いに通話出来るようになっている。音声会議装置1aと1bとの間で送受信される音声の信号は、図3の場合、デジタル信号がパケット化されたデータである。
なお、ゲートウェイ10aやゲートウェイ10bには他の端末装置やハブやルータなどが接続されていても構わないし、ゲートウェイ10aと音声会議装置1aとの間またはゲートウェイ10bと音声会議装置1bとの間にも他の端末装置やハブやルータなどが接続されていても構わない。
また、図4に示すように、音声会議装置1aおよび1bがそれぞれ電話線7aおよび7bにより公衆電話回線12に接続されているものであっても良い。この場合、少なくとも電話線7aおよび7b上ではアナログ音声信号で送受信が行われる。
なお、本実施の形態における音声会議装置1aおよび1bは、それぞれの集音部(図2における音声会議装置1の2a〜2dに相当)に入力される当該音声会議装置の使用者の音声については、その音声会議装置に内蔵されたスピーカ部(図2における音声会議装置1のスピーカ部3に相当)には出力しないようにしている。これは、内蔵マイクロホンに入力された当該音声会議装置の使用者の音声を当該音声会議装置のスピーカから出力するようにした場合、ハウリングを起こしやすいためである。しかしながらもしハウリングが発生しないよう装置を構成することができるのであれば、内蔵マイクロホンに入力された当該音声会議装置の使用者の音声を当該音声会議装置のスピーカから出力するようにしても良い。
以上の図1〜図4に示す構成により、音声会議装置1aを使用する話者と音声会議装置1bを使用する話者は互いに離れていながら会話を行うことができる。なお、それぞれの音声会議装置1aおよび1bを使用する話者は1人に限らず、複数人であってもよい。
図5は、本発明の実施の形態1における音声会議装置のハードウェアブロック図を示している。
図5において、40はDSP内蔵のCPU、41はCPU40での各種処理を実行するためのプログラムソフトウェアを格納するプログラムメモリ、42はプログラムメモリ41に格納された各種プログラムをCPU40で実行するために必要となる作業用のメインメモリである。これらにより、MAC層レベル以上でのパケット処理や、ダイヤルトーンやメロディなどの出力処理が行われる。
43はEthernet(登録商標)の物理層レベルでのプロトコル処理をおこなうためのPHYチップ、46はEthernet(登録商標)ケーブル6を接続するための通常RJ−45と呼ばれるコネクタである。CPU40で処理される音声データのパケットは、PHYチップ43、コネクタ46およびEthernet(登録商標)ケーブル6を介して送受信される。
また、CPU40にはキーボード44、LCD45、コントローラ47が接続されている。キーボード44は操作ボタン4の内部に格納され、LCD45は表示部5の内部に格納される。コントローラ47はキーボード44の入力処理を担当している。
50はエコーキャンセル処理を行うDSP、51はDSP50での各種処理を実行するためのプログラムソフトウェアを格納するプログラムメモリ、52はプログラムメモリ51に格納された各種プログラムをDSP50で実行するために必要となる作業用のワークメモリである。
DSP50にはタイミング調整用PLD54およびCODEC部55を介してマイクロホン/スピーカ部56が接続されている。マイクロホン/スピーカ部56のアナログ入出力信号はCODEC部55においてデジタル化された後、DSP50においてマイクロホンとラウドスピーカとの間のエコーキャンセル処理が実行される。これらの部分ブロック58のより詳細なブロック図については後述の図6において説明する。マイクロホン/スピーカ部56は8個のマイクロホンと1個のラウドスピーカからなる。マイクロホンは集音部2a〜2dに各2個ずつ設置され、ラウドスピーカはスピーカ部3に設置されているが、これらのより詳細な構成についても後述の図6以降において行う。
本実施の形態における音声会議装置1が電話線7を介して公衆電話回線12に接続され使用される場合は、CODEC部55に対して電話線7を接続するための公衆回線I/F部57が図4の点線に示すようにさらに接続されるが、公衆回線I/F部57の詳細については省略する。
図6は、本発明の実施の形態1におけるDSP、タイミング調整用PLD、CODEC部およびマイク/ラウドスピーカ部のブロック図であり、図5をより詳細に示したものである。
本実施の形態の場合、CODEC部55は2つのCODEC−IC55aおよび55bからなる。CODEC−IC55aおよび55bに対して8個のマイクロホン21a〜21d、22a〜22dおよびラウドスピーカ30が、図6に示すように、各マイク駆動回路61a〜61d、62a〜62dおよびスピーカ増幅回路63を介して接続される。マイクロホン21aとマイク駆動回路61aおよびマイクロホン22aとマイク駆動回路62aは、実際には2系統の独立した回路であるが、図6においてはマイク駆動回路61aと62aおよびそれらを介したマイクロホン21aおよびマイクロホン22aとCODEC部55との間の接続線は1つに省略されている。マイクロホン21b〜21dおよび22b〜22dとマイク駆動回路61b〜61dおよび62b〜62dとのそれぞれの関係も同様である。
次に、本実施の形態の音声会議装置1に内蔵されるマイクロホンとラウドスピーカとの配置関係について説明する。
図7は、本発明の実施の形態1におけるラウドスピーカの説明図であり、ラウドスピーカ30の例を示している。
図8は、本発明の実施の形態1におけるマイクロホンとラウドスピーカとの配置関係を示す図であり、マイクロホン21・22と図7に示すラウドスピーカ30が音声会議装置1に内蔵された場合の配置関係をその筐体上面から見た状態を示している。
図9は、本発明の実施の形態1におけるDSPのマイクロホンに係る処理ブロックを示す図であり、DSP50内においてマイクロホン21・22に関わる部分の処理ブロックを示している。
図10は、本発明の実施の形態1におけるマイクロホンとラウドスピーカの配置関係を示す図であり、図8に示す音声会議装置1の集音部20a〜20dの一つに配置されたマイクロホン21・22とスピーカ部3に配置されたラウドスピーカ30との配置関係を断面方向から示したものである。
図8の集音部2a〜2dおよびスピーカ部3において、マイクロホン21a〜21dおよび22a〜22dとラウドスピーカ30はそれらの位置がわかるよう描かれているが、実際にはそれぞれ集音部2およびスピーカ部3の内部に配置されているものであり、外部から直接視認することはできない。
図6において、マイクロホン部21a〜21d、22a〜22dに入射した音波は電圧に変換され、CODEC部55によりデジタル信号化され、DSP50によりエコーキャンセル処理がなされ、図5のCPU40においてパケット処理がなされ、PHYチップ43およびコネクタ46を介してEthernet(登録商標)またはインターネット上にある相手側の音声会議装置(例えば図3において本会議装置を1aとするならば、相手側の音声会議装置は1b)へと送出される。
図7(a)は、ラウドスピーカ30の背面図、図7(b)は、ラウドスピーカ30の側面方向から見た断面構成図、図7(c)はラウドスピーカ30の動作を簡潔に示すための概略断面図である。
ラウドスピーカ30は、詳細には図7(a)、(b)に示すような構造を有しているが、原理的には図7(c)に示すとおり、振動板であるコーン紙31、コイル35、磁石37により動作の説明が可能である。すなわち、コイル35に図5におけるスピーカ増幅回路63からの音声の電気信号を流せば、フレミングの法則によってコイル35につながっているコーン紙31が前後に振動して音になる。コーン紙31の振動方向は図7(a)〜(c)に示すとおりである。
ラウドスピーカ30から出力されるのはEthernet(登録商標)またはインターネット上にある相手側の音声会議装置(例えば図2において本会議装置を1aとするならば、相手側の音声会議装置は1b)において集音された音声であり、図6におけるコネクタ46およびPHYチップ43を介して受信された相手側の音声会議装置からのパケットがCPU40においてパケット処理がなされ、DSP50を介してCODEC部55によりアナログ信号に変換された後、スピーカ増幅回路63により増幅された信号が入力される。
本実施の形態の音声会議装置1においては、以上のようなマイクロホン21a〜21d・22a〜22dおよびラウドスピーカ30が、図8に示す21a〜21dおよび22a〜22dのように配置される。すなわち、各マイクロホン21a〜21dおよび22a〜22dの振動板の振動方向はラウドスピーカ30により発生する疎密波の伝播方向に対し略直交し、かつラウドスピーカ30に対し第1のマイクロホン21a〜21dよりも第2のマイクロホン22a〜22dのほうが距離dだけ近くに設置されている。本実施の形態の場合、2つのマイクロホン21a・22a〜21d・22dのそれぞれの間の距離dは(数1)に示すように、最高処理周波数fの波長の1/4とする。
Figure 2008245250
2つのマイクロホン21a・22a〜21d・22dのそれぞれの間の距離dを、d=(1/4)λ程度に設定する事が望ましい理由を図11により説明する。
図11の円グラフ(a)と(b)はマイクロホン組の信号処理によって合成される、最高周波数付近の指向性を示すポーラパターンであり、死角方向の感度が最小になる事が望ましい。図11(b)の円グラフのようにマイクの間隔dがλの1/4倍よりも大きくなると、死角方向に空間的な折り返しが発生してしまう。一方、図11(a)の円グラフのようにマイクの間隔dがλの1/4倍に等しいと、死角方向の感度が比較的低くなり、望ましい指向特性を得ることが出来る。逆に、マイクの間隔dがλの1/4倍より小さくなる場合、図12のグラフに示すように、死角と反対側の主ローブの感度はマイクロホンの間隔dに比例するため、感度が低下して相対的に雑音が大きくなり、音声品質が損なわれる。以上より、これら両方が最適なマイクロホン間隔は、d=λ/4の近傍となる。
空気中での音速度cは通常340m/秒であり、最高処理可能周波数は本実施の形態1の場合7kHzとなるが、その場合のマイク間隔dは約12mmとなる。
最高処理可能周波数を7kHzとする第1の理由は、ここまでの周波数の音声が処理できれば音声通話として十分な音質感が得られることにある。最高処理周波数fが高くすればより高音質な音声通話が可能となるように思えるが、実際には本実施の形態に示すような音声会議装置においては使用者が実感できるほどの音質感の違いが得られず、逆に、(数1)を見ればわかるように、そのためにサンプリング周波数Fsも上げなければならないので、DSP50の演算量が増加してしまう。
最高処理可能周波数を7kHzとする第2の理由としては、通常のADコンバータのアンチエイリアスフィルタの阻止域はサンプリング周波数の0.5倍よりも低い周波数に設定されるので、一般的な16kHzサンプリングのADコンバータにおける実用的な最高周波数は7kHz程度となる。
2つのマイクロホンの距離をd=(1/4)λから補正する例について、図13を用いて説明する。2つのマイクロホンの音響的中心を結んだ線の延長上に、スピーカの音響的中心が位置しない場合、スピーカの音響的中心と2つのマイクロホンの中間位置とを結ぶ線が、2つのマイクロホンの延長線と交差する角度をθとして、間隔をd’=d/cosθ へと補正する事が望ましい。これにより、スピーカの音響的中心から2つのマイクロホンに到達する音波の伝播方向における行程差が、d=(1/4)の条件を満たす事になり、感度と指向特性の点で望ましい性能を得ることが出来る。例えば、d=(1/4)λ=12mmで、角度θが30度の場合は、d’=12mm/cos30°=約14mmに補正すればよい。
2つのマイクロホンの距離dを補正するもう一つの例について、図14を用いて説明する。固定小数点演算による量子化雑音や電気基板の雑音など、一定の大きさの雑音の混入が避けられない条件下で、図14(a)の2つのマイクロホンの音響的中心間の距離dを、図14(b)のグラフに示すd=(1/4)λに設定すると、上記雑音に対する音響信号のSN比が不足する場合がある。そのような場合は、マイクロホンの間隔dをSN比が確保できる距離d'=(1/4)λ+α>dへと補正する必要がある。これにより、量子化雑音や電気ノイズなどの雑音の影響が無視できない条件においても、妥当な指向性能を得る事が出来る。例えば、d=(1/4)λ=12mmの場合、d’=約14mmに補正する。
上記の雑音による距離dの補正の具体的な例としては、図14の(a)と(b)のグラフに示すように、音響信号のSN比が約35dBを上回るように、距離dを(1/4)λよりも少し大きな値に補正する場合がある。これは、一般的な16ビット固定小数点演算による量子化雑音の下限値が35dB前後であるので、その条件下で得られる最大限の指向特性の実現が可能となる。
図8のマイクユニットすなわち集音部2a〜2dにおいては、それぞれ2つの無指向性マイクロホン装置21a・22a〜21d・22dが集音部2a〜2dの音響的中心82a〜82dとラウドスピーカ30の音響的中心83とを結ぶ放射線81a〜81d上にそれぞれ並べて配置されている。各集音部2a〜2dにおける無指向性マイクロホンの数を2とすることにより、最小個数の無指向性マイクロホンにてマイクユニットすなわち各集音部2a〜2dを構成可能であり、従って安価な装置コストで高品質な全二重動作が可能となる。
さらに、マイクユニットすなわち集音部2a〜2dは音声会議装置1の筐体上面から見てラウドスピーカ30の音響的中心83を中心とする同心円面86上に複数、本実施の形態の場合は4つ配置されており、それらのマイクユニットすなわち集音部2a〜2dの感度特性85a〜85dは互いに略同一であり、かつそれらのマイクユニットすなわち集音部2a〜2dの音響的中心82a〜82dとラウドスピーカ30の音響的中心83とを結ぶ放射線81a〜81dが隣接する放射線となす角度は同一である。これにより、あらゆる方向に存在する送話者の音声の集音不均一が低減され、高品質な全二重動作が可能である。
それに加えマイクユニットすなわち集音部が4つ配置されているのは、テーブルや部屋を上から俯瞰すれば圧倒的に長方形または正方形が多いということによる。よってこの構成が最小のマイクユニット数でテーブルや部屋の各辺からの集音の均一化を最も期待できると言え、安価な装置コストでさらに高品質な全二重動作が可能となる。
ここで、集音部2a〜2dの各部の音響的中心における収音方向を角度とし感度の大きさを半径方向として、集音部2a〜2dの感度特性85a〜85dを表現する場合について考える。集音部2a〜2dの音響的中心82a〜82dとラウドスピーカ30の音響的中心83とを結ぶ各放射線81a〜81dのそれぞれに直交しかつ音響的中心82a〜82d上を通過する直交線84a〜84dを境界として、それらの境界よりも各集音部2a〜2dの感度特性85a〜85dのラウドスピーカ30側に形成される面積が他方より小さくなるよう、後述の感度特性形成手段により各集音部2a〜2dの2組のマイクロホン21a〜21dおよび22a〜22dを用いて感度特性85a〜85dが形成されている。すなわち感度特性85a〜85dの主ローブは、音声会議装置1の使用者が潜在的かつ無意識に考えている方向、つまり各放射線81a〜81d上であってラウドスピーカ30とは反対の方向に形成されている。
ここで集音部2a〜2dの音響的中心は、複数の無指向性マイクロホン装置、すなわち本実施の形態1の場合は各2組のマイクロホン21a〜21dおよび22a〜22dをその振動板の振動方向から見た場合の振動板の中心といずれも等距離にある点を仮想的に設定している。また、ラウドスピーカ30の音響的中心83についても、ラウドスピーカ30の振動板を振動方向から見た場合の中心を仮想的に設定している。
重要なのは、各マイクロホン21a〜21dおよび22a〜22dの振動板の振動方向がラウドスピーカにより発生する疎密波の伝播方向に対し略直交し、ラウドスピーカ30に対し各集音部2a〜2dにおける各第1のマイクロホン21a〜21dよりも各第2のマイクロホン22a〜22dのほうがより近くに設置されていることである。後述の感度特性形成手段は、このようなマイクロホンの配置により初めて図8に示すような各集音部の感度特性を形成することが出来る。もし各集音部に配置されるマイクロホンが3組以上である場合には、それらの少なくとも一つのマイクロホンが他よりもラウドスピーカに近い位置に配置されていれば、各集音部の音響的中心とラウドスピーカの音響的中心とを結ぶ放射線と直交する線を境界として、その境界よりもラウドスピーカ側に形成される感度特性の面積が他方より小さくなる。
以上のような構成により、マイクユニットとラウドスピーカとの音響結合が小さくなり、使用者が違和感を覚えることが無く、各集音部2a〜2dの感度特性85a〜85dのバラつきと経年変化も低減されるので、高品質な全二重動作が可能となる。さらには、感度特性の主ローブが使用者にとって潜在的に感じるのとは全く異なる方向に形成されることによる予期しない誤動作、例えば誤った残響処理や指向調整制御の不具合などを防ぐことができる。
各集音部2a〜2dの2組のマイクロホン21a〜21dおよび22a〜22dを用いて感度特性85a〜85dを形成するための感度特性形成手段は、本実施の形態の音声会議装置1においては主に図9に示すDSP50内におけるマイクロホン21a〜21d(図9以降においては以下、代表して21と表す)からの入力信号の処理回路ブロック59である。以下、図9以降においては各集音部2a〜2dを代表して2と、各マイクロホン21a〜21dおよび22a〜22dを代表して21および22と、各集音部2a〜2dの音響的中心82a〜82dを代表して82と、集音部2a〜2dの音響的中心82a〜82dとラウドスピーカ30の音響的中心83とを結ぶ各放射線81a〜81dを代表して81と、そのそれぞれに対応する直交線84a〜84dを代表して84と、各集音部2a〜2dの感度特性85a〜85dを代表して85として説明する。
図9において、マイク駆動回路61および62を介して第1のマイクロホン21および第2のマイクロホン22からのアナログ入力信号を入力しデジタル信号化するA/Dコンバータ60および64はCODEC部55内にある。
59は、DSP50のプログラムメモリ51に格納されたプログラムにより構成される本発明に関わる部分の処理ブロックである。それぞれのA/Dコンバータ60および64からの出力データからは、互いに他の出力を遅延フィルタ65または66を通して遅延させた信号が減算される。本実施の形態1の場合、遅延フィルタ65および66の遅延時間は(数2)により求められる。
Figure 2008245250
すなわち1サンプリング周期1/Fsであり、最高処理可能周波数fの波形を入力した場合は1/4波長分遅らせることが出来る。これにより、後述の送話者の音声および受話者の音声強調処理が最適となり、残響低減処理の負担がより軽減されるので、より高品質な全二重動作が可能となる。
演算器67は、ラウドスピーカ30に対してより近くに位置している第2のマイクロホン22からの入力信号を処理するA/Dコンバータ64の出力データが遅延フィルタ66により遅延時間τだけ遅延されたデータを、第1のマイクロホン21からの入力信号を処理するA/Dコンバータ60の出力データより減算し出力する。第1のマイクロホン21と第2のマイクロホン22とは最高処理可能周波数fの1/4波長だけ離れているので、特にラウドスピーカ30から2つのマイクロホン21および22に入力される受話者の音声が打ち消し合うこととなる(これを「メイン・ビーム」と呼ぶ)。
演算器68は、ラウドスピーカ30に対してより近くに位置している第2のマイクロホン22からの入力信号を処理するA/Dコンバータ64の出力データから、第1のマイクロホン21からの入力信号を処理するA/Dコンバータ63の出力データが遅延フィルタ65により遅延時間τだけ遅延されたデータを減算し出力する。第1のマイクロホン21と第2のマイクロホン22とは最高処理可能周波数fの1/4波長だけ離れているので、ラウドスピーカ30とは別の方向、特にラウドスピーカ30とは逆の方向から2つのマイクロホン21および22に入力される使用者(送話者)の音声が打ち消し合うこととなる(これを「ヌル・ビーム」と呼ぶ)。以上のような遅延加算処理により、ラウドスピーカ30に近い側のマイクロホン22の入力はラウドスピーカ30からの受話者の音声が強調され、反対側のマイクロホン21の入力は送話者の音声が強調されるので、後述の適応フィルタ69および減算器70において受話者音声信号と送話者の残響音の減算が容易となり、高品質な全二重動作が可能となる。
減算器70は、演算器68の出力データ(ヌル・ビーム)が適応フィルタ69により処理されたデータを演算器67の出力データ(メイン・ビーム)より減算する。これにより、ラウドスピーカ30から2つのマイクロホン21および22に入力される音声がさらに打ち消されるとともに、音声会議装置1の周辺環境により発生する残響音も低減され、音声会議装置1の使用者(送話者)の音声が極めて明瞭に、遠端話者の音声会議装置へと送出される。なお、減算器70の後段には、マイクロホン21および22とラウドスピーカ30との間のエコー(線形エコーという)をキャンセルするための別の適応フィルタが配置されていても良い。
本実施の形態の音声会議装置1の適応フィルタ69は、音声会議装置1のラウドスピーカ30より通信相手である遠端話者の音声会議装置からの音が出力されており、音声会議装置1の使用者は音声会議装置1に向かって話をしていない状況で学習作業を行う。ここで、適応フィルタ69の一つの例として、FIRフィルタが用いられる場合について説明する。
まず、演算器67の出力データ(メイン・ビーム)と演算器68の出力データ(ヌル・ビーム)に相関が高いエコー信号成分との関係は、理論的に(数3)で表されると仮定できる。
Figure 2008245250
上記(数3)においてヌル・ビームに相関が高いエコー成分は、もしマイクロホン21および22に入力される音が純粋にラウドスピーカ30からの音と全く同一であればヌル・ビームと全く同一となるはずであるが、実際には、ラウドスピーカ30での電気信号から空気振動への変換時における音響的ひずみ(ラウドスピーカ30の固有振動数や周波数特性に起因する、特に安価なラウドスピーカにおいては高周波ひずみが問題となる)やラウドスピーカの振動に伴う音声会議装置1の筐体振動などにより、様々なエコー信号が含まれている。ただし、この(数3)におけるヌル・ビームに相関が高いエコー成分を直接算出するのは困難である。そこで、適応フィルタ69はヌル・ビームを基に、(数4)に従って擬似エコー信号を合成する。
Figure 2008245250
減算器70はメイン・ビームからこの擬似エコー信号を減算する。これによりエコー信号がメイン・ビームより減衰される仕組みとなっている。従って、減算器70の出力信号は以下の(数5)により求められる。
Figure 2008245250
適応フィルタの推定誤差がゼロであれば(数5)右辺の第1項と第2項との関係は以下の(数6)および(数7)となり、(数5)における減算器70の出力信号は0となるはずである。
Figure 2008245250
Figure 2008245250
だが現実には推定誤差が存在するので、(数6)および(数7)とはならない。特に、遠端話者のみが発声し、近端話者が発声していない時の(数5)は残留エコー(エラー)信号と呼ばれ、以下の(数8)のように表される。
Figure 2008245250
このような適応フィルタでは、フィルタ係数を推定誤差が少ない方向に更新(学習)していく事が重要であり、その学習のアルゴリズムは数種類知られている。音声の収束が良い事で一般的なNLMS法では、(数9)に示すようにフィルタ係数を更新する。
Figure 2008245250
この種のアルゴリズムにより、適応フィルタによるエコーの減算と係数の更新が並行的に行われ、メイン・ビームに混入したヌル・ビームのエコー成分が減衰され続け、より純粋に近いメイン・ビームすなわち近端話者の音声信号のみを出力する事が可能となる。なお、本実施の形態における適応フィルタ69については、FIRフィルタをその一つの例として取り上げて説明したが、本実施の形態の音声会議装置の適応フィルタは特にFIRフィルタに限るものではなく、例えば周波数領域適応フィルタやサブバンド分割型適応フィルタを用いても良い。
従来、適応フィルタはある方向にいる近端話者の音声をより鮮明に抽出するための適応処理を行うものであったが、本実施の形態の音声会議装置における適応フィルタ69は、音声会議装置の周囲にいる近端話者に対してはラウドスピーカ30からの音声が聞こえるように維持しつつ、ラウドスピーカ30から出力されマイクロホン21および22に入力される遠端話者の音声のエコーをキャンセルすることに貢献している。特に、ラウドスピーカ30での電気信号から空気振動への変換時における音響的ひずみによるエコー信号や、ラウドスピーカ30の振動に伴う音声会議装置1の筐体振動などによるエコー信号などのいわゆる非線形エコーに対して効果がある。すなわち、本発明の感度特性形成手段(図9の処理ブロック59に相当)は、マイクユニット2の感度特性をラウドスピーカ30からの出力音声が拾いにくくなるよう形成することに加えて、非線形エコーを低減できるという特徴を併せ持つ。この適応フィルタ69のエコーキャンセル効果をさらにアップするために、前述のように2つのマイクロホン21・22の音響的中心間の距離dを(数1)のように設定すれば、特に高い周波数のひずみに対して効果的である。
図8に示す音声会議装置1の集音部2a〜2dの一つを代表して集音部2とし、そこに配置されるマイクロホン21および22とスピーカ部3に配置されたラウドスピーカ30との配置関係を断面方向から見たものが図10である。相手側の音声会議装置において集音された音声はラウドスピーカ30より出力される。すなわち、そのコーン紙31の振動が空気の粗密波38a及び38bを発生させて音声会議装置1の筐体外部を伝播し、周囲にいる使用者にその音声が伝わる。
集音部2の複数のマイクロホン21および22の振動板の振動方向はラウドスピーカにより発生する疎密波の伝播方向に対し略直交している。また、集音部2の複数のマイクロホン21および22の振動板28の振動方向はその直上にあるマイクユニットすなわち集音部2の保護部材20の上面と略直交し、ラウドスピーカ30の振動板28の振動方向はその直上にある保護部材3aの上面と略直交している。
このとき、マイクロホン21および22にはラウドスピーカ30からの音声、すなわち相手側の音声会議装置において集音された音声や、周辺の残響などが入力されてしまうが、先に説明した図9に示す処理ブロックによりこれらは低減されるので、本音声会議装置の周辺にいる使用者の音声が極めて明瞭に、相手側の音声会議装置へと送出される。
もし、マイクロホン21および22を、図15の21eおよび22eのように配置すると、ラウドスピーカ30により発生する相手側の音声会議装置において集音された音声の空気粗密波がマイクロホン21eおよび22eに多少なりとも入射しにくくなるかもしれない。しかしながらそのメリットよりも、ラウドスピーカ30からの距離差がほとんど取れないことによる図9のエコーキャンセル処理効果の喪失のほうが極めて大きい。従って、2つのマイクロホン21および22は、図10に示すように配置するほうが良い。
なお、マイクユニットすなわち集音部2の複数のマイクロホン21および22の集音口を有する面とマイクユニットすなわち集音部2の保護部材20の上面との距離は、マイクロホン21および22のそれ以外の面と保護部材20との距離よりも小さくなるよう配置することが望ましい。これによりマイクユニットすなわち集音部2はラウドスピーカ30からの一次粗密波を主に集音することができ、マイクユニットすなわち集音部2内での反射音が拾いにくくなるので、残響低減処理の負担が低減され、さらに高品質な全二重動作が可能となる。
なお、本実施の形態における音声会議装置1はラウドスピーカ30を一つだけ備えた構成であるが、ラウドスピーカは一つに限定するものではなく、複数備えていても良い。その場合、例えば音声会議装置の上面から見た場合にスピーカ部が備える複数のラウドスピーカの各音響的中心から等距離にある点を音声会議装置のスピーカ部の音響的中心とすることができる。
以上のように本実施の形態によれば、ラウドスピーカとの音響結合が小さくなり、かつ使用者が違和感を覚えることが無く、各集音部の感度特性のバラつきと経年変化も低減されるので、高品質な全二重動作が可能となる。さらには、感度特性の主ローブが使用者にとって潜在的に感じるのとは全く異なる方向に形成されることによる予期しない誤動作、例えば誤った残響処理や指向調整制御の不具合などを防ぐことができる。
(実施の形態2)
本発明における実施の形態2における信号遅延時間の補正の例を図16に示す。図10との相違点は、送話者の位置が机面と平行に位置し、2個のマイクの延長線方向より角度θの方向に送話者が存在すると仮定しており、より実際に近い。それぞれのA/Dコンバータ60および64からの出力データには、互いに他の出力を遅延フィルタ65または66を通して遅延させた信号が減算される。本実施の形態の場合、ラウドスピーカ30に対してより近くに位置している第2のマイクロホンに適用される遅延フィルタ65の遅延時間τ1は、(数10)により求められる。
Figure 2008245250
一方、図16においてラウドスピーカ30に対してより遠くに位置している第1のマイクロホンに適用される遅延フィルタ66の遅延時間τ2は、(数11)により求められる。
Figure 2008245250
すなわち、τ2はτ1よりも遅延時間が小さい。これにより、実際に送話者が位置する方向からの音声信号が強調されるので、集音効率が一層向上し、高品質な全二重動作が可能となる。
このように遅延時間を設定する効果の例を、図16にて説明する。ここではマイクユニット間隔d=14mm,ユニットの延長方向と机面が形成する角度θ=30°と仮定し、指向性パターンを例示している。
最初に、メインビームの指向性パターンを示す。メインビームとは近端話者の音声方向に感度が強く、その反対側は死角となるように合成された指向性パターンの出力信号であり、図16(a)ではaの矢印で示す机面と平行な方向に指向角を向ける事が目的である。この図の場合、近端話者に近い側と遠い側のマイク信号が互いに一致するように、両マイク間の音波の到達時間の差に合わせた遅延を、近端話者に近い側のマイク信号に与えれば良い。その遅延時間τ2がτ2=d/cの場合、図16(b)の円グラフのように、近端話者の反対方向にも感度が多く残り、死角の形成が不十分である。一方、τ2=d・cosθ/cの場合は図16(c)の円グラフのように、近端話者の反対方向に鋭い死角が形成され、この方が優れている事が判る。
次に、ヌルビームの指向性パターンを示す。ヌルビームとは通話装置のスピーカの方向、すなわち音響エコーの最大の到達方向に感度が強く、その反対側は死角となるように合成された指向性パターンの出力信号であり、図16(a)ではbの矢印で示す2個のマイクの延長線上でスピーカの方向に指向角を向ける事が目的である。この図の場合、スピーカに近い側と遠い側のマイク信号が互いに一致するように、両マイク間の音波の到達時間の差に合わせた遅延を、スピーカに近い側のマイク信号に与えれば良い。その遅延時間τ1がτ1=d/cの場合、図16(d)の円グラフのように、スピーカと反対方向に鋭い死角が形成され、この遅延時間が妥当である事が判る。一方、メインビーム側と同様にτ1=d・cosθ/ cを適用する場合は図16(e)の円グラフのように、スピーカの反対方向にも感度が多く残り、死角の形成が不十分である。
以上から本実施の形態のように、指向性を合成する遅延時間τを、メインビーム側とヌルビーム側の目的とする音源の方向で換算した行程差をそれぞれ適用する事によって、メインビーム・ヌルビームの指向性を正確に実現する事が可能になる。
(実施の形態3)
本発明における実施の形態3における信号遅延時間の補正の例を図17に示す。図17(b)に示すように図16と比較して、送話者の位置が机面と平行に位置し、2個のマイクの延長線方向より角度θ2の方向に送話者が存在する事は図16(a)と同様であるが、更にスピーカの音響中心も2個のマイクの延長線方向に位置しておらず、角度θ1の方向に位置している。本実施の形態の場合、図17(a)においてラウドスピーカ30に対してより近くに位置している第2のマイクロホンに適用される遅延フィルタ65の遅延時間τ1は、(数12)により求められる。
Figure 2008245250
一方、図17(b)においてラウドスピーカ30に対してより遠くに位置している第1のマイクロホンに適用される遅延フィルタ66の遅延時間τ2は、(数13)により求められる。
Figure 2008245250
以上によって、メインビームでは実際に送話者が位置する方向からの音声信号が強調され、ヌルビームでは実際にスピーカが位置する方向からの信号が強調されるので、集音効率が一層向上し、高品質な全二重動作が可能となる。
(実施の形態4)
実施の形態1においては(数1)に示すように、2つのマイクロホン21(21a〜2
1d)および22(22a〜22d)の間の距離dを最高処理周波数fの波長の4分の1程度としていたが、サンプリング周波数Fsや最高処理可能周波数fは変えずにこれよりももっと近い距離とすることもできる。すなわち、距離dの代わりに、(数14)で得られる距離xを、2つのマイクロホン21(21a〜21d)および22(22a〜22d)の間の距離とする。
Figure 2008245250
この場合、図9の回路における遅延フィルタ65および66の遅延時間τを以下のようにする。
Figure 2008245250
すなわち、サンプリング周期1/Fsのh倍(h<1)とすればよい。
以上のように本実施の形態によれば、マイクユニットすなわち集音部に配置された2つのマイクロホンの間の距離をさらに縮めるので、それぞれのマイクロホンに異なる反射音が入力するのを低減することができ、さらに高品質な全二重動作が可能となる。
(実施の形態5)
図18は、本発明の実施の形態5における電話機の斜視図であり、実施の形態1、2,3,4の音声会議装置を応用した電話機を示している。図19は、本発明の実施の形態5における電話機の上面図であり、図18の電話機を上面から見たものを示している。
図18に示すように、本実施の形態の電話機は、実施の形態1における音声会議装置と同様に集音部102およびスピーカ部103を有する。ただし集音部102は実施の形態1の音声会議装置1とは異なり、1つのみである。
図19に示す集音部102およびスピーカ部103において、マイクロホン121および122とラウドスピーカ130はそれらの位置がわかるよう描かれているが、実際にはそれぞれ集音部102およびスピーカ部103の内部に配置されているものであり、外部から直接視認することはできない。
このような電話機113が、実施の形態1の図3または図4における音声会議装置1aまたは1bのように複数台用いられ、インターネット11または公衆電話回線12等を介して接続され、互いに音声の送受信を行う。
本実施の形態における電話機113のハードウェアは、実施の形態1の音声会議装置1における図5および図6と大きな相違点は無く、これらにハンドセットの送受話インターフェース等が追加される程度で実現できる。マイクユニットすなわち集音部102に設置される2つの無指向性マイクロホン装置121・122やスピーカ部に設置されるラウドスピーカ130も、実施の形態1に示したものと大きな相違点の無いものが使用できる。
マイクユニットすなわち集音部102においては、2つの無指向性マイクロホン装置121・122が集音部102の音響的中心182とラウドスピーカ130の音響的中心183とを結ぶ放射線181上に並べて配置されている。
各集音部102a〜102dにおける無指向性マイクロホンの数を2とすることにより、最小個数の無指向性マイクロホンにてマイクユニットすなわち各集音部102a〜102dを構成可能であり、従って安価な装置コストで高品質な全二重動作が可能となる。
各マイクロホン121および122の振動板の振動方向は、ラウドスピーカ130により発生する疎密波の伝播方向に対し略直交し、かつラウドスピーカ130に対し第1のマイクロホン121よりも第2のマイクロホン122のほうが近くに設置されている。その距離は実施の形態1における(数1)により導かれるdでも良いし、実施の形態4における(数14)により導かれるxでも構わない。
集音部2の音響的中心182とラウドスピーカ130の音響的中心183とを結ぶ放射線81に対応する直交線184を境界として、その境界よりも集音部2の感度特性185のラウドスピーカ130側に形成される面積が他方より小さくなるよう、実施の形態1および実施の形態2において示したのと同様の感度特性形成手段により集音部2の2組のマイクロホン121および122を用いて感度特性185が形成されている。
以上のような構成により、ラウドスピーカとの音響結合が小さくなり、集音部102の感度特性185の経年変化も低減され、後述の送話者の音声および受話者の音声強調処理が最適となり、残響低減処理の負担がより軽減されるので、より高品質な全二重動作が可能となる。電話機113の使用者(送話者)の音声が極めて明瞭に、相手側の電話機へと送出される。
なお、マイクユニットすなわち集音部102の複数のマイクロホン121および122の集音口127を有する面とマイクユニット、すなわち集音部102の保護部材の上面との距離は、マイクロホン121および122のそれ以外の面と保護部材との距離よりも小さくなるよう配置することが望ましい。これによりラウドスピーカ130からの一次粗密波を主に集音することができ、マイクユニット内での反射音が拾いにくくなるので、残響低減処理の負担が低減され、さらに高品質な全二重動作が可能となる。
本発明にかかる音声会議装置は、高品質な全二重動作が可能となり、さらには、感度特性の主ローブが使用者にとって潜在的に感じるのとは全く異なる方向に形成されることによる予期しない誤動作、例えば誤った残響処理や指向調整制御の不具合などを防ぐことが出来るところから、例えば電話機や、音声会議システムおよびテレビ会議システムなどへの利用が可能である。
本発明の実施の形態1における音声会議装置の斜視図 本発明の実施の形態1における音声会議装置の上面図 本発明の実施の形態1における2つの音声会議装置を接続した構成例を示す図 本発明の実施の形態1における2つの音声会議装置を接続した構成例を示す図 本発明の実施の形態1における音声会議装置のハードウェアブロック図 本発明の実施の形態1におけるDSP、タイミング調整用PLD、CODEC部およびマイク/ラウドスピーカ部のブロック図 本発明の実施の形態1におけるラウドスピーカの説明図 本発明の実施の形態1におけるマイクロホンとラウドスピーカとの配置関係を示す図 本発明の実施の形態1におけるDSPのマイクロホンに係る処理ブロックを示す図 本発明の実施の形態1におけるマイクロホンとラウドスピーカの配置関係を示す図 本発明の実施の形態1におけるマイクの間隔と指向性パターンの関係を示す図 本発明の実施の形態1におけるマイクの間隔と感度の関係を示す図 本発明の実施の形態1におけるマイク間隔の補正の例を示す図 本発明の実施の形態1におけるマイク間隔の補正の例を示す図 本発明の実施の形態1におけるマイクロホンとラウドスピーカの配置関係を示す図 本発明の実施の形態2における信号遅延時間の補正の例を示す図 本発明の実施の形態3における信号遅延時間の補正の例を示す図 本発明の実施の形態5における電話機の斜視図 本発明の実施の形態5における電話機の上面図
符号の説明
1、1a、1b 音声会議装置
2、2a〜2d 集音部
3 スピーカ部
4 操作ボタン
5 表示装置
6、6a、6b 通信ケーブル(Ethernet(登録商標)ケーブル)
7、7a、7b 通信ケーブル(電話線)
10a、10b ゲートウェイ
11 インターネット
12 公衆電話回線
20 保護部材
21、21a〜21d、22、22a〜22d マイクロホン
30 ラウドスピーカ
30a 保護部材
31 コーン紙(振動板)
35 コイル
37 磁石
38a、38b 粗密波
40 CPU
41 プログラムメモリ
42 メインメモリ
43 PHYチップ
44 キーボード
45 LCD
46 コネクタ(RJ−45)
47 コントローラ
50 DSP
51 プログラムメモリ
52 DSPのワークメモリ
54 タイミング調整用PLD
55 CODEC部
55a、55b CODEC−IC
56 マイクロホン/スピーカ部
57 公衆回線I/F部
58 部分ブロック
59 処理ブロック
61、61a〜61d、62、62a〜62d マイク駆動回路
63 スピーカ増幅回路
60、64 A/Dコンバータ
65、66 遅延フィルタ
67、68 演算器
69 適応フィルタ
70 減算器
81、81a〜81d 放射線
82、82a〜82d マイクユニット(集音部)の音響的中心
83 スピーカ部(ラウドスピーカ)の音響的中心
84、84a〜84d 直交線
85、85a〜85d 感度特性
86 スピーカ部(ラウドスピーカ)の音響的中心を中心とする同心円面

Claims (15)

  1. 送話音声信号を集音するための複数の無指向性マイクロホンを有するマイクユニットと、受話音声信号を拡声するためのスピーカと、前記送話音声信号および受話音声信号を送受信するための通信手段と、前記マイクユニットの音響的中心における収音方向を角度とし感度の大きさを半径方向として前記マイクユニットの感度特性を表現する場合、前記マイクユニットの音響的中心と前記スピーカの音響的中心とを結ぶ放射線と直交し、かつ前記マイクユニットの音響的中心を通過する直交線を境界として、当該境界よりも前記スピーカ側に形成される感度特性の面積が他方より小さくなるよう前記マイクユニットの感度特性を形成する感度特性形成手段と、を有することを特徴とする音声会議装置。
  2. 前記マイクユニットの複数のマイクロホンのうち少なくとも一つは他より前記スピーカに近い位置に配置されたことを特徴とする請求項1に記載の音声会議装置。
  3. 前記マイクユニットの複数のマイクロホンの集音口を有する面と複数のマイクロホンを保護するための前記マイクユニット保護部材上面との距離は、マイクロホンのそれ以外の面と保護部材との距離よりも小さいことを特徴とする請求項2に記載の音声会議装置。
  4. 前記マイクユニットは2つの無指向性マイクロホンが前記マイクユニットの音響的中心と前記スピーカの音響的中心とを結ぶ放射線上に並べて配置されたことを特徴とする請求項2に記載の音声会議装置。
  5. 前記マイクユニットの2つの無指向性マイクロホン装置の音響的中心間の距離dは、サンプリング周波数をFs、音速をc、最高処理可能周波数をf、その波長をλとした場合、d=c/2Fs=c/4f=(1/4)λとなることを特徴とする請求項4に記載の音声会議装置。
  6. 前記マイクユニットの2つの無指向性マイクロホン装置の音響的中心間の距離dを、2つの無指向性マイクロホン装置の延長線と、スピーカの音響的中心とマイクロホン装置とを結ぶ線が交差する角度をθとして、d’=d/cosθへと補正することを特徴とする前記請求項5に記載の音声会議装置。
  7. 前記マイクユニットの2つの無指向性マイクロホン装置の音響的中心間の距離dを、電気雑音に対する音響信号のSN比が確保される距離d'>dへと補正することを特徴とする前記請求項5に記載の音声会議装置。
  8. 前記マイクユニットの2つの無指向性マイクロホン装置の音響的中心間の距離dを、電気雑音に対する音響信号のSN比が35dB以上になる距離d'>dへと補正することを特徴とする前記請求項7に記載の音声会議装置。
  9. 前記感度特性形成手段は、前記マイクユニットの2つの無指向性マイクロホンのうち前記スピーカに近い側にある無指向性マイクロホンからの入力を一定時間遅延させて出力する第一の遅延手段と、2つの無指向性マイクロホンのうち前記スピーカから遠い側にある無指向性マイクロホンからの入力を一定時間遅延させて出力する第二の遅延手段と、前記スピーカから遠い側にある無指向性マイクロホンからの入力に対し前記第一の遅延手段の出力を減算する第一の演算手段と、前記スピーカに近い側にある無指向性マイクロホンからの入力に対し前記第二の遅延手段の出力を減算する第二の演算手段と、前記第二の演算手段の出力を入力し適応学習を行う適応フィルタ手段と、前記第一の遅延手段の出力から前記適応フィルタ手段の出力を減算する第三の演算手段とを有することを特徴とする請求項4に記載の音声会議装置。
  10. 前記第一および第二の遅延手段の遅延時間τは、前記マイクロユニットの無指向性マイクロホンの音響的中心間の距離をd、音速をcとした場合、τ=d/cとなることを特徴とする請求項9に記載の音声会議装置。
  11. 前記マイクユニットは装置筐体上面から見て前記スピーカの音響的中心の同心円面上に複数配置され、それらのマイクユニットの感度特性は互いに略同一であり、かつそれらのマイクユニットの音響的中心と前記スピーカの音響的中心とを結ぶ放射線が隣接するマイクユニットの音響的中心と前記スピーカの音響的中心とを結ぶ線となす角度は同一であることを特徴とする請求項2に記載の音声会議装置。
  12. 前記マイクユニットを4つ配置したことを特徴とする請求項11に記載の音声会議装置。
  13. 前記マイクユニット2つの無指向性マイクロホン装置の音響的中心間の距離xは、サンプリング周波数をFs、音速をc、最高処理可能周波数をf、その波長をλとした場合、x
    =hc/2Fs=hc/4f=(1/4)hλ(但しh<1)となることを特徴とする請求項4に記載の音声会議装置。
  14. 前記マイクユニット2つの無指向性マイクロホン装置の音響的中心間の距離をd、音速をcとした場合、前記第一の遅延手段の遅延時間τ1はτ1=d/cとなり、前記第二の遅延手段の遅延時間τ2は、2つの無指向性マイクロホン装置の延長線と、マイクロホン装置と通話者とを結ぶ線分との角度をθとして、τ2=d・cosθ/cとなることを特徴とする請求項9に記載の音声会議装置。
  15. 前記マイクユニット2つの無指向性マイクロホン装置の音響的中心間の距離をd、音速をcとした場合、前記第一の遅延手段の遅延時間τ1は、2つの無指向性マイクロホン装置の延長線と、スピーカ中心とマイクロホン装置とを結ぶ線が交差する角度をθ1として、τ1=d・cosθ1/cとなり、前記第二の遅延手段の遅延時間τ2は、2つの無指向性マイクロホン装置の延長線と、マイクロホン装置と通話者とを結ぶ線分との角度をθ2として、τ2=d・cosθ2/cとなることを特徴とする請求項9に記載の音声会議装置。
JP2008010131A 2007-02-28 2008-01-21 音声会議装置 Expired - Fee Related JP5082878B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2008010131A JP5082878B2 (ja) 2007-02-28 2008-01-21 音声会議装置
US12/037,426 US8111838B2 (en) 2007-02-28 2008-02-26 Conferencing apparatus for echo cancellation using a microphone arrangement
PCT/JP2008/000388 WO2008120436A2 (en) 2007-02-28 2008-02-28 Voice conference apparatus providing microphone directivity to reduce acoustic coupling

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2007048762 2007-02-28
JP2007048762 2007-02-28
JP2008010131A JP5082878B2 (ja) 2007-02-28 2008-01-21 音声会議装置

Publications (3)

Publication Number Publication Date
JP2008245250A true JP2008245250A (ja) 2008-10-09
JP2008245250A5 JP2008245250A5 (ja) 2011-03-10
JP5082878B2 JP5082878B2 (ja) 2012-11-28

Family

ID=39915972

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008010131A Expired - Fee Related JP5082878B2 (ja) 2007-02-28 2008-01-21 音声会議装置

Country Status (1)

Country Link
JP (1) JP5082878B2 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010119636A (ja) * 2008-11-20 2010-06-03 Universal Entertainment Corp 遊技機
JPWO2012124422A1 (ja) * 2011-03-11 2014-07-17 三洋電機株式会社 録音装置
JP2014171108A (ja) * 2013-03-04 2014-09-18 Yamaha Corp 収音装置
WO2015029384A1 (ja) 2013-08-26 2015-03-05 京セラ株式会社 音声装置、音声システム、画像表示装置及び画像投影装置
US10951748B2 (en) 2019-04-18 2021-03-16 Lenovo (Singapore) Pte. Ltd. Electronic device for use in a teleconference

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02288455A (ja) * 1989-04-27 1990-11-28 Fujitsu Ltd 会議用通話装置
JPH1118186A (ja) * 1997-06-25 1999-01-22 Purimo:Kk 一次圧力傾度マイク

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02288455A (ja) * 1989-04-27 1990-11-28 Fujitsu Ltd 会議用通話装置
JPH1118186A (ja) * 1997-06-25 1999-01-22 Purimo:Kk 一次圧力傾度マイク

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010119636A (ja) * 2008-11-20 2010-06-03 Universal Entertainment Corp 遊技機
JPWO2012124422A1 (ja) * 2011-03-11 2014-07-17 三洋電機株式会社 録音装置
JP2014171108A (ja) * 2013-03-04 2014-09-18 Yamaha Corp 収音装置
WO2015029384A1 (ja) 2013-08-26 2015-03-05 京セラ株式会社 音声装置、音声システム、画像表示装置及び画像投影装置
US9807514B2 (en) 2013-08-26 2017-10-31 Kyocera Corporation Audio apparatus, audio system, image display apparatus, and image projection apparatus
US10231058B2 (en) 2013-08-26 2019-03-12 Kyocera Corporation Audio apparatus, audio system, image display apparatus, and image projection apparatus
US10951748B2 (en) 2019-04-18 2021-03-16 Lenovo (Singapore) Pte. Ltd. Electronic device for use in a teleconference

Also Published As

Publication number Publication date
JP5082878B2 (ja) 2012-11-28

Similar Documents

Publication Publication Date Title
US9749731B2 (en) Sidetone generation using multiple microphones
US10839785B2 (en) Voice sensing using multiple microphones
EP2772070B1 (en) Processing audio signals
EP3039882B1 (en) Assisting conversation
US8111838B2 (en) Conferencing apparatus for echo cancellation using a microphone arrangement
JP5394373B2 (ja) オーディオ信号を処理する装置及び方法
CN110856072B (zh) 一种耳机通话降噪方法及耳机
US20060147063A1 (en) Echo cancellation in telephones with multiple microphones
US20110181452A1 (en) Usage of Speaker Microphone for Sound Enhancement
JP2017513296A (ja) 周波数依存側音較正
JP2009171315A (ja) 音声信号送受信装置
JP3267556B2 (ja) エコー除去装置および送話器
JP2009141698A (ja) ヘッドセット
JP5082878B2 (ja) 音声会議装置
EP2257081B1 (en) Listening device with two or more microphones
US8923530B2 (en) Speakerphone feedback attenuation
US11335315B2 (en) Wearable electronic device with low frequency noise reduction
JP4941579B2 (ja) 音声信号送受信装置
US7751575B1 (en) Microphone system for communication devices
US11637932B2 (en) Method for optimizing speech pickup in a speakerphone system
WO2023047911A1 (ja) 通話システム
JP2013141118A (ja) ハウリングキャンセラ

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110121

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110121

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20110215

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120410

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120605

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120807

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120820

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150914

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees