JP4639639B2 - マイクロフォン信号生成方法および通話装置 - Google Patents
マイクロフォン信号生成方法および通話装置 Download PDFInfo
- Publication number
- JP4639639B2 JP4639639B2 JP2004148344A JP2004148344A JP4639639B2 JP 4639639 B2 JP4639639 B2 JP 4639639B2 JP 2004148344 A JP2004148344 A JP 2004148344A JP 2004148344 A JP2004148344 A JP 2004148344A JP 4639639 B2 JP4639639 B2 JP 4639639B2
- Authority
- JP
- Japan
- Prior art keywords
- microphone
- microphones
- signal
- sub
- level
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
- Circuit For Audible Band Transducer (AREA)
- Telephone Set Structure (AREA)
- Telephone Function (AREA)
Description
特に、本発明は、複数のマイクロフォンの音声信号を組み合わせて、単体のマイクロフォンの指向性とは異なる指向性を示す音声信号を生成する、マイクロフォン信号生成方法および通話装置に関する。
またテレビジョン受像機のスピーカから出力される音声が、スピーカから離れた位置にいる会議参加者には聞きにくいという問題もある。
しかしながら、遠隔会議方式としては、テレビ会議システムのような複雑な装置を用いず、音声だけで行うことでも十分な場合が多い。たとえば、同じ社内の本社と遠隔地の営業所との間で複数の会議参加者同士が会議を行うような場合は、顔見知りでもあり、互いに肉声を理解しているから、テレビ会議システムによる映像なしでも十分会議を行うことができる。
また、テレビ会議システムは便利であるが、テレビ会議システム自体を導入する投資額の大きさと、操作の複雑さと、撮像画像を伝送するために通信負担が大きいという不利益がある。
特に本発明は、複数のマイクロフォンを組み合わせて、マイクロフォン単体の指向性とは異なる指向性を持つ音声信号、好ましくは、ノイズを排除または軽減した音声信号を生成する、マイクロフォン信号生成方法および通話装置を提供することにある。
前記選択された1つのマイクロフォンが検出した音声信号を補正する前記サブマイクロフォンとして、前記複数のマイクロフォンのうちから前記最大の集音レベルを示す1つのマイクロフォンを除く少なくとも1つのサブマイクロフォンを事前に設定し、当該設定されたサブマイクロフォンの指向性、ノイズ源の位置、音量または合成マイクロフォン信号生成工程において合成するマイクロフォンの相互関係によって規定されるサブ係数を事前に設定する、サブマイクロフォン設定工程と、
前記複数のマイクロフォンのうち、前記最大の集音レベルを示す1つのマイクロフォンを選択するマイクロフォン選択工程と、
前記マイクロフォン選択工程において前記最大の集音レベルを示す1つのマイクロフォンが選択されたとき、前記サブマイクロフォン設定工程において設定された前記サブマイクロフォンの前記サブ係数を前記サブマイクロフォンが検出した音声信号に乗じ、当該乗じた値を前記選択された最大の集音レベルを示す1つのマイクロフォンの音声信号から減じて、前記選択された最大の集音レベルを示す1つのマイクロフォンの音声信号を補正する、合成マイクロフォン信号生成工程と
を具備する、マイクロフォン信号生成方法が提供される。
所定の指向性を持ち、所定の角度間隔で放射状に配設された、前記複数のマイクロフォンと、
前記選択された1つのマイクロフォンが検出した音声信号を補正する前記サブマイクロフォンとして、前記複数のマイクロフォンのうちから前記最大の集音レベルを示す1つのマイクロフォンを除く少なくとも1つのサブマイクロフォンを事前に設定し、当該設定されたサブマイクロフォンの指向性、ノイズ源の位置、音量または合成マイクロフォン信号生成手段において合成するマイクロフォンの相互関係によって規定されるサブ係数を事前に設定する、サブマイクロフォン設定手段と、
前記複数のマイクロフォンのうち、前記最大の集音レベルを示す1つのマイクロフォンを選択するマイクロフォン選択手段と、
前記マイクロフォン選択手段によって前記最大の集音レベルを示す1つのマイクロフォンが選択されたとき、前記サブマイクロフォン設定手段によって設定されたサブマイクロフォンの前記サブ係数を前記サブマイクロフォンが検出した音声信号に乗じ、当該乗じた値を前記選択された最大の集音レベルを示す1つのマイクロフォンの音声信号から減じて、前記選択された最大の集音レベルを示す1つのマイクロフォンの音声信号を補正する、合成マイクロフォン信号生成手段と
を具備する、通話装置が提供される。
また本発明のマイクロフォン信号生成方法および通話装置は、たとえば、会議室の議事録収音用マイクロフォンユニットとして、通話装置の近傍にプロジェクタなど騒音源があっても、このノイズの影響を受けにくい通話装置と利用できる。
まず、本発明の第1実施の形態の通話装置の適用例を述べる。
図1(A)〜(C)は本発明の第1実施の形態の通話装置が適用される1例を示す構成図である。
図1(A)に図解したように、遠隔に位置する2つの会議室901、902にそれぞれ通話装置1A、1Bが設置されており、これらの通話装置1A、1Bが電話回線920で接続されている。
図1(B)に図解したように、2つの会議室901、902において、通話装置1A、1Bがそれぞれテーブル911、912の上に置かれている。ただし、図1(B)においては、図解の簡略化のため、会議室901内の通話装置1Aについてのみ図解している。会議室902内の通話装置1Bも同様である。通話装置1(以下、1A、1Bを代表した符号として1を用いる)の外観斜視図を図2に示す。
図1(C)に図解したように、通話装置1A、1Bの周囲にそれぞれ複数(本実施の形態においては6名)の会議参加者A1〜A6が位置している。ただし、図1(C)においては、図解の簡略化のため、会議室901内の通話装置1Aの周囲の会議参加者のみ図解している。他方の会議室902内の通話装置1Bの周囲に位置する会議参加者の配置も同様である。
通常、電話回線920を介しての会話は、一人の話者と一人の話者同士、すなわち、1対1で通話を行うが、本発明の第1実施の形態の通話装置は1つの電話回線920を用いて複数の会議参加者A1〜A6同士が通話できる。ただし、詳細は後述するが、音声の混雑を回避するため、同時刻(同じ時間帯)の話者は、相互に一人に限定する。
本発明の通話装置は音声(通話)を対象としているから、電話回線920を介して音声を伝送するだけである。換言すれば、テレビ会議システムのような多量の画像データは伝送しない。さらに、本発明の通話装置は会議参加者の通話を圧縮して伝送しているので電話回線920の伝送負担は軽い。
図2〜図4を参照して本発明の第1実施の形態の通話装置の構成について述べる。
図2は本発明の第1実施の形態の通話装置の斜視図である。
図3は図2に図解した通話装置の断面図である。
図4は図1に図解した通話装置のマイクロフォン・電子回路収容部の平面図であり、図3の線X−X−Yにおける平面図である。
図3に図解したように、スピーカ収容部14は、音反射面(音指向面または音案内面)14aと、底面14bと、上部音出力開口部14cとを有する。音反射面14aと底面14bで包囲された空間である内腔14dに受話再生スピーカ16が収容されている。スピーカ収容部14の上部に音反射板12が位置し、スピーカ収容部14と音反射板12とが連結部材13によって連結されている。
相手会議室の話者が話した音声は、受話再生スピーカ16を介して上部音出力開口部14cから抜け、音反射板12の音反射面12aとスピーカ収容部14の音反射面14aとで規定される空間に沿って軸C−Cを中心として360度の全方位に拡散する。
音反射板12の音反射面12aの断面は図解したように、ゆるやかなラッパ型の弧を描いている。すなわち、音反射板12は、中央が連続的に傾斜している円錐状の突起と、その周辺になだらかに傾斜をしながら平坦な面とが連続している。音反射面12aの断面は軸C−Cを中心として360度にわたり(全方位)、図解した断面形状をしている。
同様にスピーカ収容部14の音反射面14aの断面も図解したように、ゆるやかな凸面を描いている。音反射面14aの断面も軸C−Cを中心として360度にわたり(全方位)、図解した断面形状をしている。
受話再生スピーカ16から出力された音Sの拡散状態を矢印で図示した。
プリント基板21には、図4に平面を図解したように、マイクロフォン・電子回路収容部2のマイクロフォンMC1〜MC6、発光ダイオードLED1〜6、マイクロプロセッサ23、コーデック(CODEC)24、第1のディジタルシグナルプロセッサ(DSP1)DSP25、第2のディジタルシグナルプロセッサ(DSP2)DSP26、A/D変換器ブロック27、D/A変換器ブロック28、増幅器ブロック29などの各種電子回路が搭載されており、音反射板12はマイクロフォン・電子回路収容部2を支持する部材としても機能している。
図4に図解したように、プリント基板21の中心軸Cから放射状に等間隔(本実施の形態では60度間隔で)で6本のマイクロフォンMC1〜MC6が位置している。各マイクロフォンは単一指向性を持つマイクロフォンである。その特性については後述する。
各マイクロフォンMC1〜MC6は、共に柔軟性または弾力性のある第1のマイクロフォン支持部材22aと第2のマイクロフォン支持部材22bとで、揺動自在に支持されており(図解を簡単にするため、マイクロフォンMC1の部分の第1のマイクロフォン支持部材22aと第2のマイクロフォン支持部材22bとについてのみ図解している)、上述した緩衝材を用いたダンパー18による受話再生スピーカ16からの振動の影響を受けない対策に加えて、柔軟性または弾力性のある第1のマイクロフォン支持部材22aと第2のマイクロフォン支持部材22bとで受話再生スピーカ16からの振動で振動するプリント基板21の振動を吸収して受話再生スピーカ16の振動の影響を受けないようにして、受話再生スピーカ16の騒音を回避している。
会議参加者A1〜A6は、通常、図1(C)に例示したように、通話装置1の周囲360度方向に、60度間隔で配設されているマイクロフォンMC1〜MC6の近傍にほぼ等間隔で位置している。
後述する話者を決定したことを通報するマイクロフォン選択結果表示装置30として発光ダイオードLED1〜6がマイクロフォンMC1〜MC6の近傍に配置されている。
発光ダイオードLED1〜6は上部カバー11を装着した状態でも、全ての会議参加者A1〜A6から視認可能に設けられている。したがって、上部カバー11は発光ダイオードLED1〜6の発光状態が視認可能なように透明窓が設けられている。もちろん、上部カバー11に発光ダイオードLED1〜6の部分に開口が設けられていてもよいが、マイクロフォン・電子回路収容部2への防塵の観点からは透光窓が好ましい。
本実施の形態においては、DSP25を各種電子回路27〜29とともにフィルタ処理、マイクロフォン選択処理などの処理を行う信号処理手段として用い、DSP26をエコーキャンセラーとして用いている。
マイクロプロセッサ23はマイクロフォン・電子回路収容部2の全体制御処理を行う。
コーデック24は相手方会議室に送信する音声を圧縮符号化する。
DSP25が下記に述べる各種の信号処理、たとえば、フィルタ処理、マイクロフォン選択処理などを行う。
DSP26はエコーキャンセラーとして機能する。
図5においては、A/D変換器ブロック27の1例として、4個のA/D変換器271〜274を例示し、D/A変換器ブロック28の1例として、2個のD/A変換器281〜282を例示し、増幅器ブロック29の1例として、2個の増幅器291〜292を例示している。
その他、マイクロフォン・電子回路収容部2としては電源回路など各種の回路がプリント基板21に搭載されている。
なお、A/D変換器271〜274は可変利得型増幅機能付きのA/D変換器271〜274として構成することもできる。
A/D変換器271〜274で変換したマイクロフォンMC1〜MC6の収音信号はDSP25に入力されて、後述する各種の信号処理が行われる。
DSP25の処理結果の1つとして、マイクロフォンMC1〜MC6のうちの1つを選択した結果が、マイクロフォン選択結果表示手段30の1例である発光ダイオードLED1〜6に出力される。
DSP26の処理結果が、D/A変換器281〜282でアナログ信号に変換される。D/A変換器281からの出力が、必要に応じて、コーデック24で符号化されて、増幅器291を介して電話回線920(図1(A))のラインアウトに出力され、相手方会議室に設置された通話装置1の受話再生スピーカ16を介して音として出力される。
相手方の会議室に設置された通話装置1からの音声が電話回線920(図1(A))のラインインを介して入力され、A/D変換器274においてディジタル信号に変換されて、DSP26に入力されてエコーキャンセル処理に使用される。また、相手方の会議室に設置された通話装置1からの音声は図示しない経路でスピーカ16に印加されて音として出力される。
D/A変換器282からの出力が増幅器292を介してこの通話装置1の受話再生スピーカ16から音として出力される。すなわち、会議参加者A1〜A6は、上述した受話再生スピーカ16から相手会議室の選択された話者の音声に加えて、その会議室にいる発言者が発した音声をも受話再生スピーカ16を介して聞くことが出来る。
図6は各マイクロフォンMC1〜MC6の特性を示すグラフである。
各単一指向特性マイクフォンは発言者からマイクロフォンへの音声の到達角度により図6に図解のように周波数特性、レベル特性が変化する。複数の曲線は、収音信号の周波数が、100Hz、150Hz、200Hz、300Hz、400Hz、500Hz、700Hz、1000Hz、1500Hz、2000Hz、3000Hz、4000Hz、5000Hz、7000Hzの時の指向性を示している。ただし、図解を簡単にするため、図6は代表的に、150Hz、500Hz、1500Hz、3000Hz、7000Hzについての指向性を図解している。
図6の指向性を持つマイクロフォンを用いた場合、マイクロフォンの正面に強い指向性を示す。本実施の形態においては、このような特性を活用して、DSP25においてマイクロフォンの選定処理を行う。
さらに、マイクロフォンの指向性を得る方法として、複数の無指向性マイクロフォンを使用したマイクアレイを用いることができるが、このような方法では、複数の信号の時間軸(位相)の一致のため複雑な処理を要するため、時間がかかり応答性が低いし、装置構成を複雑になる。すなわち、DSPの信号処理系にも複雑な信号処理を必要とする。本発明の第1実施の形態は図6に例示した指向性のあるマイクロフォンを用いてそのような問題を解決している。
また、マイクロフォン・アレイ信号を合成して指向性収音マイクロフォンとして利用するためには外形形状が通過周波数特性によって規制され外形形状が大きくなるという不利益がある。本発明はこの問題も解決している。
上述した構成の通話装置は下記の利点を示す。
(1)等角度で放射状かつ等間隔に配設された偶数個のマイクロフォンMC1〜MC6と受話再生スピーカ16との位置関係が一定であり、さらにその距離が非常に近いことで受話再生スピーカ16から出た音が会議室(部屋)環境を経てマイクロフォンMC1〜MC6に戻ってくるレベルより直接戻ってくるレベルが圧倒的に大きく支配的である。そのために、スピーカ16からマイクロフォンMC1〜MC6に音が到達する特性(信号レベル(強度)、周波数特性(f特)、位相)がいつも同じである。つまり、本発明の実施の形態における通話装置1においてはいつも伝達関数が同じという利点がある。
(2)それ故、話者が異なった時に相手方会議室に送出するマイクロフォンの出力を切り替えた時の伝達関数の変化がなく、マイクロフォンを切り替える都度、マイクロフォン系の利得を調整をする必要がないという利点を有する。換言すれば、本発明の第1実施の形態の通話装置の製造時に一度調整をすると調整をやり直す必要がないという利点がある。
(3)上記と同じ理由で話者が異なった時にマイクロフォンを切り替えても、エコーキャンセラー(DSP26)が一つでよい。DSPは高価であり、種々の部材が搭載されて空きが少ないプリント基板21に複数のDSPを配置する必要がなく、プリント基板21におけるDSPの配置するスペースも少なくてよい。その結果、プリント基板21、ひいては、本発明の実施の形態の通話装置を小型にできる。
(4)上述したように、受話再生スピーカ16とマイクロフォンMC1〜MC6間の伝達関数が一定であるため、たとえば、±3dBもあるマイクロフォン自体の感度差調整を通話装置のマイクロフォンユニット単独で出来るという利点がある。感度差調整の詳細は後述する。
(5)通話装置1が搭載されるテーブルは、通常、円いテーブル(円卓)または多角テーブルを用いるが、通話装置1内の一つの受話再生スピーカ16で均等な品質の音声を軸Cを中心として360度全方位に均等に分散(拡散)するスピーカシステムが可能になった。
(6)受話再生スピーカ16から出た音は円卓のテーブル面を伝達して(バウンダリ効果)会議参加者まで有効に能率良く均等に上質な音が届き、会議室の天井方向に対しては対向側の音と位相がキャンセルされて小さな音になり、会議参加者に対して天井方向からの反射音が少なく、結果として参加者に明瞭な音が配給されるという利点がある。
(7)受話再生スピーカ16から出た音は等角度で放射状かつ等間隔に配設された全てのマイクロフォンMC1〜MC6に同時に同じ音量で届くので発言者の音声なのか受話音声なのかの判断が容易になる。その結果、マイクロフォン選択処理の誤判別が減る。その詳細は後述する。
(8)偶数個、たとえば、6本のマイクロフォンを等角度で放射状かつ等間隔で、対向する1対のマイクロフォンを一直線上に配置したことで方向検出の為のレベル比較が容易に出来る。
(9)ダンパー18、マイクロフォン支持部材22A、22Bなどにより、受話再生スピーカ16の音による振動が、マイクロフォンMC1〜MC6の収音に与える影響を低減することができる。
(10)図3に図解したように、構造的に、受話再生スピーカ16の音が直接、マイクロフォンMC1〜MC6には伝搬しない。したがって、この通話装置1においは受話再生スピーカ16からのノイズの影響が少ない。
図2〜図3を参照して述べた通話装置1は、下部に受話再生スピーカ16を配置させ、上部にマイクロフォンMC1〜MC6(および関連する電子回路)を配置させたが、受話再生スピーカ16とマイクロフォンMC1〜MC6(および関連する電子回路)の位置を、図8に図解したように、上下逆にすることもできる。このような場合でも上述した効果を奏する。
以下、主として第1のディジタルシグナルプロセッサ(DSP)25で行う処理内容について述べる。
図9はDSP25が行う処理の概要を図解した図である。以下、その概要を述べる。
初期動作として、好ましくは、通話装置1が設置される周囲のノイズの測定する。
通話装置1は種々の環境(会議室)で使用されうる。マイクロフォンの選択の正確さを期し、通話装置1の性能を高めるために、本発明においては、初期段階において、通話装置1が設置される周囲環境のノイズを測定し、そのノイズの影響をマイクロフォンで収音した信号から排除することを可能とする。
もちろん、通話装置1を同じ会議室で反復して使用するような場合、事前にノイズ測定が行われており、ノイズ状態が変化しないような場合にこの処理は割愛できる。
なお、ノイズ測定は通常状態においても行うことができる。
たとえば、通話装置1を双方向会議に使用する場合、それぞれの会議室における議事運営を取りまとめる議長がいることが有益である。したがって、本発明の1態様としては、通話装置1を使用する初期段階において、通話装置1の操作部15から議長を設定する。議長の設定方法としては、たとえば、操作部15の近傍に位置する第1マイクロフォンMC1を議長用マイクロフォンとする。もちろん、議長用マイクロフォンを任意のものにすることもできる。
なお、通話装置1を反復して使用する議長が同じ場合はこの処理は割愛できる。あるいは、事前に議長が座る位置のマイクロフォンを決めておいてもよい。その場合はその都度、議長の選定動作は不要である。
もちろん、議長の選定は初期状態に限らず、任意のタイミングで行うことができる。
議長選定の詳細は後述する。
初期動作として、好ましくは、受話再生スピーカ16とマイクロフォンMC1〜MC6との音響結合が等しくなるように、マイクロフォンMC1〜MC6の信号を増幅する増幅部の利得または減衰部の減衰値を自動的に調整する。
感度差調整については後述する。
(4)マイクロフォン選択、切り替え処理
1つの会議室において同時に複数の会議参加者が通話すると、音声が入り交じり相手側会議室内の会議参加者A1〜A6にとって聞きにくい。そこで、本発明の第1実施の形態においては、原則として、ある時間帯には1人ずつ通話させる。そのため、DSP25においてマイクロフォンの選択・切り替え処理を行う。
その結果、選択されたマイクロフォンからの通話のみが、電話回線920を介して相手方会議室の通話装置1に伝送されてスピーカから出力される。もちろん、図5を参照して述べたように、選択された話者のマイクロフォンの近傍のLEDが点灯し、さらに、その部屋の通話装置1のスピーカからも選択された話者の音声を聞くことができ、誰が許可された話者かを認識することができる。
この処理により、発言者に対向した単一指向性マイクの信号を選択し、送話信号として相手方にS/Nの良い信号を送ることを目的としている。
(5)選択したマイクロフォンの表示
話者のマイクロフォンが選択され、話すことが許可された会議参加者のマイクロフォンがどれであるかを、会議参加者A1〜A6全員に容易に認識できるように、マイクロフォン選択結果表示手段30、たとえば、発光ダイオードLED1〜6の該当するもの点灯させる。
(6)上述したマイクロフォン選択処理の背景技術として、または、マイクロフォン選択処理を正確に遂行するため下記に例示する各種の信号処理を行う。
(a)マイクロフォンの収音信号の帯域分離と、レベル変換処理
(b)発言の開始、終了の判定処理
発言者方向に対向したマイク信号の選択判定開始トリガとして使用するため。
(c)発言者方向マイクロフォンの検出処理
各マイクロフォンの収音信号を分析し、発言者の使用しているマイクロフォンを判定するため。
(d)発言者方向マイクロフォンの切り換えタイミング判定処理、および、検出された発言者に対向したマイク信号の選択切り替え処理
上述した処理結果から選択したマイクロフォンへ切り換えの指示をする。
(e)通常動作時のフロアノイズの測定
〜MC6に対しそれぞれ選択された発言者の音量レベル平均値と発言終了検出後のノイズレベルを測定し一定時間単位で、発言開始、終了判定閾値レベルを再設定する。
図10はマイクロフォンで収音した音信号を前処理として、DSP25で行うフィルタリング処理を示す構成図である。図10は1マイクロフォン(チャネル(1収音信号))分の処理について示す。
各マイクロフォンの収音信号は、たとえば、100Hzのカットオフ周波数を持つアナログ・ローカットフィルタ101で処理され、100Hz以下の周波数が除去されたフィルタ処理された音声信号がA/D変換器102に出力され、A/D変換器102でディジタル信号に変換された収音信号が、それぞれ7.5KHz、4KHz、1.5KHz、600Hz、250Hzのカットオフ周波数を持つ、ディジタル・ハイカットフィルタ103a〜103e(総称して103)で高周波成分が除去される(ハイカット処理)。ディジタル・ハイカットフィルタ103a〜103eの結果はさらに、減算器104a〜104d(総称して104)において隣接するディジタル・ハイカットフィルタ103a〜103eのフィルタ信号ごとの減算が行われる。
本発明の実施の形態において、ディジタル・ハイカットフィルタ103a〜103eおよび減算器104a〜104dは、実際はDSP25において処理している。A/D変換器102はA/D変換器ブロック27の1つとして実現できる。
マイクロフォン選択処理の開始のトリガの1つに発言の開始、終了の判定を行う。そのために使用する信号が、DSP25で行う図12に図解したバンドパス・フィルタ処理およびレベル変換処理によって得られる。
図12はマイクロフォンMC1〜MC6で収音した6チャネル(CH)の入力信号処理中の1CHのみを示す。
DSP25内のバンドパス・フィルタ処理およびレベル変換処理部は、各チャネルのマイクロフォンの収音信号を、それぞれ、たとえば、100〜600Hz、200〜250Hz、250〜600Hz、600〜1500Hz、1500〜4000Hz、4000〜7500Hzの帯域通過特性を持つバンドパス・フィルタ201a〜201a(総称してバンドパス・フィルタ・ブロック201)と、元のマイクロフォン収音信号および上記帯域通過収音信号をレベル変換するレベル変換器202a〜202g(総称して、レベル変換ブロック202)を有する。
本実施の形態においては周波数特性がフラットな信号からハイカットフィルタを通した信号を引き算すれば残りはローカットフィルタを通した信号とほぼ同等になることを利用する。
周波数−レベル特性を合わせる為に、1バンド余分に全体帯域通過のバンドパス・フィルタが必要となるが、必要とするバンドパス・フィルタのバンド数+1のフィルタ段数とフィルタ係数により必要とされるバンドパスが得られる。今回必要とされるハンドパス・フィルタの帯域周波数はマイク信号1チャネル(CH)当りで下記6バンドのバンドパス・フィルタとなる。
BPF1=[100Hz-250Hz] ・・201b
BPF2=[250Hz-600Hz] ・・201c
BPF3=[600Hz-1.5KHz] ・・201d
BPF4=[1.5KHz-4KHz] ・・201e
BPF5=[4KHz-7.5KHz] ・・201f
BPF6=[100Hz-600Hz] ・・201a
従来のバンドパス・フィルタの構成と対比する。バンドパス・フィルタの構成は2次IIRフィルタを使用するとして、本発明のように6本のマイク信号にそれぞれ6バンドのバンドパス・フィルタを用意すると、従来方法では、6×6×2=72回路のIIR・フィルタ処理が必要になる。この処理には、最新の優秀なDSPでもかなりのプログラム処理を要し他の処理への影響が出る。
本発明の実施の形態においては、100Hzのローカット・フィルタは入力段のアナログフィルタで処理する。用意する2次IIRハイカット・フィルタのカットオフ周波数は、250Hz,600Hz,1.5KHz,4KHz,7.5KHzの5種類である。このうちのカットオフ周波数7.5KHzのハイカット・フィルタは、実はサンプリング周波数が 16KHzなので必要が無いが、減算処理の過程で、IIRフィルタの位相回りの影響で、バンドパス・フィルタの出力レベルが減少する現象を軽減する為に意図的に被減数の位相を回す(回転させて変化させる)。
〔1〕全体帯域通過フィルタ用として、入力信号を7.5KHzのハイカットフィルタを通す。このフィルタ出力信号は入力のアナログのローカット合わせにより [100Hz-7.5KHz] のバンドパス・フィルタ出力となる。
〔1〕バンドパス・フィルタ(BPF5=[4KHz〜7.5KHz])は、フィルタ出力[1]-[2]([100Hz〜7.5KHz] - [100Hz〜4KHz])の処理を実行すると上記信号出力[4KHz〜7.5KHz]となる。
〔2〕バンドパス・フィルタ(BPF4=[1.5KHz〜4KHz])は、フィルタ出力[2]-[3]([100Hz〜4KHz] - [100Hz〜1.5KHz])の処理を実行すると、上記信号出力[1.5KHz〜4KHz]となる。
〔3〕バンドパス・フィルタ(BPF3=[600Hz〜1.5KHz])は、フィルタ出力[3]-[4]([100Hz〜1.5KHz] - [100Hz〜600Hz])の処理を実行すると、上記信号出力[600Hz〜1.5KHz]となる。
〔4〕バンドパス・フィルタ(BPF2=[250Hz〜600Hz])は、フィルタ出力[4]-[5]([100Hz〜600Hz] - [100Hz〜250Hz]) の処理を実行すると上記信号出力[250Hz〜600Hz]となる。
〔5〕バンドパス・フィルタ(BPF1=[100Hz〜250Hz])は上記[5]の信号をそのままで出力信号[5]とする。
〔6〕バンドパス・フィルタ(BPF6=[100Hz〜600Hz])は[4]の信号をそのままで上記(4)の出力信号とする。
DSP25における以上の処理で必要とされるバンドパス・フィルタ出力が得られる。
発言の開始、終了判定は、図12に図示した100Hz〜600Hzのバンドパス・フィルタ201aを通過し、レベル変換部202bで音圧レベル変換されたマイクロフォン収音信号を用いる。
第1のディジタルシグナルプロセッサ(DSP1)25は、音圧レベル検出部から出力される値を元に、図13に図解したように、マイクロフォン収音信号レベルがフロアノイズより上昇し、発言開始レベルの閾値を越した場合発言開始と判定し、その後開始レベルの閾値よりも高いレベルが継続した場合発言中、発言終了の閾値よりレベルが下がった場合をフロアノイズと判定し、発言終了判定時間、たとえば、0.5秒間継続した場合発言終了と判定する。
発言の開始、終了判定は、図12に図解したマイク信号変換処理部202bで音圧レベル変換された100Hz〜600Hzのバンドパス・フィルタを通過した音圧レベルデータ(マイク信号レベル(1))が図13に例示した閾値レベル以上になった時から発言開始と判定する。
DSP25は、頻繁なマイクロフォン切り替えに伴う動作不良を回避するため、発言開始を検出してから、発言終了判定時間、たとえば、0.5秒間は次の発言開始を検出しないようにしている。
DSP25は、相互通話システムにおける発言者方向検出および発言者に対向したマイク信号の自動選択を、発言レベルの高いほうから順に選択していく、いわゆる、「星取表方式」に基づいて行う。「星取表方式」の詳細は後述する。
図14は通話装置1の動作形態を図解したグラフである。
図15は通話装置1の通常処理を示すフローチャートである。
以下、図15のフローチャートを参照して通話装置1におけるDSP25を主体として動作を述べる。なお、マイクロフォン・電子回路収容部2の全体制御はマイクロプロセッサ23によって行われるが、以下、DSP25の処理を中心に述べる。
マイクロフォンMC1〜MC6で収音した信号はそれぞれ、図11〜図12を参照して述べた、バンドパス・フィルタ・ブロック201、レベル変換ブロック202において、7種類のレベルデータとして変換されているから、DSP25は各マイクロフォン収音信号についての7種類の信号を常時監視する。
その監視結果に基づいて、DSP25は、発言者方向検出処理1、発言者方向検出処理2、発言開始・終了判定処理のいずれかの処理に移行する。
DSP25は図13を参照して、さらに下記に詳述する方法に従って、発言の開始、終了の判定を行う。DSP25が処理が発言開始を検出した場合、ステップ4の発言者方向の判定処理へ発言開始検出を知らせる。
なお、ステップ2における発言の開始、終了の判定処理が発言レベルが発言終了レベルより小さくなった時、発言終了判定時間(たとえば、0.5秒)のタイマを起動し発言終了判定時間、発言レベルが発言終了レベルより小さい時、発言終了と判定する。
発言終了判定時間以内に発言終了レベルより大きくなったら再び発言終了レベルより小さくなるまで待機する。
DSP25における発言者方向の検出処理は、常時発言者方向をサーチし続けて行う。その後、ステップ4の発言者方向の判定処理へデータを供給する。
DSP25に発言者方向マイクの切り換え処理におけるタイミング判定処理はステップ2の処理とステップ3の処理の結果から、その時の発言者検出方向と今まで選択していた発言者方向が違う場合に、新たな発言者方向のマイク選択をステップ4のマイク信号切り換え処理へ指示する。
ただし、議長のマイクロフォンが操作部15から設定されていて、議長のマイクロフォンと他の会議参加者とが同時的に発言がある場合、議長の発言を優先する。
この時に、選択されたマイク情報をマイクロフォン選択結果表示手段30、たとえば、発光ダイオードLED1〜6に表示する。
マイクロフォン信号切り換え処理は6本のマイクロフォン信号の中からステップ4処理により選択されたマイクロフォン信号のみを送話信号として、通話装置1から電話回線920を介して相手側の通話装置に伝送するため、図5に図解した電話回線920のラインアウトへ出力する。
処理1:電源を投入直後に各マイクロフォンそれぞれの所定時間、たとえば、1秒間分のフロアノイズを測定する。
DSP25は、音圧レベル検出部のピークホールドされたレベル値を一定時間間隔、本実施の形態では、たとえば、10mSec間隔で読み出し、所定時間、たとえば、1分間の値の平均値を算出しフロアノイズとする。
DSP25は測定されたフロアノイズレベルを元に発言開始の検出レベル(フロアノイズ +9dB)、発言終了の検出レベルの閾値(フロアノイズ+6dB)を決定する。DSP25は、以後も、音圧レベル検出器のピークホールドされたレベル値を一定時間間隔で読み出す。
発言終了と判定された時は、DSP25は、フロアノイズの測定として働き、発言開始の検出し、発言終了の検出レベルの閾値を更新する。
処理2は処理1ではフロアノイズが大きく自動で閾値レベルを更新されると、発言開始、終了検出がしにくい時の対策として下記を行う。
DSP25は、予測されるフロアノイズレベルを元に発言開始の検出レベル、発言終了の検出レベルの閾値を決定する。
DSP25は、発言開始閾値レベルは発言終了閾値レベルより大きく(たとえば、3dB以上の差)に設定する。
DSP25は、音圧レベル検出器でピークホールドされたレベル値を一定時間間隔で読み出す。
処理1、6個のマイクロフォンに対応した音圧レベル検出器の出力レベルと、発言開始レベルの閾値を比較し発言開始レベルの閾値を越した場合発言開始と判定する。
DSP25は、全てのマイクロフォンに対応した音圧レベル検出器の出力レベルが、発言開始レベルの閾値を越した場合は、受話再生スピーカ16からの信号であると判定し、発言開始とは判定しない。なぜなら、受話再生スピーカ16と全てのマイクロフォンMC1〜MC6との距離は同じであるから、受話再生スピーカ16からの音は全てのマイクロフォンMC1〜MC6にほぼ均等に到達するからである。
(マイク2の信号レベル−マイク5の信号レベル)の絶対値・・・[2]
(マイク3の信号レベル−マイク6の信号レベル)の絶対値・・・[3]
この処理の場合、処理1のように全ての絶対値が発言開始レベルの閾値より大きくなることは無いので(受話再生スピーカ16からの音が全てのマイクロフォンに等しく到達するから)、受話再生スピーカ16からの音か話者からの音声かの判定は不要になる。
発言者方向の検出には図6に例示した単一指向性マイクロフォンの特性を利用する。単一指向特性マイクロフォンは発言者からマイクロフォンへの音声の到達角度により図6に例示したように、周波数特性、レベル特性が変化する。その結果を図7(A)〜(C)に例示した。図7(A)〜(C)は、通話装置1から所定距離、たとえば、1.5メートルの距離にスピーカーを置いて各マイクロフォンが収音した音声を一定時間間隔で高速フーリエ変換(FFT)した結果を示す。X軸が周波数を、Y軸が信号レベルを、Z軸が時間を表している。横線は、バンドパス・フィルタのカットオフ周波数を表し、この線にはさまれた周波数帯域のレベルが、図10〜図12を参照して述べたマイクロフォン信号レベル変換処理からの5バンドのバンドパス・フィルタを通した音圧レベルに変換されたデータとなる。
各帯域バンドパス・フィルタの出力レベルに対しそれぞれ適切な重み付け処理(1dBフルスパン(1dBFs)ステップなら0dBFsの時0、-3dBFsなら3というように、又はこの逆に)を行う。この重み付けのステップで処理の分解能が決まる。
1サンプルクロック毎に上記の重み付け処理を実行し、各マイクの重み付けされた得点を加算して一定サンプル数で平均値化して合計点の小さい(大きい)マイク信号を発言者に対向したマイクロフォンと判定する。この結果をイメージ化したものが下記表2である。
上述したように、DSP25は各マイクロフォン毎の周波数帯域のバンドパス・フィルタの出力レベルに重み付けを付けを実行し、各帯域バンドパス・フィルタの出力の、得点の小さい(または大きい)マイクロフォン信号順に順位をつけ、1位の順位が3つの帯域以上に有るマイク信号を発言者に対向したマイクロフォンと判定する。そして、DSP25は第1マイクロフォンMC1の方向に音源が有る(話者がいる)として、下記表3のような成績表を作成する。これを星取り表と呼ぶ。
MIC2 Level = L2-1 + L2-2 + L2-3 + L2-4 + L2-5
MIC3 Level = L3-1 + L3-2 + L3-3 + L3-4 + L3-5
MIC4 Level = L4-1 + L4-2 + L4-3 + L4-4 + L4-5
MIC5 Level = L5-1 + L5-2 + L5-3 + L5-4 + L5-5
MIC6 Level = L6-1 + L6-2 + L6-3 + L6-4 + L6-5
図15のステップ2の発言開始判定結果により起動し、ステップ3の発言者方向の検出処理結果と過去の選択情報から新しい発言者のマイクロフォンが検出された時、DSP25は、ステップ5のマイクロフォン信号の選択切り替え処理へマイクロフォン信号の切り換えコマンドを発効すると共に、マイクロフォン選択結果表示手段30(発光ダイオードLED1〜6)へ発言者のマイクロフォンが切り替わったことを通知し、発言者に自分の発言に対し通話装置1が応答した事を知らせる。
図15のステップ1のマイクロフォン信号レベル変換処理結果、および、ステップ3の発言者方向の検出処理結果から、本実施の形態においては、マイクロフォン選択切り替えタイミングは2通りを準備する。
選択されていたマイクロフォンの方向からの発言が終了し新たに別の方向から発言があった場合。
この場合は、DSP25は、全てのマイクロフォン信号レベル(1)とマイクロフォン信号レベル(2)が発言終了閾値レベル以下になってから発言終了判定時間(たとえば、0.5
秒)以上経過してから発言が開始され、どれかのマイクロフォン信号レベル(1)が発言開始閾値レベル以上になった時発言が開始されたと判断し、音源方向マイクロフォン番号の情報を元に発言者方向に対向したマイクロフォンを正当な収音マイクロフォンと決定し、ステップ5のマイクロフォン信号選択切り替え処理を開始する。
この場合はDSP25は発言開始(マイクロフォン信号レベル(1)が閾値レベル以上になった時)から発言終了判定時間(たとえば、0.5 秒)以上経過してから判定処理を開始する。
発言終了検出前に、3の処理からの音源方向マイクロフォン番号が変更になり、安定していると判定された場合、DSP25は音源方向マイクロフォン番号に相当するマイクロフォンに現在選択されている発言者よりも大声で発言している話者がいると判断し、その音源方向マイクロフォンを正当な収音マイクロフォンと決定し、ステップ5のマイクロフォン信号選択切り替え処理を起動する。
DSP25は図15のステップ4の発言者方向マイクロフォンの切り換えタイミング判定処理からのコマンドで選択判定されたコマンドにより起動する。
DSP25のマイクロフォン信号の選択切り替え処理は、図16に図解したように、6回路の乗算器と6入力の加算器で構成する。マイクロフォン信号を選択する為には、DSP25は選択したいマイクロフォン信号が接続されている乗算器のチャネルゲイン(チャネル利得:CH Gain)を“1“に、その他の乗算器のCH Gainを“0“とする事で、加算器には選択された(マイクロフォン信号×1) の信号と(マイクロフォン信号×0)の処理結果が加算されて希望のマイクロフォン選択信号が得られる。
もちろん、本発明の通話装置は会議用に限定されることなく、種々の他の用途に適用できる。すなわち、本発明の第1実施の形態の通話装置は、各通過帯域の群遅延特性を重視しなくても良い時通過帯域の電圧レベルの測定にも適している。したがって、たとえば、簡易スペクトラム・アナライザ、高速フーリエ変換(FFT)処理を行う(FFT的な)レベルメータ、グラフィクイコライザーなどのイコライザー処理結果の確認用レベル検出処理装置、カーステレオ、ラジカセ等のレベルメーターなどにも適用できる。
(1)複数の単一指向性を持つマイクロフォンと受話再生スピーカとの位置関係が一定であり、さらにその距離が非常に近いことで受話再生スピーカから出た音が会議室(部屋)環境を経て複数のマイクロフォンに戻ってくるレベルより直接戻ってくるレベルが圧倒的に大きく支配的である。そのために、受話再生スピーカから複数のマイクロフォンに音が到達する特性(信号レベル(強度)、周波数特性(f特)、位相)がいつも同じである。つまり、通話装置においてはいつも伝達関数が同じという利点がある。
(a)複数の単一指向性マイクロフォンを等間隔で放射状に配置して音源方向を検知可能とし、マイクロフォン信号を切り換えてS/Nの良い音、クリアな音を収音(収音)して、相手方に送信することができる。
(b)周辺の発言者からの音声を高いS/Nで収音して、発言者に対向したマイクロフォンの検出信号を自動選択できる。
(c)本発明においては、マイクロフォン選択処理の方法として通過音声周波数帯域を分割し、それぞれの分割された周波数帯域事のレベルを比較する事で、信号分析を簡略化している。
(d)本発明のマイクロフォン信号切り換え処理をDSPの信号処理として実現し、マイクロフォン信号の切り替え時に急激な変化がおきないように、複数の信号をすべてにクロス・フェード処理する事で切り換え時のクリック音を出さないようにしている。
(e)マイクロフォン選択結果を、発光ダイオードなどのマイクロフォン選択結果表示手段、または、外部への通知処理することができる。したがって、たとえば、テレビカメラへの発言者位置情報として活用することもできる。
本発明の通話装置の第2実施の形態として、マイクロフォンの感度差を自動的に調整する技術を述べる。
本発明の第2実施の形態においては、上述した問題を克服するため、下記に述べる方法でマイクロフォンの感度差を自動的に調整する。
1.本発明の実施の形態の通話装置1には、たとえば、図5に図解したように、受話再生スピーカ16を有している。そこで、基準信号をライン・インすれば、A/D変換器274を介してDSP26およびDSP25に入力できるので、特別な測定装置を設けることなく、マイクロフォンの感度差を調整できるという利点をいかす。
2.感度差の誤差範囲をDSP25のプログラムにより自由に設定できる。
3.自動調整を行うことにより、規格外のマイクロフォンの判別、接続不良の検出する。同様に、マイクロフォンの信号を増幅する増幅部の不良なども検出する。
前提条件として、第2実施の形態において、マイクロフォンは図4に図解したように、偶数本、たとえば、6本、等角度で放射状かつ等間隔で、受話再生スピーカ16から等距離に配設されている。
マイクロフォンMC1〜MC6と受話再生スピーカ16との配置関係は、図3に図解したように、マイクロフォンMC1〜MC6の下部に受話再生スピーカ16が配設されているか、図8に図解したように、マイクロフォンMC1〜MC6の上部に受話再生スピーカ16が配設されていてもよい。
第2実施の形態を行う装置構成は基本的に図5に図解したものであり、詳細は図18および図19に図解した構成となる。
図18において、図5におけるマイクロフォンMC1〜MC6とA/D変換器271〜273との間には実際には、利得調整を行う可変利得型増幅器301〜306が配設されている。あるいは、図5におけるA/D変換器271〜274は可変利得型増幅器301〜306付のA/D変換器271〜274としてもよい。
DSP25は上述した各種の処理を行うが、増幅器301〜306の感度差を調整する部分として、第1〜第6可変減衰部(ATT)2511〜2516、第1〜第6レベル検出部2521〜2526、レベル判定・利得制御部253、テスト信号発生部254を有する。
DSP26は、エコーキャンセル送話処理部261とエコーキャンセル受話部262とを有する。
ある程度の広さの部屋(会議室)で、騒音計または受話再生スピーカ16からテスト音を出すと、特に反射物や吸音物が無い限り、騒音計または受話再生スピーカ16と等間隔d隔てて配設されている各マイクロフォンMC1〜MC6へはほぼ同等の信号が到達する。
マイクロフォンMC1〜MC6が収音した騒音計または受話再生スピーカ16からのテスト音声を可変利得型増幅器301〜306で増幅して、A/D変換器271〜273でディジタル信号に変換し、DSP25内の可変減衰部2511〜2516において減衰する。レベル検出部2521〜2526におけるバンドパス・フィルタ252aで所定帯域の周波数成分が通過し、絶対値演算部252bで表6に示した演算が行われ、ピークレベル検出・保持部252cで最大値が検出されて保持される。
レベル判定・利得制御部253は可変減衰部2511〜2516の減衰量(減衰係数)を調整して各マイクロフォンMC1〜MC6の感度差を調整する。
第2実施の形態においては、マイクロフォン感度の公称誤差として、たとえば、±3dBのマイクロフォンを想定している。
また第2実施の形態においては、感度差調整誤差の設計値として、たとえば、0.5dB以内を目標としている。なお、通話装置が設置される環境によって変わってしまうので、実際の感度差調整誤差としては、たとえば、0.5〜1.0dB程度が妥当でもある。
図20〜図22を参照して、本発明の通話装置の第3実施の形態として、単一指向性マイクロフォンを2本を1対(1組)として複数対(組)を使用したときの発言者を特定する方法についてより詳細に述べる。
発言者の特定方法についての基本的な考えたかたは第1実施の形態において述べた。第3実施の形態は、第1実施の形態と関連づけて、さらに詳細かつ好適な発言者の特定方法について述べる。
マイクロフォンは図4に図解したように、等角度で放射状かつスピーカ16から等間隔で配設されており、特に、たとえば、第1番目のマイクロフォンMC1と第4番目のマイクロフォンMC4のように、中心軸Cを挟んで対向する1対のマイクロフォンは一直線上に位置している。図4に図解したマイクロフォンMC1〜MC6は6本あるから、60度の角度で等角度で放射状に配置されており、これらの前方に会議者が位置する。
音源からの信号音の周波数を、たとえば、500Hzと仮定し、たとえば、第1番目のマイクロフォンMC1の方向に音源(話者の音声)が有った場合、単一指向性マイクロフォンMC1〜MC6を放射状に60度間隔で配置したとき、各マイクロフォンMC1〜MC6が収音する音圧レベルは、図7(A)の正面方向レベルを0dBと正規化すると、下記表4に示した値になる。
他方、第1番目のマイクロフォンMC1方向に音源が有る場合の各マイクロフォンMC1〜MC6が収音する音圧レベルは、たとえば、下記になると推察される。
マイク1のレベルが一番高い [ 0 dB] [1]
マイク2、6のレベルが2番目 [- 4 dB] [2]
マイク3、5のレベルが3番目 [-14.7dB] [3]
マイク4のレベルが一番低い [-15.3dB] [4]
(1)MC1− MC4 0 - (-15.3) = 15.3dB [5]
(2)MC2− MC5 -4 -(-14.7) = 10.7dB [6]
(3)MC3− MC6 -14.7 - (-4) =-10.7dB [7]
この判定処理は、第1のディジタルシグナルプロセッサ(DSP1)DSP25が行い、その処理内容を図20のフローチャートに示す。
なお、A/D変換器271〜273には対向して一直線に配置された1対のマイクロフォンの検出信号が入力されており、音圧レベル検出部はそのような1対のマイクロフォンの検出信号についてレベル差、その絶対値算出などの上記処理を行う。
なお、バンドパス・フィルタ201aで100Hz〜600Hzの通過帯域を通した信号を用いる理由は、他の音源方向判定処理と共用するためであり、音源方向を特定するための特別な条件ではない。したがって、任意の帯域通過特性を持つバンドパスフィルタの出力を用いて上記処理を行うことができる。
音源装置方向特定処理手段255の判定結果は、マイクロフォン選択結果表示手段30としてのLEDに表示される。
ステップS331:最大レベルを検出したマイクに隣接するマイクの確認
音源装置方向特定処理手段255は、メモリの"2nd"の内容が第2マイクロフォンMC2または第6マイクロフォンMC6であることを確認する。その理由は、(a)2番目に高い音圧を検出したマイクロフォン(第2マイクロフォンMC)が第2番目のマイクロフォンMC2の場合、第1番目のマイクロフォンMC1とこの第1番目のマイクロフォンMC1と隣接する第2番目のマイクロフォンMC2との間に音源が存在すると判断し、または、(b)2番目に高い音圧を検出したマイクロフォンが第6番目のマイクロフォンMC6の場合、第1番目のマイクロフォンMC1とこの第1番目のマイクロフォンMC1と隣接する第6番目のマイクロフォンMC6との間に音源が存在すると判断することが妥当であるからである。すなわち、本実施の形態においては、最大レベルを検出したマイクロフォンMCに隣接する位置に存在するマイクロフォンMCのレベル検出状態も参照して、音源方向に位置するマイクロフォンの特定の信頼性を高めている。
なお、2番目に高いレベルを検出したマイクロフォンを片方だけ検出しているのは、本実施の形態においては、音源方向の分解能をマイク正面方向(60度)に限定して、隣り合ったマイク間の方向は無視しているためである。
上記以外のときは、音源装置方向特定処理手段255は判定不能としてメモリの"RESLT"部分に判定不能状態を記憶する。
次いで、音源装置方向特定処理手段255は、メモリの"sub1","sub2","sub3"の内容が、表13に示したように、"+","+","−"で有る事を確認する。
ステップS334:音源方向とマイクロフォンMCとの一致を確定
この状態に一致した場合、音源装置方向特定処理手段255は第1番目のマイクロフォンMC1方向に音源が有ると確定し、メモリの"RESLT"部分に第1番目のマイクロフォンMC1の番号を記憶する。
表4の状態に不一致の場合は、音源装置方向特定処理手段255はステップS332に飛び、判定不能としてメモリの"RESLT"部分に判定不能を示す情報を記憶する。
選択音源装置方向特定処理手段255は上述した処理により、正当に第1番目のマイクロフォンMC1の方向に音源が存在すると判定した場合、図20に図解したように、マイクロフォン選択結果表示手段30の第1番目のマイクロフォンMC1に隣接するマイクロフォン選択結果表示手段30としてのLEDを点灯して、第1番目のマイクロフォンMC1が特定(選定)されたことを明示する。
音源装置方向特定処理手段255は、メモリ"second"部分第2番目のマイクロフォンMC2と隣接する第3番目のマイクロフォンMC3か第1番目のマイクロフォンMC1かをチェックする。
上記以外のときは、音源装置方向特定処理手段255は判定不能としてメモリの"RESLT"部分に判定不能状態を記憶する。
音源装置方向特定処理手段255はメモリの"sub1","sub2","sub3"の内容が表4に示した"+","+","+"で有る事を確認したとき第2番目のマイクロフォンMC2方向に音源が有ると確定し、メモリの "RESLT"に第2マイクロフォンMC2の番号を記憶する。
表4の状態に不一致の場合は、判定不能としてメモリの"RESLT"部分に判定不能を示す情報を記憶する。
選択音源装置方向特定処理手段255は上述した処理により、正当に第2番目のマイクロフォンMC2の方向に音源が存在すると判定した場合、マイクロフォンMC2に隣接するLEDを点灯して、第2番目のマイクロフォンMC2が特定(選定)されたことを明示する。
すなわち、音源装置方向特定処理手段255は、メモリの"second"部分の内容と、メモリの"sub1","sub2","sub3"の内容が表13の"−","+","+"で有る事を確認し第3番目のマイクロフォンMC3方向に音源が有ると確定する。
これ以外のときは判定不良とする。
正当に音源方向に対応するマイクロフォンを確定(特定)できたときは、音源装置方向特定処理手段255は確定したマイクロフォンに該当するLEDを点灯する。
その結果、第3実施の形態によれば、通話装置において信頼性高く音源方向を特定できる。
上記実施の形態においては、他の音源方向判定処理と共用のためバンドパス・フィルタ201aで100Hz〜600Hzの通過帯域を通した信号のピークレベルを信号の検出レベルとして使用して判定処理を実現したが、図12に図解したように、複数のパンドパスフィルタ201a〜201fの通過帯域信号についてレベル変換処理部202b〜202gでレベル変換処理した結果を用いることもできる。もちろん、上述したように、DSP25においてはそのような信号処理を行っている。
その場合、レベル変換処理部202b〜202gでレベル変換した結果について、それぞれ、図20および図22に図解した処理を行い、第1次の判定(仮判定)を行い、第2判定として、複数の第1次判定結果について多数決で最も多い場合を最終的な判定結果として決定し、その結果をステップS321において選択出力することができる。
このような方法によれば、音源方向の判定結果の信頼度(精度)はさらに向上する。
本発明の第4実施の形態として、マイクロフォン信号生成方法およびそれを適用した通話装置について述べる。
第1〜第3実施の形態として述べたように、全方位に音を拡散可能なスピーカーと、スピーカーを中心に、指向性の高い複数のマイクロフォンを水平に等角度で、たとえば、60度間隔で6本を配置したマイクロフォン・スピーカ一体構成型・通話装置において、マイクロフォン単体、あるいは、複数のマイクロフォン信号を合成する事で任意の指向性を持たせる事が出来ることを述べた。
理想的には、マイクロフォンの正面の音だけ収音するマイクロフォンがあれば良いが、実際は、(1)マイクロフォンの背面方向の感度は落ちているが左右方向の感度はそれほど落ちていない指向性マイクロフォン、あるいは、(2)左右方向の感度は落ちているが背面方向はそれほど落ちていない指向性マイクロフォンを通話装置に用いると、マイクロフォンの正面以外の音も拾ってしまう。そのようなマイクロフォンを単純に水平に配置した場合、たとえば、(1)の指向性マイクロフォンを使用した場合、発言者(収音するマイクロフォン)の横にノイズ源がある時、(2)の指向性マイクロフォンでは発言者の対抗側にノイズ源がある時、このノイズ音をかなり拾ってしまう。
第4実施の形態の通話装置は、このような問題を解決する。
図24は第4実施の形態におけるマイクロフォンの指向性を示すグラフである。図24は周波数1kHzにおけるマイクロフォンの指向性の例である。図23に図解した6本のマイクロフォンが同じ、このような指向性を持つ。図24に図解したマイクロフォンの指向性は上述した実施の形態において使用した、図6および図7に図解したマイクロフォンの指向性と類似しているが、図6に図解した指向性よりいくぶん低い指向性である。
その1例として、第1マイクロフォンの検出信号MIC1と、第1マイクロフォンの正面から±120度回転した位置に置いたマイクロフォン、たとえば、−120度(240度)の位置の第5のマイクロフォンの検出信号MIC5とについて、下記の演算を行った。
・・・(1)
第1のDSP25における上記演算は、図16に図解したように、第1マイクロフォンの検出信号MIC1に乗じる係数をチャネルゲイン=1.0とし、第5マイクロフォンの検出信号MIC5に乗ずる係数をチャネルゲイン=−0.667(2/3)とし、その他のマイクロフォン検出信号のチャネルゲイン=0.0とすれば、容易に求めることができる。
第1マイクロフォンの信号MIC1をメイン(主)マイクロフォン信号と呼び、第5マイクロフォンの信号MIC5をサブ(副)マイクロフォン信号と呼ぶ。メインマイクロフォン信号に乗ずる係数をメイン係数と呼び、サブマイクロフォン信号に乗ずる係数をサブ係数と呼ぶ。
図24に図解した単体のマイクロフォンの1kHzにおける指向性と、図25に図解した2本合成したときのマイクロフォンの1kHzにおける指向性とを対比すると、下記になる。
図24 0.30539 0.11212 1.80955
図25 0.31005 0.12929 1.7959
他方、図25に図解した例示の2本合成マイクロフォンの指向性は、正面に対し120度、300度方向は感度が落ちているが、180度方向は殆ど落ちていない。
すなわち、利用者が任意のマイクロフォンを選択したり、入力音量の大きなマイクロフォンに自動切換えする、第1〜第3実施の形態の通話装置において、さらに、複数のマイクロフォン、たとえば、2個のマイクロフォンの検出信号を合成して合成したマイクロフォンの指向性を任意に持たせることで、マイクロフォンが切り替わっても、冷却ファンの回転音が会議の音声にノイズとなるプロジェクタ装置などのノイズ源が位置する方向の感度を低下させることができる。その結果、一定方向にあるノイズ音を拾わず、明瞭な音声が収音できるようになる。
このように、第4実施の形態の通話装置の使用者(ユーザ)がノイズ方向のマイクロフォンを非選択に設定した時、任意の選択可能なマイクロフォンが選ばれても絶えず非選択方向の感度が落ちるような指向性をつくり、ノイズ音を拾わなくする事が出来る。
したがって、下記に述べる第1のDSP25におけるマイクロフォンの選択方法を除いて、第4実施の形態の通話装置は、上述した第1〜第3実施の形態の通話装置と同様の機能を有する。
前提条件
1.たとえば、図24に例示した指向性を持つマイクロフォンを、たとえば、図23または図4に図解のごとく、6本、等角度で、音声検出部分が外向きになるように、配設し、さらにスピーカ16などを有する通話装置を用いる。上述した第1〜第3実施の形態の通話装置はこのような条件を満たしている。
2.そのような通話装置において、ユーザがマイクロフォンを選択できるか、図16に図解した構成においてチャネルゲインを設定することにより、実質的にマイクロフォンを選択可能になっている。この条件も第1〜第3実施の形態の通話装置は満たしている。
3.第4実施の形態で選択した音声を出力できるスピーカを備えている。この条件も第1〜第3実施の形態の通話装置は満たしており、たとえば、図3に図解したスピーカ16が該当する。
4.第4実施の形態として、たとえば、ノイズ源が近いため、任意の1方向のマイクロフォンを非選択に指定することができる機能を付加する。
(2)選択しようとするマイクロフォンと非選択設定されているマイクロフォンの角度、図23に図解した例示において、非選択マイクロフォンが時計周りに何本目に当たるかを計算し、
(3)その角度が、たとえば、60度、すなわち、選択しようとするマイクロフォンに対し非選択設定マイクロフォンが時計周りに1本目の場合、メイン・マイクロフォン(=選択しようとするマイクロフォン)の信号より、サブ・マイクロフォン(=選択しようとするマイクロフォンから120度離れたマイクロフォン)の検出信号をサブ係数、たとえば、2/3を乗じてメインマイクロフォン信号から減算し(または、−2/3を乗じてメインマイクロフォン信号に加算し)、合成マイクロフォン出力信号とする。
(4)同様に角度が、たとえば、300度、すなわち、選択しようとするマイクロフォンに対し非選択設定マイクロフォンが時計周りに5本目の場合、メイン・マイクロフォン(=選択しようとするマイクロフォン)の信号より、サブ・マイクロフォン(=選択しようとするマイクロフォンから240度離れたマイクロフォン)の検出信号をサブ係数、たとえば、−2/3を乗じてメインマイクロフォン信号から減算し、合成マイクロフォンの出力信号とする。
(5)角度がその他の場合は、選択しようとするマイクロフォン単体の信号を出力信号をする。
(6)以後、上記手順4,5の処理を行うことで、どのマイクロフォンが選択された場合も、合成マイクロフォン信号を生成することにより、ノイズ源の影響を小さく抑える事が出来、明瞭な音声をスピーカ16から出力できるし、相手側の通話装置に送出することができる。
第1のDSP25は、選択マイクロフォン番号=1、非選択マイクロフォン番号=0、サブマイクロフォン番号=0に初期設定する。
第1のDSP25は、選択マイクロフォンの表示を行う。具体的には、選択マイクロフォンに該当する図4に図解したLEDを点灯させる。
また、好ましくは、第1のDSP25は非選択マイクロフォンの表示を行う。図4に図解した通話装置には、非選択マイクロフォンを示すLEDはないので、必要に応じて、対応するLEDを付加するか、非選択マイクロフォンは図4に図解したLEDを表示しないことが代用する。
第1のDSP25は、たとえば、図16に図解した方法で、下記の演算を行う。
音声出力= Mc×選択マイクロフォンの音声信号レベル
+SC ×サブマイクロフォンの音声信号
なお、Mcは選択(メイン)マイクロフォンのチャネルゲインに相当する係数であ り、上述の例または通常、Mc=1.0である。
SC はサブマイクロフォンのチャネルゲインに相当する係数であり、上述し た例示においては、SC =−2/3である。
非選択マイクロフォンの指示があれば、ステップ105の処理に移行する。
非選択マイクロフォンの指示がなければ、ステップ106の処理に移行する。
第1のDSP25は非選択マイクロフォンの番号を1進める。その結果、既存のマイクロフォンの数、たとえば、6以上になったら、初期のマイクロフォン番号=0にする。
第1のDSP25は選択マイクロフォンの変更の指示があるか否かをチェックして、なければ、ステップ102の処理に戻る。
ステップ107:選択マイクロフォンの更新
選択マイクロフォンの変更の指示があったとき、第1のDSP25は選択マイクロフォンの番号を1進める。その結果、既存のマイクロフォンの数、たとえば、6以上になったら、初期のマイクロフォン番号=0にする。
第1のDSP25は、非選択マイクロフォンの番号が1〜6以内であれば、ステップ110の処理に移行する。そうでなければ、ステップ114の処理に移行する。
第1のDSP25は、下記の演算により、マイクロフォンの間隔を計算する。
マイクロフォン間隔=選択マイクロフォン番号(配設角度)
−非選択マイクロフォンの番号(配設角度)
計算したマイクロフォン間隔が負のばあいは、マイクロフォン番号を6増加させたマイクロフォン番号の配設角度を用いる。
第1のDSP25は、マイクロフォン間隔に応じて下記の処理を行う。
ステップ113:第1のDSP25は、マイクロフォン間隔が「5」の場合は、(サブマイクロフォン番号=選択マイクロフォン番号−5)を計算する。その結果、サブマイクロフォン番号が1未満(0)ならば、サブマイクロフォン番号に6を加える。
ステップ114:第1のDSP25は、マイクロフォン間隔が「2」、「3」、「4」の場合は、(サブマイクロフォン番号=0)とする。すなわち、サブマイクロフォンが存在しないことを示す。
また、通話装置をテレビジョン会議システムのマイクロフォンユニットとして使用し、テレビジョン受像機のスピーカ方向の感度を落とすことで、ハウリング、通話装置のエコーキャンセラー処理部分の余裕度が大きくなり、結果として、安定性が向上するという効果を奏することができる。
+SC1×第1サブマイクロフォンの音声信号
+SC2×第2サブマイクロフォンの音声信号
なお、Mcはメインマイクロフォンのチャネルゲインに相当する係数であり、
SC1は第1サブマイクロフォンのチャネルゲインに相当する係数であり、
SC2は第2サブマイクロフォンのチャネルゲインに相当する係数である。
11・・上部カバー
12・・音反射板
12a・・音反射面、12b・・拘束部材固定部
13・・連結部材
14・・スピーカ収容部
14a・・音反射面、14b・・底面
14c・・上面14b、14d・・内腔
14e・・拘束部材下部固定部
14f・・拘束部材貫通部
15・・操作部
16・・受話再生スピーカ
17・・拘束部材
18・・ダンパ
2・・マイクロフォン・電子回路収容部
21・・プリント基板
MC1〜MC・・マイクロフォン
22・・マイクロフォン支持部材
22a、22b・・マイクロフォン支持部材
23・・マイクロプロセッサ、24・・コーデック
25・・第1のディジタルシグナルプロセッサ(DSP1)
301〜306・・可変利得型増幅器
251・・可変減衰部
252・・レベル検出部
253・・レベル判定・利得制御部
254・・テスト信号発生部
255・・音源装置方向特定処理手段
26・・第2のディジタルシグナルプロセッサ(DSP2)
261・・エコーキャンセル送話処理部
262・・エコーキャンセル受話部
27・・A/D変換器ブロック
301〜306・・可変利得型増幅器
28・・D/A変換器ブロック
29・・増幅器ブロック
30・・マイクロフォン選択結果表示手段
LED1〜6・・発光ダイオード
Claims (4)
- 所定の指向性を持つ複数のマイクロフォンが所定の角度間隔で放射状に配設されており、前記複数のマイクロフォンが検出した音声信号のうち最大の集音レベルを示す1つのマイクロフォンの音声信号を選択し、当該選択された1つのマイクロフォンが検出した音声信号をサブマイクロフォンが検出した音声信号を用いて補正する、通話装置におけるマイクロフォン信号生成方法であって、
前記選択された1つのマイクロフォンが検出した音声信号を補正する前記サブマイクロフォンとして、前記複数のマイクロフォンのうちから前記最大の集音レベルを示す1つのマイクロフォンを除く少なくとも1つのサブマイクロフォンを事前に設定し、当該設定されたサブマイクロフォンの指向性、ノイズ源の位置、音量または合成マイクロフォン信号生成工程において合成するマイクロフォンの相互関係によって規定されるサブ係数を事前に設定する、サブマイクロフォン設定工程と、
前記複数のマイクロフォンのうち、前記最大の集音レベルを示す1つのマイクロフォンを選択するマイクロフォン選択工程と、
前記マイクロフォン選択工程において前記最大の集音レベルを示す1つのマイクロフォンが選択されたとき、前記サブマイクロフォン設定工程において設定された前記サブマイクロフォンの前記サブ係数を前記サブマイクロフォンが検出した音声信号に乗じ、当該乗じた値を前記選択された最大の集音レベルを示す1つのマイクロフォンの音声信号から減じて、前記選択された最大の集音レベルを示す1つのマイクロフォンの音声信号を補正する、合成マイクロフォン信号生成工程と
を具備する、マイクロフォン信号生成方法。 - 前記補正したマイクロフォンの音声信号が1個のスピーカから出力される、
請求項1に記載のマイクロフォン信号生成方法。 - 所定の指向性を持つ複数のマイクロフォンが所定の角度間隔で放射状に配設されており、前記複数のマイクロフォンが検出した音声信号のうち最大の集音レベルを示す1つのマイクロフォンの音声信号を選択し、当該選択された1つのマイクロフォンが検出した音声信号をサブマイクロフォンが検出した音声信号を用いて補正する、通話装置であって、
所定の指向性を持ち、所定の角度間隔で放射状に配設された、前記複数のマイクロフォンと、
前記選択された1つのマイクロフォンが検出した音声信号を補正する前記サブマイクロフォンとして、前記複数のマイクロフォンのうちから前記最大の集音レベルを示す1つのマイクロフォンを除く少なくとも1つのサブマイクロフォンを事前に設定し、当該設定されたサブマイクロフォンの指向性、ノイズ源の位置、音量または合成マイクロフォン信号生成手段において合成するマイクロフォンの相互関係によって規定されるサブ係数を事前に設定する、サブマイクロフォン設定手段と、
前記複数のマイクロフォンのうち、前記最大の集音レベルを示す1つのマイクロフォンを選択するマイクロフォン選択手段と、
前記マイクロフォン選択手段によって前記最大の集音レベルを示す1つのマイクロフォンが選択されたとき、前記サブマイクロフォン設定手段によって設定されたサブマイクロフォンの前記サブ係数を前記サブマイクロフォンが検出した音声信号に乗じ、当該乗じた値を前記選択された最大の集音レベルを示す1つのマイクロフォンの音声信号から減じて、前記選択された最大の集音レベルを示す1つのマイクロフォンの音声信号を補正する、合成マイクロフォン信号生成手段と
を具備する、通話装置。 - 前記合成マイクロフォン信号生成手段で生成した音声信号を出力するスピーカをさらに具備する、
請求項3記載の通話装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004148344A JP4639639B2 (ja) | 2004-05-18 | 2004-05-18 | マイクロフォン信号生成方法および通話装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004148344A JP4639639B2 (ja) | 2004-05-18 | 2004-05-18 | マイクロフォン信号生成方法および通話装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005333270A JP2005333270A (ja) | 2005-12-02 |
JP4639639B2 true JP4639639B2 (ja) | 2011-02-23 |
Family
ID=35487640
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004148344A Expired - Fee Related JP4639639B2 (ja) | 2004-05-18 | 2004-05-18 | マイクロフォン信号生成方法および通話装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4639639B2 (ja) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4929711B2 (ja) * | 2005-12-21 | 2012-05-09 | ヤマハ株式会社 | 放収音装置 |
JP4929703B2 (ja) * | 2005-12-19 | 2012-05-09 | ヤマハ株式会社 | 放収音装置 |
JP4867516B2 (ja) * | 2006-08-01 | 2012-02-01 | ヤマハ株式会社 | 音声会議システム |
JP5050616B2 (ja) * | 2007-04-06 | 2012-10-17 | ヤマハ株式会社 | 放収音装置 |
JP5338040B2 (ja) | 2007-06-04 | 2013-11-13 | ヤマハ株式会社 | 音声会議装置 |
JP5386974B2 (ja) * | 2008-12-25 | 2014-01-15 | トヨタ自動車株式会社 | 車載無線通信装置およびキャリアセンス方法 |
EP2615850A4 (en) * | 2011-03-11 | 2014-06-25 | Sanyo Electric Co | AUDIO RECORDING DEVICE |
US10542154B2 (en) * | 2015-10-16 | 2020-01-21 | Panasonic Intellectual Property Management Co., Ltd. | Device for assisting two-way conversation and method for assisting two-way conversation |
JP7072186B2 (ja) * | 2018-02-08 | 2022-05-20 | 株式会社オーディオテクニカ | マイクロホン装置及びマイクロホン装置用ケース |
JP7341755B2 (ja) * | 2019-07-05 | 2023-09-11 | 清水建設株式会社 | 局所的音場支援用音響反射体及び局所的音場支援装置 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS63144699A (ja) * | 1986-12-08 | 1988-06-16 | Nippon Telegr & Teleph Corp <Ntt> | 複数対のマイクロホン出力の位相切替収音装置 |
JPH1118191A (ja) * | 1997-06-23 | 1999-01-22 | Nippon Telegr & Teleph Corp <Ntt> | 収音方法およびその装置 |
JP2000197178A (ja) * | 1998-12-24 | 2000-07-14 | Victor Co Of Japan Ltd | マイクロホン装置及び指向性制御装置 |
JP2003087887A (ja) * | 2001-09-14 | 2003-03-20 | Sony Corp | 音声入出力装置 |
-
2004
- 2004-05-18 JP JP2004148344A patent/JP4639639B2/ja not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS63144699A (ja) * | 1986-12-08 | 1988-06-16 | Nippon Telegr & Teleph Corp <Ntt> | 複数対のマイクロホン出力の位相切替収音装置 |
JPH1118191A (ja) * | 1997-06-23 | 1999-01-22 | Nippon Telegr & Teleph Corp <Ntt> | 収音方法およびその装置 |
JP2000197178A (ja) * | 1998-12-24 | 2000-07-14 | Victor Co Of Japan Ltd | マイクロホン装置及び指向性制御装置 |
JP2003087887A (ja) * | 2001-09-14 | 2003-03-20 | Sony Corp | 音声入出力装置 |
Also Published As
Publication number | Publication date |
---|---|
JP2005333270A (ja) | 2005-12-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3891153B2 (ja) | 通話装置 | |
JP3972921B2 (ja) | 音声集音装置とエコーキャンセル処理方法 | |
JP4192800B2 (ja) | 音声集音装置と方法 | |
US7519175B2 (en) | Integral microphone and speaker configuration type two-way communication apparatus | |
US7227566B2 (en) | Communication apparatus and TV conference apparatus | |
JP4411959B2 (ja) | 音声集音・映像撮像装置 | |
US20070237344A1 (en) | Microphone enhancement device | |
JP4639639B2 (ja) | マイクロフォン信号生成方法および通話装置 | |
JP4281568B2 (ja) | 通話装置 | |
JP4479227B2 (ja) | 音声集音・映像撮像装置および撮像条件決定方法 | |
JP4453294B2 (ja) | マイクロフォン・スピーカ一体構成型・通話装置 | |
JP4225129B2 (ja) | マイクロフォン・スピーカ一体構成型・双方向通話装置 | |
JP4269854B2 (ja) | 通話装置 | |
JP4403370B2 (ja) | マイクロフォン・スピーカ一体構成型・通話装置 | |
JP4470413B2 (ja) | マイクロフォン・スピーカ一体構成型・通話装置 | |
JP2005181391A (ja) | 音声処理装置および音声処理方法 | |
JP4379105B2 (ja) | 飲食店における受注装置 | |
JP2007329753A (ja) | 音声通信装置および音声通信システム | |
JP2005151042A (ja) | 音源位置特定装置および撮像装置並びに撮像方法 | |
JP2005148301A (ja) | 音声処理装置と音声処理方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070322 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100119 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100315 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100608 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100729 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20101102 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20101115 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131210 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |