JP5166117B2

JP5166117B2 - 音声入力装置及びその製造方法、並びに、情報処理システム

Info

Publication number: JP5166117B2
Application number: JP2008132458A
Authority: JP
Inventors: 陸男高野; 精杉山; 敏美福岡; 雅敏小野; 隆介堀邊; 史記田中; 岳司猪田
Original assignee: Funai Electric Co Ltd; Funai Electric Advanced Applied Technology Research Institute Inc
Current assignee: Funai Electric Co Ltd; Funai Electric Advanced Applied Technology Research Institute Inc
Priority date: 2008-05-20
Filing date: 2008-05-20
Publication date: 2013-03-21
Anticipated expiration: 2028-05-20
Also published as: EP2282554A4; WO2009142249A1; US20110158454A1; US8774429B2; EP2282554A1; JP2009284109A; CN102037739A

Description

本発明は、音声入力装置及びその製造方法、並びに、情報処理システムに関する。

電話などによる通話や、音声認識、音声録音などに際しては、目的の音声（ユーザの音声）のみを収音することが好ましい。しかし、音声入力装置の使用環境では、背景雑音など目的の音声以外の音が存在することがある。そのため、雑音を除去する機能を有する音声入力装置の開発が進んでいる。

雑音が存在する使用環境で雑音を除去する技術として、マイクロフォンに鋭い指向性を持たせること、あるいは、音波の到来時刻差を利用して音波の到来方向を識別して信号処理により雑音を除去する方法が知られている。

また、近年では、電子機器の小型化が進んでおり、音声入力装置を小型化する技術が重要になっている。
特開平７−３１２６３８号公報特開平９−３３１３７７号公報特開２００１−１８６２４１号公報

マイクロフォンに鋭い指向性を持たせるためには、多数の振動膜を並べる必要があり、小型化は困難であった。

また、音波の到来時刻差を利用して音波の到来方向を精度よく検出するためには、複数の振動膜を、可聴音波の数波長分の１程度の間隔で設置する必要があるため、小型化は困難である。

また、複数のマイクで取得した音波の差分信号を利用する場合には、マイクの製造過程で生じる遅延やゲインのばらつきが雑音除去の精度に影響を与えることがあった。

本発明のいくつかの態様の目的は、雑音成分を除去する機能を有する音声入力装置及びその製造方法、並びに、情報処理システムを提供することにある。

（１）本発明は、
第１の振動膜を有する第１のマイクロフォンと、
第２の振動膜を有する第２のマイクロフォンと、
前記第１のマイクロフォンで取得された第１の電圧信号と、前記第２のマイクロフォンで取得された第２の電圧信号とに基づき第１の電圧信号と第２の電圧信号の差分信号を生成する差分信号生成部とを含む音声入力装置であって、
前記第１及び第２の振動膜は、
前記差分信号に含まれる雑音成分の強度の、前記第１又は第２の電圧信号に含まれる前記雑音成分の強度に対する比率を示す雑音強度比が、前記差分信号に含まれる入力音声成分の強度の、前記第１又は第２の電圧信号に含まれる前記入力音声成分の強度に対する比率を示す入力音声強度比よりも小さくなるように配置され、
前記差分信号生成部は、
前記第１のマイクロフォンで取得された第１の電圧信号及び前記第２のマイクロフォンで取得された第２の電圧信号の少なくとも一方に所定遅延を与えて出力する遅延部と、
前記第１のマイクロフォンで取得された第１の電圧信号及び前記第２のマイクロフォンで取得された第２の電圧信号の少なくとも一方として、前記遅延部によって遅延を与えられた信号を入力して、第１の電圧信号と第２の電圧信号の差分信号を生成して出力する差分信号出力部とを含むことを特徴とする。

ここで第１のマイクロフォンで取得された第１の電圧信号に所定遅延を与えて出力する第１の遅延部、第２の電圧信号に所定遅延を与えて出力する第２の遅延部のいずれか一方を設けていずれか一方の電圧信号を遅延させて差分信号を生成してもよい。また第１の遅延部と第２の遅延部の両方を設けて第１の電圧信号と第２の電圧信号の両方を遅延させて差分信号を生成してもよい。第１の遅延部と第２の遅延部の両方を設ける場合にはいずれか一方に固定遅延を与える遅延部として構成し、他方の遅延を可変に調整可能な可変遅延部として構成してもよい。

製造工程における電気的又はメカ的な要因によりマイクロフォンの遅延にはばらつきが生じることが多い。かかる遅延のばらつきがあるとノイズ抑制効果に影響を与えることが実験的に確認された。

本発明によれば、第１の電圧信号及び第２の電圧信号の少なくとも一方に所定遅延を与えることにより、第１の電圧信号及び第２の電圧信号の遅延のばらつきを補正することができるので、遅延のばらつきによるノイズ抑制効果の低減を防止することができる。

この音声入力装置によると、第１及び第２のマイクロフォン（第１及び第２の振動膜）が所定の条件を満たすように配置されている。これによると、第１及び第２のマイクロフォンで取得された第１及び第２の電圧信号の差を示す差分信号を、雑音成分が除去された、入力音声を示す信号とみなすことができる。そのため、本発明によると、差分信号を生成するだけの単純な構成で雑音除去機能を実現することが可能な音声入力装置を提供することができる。

なお、この音声入力装置では、差分信号生成部は、第１及び第２の電圧信号に対する解析処理（フーリエ解析処理など）を行うことなく、差分信号を生成する。そのため、差分信号生成部の信号処理負担を軽減し、あるいは、差分信号生成部を非常に簡易な回路によって実現することが可能になる。

このことから、本発明によると、小型化が可能で、かつ、精度の高い雑音除去機能を実現することが可能な音声入力装置を提供することができる。

なお、この音声入力装置では、第１及び第２の振動膜は、雑音成分の位相差成分に基づく強度比が、入力音声成分の振幅に基づく強度比よりも小さくなるように配置されていてもよい。

（２）この音声入力装置は、
前記差分信号生成部は、
所定の端子に流れる電流に応じて遅延量が変化するよう構成された遅延部と、
前記所定の端子に前記遅延部の遅延量を制御する電流を供給する遅延制御部を含み、
前記遅延制御部は、
複数の抵抗が直列または並列に接続された抵抗アレー含み、前記抵抗アレーを構成する抵抗体又は導体の一部を切断する、もしくは少なくとも１つの抵抗体を含み、該抵抗体の一部を切断することで遅延部の所定の端子に供給する電流または電圧を変更可能に構成さ
れていることを特徴とする。

抵抗アレーを構成する抵抗体又は導体の一部をレーザによるカット、あるいは高電圧または高電流の印加により溶断することで抵抗アレーの抵抗値を変更してもよいし、１つの抵抗体の１部に切れ込みを入れることで抵抗値を変更してもよい。

マイクロフォンの製造過程で生じる個体差による遅延のばらつきを調べて、当該ばらつきにより生じる遅延差を解消するように、第１の電圧信号の遅延量を決定する。そして決定した遅延量を実現するための電圧あるいは電流を所定の端子に供給できるように前記抵抗アレーを構成する抵抗体又は導体（例えばヒューズ）の一部を切断する、もしくは抵抗体の一部に切れ込みを入れて、遅延制御部の抵抗値を適切な値に設定する。これにより前記第２のマイクロフォンで取得された第２の電圧信号との遅延のバランスを調整することができる。

（３）この音声入力装置は、
前記差分信号生成部は、
前記差分信号出力部の入力となる第１の電圧信号と第２の電圧信号を受け取り、受けとった第１の電圧信号と第２の電圧信号に基づいて、差分信号が生成される際の第１の電圧信号と第２の電圧信号の位相差を検出して、検出結果に基づき位相差信号を生成して出力する位相差検出部と、
前記位相差信号に基づき、前記遅延部における遅延量を変化させる制御を行う遅延制御部と、を含むことを特徴とする。

位相差検出は、例えばアナログ乗算器により位相比較を行う事により実現してもよい。

位相差検出部は、例えば第１の電圧信号と第２の電圧信号のいずれか一方の位相が他方に対して遅れまたは進みのいずれの状態にあるに応じて極性が変化し、また位相ずれの量に応じてパルス幅が変化するような前記位相差信号（信号の極性によって進み又は遅れを示す）を生成してもよい。

本発明によれば使用時に様々な理由で変化する遅延のばらつきをリアルタイムに検出して調整を行うことができる。

（４）この音声入力装置は、
前記位相差検出部は、
受け取った前記第１の電圧信号を所定レベルで２値化して第１のデジタル信号に変換する第１の２値化部と、
受け取った前記第２の電圧信号を所定レベルで２値化して第２のデジタル信号に変換する第２の２値化部と、
前記第１のデジタル信号と前記第２のデジタル信号との位相差を演算して位相差信号を出力する位相差信号出力部と、
を含むことを特徴とする。

（５）この音声入力装置は、
前記第１のマイクロフォンおよび前記第２のマイクロフォンから等距離に設置された音源部を含み、
前記差分信号生成部は、
前記差分信号出力部の入力となる第１の電圧信号と第２の電圧信号を受け取り、受けとった第１の電圧信号と第２の電圧信号に基づいて、差分信号が生成される際の第１の電圧信号と第２の電圧信号の位相差を検出して、検出結果に基づき位相差信号を生成して出力する位相差検出部と、
前記位相差信号に基づき、前記遅延部における遅延量を変化させる制御を行う遅延制御部と、を含み、
前記音源部からの音に基づいて前記遅延部における遅延量を変化させる制御を行うことを特徴とする。

（６）この音声入力装置は、
第１の振動膜を有する第１のマイクロフォンと、
第２の振動膜を有する第２のマイクロフォンと、
前記第１のマイクロフォンで取得された第１の電圧信号と、前記第２のマイクロフォンで取得された第２の電圧信号とに基づき第１の電圧信号と第２の電圧信号の差分信号を生成する差分信号生成部とを含む音声入力装置であって、
前記第１のマイクロフォンで取得された第１の電圧信号及び前記第２のマイクロフォンで取得された第２の電圧信号の少なくとも一方に所定遅延を与えて出力する遅延部と、
前記第１のマイクロフォンで取得された第１の電圧信号及び前記第２のマイクロフォンで取得された第２の電圧信号の少なくとも一方として、前記遅延部によって遅延を与えられた信号を入力して、第１の電圧信号と第２の電圧信号の差分信号を生成する差分信号出力部と、
前記第１のマイクロフォンおよび前記第２のマイクロフォンから等距離に設置された音源部を含み、
前記差分信号生成部は、
前記音源部からの音に基づいて前記遅延部における遅延量を変化させる制御を行うことを特徴とする。

（７）この音声入力装置は、
前記差分信号生成部は、
前記差分信号出力部の入力となる第１の電圧信号と第２の電圧信号を受け取り、受けとった第１の電圧信号と第２の電圧信号に基づいて、差分信号が生成される際の第１の電圧信号と第２の電圧信号の位相差を検出して、検出結果に基づき位相差信号を生成して出力する位相差検出部と、
前記位相差信号に基づき、前記遅延部における遅延量を変化させる制御を行う遅延制御部と、を含むことを特徴とする。

（８）この音声入力装置は、
前記音源部は、単一周波数の音を発生する音源であることを特徴とする。

（９）この音声入力装置は、
前記音源部の周波数は、可聴帯域外に設定されることを特徴とする。

前記音源部の周波数は、可聴帯域外に設定されると、ユーザ使用時においても、支障をきたすことなく音源部を用いて入力信号の位相差あるいは遅延差を調整することができる。本発明によれば、使用時にダイナミックに調整できるので、温度変化等の周囲の環境に応じた遅延調整をおこなうことができる。

（１０）この音声入力装置は、
前記位相差検出部は、
受け取った第１の電圧信号を入力して前記単一周波数を通過させる第１のバンドパスフィルタと、
受け取った第２の電圧信号を入力して前記単一周波数を通過させる第２のバンドパスフィルタと、を含み、
第１のバンドパスフィルタを通過後の第１の電圧信号と、第２のバンドパスフィルタを通過後の第２の電圧信号に基づき位相差を検出することを特徴とする。

音源部で単一周波数の音を発生させて、それ以外の音を第１のバンドパスフィルタと第２のバンドパスフィルタでカットしたあと位相差を検出することができるので、位相差または遅延量を精度良く検出することができる。

なお音声入力装置自体が音源部を有していない場合でも、テスト時に音声入力装置の近傍にテスト用音源を一時的に設置して、第１のマイクロフォンと第２のマイクロフォンに対して音が同位相で入力されるように設定し、第１のマイクロフォンと第２のマイクロフォンで受音して、出力される第１の電圧信号と第２の電圧信号の波形をモニタして両者の位相が一致するように遅延部の遅延量を変更してもよい。また、位相差検出部およびバンドパスフィルタは、必ずしも音声入力装置内に構成する必要はなく、テスト音源と同様に外部設置するものであっても構わない。

（１１）この音声入力装置は、
前記第２のマイクロフォンで取得された第２の電圧信号にノイズ検出用の遅延を与えて出力するノイズ検出用遅延部と、
前記ノイズ検出用遅延部によってノイズ検出用の所定の遅延を与えられた第２の電圧信号と、前記第１のマイクロフォンで取得された第１の電圧信号との差を示すノイズ検出用の差分信号を生成するノイズ検出用差分信号生成部と、
前記ノイズ検出用の差分信号に基づきノイズのレベルを判定し、判定結果に基づきノイズ検出信号を出力するノイズ検出部と、
前記差分信号生成部から出力される差分信号と前記第１のマイクロフォンで取得された第１の電圧信号を受け取り、前記ノイズ検出信号に基づき第１の電圧信号と前記差分信号とを切り替えて出力する信号切り替え部と、
を含むことを特徴とする。

本発明によれば差動マイクの指向特性を制御して話者音声を除いた周囲の雑音の状態を検出し、検出した雑音のレベルに応じてシングルマイクの出力と差動マイクの出力を切り替えることができる。従って検出した周囲の雑音が所定のレベルより小さい場合にはシングルマイクの出力とし、所定のレベルよりも大きい場合には差動マイクの出力とすることで、静かな環境ではＳＮ比を優先し、高騒音環境では遠方ノイズの抑圧を優先した音声入力装置を提供することができる。

（１２）本発明は、
音声入力装置であって、
第１の振動膜を有する第１のマイクロフォンと、
第２の振動膜を有する第２のマイクロフォンと、
前記第１のマイクロフォンで取得された第１の電圧信号と、前記第２のマイクロフォンで取得された第２の電圧信号とに基づき第１の電圧信号と第２の電圧信号の差分信号を生成する差分信号生成部と、
前記第２のマイクロフォンで取得された第２の電圧信号にノイズ検出用の遅延を与えて出力するノイズ検出用遅延部と、
前記ノイズ検出用遅延部によってノイズ検出用の所定の遅延を与えられた第２の電圧信号と、前記第１のマイクロフォンで取得された第１の電圧信号との差を示すノイズ検出用の差分信号を生成するノイズ検出用差分信号生成部と、
前記ノイズ検出用の差分信号に基づきノイズのレベルを判定し、判定結果に基づきノイズ検出信号を出力するノイズ検出部と、
前記差分信号生成部から出力される差分信号と前記第１のマイクロフォンで取得された
第１の電圧信号を受け取り、前記ノイズ検出信号に基づき第１の電圧信号と前記差分信号を切り替えて出力する信号切り替え部と、
を含むことを特徴とする。

（１３）この音声入力装置は、
音情報を出力するスピーカと、
前記ノイズ検出信号に基づき前記スピーカの音量を制御する音量制御部と、
をさらに含むことを特徴とする。

前記ノイズのレベルが所定レベルより大きいときはスピーカ音量を上げ、前記ノイズのレベルが所定レベルより小さいときはスピーカ音量を下げるようにしてもよい。

（１４）この音声入力装置は、
前記ノイズ検出用の遅延は、第１および第２の振動版の中心間距離を音速で除算した時間に設定されることを特徴とする。

このように遅延量を設定して、音声入力装置の指向特性をカーディオイド型にし、話者の位置を指向性のヌル位置近傍に設定することで、話者音声をカットして周囲雑音のみを拾いやすい指向性となるため、ノイズ検出用に利用することができる。

（１５）この音声入力装置は、
前記第１の電圧信号をアナログ・デジタル変換する第１のＡＤ変換手段と、
前記第２の電圧信号をアナログ・デジタル変換する第２のＡＤ変換手段と、をさらに含み、
前記差分信号生成部は、
前記第１のＡＤ変換手段によってデジタル信号に変換された前記第１の電圧信号と、前記第２のＡＤ変換手段によってデジタル信号に変換された前記第２の電圧信号と、に基づき第１の電圧信号と第２の電圧信号の差分信号を生成することを特徴とする。

（１６）この音声入力装置は、
前記遅延部の遅延は、アナログ・デジタル変換の変換周期の整数倍に設定されることを特徴とする。

（１７）この音声入力装置は、
第１および第２の振動版の中心間距離は、アナログ・デジタル変換の変換周期に音速を乗じた値もしくはその整数倍に設定されることを特徴とする。

このようにするとノイズ検出用遅延部では、入力電圧信号をデジタル的にｎ（ｎは整数）クロック遅延するという簡単な動作で、周囲のノイズを拾うのに都合のカーディオイド型の指向性特性を簡単かつ精度良く実現することができる。

（１８）この音声入力装置は、
前記第１のマイクロフォンで取得された第１の電圧信号及び前記第２のマイクロフォンで取得された第２の電圧信号の少なくとも一方に所定ゲインを与えて出力するゲイン部をさらに含み、
前記差分信号出力部は、
前記第１のマイクロフォンで取得された第１の電圧信号及び前記第２のマイクロフォンで取得された第２の電圧信号の少なくとも一方が前記ゲイン部によってゲインを与えられた信号を入力して、第１の電圧信号と第２の電圧信号の差分信号を生成して出力することを特徴とする。

本発明によれば、前記第１のマイクロフォンで取得された第１の電圧信号及び前記第２のマイクロフォンで取得された第２の電圧信号の少なくとも一方に所定ゲインを与えることにより、２つのマイクロフォンの製造時の個体差によるゲインばらつきを吸収することができる。ここで、所定入力音圧に対する第１の電圧信号及び第２の電圧信号の振幅が等しくなるように、または第１の電圧信号及び第２の電圧信号の振幅差が所定の範囲内におさまるように補正してもよい。これにより、製造工程で生じたマイクロフォンの個体差による感度ばらつきによるノイズ抑制効果の低減を防止することができる。

（１９）この音声入力装置は、
主面に凹部が形成された基部をさらに含み、
前記第１の振動膜は前記凹部の底面に設置され、
前記第２の振動膜は前記主面に設置されていることを特徴とする。

（２０）この音声入力装置は、
前記基部が、前記凹部に連通する開口が、前記主面における前記第２の振動膜の形成領域よりも、前記入力音声のモデル音源の近くに配置されるように設置されたことを特徴とする。

この音声入力装置によると、第１及び第２の振動膜に入射する入力音声の位相ずれを小さくすることができる。そのため、ノイズの少ない差分信号を生成することが可能になり、精度の高い雑音除去機能を有する音声入力装置を提供することができる。

（２１）この音声入力装置は、
前記凹部は、前記開口と前記第２の振動膜の形成領域との間隔よりも浅いことを特徴とする。

（２２）この音声入力装置は、
主面に、第１の凹部と、前記第１の凹部よりも浅い第２の凹部が形成された基部をさらに含み、
前記第１の振動膜は前記第１の凹部の底面に設置され、
前記第２の振動膜は前記第２の凹部の底面に設置されていることを特徴とする。

（２３）この音声入力装置は、
前記基部が、前記第１の凹部に連通する第１の開口が、前記第２の凹部に連通する第２の開口よりも、前記入力音声のモデル音源の近くに配置されるように設置されたことを特徴とする。

（２４）この音声入力装置は、
前記第１及び第２の凹部の深さの差は、前記第１及び第２の開口の間隔よりも小さいことを特徴とする。

（２５）この音声入力装置は、
前記基部が、前記入力音声が、第１及び第２の振動膜に同時に到着するように設置されたことを特徴とする。

これによると、入力音声の位相ずれを含まない差分信号を生成することができるため、精度の高い雑音除去機能を有する音声入力装置を提供することができる。

（２６）本発明は、
音声入力装置であって、
第１の振動膜を有する第１のマイクロフォンと、
第２の振動膜を有する第２のマイクロフォンと、
前記第１のマイクロフォンで取得された第１の電圧信号と、前記第２のマイクロフォンで取得された第２の電圧信号との差を示す差分信号を生成する差分信号生成部と、
を含み、
前記第１及び第２の振動膜は、前記差分信号に含まれる雑音成分の強度の、前記第１又は第２の電圧信号に含まれる前記雑音成分の強度に対する比率を示す雑音強度比が、前記差分信号に含まれる入力音声成分の強度の、前記第１又は第２の電圧信号に含まれる前記入力音声成分の強度に対する比率を示す入力音声強度比よりも小さくなるように配置され、
前記第１の振動膜及び前記第２の振動膜の少なくとも一方は、膜面に対して垂直になるように設置された筒状の導音管を介して音波を取得するように構成されていることを特徴とする。

導音管は、開口部から入力した音波が外部に漏れないよう振動膜まで届くように、振動膜の周囲の基板に密着して設置することにより、導音管に入った音は減衰することなく振動膜まで届く。本発明によれば前記第１の振動膜及び前記第２の振動膜の少なくとも一方に導音管を設置することにより、拡散による減衰なしに音が振動膜に届くまでの距離を変えることができる。従って遅延バランスのばらつきに応じて、適当な長さ（例えば数ミリ）の導音管を設置することにより遅延を解消することができる。

（２７）この音声入力装置は、
前記入力音が、第１及び第２の振動膜に同時に到着するように導音管を設置することを特徴とする。

（２８）この音声入力装置は、
前記第１及び第２の振動膜は、法線が平行になるように配置されていることを特徴とする。

（２９）この音声入力装置は、
前記第１及び第２の振動膜は、法線が同一直線とならないように配置されていることを特徴とする。

（３０）この音声入力装置は、
前記第１及び第２のマイクロフォンは、半導体装置として構成されていることを特徴とする。

例えば、第１及び第２のマイクロフォンは、シリコンマイク（Ｓｉマイク）であってもよい。そして、第１及び第２のマイクロフォンは、１つの半導体基板として構成されていてもよい。このとき、第１及び第２のマイクロフォンと、差分信号生成部とが、１つの半導体基板として構成されていてもよい。第１及び第２のマイクロフォンは、半導体プロセスを利用して作られた、いわゆるメムス（MEMS：Micro Electro Mechanical Systems）として構成されていてもよい。

（３１）この音声入力装置は、
前記第１及び第２の振動膜の中心間距離は、５．２ｍｍ以下であることを特徴とする。

なお、第１及び第２の振動膜は、法線が平行になるように、かつ、法線の間隔が５．２ｍｍ以下となるように配置されていてもよい。

（３２）この音声入力装置は、
前記振動膜を、ＳＮ比が約６０デシベル以上の振動子で構成してもよい。
例えばＳＮ比が６０デシベル以上の振動子で構成してもよいし、６０±αデシベル以上の振動子で構成してもよい。

（３３）この音声入力装置は、
前記第１及び第２の振動膜の中心間距離が、１０kHz以下の周波数帯域の音に対して第１の振動膜に入射する音声の音圧の強度に対する第１の振動膜と第２の振動膜に入射する音声の差分音圧の強度の比率である音声強度比の位相成分が０デシベル以下となる距離に設定されていてもよい。

（３４）この音声入力装置は、
前記第１及び第２の振動膜の中心間距離が、抽出対象周波数帯域の音に対して、前記振動膜を差動マイクとして使用した場合の音圧が全方位において単体マイクとして使用した場合の音圧を上回らない範囲の距離に設定されていてもよい。

抽出対象周波数は、本音声入力装置で抽出したい音の周波数である。例えば７kHz以下の周波数を抽出対象周波数として前記第１及び第２の振動膜の中心間距離が設定されていてもよい。

（３５）本発明は、
上記のいずれかに記載の音声入力装置と、
前記差分信号に基づいて、前記音声入力装置に入力された音声情報の解析処理を行う解析処理部と、を含むことを特徴とする情報処理システムである。

この情報処理システムによると、第１及び第２の振動膜が所定の条件を満たすように配置された音声入力装置で取得された差分信号に基づいて、音声情報の解析処理を行う。この音声入力装置によると、差分信号は、雑音成分が除去された音声成分を示す信号となるため、この差分信号を解析処理することによって、入力音声に基づく種々の情報処理が可能になる。

本発明に係る情報処理システムは、音声認識処理や、音声認証処理、あるいは、音声に基づくコマンド生成処理などを行うシステムであってもよい。

（３６）本発明は、
上記のいずれかに記載の音声入力装置と、
前記差分信号に基づいて、前記音声入力装置に入力された音声情報の解析処理を行うホストコンピュータと、を含み、
前記通信処理部によって、前記ホストコンピュータとのネットワークを介した通信処理を行うことを特徴とする情報処理システムである。

この情報処理システムによると、第１及び第２の振動膜が所定の条件を満たすように配置された音声入力装置で取得された差分信号に基づいて、音声情報の解析処理を行う。この音声入力装置によると、差分信号は、雑音成分が除去された音声成分を示す信号となるため、差分信号を解析処理することによって、入力音声に基づく種々の情報処理が可能になる。

本発明に係る情報処理システムでは、音声認識処理や、音声認証処理、あるいは、音声に基づくコマンド生成処理などを行うシステムであってもよい。

（３７）本発明は、
第１の振動膜を有する第１のマイクロフォンと、第２の振動膜を有する第２のマイクロフォンと、前記第１のマイクロフォンで取得された第１の電圧信号と、前記第２のマイクロフォンで取得された第２の電圧信号との差を示す差分信号を生成する差分信号生成部と、を含む、雑音成分を除去する機能を有する音声入力装置を製造する方法であって、
前記第１及び第２の振動膜の中心間距離Δｒと雑音の波長λとの比率を示すΔｒ／λの値と、前記差分信号に含まれる前記雑音成分の強度の、前記第１又は第２の電圧信号に含まれる前記雑音成分の強度に対する比率を示す雑音強度比との対応関係を示すデータを用意する手順と、
前記データに基づいて、前記Δｒ／λの値を設定する手順と、
設定された前記Δｒ／λの値、及び、前記雑音の波長に基づいて、前記中心間距離を設定する手順と、
所定の端子に流れる電流に応じて遅延量が変化するよう構成された遅延部の前記所定の端子に前記遅延部の遅延量を制御する電流を供給する遅延制御部を、複数の抵抗が直列または並列に接続された抵抗アレー含んで構成し、遅延部の所定の端子に所定の電流を供給するために、前記抵抗アレーを構成する抵抗体又は導体の一部を切断する遅延設定手順と、
を含むことを特徴とする音声入力装置の製造方法である。

（３８）この音声入力装置の製造方法は、
上記遅延設定手順において、
前記第１のマイクロフォンおよび前記第２のマイクロフォンから等距離に音源を設置し、
前記音源部からの音に基づいて、第１のマイクロフォンおよび前記第２のマイクロフォンから取得された電圧信号の位相差を判定し、当該位相差が所定の範囲内におさまる抵抗値となるように前記抵抗アレーを構成する抵抗体又は導体の一部を切断すること、もしくは１つの抵抗体の一部を切断することを特徴とする。

以下、本発明を適用した実施の形態について図面を参照して説明する。ただし、本発明は以下の実施の形態に限定されるものではない。また、本発明は、以下の内容を自由に組み合わせたものを含むものとする。

１．第１の実施の形態に係る音声入力装置の構成
はじめに、図１〜図３を参照して、本発明を適用した実施の形態に係る音声入力装置１の構成について説明する。なお、以下に説明する音声入力装置１は、接話式の音声入力装置であって、例えば、携帯電話やトランシーバー等の音声通信機器や、入力された音声を解析する技術を利用した情報処理システム（音声認証システム、音声認識システム、コマンド生成システム、電子辞書、翻訳機や、音声入力方式のリモートコントローラなど）、あるいは、録音機器やアンプシステム（拡声器）、マイクシステムなどに適用することができる。

本実施の形態に係る音声入力装置は、第１の振動膜１２を有する第１のマイクロフォン１０と、第２の振動膜２２を有する第２のマイクロフォン２０とを含む。ここで、マイクロフォンとは、音響信号を電気信号へ変換する電気音響変換器である。第１及び第２のマイクロフォン１０，２０は、それぞれ、第１及び第２の振動膜１２，２２（振動板）の振動を、電圧信号として出力する変換器であってもよい。

本実施の形態に係る音声入力装置では、第１のマイクロフォン１０は第１の電圧信号を生成する。また、第２のマイクロフォン２０は第２の電圧信号を生成する。すなわち、第１及び第２のマイクロフォン１０，２０で生成された電圧信号を、それぞれ、第１及び第２の電圧信号と呼んでもよい。

第１及び第２のマイクロフォン１０，２０の機構については特に限定されるものではない。図２には、第１及び第２のマイクロフォン１０，２０に適用可能なマイクロフォンの一例として、コンデンサ型マイクロフォン１００の構造を示す。コンデンサ型マイクロフォン１００は、振動膜１０２を有する。振動膜１０２は、音波を受けて振動する膜（薄膜）で、導電性を有し、電極の一端を形成している。コンデンサ型マイクロフォン１００は、また、電極１０４を有する。電極１０４は、振動膜１０２と対向して配置されている。これにより、振動膜１０２と電極１０４とは容量を形成する。コンデンサ型マイクロフォン１００に音波が入射すると、振動膜１０２が振動して、振動膜１０２と電極１０４との間隔が変化し、振動膜１０２と電極１０４との間の静電容量が変化する。この静電容量の変化を、例えば電圧の変化として出力することによって、コンデンサ型マイクロフォン１００に入射する音波を、電気信号に変換することができる。なお、コンデンサ型マイクロフォン１００では、電極１０４は、音波の影響を受けない構造をなしていてもよい。例えば、電極１０４はメッシュ構造をなしていてもよい。

ただし、本発明に適用可能なマイクロフォンは、コンデンサ型マイクロフォンに限られるものではなく、既に公知となっているいずれかのマイクロフォンを適用することができる。例えば、第１及び第２のマイクロフォン１０，２０として、動電型（ダイナミック型）、電磁型（マグネティック型）、圧電型（クリスタル型）等のマイクロフォンを適用してもよい。

第１及び第２のマイクロフォン１０，２０は、第１及び第２の振動膜１２，２２がシリコンによって構成されたシリコンマイク（Ｓｉマイク）であってもよい。シリコンマイクを利用することで、第１及び第２のマイクロフォン１０，２０の小型化、及び、高性能化を実現することができる。このとき、第１及び第２のマイクロフォン１０，２０は、１つの集積回路装置として構成されていてもよい。すなわち、第１及び第２のマイクロフォン１０，２０は、１つの半導体基板に構成されていてもよい。このとき、後述する差分信号生成部３０も、同一の半導体基板に形成されていてもよい。すなわち、第１及び第２のマイクロフォン１０，２０は、いわゆるメムス（MEMS：M icro Electro Mechanical Systems）として構成されていてもよい。ただし、第１のマイクロフォン１０と第２のマイクロフォン２０とは、別々のシリコンマイクとして構成されていてもよい。

前記振動膜を、ＳＮ（Signal to Noise）比が約６０デシベル以上の振動子で構成してもよい。振動子を差動マイクとして機能させる場合には単体マイクとして機能させる場合に比べてＳＮ比が低下する。従ってＳＮ比に優れた振動子（例えばＳＮ比が６０デシベル以上のＭＥＭＳ振動子）を用いて前記振動膜を構成することで、感度のよい音声入力装置を実現することができる。

例えば、単体マイク２個を５ｍｍ程度離して配置し、これらの差分をとることで差動マイクを構成し、話者とマイク間の距離を約2.5cm程度（接話型の音声入力装置）の条件で使用する場合には、単体マイクの場合に比べて出力感度が１０デシベル程度低下する。すなわち、単体マイクに比べて差動マイクは少なくとも１０デシベルはＳＮ比が低下することになる。マイクの実用性を考えた場合、ＳＮ比は５０デシベル程度必要であるとされているため、差動マイクにおいてこの条件を満たすためには、単体の状態でＳＮ比が約６０デシベル以上確保できるような振動子を用いてマイクロフォンを構成する必要があり、これにより、前記感度の低下による影響を鑑みてもマイクとしての機能の必要レベルを満たした音声入力装置を実現することができる。

本実施の形態に係る音声入力装置では、後述するように、第１及び第２の電圧信号の差を示す差分信号を利用して、雑音成分を除去する機能を実現する。この機能を実現するために、第１及び第２のマイクロフォン（第１及び第２の振動膜１２，２２）は、一定の制約を満たすように配置される。第１及び第２の振動膜１２，２２が満たすべき制約の詳細については後述するが、本実施の形態では、第１及び第２の振動膜１２，２２（第１及び第２のマイクロフォン１０，２０）は、雑音強度比が、入力音声強度比よりも小さくなるように配置される。これにより、差分信号を、雑音成分が除去された音声成分を示す信号とみなすことが可能になる。第１及び第２の振動膜１２，２２は、例えば、中心間距離が５．２ｍｍ以下になるように配置されていてもよい。

なお、本実施の形態に係る音声入力装置では、第１及び第２の振動膜１２，２２の向きは、特に限定されるものではない。第１及び第２の振動膜１２，２２は、法線が平行になるように配置されていてもよい。このとき、第１及び第２の振動膜１２，２２は、法線が同一直線にならないように配置されていてもよい。例えば、第１及び第２の振動膜１２，２２は、図示しない基部（例えば回路基板）の表面に、間隔をあけて配置されていてもよい。あるいは、第１及び第２の振動膜１２，２２は、法線方向にずれて配置されていてもよい。ただし、第１及び第２の振動膜１２，２２は、法線が平行にならないように配置されていてもよい。第１及び第２の振動膜１２，２２は、法線が直交するように配置されていてもよい。

そして、本実施の形態に係る音声入力装置は、差分信号生成部３０を有する。差分信号生成部３０は、第１のマイクロフォン１０で取得された第１の電圧信号と、第２のマイクロフォン２０で取得された第２の電圧信号との差（電圧差）を示す差分信号を生成する。差分信号生成部３０では、第１及び第２の電圧信号に対して例えばフーリエ解析などの解析処理を行うことなく、時間領域において両者の差を示す差分信号を生成する処理を行う。差分信号生成部３０の機能は、専用のハードウェア回路（差分信号生成回路）によって実現してもよく、ＣＰＵなどによる信号処理によって実現してもよい。

本実施の形態に係る音声入力装置は、差分信号を増幅する（ゲインを上げる場合もゲインを下げる場合も含む意味である）ゲイン部をさらに含んでいてもよい。差分信号生成部３０とゲイン部とは、１つの制御回路によって実現してもよい。ただし、本実施の形態に係る音声入力装置は、ゲイン部を内部に持たない構成をなしていてもよい。

図３には、差分信号生成部３０とゲイン部とを実現可能な回路の一例を示す。図３に示す回路によれば、第１及び第２の電圧信号を受け付けて、その差を示す差分信号を１０倍に増幅した信号を出力することになる。ただし、差分信号生成部３０及びゲイン部を実現するための回路構成は、これに限られるものではない。

本実施の形態に係る音声入力装置は、筐体４０を含んでいてもよい。このとき、音声入力装置の外形は、筐体４０によって構成されていてもよい。筐体４０には基本姿勢が設定されていてもよく、これにより、入力音声の進行径路を規制することができる。第１及び第２の振動膜１２，２２は、筐体４０の表面に形成されていてもよい。あるいは、第１及び第２の振動膜１２，２２は、筐体４０に形成された開口（音声入射口）と対向するように、筐体４０内部に配置されていてもよい。そして、第１及び第２の振動膜１２，２２は、音源（入射音声のモデル音源）からの距離が異なるように配置されていてもよい。例えば図１に示すように、筐体４０は、入力音声の進行径路が筐体４０の表面に沿うように、基本姿勢が設定されていてもよい。そして、第１及び第２の振動膜１２，２２は、入力音声の進行径路に沿って配置されていてもよい。そして、入力音声の進行径路の上流側に配置される振動膜を第１の振動膜１２とし、下流側に配置される振動膜を第２の振動膜２２としてもよい。

本実施の形態に係る音声入力装置は、演算処理部５０をさらに含んでいてもよい。演算処理部５０は、差分信号生成部３０で生成された差分信号に基づいて各種の演算処理を行う。演算処理部５０は、差分信号に対する解析処理を行ってもよい。演算処理部５０は、差分信号を解析することにより、入力音声を発した人物を特定する処理（いわゆる音声認証処理）を行ってもよい。あるいは、演算処理部５０は、差分信号を解析処理することにより、入力音声の内容を特定する処理（いわゆる音声認識処理）を行ってもよい。演算処理部５０は、入力音声に基づいて、各種のコマンドを作成する処理を行ってもよい。演算処理部５０は、差分信号を増幅する処理を行ってもよい。また、演算処理部５０は、後述する通信処理部６０の動作を制御してもよい。なお、演算処理部５０は、上記各機能を、ＣＰＵやメモリによる信号処理によって実現してもよい。

演算処理部５０は、筐体４０の内部に配置されていてもよいが、筐体４０の外部に配置されていてもよい。演算処理部５０が筐体４０の外部に配置されている場合、演算処理部５０は、後述する通信処理部６０を介して、差分信号を取得してもよい。

本実施の形態に係る音声入力装置は、通信処理部６０をさらに含んでいてもよい。通信処理部６０は、音声入力装置と、他の端末（携帯電話端末や、ホストコンピュータなど）との通信を制御する。通信処理部６０は、ネットワークを介して、他の端末に信号（差分信号）を送信する機能を有していてもよい。通信処理部６０は、また、ネットワークを介して、他の端末から信号を受信する機能を有していてもよい。そして、例えばホストコンピュータで、通信処理部６０を介して取得した差分信号を解析処理して、音声認識処理や音声認証処理、コマンド生成処理や、データ蓄積処理など、種々の情報処理を行ってもよい。すなわち、音声入力装置は、他の端末と協働して、情報処理システムを構成していてもよい。言い換えると、音声入力装置は、情報処理システムを構築する情報入力端末であるとみなしてもよい。ただし、音声入力装置は、通信処理部６０を有しない構成となっていてもよい。

本実施の形態に係る音声入力装置は、表示パネルなどの表示装置や、スピーカ等の音声出力装置をさらに含んでいてもよい。また、本実施の形態に係る音声入力装置は、操作情報を入力するための操作キーをさらに含んでいてもよい。

本実施の形態に係る音声入力装置は、以上の構成をなしていてもよい。この音声入力装
置によると、第１及び第２の電圧信号の差を出力するだけの簡単な処理によって、雑音成分が除去された音声成分を示す信号（電圧信号）が生成される。そのため、本発明によると、小型化が可能で、かつ、優れた雑音除去機能を有する音声入力装置を提供することができる。なお、その原理については、後で詳述する。

２．雑音除去機能
以下、本実施の形態に係る音声入力装置が採用する音声除去原理、及び、これを実現するための条件について説明する。

（１）雑音除去原理
はじめに、本実施の形態に係る音声入力装置の雑音除去原理について説明する。

音波は、媒質中を進行するにつれ減衰し、音圧（音波の強度・振幅）が低下する。音圧は、音源からの距離に反比例するため、音圧Ｐは、音源からの距離Ｒとの関係において、

と表すことができる。なお、式（１）中、Ｋは比例定数である。図４には、式（１）を表すグラフを示すが、本図からもわかるように、音圧（音波の振幅）は、音源に近い位置（グラフの左側）では急激に減衰し、音源から離れるほどなだらかに減衰する。本実施の形態に係る音声入力装置では、この減衰特性を利用して雑音成分を除去する。

すなわち、接話型の音声入力装置では、ユーザは、雑音の音源よりも、第１及び第２のマイクロフォン１０，２０（第１及び第２の振動膜１２，２２）に近い位置から音声を発する。そのため、第１及び第２の振動膜１２，２２の間で、ユーザの音声は大きく減衰し、第１及び第２の電圧信号に含まれるユーザ音声の強度には差が現れる。これに対して、雑音成分は、ユーザの音声に比べて音源が遠いため、第１及び第２の振動膜１２，２２の間でほとんど減衰しない。そのため、第１及び第２の電圧信号に含まれる雑音の強度には、差が現れないとみなすことができる。このことから、第１及び第２の電圧信号の差を検出すれば雑音が消去されるため、雑音成分が含まれない、ユーザの音声成分のみを示す電圧信号（差分信号）を取得することができる。すなわち、差分信号を、雑音成分が除去されたユーザの音声を示す信号であるとみなすことができる。

ただし、音波は位相成分を有する。そのため、信頼性の高い雑音除去機能を実現するためには、第１及び第２の電圧信号に含まれる音声成分及び雑音成分の位相差を考慮する必要がある。

以下、差分信号を生成することによって雑音除去機能を実現するために、音声入力装置が満たすべき具体的な条件について説明する。

（２）音声入力装置が満たすべき具体的条件
本実施の形態に係る音声入力装置は、先に説明したように、第１及び第２の電圧信号の差分を示す差分信号を、雑音を含まない入力音声信号であるとみなす。この音声入力装置によると、差分信号に含まれる雑音成分が、第１又は第２の電圧信号に含まれる雑音成分よりも小さくなれば、雑音除去機能が実現できたと評価することができる。詳しくは、差分信号に含まれる雑音成分の強度の、第１又は第２の電圧信号に含まれる雑音成分の強度
に対する比を示す雑音強度比が、差分信号に含まれる音声成分の強度の、第１又は第２の電圧信号に含まれる音声成分の強度に対する比を示す音声強度比よりも小さくなれば、この雑音除去機能が実現されたと評価することができる。

以下、この雑音除去機能を実現するために、音声入力装置（第１及び第２の振動膜１２，２２）が満たすべき具体的な条件について説明する。

はじめに、第１及び第２のマイクロフォン１０，２０（第１及び第２の振動膜１２，２２）に入射する音声の音圧について検討する。入力音声（ユーザの音声）の音源から第１の振動膜１２までの距離をＲとし、第１及び第２の振動膜１２，２２（第１及び第２のマイクロフォン１０，２０）の中心間距離をΔｒとすれば、位相差を無視すれば、第１及び第２のマイクロフォン１０，２０で取得される、入力音声の音圧（強度）Ｐ（Ｓ１）及びＰ（Ｓ２）は、

と表すことができる。

そのため、入力音声の位相差を無視した時の、第１のマイクロフォン１０で取得される入力音声成分の強度に対する、差分信号に含まれる入力音声成分の強度の比率を示す音声強度比ρ（Ｐ）は、

と表される。

ここで、本実施の形態に係る音声入力装置は接話式の音声入力装置であって、ΔｒはＲに比べて充分小さいとみなすことができる。

そのため、上述の式（４）は、

と変形することができる。

すなわち、入力音声の位相差を無視した場合の音声強度比は、式（Ａ）と表されることがわかる。

ところで、入力音声の位相差を考慮すると、ユーザ音声の音圧Ｑ（Ｓ１）及びＱ（Ｓ２）は、

と表すことができる。なお、式中、αは位相差である。

このとき、音声強度比ρ（Ｓ）は、

と表される。式（７）を考慮すると、音声強度比ρ（Ｓ）の大きさは、

と表すことができる。

ところで、式（８）のうち、sinωt−sin(ωt−α)項は位相成分の強度比を示し、Δr／R sinωt項は振幅成分の強度比を示す。入力音声成分であっても、位相差成分は、振幅成分に対するノイズとなるため、入力音声（ユーザの音声）を精度よく抽出するためには、位相成分の強度比が、振幅成分の強度比よりも充分に小さいことが必要である。すなわち、sinωt−sin(ωt−α)と、Δr／R sinωtとは、

の関係を満たしていることが必要である。

ここで、

と表すことができるため、上述の式（Ｂ）は、

と表すことができる。

式（１０）の振幅成分を考慮すると、本実施の形態に係る音声入力装置は、

を満たす必要があることがわかる。

なお、上述したように、ΔｒはＲに比べて充分小さいとみなすことができるため、sin(α/２)は充分小さいとみなすことができ、

と近似することができる。

そのため、式（Ｃ）は、

と変形することができる。

また、位相差であるαとΔｒとの関係を、

と表せば、式（Ｄ）は、

と変形することができる。

すなわち、本実施の形態では、入力音声（ユーザの音声）を精度よく抽出するためには、音声入力装置を、式（Ｅ）に示す関係を満たすように製造することが必要である。

次に、第１及び第２のマイクロフォン１０，２０（第１及び第２の振動膜１２，２２）に入射する雑音の音圧について検討する。

第１及び第２のマイクロフォンで取得される雑音成分の振幅を、Ａ，Ａ´とすると、位相差成分を考慮した雑音の音圧Ｑ（Ｎ１）及びＱ（Ｎ２）は、

と表すことができ、第１のマイクロフォン１０で取得される雑音成分の強度に対する、差分信号に含まれる雑音成分の強度の比率を示す雑音強度比ρ（Ｎ）は、

と表すことができる。

なお、先に説明したように、第１及び第２のマイクロフォンで取得される雑音成分の振幅（強度）はほぼ同じであり、Ａ＝Ａ´と扱うことができる。そのため、上記の式（１５）は、

と変形することができる。

そして、雑音強度比の大きさは、

と表すことができる。

ここで、上述の式（９）を考慮すると、式（１７）は、

と変形することができる。

そして、式（１１）を考慮すると、式（１８）は、

と変形することができる。

ここで、式（Ｄ）を参照すれば、雑音強度比は、

と表すことができる。なお、Δｒ／Ｒとは、式（Ａ）に示すように、入力音声（ユーザ音声）の振幅成分の強度比である。式（Ｆ）から、この音声入力装置では、雑音強度比が入力音声の強度比Δｒ／Ｒよりも小さくなることがわかる。

以上のことから、入力音声の位相成分の強度比が振幅成分の強度比よりも小さくなるように設計された音声入力装置によれば（式（Ｂ）参照）、雑音強度比が入力音声強度比よりも小さくなる（式（Ｆ）参照）。逆に言うと、雑音強度比が入力音声強度比よりも小さくなるように設計された音声入力装置によると、精度の高い雑音除去機能を実現することができる。

すなわち、第１及び第２の振動膜１２，２２（第１及び第２のマイクロフォン１０，２０）が、雑音強度比が入力音声強度比よりも小さくなるように配置される本実施の形態に係る音声入力装置によれば、精度の高い雑音除去機能を実現することができる。

３．音声入力装置の製造方法
以下、本実施の形態に係る音声入力装置の製造方法について説明する。本実施の形態では、第１及び第２の振動膜１２，２２の中心間距離Δｒと雑音の波長λとの比率を示すΔｒ／λの値と、雑音強度比（雑音の位相成分に基づく強度比）との対応関係を示すデータを利用して、音声入力装置を製造する。

雑音の位相成分に基づく強度比は、上述した式（１８）で表される。そのため、雑音の位相成分に基づく強度比のデシベル値は、

と表すことができる。

そして、式（２０）のαに各値を代入すれば、位相差αと雑音の位相成分に基づく強度比との対応関係を明らかにすることができる。図５には、横軸をα／２πとし、縦軸に雑音の位相成分に基づく強度比（デシベル値）を取った時の、位相差と強度比との対応関係を表すデータの一例を示す。

なお、位相差αは、式（１２）に示すように、距離Δｒと波長λとの比であるΔｒ／λの関数で表すことができ、図５の横軸は、Δｒ／λとみなすことができる。すなわち、図５は、雑音の位相成分に基づく強度比と、Δｒ／λとの対応関係を示すデータであるといえる。

本実施の形態では、このデータを利用して、音声入力装置を製造する。図６は、このデータを利用して音声入力装置を製造する手順について説明するためのフローチャート図である。

はじめに、雑音の強度比（雑音の位相成分に基づく強度比）と、Δｒ／λとの対応関係を示すデータ（図５参照）を用意する（ステップＳ１０）。

次に、用途に応じて、雑音の強度比を設定する（ステップＳ１２）。なお、本実施の形態では、雑音の強度が低下するように雑音の強度比を設定する必要がある。そのため、本ステップでは、雑音の強度比を、０ｄＢ以下に設定する。

次に、当該データに基づいて、雑音の強度比に対応するΔｒ／λの値を導出する（ステップＳ１４）。

そして、λに主要な雑音の波長を代入することによって、Δｒが満たすべき条件を導出する（ステップＳ１６）。

具体例として、主要な雑音が１ｋＨｚであり、その波長が０．３４７ｍとなる環境下で、雑音の強度が２０dB低下する音声入力装置を製造する場合について考える。

はじめに、必要条件として、雑音の強度比が０ｄＢ以下になるための条件について検討する。図５を参照すると、雑音の強度比を０ｄＢ以下とするためには、Δｒ／λの値を０．１６以下とすればよいことがわかる。すなわち、Δｒの値が５５．４６ｍｍ以下とすればよいことがわかり、これが、この音声入力装置の必要条件となる。

次に、１ｋＨｚの雑音の強度を２０ｄB低下させるための条件について考える。図５を参照すると、雑音の強度を２０ｄＢ低下させるためには、Δｒ／λの値を０．０１５とすればよいことがわかる。そして、λ＝０．３４７ｍとすると、Δｒの値が５．２０ｍｍ以下のときに、この条件を満たすことがわかる。すなわち、第１及び第２の振動膜１２，２２（第１及び第２のマイクロフォン１０，２０）の中心間距離Δｒを約５．２ｍｍ以下に設定すれば、雑音除去機能を有する接話型の音声入力装置を製造することが可能になる。

なお、本実施の形態に係る音声入力装置は接話式の音声入力装置であり、ユーザの音声の音源と第１又は第２の振動膜１２，２２との間隔は、通常５ｃｍ以下である。また、ユーザ音声の音源と第１及び第２の振動膜１２，２２との間隔は、筐体４０の設計によって制御することが可能である。そのため、入力音声（ユーザの音声）の強度比であるΔｒ／Ｒの値は、０．１（雑音の強度比）よりも大きくなり、雑音除去機能が実現されることがわかる。

なお、通常、雑音は単一の周波数に限定されるものではない。しかし、主要な雑音として想定された雑音よりも周波数の低い雑音は、当該主要な雑音よりも波長が長くなるため、Δｒ／λの値は小さくなり、この音声入力装置によって除去される。また、音波は、周波数が高いほどエネルギーの減衰が早い。そのため、主要な雑音として想定された雑音よりも周波数の高い雑音は、当該主要な雑音よりも早く減衰するため、音声入力装置に与える影響を無視することができる。このことから、本実施の形態に係る音声入力装置は、主要な雑音として想定された雑音とは異なる周波数の雑音が存在する環境下でも、優れた雑音除去機能を発揮することができる。

また、本実施の形態では、式（１２）からもわかるように、第１及び第２の振動膜１２，２２を結ぶ直線上から入射する雑音を想定した。この雑音は、第１及び第２の振動膜１２，２２の見かけ上の間隔が最も大きくなる雑音であり、現実の使用環境において、位相差が最も大きくなる雑音である。すなわち、本実施の形態に係る音声入力装置は、位相差が最も大きくなる雑音を除去することが可能に構成されている。そのため、本実施の形態に係る音声入力装置によると、すべての方向から入射する雑音が除去される。

４．効果
以下、本実施の形態に係る音声入力装置が奏する効果について説明する。

先に説明したように、本実施の形態に係る音声入力装置によると、第１及び第２のマイクロフォン１０，２０で取得された電圧信号の差分を示す差分信号を生成するだけで、雑音成分が除去された音声成分を取得することができる。すなわち、この音声入力装置では、複雑な解析演算処理を行うことなく雑音除去機能を実現することができる。そのため本実施の形態によれば、簡単な構成で、精度の高い雑音除去機能を実現することが可能な音声入力装置を提供することができる。特に、第１及び第２の振動膜の中心間距離Δｒを５．２ｍｍ以下に設定することで、位相歪が少なく、より精度の高い雑音除去機能を実現することが可能な音声入力装置を提供することができる。

また前記第１及び第２の振動膜の中心間距離が、１０kHz以下の周波数帯域の音に対して、第１の振動膜に入射する音声の音圧の強度に対する第１の振動膜と第２の振動膜に入射する音声の差分音圧の強度の比率である音声強度比の位相成分が、０デシベル以下となる距離に設定してもよい。

前記第１及び第２の振動膜を音源の音（例えば音声）の進行方向に沿って配置して、前記進行方向からの１０kHz以下の周波数帯域の音に対して、前記振動膜を差動マイクとして使用した場合の音圧の位相成分が単体マイクとして使用した場合の音圧を上回らない範囲の距離に前記第１及び第２の振動膜の中心間距離を設定してもよい。

音声入力装置１が奏する遅延歪除去効果について説明する。

先に説明したように、ユーザ音声強度比ρ（Ｓ）は以下の式（８）で表される。

ここで、ユーザ音声強度比ρ（Ｓ）の位相成分ρ（Ｓ）_phaseは、sinωt−sin（ωt−α）の項である。式（８）に、

と

を代入すると、ユーザ音声強度比ρ（Ｓ）の位相成分ρ（Ｓ）_phaseは、以下の式で表すことができる。

したがって、ユーザ音声強度比ρ（Ｓ）の位相成分ρ（Ｓ）_phaseに基づく強度比のデシベル値は、以下の式で表すことができる。

そして、式（２２）のαに各値を代入すれば、位相差αと、ユーザ音声の位相成分に基づく強度比との対応関係を明らかにすることができる。

図４１から図４３はマイク間距離とユーザ音声強度比ρ（Ｓ）の位相成分ρ（Ｓ）_phaseの関係について説明するための図である。図４１から図４４の横軸はΔｒ／λであり、縦軸はユーザ音声強度比ρ（Ｓ）の位相成分ρ（Ｓ）_phaseである。ユーザ音声強度比ρ（Ｓ）の位相成分ρ（Ｓ）_phaseとは差動マイクと単体マイクの音圧比の位相成分（ユーザ音声の位相成分に基づく強度比）であり、差動マイクを構成するマイクを単体マイクとして使用した場合の音圧が差動音圧と同じになるところを０デシベルとしている。

すなわち図４１から図４３のグラフは、Δｒ／λに対応した差動音圧の遷移を示しており、縦軸が０デシベル以上のエリアは、遅延歪（ノイズ）が大きいと考えることができる。

現行の電話回線は３．４kHzの音声周波数帯域で設計されているが、より高品質な音声通信を実現しようとした場合、７kHz以上、好ましくは１０kH zの音声周波数帯域が必要とされる。以下、１０kHzの音声周波数帯域を想定した場合における、遅延による音声歪みの影響について考察する。

図４１はマイク間距離（Δｒ）が５mmである場合の、１kHz、７kHz、１０kHzの周波数の音を差動マイクでとらえた場合のユーザ音声強度比ρ（Ｓ）の位相成分ρ（Ｓ）_phaseの分布を示している。

マイク間距離が５mmの場合には、図４１に示すように１kHz、７kHz、１０kHzのいずれの周波数の音についても音ユーザ音声強度比ρ（Ｓ）の位相成分ρ（Ｓ）_phaseは０デシベル以下である。

また図４２はマイク間距離（Δｒ）が１０mmである場合の、１kHz、７kHz、１０kHzの周波数の音を差動マイクでとらえた場合のユーザ音声強度比ρ（Ｓ）の位相成分ρ（Ｓ）_phaseの分布を示している。

マイク間距離が１０mmになると、図４２に示すように１kHz、７kHzの周波数の音についてはユーザ音声強度比ρ（Ｓ）の位相成分ρ（Ｓ）_phaseは０デシベル以下であるが、１０kHzの周波数の音についてはユーザ音声強度比ρ（Ｓ）の位相成分ρ（Ｓ）_phaseが０デシベル以上となり遅延ひずみ（ノイズ）が大きくなっている。

また図４３はマイク間距離（Δｒ）が２０mmである場合の、１kHz、７kHz、１０kHzの周波数の音を差動マイクでとらえた場合の音ユーザ音声強度比ρ（Ｓ）の位相成分ρ（Ｓ）_phaseの分布を示している。

マイク間距離が２０mmになると、図４３に示すように１kHzの周波数の音についてはユーザ音声強度比ρ（Ｓ）の位相成分ρ（Ｓ）_phaseは０デシベル以下であるが、７kHz、１０kHzの音についてはユーザ音声強度比ρ（Ｓ）の位相成分ρ（Ｓ）_phaseが０デシベル以上となり遅延ひずみ（ノイズ）が大きくなっている。

従ってマイク間距離を約５mm〜６mm程度（より具体的には５．２ｍｍ以下）にすることで、周波数が１０kHz帯域まで話者音声を忠実に抽出し、かつ遠方雑音の抑制効果の高い音声入力装置を実現することができる。

ここで、マイク間距離を短くするほど、話者音声の位相歪みを抑えられて忠実性は良くなるが、逆に差動マイクの出力レベルが低下して、ＳＮ比が低下してしまう。したがって、実用性を考えた場合、最適なマイク間距離範囲が存在する。

本実施の形態では第１及び第２の振動膜の中心間距離を約５mm〜６mm程度（より具体的には５．２mm以下）にすることで、１０kHz帯域まで話者音声を忠実に抽出し、かつ実用レベルのＳＮ比を確保し、遠方雑音の抑制効果の高い音声入力装置を実現することができる。

また、この音声入力装置は、位相差に基づく雑音の強度比が、入力音声の強度比よりも小さくなることによって、雑音除去機能を実現する。ところで、位相差に基づく雑音強度比は、第１及び第２の振動膜１２，２２の配列方向と雑音の入射方向によって変化する。すなわち、雑音に対する第１及び第２の振動膜１２，２２の間隔（見かけ上の間隔）が広くなるほど、雑音の位相差が大きくなり、位相差に基づく雑音強度比が大きくなる。ところで、本実施の形態では、音声入力装置は、式（１２）からもわかるように、第１及び第２の振動膜１２，２２の見かけ上の間隔が最も広くなる雑音を除去することができるように構成されている。言い換えると、本実施の形態では、位相差に基づく雑音強度比が最も大きくなるように入射する雑音を除去することができるように、第１及び第２の振動膜１２，２２が配置されている。そのため、この音声入力装置によると、全方位から入射する雑音が除去される。すなわち、本発明によると、全方位から入射する雑音を除去することが可能な音声入力装置を提供することができる。

図４４（Ａ）（Ｂ）から図５２（Ａ）（Ｂ）は音源周波数とマイク間距離Δｒとマイク−音源間の距離毎の差動マイクの指向性について説明するための図である。

図４４（Ａ）（Ｂ）は音源の周波数が１kHz、マイク間距離Δｒが５mm、マイク−音源間距離がそれぞれ2.5cm（接話型の話者の口元からマイクまでの距離に相当）および１m（遠方雑音に相当）の場合の差動マイクの指向性を示す図である。

１１１６は差動マイクの全方位に対する感度（差動音圧）を示すグラフであり、差動マイクの指向特性を示している。また１１１２は差動マイクを単体マイクとして使用した場合の全方位に対する感度（音圧）を示すグラフであり、単体マイクの均等特性を示している。

１１１４はマイクを2つ用いて差動マイクを構成する場合の両マイクを結ぶ直線の方向又はマイクを１つで差動マイクを実現する場合にマイクの両面に音波を到達させるための第１の振動膜と第２の振動膜を結ぶ直線の方向（０度−１８０度、差動マイクを構成する２つのマイクＭ１、Ｍ２又は第１の振動膜と第２の振動膜はこの直線上に置かれている）を示している。この直線の方向を０度、１８０度とし、この直線の方向と直角な方向を９０度、２７０度とする。

１１１２、１１２２に示すように単体マイクは全方位から均一に音を取っており指向性を有していない。また音源が遠くなるほど取得する音圧は減衰している。

１１１６、１１２０に示すように差動マイクは９０度、２７０度方向で多少感度が落ちるが全方位にほぼ均一な指向性を有している。また単体マイクより取得する音圧が減衰しており、単体マイクと同様に音源が遠くなるほど取得する音圧は減衰している。

図４４（Ｂ）に示すように音源の周波数が１ｋHz、マイク間距離Δｒが５mmの場合には、差動マイクの指向性を示す差動音圧のグラフ１１２０の示す領域は単体マイクの均等特性を示すグラフ１１２２の示す領域に内包されており、差動マイクは単体マイクに比べ遠方雑音の抑制効果に優れているといえる。

図４５（Ａ）（Ｂ）は音源の周波数が１ｋHz、マイク間距離Δｒが１０mm、マイク−音源間距離がそれぞれ2.5cm及び１mの場合の差動マイクの指向性を説明する図である。かかる場合にも、図４５（Ｂ）に示すように、差動マイクの指向性を示すグラフ１１４０の示す領域は単体マイクの均等特性を示すグラフ１４２２の示す領域に内包されており、差動マイクは単体マイクに比べ遠方雑音の抑制効果に優れているといえる。

図４６（Ａ）（Ｂ）は音源の周波数が１ｋHz、マイク間距離Δｒが２０mm、マイク−音源間距離がそれぞれ2.5cm及び１mの場合の差動マイクの指向性を示す図である。かかる場合にも、図４６（Ｂ）に示すように、差動マイクの指向性を示すグラフ１１６０の示す領域は単体マイクの均等特性を示すグラフ１４６２の示す領域に内包されており、差動マイクは単体マイクに比べ遠方雑音の抑制効果に優れているといえる。

図４７（Ａ）（Ｂ）は音源の周波数が７ｋHz、マイク間距離Δｒが５mm、マイク−音源間距離がそれぞれ2.5cm及び１mの場合の差動マイクの指向性を示す図である。かかる場合にも、図４７（Ｂ）に示すように、差動マイクの指向性を示すグラフ１１８０の示す領域は単体マイクの均等特性を示すグラフ１１８２の示す領域に内包されており、差動マイクは単体マイクに比べ遠方雑音の抑制効果に優れているといえる。

図４８（Ａ）（Ｂ）は音源の周波数が７ｋHz、マイク間距離Δｒが１０mm、マイク−音源間距離がそれぞれ2.5cm及び１mの場合の差動マイクの指向性を示す図である。かかる場合には、図４８（Ｂ）に示すように、差動マイクの指向性を示すグラフ１２００の示す領域は単体マイクの均等特性を示すグラフ１２０２の示す領域に内包されておらず、差動マイクは単体マイクに比べ遠方雑音の抑制効果に優れているとはいえない。

図４９（Ａ）（Ｂ）は音源の周波数が７ｋHz、マイク間距離Δｒが２０mm、マイク−音源間距離がそれぞれ2.5cm及び１mの場合の差動マイクの指向性を示す図である。かかる場合にも、図４９（Ｂ）に示すように、差動マイクの指向性を示すグラフ１２２０の示す領域は単体マイクの均等特性を示すグラフ１２２２の示す領域に内包されておらず、差動マイクは単体マイクに比べ遠方雑音の抑制効果に優れているとはいえない。

図５０（Ａ）（Ｂ）は音源の周波数が３００Hz、マイク間距離Δｒが５mm、マイク−音源間距離がそれぞれ2.5cm及び１mの場合の差動マイクの指向性を示す図である。かかる場合には、図５０（Ｂ）に示すように、差動マイクの指向性を示すグラフ１２４０の示す領域は単体マイクの均等特性を示すグラフ１２４２の示す領域に内包されており、差動マイクは単体マイクに比べ遠方雑音の抑制効果に優れているといえる。

図５１（Ａ）（Ｂ）は音源の周波数が３００Hz、マイク間距離Δｒが１０mm、マイク−音源間距離がそれぞれ2.5cm及び１mの場合の差動マイクの指向性を示す図である。かかる場合にも、図５１（Ｂ）に示すように、差動マイクの指向性を示すグラフ１２６０の示す領域は単体マイクの均等特性を示すグラフ１２６２の示す領域に内包されており、差動マイクは単体マイクに比べ遠方雑音の抑制効果に優れているといえる。

図５２（Ａ）（Ｂ）は音源の周波数が３００Hz、マイク間距離Δｒが２０mm、マイク−音源間距離がそれぞれ2.5cm及び１mの場合の差動マイクの指向性を示す図である。かかる場合にも、図５２（Ｂ）に示すように、差動マイクの指向性を示すグラフ１２８０の示す領域は単体マイクの均等特性を示すグラフ１２８２の示す領域に内包されており、差動マイクは単体マイクに比べ遠方雑音の抑制効果に優れているといえる。

マイク間距離が５mmである場合には、図４４（Ｂ）、図４７（Ｂ）、図５０（Ｂ）に示すように音の周波数が１ｋHz、７ｋHz、３００Hzのいずれの場合についても、差動マイクの指向性を示すグラフの示す領域は単体マイクの均等特性を示すグラフの示す領域に内包されている。すなわちマイク間距離が５mmである場合については音の周波数が７ｋHz以下の帯域では、差動マイクは単体マイクに比べ遠方雑音の抑制効果に優れているといえる。

ところがマイク間距離が１０mmである場合には、図４５（Ｂ）、図４８（Ｂ）、図５０（Ｂ）に示すように音の周波数が７ｋHzの場合には、差動マイクの指向性を示すグラフの示す領域は単体マイクの均等特性を示すグラフの示す領域に内包されていない。すなわちマイク間距離が１０mmである場合については音の周波数が７ｋHz付近（又は７ｋHz以上）では、差動マイクは単体マイクに比べ遠方雑音の抑制効果に優れているといえない。

またマイク間距離が２０mmである場合には、図４６（Ｂ）、図４９（Ｂ）、図５２（Ｂ）に示すように音の周波数が７ｋHzの場合には、差動マイクの指向性を示すグラフの示す領域は単体マイクの均等特性を示すグラフの示す領域に内包されていない。すなわちマイク間距離が２０mmである場合については音の周波数が７ｋHz付近（又は７ｋHz以上）では、差動マイクは単体マイクに比べ遠方雑音の抑制効果に優れているといえない。

差動マイクのマイク間距離を約５ｍｍ〜６mm程度（より具体的には５．２ｍｍ以下）にすることで、７ｋHz以下の音については指向性によらず全方位の遠方雑音の抑圧効果が単体マイクに比べ高くなる。従って第１及び第２の振動膜の中心間距離を約５ｍｍ〜６mm程度（より具体的には５．２ｍｍ以下）にすることで、７ｋHz以下の音については指向性によらず全方位の遠方雑音を抑圧することが可能な音声入力装置を実現することができる。

なお、この音声入力装置によると、壁などで反射した後に音声入力装置に入射したユーザ音声成分も除去することができる。詳しくは、壁などで反射したユーザ音声の音源は、通常のユーザ音声の音源よりも遠いとみなすことができ、かつ、反射により大きくエネル
ギーを消失しているため、雑音成分と同様に、第１及び第２の振動膜１２，２２の間で音圧が大きく減衰することがない。そのため、この音声入力装置によると、壁などで反射した後に音声入力装置に入射するユーザ音声成分も、雑音と同様に（雑音の一種として）除去される。

そして、この音声入力装置を利用すれば、雑音を含まない、入力音声を示す信号を取得することができる。そのため、この音声入力装置を利用することで、精度の高い音声認識や音声認証、コマンド生成処理を実現することができる。

また、この音声入力装置をマイクシステムに適用すれば、スピーカから出力されるユーザの声も、雑音として除去される。そのため、ハウリングが起こりにくいマイクシステムを提供することができる。

５．第２の実施の形態に係る音声入力装置
次に、本発明を適用した第２の実施の形態に係る音声入力装置について、図７を参照して説明する。

本実施の形態に係る音声入力装置は、基部７０を含む。基部７０の主面７２には、凹部７４が形成されている。そして、本実施の形態に係る音声入力装置では、凹部７４の底面７５に第１の振動膜１２（第１のマイクロフォン１０）が配置され、基部７０の主面７２に第２の振動膜２２（第２のマイクロフォン２０）が配置される。なお、凹部７４は、主面７２に対して垂直に延びていてもよく、凹部７４の底面７５は、主面７２と平行な面であってもよい。底面７５は、凹部７４と直交する面であってもよい。また、凹部７４は、第１の振動膜１２と同じ外形をなしていてもよい。

本実施の形態では、凹部７４は、領域７６と開口７８との間隔よりも浅くなっていてもよい。すなわち、凹部７４の深さをｄとし、領域７６と開口７８との間隔をΔＧとすると、基部７０は、ｄ≦ΔＧを満たしていてもよい。基部７０は、２ｄ＝ΔＧを満たしていてもよい。なお、ΔＧは５．２ｍｍ以下であってもよい。あるいは、基部７０は、第１及び第２の振動膜１２，２２の中心間を結ぶ直線距離が５．２ｍｍ以下になるように構成されていてもよい。

基部７０は、凹部７４に連通する開口７８が、主面７２における第２の振動膜２２が配置される領域７６よりも、入力音声の音源に近い位置に配置されるように設置される。基部７０は、入力音声が、第１及び第２の振動膜１２，２２に、同時に到着するように設置されていてもよい。例えば、基部７０は、入力音声の音源（モデル音源）と第１の振動膜１２との間隔が、モデル音源と第２の振動膜２２との間隔と同じになるように設置されていてもよい。基部７０は、上記の条件を満たすように、基本姿勢が設定された筐体に設置されていてもよい。

本実施の形態に係る音声入力装置によると、第１及び第２の振動膜１２，２２に入射する入力音声（ユーザの音声）の、入射時間のずれを低減することができる。すなわち、入力音声の位相差成分が含まれないように差分信号を生成することができることから、入力音声の振幅成分を精度よく抽出することが可能になる。

なお、凹部７４内では音波は拡散しないため、音波の振幅ほとんど減衰しない。そのため、この音声入力装置では、第１の振動膜１２を振動させる入力音声の強度（振幅）は、開口７８における入力音声の強度と同じとみなすことができる。このことから、音声入力装置が、入力音声が第１及び第２の振動膜１２，２２に同時に到達するように構成されている場合でも、第１及び第２の振動膜１２，２２を振動させる入力音声の強度には差が現
れる。そのため、第１及び第２の電圧信号の差を示す差分信号を取得することで、入力音声を抽出することができる。

まとめると、この音声入力装置によると、入力音声の位相差成分に基づくノイズを含まないように、入力音声の振幅成分（差分信号）を取得することができる。そのため、精度の高い雑音除去機能を実現することが可能になる。

なお、凹部７４の深さをΔＧ以下（５．２ｍｍ以下）とすることで、凹部７４の共振周波数を高く設定することができるため、凹部７４で共振ノイズが発生することを防止することができる。

図８には、本実施の形態に係る音声入力装置の変形例を示す。

本実施の形態に係る音声入力装置は、基部８０を含む。基部８０の主面８２には、第１の凹部８４と、第１の凹部８４よりも浅い第２の凹部８６が形成されている。第１及び第２の凹部８４，８６の深さの差であるΔｄは、第１の凹部８４に連通する第１の開口８５と、第２の凹部８６に連通する第２の開口８７との間隔であるΔＧよりも小さくなっていてもよい。そして、第１の振動膜１２は第１の凹部８４の底面に配置され、第２の振動膜２２は第２の凹部８６の底面に配置される。

この音声入力装置であっても、上記と同様の効果を奏するため、精度の高い雑音除去機能を実現することが可能になる。

最後に、図９〜図１１に、本発明の実施の形態に係る音声入力装置の例として、携帯電話３００、マイク（マイクシステム）４００、及び、リモートコントローラ５００を、それぞれ示す。また、図１２には、情報入力端末としての音声入力装置６０２と、ホストコンピュータ６０４とを含む、情報処理システム６００の概略図を示す。

６．第３の実施の形態に係る音声入力装置の構成
図１３は第３の実施の形態の音声入力装置の構成の一例を示す図である。

第３の実施の形態の音声入力装置７００は、第１の振動膜を有する第１のマイクロフォン７１０−１を含む。また第３の実施の形態の音声入力装置７００は、第２の振動膜を有する第２のマイクロフォン７１０−２を含む。

第１のマイクロフォン７１０−１の第１の振動膜及び第２のマイクロフォン７１０−２の第１の振動膜は、差分信号７４２に含まれる雑音成分の強度の、前記第１又は第２の電圧信号７１２−１，７１２−２に含まれる前記雑音成分の強度に対する比率を示す雑音強度比が、前記差分信号７４２に含まれる入力音声成分の強度の、前記第１又は第２の電圧信号に含まれる前記入力音声成分の強度に対する比率を示す入力音声強度比よりも小さくなるように配置されている。

また第１の振動膜を有する第１のマイクロフォン７１０−１と第２の振動膜を有する第２のマイクロフォン７１０−２は図１〜図８で説明したように構成されていても良い。

第３の実施の形態の音声入力装置７００は、前記第１のマイクロフォン７１０−１で取得された第１の電圧信号７１２−１と、前記第２のマイクロフォンで取得された第２の電圧信号７１２−２とに基づき第１の電圧信号７１２−１と第２の電圧信号７１２−２の差分信号を７４２生成する差分信号生成部７２０を含む。

また差分信号生成部７２０は、遅延部７３０を含む。遅延部７３０は、前記第１のマイクロフォンで取得された第１の電圧信号７１２−１及び前記第２のマイクロフォンで取得された第２の電圧信号７１２−２の少なくとも一方に所定遅延を与えて出力する。

また差分信号生成部７２０は、差分信号出力部７４０を含む。差分信号出力部７４０は、前記第１のマイクロフォンで取得された第１の電圧信号及び前記第２のマイクロフォンで取得された第２の電圧信号の少なくとも一方は前記遅延部によって遅延を与えられた信号を入力して、第１の電圧信号と第２の電圧信号の差分信号を生成して出力する。

遅延部７３０は、第１のマイクロフォンで取得された第１の電圧信号７１２−１に所定遅延を与えて出力する第１の遅延部７３２−１、第２の電圧信号７１２−２に所定遅延を与えて出力する第２の遅延部７３２−２のいずれか一方を設けていずれか一方の電圧信号を遅延させて差分信号を生成してもよい。また第１の遅延部７３２−１と第２の遅延部７３２−２の両方を設けて第１の電圧信号７１２−１と第２の電圧信号７１２−２の両方を遅延させて差分信号を生成してもよい。第１の遅延部７３２−１と第２の遅延部７３２−２の両方を設ける場合にはいずれか一方を固定遅延を与える遅延部として構成し、他方を遅延を可変に調整可能な可変遅延部として構成してもよい。

このようにすると、第１の電圧信号７１２−１及び第２の電圧信号７１２−２の少なくとも一方に所定遅延を与えることにより、マイク製造時の個体差に起因する、第１の電圧信号及び第２の電圧信号の遅延のばらつきを補正することができるので、第１の電圧信号及び第２の電圧信号の遅延のばらつきによるノイズ抑制効果の低減を防止することができる。

図１４は第３の実施の形態の音声入力装置の構成の一例を示す図である。

本実施の形態の差分信号生成部７２０は、遅延制御部７３４を含んで構成してもよい。遅延制御部７３４は、遅延部（ここでは第１の遅延部７３２−１）における遅延量を変化させる制御を行う。遅延制御部７３４で遅延部（ここでは第１の遅延部７３２−１）の適遅延量をダイナミックにまたはスタティックに制御することで、遅延部出力Ｓ１と、前記第２のマイクロフォンで取得された第２の電圧信号７１２−２との信号遅延バランスを調整してもよい。

図１５は遅延部と遅延制御部の具体的構成の一例を示す図である。例えば遅延部（ここでは第１の遅延部７３２−１）を、群遅延フィルタなどのアナログフィルタで構成してもよい。例えば、遅延制御部７３４は、群遅延フィルタ７３２−１のコントロール端子７３６−ＧＮＤ間の電圧あるいはコントロール端子７３６−ＧＮＤ間に流れる電流量により、群遅延フィルタの遅延量をダイナミックまたはスタティックに制御するようにしてもよい。

図１６（Ａ）（Ｂ）は、群遅延フィルタの遅延量をスタティックに制御する構成の一例である。

例えば図１６（Ａ）に示すように、複数の抵抗体（ｒ）が直列に接続された抵抗アレーを含み、当該抵抗アレーを介して遅延部の所定の端子（図１５のコントロール端子７３４）に所定の大きさの電流を供給するよう構成してもよい。ここで製造過程において、所定の電流の大きさに応じて、前記抵抗アレーを構成する抵抗体（ｒ）又は導体（７３８のＦ）をレーザによるカット、あるいは高電圧または高電流の印加により溶断してもよい。

また例えば図１６（Ｂ）に示すように、複数の抵抗体（ｒ）が並列に接続された抵抗ア
レーを含み、当該抵抗アレーを介して遅延部の所定の端子（図１５のコントロール端子７３４）に所定の大きさの電流を供給するよう構成してもよい。ここで製造過程において、所定の電流の大きさに応じて、前記抵抗アレーを構成する抵抗体（ｒ）又は導体（Ｆ）をレーザによるカット、あるいは高電圧または高電流の印加により溶断してもよい。

ここで遅延部の所定の端子に流す電流の大きさは、製造段階で生じた遅延のばらつきに基づき、これを解消できる値に設定するとよい。図１６（Ａ）（Ｂ）のように複数の抵抗体（ｒ）が直列又は並列に接続された抵抗アレーを用いることにより、製造段階で生じた遅延のばらつきに対応した抵抗値を作り込むことができ、所定の端子に接続され、前記遅延部の遅延量を制御する電流を供給する遅延制御部として機能する。

なお上記実施の形態では複数の抵抗体（ｒ）がヒューズ（Ｆ）を介して接続されている構成を例にとり説明したがこれに限られない。複数の抵抗（ｒ）がヒューズ（Ｆ）を介さずに直列または並列に接続されている構成でもよく、この場合少なくとも１つの抵抗を切断してもよい。

また、例えば図３３の抵抗Ｒ１又Ｒ２を、図４０に示すように１つの抵抗体で構成し、抵抗体の一部を切断する、いわゆるレーザートリミングにより抵抗値を調整する構成であっても構わない。

また、抵抗体はマイクロフォン７１０が搭載される配線基板上に、抵抗体を吹き付ける等により、パターンニングして形成されたプリント抵抗を使用し、トリミングを行うものであって構わない。また、マイクロホンユニットの完成状態で実動作状態でのトリミングを行うためには、マイクロホンユニットの筐体表面に抵抗体を設けることがより好ましい。

図１７は第３の実施の形態の音声入力装置の構成の一例を示す図である。

差分信号生成部７２０は、位相差検出部７５０を含んで構成してもよい。位相差検出部７５０は、差分信号出力部７４０の入力となる第１の電圧信号（Ｓ１）と第２の電圧信号（Ｓ２）を受け取り、受けとった第１の電圧信号（Ｓ１）と第２の電圧信号（Ｓ２）に基づいて、差分信号７４２が生成される際の第１の電圧信号（Ｓ１）と第２の電圧信号（Ｓ２）の位相差を検出して、検出結果に基づき位相差信号（ＦＤ）を生成して出力する。

遅延制御部７３４は、位相差信号（ＦＤ）に基づき、遅延部（ここでは第１の遅延部７３２−１）における遅延量を変化させるようにしてもよい。

また差分信号生成部７２０は、ゲイン部７６０を含んで構成してもよい。ゲイン部７６０は第１のマイクロフォン７１０−１で取得された第１の電圧信号及び前記第２のマイクロフォン７１０−２で取得された第２の電圧信号の少なくとも一方に所定ゲインを与えて出力する。

差分信号出力部７４０は、第１のマイクロフォン７１０−１で取得された第１の電圧信号及び前記第２のマイクロフォン７１０−２で取得された第２の電圧信号の少なくとも一方がゲイン部７６０によってゲインを与えられた信号（Ｓ２）を入力して、第１の電圧信号（Ｓ１）と第２の電圧信号（Ｓ２）の差分信号を生成して出力してもよい。

例えば位相差検出部７４０は、遅延部（ここでは第１の遅延部７３２−１）出力Ｓ１とゲイン部出力Ｓ２の位相差を演算して位相差信号ＦＤを出力し、遅延制御部７３４は、位相差信号ＦＤの極性に応じて遅延部（ここでは第１の遅延部７３２−１）の遅延量をダイナミックに変化させてもよい。

第１の遅延部７３２−１は第１のマイクロフォン７１０−１で取得された第１の電圧信号７１２−１を入力して、遅延制御信号（例えば所定の電流）７３５に応じて所定の遅延を与えた電圧信号Ｓ１を出力する。ゲイン部７６０は第２のマイクロフォン７１０−２で取得された第２の電圧信号７１２−２を入力して、所定のゲインを与えた電圧信号Ｓ２を
出力する。位相差信号出力部７５４は、第１の遅延部７３２−１から出力された電圧信号Ｓ１とゲイン部７６０から出力された電圧信号Ｓ２とを入力して位相差信号ＦＤを出力する。遅延制御部７３４は位相差信号出力部７５４から出力された位相差信号ＦＤを入力し、遅延制御信号（例えば所定の電流）７３５を出力する。この遅延制御信号（例えば所定の電流）７３５によって第１の遅延部７３２−１の遅延量をコントロールすることで、第１の遅延部７３２−１の遅延量のフィードバック制御をおこなうようにしてもよい。

図１８は第３の実施の形態の音声入力装置の構成の一例を示す図である。

位相差検出部７２０は、第１の２値化部７５２−１を含んで構成してもよい。第１の２値化部７５２−１は、受け取った前記第１の電圧信号Ｓ１を所定レベルで２値化して第１のデジタル信号Ｄ１に変換する。

また位相差検出部７２０は、第２の２値化部７５２−２を含んで構成してもよい。第２の２値化部７５２−２は、受け取った前記第２の電圧信号Ｓ２を所定レベルで２値化して第２のデジタル信号Ｄ２に変換する。

位相差検出部７２０は位相差信号出力部７５４を含む。位相差信号出力部７５４は、第１のデジタル信号Ｄ１と前記第２のデジタル信号Ｄ２との位相差を演算して位相差信号ＦＤを出力する。

第１の遅延部７３２−１は第１のマイクロフォン７１０−１で取得された第１の電圧信号７１２−１を入力して、遅延制御信号（例えば所定の電流）７３５に応じて所定の遅延を与えた信号Ｓ１を出力する。ゲイン部７６０は第２のマイクロフォン７１０−２で取得された第２の電圧信号７１２−２を入力して、所定のゲインを与えた信号Ｓ２を出力する。第１の２値化部７５２−１は、第１の遅延部７３２−１から出力される第１の電圧信号Ｓ１を受け取り、所定レベルで２値化された第１のデジタル信号Ｄ１を出力する。第２の２値化部７５２−２は、ゲイン部７６０から出力される第２の電圧信号Ｓ２を受け取り、所定レベルで２値化された第２のデジタル信号Ｄ２を出力する。位相差信号出力部７５４は、第１の２値化部７５２−１から出力された第１のデジタル信号Ｄ１と第２の２値化部７５２−２から出力された第２のデジタル信号Ｄ２とを入力して位相差信号ＦＤを出力する。遅延制御部７３４は位相差信号出力部７５４から出力された位相差信号ＦＤを入力し、遅延制御信号（例えば所定の電流）７３５を出力する。この遅延制御信号（例えば所定の電流）７３５によって第１の遅延部７３２−１の遅延量をコントロールすることで、第１の遅延部７３２−１の遅延量のフィードバック制御をおこなうようにしてもよい。

図１９は、位相差検出部のタイミングチャートである。Ｓ１は第１の遅延部７３２−１から出力される電圧信号であり、Ｓ２はゲイン部から出力される電圧信号である。電圧信号Ｓ２は電圧信号Ｓ１に対して、Δφだけ位相が遅れているとする。

Ｄ１は電圧信号Ｓ１の２値化信号であり、Ｄ２は電圧信号Ｓ２の２値化信号である。例えば、Ｄ１あるいはＤ２の信号は、電圧信号Ｓ１あるいはＳ２に対しハイパスフィルターを通した後、コンパレータ回路で２値化することで得られる。

ＦＤは２値化信号Ｄ１と２値化信号Ｄ２に基づき生成される位相差信号である。例えば図１９に示すように第１の電圧信号の位相が第２の電圧信号の位相に比べて進んでいる場合には進み位相差に応じたパルス幅の正のパルスＰを各周期毎に生成し、第１の電圧信号の位相が第２の電圧信号の位相に比べて遅れている場合には遅れ位相差に応じたパルス幅の負のパルスを各周期毎に生成してもよい。

図２１は第３の実施の形態の音声入力装置の構成の一例を示す図である。

位相差検出部７５０は、第１のバンドパスフィルタ７５６−１を含む。第１のバンドパスフィルタ７５６−１は受け取った第１の電圧信号Ｓ１を入力して所定の単一周波数の信号Ｋ１を通過させるバンドパスフィルタである。

位相差検出部７５０は、第２のバンドパスフィルタ７５６−２を含む。第２のバンドパスフィルタ７５６−２は受け取った第２の電圧信号Ｓ２を入力して所定の単一周波数の信号Ｋ２を通過させるバンドパスフィルタである。

位相差検出部７５０は、第１のバンドパスフィルタ７５６−１及び第２のバンドパスフィルタ７５６−２通過後の第１の電圧信号Ｋ１と第２の電圧信号Ｋ２に基づき位相差を検出してもよい。

例えば図２０に示すように音源部７７０を第１のマイクロフォン７１０−１および第２のマイクロフォン７１０−２から等距離の位置に配置し、単一周波数の音を発生させて受音し、該単一周波数の音以外の周波数の音を第１のバンドパスフィルタ７５６−１と第２のバンドパスフィルタ７５６−２でカットしたあと位相差を検出することで、位相比較信号のＳＮ比を改善し、位相差または遅延量を精度良く検出することができる。

なお音声入力装置自体が音源部７７０を有していない場合でも、テスト時に音声入力装置の近傍にテスト用音源を一時的に設置して、第１のマイクロフォンと第２のマイクロフォンに対して音が同位相で入力されるように設定し、第１のマイクロフォンと第２のマイクロフォンで受音して、出力される第１の電圧信号と第２の電圧信号の波形をモニタして両者の位相が一致するように遅延部の遅延量を変更してもよい。

第１の遅延部７３２−１は第１のマイクロフォン７１０−１で取得された第１の電圧信号７１２−１を入力して、遅延制御信号（例えば所定の電流）７３５に応じて所定の遅延を与えた信号Ｓ１を出力する。ゲイン部７６０は第２のマイクロフォン７１０−２で取得された第２の電圧信号７１２−２を入力して、所定のゲインを与えた信号Ｓ２を出力する。第１のバンドパスフィルタ７５６−１は第１の遅延部７３２−１から出力される第１の電圧信号Ｓ１を受け取り、単一周波数の信号Ｋ１を出力する。第２のバンドパスフィルタ７５６−２はゲイン部７６０から出力される第２の電圧信号Ｓ２を受け取り、単一周波数の信号Ｋ２を出力する。第１の２値化部７５２−１は、第１のバンドパスフィルタ７５６−１から出力される単一周波数の信号Ｋ１を受け取り、所定レベルで２値化された第１のデジタル信号Ｄ１を出力する。第２の２値化部７５２−２は、第２のバンドパスフィルタ７５６−２から出力される単一周波数の信号Ｋ２を受け取り、所定レベルで２値化された第２のデジタル信号Ｄ２を出力する。位相差信号出力部７５４は、第１の２値化部７５２−１から出力された第１のデジタル信号Ｄ１と第２の２値化部７５２−２から出力された第２のデジタル信号Ｄ２とを入力して位相差信号ＦＤを出力する。遅延制御部７３４は位相差信号出力部７５４から出力された位相差信号ＦＤを入力し、遅延制御信号（例えば所定の電流）７３５を出力する。この遅延制御信号（例えば所定の電流）７３５によって第１の遅延部７３２−１の遅延量をコントロールすることで、第１の遅延部７３２−１の遅延量のフィードバック制御をおこなうようにしてもよい。

図２２（Ａ）（Ｂ）は差動マイクの指向性について説明するための図である。

図２２（Ａ）は２つのマイクＭ１、Ｍ２の位相がずれていない状態での指向特性を表している。円状の領域８１０−１と、８１０−２は、両マイクＭ１、Ｍ２の出力の差分により得られる指向特性を示しており、両マイクＭ１、Ｍ２を結ぶ直線方向を０度、１８０度
とし、両マイクＭ１、Ｍ２を結ぶ直線方向と直角な方向を９０度、２７０度とすると、０度、１８０度方向に最大感度を有し、９０度、２７０度方向に感度を持たない両指向性であることを表している。

両マイクＭ１、Ｍ２でとらえた信号の一方に遅延を与えた場合、指向特性が変化する。例えば、マイクＭ１の出力に対し、マイク間隔ｄを音速ｃで除算した時間に相当する遅延を与えた場合、両マイクＭ１、Ｍ２の指向性を示す領域は図２２（Ｂ）の８２０に示すようなカーディオイド型になる。このような場合、０度の話者方向に対して感度のない（ヌル）指向特性を実現でき、話者の音声を選択的にカットして周囲の音（周囲の雑音）のみをとらえることができる。

上記の特性を利用して周囲の雑音レベルの状態を検出することができる。

図２３は、ノイズ検出手段を備えた音声入力装置の構成の一例を示す図である。

本実施の形態の音声入力装置は、ノイズ検出用遅延部７８０を含む。ノイズ検出用遅延部７８０は、第２のマイクロフォン７１０−２で取得された第２の電圧信号７１２−２にノイズ検出用の遅延を与えて出力する。

本実施の形態の音声入力装置は、ノイズ検出用差分信号生成部７８２を含む。ノイズ検出用差分信号生成部７８２は、ノイズ検出用遅延部７８０によってノイズ検出用の所定の遅延を与えられた信号７８１と、前記第１のマイクロフォン７１０−１で取得された第１の電圧信号７１２−１との差を示すノイズ検出用の差分信号７８３を生成する。

本実施の形態の音声入力装置は、ノイズ検出部７８４を含む。ノイズ検出部７８４は、ノイズ検出用の差分信号７８３に基づきノイズのレベルを判定し、判定結果に基づきノイズ検出信号７８５を出力する。ノイズ検出部７８４は、ノイズ検出用の差分信号の平均レベルを算出して、平均レベルに基づきノイズ検出用の差分信号７８５を生成してもよい。

本実施の形態の音声入力装置は、信号切り替え部７８６を含む。信号切り替え部７８６は、差分信号生成部７２０から出力される差分信号７４２と前記第１のマイクロフォンで取得された第１の電圧信号７１２−１を受け取り、前記ノイズ検出信号７８５に基づき第１の電圧信号７１２−１と前記差分信号７４２を切り替えて出力する。信号切り替え部７８６は、ノイズレベルが所定レベル以下の場合は前記第１のマイクロフォンで取得された第１の電圧信号を出力し、前記平均レベルが所定レベルより大きい場合は差分信号を出力するようにしてもよい。このようにすると、静かな環境（ノイズレベルが所定レベル以下）のときは、ＳＮＲ（Signal to Noise Ratio：ＳＮ比）のよいシングルマイクでとらえ
た音が出力される。また高騒音下の環境（ノイズレベルが所定レベル以上）のときは、雑音除去性能に優れる差動マイクでとらえた音が出力される。

ここで差分信号生成部は、図１３，図１４、図１７、図１８、図２１で説明した構成でもよいし、従来から知られている一般的な差動マイクの構成でもよい。また第１のマイクロフォン７１０−１の第１の振動膜と第２のマイクロフォン７１０−１の第２の振動膜は、前記差分信号７４２に含まれる雑音成分の強度の、前記第１又は第２の電圧信号に含まれる前記雑音成分の強度に対する比率を示す雑音強度比が、前記差分信号に含まれる入力音声成分の強度の、前記第１又は第２の電圧信号に含まれる前記入力音声成分の強度に対する比率を示す入力音声強度比よりも小さくなるように配置されている構成でもよいし、そのような限定のない他の構成でもよい。

また、前記ノイズ検出用の遅延は、第１および第２の振動版の中心間距離（図２０のｄ
参照）を音速で除算した時間でなくてもよい。話者の方向が０度方向でない場合であっても、指向特性の感度のない方向（ヌル）を話者方向に設定できれば、話者音声をカットして周囲の雑音をひろうような指向性をもつノイズ検出に適した特性を実現することができる。例えば、ハイパーカーディオイド、スーパーカーディオイド型の指向特性を持つように遅延を設定して、話者音声をカットするものであって構わない。

差分信号生成部７２０は第１のマイクロフォン７１０−１で取得された第１の電圧信号７１２−１を第２のマイクロフォン７１０−２で取得された第２の電圧信号７１２−２を入力して、差分信号７４２を生成して出力する。

ノイズ検出用遅延部７８０は、第２のマイクロフォン７１０−２で取得された第２の電圧信号７１２−２を入力してノイズ検出用の遅延を与えた信号７８１を出力する。ノイズ検出用差分信号生成部７８２は、ノイズ検出用遅延部７８０によってノイズ検出用の所定の遅延を与えられた信号７８１と、前記第１のマイクロフォン７１０−１で取得された第１の電圧信号７１２−１との差を示すノイズ検出用の差分信号７８３を生成して出力する。ノイズ検出部７８４はノイズ検出用の差分信号７８３を入力して、ノイズ検出用の差分信号７８３に基づきノイズのレベルを判定し、判定結果に基づきノイズ検出信号７８５を出力する。

信号切り替え部７８６は、差分信号生成部７２０から出力される差分信号７４２と前記第１のマイクロフォンで取得された第１の電圧信号７１２−１とノイズ検出信号７８５を入力し、ノイズ検出信号７８５に基づき第１の電圧信号７１２−１と前記差分信号７４２を切り替えて出力する。

図２４はノイズ検出による信号切り替えの動作例を示すフローチャートである。

ノイズ検出部から出力されるノイズ検出信号が所定のしきい値（ＬＴＨ）よりの小さい場合には（ステップＳ１１０）信号切り替え部はシングルマイクの信号を出力し（ステップＳ１１２）、ノイズ検出部から出力されるノイズ検出信号が所定のしきい値（ＬＴＨ）よりの小さくない場合には（ステップＳ１１０）信号切り替え部は差動マイクの信号を出力する（ステップＳ１１４）。

なお音情報を出力するスピーカを有する音声入力装置においては、ノイズ検出信号に基づきスピーカの音量を制御する音量制御部を含むようにしてもよい。

図２５はノイズ検出によるスピーカの音量制御の動作例を示すフローチャートである。

ノイズ検出部から出力されるノイズ検出信号が所定のしきい値（ＬＴＨ）よりの小さい場合には（ステップＳ１２０）スピーカの音量を第１の値に設定し（ステップＳ１２２）、ノイズ検出部から出力されるノイズ検出信号が所定のしきい値（ＬＴＨ）よりの小さくない場合には（ステップＳ１２０）スピーカの音量を第１のより大きな音量の第２の値に設定する（ステップＳ１２４）。

またノイズ検出部から出力されるノイズ検出信号が所定のしきい値（ＬＴＨ）よりの小さい場合にはスピーカの音量を下げ、ノイズ検出部から出力されるノイズ検出信号が所定のしきい値（ＬＴＨ）よりの小さくない場合にはスピーカの音量を上げるようにしてもよい。

図２６は、ＡＤ変換手段を備えた音声入力装置の構成の一例を示す図である。

本実施の形態の音声入力装置は、第１のＡＤ変換手段７９０−１を含んで構成してもよ
い。第１のＡＤ変換手段７９０−１は、第１のマイクロフォン７１０−１で取得された第１の電圧信号７１２−１をアナログ・デジタル変換する。

本実施の形態の音声入力装置は、第２のＡＤ変換手段７９０−２を含んで構成してもよい。第２のＡＤ変換手段７９０−２は、第２のマイクロフォン７１０−２で取得された第２の電圧信号７１２−２をアナログ・デジタル変換する。

本実施の形態の音声入力装置は、差分信号生成部７２０を含む。差分信号生成部７２０は、第１のＡＤ変換手段７９０−１によってデジタル信号に変換された前記第１の電圧信号７８２−１と、前記第２のＡＤ変換手段７９０−２によってデジタル信号に変換された前記第２の電圧信号７８２−２とに基づき第１の電圧信号と第２の電圧信号の差分信号７４２を生成してもよい。

ここで差分信号生成部７２０は、図１３，図１４、図１７、図１８、図２１で説明した構成でもよい。差分信号生成部７２０の遅延は、第１のＡＤ変換手段７９０−１や第２のＡＤ変換手段７９０−２のアナログ・デジタル変換の変換周期の整数倍に設定してもよい。このようにすると遅延部は入力信号をデジタル的に１クロック又は数クロック分、フリップフロップでずらすことで遅延を実現することができる。

また第１のマイクロフォン７１０−１の第１の振動膜と第２のマイクロフォン７１０−２の第２の振動膜の中心間距離は、アナログ・デジタル変換の変換周期に音速を乗じた値もしくはその整数倍に設定してもよい。

このようにするとノイズ検出用遅延部では、入力電圧信号をｎクロック（ｎは整数）ずらすという簡単な動作で、周囲のノイズを拾うのに都合の良い指向特性（例えば、カーディオイド型）を精度良く実現することができる
例えばアナログ・デジタル変換の際のサンプリング周波数が４４．１ｋＨｚの場合には第１および第２の振動板の中心間距離は約７．７ｍｍ程度となり、サンプリング周波数が１６ｋＨｚの場合には第１および第２の振動版の中心間距離は約２１ｍｍ程度となる。

図２７はゲイン調整手段を備えた音声入力装置の構成の一例を示す図である。

本実施の形態の音声入力装置の差分信号生成部７２０は、ゲイン制御部９１０を含む。ゲイン制御部９１０は、ゲイン部７６０における増幅率（ゲイン）を変化させる制御を行う。ゲイン制御部９１０で振幅差検出部が出力する振幅差信号ＡＤに基づきゲイン部７６０の増幅率をダイナミックに制御することで、第１のマイクロフォン７１０−１で取得された第１の電圧信号７１２−１と第２のマイクロフォン７１０−２で取得された第２の電圧信号７１２−２との振幅のバランスを調整してもよい。

差分信号生成部７２０は、第１の振幅検出手段９２０−１を含む。第１の振幅検出手段９２０−１は第１の遅延部７３２−１の出力信号Ｓ１の振幅を検出して第１の振幅信号Ａ１を出力する。

差分信号生成部７２０は、第２の振幅検出手段９２０−２を含む。第２の振幅検出手段９２０−２はゲイン部７６０の出力信号Ｓ２の振幅を検出して第２の振幅信号Ａ２を出力する。

差分信号生成部７２０は、振幅差検出部９３０を含む。振幅差検出部９３０は第１の振幅検出手段９２０−１が出力した第１の振幅信号Ａ１及び第２の振幅検出手段９２０−２が出力した第２の振幅信号Ａ２を入力して、これらの振幅差を求めて振幅差信号ＡＤを出
力する。この振幅差信号ＡＤによってゲイン部７６０のゲインをコントロールすること
で、ゲイン部７６０のゲインのフィードバック制御をおこなうようにしてもよい。

７．第４の実施の形態に係る音声入力装置の構成
図２８、２９は第４の実施の形態の音声入力装置の構成の一例を示す図である。

第４の実施の形態の音声入力装置７００は、第１の振動膜を有する第１のマイクロフォン７１０−１を含む。また第４の実施の形態の音声入力装置７００は、第２の振動膜を有する第２のマイクロフォン７１０−２を含む。

第４の実施の形態の音声入力装置７００は、前記第１のマイクロフォン７１０−１で取得された第１の電圧信号７１２−１と、前記第２のマイクロフォンで取得された第２の電圧信号７１２−２とに基づき第１の電圧信号７１２−１と第２の電圧信号７１２−２の差分信号を７４２生成する差分信号生成部７２０を含む。

また差分信号生成部７２０は、ゲイン部７６０を含む。ゲイン部７６０は、第１のマイクロフォン７１０−１で取得された第１の電圧信号７１２−１に所定のゲインで増幅して出力する。

また差分信号生成部７２０は、差分信号出力部７４０を含む。差分信号出力部に７４０は、ゲイン部７６０によって所定のゲインで増幅された第１の電圧信号Ｓ１と、前記第２のマイクロフォンで取得された第２の電圧信号を入力して、所定のゲインで増幅された第１の電圧信号Ｓ１と第２の電圧信号の差分信号を生成して出力する。

第１の電圧信号７１２−１を所定のゲインで増幅する（ゲインを上げる場合もゲインを下げる場合も含む意味である）ことにより、第１の電圧信号及び第２の電圧信号の振幅差が無くなるように補正することができるので、製造ばらつき等に起因する２つのマイクロフォン間の感度差に起因して差動マイクとしてのノイズ抑制効果が劣化するのを防止することができる。

図３０、３１は第４の実施の形態の音声入力装置の構成の一例を示す図である。

本実施の形態の差分信号生成部７２０は、ゲイン制御部９１０を含んで構成してもよい。ゲイン制御部９１０は、ゲイン部７６０におけるゲインを変化させる制御を行う。ゲイン制御部９１０でゲイン部７６０のゲインをダイナミックにまたはスタティックに制御することで、ゲイン部出力Ｓ１と、前記第２のマイクロフォンで取得された第２の電圧信号７１２−２との振幅のバランスを調整してもよい。

図３２はゲイン部とゲイン制御部の具体的構成の一例を示す図である。例えばアナログ信号を処理する場合にはゲイン部７６０を、オペアンプ（例えば図３２に示すような非反
転増幅回路）などのアナログ回路で構成してもよい。抵抗Ｒ１、Ｒ２の値を変更することにより、又は例えば製造時に所定の値にトリミング設定することで、オペアンプの−端子にかかる電圧をダイナミックまたはスタティックに制御することでオペアンプの増幅率を制御してもよい。

図３３（Ａ）（Ｂ）は、ゲイン部の増幅率をスタティックに制御する構成の一例である。

例えば図３２の抵抗Ｒ１又Ｒ２は、図３３（Ａ）に示すように複数の抵抗が直列に接続された抵抗アレーを含み、当該抵抗アレーを介してゲイン部の所定の端子（図３２の−端子）に所定の大きさの電圧をかけるよう構成してもよい。適切な増幅率を求めて、当該増幅率を実現するための抵抗値をとるように、製造段階において、前記抵抗アレーを構成する抵抗体（ｒ）又は導体（９１２のＦ）をレーザによるカット、あるいは高電圧または高電流の印加により溶断してもよい。

また、例えば図３２の抵抗Ｒ１又Ｒ２を、図３３（Ｂ）に示すように複数の抵抗が並列に接続された抵抗アレーを含み、当該抵抗アレーを介してゲイン部の所定の端子（図３２の−端子）に所定の大きさの電圧をかけるよう構成してもよい。適切な増幅率を求めて、当該増幅率を実現するための抵抗値をとるように、製造段階において、前記抵抗アレーを構成する抵抗体（ｒ）又は導体（９１２のＦ）をレーザによるカット、あるいは高電圧または高電流の印加により溶断してもよい。

ここで適切な増幅値は、製造工程で生じたマイクロフォンのゲインバランスを解消できる値に設定するとよい。図３３（Ａ）（Ｂ）のように複数の抵抗が直列又は並列に接続された抵抗アレーを用いることにより、製造工程で生じたマイクロフォンのゲインバランスに対応した抵抗値を作り込むことができ、所定の端子に接続され、前記ゲイン部のゲインを制御するゲイン制御部として機能する。

図３４は第４の実施の形態の音声入力装置の構成の一例を示す図である。

差分信号生成部７２０は、振幅差検出部９４０を含んで構成してもよい。振幅差検出部９４０は、差分信号出力部７４０の入力となる第１の電圧信号（Ｓ１）と第２の電圧信号（Ｓ２）を受け取り、受け取った第１の電圧信号（Ｓ１）と第２の電圧信号（Ｓ２）に基づいて、差分信号７４２が生成される際の第１の電圧信号（Ｓ１）と第２の電圧信号（Ｓ２）の振幅差を検出して、検出結果に基づき振幅差信号９４２を生成して出力する。

ゲイン制御部９１０は、振幅差信号９４２に基づき、ゲイン部７６０におけるゲインを変化させるようにしてもよい。

振幅差検出部９４０は、ゲイン部７６０の出力信号の振幅を検出する第１の振幅検出部と、前記第２のマイクロフォンで取得された第２の電圧信号の信号振幅を検出する第２の
振幅検出部９２２−１と、前記第１の振幅検出部９２２−２で検出された第１の振幅信号９２２−１と第２の振幅検出部９２０−１で検出された第２の振幅信号９２２−１との差分をとり振幅差信号９４２を生成する振幅差信号生成部９３０とを含んで構成してもよい。

第１の振幅検出手段９２０−１は、ゲイン部７６０の出力信号Ｓ１を入力して振幅を検出し検出結果に基づき第１の振幅信号９２２−１を出力し、第２の振幅検出手段９２０−２は、第２のマイクロフォンで取得された第２の電圧信号９１２−２を入力して振幅を検出し検出結果に基づき第２の振幅信号９２２−２を出力し、振幅差信号生成部９３０は、第１の振幅検出手段９２０−１から出力された第１の振幅信号９２２−１と第２の振幅信号９２２−２から出力された第２の振幅信号９２２−２とを入力して差分をとり振幅差信号９４２を生成して出力してもよい。

ゲイン制御部９１０は振幅差信号出力部９３０から出力された振幅差信号９４２を入力し、ゲイン制御信号（例えば所定の電流）９１２を出力する。このゲイン制御信号（例えば所定の電流）９１２によってゲイン部７６０のゲインをコントロールすることで、ゲイン部７６０のゲインのフィードバック制御をおこなうようにしてもよい。

本実施の形態によれば使用時に様々な理由で変化する振幅差をリアルタイムに検出して調整を行うことができる。

前記ゲイン制御部は、ゲイン部の出力信号Ｓ１と、前記第２のマイクロフォンで取得された第２の電圧信号７１２−２（Ｓ２）の振幅の差が、いずれかの信号（Ｓ１又はＳ２）に対して所定の割合以下になるように調整してもよい。または所定のノイズ抑圧効果（例えば約１０以上）を得るようにゲイン部の増幅率を調整してもよい。

例えば信号Ｓ１とＳ２振幅の差がＳ１又はＳ２に対して−３％以上、＋３％以下の範囲になるように調整しても良いし、−６％以上、＋６％以下の範囲になるようにしても良い。前者の場合ノイズを約１０デシベル抑圧することができ、後者の場合ノイズを約６デシベル抑圧することができる。

図３５、図３６，図３７は第４の実施の形態の音声入力装置の構成の一例を示す図である。

差分信号生成部７２０は、ローパスフィルタ部９５０を含んで構成してもよい。ローパスフィルタ部９５０は、差分信号の高域成分をカットする。ローパスフィルタ部９５０は、１次の遮断特性を有するフィルタを用いてもよい。またローパスフィルタ部９５０のカットオフ周波数は、１ｋＨｚ以上、５ｋＨｚ以下の間のいずれかの値Ｋに設定してもよい。例えば、ローパスフィルタ部９５０のカットオフ周波数が１．５以上、２ｋＨｚ以下程度に設定されていることがより好ましい。

ゲイン部７６０は第１のマイクロフォン７１０−１で取得された第１の電圧信号７１２−１を入力して所定の増幅率（ゲイン）で増幅して、所定のゲインで増幅された第１の電圧信号Ｓ１を出力する。差分信号出力部７４０は、ゲイン部７６０によって所定のゲインで増幅された第１の電圧信号Ｓ１と、前記第２のマイクロフォン７１０−２で取得された第２の電圧信号Ｓ２を入力して、所定のゲインで増幅された第１の電圧信号Ｓ１と第２の電圧信号の差分信号７４２を生成して出力する。ローパスフィルタ部９５０は、差分信号出力部７４０から出力された差分信号７４２を入力して、差分信号７４２に含まれる高域周波数（Ｋ以上の帯域の周波数）を減衰させた差分信号９５２を出力する。

図３７は、差動マイクのゲイン特性について説明するための図である。横軸は周波数であり縦軸はゲインである。１０２０はシングルマイク（単一マイク）の周波数とゲインの関係を示すグラフである。シングルマイクは、フラットな周波数特性を有している。１０１０は、差動マイクの話者想定位置での周波数とゲインの関係を示すグラフであり、例えば第１のマイクロフォン７１０−１および第２のマイクロフォン７１０−２の中心から５０ｍｍ離れた位置での周波数特性を表している。第１のマイクロフォン７１０−１および第２のマイクロフォン７１０−２がフラットな周波数特性であっても、差分信号の高周波数域は約１ｋＨｚ付近から１次特性（２０ｄＢ／ｄｅｃ）で上がっていくため、この逆特性を持つ１次のローパスフィルタで高域を減衰させると、差分信号の周波数特性をフラットにすることができ、聴感上の違和感が発生するのを防止することができる。
従って図３６で示したように差分信号をローパスフィルタを通して周波数特性を補正することで、１０１２に示すようにほぼフラットな周波数特性を得ることができる。これにより話者音声の高域あるいはノイズの高域が強調されて耳障りな音質になるのを防止することができる。

図３８は、ＡＤ変換手段を備えた音声入力装置の構成の一例を示す図である。

本実施の形態の音声入力装置は、第１のＡＤ変換手段７９０−１を含んで構成してもよい。第１のＡＤ変換手段７９０−１は、第１のマイクロフォン７１０−１で取得された第１の電圧信号７１２−１をアナログ・デジタル変換する。

本実施の形態の音声入力装置は、差分信号生成部７２０を含む。差分信号生成部７２０は、第１のＡＤ変換手段７９０−１によってデジタル信号に変換された前記第１の電圧信号７８２−１と、前記第２のＡＤ変換手段７９０−２によってデジタル信号に変換された前記第２の電圧信号７８２−２とに基づき、全てデジタル信号処理演算によりゲインバランス調整および遅延バランス調整を行い、第１の電圧信号と第２の電圧信号の差分信号７４２を生成してもよい。

ここで差分信号生成部７２０は、図２９，図３１、図３４、図３６等で説明した構成でもよい。

８．第５の実施の形態に係る音声入力装置の構成
図２０は第５の実施の形態の音声入力装置の構成の一例を示す図である。

本実施の形態の音声入力装置は第１のマイクロフォン（の第１の振動膜７１１−１）および前記第２のマイクロフォン（の第２の振動膜７１１−２）から等距離に設置された音源部７７０を含んで構成してもよい。音源部７７０は発振器等で構成することができ、第１のマイクロフォン７１０−１の第１の振動膜（ダイヤフラム）７１１−１の中心点Ｃ１と第２のマイクロフォン７１０−２の第２の振動膜（ダイヤフラム）７１１−２の中心点Ｃ２から等距離に設置してもよい。

そして音源部７７０からの音に基づいて差分信号生成部７４０の入力となる第１の電圧信号Ｓ１と第２の電圧信号Ｓ２の位相差あるいは遅延差が零となるように調整してもよい。

また音源部７７０からの音に基づいてゲイン部７６０における増幅率を変化させる制御
を行うようにしてもよい。

そして音源部７７０からの音に基づいて差分信号生成部７４０の入力となる第１の電圧信号Ｓ１と第２の電圧信号Ｓ２の振幅差が零となるように調整してもよい。

ここで音源部７７０は、単一周波数の音を発生する音源を用いてもよい。例えば１ｋHzの音を発生させてもよい。

また音源部７７０の周波数は、可聴帯域外に設定してもよい。例えば２０ｋHzより高い周波数（例えば３０ｋHz）の音を使用すれば人間の耳には聞こえない。音源部７７０の周波数を可聴帯域外に設定すると、ユーザ使用時においても支障をきたすことなく音源部７７０を用いて入力信号の位相差あるいは遅延差、および感度（ゲイン）差を調整することができる。

例えば遅延部７３２−１をアナログフィルタで構成する場合、温度特性によって遅延量が変化する場合もあるが、本実施の形態によれば、温度変化等の周囲の環境変化に対応した遅延調整を行うことができる。遅延調整は常時行うようにしてもよいし、間欠的に行うようにしてもよいし、電源投入時等に行うようにしても良い。

９．第６の実施の形態に係る音声入力装置の構成
図３９は第６の実施の形態の音声入力装置の構成の一例を示す図である。

本実施の形態の音声入力装置は、第１の振動膜を有する第１のマイクロフォン７１０−１と、第２の振動膜を有する第２のマイクロフォン７１０−２と、前記第１のマイクロフォンで取得された第１の電圧信号と、前記第２のマイクロフォンで取得された第２の電圧信号との差を示す差分信号を生成する図示しない差分信号生成部とを含んでおり、前記第１の振動膜及び前記第２の振動膜の少なくとも一方は、膜面に対して垂直になるように設置された筒状の導音管１１００を介して音波を取得するように構成してもよい。

導音管１１００は、筒の開口部１１０２からから入力した音波が音響孔７１４−２を介して外部に漏れないよう第２のマイクロフォン７１０−２の振動膜まで届くように、振動膜の周囲の基板１１１０に設置してもよい。このようすると、導音管１１００に入った音は減衰することなく第２のマイクロフォン７１０−２の振動膜に届く。本実施の形態によれば前記第１の振動膜及び前記第２の振動膜の少なくとも一方に導音管を設置することにより、音が振動膜に届くまでの距離を変えることができる。従って遅延バランスのばらつきに応じて、適当な長さ（例えば数ミリ）の導音管を設置することにより遅延を解消することができる。

なお、本発明は、上述の実施の形態に限定されるものではなく、種々の変形が可能である。本発明は、実施の形態で説明した構成と実質的に同一の構成（例えば、機能、方法及び結果が同一の構成、あるいは目的及び効果が同一の構成）を含む。また、本発明は、実施の形態で説明した構成の本質的でない部分を置き換えた構成を含む。また、本発明は、実施の形態で説明した構成と同一の作用効果を奏する構成又は同一の目的を達成することができる構成を含む。また、本発明は、実施の形態で説明した構成に公知技術を付加した構成を含む。

音声入力装置について説明するための図。音声入力装置について説明するための図。音声入力装置について説明するための図。音声入力装置について説明するための図。音声入力装置を製造する方法について説明するための図。音声入力装置を製造する方法について説明するための図。音声入力装置について説明するための図。音声入力装置について説明するための図。音声入力装置の一例としての携帯電話を示す図。音声入力装置の一例としてのマイクを示す図。音声入力装置の一例としてのリモートコントローラを示す図。情報処理システムの概略図。音声入力装置の構成の一例を示す図。音声入力装置の構成の一例を示す図。遅延部と遅延制御部の具体的構成の一例を示す図。図１６（Ａ）（Ｂ）は、群遅延フィルタの遅延量をスタティックに制御する構成の一例。音声入力装置の構成の一例を示す図。音声入力装置の構成の一例を示す図。位相差検出部のタイミングチャート。音声入力装置の構成の一例を示す図。音声入力装置の構成の一例を示す図。図２２（Ａ）（Ｂ）は差動マイクの指向性について説明するための図。ノイズ検出手段を備えた音声入力装置の構成の一例を示す図。ノイズ検出による信号切り替えの動作例を示すフローチャート。ノイズ検出によるスピーカの音量制御の動作例を示すフローチャート。ＡＤ変換手段を備えた音声入力装置の構成の一例を示す図。ゲイン調整手段を備えた音声入力装置の構成の一例を示す図。音声入力装置の構成の一例を示す図。音声入力装置の構成の一例を示す図。音声入力装置の構成の一例を示す図。音声入力装置の構成の一例を示す図。ゲイン部とゲイン制御部の具体的構成の一例を示す図。図３３（Ａ）（Ｂ）は、ゲイン部の増幅率をスタティックに制御する構成の一例。音声入力装置の構成の一例を示す図。音声入力装置の構成の一例を示す図。音声入力装置の構成の一例を示す図。音声入力装置の構成の一例を示す図。ＡＤ変換手段を備えた音声入力装置の構成の一例を示す図。音声入力装置の構成の一例を示す図。レーザートリミングにより抵抗値を調整する例を示す図。マイク間距離が５mmの場合のユーザー音声強度比の位相成分の分布の関係について説明するための図。マイク間距離が１０mmの場合のユーザー音声強度比の位相成分の分布について説明するための図。マイク間距離が２０mmの場合のユーザー音声強度比の位相成分の分布について説明するための図。マイク間距離５mm、音源周波数１kHz、マイク−音源間の距離2.5cm及び１mの場合の差動マイクの指向性について説明するための図。マイク間距離１０mm、音源周波数１kHz、マイク−音源間の距離2.5cm及び１mの場合の差動マイクの指向性について説明するための図。マイク間距離２０mm、音源周波数１kHz、マイク−音源間の距離2.5cm及び１mの場合の差動マイクの指向性について説明するための図。マイク間距離５mm、音源周波数７kHz、マイク−音源間の距離2.5cm及び１mの場合の差動マイクの指向性について説明するための図。マイク間距離１０mm、音源周波数７kHz、マイク−音源間の距離2.5cm及び１mの場合の差動マイクの指向性について説明するための図。マイク間距離２０mm、音源周波数７kHz、マイク−音源間の距離2.5cm及び１mの場合の差動マイクの指向性について説明するための図。マイク間距離５mm、音源周波数３００Hz、マイク−音源間の距離2.5cm及び１mの場合の差動マイクの指向性について説明するための図。マイク間距離１０mm、音源周波数３００Hz、マイク−音源間の距離2.5cm及び１mの場合の差動マイクの指向性について説明するための図。マイク間距離２０mm、音源周波数３００Hz、マイク−音源間の距離2.5cm及び１mの場合の差動マイクの指向性について説明するための図。

符号の説明

１…音声入力装置、１０…第１のマイクロフォン、１２…第１の振動膜、２０…第２のマイクロフォン、２２…第２の振動膜、３０…差分信号生成部、４０…筐体、５０…演算処理部、６０…通信処理部、７０…基部、７２…主面、７４…凹部、７５…底面、７６…領域、７８…開口、８０…基部、８２…主面、８４…第１の凹部、８５…第１の開口、８６…第２の凹部、８７…第２の開口、１００…コンデンサ型マイクロフォン、１０２…振動膜、１０４…電極、３００…携帯電話、４００…マイク、５００…リモートコントローラ、６００…情報処理システム、６０２…情報入力端末、６０４…ホストコンピュータ、７００音声入力装置、７１０−１第１のマイクロフォン、７１０−２第２のマイクロフォン、７１２−１
第１の電圧信号、７１２−２第２の電圧信号、７１４−１第１の振動膜、７１４−２
第２の振動膜、７２０差分信号生成回路、７３０遅延部、７３４遅延制御部、７４０差分信号出力部、７４２差分信号、７５０位相差検出部、７５２−１第１の２値化部、７５２−２第２の２値化部、７５４位相差信号生成部、７５６−１第１のバンドパスフィルタ、７５６−２第２のバンドパスフィルタ、７６０ゲイン部、７７０音源部、７８０ノイズ検出量遅延部、７８２ノイズ検出用差分信号生成部、７８４ノイズ検出部、７８６信号切り替え部、７９０−１第１のＡＤ変換手段、７９０−２第２のＡＤ変換手段、９１０ゲイン制御部、９００振幅差検出部、９２０−１第１の振幅検出手段、９２０−２第２の振幅検出手段、９３０振幅差検出部、１１００導音管

Claims

第１の振動膜を有する第１のマイクロフォンと、
第２の振動膜を有する第２のマイクロフォンと、
前記第１のマイクロフォンで取得された第１の電圧信号と、前記第２のマイクロフォンで取得された第２の電圧信号とに基づき第１の電圧信号と第２の電圧信号の差分信号を生成する差分信号生成部と、
前記第２のマイクロフォンで取得された第２の電圧信号にノイズ検出用の遅延を与えて出力するノイズ検出用遅延部と、
前記ノイズ検出用遅延部によってノイズ検出用の所定の遅延を与えられた第２の電圧信号と、前記第１のマイクロフォンで取得された第１の電圧信号との差を示すノイズ検出用の差分信号を生成するノイズ検出用差分信号生成部と、
前記ノイズ検出用の差分信号に基づきノイズのレベルを判定し、判定結果に基づきノイズ検出信号を出力するノイズ検出部と、
前記差分信号生成部から出力される差分信号と前記第１のマイクロフォンで取得された第１の電圧信号を受け取り、前記ノイズ検出信号に基づき第１の電圧信号と前記差分信号とを切り替えて出力する信号切り替え部と、を含む音声入力装置であって、
前記第１及び第２の振動膜は、
前記差分信号に含まれる雑音成分の強度の、前記第１又は第２の電圧信号に含まれる前記雑音成分の強度に対する比率を示す雑音強度比が、前記差分信号に含まれる入力音声成分の強度の、前記第１又は第２の電圧信号に含まれる前記入力音声成分の強度に対する比率を示す入力音声強度比よりも小さくなるように配置され、
前記差分信号生成部は、
前記第１のマイクロフォンで取得された第１の電圧信号及び前記第２のマイクロフォンで取得された第２の電圧信号の少なくとも一方に所定遅延を与えて出力する遅延部と、
前記第１のマイクロフォンで取得された第１の電圧信号及び前記第２のマイクロフォンで取得された第２の電圧信号の少なくとも一方として、前記遅延部によって遅延を与えら
れた信号を入力して、第１の電圧信号と第２の電圧信号の差分信号を生成して出力する差分信号出力部と、を含むことを特徴とする音声入力装置。
請求項１において、
前記遅延部は、
前記第１のマイクロフォンと前記第２のマイクロフォンの製造過程で生じる個体差による遅延のばらつきの検査結果に基づき、前記第１のマイクロフォンで取得された第１の電圧信号及び前記第２のマイクロフォンで取得された第２の電圧信号の少なくとも一方に前記遅延のばらつきを解消する所定遅延を与えることを特徴とする音声入力装置。
請求項１又は２において、
音情報を出力するスピーカと、
前記ノイズ検出信号に基づき前記スピーカの音量を制御する音量制御部と、
をさらに含むことを特徴とする音声入力装置。
請求項１乃至３のいずれかにおいて、
前記ノイズ検出用の遅延は、第１および第２の振動膜の中心間距離を音速で除算した時間に設定されることを特徴とする音声入力装置。
請求項１乃至４のいずれかにおいて、
前記第１の電圧信号をアナログ・デジタル変換する第１のＡＤ変換手段と、
前記第２の電圧信号をアナログ・デジタル変換する第２のＡＤ変換手段と、をさらに含み、
前記差分信号生成部は、
前記第１のＡＤ変換手段によってデジタル信号に変換された前記第１の電圧信号と、前記第２のＡＤ変換手段によってデジタル信号に変換された前記第２の電圧信号と、に基づき第１の電圧信号と第２の電圧信号の差分信号を生成することを特徴とする音声入力装置。
請求項５において、
前記遅延部の遅延は、アナログ・デジタル変換の変換周期の整数倍に設定されることを特徴とする音声入力装置。
請求項５又は６において、
第１および第２の振動膜の中心間距離は、アナログ・デジタル変換の変換周期に音速を乗じた値もしくはその整数倍に設定されることを特徴とする音声入力装置。
請求項１乃至７のいずれかにおいて、
前記第１のマイクロフォンで取得された第１の電圧信号及び前記第２のマイクロフォンで取得された第２の電圧信号の少なくとも一方に所定ゲインを与えて出力するゲイン部をさらに含み、
前記差分信号出力部は、
前記第１のマイクロフォンで取得された第１の電圧信号及び前記第２のマイクロフォンで取得された第２の電圧信号の少なくとも一方が前記ゲイン部によってゲインを与えられた信号を入力して、第１の電圧信号と第２の電圧信号の差分信号を生成して出力することを特徴とする音声入力装置。
請求項１乃至８のいずれかに記載の音声入力装置と、
前記差分信号に基づいて、前記音声入力装置に入力された音声情報の解析処理を行う解析処理部と、を含むことを特徴とする情報処理システム。
請求項１乃至９のいずれかに記載の音声入力装置と、
前記差分信号に基づいて、前記音声入力装置に入力された音声情報の解析処理を行うホストコンピュータと、を含み、
前記通信処理部によって、前記ホストコンピュータとのネットワークを介した通信処理を行うことを特徴とする情報処理システム。