JP2009284110A - 音声入力装置及びその製造方法、並びに、情報処理システム - Google Patents

音声入力装置及びその製造方法、並びに、情報処理システム Download PDF

Info

Publication number
JP2009284110A
JP2009284110A JP2008132459A JP2008132459A JP2009284110A JP 2009284110 A JP2009284110 A JP 2009284110A JP 2008132459 A JP2008132459 A JP 2008132459A JP 2008132459 A JP2008132459 A JP 2008132459A JP 2009284110 A JP2009284110 A JP 2009284110A
Authority
JP
Japan
Prior art keywords
microphone
input device
voltage signal
signal
voice input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2008132459A
Other languages
English (en)
Inventor
Rikuo Takano
陸男 高野
Kiyoshi Sugiyama
精 杉山
Toshimi Fukuoka
敏美 福岡
Masatoshi Ono
雅敏 小野
Ryusuke Horibe
隆介 堀邊
Fuminori Tanaka
史記 田中
Takeshi Inota
岳司 猪田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Funai Electric Co Ltd
Funai Electric Advanced Applied Technology Research Institute Inc
Original Assignee
Funai Electric Co Ltd
Funai Electric Advanced Applied Technology Research Institute Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Funai Electric Co Ltd, Funai Electric Advanced Applied Technology Research Institute Inc filed Critical Funai Electric Co Ltd
Priority to JP2008132459A priority Critical patent/JP2009284110A/ja
Priority to US12/994,142 priority patent/US20110172996A1/en
Priority to PCT/JP2009/059291 priority patent/WO2009145096A1/ja
Priority to CN2009801186556A priority patent/CN102037738A/zh
Priority to EP09754604A priority patent/EP2280559A1/en
Publication of JP2009284110A publication Critical patent/JP2009284110A/ja
Withdrawn legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/005Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G3/00Gain control in amplifiers or frequency changers
    • H03G3/20Automatic control
    • H03G3/30Automatic control in amplifiers having semiconductor devices
    • H03G3/3005Automatic control in amplifiers having semiconductor devices in amplifiers suitable for low-frequencies, e.g. audio amplifiers
    • H03G3/301Automatic control in amplifiers having semiconductor devices in amplifiers suitable for low-frequencies, e.g. audio amplifiers the gain being continuously variable
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G3/00Gain control in amplifiers or frequency changers
    • H03G3/20Automatic control
    • H03G3/30Automatic control in amplifiers having semiconductor devices
    • H03G3/32Automatic control in amplifiers having semiconductor devices the control being dependent upon ambient noise level or sound level
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/60Substation equipment, e.g. for use by subscribers including speech amplifiers
    • H04M1/6008Substation equipment, e.g. for use by subscribers including speech amplifiers in the transmitter circuit
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/20Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L2021/02161Number of inputs available containing the signal or the noise to be suppressed
    • G10L2021/02165Two microphones, one receiving mainly the noise signal and the other one mainly the speech signal
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2250/00Details of telephonic subscriber devices
    • H04M2250/74Details of telephonic subscriber devices with voice recognition means
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R17/00Piezoelectric transducers; Electrostrictive transducers
    • H04R17/02Microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R19/00Electrostatic transducers
    • H04R19/005Electrostatic transducers using semiconductor materials
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R19/00Electrostatic transducers
    • H04R19/04Microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2499/00Aspects covered by H04R or H04S not otherwise provided for in their subgroups
    • H04R2499/10General applications
    • H04R2499/11Transducers incorporated or for use in hand-held devices, e.g. mobile phones, PDA's, camera's
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R31/00Apparatus or processes specially adapted for the manufacture of transducers or diaphragms therefor

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Quality & Reliability (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Otolaryngology (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)

Abstract

【課題】雑音成分を除去する機能を有する音声入力装置及びその製造方法、並びに、情報処理システムを提供すること。
【解決手段】第1の振動膜を有する第1のマイクロフォン710−1と、第2の振動膜を有する第2のマイクロフォン710−2と、第1の電圧信号と、第2の電圧信号の差分信号を生成する差分信号生成部720とを含み、前記第1及び第2の振動膜は、雑音強度比が入力音声成分の強度に対する比率を示す入力音声強度比よりも小さくなるように配置され、差分信号生成部720は、第1の電圧信号に所定のゲインを与えるゲイン部760と、ゲイン部によって所定のゲインを与えられた第1の電圧信号と、第2の電圧信号の差分信号を生成して出力する差分信号出力部740とを含む。
【選択図】図34

Description

本発明は、音声入力装置及びその製造方法、並びに、情報処理システムに関する。
電話などによる通話や、音声認識、音声録音などに際しては、目的の音声(ユーザの音声)のみを収音することが好ましい。しかし、音声入力装置の使用環境では、背景雑音など目的の音声以外の音が存在することがある。そのため、雑音を除去する機能を有する音声入力装置の開発が進んでいる。
雑音が存在する使用環境で雑音を除去する技術として、マイクロフォンに鋭い指向性を持たせること、あるいは、音波の到来時刻差を利用して音波の到来方向を識別して信号処理により雑音を除去する方法が知られている。
また、近年では、電子機器の小型化が進んでおり、音声入力装置を小型化する技術が重要になっている。
特開平7−312638号公報 特開平9−331377号公報 特開2001−186241号公報
マイクロフォンに鋭い指向性を持たせるためには、多数の振動膜を並べる必要があり、小型化は困難であった。
また、音波の到来時刻差を利用して音波の到来方向を精度よく検出するためには、複数の振動膜を、可聴音波の数波長分の1程度の間隔で設置する必要があるため、小型化は困難である。
また、複数のマイクで取得した音波の差分信号を利用する場合には、マイクの製造過程で生じる遅延やゲインのばらつきもが雑音除去の精度に影響を与えることがあった。
本発明のいくつかの態様の目的は、雑音成分を除去する機能を有する音声入力装置及びその製造方法、並びに、情報処理システムを提供することにある。
(1)本発明は、
第1の振動膜を有する第1のマイクロフォンと、
第2の振動膜を有する第2のマイクロフォンと、
前記第1のマイクロフォンで取得された第1の電圧信号と、前記第2のマイクロフォンで取得された第2の電圧信号とに基づき第1の電圧信号と第2の電圧信号の差分信号を生成する差分信号生成部とを含む音声入力装置であって、
前記第1及び第2の振動膜は、
前記差分信号に含まれる雑音成分の強度の、前記第1又は第2の電圧信号に含まれる前記雑音成分の強度に対する比率を示す雑音強度比が、前記差分信号に含まれる入力音声成分の強度の、前記第1又は第2の電圧信号に含まれる前記入力音声成分の強度に対する比率を示す入力音声強度比よりも小さくなるように配置され、
前記差分信号生成部は、
前記第1のマイクロフォンで取得された第1の電圧信号に所定のゲインを与えるゲイン部と、
前記ゲイン部によって所定のゲインを与えられた第1の電圧信号と、前記第2のマイクロフォンで取得された第2の電圧信号を入力して、所定のゲインを与えられた第1の電圧信号と第2の電圧信号の差分信号を生成して出力する差分信号出力部とを含むことを特徴とする。
ゲイン部は入力信号を所定に所定ゲインを与える機能を有し、アナログ信号として処理する場合にはアナログアンプ回路で構成し、デジタル信号として処理する場合にはデジタル乗算器等で構成してもよい。
製造工程における電気的又はメカ的な要因によりマイクロフォンの感度(ゲイン)にはばらつきが生じることが多い。従って第1のマイクロフォンと前記第2のマイクロフォンから出力される電圧信号の振幅のばらつき(マイクロフォンのゲインのばらつき)が生じることがあり、通常±3dB程度のばらつきがある。かかるばらつきがあると、差動マイクロフォンとしての遠方ノイズ抑制効果が低減する原因となることが実験的に確認された。
本発明によれば、第1の電圧信号を所定のゲインを与えること(ゲインを上げる場合でのよいし、ゲインを下げる場合でもよい)により、第1の電圧信号及び第2の電圧信号の振幅のばらつき(ゲインのばらつき)を補正することができる。入力音圧に対する第1の電圧信号及び第2の電圧信号の振幅が等しくなるように、または第1の電圧信号及び第2の電圧信号の振幅差が所定の範囲内におさまるように補正してもよい。これにより、製造工程で生じたマイクロフォンの個体差による感度ばらつきによるノイズ抑制効果の低減を防止することができる。
この音声入力装置によると、第1及び第2のマイクロフォン(第1及び第2の振動膜)が所定の条件を満たすように配置されている。これによると、第1及び第2のマイクロフォンで取得された第1及び第2の電圧信号の差を示す差分信号を、雑音成分が除去された、入力音声を示す信号とみなすことができる。そのため、本発明によると、差分信号を生成するだけの単純な構成で雑音除去機能を実現することが可能な音声入力装置を提供することができる。
なお、この音声入力装置では、差分信号生成部は、第1及び第2の電圧信号に対する解析処理(フーリエ解析処理など)を行うことなく、差分信号を生成する。そのため、差分信号生成部の信号処理負担を軽減し、あるいは、差分信号生成部を非常に簡易な回路によって実現することが可能になる。
このことから、本発明によると、小型化が可能で、かつ、精度の高い雑音除去機能を実現することが可能な音声入力装置を提供することができる。
なお、この音声入力装置では、第1及び第2の振動膜は、雑音成分の位相差成分に基づく強度比が、入力音声成分の振幅に基づく強度比よりも小さくなるように配置されていてもよい。
(2)この音声入力装置は、
前記差分信号生成部は、
所定の端子にかかる電圧または流れる電流に応じて増幅率が変化するよう構成されたゲイン部と、
前記所定の端子にかかる電圧または流れる電流を制御するゲイン制御部を含み、
前記ゲイン制御部は、
複数の抵抗が直列または並列に接続された抵抗アレーを含み、前記抵抗アレーを構成する抵抗体又は導体の一部を切断する、もしくは少なくとも1つの抵抗体を含み、該抵抗体の一部を切断することでゲイン部の所定の端子にかかる電圧または流れる電流を変更可能に構成されていることを特徴とする。
抵抗アレーを構成する抵抗体又は導体の一部をレーザによるカット、あるいは高電圧または高電流の印加により溶断することで抵抗アレーの抵抗値を変更してもよいし、1つの抵抗体の一部に切れ込みを入れることで抵抗値を変更してもよい。
マイクロフォンの製造過程で生じる個体差によるゲインのばらつきを調べて、当該ばらつきにより生じる振幅差を解消するように、第1の電圧信号の増幅率を決定する。そして決定した増幅率を実現するための電圧または電流を所定の端子に供給できるように前記抵抗アレーを構成する抵抗体又は導体(例えばヒューズ)の一部を切断して、ゲイン制御部の抵抗値を適切な値に設定する。これによりゲイン部の出力と、前記第2のマイクロフォンで取得された第2の電圧信号との振幅のバランスを調整することができる。
(3)この音声入力装置は、
前記差分信号生成部は、
前記差分信号出力部の入力となる第1の電圧信号と第2の電圧信号を受け取り、受けとった第1の電圧信号と第2の電圧信号に基づいて、差分信号が生成される際の第1の電圧信号と第2の電圧信号との振幅差を検出して、検出結果に基づき振幅差信号を生成して出力する振幅差検出部と、
前記振幅差信号に基づき、前記ゲイン部における増幅率を変化させる制御を行うゲイン制御部と、を含むことを特徴とする。
振幅差検出部は、ゲイン部の出力信号振幅を検出する第1の振幅検出部と、前記第2のマイクロフォンで取得された第2の電圧信号の信号振幅を検出する第2の振幅検出部と、前記第1の振幅検出手段で検出された振幅信号と前記第2の振幅検出手段で検出された振幅信号との差分信号を検出する振幅差信号生成部とを含んで構成してもよい。
例えばゲイン調整用にテスト用の音源を用意して、当該音源からの音を第1のマイクロフォンと第2のマイクロフォンに対して等しい音圧で入力されるように設定し、第1のマイクロフォンと第2のマイクロフォンで受音して出力される第1の電圧信号と第2の電圧信号の波形をモニタして(例えばオシロスコープ等を用いてモニタしてもよい)振幅が一致するように、または振幅差が所定の範囲内になるように増幅率を変更してもよい。
(4)この音声入力装置は、
前記ゲイン制御部は、
前記ゲイン部の出力信号と、前記第2のマイクロフォンで取得された第2の電圧信号の振幅の差が、いずれかの信号に対して所定の割合以下になるように、または所定レベルのノイズ抑圧効果が得るようにゲイン部の増幅率を制御することを特徴とする。
例えば振幅の差がゲイン部の出力信号または第2の電圧信号に対して−3%以上、+3%以下の範囲になるようにしても良いし、−6%以上、+6%以下の範囲になるようにしても良い。前者の場合1kHzの音波に対してノイズ抑圧効果が約10デシベルとなり、後者の場合ノイズ抑圧効果が約6デシベルとなり、適切な抑圧効果をだすことができる。
または所定のデシベル(例えば約10デシベル)のノイズ抑圧効果を得るように増幅を制御してもよい。
(5)この音声入力装置は、
前記第1のマイクロフォンおよび前記第2のマイクロフォンから等距離に設置された音源部を含み、
前記差分信号生成部は、
前記音源部からの音に基づいて前記ゲイン部における増幅率を変化させる制御を行うことを特徴とする。
前記差分信号生成部は、
前記第1のマイクロフォンおよび前記第2のマイクロフォンで受音した音源部からの音に基づきゲイン部出力と、前記第2のマイクロフォンで取得された第2の電圧信号の信号振幅が等しくなるように調整してもよい。
(6)本発明は、
音声入力装置であって、
第1の振動膜を有する第1のマイクロフォンと、
第2の振動膜を有する第2のマイクロフォンと、
前記第1のマイクロフォンで取得された第1の電圧信号と、前記第2のマイクロフォンで取得された第2の電圧信号とに基づき第1の電圧信号と第2の電圧信号の差分信号を生成する差分信号生成部と、
前記第1のマイクロフォンおよび前記第2のマイクロフォンから等距離に設置された音源部を含み、
前記差分信号生成部は、
前記第1のマイクロフォンで取得された第1の電圧信号に所定のゲインを与えるゲイン部と、
前記差分信号出力部の入力となる第1の電圧信号と第2の電圧信号を受け取り、受けとった第1の電圧信号と第2の電圧信号に基づいて、差分信号が生成される際の第1の電圧信号と第2の電圧信号の振幅差を検出して、検出結果に基づき振幅差信号を生成して出力する振幅差検出部と、
前記振幅差信号に基づき、前記ゲイン部における増幅率を変化させる制御を行うゲイン制御部と、を含み、
前記音源部からの音に基づいて前記第1の電圧信号と第2の電圧信号の振幅が等しくなるように前記ゲイン部における増幅率を調整することを特徴とする。
本発明によれば使用時の状況(環境や使用年数)等により変化するマイクロフォンのゲインのばらつきを調整することができる。
(7)この音声入力装置は、
前記音源部は、単一周波数の音を発生する音源であることを特徴とする。
(8)この音声入力装置は、
前記音源部の周波数は、可聴帯域外に設定されることを特徴とする。
前記音源部の周波数は、可聴帯域外に設定されると、ユーザ使用時においても、支障をきたすことなく音源部を用いて入力信号の位相差あるいは遅延差を調整することができる。本発明によれば、使用時にダイナミックにゲイン調整できるので、温度変化等の周囲の環境に応じたゲイン調整を行うことができる。
(9)この音声入力装置は、
前記振幅差検出部は、
差分信号出力部の入力となる第1の電圧信号と第2の電圧信号の前記単一周波数近傍帯域を通過させるバンドパスフィルタを含み、
前記バンドパスフィルタ通過後の前記第1の電圧信号と前記第2の電圧信号との振幅差を検出して、検出結果に基づき振幅差信号を生成することを特徴とする。
本明によれば、音源部の音声信号を選択的に捉えて調整することができるため、精度の良い調整が可能である。そして、使用時の状況(環境や使用年数)等により変化するマイクロフォンのゲインのばらつきをリアルタイムもしくは間欠的に検出して調整を行うことができる。
(10)この音声入力装置は、
前記差分信号生成部は、
前記差分信号の高周波数域成分をカットするローパスフィルタ部を含むことを特徴とする。
差動マイクは音の高周波数域成分が強調される(ゲインがあがる)という特性を有しており、聴感上高周波数域のノイズが耳障りになることある。そのため、ローパスフィルタを用いて前記差分信号の高域成分を減衰させることで、周波数特性をフラットにし、聴感上の違和感が発生するのを防止することができる。
(11)この音声入力装置は、
前記ローパスフィルタ部は、1次の遮断特性を有するフィルタであることを特徴とする。
差分信号の高周波数域は1次特性(20dB/dec)で上がっていくため、この逆特性を持つ1次のローパスフィルタで高域を減衰させると、差分信号の周波数特性をフラットにたもつことができ、聴感上の違和感が発生するのを防止することができる。
(12)この音声入力装置は、
前記ローパスフィルタ部のカットオフ周波数は、1kHz以上、5kHz以下の間のいずれかの値に設定されることを特徴とする。
ローパスフィルタ部のカットオフ周波数低く設定すると音がこもったようになり、高く設定すると高域ノイズが耳障りであるので、マイク間の距離に応じて適切な値に設定することが好ましい。最適なカットオフ周波数はマイク間の距離によってもかわるが、例えばマイク間の距離が約5mm程度の場合にはローパスフィルタ部のカットオフ周波数を1.5kHz以上、2kHz以下に設定することが好ましい。
(13)この音声入力装置は、
前記第1の電圧信号をアナログ・デジタル変換する第1のAD変換手段と、
前記第2の電圧信号をアナログ・デジタル変換する第2のAD変換手段と、をさらに含み、
前記差分信号生成部は、
前記第1のAD変換手段によってデジタル信号に変換された前記第1の電圧信号と、前記第2のAD変換手段によってデジタル信号に変換された前記第2の電圧信号と、に基づき第1の電圧信号と第2の電圧信号の差分信号を生成することを特徴とする。
(14)本発明は、
音声入力装置であって、
第1の振動膜を有する第1のマイクロフォンと、
第2の振動膜を有する第2のマイクロフォンと、
前記第1のマイクロフォンで取得された第1の電圧信号と、前記第2のマイクロフォンで取得された第2の電圧信号との差を示す差分信号を生成する差分信号生成部と、
を含み、
前記第1及び第2の振動膜は、前記差分信号に含まれる雑音成分の強度の、前記第1又は第2の電圧信号に含まれる前記雑音成分の強度に対する比率を示す雑音強度比が、前記差分信号に含まれる入力音声成分の強度の、前記第1又は第2の電圧信号に含まれる前記入力音声成分の強度に対する比率を示す入力音声強度比よりも小さくなるように配置されていることを特徴とする。
この音声入力装置によると、第1及び第2のマイクロフォン(第1及び第2の振動膜)が所定の条件を満たすように配置されている。これによると、第1及び第2のマイクロフォンで取得された第1及び第2の電圧信号の差を示す差分信号を、雑音成分が除去された、入力音声を示す信号とみなすことができる。そのため、本発明によると、差分信号を生成するだけの単純な構成で雑音除去機能を実現することが可能な音声入力装置を提供することができる。
なお、この音声入力装置では、差分信号生成部は、第1及び第2の電圧信号に対する解析処理(フーリエ解析処理など)を行うことなく、差分信号を生成する。そのため、差分信号生成部の信号処理負担を軽減し、あるいは、差分信号生成部を非常に簡易な回路によって実現することが可能になる。
このことから、本発明によると、小型化が可能で、かつ、精度の高い雑音除去機能を実現することが可能な音声入力装置を提供することができる。
なお、この音声入力装置では、第1及び第2の振動膜は、雑音成分の位相差成分に基づく強度比が、入力音声成分の振幅に基づく強度比よりも小さくなるように配置されていてもよい。
(15)この音声入力装置は、
主面に凹部が形成された基部をさらに含み、
前記第1の振動膜は前記凹部の底面に設置され、
前記第2の振動膜は前記主面に設置されていることを特徴とする。
(16)この音声入力装置は、
前記基部が、前記凹部に連通する開口が、前記主面における前記第2の振動膜の形成領域よりも、前記入力音声のモデル音源の近くに配置されるように設置されたことを特徴とする。
この声入力装置によると、第1及び第2の振動膜に入射する入力音声の位相ずれを小さくすることができる。そのため、ノイズの少ない差分信号を生成することが可能になり、精度の高い雑音除去機能を有する音声入力装置を提供することができる。
(17)この音声入力装置は、
前記凹部は、前記開口と前記第2の振動膜の形成領域との間隔よりも浅いことを特徴とする。
(18)この音声入力装置は、
主面に、第1の凹部と、前記第1の凹部よりも浅い第2の凹部が形成された基部をさらに含み、
前記第1の振動膜は前記第1の凹部の底面に設置され、
前記第2の振動膜は前記第2の凹部の底面に設置されていることを特徴とする。
(19)この音声入力装置は、
前記基部が、前記第1の凹部に連通する第1の開口が、前記第2の凹部に連通する第2の開口よりも、前記入力音声のモデル音源の近くに配置されるように設置されたことを特徴とする。
この声入力装置によると、第1及び第2の振動膜に入射する入力音声の位相ずれを小さくすることができる。そのため、ノイズの少ない差分信号を生成することが可能になり、精度の高い雑音除去機能を有する音声入力装置を提供することができる。
(20)この音声入力装置は、
前記第1及び第2の凹部の深さの差は、前記第1及び第2の開口の間隔よりも小さいことを特徴とする。
(21)この音声入力装置は、
前記基部が、前記入力音声が、第1及び第2の振動膜に同時に到着するように設置されたことを特徴とする。
これによると、入力音声の位相ずれを含まない差分信号を生成することができるため、精度の高い雑音除去機能を有する音声入力装置を提供することができる。
(22)この音声入力装置は、
前記第1及び第2の振動膜は、法線が平行になるように配置されていることを特徴とする。
(23)この音声入力装置は、
前記第1及び第2の振動膜は、法線が同一直線とならないように配置されていることを特徴とする。
(24)この音声入力装置は、
前記第1及び第2のマイクロフォンは、半導体装置として構成されていることを特徴とする。
例えば第1及び第2のマイクロフォンは、シリコンマイク(Siマイク)であってもよい。そして、第1及び第2のマイクロフォンは、1つの半導体基板として構成されていてもよい。このとき、第1及び第2のマイクロフォンと、差分信号生成部とが、1つの半導体基板として構成されていてもよい。第1及び第2のマイクロフォンと、差分信号生成部とは、いわゆるメムス(MEMS:Micro Electro Mechanical Systems)として構成されていてもよい。また、振動膜については無機圧電薄膜、あるいは有機圧電薄膜を使用して、圧電効果により音響−電気変換するようなものであっても構わない。
(25)この音声入力装置は、
前記第1及び第2の振動膜の中心間距離は、5.2mm以下であることを特徴とする。
なお、第1及び第2の振動膜は、法線が平行になるように、かつ、法線の間隔が5.2mm以下となるように配置されていてもよい。
(26)この音声入力装置は、
前記振動膜を、SN比が約60デシベル以上の振動子で構成してもよい。
例えばSN比が60デシベル以上の振動子で構成してもよいし、60±αデシベル以上の振動子で構成してもよい。
(27)この音声入力装置は、
前記第1及び第2の振動膜の中心間距離が、10kHz以下の周波数帯域の音に対して第1の振動膜に入射する音声の音圧の強度に対する第1の振動膜と第2の振動膜に入射する音声の差分音圧の強度の比率である音声強度比の位相成分が0デシベル以下となる距離に設定されていてもよい。
(28)この音声入力装置は、
前記第1及び第2の振動膜の中心間距離が、抽出対象周波数帯域の音に対して、前記振動膜を差動マイクとして使用した場合の音圧が全方位において単体マイクとして使用した場合の音圧を上回らない範囲の距離に設定されていてもよい。
抽出対象周波数は、本音声入力装置で抽出したい音の周波数である。例えば7kHz以下の周波数を抽出対象周波数として前記第1及び第2の振動膜の中心間距離が設定されていてもよい。
(29)本発明は、
上記のいずれかに記載の音声入力装置と、
前記差分信号に基づいて、前記音声入力装置に入力された音声情報の解析処理を行う解析処理部と、を含むことを特徴とする情報処理システムである。
この情報処理システムによると、第1及び第2の振動膜が所定の条件を満たすように配置された音声入力装置で取得された差分信号に基づいて、音声情報の解析処理を行う。この音声入力装置によると、差分信号は、雑音成分が除去された音声成分を示す信号となるため、この差分信号を解析処理することによって、入力音声に基づく種々の情報処理が可能になる。
本発明に係る情報処理システムは、音声認識処理や、音声認証処理、あるいは、音声に基づくコマンド生成処理などを行うシステムであってもよい。
(30)本発明は、
上記のいずれかに記載の音声入力装置と、
前記差分信号に基づいて、前記音声入力装置に入力された音声情報の解析処理を行うホストコンピュータと、を含み、
前記通信処理部によって、前記ホストコンピュータとのネットワークを介した通信処理を行うことを特徴とする情報処理システムである。
この情報処理システムによると、第1及び第2の振動膜が所定の条件を満たすように配置された音声入力装置で取得された差分信号に基づいて、音声情報の解析処理を行う。この音声入力装置によると、差分信号は、雑音成分が除去された音声成分を示す信号となるため、差分信号を解析処理することによって、入力音声に基づく種々の情報処理が可能になる。
本発明に係る情報処理システムでは、音声認識処理や、音声認証処理、あるいは、音声に基づくコマンド生成処理などを行うシステムであってもよい。
(31)本発明は、
第1の振動膜を有する第1のマイクロフォンと、第2の振動膜を有する第2のマイクロフォンと、前記第1のマイクロフォンで取得された第1の電圧信号と、前記第2のマイクロフォンで取得された第2の電圧信号との差を示す差分信号を生成する差分信号生成部と、を含む、雑音成分を除去する機能を有する接話型の音声入力装置を製造する方法であって、
前記第1及び第2の振動膜の中心間距離Δrと雑音の波長λとの比率を示すΔr/λの値と、前記差分信号に含まれる前記雑音成分の強度の、前記第1又は第2の電圧信号に含まれる前記雑音成分の強度に対する比率を示す雑音強度比との対応関係を示すデータを用意する手順と、
前記データに基づいて、前記Δr/λの値を設定する手順と、
設定された前記Δr/λの値、及び、前記雑音の波長に基づいて、前記中心間距離を設定する手順と、
を含むことを特徴とする。
本発明によると、小型化が可能で、かつ、精度の高い雑音除去機能を有する音声入力装置を製造する方法を提供することができる。
(32)この音声入力装置の製造方法は、
前記Δr/λの値を設定する手順では、
前記データに基づいて、前記雑音強度比が、前記差分信号に含まれる入力音声成分の強度の、前記第1又は第2の電圧信号に含まれる前記入力音声成分の強度に対する比率を示す入力音声強度比よりも小さくなるように、前記Δr/λの値を設定することを特徴とする。
(33)この音声入力装置の製造方法は、
前記入力音声強度比は、前記入力音声の振幅成分に基づく強度比であることを特徴とする。
(34)この音声入力装置の製造方法は、
前記雑音強度比は、前記雑音成分の位相差に基づく強度比であることを特徴とする。
(35)この音声入力装置の製造方法は、
前記音声入力装置の差分信号生成部は、
所定の端子にかかる電圧または流れる電流に応じて、前記第1のマイクロフォンで取得された第1の電圧信号に所定ゲインを与えるゲイン部と、
前記所定の端子にかかる電圧または流れる電流を制御するゲイン制御部と、
前記ゲイン部によって所定のゲインを与えられた第1の電圧信号と、前記第2のマイクロフォンで取得された第2の電圧信号を入力して、所定のゲインを与えられた第1の電圧信号と第2の電圧信号の差分信号を生成して出力する差分信号出力部とを含んで構成され、
前記ゲイン制御部を複数の抵抗が直列または並列に接続された抵抗アレーを含むように構成し、前記抵抗アレーを構成する抵抗体又は導体の一部を切断する手順、又は前記ゲイン制御部を少なくとも1つの抵抗体を含むように構成し、該抵抗体の一部を切断する手順のいずれかの手順を含むことを特徴とする。
(36)この音声入力装置の製造方法は、
前記第1のマイクロフォンおよび前記第2のマイクロフォンから等距離に音源を設置し、
前記音源部からの音に基づいて、第1のマイクロフォンおよび前記第2のマイクロフォンかとの振幅差を判定し、当該振幅差が所定の範囲内におさまる抵抗値となるように前記抵抗アレーを構成する抵抗体又は導体の一部、又は抵抗体の一部を切断することを特徴とする。
以下、本発明を適用した実施の形態について図面を参照して説明する。ただし、本発明は以下の実施の形態に限定されるものではない。また、本発明は、以下の内容を自由に組み合わせたものを含むものとする。
1.第1の実施の形態に係る音声入力装置の構成
はじめに、図1〜図3を参照して、本発明を適用した実施の形態に係る音声入力装置1の構成について説明する。なお、以下に説明する音声入力装置1は、接話式の音声入力装置であって、例えば、携帯電話やトランシーバー等の音声通信機器や、入力された音声を解析する技術を利用した情報処理システム(音声認証システム、音声認識システム、コマンド生成システム、電子辞書、翻訳機や、音声入力方式のリモートコントローラなど)、あるいは、録音機器やアンプシステム(拡声器)、マイクシステムなどに適用することができる。
本実施の形態に係る音声入力装置は、第1の振動膜12を有する第1のマイクロフォン10と、第2の振動膜22を有する第2のマイクロフォン20とを含む。ここで、マイクロフォンとは、音響信号を電気信号へ変換する電気音響変換器である。第1及び第2のマイクロフォン10,20は、それぞれ、第1及び第2の振動膜12,22(振動板)の振動を、電圧信号として出力する変換器であってもよい。
本実施の形態に係る音声入力装置では、第1のマイクロフォン10は第1の電圧信号を生成する。また、第2のマイクロフォン20は第2の電圧信号を生成する。すなわち、第1及び第2のマイクロフォン10,20で生成された電圧信号を、それぞれ、第1及び第2の電圧信号と呼んでもよい。
第1及び第2のマイクロフォン10,20の機構については特に限定されるものではない。図2には、第1及び第2のマイクロフォン10,20に適用可能なマイクロフォンの一例として、コンデンサ型マイクロフォン100の構造を示す。コンデンサ型マイクロフォン100は、振動膜102を有する。振動膜102は、音波を受けて振動する膜(薄膜)で、導電性を有し、電極の一端を形成している。コンデンサ型マイクロフォン100は、また、電極104を有する。電極104は、振動膜102と対向して配置されている。これにより、振動膜102と電極104とは容量を形成する。コンデンサ型マイクロフォン100に音波が入射すると、振動膜102が振動して、振動膜102と電極104との間隔が変化し、振動膜102と電極104との間の静電容量が変化する。この静電容量の変化を、例えば電圧の変化として出力することによって、コンデンサ型マイクロフォン100に入射する音波を、電気信号に変換することができる。なお、コンデンサ型マイクロフォン100では、電極104は、音波の影響を受けない構造をなしていてもよい。例えば、電極104はメッシュ構造をなしていてもよい。
ただし、本発明に適用可能なマイクロフォンは、コンデンサ型マイクロフォンに限られるものではなく、既に公知となっているいずれかのマイクロフォンを適用することができる。例えば、第1及び第2のマイクロフォン10,20として、動電型(ダイナミック型)、電磁型(マグネティック型)、圧電型(クリスタル型)等のマイクロフォンを適用してもよい。
第1及び第2のマイクロフォン10,20は、第1及び第2の振動膜12,22がシリコンによって構成されたシリコンマイク(Siマイク)であってもよい。シリコンマイクを利用することで、第1及び第2のマイクロフォン10,20の小型化、及び、高性能化を実現することができる。このとき、第1及び第2のマイクロフォン10,20は、1つの集積回路装置として構成されていてもよい。すなわち、第1及び第2のマイクロフォン10,20は、1つの半導体基板に構成されていてもよい。このとき、後述する差分信号生成部30も、同一の半導体基板に形成されていてもよい。すなわち、第1及び第2のマイクロフォン10,20は、いわゆるメムス(MEMS:Micro Electro Mechanical Systems)として構成されていてもよい。ただし、第1のマイクロフォン10と第2のマイクロフォン20とは、別々のシリコンマイクとして構成されていてもよい。
前記振動膜を、SN(Signal to Noise)比が約60デシベル以上の振動子で構成してもよい。振動子を差動マイクとして機能させる場合には単体マイクとして機能させる場合に比べてSN比が低下する。従ってSN比に優れた振動子(例えばSN比が60デシベル以上のMEMS振動子)を用いて前記振動膜を構成することで、感度のよい音声入力装置を実現することができる。
例えば、単体マイク2個を5mm程度離して配置し、これらの差分をとることで差動マイクを構成し、話者とマイク間の距離を約2.5cm程度(接話型の音声入力装置)の条件で使用する場合には、単体マイクの場合に比べて出力感度が10デシベル程度低下する。すなわち、単体マイクに比べて差動マイクは少なくとも10デシベルはSN比が低下することになる。マイクの実用性を考えた場合、SN比は50デシベル程度必要であるとされているため、差動マイクにおいてこの条件を満たすためには、単体の状態でSN比が約60デシベル以上確保できるような振動子で前記振動膜を用いてマイクロフォンを構成する必要があり、これにより、前記感度の低下による影響を鑑みてもマイクとしての機能の必要レベルを満たした音声入力装置を実現することができる。
本実施の形態に係る音声入力装置では、後述するように、第1及び第2の電圧信号の差を示す差分信号を利用して、雑音成分を除去する機能を実現する。この機能を実現するために、第1及び第2のマイクロフォン(第1及び第2の振動膜12,22)は、一定の制約を満たすように配置される。第1及び第2の振動膜12,22が満たすべき制約の詳細については後述するが、本実施の形態では、第1及び第2の振動膜12,22(第1及び第2のマイクロフォン10,20)は、雑音強度比が、入力音声強度比よりも小さくなるように配置される。これにより、差分信号を、雑音成分が除去された音声成分を示す信号とみなすことが可能になる。第1及び第2の振動膜12,22は、例えば、中心間距離が5.2mm以下になるように配置されていてもよい。
なお、本実施の形態に係る音声入力装置では、第1及び第2の振動膜12,22の向きは、特に限定されるものではない。第1及び第2の振動膜12,22は、法線が平行になるように配置されていてもよい。このとき、第1及び第2の振動膜12,22は、法線が同一直線にならないように配置されていてもよい。例えば、第1及び第2の振動膜12,22は、図示しない基部(例えば回路基板)の表面に、間隔をあけて配置されていてもよい。あるいは、第1及び第2の振動膜12,22は、法線方向にずれて配置されていてもよい。ただし、第1及び第2の振動膜12,22は、法線が平行にならないように配置されていてもよい。第1及び第2の振動膜12,22は、法線が直交するように配置されていてもよい。
そして、本実施の形態に係る音声入力装置は、差分信号生成部30を有する。差分信号生成部30は、第1のマイクロフォン10で取得された第1の電圧信号と、第2のマイクロフォン20で取得された第2の電圧信号との差(電圧差)を示す差分信号を生成する。差分信号生成部30では、第1及び第2の電圧信号に対して例えばフーリエ解析などの解析処理を行うことなく、時間領域において両者の差を示す差分信号を生成する処理を行う。差分信号生成部30の機能は、専用のハードウェア回路(差分信号生成回路)によって実現してもよく、CPUなどによる信号処理によって実現してもよい。
本実施の形態に係る音声入力装置は、差分信号を増幅する(ゲインを上げる場合もゲインを下げる場合も含む意味である)ゲイン部をさらに含んでいてもよい。差分信号生成部30とゲイン部とは、1つの制御回路によって実現してもよい。ただし、本実施の形態に係る音声入力装置は、ゲイン部を内部に持たない構成をなしていてもよい。
図3には、差分信号生成部30とゲイン部とを実現可能な回路の一例を示す。図3に示す回路によれば、第1及び第2の電圧信号を受け付けて、その差を示す差分信号を10倍に増幅した信号を出力することになる。ただし、差分信号生成部30及びゲイン部を実現するための回路構成は、これに限られるものではない。
本実施の形態に係る音声入力装置は、筐体40を含んでいてもよい。このとき、音声入力装置の外形は、筐体40によって構成されていてもよい。筐体40には基本姿勢が設定されていてもよく、これにより、入力音声の進行径路を規制することができる。第1及び第2の振動膜12,22は、筐体40の表面に形成されていてもよい。あるいは、第1及び第2の振動膜12,22は、筐体40に形成された開口(音声入射口)と対向するように、筐体40内部に配置されていてもよい。そして、第1及び第2の振動膜12,22は、音源(入射音声のモデル音源)からの距離が異なるように配置されていてもよい。例えば図1に示すように、筐体40は、入力音声の進行径路が筐体40の表面に沿うように、基本姿勢が設定されていてもよい。そして、第1及び第2の振動膜12,22は、入力音声の進行径路に沿って配置されていてもよい。そして、入力音声の進行径路の上流側に配置される振動膜を第1の振動膜12とし、下流側に配置される振動膜を第2の振動膜22としてもよい。
本実施の形態に係る音声入力装置は、演算処理部50をさらに含んでいてもよい。演算処理部50は、差分信号生成部30で生成された差分信号に基づいて各種の演算処理を行う。演算処理部50は、差分信号に対する解析処理を行ってもよい。演算処理部50は、差分信号を解析することにより、入力音声を発した人物を特定する処理(いわゆる音声認証処理)を行ってもよい。あるいは、演算処理部50は、差分信号を解析処理することにより、入力音声の内容を特定する処理(いわゆる音声認識処理)を行ってもよい。演算処理部50は、入力音声に基づいて、各種のコマンドを作成する処理を行ってもよい。演算処理部50は、差分信号を増幅する処理を行ってもよい。また、演算処理部50は、後述する通信処理部60の動作を制御してもよい。なお、演算処理部50は、上記各機能を、CPUやメモリによる信号処理によって実現してもよい。
演算処理部50は、筐体40の内部に配置されていてもよいが、筐体40の外部に配置されていてもよい。演算処理部50が筐体40の外部に配置されている場合、演算処理部50は、後述する通信処理部60を介して、差分信号を取得してもよい。
本実施の形態に係る音声入力装置は、通信処理部60をさらに含んでいてもよい。通信処理部60は、音声入力装置と、他の端末(携帯電話端末や、ホストコンピュータなど)との通信を制御する。通信処理部60は、ネットワークを介して、他の端末に信号(差分信号)を送信する機能を有していてもよい。通信処理部60は、また、ネットワークを介して、他の端末から信号を受信する機能を有していてもよい。そして、例えばホストコンピュータで、通信処理部60を介して取得した差分信号を解析処理して、音声認識処理や音声認証処理、コマンド生成処理や、データ蓄積処理など、種々の情報処理を行ってもよい。すなわち、音声入力装置は、他の端末と協働して、情報処理システムを構成していてもよい。言い換えると、音声入力装置は、情報処理システムを構築する情報入力端末であるとみなしてもよい。ただし、音声入力装置は、通信処理部60を有しない構成となっていてもよい。
本実施の形態に係る音声入力装置は、表示パネルなどの表示装置や、スピーカ等の音声出力装置をさらに含んでいてもよい。また、本実施の形態に係る音声入力装置は、操作情報を入力するための操作キーをさらに含んでいてもよい。
本実施の形態に係る音声入力装置は、以上の構成をなしていてもよい。この音声入力装置によると、第1及び第2の電圧信号の差を出力するだけの簡単な処理によって、雑音成分が除去された音声成分を示す信号(電圧信号)が生成される。そのため、本発明によると、小型化が可能で、かつ、優れた雑音除去機能を有する音声入力装置を提供することができる。なお、その原理については、後で詳述する。
2.雑音除去機能
以下、本実施の形態に係る音声入力装置が採用する音声除去原理、及び、これを実現するための条件について説明する。
(1)雑音除去原理
はじめに、本実施の形態に係る音声入力装置の雑音除去原理について説明する。
音波は、媒質中を進行するにつれ減衰し、音圧(音波の強度・振幅)が低下する。音圧は、音源からの距離に反比例するため、音圧Pは、音源からの距離Rとの関係において、
と表すことができる。なお、式(1)中、Kは比例定数である。図4には、式(1)を表すグラフを示すが、本図からもわかるように、音圧(音波の振幅)は、音源に近い位置(グラフの左側)では急激に減衰し、音源から離れるほどなだらかに減衰する。本実施の形態に係る音声入力装置では、この減衰特性を利用して雑音成分を除去する。
すなわち、接話型の音声入力装置では、ユーザは、雑音の音源よりも、第1及び第2のマイクロフォン10,20(第1及び第2の振動膜12,22)に近い位置から音声を発する。そのため、第1及び第2の振動膜12,22の間で、ユーザの音声は大きく減衰し、第1及び第2の電圧信号に含まれるユーザ音声の強度には差が現れる。これに対して、雑音成分は、ユーザの音声に比べて音源が遠いため、第1及び第2の振動膜12,22の間でほとんど減衰しない。そのため、第1及び第2の電圧信号に含まれる雑音の強度には、差が現れないとみなすことができる。このことから、第1及び第2の電圧信号の差を検出すれば雑音が消去されるため、雑音成分が含まれない、ユーザの音声成分のみを示す電圧信号(差分信号)を取得することができる。すなわち、差分信号を、雑音成分が除去されたユーザの音声を示す信号であるとみなすことができる。
ただし、音波は位相成分を有する。そのため、信頼性の高い雑音除去機能を実現するためには、第1及び第2の電圧信号に含まれる音声成分及び雑音成分の位相差を考慮する必要がある。
以下、差分信号を生成することによって雑音除去機能を実現するために、音声入力装置が満たすべき具体的な条件について説明する。
(2)音声入力装置が満たすべき具体的条件
本実施の形態に係る音声入力装置は、先に説明したように、第1及び第2の電圧信号の差分を示す差分信号を、雑音を含まない入力音声信号であるとみなす。この音声入力装置によると、差分信号に含まれる雑音成分が、第1又は第2の電圧信号に含まれる雑音成分よりも小さくなれば、雑音除去機能が実現できたと評価することができる。詳しくは、差分信号に含まれる雑音成分の強度の、第1又は第2の電圧信号に含まれる雑音成分の強度に対する比を示す雑音強度比が、差分信号に含まれる音声成分の強度の、第1又は第2の電圧信号に含まれる音声成分の強度に対する比を示す音声強度比よりも小さくなれば、この雑音除去機能が実現されたと評価することができる。
以下、この雑音除去機能を実現するために、音声入力装置(第1及び第2の振動膜12,22)が満たすべき具体的な条件について説明する。
はじめに、第1及び第2のマイクロフォン10,20(第1及び第2の振動膜12,22)に入射する音声の音圧について検討する。入力音声(ユーザの音声)の音源から第1の振動膜12までの距離をRとし、第1及び第2の振動膜12,22(第1及び第2のマイクロフォン10,20)の中心間距離をΔrとすれば、位相差を無視すれば、第1及び第2のマイクロフォン10,20で取得される、入力音声の音圧(強度)P(S1)及びP(S2)は、
と表すことができる。
そのため、入力音声の位相差を無視した時の、第1のマイクロフォン10で取得される入力音声成分の強度に対する、差分信号に含まれる入力音声成分の強度の比率を示す音声強度比ρ(P)は、
と表される。
ここで、本実施の形態に係る音声入力装置は接話式の音声入力装置であって、ΔrはRに比べて充分小さいとみなすことができる。
そのため、上述の式(4)は、
と変形することができる。
すなわち、入力音声の位相差を無視した場合の音声強度比は、式(A)と表されることがわかる。
ところで、入力音声の位相差を考慮すると、ユーザ音声の音圧Q(S1)及びQ(S2)は、
と表すことができる。なお、式中、αは位相差である。
このとき、音声強度比ρ(S)は、
と表される。式(7)を考慮すると、音声強度比ρ(S)の大きさは、
と表すことができる。
ところで、式(8)のうち、sinωt−sin(ωt−α)項は位相成分の強度比を示し、Δr/R sinωt項は振幅成分の強度比を示す。入力音声成分であっても、位相差成分は、振幅成分に対するノイズとなるため、入力音声(ユーザの音声)を精度よく抽出するためには、位相成分の強度比が、振幅成分の強度比よりも充分に小さいことが必要である。すなわち、sinωt−sin(ωt−α)と、Δr/R sinωtとは、
の関係を満たしていることが必要である。
ここで、
と表すことができるため、上述の式(B)は、
と表すことができる。
式(10)の振幅成分を考慮すると、本実施の形態に係る音声入力装置は、
を満たす必要があることがわかる。
なお、上述したように、ΔrはRに比べて充分小さいとみなすことができるため、sin(α/2)は充分小さいとみなすことができ、
と近似することができる。
そのため、式(C)は、
と変形することができる。
また、位相差であるαとΔrとの関係を、
と表せば、式(D)は、
と変形することができる。
すなわち、本実施の形態では、入力音声(ユーザの音声)を精度よく抽出するためには、音声入力装置を、式(E)に示す関係を満たすように製造することが必要である。
次に、第1及び第2のマイクロフォン10,20(第1及び第2の振動膜12,22)に入射する雑音の音圧について検討する。
第1及び第2のマイクロフォンで取得される雑音成分の振幅を、A,A´とすると、位相差成分を考慮した雑音の音圧Q(N1)及びQ(N2)は、
と表すことができ、第1のマイクロフォン10で取得される雑音成分の強度に対する、差分信号に含まれる雑音成分の強度の比率を示す雑音強度比ρ(N)は、
と表すことができる。
なお、先に説明したように、第1及び第2のマイクロフォンで取得される雑音成分の振幅(強度)はほぼ同じであり、A=A´と扱うことができる。そのため、上記の式(15)は、
と変形することができる。
そして、雑音強度比の大きさは、
と表すことができる。
ここで、上述の式(9)を考慮すると、式(17)は、
と変形することができる。
そして、式(11)を考慮すると、式(18)は、
と変形することができる。
ここで、式(D)を参照すれば、雑音強度比は、
と表すことができる。なお、Δr/Rとは、式(A)に示すように、入力音声(ユーザ音声)の振幅成分の強度比である。式(F)から、この音声入力装置では、雑音強度比が入力音声の強度比Δr/Rよりも小さくなることがわかる。
以上のことから、入力音声の位相成分の強度比が振幅成分の強度比よりも小さくなるように設計された音声入力装置によれば(式(B)参照)、雑音強度比が入力音声強度比よりも小さくなる(式(F)参照)。逆に言うと、雑音強度比が入力音声強度比よりも小さくなるように設計された音声入力装置によると、精度の高い雑音除去機能を実現することができる。
すなわち、第1及び第2の振動膜12,22(第1及び第2のマイクロフォン10,20)が、雑音強度比が入力音声強度比よりも小さくなるように配置される本実施の形態に係る音声入力装置によれば、精度の高い雑音除去機能を実現することができる。
3.音声入力装置の製造方法
以下、本実施の形態に係る音声入力装置の製造方法について説明する。本実施の形態では、第1及び第2の振動膜12,22の中心間距離Δrと雑音の波長λとの比率を示すΔr/λの値と、雑音強度比(雑音の位相成分に基づく強度比)との対応関係を示すデータを利用して、音声入力装置を製造する。
雑音の位相成分に基づく強度比は、上述した式(18)で表される。そのため、雑音の位相成分に基づく強度比のデシベル値は、
と表すことができる。
そして、式(20)のαに各値を代入すれば、位相差αと雑音の位相成分に基づく強度比との対応関係を明らかにすることができる。図5には、横軸をα/2πとし、縦軸に雑音の位相成分に基づく強度比(デシベル値)を取った時の、位相差と強度比との対応関係を表すデータの一例を示す。
なお、位相差αは、式(12)に示すように、距離Δrと波長λとの比であるΔr/λの関数で表すことができ、図5の横軸は、Δr/λとみなすことができる。すなわち、図5は、雑音の位相成分に基づく強度比と、Δr/λとの対応関係を示すデータであるといえる。
本実施の形態では、このデータを利用して、音声入力装置を製造する。図6は、このデータを利用して音声入力装置を製造する手順について説明するためのフローチャート図である。
はじめに、雑音の強度比(雑音の位相成分に基づく強度比)と、Δr/λとの対応関係を示すデータ(図5参照)を用意する(ステップS10)。
次に、用途に応じて、雑音の強度比を設定する(ステップS12)。なお、本実施の形態では、雑音の強度が低下するように雑音の強度比を設定する必要がある。そのため、本ステップでは、雑音の強度比を、0dB以下に設定する。
次に、当該データに基づいて、雑音の強度比に対応するΔr/λの値を導出する(ステップS14)。
そして、λに主要な雑音の波長を代入することによって、Δrが満たすべき条件を導出する(ステップS16)。
具体例として、主要な雑音が1kHzであり、その波長が0.347mとなる環境下で、雑音の強度が20dB低下する音声入力装置を製造する場合について考える。
はじめに、必要条件として、雑音の強度比が0dB以下になるための条件について検討する。図5を参照すると、雑音の強度比を0dB以下とするためには、Δr/λの値を0.16以下とすればよいことがわかる。すなわち、Δrの値が55.46mm以下とすればよいことがわかり、これが、この音声入力装置の必要条件となる。
次に、1kHzの雑音の強度を20dB低下させるための条件について考える。図5を参照すると、雑音の強度を20dB低下させるためには、Δr/λの値を0.015とすればよいことがわかる。そして、λ=0.347mとすると、Δrの値が5.20mm以下のときに、この条件を満たすことがわかる。すなわち、第1及び第2の振動膜12,22(第1及び第2のマイクロフォン10,20)の中心間距離Δrを約5.2mm以下に設定すれば、雑音除去機能を有する接話型の音声入力装置を製造することが可能になる。
なお、本実施の形態に係る音声入力装置は接話式の音声入力装置であり、ユーザの音声の音源と第1又は第2の振動膜12,22との間隔は、通常5cm以下である。また、ユーザ音声の音源と第1及び第2の振動膜12,22との間隔は、筐体40の設計によって制御することが可能である。そのため、入力音声(ユーザの音声)の強度比であるΔr/Rの値は、0.1(雑音の強度比)よりも大きくなり、雑音除去機能が実現されることがわかる。
なお、通常、雑音は単一の周波数に限定されるものではない。しかし、主要な雑音として想定された雑音よりも周波数の低い雑音は、当該主要な雑音よりも波長が長くなるため、Δr/λの値は小さくなり、この音声入力装置によって除去される。また、音波は、周波数が高いほどエネルギーの減衰が早い。そのため、主要な雑音として想定された雑音よりも周波数の高い雑音は、当該主要な雑音よりも早く減衰するため、音声入力装置に与える影響を無視することができる。このことから、本実施の形態に係る音声入力装置は、主要な雑音として想定された雑音とは異なる周波数の雑音が存在する環境下でも、優れた雑音除去機能を発揮することができる。
また、本実施の形態では、式(12)からもわかるように、第1及び第2の振動膜12,22を結ぶ直線上から入射する雑音を想定した。この雑音は、第1及び第2の振動膜12,22の見かけ上の間隔が最も大きくなる雑音であり、現実の使用環境において、位相差が最も大きくなる雑音である。すなわち、本実施の形態に係る音声入力装置は、位相差が最も大きくなる雑音を除去することが可能に構成されている。そのため、本実施の形態に係る音声入力装置によると、すべての方向から入射する雑音が除去される。
4.効果
以下、本実施の形態に係る音声入力装置が奏する効果について説明する。
先に説明したように、本実施の形態に係る音声入力装置によると、第1及び第2のマイクロフォン10,20で取得された電圧信号の差分を示す差分信号を生成するだけで、雑音成分が除去された音声成分を取得することができる。すなわち、この音声入力装置では、複雑な解析演算処理を行うことなく雑音除去機能を実現することができる。そのため本実施の形態によれば、簡単な構成で、精度の高い雑音除去機能を実現することが可能な音声入力装置を提供することができる。特に、第1及び第2の振動膜の中心間距離Δrを5.2mm以下に設定することで、位相歪が少なく、より精度の高い雑音除去機能を実現することが可能な音声入力装置を提供することができる。
また前記第1及び第2の振動膜の中心間距離が、10kHz以下の周波数帯域の音に対して、第1の振動膜に入射する音声の音圧の強度に対する第1の振動膜と第2の振動膜に入射する音声の差分音圧の強度の比率である音声強度比の位相成分が、0デシベル以下となる距離に設定してもよい。
前記第1及び第2の振動膜を音源の音(例えば音声)の進行方向に沿って配置して、前記進行方向からの10kHz以下の周波数帯域の音に対して、前記振動膜を差動マイクとして使用した場合の音圧の位相成分が単体マイクとして使用した場合の音圧を上回らない範囲の距離に前記第1及び第2の振動膜の中心間距離を設定してもよい。
音声入力装置1が奏する遅延歪除去効果について説明する。
先に説明したように、ユーザ音声強度比ρ(S)は以下の式(8)で表される。
ここで、ユーザ音声強度比ρ(S)の位相成分ρ(S)phaseは、sinωt−sin(ωt−α)の項である。式(8)に、

を代入すると、ユーザ音声強度比ρ(S)の位相成分ρ(S)phaseは、以下の式で表すことができる。
したがって、ユーザ音声強度比ρ(S)の位相成分ρ(S)phaseに基づく強度比のデシベル値は、以下の式で表すことができる。
そして、式(22)のαに各値を代入すれば、位相差αと、ユーザ音声の位相成分に基づく強度比との対応関係を明らかにすることができる。
図41から図43はマイク間距離とユーザ音声強度比ρ(S)の位相成分ρ(S)phaseの関係について説明するための図である。図41から図44の横軸はΔr/λであり、縦軸はユーザ音声強度比ρ(S)の位相成分ρ(S)phaseである。ユーザ音声強度比ρ(S)の位相成分ρ(S)phaseとは差動マイクと単体マイクの音圧比の位相成分(ユーザ音声の位相成分に基づく強度比)であり、差動マイクを構成するマイクを単体マイクとして使用した場合の音圧が差動音圧と同じになるところを0デシベルとしている。
すなわち図41から図43のグラフは、Δr/λに対応した差動音圧の遷移を示しており、縦軸が0デシベル以上のエリアは、遅延歪(ノイズ)が大きいと考えることができる。
現行の電話回線は3.4kHzの音声周波数帯域で設計されているが、より高品質な音声通信を実現しようとした場合、7kHz以上、好ましくは10kHzの音声周波数帯域が必要とされる。以下、10kHzの音声周波数帯域を想定した場合における、遅延による音声歪みの影響について考察する。
図41はマイク間距離(Δr)が5mmである場合の、1kHz、7kHz、10kHzの周波数の音を差動マイクでとらえた場合のユーザ音声強度比ρ(S)の位相成分ρ(S)phaseの分布を示している。
マイク間距離が5mmの場合には、図41に示すように1kHz、7kHz、10kHzのいずれの周波数の音についても音ユーザ音声強度比ρ(S)の位相成分ρ(S)phaseは0デシベル以下である。
また図42はマイク間距離(Δr)が10mmである場合の、1kHz、7kHz、10kHzの周波数の音を差動マイクでとらえた場合のユーザ音声強度比ρ(S)の位相成分ρ(S)phaseの分布を示している。
マイク間距離が10mmになると、図42に示すように1kHz、7kHzの周波数の音についてはユーザ音声強度比ρ(S)の位相成分ρ(S)phaseは0デシベル以下であるが、10kHzの周波数の音についてはユーザ音声強度比ρ(S)の位相成分ρ(S)phaseが0デシベル以上となり遅延ひずみ(ノイズ)が大きくなっている。
また図43はマイク間距離(Δr)が20mmである場合の、1kHz、7kHz、10kHzの周波数の音を差動マイクでとらえた場合の音ユーザ音声強度比ρ(S)の位相成分ρ(S)phaseの分布を示している。
マイク間距離が20mmになると、図43に示すように1kHzの周波数の音についてはユーザ音声強度比ρ(S)の位相成分ρ(S)phaseは0デシベル以下であるが、7kHz、10kHzの音についてはユーザ音声強度比ρ(S)の位相成分ρ(S)phaseが0デシベル以上となり遅延ひずみ(ノイズ)が大きくなっている。
従ってマイク間距離を約5mm〜6mm程度(より具体的には5.2mm以下)にすることで、周波数が10kHz帯域まで話者音声を忠実に抽出し、かつ遠方雑音の抑制効果の高い音声入力装置を実現することができる。
ここで、マイク間距離を短くするほど、話者音声の位相歪みを抑えられて忠実性は良くなるが、逆に差動マイクの出力レベルが低下して、SN比が低下してしまう。したがって、実用性を考えた場合、最適なマイク間距離範囲が存在する。
本実施の形態では第1及び第2の振動膜の中心間距離を約5mm〜6mm程度(より具体的には5.2mm以下)にすることで、10kHz帯域まで話者音声を忠実に抽出し、かつ実用レベルのSN比を確保し、遠方雑音の抑制効果の高い音声入力装置を実現することができる。
また、この音声入力装置は、位相差に基づく雑音の強度比が、入力音声の強度比よりも小さくなることによって、雑音除去機能を実現する。ところで、位相差に基づく雑音強度比は、第1及び第2の振動膜12,22の配列方向と雑音の入射方向によって変化する。すなわち、雑音に対する第1及び第2の振動膜12,22の間隔(見かけ上の間隔)が広くなるほど、雑音の位相差が大きくなり、位相差に基づく雑音強度比が大きくなる。ところで、本実施の形態では、音声入力装置は、式(12)からもわかるように、第1及び第2の振動膜12,22の見かけ上の間隔が最も広くなる雑音を除去することができるように構成されている。言い換えると、本実施の形態では、位相差に基づく雑音強度比が最も大きくなるように入射する雑音を除去することができるように、第1及び第2の振動膜12,22が配置されている。そのため、この音声入力装置によると、全方位から入射する雑音が除去される。すなわち、本発明によると、全方位から入射する雑音を除去することが可能な音声入力装置を提供することができる。
図44(A)(B)から図52(A)(B)は音源周波数とマイク間距離Δrとマイク−音源間の距離毎の差動マイクの指向性について説明するための図である。
図44(A)(B)は音源の周波数が1kHz、マイク間距離Δrが5mm、マイク−音源間距離がそれぞれ2.5cm(接話型の話者の口元からマイクまでの距離に相当)および1m(遠方雑音に相当)の場合の差動マイクの指向性を示す図である。
1116は差動マイクの全方位に対する感度(差動音圧)を示すグラフであり、差動マイクの指向特性を示している。また1112は差動マイクを単体マイクとして使用した場合の全方位に対する感度(音圧)を示すグラフであり、単体マイクの均等特性を示している。
1114はマイクを2つ用いて差動マイクを構成する場合の両マイクを結ぶ直線の方向又はマイクを1つで差動マイクを実現する場合にマイクの両面に音波を到達させるための第1の振動膜と第2の振動膜を結ぶ直線の方向(0度−180度、差動マイクを構成する2つのマイクM1、M2又は第1の振動膜と第2の振動膜はこの直線上に置かれている)を示している。この直線の方向を0度、180度とし、この直線の方向と直角な方向を90度、270度とする。
1112、1122に示すように単体マイクは全方位から均一に音を取っており指向性を有していない。また音源が遠くなるほど取得する音圧は減衰している。
1116、1120に示すように差動マイクは90度、270度方向で多少感度が落ちるが全方位にほぼ均一な指向性を有している。また単体マイクより取得する音圧が減衰しており、単体マイクと同様に音源が遠くなるほど取得する音圧は減衰している。
図44(B)に示すように音源の周波数が1kHz、マイク間距離Δrが5mmの場合には、差動マイクの指向性を示す差動音圧のグラフ1120の示す領域は単体マイクの均等特性を示すグラフ1122の示す領域に内包されており、差動マイクは単体マイクに比べ遠方雑音の抑制効果に優れているといえる。
図45(A)(B)は音源の周波数が1kHz、マイク間距離Δrが10mm、マイク−音源間距離がそれぞれ2.5cm及び1mの場合の差動マイクの指向性を説明する図である。かかる場合にも、図45(B)に示すように、差動マイクの指向性を示すグラフ1140の示す領域は単体マイクの均等特性を示すグラフ1422の示す領域に内包されており、差動マイクは単体マイクに比べ遠方雑音の抑制効果に優れているといえる。
図46(A)(B)は音源の周波数が1kHz、マイク間距離Δrが20mm、マイク−音源間距離がそれぞれ2.5cm及び1mの場合の差動マイクの指向性を示す図である。かかる場合にも、図46(B)に示すように、差動マイクの指向性を示すグラフ1160の示す領域は単体マイクの均等特性を示すグラフ1462の示す領域に内包されており、差動マイクは単体マイクに比べ遠方雑音の抑制効果に優れているといえる。
図47(A)(B)は音源の周波数が7kHz、マイク間距離Δrが5mm、マイク−音源間距離がそれぞれ2.5cm及び1mの場合の差動マイクの指向性を示す図である。かかる場合にも、図47(B)に示すように、差動マイクの指向性を示すグラフ1180の示す領域は単体マイクの均等特性を示すグラフ1182の示す領域に内包されており、差動マイクは単体マイクに比べ遠方雑音の抑制効果に優れているといえる。
図48(A)(B)は音源の周波数が7kHz、マイク間距離Δrが10mm、マイク−音源間距離がそれぞれ2.5cm及び1mの場合の差動マイクの指向性を示す図である。かかる場合には、図48(B)に示すように、差動マイクの指向性を示すグラフ1200の示す領域は単体マイクの均等特性を示すグラフ1202の示す領域に内包されておらず、差動マイクは単体マイクに比べ遠方雑音の抑制効果に優れているとはいえない。
図49(A)(B)は音源の周波数が7kHz、マイク間距離Δrが20mm、マイク−音源間距離がそれぞれ2.5cm及び1mの場合の差動マイクの指向性を示す図である。かかる場合にも、図49(B)に示すように、差動マイクの指向性を示すグラフ1220の示す領域は単体マイクの均等特性を示すグラフ1222の示す領域に内包されておらず、差動マイクは単体マイクに比べ遠方雑音の抑制効果に優れているとはいえない。
図50(A)(B)は音源の周波数が300Hz、マイク間距離Δrが5mm、マイク−音源間距離がそれぞれ2.5cm及び1mの場合の差動マイクの指向性を示す図である。かかる場合には、図50(B)に示すように、差動マイクの指向性を示すグラフ1240の示す領域は単体マイクの均等特性を示すグラフ1242の示す領域に内包されており、差動マイクは単体マイクに比べ遠方雑音の抑制効果に優れているといえる。
図51(A)(B)は音源の周波数が300Hz、マイク間距離Δrが10mm、マイク−音源間距離がそれぞれ2.5cm及び1mの場合の差動マイクの指向性を示す図である。かかる場合にも、図51(B)に示すように、差動マイクの指向性を示すグラフ1260の示す領域は単体マイクの均等特性を示すグラフ1262の示す領域に内包されており、差動マイクは単体マイクに比べ遠方雑音の抑制効果に優れているといえる。
図52(A)(B)は音源の周波数が300Hz、マイク間距離Δrが20mm、マイク−音源間距離がそれぞれ2.5cm及び1mの場合の差動マイクの指向性を示す図である。かかる場合にも、図52(B)に示すように、差動マイクの指向性を示すグラフ1280の示す領域は単体マイクの均等特性を示すグラフ1282の示す領域に内包されており、差動マイクは単体マイクに比べ遠方雑音の抑制効果に優れているといえる。
マイク間距離が5mmである場合には、図44(B)、図47(B)、図50(B)に示すように音の周波数が1kHz、7kHz、300Hzのいずれの場合についても、差動マイクの指向性を示すグラフの示す領域は単体マイクの均等特性を示すグラフの示す領域に内包されている。すなわちマイク間距離が5mmである場合については音の周波数が7kHz以下の帯域では、差動マイクは単体マイクに比べ遠方雑音の抑制効果に優れているといえる。
ところがマイク間距離が10mmである場合には、図45(B)、図48(B)、図50(B)に示すように音の周波数が7kHzの場合には、差動マイクの指向性を示すグラフの示す領域は単体マイクの均等特性を示すグラフの示す領域に内包されていない。すなわちマイク間距離が10mmである場合については音の周波数が7kHz付近(又は7kHz以上)では、差動マイクは単体マイクに比べ遠方雑音の抑制効果に優れているといえない。
またマイク間距離が20mmである場合には、図46(B)、図49(B)、図52(B)に示すように音の周波数が7kHzの場合には、差動マイクの指向性を示すグラフの示す領域は単体マイクの均等特性を示すグラフの示す領域に内包されていない。すなわちマイク間距離が20mmである場合については音の周波数が7kHz付近(又は7kHz以上)では、差動マイクは単体マイクに比べ遠方雑音の抑制効果に優れているといえない。
差動マイクのマイク間距離を約5mm〜6mm程度(より具体的には5.2mm以下)にすることで、7kHz以下の音については指向性によらず全方位の遠方雑音の抑圧効果が単体マイクに比べ高くなる。従って第1及び第2の振動膜の中心間距離を約5mm〜6mm程度(より具体的には5.2mm以下)にすることで、7kHz以下の音については指向性によらず全方位の遠方雑音を抑圧することが可能な音声入力装置を実現することができる。
なお、この音声入力装置によると、壁などで反射した後に音声入力装置に入射したユーザ音声成分も除去することができる。詳しくは、壁などで反射したユーザ音声の音源は、通常のユーザ音声の音源よりも遠いとみなすことができ、かつ、反射により大きくエネルギーを消失しているため、雑音成分と同様に、第1及び第2の振動膜12,22の間で音圧が大きく減衰することがない。そのため、この音声入力装置によると、壁などで反射した後に音声入力装置に入射するユーザ音声成分も、雑音と同様に(雑音の一種として)除去される。
そして、この音声入力装置を利用すれば、雑音を含まない、入力音声を示す信号を取得することができる。そのため、この音声入力装置を利用することで、精度の高い音声認識や音声認証、コマンド生成処理を実現することができる。
また、この音声入力装置をマイクシステムに適用すれば、スピーカから出力されるユーザの声も、雑音として除去される。そのため、ハウリングが起こりにくいマイクシステムを提供することができる。
5.第2の実施の形態に係る音声入力装置
次に、本発明を適用した第2の実施の形態に係る音声入力装置について、図7を参照して説明する。
本実施の形態に係る音声入力装置は、基部70を含む。基部70の主面72には、凹部74が形成されている。そして、本実施の形態に係る音声入力装置では、凹部74の底面75に第1の振動膜12(第1のマイクロフォン10)が配置され、基部70の主面72に第2の振動膜22(第2のマイクロフォン20)が配置される。なお、凹部74は、主面72に対して垂直に延びていてもよく、凹部74の底面75は、主面72と平行な面であってもよい。底面75は、凹部74と直交する面であってもよい。また、凹部74は、第1の振動膜12と同じ外形をなしていてもよい。
本実施の形態では、凹部74は、領域76と開口78との間隔よりも浅くなっていてもよい。すなわち、凹部74の深さをdとし、領域76と開口78との間隔をΔGとすると、基部70は、d≦ΔGを満たしていてもよい。基部70は、2d=ΔGを満たしていてもよい。なお、ΔGは5.2mm以下であってもよい。あるいは、基部70は、第1及び第2の振動膜12,22の中心間を結ぶ直線距離が5.2mm以下になるように構成されていてもよい。
基部70は、凹部74に連通する開口78が、主面72における第2の振動膜22が配置される領域76よりも、入力音声の音源に近い位置に配置されるように設置される。基部70は、入力音声が、第1及び第2の振動膜12,22に、同時に到着するように設置されていてもよい。例えば、基部70は、入力音声の音源(モデル音源)と第1の振動膜12との間隔が、モデル音源と第2の振動膜22との間隔と同じになるように設置されていてもよい。基部70は、上記の条件を満たすように、基本姿勢が設定された筐体に設置されていてもよい。
本実施の形態に係る音声入力装置によると、第1及び第2の振動膜12,22に入射する入力音声(ユーザの音声)の、入射時間のずれを低減することができる。すなわち、入力音声の位相差成分が含まれないように差分信号を生成することができることから、入力音声の振幅成分を精度よく抽出することが可能になる。
なお、凹部74内では音波は拡散しないため、音波の振幅ほとんど減衰しない。そのため、この音声入力装置では、第1の振動膜12を振動させる入力音声の強度(振幅)は、開口78における入力音声の強度と同じとみなすことができる。このことから、音声入力装置が、入力音声が第1及び第2の振動膜12,22に同時に到達するように構成されている場合でも、第1及び第2の振動膜12,22を振動させる入力音声の強度には差が現れる。そのため、第1及び第2の電圧信号の差を示す差分信号を取得することで、入力音声を抽出することができる。
まとめると、この音声入力装置によると、入力音声の位相差成分に基づくノイズを含まないように、入力音声の振幅成分(差分信号)を取得することができる。そのため、精度の高い雑音除去機能を実現することが可能になる。
なお、凹部74の深さをΔG以下(5.2mm以下)とすることで、凹部74の共振周波数を高く設定することができるため、凹部74で共振ノイズが発生することを防止することができる。
図8には、本実施の形態に係る音声入力装置の変形例を示す。
本実施の形態に係る音声入力装置は、基部80を含む。基部80の主面82には、第1の凹部84と、第1の凹部84よりも浅い第2の凹部86が形成されている。第1及び第2の凹部84,86の深さの差であるΔdは、第1の凹部84に連通する第1の開口85と、第2の凹部86に連通する第2の開口87との間隔であるΔGよりも小さくなっていてもよい。そして、第1の振動膜12は第1の凹部84の底面に配置され、第2の振動膜22は第2の凹部86の底面に配置される。
この音声入力装置であっても、上記と同様の効果を奏するため、精度の高い雑音除去機能を実現することが可能になる。
最後に、図9〜図11に、本発明の実施の形態に係る音声入力装置の例として、携帯電話300、マイク(マイクシステム)400、及び、リモートコントローラ500を、それぞれ示す。また、図12には、情報入力端末としての音声入力装置602と、ホストコンピュータ604とを含む、情報処理システム600の概略図を示す。
6.第3の実施の形態に係る音声入力装置の構成
図13は第3の実施の形態の音声入力装置の構成の一例を示す図である。
第3の実施の形態の音声入力装置700は、第1の振動膜を有する第1のマイクロフォン710−1を含む。また第3の実施の形態の音声入力装置700は、第2の振動膜を有する第2のマイクロフォン710−2を含む。
第1のマイクロフォン710−1の第1の振動膜及び第2のマイクロフォン710−2の第1の振動膜は、差分信号742に含まれる雑音成分の強度の、前記第1又は第2の電圧信号712−1,712−2に含まれる前記雑音成分の強度に対する比率を示す雑音強度比が、前記差分信号742に含まれる入力音声成分の強度の、前記第1又は第2の電圧信号に含まれる前記入力音声成分の強度に対する比率を示す入力音声強度比よりも小さくなるように配置されている。
また第1の振動膜を有する第1のマイクロフォン710−1と第2の振動膜を有する第2のマイクロフォン710−2は図1〜図8で説明したように構成されていても良い。
第3の実施の形態の音声入力装置700は、前記第1のマイクロフォン710−1で取得された第1の電圧信号712−1と、前記第2のマイクロフォンで取得された第2の電圧信号712−2とに基づき第1の電圧信号712−1と第2の電圧信号712−2の差分信号を742生成する差分信号生成部720を含む。
また差分信号生成部720は、遅延部730を含む。遅延部730は、前記第1のマイクロフォンで取得された第1の電圧信号712−1及び前記第2のマイクロフォンで取得された第2の電圧信号712−2の少なくとも一方に所定遅延を与えて出力する。
また差分信号生成部720は、差分信号出力部740を含む。差分信号出力部740は、前記第1のマイクロフォンで取得された第1の電圧信号及び前記第2のマイクロフォンで取得された第2の電圧信号の少なくとも一方は前記遅延部によって遅延を与えられた信号を入力して、第1の電圧信号と第2の電圧信号の差分信号を生成して出力する。
遅延部730は、第1のマイクロフォンで取得された第1の電圧信号712−1に所定遅延を与えて出力する第1の遅延部732−1、第2の電圧信号712−2に所定遅延を与えて出力する第2の遅延部732−2のいずれか一方を設けていずれか一方の電圧信号を遅延させて差分信号を生成してもよい。また第1の遅延部732−1と第2の遅延部732−2の両方を設けて第1の電圧信号712−1と第2の電圧信号712−2の両方を遅延させて差分信号を生成してもよい。第1の遅延部732−1と第2の遅延部732−2の両方を設ける場合にはいずれか一方を固定遅延を与える遅延部として構成し、他方を遅延を可変に調整可能な可変遅延部として構成してもよい。
このようにすると、第1の電圧信号712−1及び第2の電圧信号712−2の少なくとも一方に所定遅延を与えることにより、マイク製造時の個体差に起因する、第1の電圧信号及び第2の電圧信号の遅延のばらつきを補正することができるので、第1の電圧信号及び第2の電圧信号の遅延のばらつきによるノイズ抑制効果の低減を防止することができる。
図14は第3の実施の形態の音声入力装置の構成の一例を示す図である。
本実施の形態の差分信号生成部720は、遅延制御部734を含んで構成してもよい。遅延制御部734は、遅延部(ここでは第1の遅延部732−1)における遅延量を変化させる制御を行う。遅延制御部734で遅延部(ここでは第1の遅延部732−1)の適遅延量をダイナミックにまたはスタティックに制御することで、遅延部出力S1と、前記第2のマイクロフォンで取得された第2の電圧信号712−2との信号遅延バランスを調整してもよい。
図15は遅延部と遅延制御部の具体的構成の一例を示す図である。例えば遅延部(ここでは第1の遅延部732−1)を、群遅延フィルタなどのアナログフィルタで構成してもよい。例えば、遅延制御部734は、群遅延フィルタ732−1のコントロール端子736−GND間の電圧あるいはコントロール端子736−GND間に流れる電流量により、群遅延フィルタの遅延量をダイナミックまたはスタティックに制御するようにしてもよい。
図16(A)(B)は、群遅延フィルタの遅延量をスタティックに制御する構成の一例である。
例えば図16(A)に示すように、複数の抵抗体(r)が直列に接続された抵抗アレーを含み、当該抵抗アレーを介して遅延部の所定の端子(図15のコントロール端子734)に所定の大きさの電流を供給するよう構成してもよい。ここで製造過程において、所定の電流の大きさに応じて、前記抵抗アレーを構成する抵抗体(r)又は導体(738のF)をレーザによるカット、あるいは高電圧または高電流の印加により溶断してもよい。
また例えば図16(B)に示すように、複数の抵抗体(r)が並列に接続された抵抗アレーを含み、当該抵抗アレーを介して遅延部の所定の端子(図15のコントロール端子734)に所定の大きさの電流を供給するよう構成してもよい。ここで製造過程において、所定の電流の大きさに応じて、前記抵抗アレーを構成する抵抗体(r)又は導体(F)をレーザによるカット、あるいは高電圧または高電流の印加により溶断してもよい。
ここで遅延部の所定の端子に流す電流の大きさは、製造段階で生じた遅延のばらつきに基づき、これを解消できる値に設定するとよい。図16(A)(B)のように複数の抵抗体(r)が直列又は並列に接続された抵抗アレーを用いることにより、製造段階で生じた遅延のばらつきに対応した抵抗値を作り込むことができ、所定の端子に接続され、前記遅延部の遅延量を制御する電流を供給する遅延制御部として機能する。
なお上記実施の形態では複数の抵抗体(r)がヒューズ(F)を介して接続されている構成を例にとり説明したがこれに限られない。複数の抵抗(r)がヒューズ(F)を介さずに直列または並列に接続されている構成でもよく、この場合少なくとも1つの抵抗を切断してもよい。
また、例えば図33の抵抗R1又R2を、図40に示すように1つの抵抗体で構成し、抵抗体の一部を切断する、いわゆるレーザートリミングにより抵抗値を調整する構成であっても構わない。
また、抵抗体はマイクロフォン710が搭載される配線基板上に、抵抗体を吹き付ける等により、パターンニングして形成されたプリント抵抗を使用し、トリミングを行うものであって構わない。また、マイクロホンユニットの完成状態で実動作状態でのトリミングを行うためには、マイクロホンユニットの筐体表面に抵抗体を設けることがより好ましい。
図17は第3の実施の形態の音声入力装置の構成の一例を示す図である。
差分信号生成部720は、位相差検出部750を含んで構成してもよい。位相差検出部750は、差分信号出力部740の入力となる第1の電圧信号(S1)と第2の電圧信号(S2)を受け取り、受けとった第1の電圧信号(S1)と第2の電圧信号(S2)に基づいて、差分信号742が生成される際の第1の電圧信号(S1)と第2の電圧信号(S2)の位相差を検出して、検出結果に基づき位相差信号(FD)を生成して出力する。
遅延制御部734は、位相差信号(FD)に基づき、遅延部(ここでは第1の遅延部732−1)における遅延量を変化させるようにしてもよい。
また差分信号生成部720は、ゲイン部760を含んで構成してもよい。ゲイン部760は第1のマイクロフォン710−1で取得された第1の電圧信号及び前記第2のマイクロフォン710−2で取得された第2の電圧信号の少なくとも一方に所定ゲインを与えて出力する。
差分信号出力部740は、第1のマイクロフォン710−1で取得された第1の電圧信号及び前記第2のマイクロフォン710−2で取得された第2の電圧信号の少なくとも一方がゲイン部760によってゲインを与えられた信号(S2)を入力して、第1の電圧信号(S1)と第2の電圧信号(S2)の差分信号を生成して出力してもよい。
例えば位相差検出部740は、遅延部(ここでは第1の遅延部732−1)出力S1とゲイン部出力S2の位相差を演算して位相差信号FDを出力し、遅延制御部734は、位相差信号FDの極性に応じて遅延部(ここでは第1の遅延部732−1)の遅延量をダイナミックに変化させてもよい。
第1の遅延部732−1は第1のマイクロフォン710−1で取得された第1の電圧信号712−1を入力して、遅延制御信号(例えば所定の電流)735に応じて所定の遅延を与えた電圧信号S1を出力する。ゲイン部760は第2のマイクロフォン710−2で取得された第2の電圧信号712−2を入力して、所定のゲインを与えた電圧信号S2を出力する。位相差信号出力部754は、第1の遅延部732−1から出力された電圧信号S1とゲイン部760から出力された電圧信号S2とを入力して位相差信号FDを出力する。遅延制御部734は位相差信号出力部754から出力された位相差信号FDを入力し、遅延制御信号(例えば所定の電流)735を出力する。この遅延制御信号(例えば所定の電流)735によって第1の遅延部732−1の遅延量をコントロールすることで、第1の遅延部732−1の遅延量のフィードバック制御をおこなうようにしてもよい。
図18は第3の実施の形態の音声入力装置の構成の一例を示す図である。
位相差検出部720は、第1の2値化部752−1を含んで構成してもよい。第1の2値化部752−1は、受け取った前記第1の電圧信号S1を所定レベルで2値化して第1のデジタル信号D1に変換する。
また位相差検出部720は、第2の2値化部752−2を含んで構成してもよい。第2の2値化部752−2は、受け取った前記第2の電圧信号S2を所定レベルで2値化して第2のデジタル信号D2に変換する。
位相差検出部720は位相差信号出力部754を含む。位相差信号出力部754は、第1のデジタル信号D1と前記第2のデジタル信号D2との位相差を演算して位相差信号FDを出力する。
第1の遅延部732−1は第1のマイクロフォン710−1で取得された第1の電圧信号712−1を入力して、遅延制御信号(例えば所定の電流)735に応じて所定の遅延を与えた信号S1を出力する。ゲイン部760は第2のマイクロフォン710−2で取得された第2の電圧信号712−2を入力して、所定のゲインを与えた信号S2を出力する。第1の2値化部752−1は、第1の遅延部732−1から出力される第1の電圧信号S1を受け取り、所定レベルで2値化された第1のデジタル信号D1を出力する。第2の2値化部752−2は、ゲイン部760から出力される第2の電圧信号S2を受け取り、所定レベルで2値化された第2のデジタル信号D2を出力する。位相差信号出力部754は、第1の2値化部752−1から出力された第1のデジタル信号D1と第2の2値化部752−2から出力された第2のデジタル信号D2とを入力して位相差信号FDを出力する。遅延制御部734は位相差信号出力部754から出力された位相差信号FDを入力し、遅延制御信号(例えば所定の電流)735を出力する。この遅延制御信号(例えば所定の電流)735によって第1の遅延部732−1の遅延量をコントロールすることで、第1の遅延部732−1の遅延量のフィードバック制御をおこなうようにしてもよい。
図19は、位相差検出部のタイミングチャートである。S1は第1の遅延部732−1から出力される電圧信号であり、S2はゲイン部から出力される電圧信号である。電圧信号S2は電圧信号S1に対して、Δφだけ位相が遅れているとする。
D1は電圧信号S1の2値化信号であり、D2は電圧信号S2の2値化信号である。例えば、D1あるいはD2の信号は、電圧信号S1あるいはS2に対しハイパスフィルターを通した後、コンパレータ回路で2値化することで得られる。
FDは2値化信号D1と2値化信号D2に基づき生成される位相差信号である。例えば図19に示すように第1の電圧信号の位相が第2の電圧信号の位相に比べて進んでいる場合には進み位相差に応じたパルス幅の正のパルスPを各周期毎に生成し、第1の電圧信号の位相が第2の電圧信号の位相に比べて遅れている場合には遅れ位相差に応じたパルス幅の負のパルスを各周期毎に生成してもよい。
図21は第3の実施の形態の音声入力装置の構成の一例を示す図である。
位相差検出部750は、第1のバンドパスフィルタ756−1を含む。第1のバンドパスフィルタ756−1は受け取った第1の電圧信号S1を入力して所定の単一周波数の信号K1を通過させるバンドパスフィルタである。
位相差検出部750は、第2のバンドパスフィルタ756−2を含む。第2のバンドパスフィルタ756−2は受け取った第2の電圧信号S2を入力して所定の単一周波数の信号K2を通過させるバンドパスフィルタである。
位相差検出部750は、第1のバンドパスフィルタ756−1及び第2のバンドパスフィルタ756−2通過後の第1の電圧信号K1と第2の電圧信号K2に基づき位相差を検出してもよい。
例えば図20に示すように音源部770を第1のマイクロフォン710−1および第2のマイクロフォン710−2から等距離の位置に配置し、単一周波数の音を発生させて受音し、該単一周波数の音以外の周波数の音を第1のバンドパスフィルタ756−1と第2のバンドパスフィルタ756−2でカットしたあと位相差を検出することで、位相比較信号のSN比を改善し、位相差または遅延量を精度良く検出することができる。
なお音声入力装置自体が音源部770を有していない場合でも、テスト時に音声入力装置の近傍にテスト用音源を一時的に設置して、第1のマイクロフォンと第2のマイクロフォンに対して音が同位相で入力されるように設定し、第1のマイクロフォンと第2のマイクロフォンで受音して、出力される第1の電圧信号と第2の電圧信号の波形をモニタして両者の位相が一致するように遅延部の遅延量を変更してもよい。
第1の遅延部732−1は第1のマイクロフォン710−1で取得された第1の電圧信号712−1を入力して、遅延制御信号(例えば所定の電流)735に応じて所定の遅延を与えた信号S1を出力する。ゲイン部760は第2のマイクロフォン710−2で取得された第2の電圧信号712−2を入力して、所定のゲインを与えた信号S2を出力する。第1のバンドパスフィルタ756−1は第1の遅延部732−1から出力される第1の電圧信号S1を受け取り、単一周波数の信号K1を出力する。第2のバンドパスフィルタ756−2はゲイン部760から出力される第2の電圧信号S2を受け取り、単一周波数の信号K2を出力する。第1の2値化部752−1は、第1のバンドパスフィルタ756−1から出力される単一周波数の信号K1を受け取り、所定レベルで2値化された第1のデジタル信号D1を出力する。第2の2値化部752−2は、第2のバンドパスフィルタ756−2から出力される単一周波数の信号K2を受け取り、所定レベルで2値化された第2のデジタル信号D2を出力する。位相差信号出力部754は、第1の2値化部752−1から出力された第1のデジタル信号D1と第2の2値化部752−2から出力された第2のデジタル信号D2とを入力して位相差信号FDを出力する。遅延制御部734は位相差信号出力部754から出力された位相差信号FDを入力し、遅延制御信号(例えば所定の電流)735を出力する。この遅延制御信号(例えば所定の電流)735によって第1の遅延部732−1の遅延量をコントロールすることで、第1の遅延部732−1の遅延量のフィードバック制御をおこなうようにしてもよい。
図22(A)(B)は差動マイクの指向性について説明するための図である。
図22(A)は2つのマイクM1、M2の位相がずれていない状態での指向特性を表している。円状の領域810−1と、810−2は、両マイクM1、M2の出力の差分により得られる指向特性を示しており、両マイクM1、M2を結ぶ直線方向を0度、180度とし、両マイクM1、M2を結ぶ直線方向と直角な方向を90度、270度とすると、0度、180度方向に最大感度を有し、90度、270度方向に感度を持たない両指向性であることを表している。
両マイクM1、M2でとらえた信号の一方に遅延を与えた場合、指向特性が変化する。例えば、マイクM1の出力に対し、マイク間隔dを音速cで除算した時間に相当する遅延を与えた場合、両マイクM1、M2の指向性を示す領域は図22(B)の820に示すようなカーディオイド型になる。このような場合、0度の話者方向に対して感度のない(ヌル)指向特性を実現でき、話者の音声を選択的にカットして周囲の音(周囲の雑音)のみをとらえることができる。
上記の特性を利用して周囲の雑音レベルの状態を検出することができる。
図23は、ノイズ検出手段を備えた音声入力装置の構成の一例を示す図である。
本実施の形態の音声入力装置は、ノイズ検出用遅延部780を含む。ノイズ検出用遅延部780は、第2のマイクロフォン710−2で取得された第2の電圧信号712−2にノイズ検出用の遅延を与えて出力する。
本実施の形態の音声入力装置は、ノイズ検出用差分信号生成部782を含む。ノイズ検出用差分信号生成部782は、ノイズ検出用遅延部780によってノイズ検出用の所定の遅延を与えられた信号781と、前記第1のマイクロフォン710−1で取得された第1の電圧信号712−1との差を示すノイズ検出用の差分信号783を生成する。
本実施の形態の音声入力装置は、ノイズ検出部784を含む。ノイズ検出部784は、ノイズ検出用の差分信号783に基づきノイズのレベルを判定し、判定結果に基づきノイズ検出信号785を出力する。ノイズ検出部784は、ノイズ検出用の差分信号の平均レベルを算出して、平均レベルに基づきノイズ検出用の差分信号785を生成してもよい。
本実施の形態の音声入力装置は、信号切り替え部786を含む。信号切り替え部786は、差分信号生成部720から出力される差分信号742と前記第1のマイクロフォンで取得された第1の電圧信号712−1を受け取り、前記ノイズ検出信号785に基づき第1の電圧信号712−1と前記差分信号742を切り替えて出力する。信号切り替え部786は、ノイズレベルが所定レベル以下の場合は前記第1のマイクロフォンで取得された第1の電圧信号を出力し、前記平均レベルが所定レベルより大きい場合は差分信号を出力するようにしてもよい。このようにすると、静かな環境(ノイズレベルが所定レベル以下)のときは、SNR(Signal to Noise Ratio:SN比)のよいシングルマイクでとらえた音が出力される。また高騒音下の環境(ノイズレベルが所定レベル以上)のときは、雑音除去性能に優れる差動マイクでとらえた音が出力される。
ここで差分信号生成部は、図13,図14、図17、図18、図21で説明した構成でもよいし、従来から知られている一般的な差動マイクの構成でもよい。また第1のマイクロフォン710−1の第1の振動膜と第2のマイクロフォン710−1の第2の振動膜は、前記差分信号742に含まれる雑音成分の強度の、前記第1又は第2の電圧信号に含まれる前記雑音成分の強度に対する比率を示す雑音強度比が、前記差分信号に含まれる入力音声成分の強度の、前記第1又は第2の電圧信号に含まれる前記入力音声成分の強度に対する比率を示す入力音声強度比よりも小さくなるように配置されている構成でもよいし、そのような限定のない他の構成でもよい。
また、前記ノイズ検出用の遅延は、第1および第2の振動版の中心間距離(図20のd参照)を音速で除算した時間でなくてもよい。話者の方向が0度方向でない場合であっても、指向特性の感度のない方向(ヌル)を話者方向に設定できれば、話者音声をカットして周囲の雑音をひろうような指向性をもつノイズ検出に適した特性を実現することができる。例えば、ハイパーカーディオイド、スーパーカーディオイド型の指向特性を持つように遅延を設定して、話者音声をカットするものであって構わない。
差分信号生成部720は第1のマイクロフォン710−1で取得された第1の電圧信号712−1を第2のマイクロフォン710−2で取得された第2の電圧信号712−2を入力して、差分信号742を生成して出力する。
ノイズ検出用遅延部780は、第2のマイクロフォン710−2で取得された第2の電圧信号712−2を入力してノイズ検出用の遅延を与えた信号781を出力する。ノイズ検出用差分信号生成部782は、ノイズ検出用遅延部780によってノイズ検出用の所定の遅延を与えられた信号781と、前記第1のマイクロフォン710−1で取得された第1の電圧信号712−1との差を示すノイズ検出用の差分信号783を生成して出力する。ノイズ検出部784はノイズ検出用の差分信号783を入力して、ノイズ検出用の差分信号783に基づきノイズのレベルを判定し、判定結果に基づきノイズ検出信号785を出力する。
信号切り替え部786は、差分信号生成部720から出力される差分信号742と前記第1のマイクロフォンで取得された第1の電圧信号712−1とノイズ検出信号785を入力し、ノイズ検出信号785に基づき第1の電圧信号712−1と前記差分信号742を切り替えて出力する。
図24はノイズ検出による信号切り替えの動作例を示すフローチャートである。
ノイズ検出部から出力されるノイズ検出信号が所定のしきい値(LTH)よりの小さい場合には(ステップS110)信号切り替え部はシングルマイクの信号を出力し(ステップS112)、ノイズ検出部から出力されるノイズ検出信号が所定のしきい値(LTH)よりの小さくない場合には(ステップS110)信号切り替え部は差動マイクの信号を出力する(ステップS114)。
なお音情報を出力するスピーカを有する音声入力装置においては、ノイズ検出信号に基づきスピーカの音量を制御する音量制御部を含むようにしてもよい。
図25はノイズ検出によるスピーカの音量制御の動作例を示すフローチャートである。
ノイズ検出部から出力されるノイズ検出信号が所定のしきい値(LTH)よりの小さい場合には(ステップS120)スピーカの音量を第1の値に設定し(ステップS122)、ノイズ検出部から出力されるノイズ検出信号が所定のしきい値(LTH)よりの小さくない場合には(ステップS120)スピーカの音量を第1のより大きな音量の第2の値に設定する(ステップS124)。
またノイズ検出部から出力されるノイズ検出信号が所定のしきい値(LTH)よりの小さい場合にはスピーカの音量を下げ、ノイズ検出部から出力されるノイズ検出信号が所定のしきい値(LTH)よりの小さくない場合にはスピーカの音量を上げるようにしてもよい。
図26は、AD変換手段を備えた音声入力装置の構成の一例を示す図である。
本実施の形態の音声入力装置は、第1のAD変換手段790−1を含んで構成してもよい。第1のAD変換手段790−1は、第1のマイクロフォン710−1で取得された第1の電圧信号712−1をアナログ・デジタル変換する。
本実施の形態の音声入力装置は、第2のAD変換手段790−2を含んで構成してもよい。第2のAD変換手段790−2は、第2のマイクロフォン710−2で取得された第2の電圧信号712−2をアナログ・デジタル変換する。
本実施の形態の音声入力装置は、差分信号生成部720を含む。差分信号生成部720は、第1のAD変換手段790−1によってデジタル信号に変換された前記第1の電圧信号782−1と、前記第2のAD変換手段790−2によってデジタル信号に変換された前記第2の電圧信号782−2とに基づき第1の電圧信号と第2の電圧信号の差分信号742を生成してもよい。
ここで差分信号生成部720は、図13,図14、図17、図18、図21で説明した構成でもよい。差分信号生成部720の遅延は、第1のAD変換手段790−1や第2のAD変換手段790−2のアナログ・デジタル変換の変換周期の整数倍に設定してもよい。このようにすると遅延部は入力信号をデジタル的に1クロック又は数クロック分、フリップフロップでずらすことで遅延を実現することができる。
また第1のマイクロフォン710−1の第1の振動膜と第2のマイクロフォン710−2の第2の振動膜の中心間距離は、アナログ・デジタル変換の変換周期に音速を乗じた値もしくはその整数倍に設定してもよい。
このようにするとノイズ検出用遅延部では、入力電圧信号をnクロック(nは整数)ずらすという簡単な動作で、周囲のノイズを拾うのに都合の良い指向特性(例えば、カーディオイド型)を精度良く実現することができる。
例えばアナログ・デジタル変換の際のサンプリング周波数が44.1kHzの場合には第1および第2の振動板の中心間距離は約7.7mm程度となり、サンプリング周波数が16kHzの場合には第1および第2の振動版の中心間距離は約21mm程度となる。
図27はゲイン調整手段を備えた音声入力装置の構成の一例を示す図である。
本実施の形態の音声入力装置の差分信号生成部720は、ゲイン制御部910を含む。ゲイン制御部910は、ゲイン部760における増幅率(ゲイン)を変化させる制御を行う。ゲイン制御部910で振幅差検出部が出力する振幅差信号ADに基づきゲイン部760の増幅率をダイナミックに制御することで、第1のマイクロフォン710−1で取得された第1の電圧信号712−1と第2のマイクロフォン710−2で取得された第2の電圧信号712−2との振幅のバランスを調整してもよい。
差分信号生成部720は、第1の振幅検出手段920−1を含む。第1の振幅検出手段920−1は第1の遅延部732−1の出力信号S1の振幅を検出して第1の振幅信号A1を出力する。
差分信号生成部720は、第2の振幅検出手段920−2を含む。第2の振幅検出手段920−2はゲイン部760の出力信号S2の振幅を検出して第2の振幅信号A2を出力する。
差分信号生成部720は、振幅差検出部930を含む。振幅差検出部930は第1の振幅検出手段920−1が出力した第1の振幅信号A1及び第2の振幅検出手段920−2が出力した第2の振幅信号A2を入力して、これらの振幅差を求めて振幅差信号ADを出力する。この振幅差信号ADによってゲイン部760のゲインをコントロールすることで、ゲイン部760のゲインのフィードバック制御をおこなうようにしてもよい。
7.第4の実施の形態に係る音声入力装置の構成
図28、29は第4の実施の形態の音声入力装置の構成の一例を示す図である。
第4の実施の形態の音声入力装置700は、第1の振動膜を有する第1のマイクロフォン710−1を含む。また第4の実施の形態の音声入力装置700は、第2の振動膜を有する第2のマイクロフォン710−2を含む。
第1のマイクロフォン710−1の第1の振動膜及び第2のマイクロフォン710−2の第1の振動膜は、差分信号742に含まれる雑音成分の強度の、前記第1又は第2の電圧信号712−1,712−2に含まれる前記雑音成分の強度に対する比率を示す雑音強度比が、前記差分信号742に含まれる入力音声成分の強度の、前記第1又は第2の電圧信号に含まれる前記入力音声成分の強度に対する比率を示す入力音声強度比よりも小さくなるように配置されている。
また第1の振動膜を有する第1のマイクロフォン710−1と第2の振動膜を有する第2のマイクロフォン710−2は図1〜図8で説明したように構成されていても良い。
第4の実施の形態の音声入力装置700は、前記第1のマイクロフォン710−1で取得された第1の電圧信号712−1と、前記第2のマイクロフォンで取得された第2の電圧信号712−2とに基づき第1の電圧信号712−1と第2の電圧信号712−2の差分信号を742生成する差分信号生成部720を含む。
また差分信号生成部720は、ゲイン部760を含む。ゲイン部760は、第1のマイクロフォン710−1で取得された第1の電圧信号712−1に所定のゲインで増幅して出力する。
また差分信号生成部720は、差分信号出力部740を含む。差分信号出力部に740は、ゲイン部760によって所定のゲインで増幅された第1の電圧信号S1と、前記第2のマイクロフォンで取得された第2の電圧信号を入力して、所定のゲインで増幅された第1の電圧信号S1と第2の電圧信号の差分信号を生成して出力する。
第1の電圧信号712−1を所定のゲインで増幅する(ゲインを上げる場合もゲインを下げる場合も含む意味である)ことにより、第1の電圧信号及び第2の電圧信号の振幅差が無くなるように補正することができるので、製造ばらつき等に起因する2つのマイクロフォン間の感度差に起因して差動マイクとしてのノイズ抑制効果が劣化するのを防止することができる。
図30、31は第4の実施の形態の音声入力装置の構成の一例を示す図である。
本実施の形態の差分信号生成部720は、ゲイン制御部910を含んで構成してもよい。ゲイン制御部910は、ゲイン部760におけるゲインを変化させる制御を行う。ゲイン制御部910でゲイン部760のゲインをダイナミックにまたはスタティックに制御することで、ゲイン部出力S1と、前記第2のマイクロフォンで取得された第2の電圧信号712−2との振幅のバランスを調整してもよい。
図32はゲイン部とゲイン制御部の具体的構成の一例を示す図である。例えばアナログ信号を処理する場合にはゲイン部760を、オペアンプ(例えば図32に示すような非反
転増幅回路)などのアナログ回路で構成してもよい。抵抗R1、R2の値を変更することにより、又は例えば製造時に所定の値にトリミング設定することで、オペアンプの−端子にかかる電圧をダイナミックまたはスタティックに制御することでオペアンプの増幅率を制御してもよい。
図33(A)(B)は、ゲイン部の増幅率をスタティックに制御する構成の一例である。
例えば図32の抵抗R1又R2は、図33(A)に示すように複数の抵抗が直列に接続された抵抗アレーを含み、当該抵抗アレーを介してゲイン部の所定の端子(図32の−端子)に所定の大きさの電圧をかけるよう構成してもよい。適切な増幅率を求めて、当該増幅率を実現するための抵抗値をとるように、製造段階において、前記抵抗アレーを構成する抵抗体(r)又は導体(912のF)をレーザによるカット、あるいは高電圧または高電流の印加により溶断してもよい。
また、例えば図32の抵抗R1又R2を、図33(B)に示すように複数の抵抗が並列に接続された抵抗アレーを含み、当該抵抗アレーを介してゲイン部の所定の端子(図32の−端子)に所定の大きさの電圧をかけるよう構成してもよい。適切な増幅率を求めて、当該増幅率を実現するための抵抗値をとるように、製造段階において、前記抵抗アレーを構成する抵抗体(r)又は導体(912のF)をレーザによるカット、あるいは高電圧または高電流の印加により溶断してもよい。
ここで適切な増幅値は、製造工程で生じたマイクロフォンのゲインバランスを解消できる値に設定するとよい。図33(A)(B)のように複数の抵抗が直列又は並列に接続された抵抗アレーを用いることにより、製造工程で生じたマイクロフォンのゲインバランスに対応した抵抗値を作り込むことができ、所定の端子に接続され、前記ゲイン部のゲインを制御するゲイン制御部として機能する。
なお上記実施の形態では複数の抵抗体(r)がヒューズ(F)を介して接続されている構成を例にとり説明したがこれに限られない。複数の抵抗(r)がヒューズ(F)を介さずに直列または並列に接続されている構成でもよく、この場合少なくとも1つの抵抗を切断してもよい。
また、例えば図33の抵抗R1又R2を、図40に示すように1つの抵抗体で構成し、抵抗体の一部を切断する、いわゆるレーザートリミングにより抵抗値を調整する構成であっても構わない。
図34は第4の実施の形態の音声入力装置の構成の一例を示す図である。
差分信号生成部720は、振幅差検出部940を含んで構成してもよい。振幅差検出部940は、差分信号出力部740の入力となる第1の電圧信号(S1)と第2の電圧信号(S2)を受け取り、受け取った第1の電圧信号(S1)と第2の電圧信号(S2)に基づいて、差分信号742が生成される際の第1の電圧信号(S1)と第2の電圧信号(S2)の振幅差を検出して、検出結果に基づき振幅差信号942を生成して出力する。
ゲイン制御部910は、振幅差信号942に基づき、ゲイン部760におけるゲインを変化させるようにしてもよい。
振幅差検出部940は、ゲイン部760の出力信号の振幅を検出する第1の振幅検出部と、前記第2のマイクロフォンで取得された第2の電圧信号の信号振幅を検出する第2の振幅検出部922−1と、前記第1の振幅検出部922−2で検出された第1の振幅信号922−1と第2の振幅検出部920−1で検出された第2の振幅信号922−1との差分をとり振幅差信号942を生成する振幅差信号生成部930とを含んで構成してもよい。
第1の振幅検出手段920−1は、ゲイン部760の出力信号S1を入力して振幅を検出し検出結果に基づき第1の振幅信号922−1を出力し、第2の振幅検出手段920−2は、第2のマイクロフォンで取得された第2の電圧信号912−2を入力して振幅を検出し検出結果に基づき第2の振幅信号922−2を出力し、振幅差信号生成部930は、第1の振幅検出手段920−1から出力された第1の振幅信号922−1と第2の振幅信号922−2から出力された第2の振幅信号922−2とを入力して差分をとり振幅差信号942を生成して出力してもよい。
ゲイン制御部910は振幅差信号出力部930から出力された振幅差信号942を入力し、ゲイン制御信号(例えば所定の電流)912を出力する。このゲイン制御信号(例えば所定の電流)912によってゲイン部760のゲインをコントロールすることで、ゲイン部760のゲインのフィードバック制御をおこなうようにしてもよい。
本実施の形態によれば使用時に様々な理由で変化する振幅差をリアルタイムに検出して調整を行うことができる。
前記ゲイン制御部は、ゲイン部の出力信号S1と、前記第2のマイクロフォンで取得された第2の電圧信号712−2(S2)の振幅の差が、いずれかの信号(S1又はS2)に対して所定の割合以下になるように調整してもよい。または所定のノイズ抑圧効果(例えば約10以上)を得るようにゲイン部の増幅率を調整してもよい。
例えば信号S1とS2振幅の差がS1又はS2に対して−3%以上、+3%以下の範囲になるように調整しても良いし、−6%以上、+6%以下の範囲になるようにしても良い。前者の場合ノイズを約10デシベル抑圧することができ、後者の場合ノイズを約6デシベル抑圧することができる。
図35、図36,図37は第4の実施の形態の音声入力装置の構成の一例を示す図である。
差分信号生成部720は、ローパスフィルタ部950を含んで構成してもよい。ローパスフィルタ部950は、差分信号の高域成分をカットする。ローパスフィルタ部950は、1次の遮断特性を有するフィルタを用いてもよい。またローパスフィルタ部950のカットオフ周波数は、1kHz以上、5kHz以下の間のいずれかの値Kに設定してもよい。例えば、ローパスフィルタ部950のカットオフ周波数が1.5以上、2kHz以下程度に設定されていることがより好ましい。
ゲイン部760は第1のマイクロフォン710−1で取得された第1の電圧信号712−1を入力して所定の増幅率(ゲイン)で増幅して、所定のゲインで増幅された第1の電圧信号S1を出力する。差分信号出力部740は、ゲイン部760によって所定のゲインで増幅された第1の電圧信号S1と、前記第2のマイクロフォン710−2で取得された第2の電圧信号S2を入力して、所定のゲインで増幅された第1の電圧信号S1と第2の電圧信号の差分信号742を生成して出力する。ローパスフィルタ部950は、差分信号出力部740から出力された差分信号742を入力して、差分信号742に含まれる高域周波数(K以上の帯域の周波数)を減衰させた差分信号952を出力する。
図37は、差動マイクのゲイン特性について説明するための図である。横軸は周波数であり縦軸はゲインである。1020はシングルマイク(単一マイク)の周波数とゲインの関係を示すグラフである。シングルマイクは、フラットな周波数特性を有している。1010は、差動マイクの話者想定位置での周波数とゲインの関係を示すグラフであり、例えば第1のマイクロフォン710−1および第2のマイクロフォン710−2の中心から50mm離れた位置での周波数特性を表している。第1のマイクロフォン710−1および第2のマイクロフォン710−2がフラットな周波数特性であっても、差分信号の高周波数域は約1kHz付近から1次特性(20dB/dec)で上がっていくため、この逆特性を持つ1次のローパスフィルタで高域を減衰させると、差分信号の周波数特性をフラットにすることができ、聴感上の違和感が発生するのを防止することができる。
従って図36で示したように差分信号をローパスフィルタを通して周波数特性を補正することで、1012に示すようにほぼフラットな周波数特性を得ることができる。これにより話者音声の高域あるいはノイズの高域が強調されて耳障りな音質になるのを防止することができる。
図38は、AD変換手段を備えた音声入力装置の構成の一例を示す図である。
本実施の形態の音声入力装置は、第1のAD変換手段790−1を含んで構成してもよい。第1のAD変換手段790−1は、第1のマイクロフォン710−1で取得された第1の電圧信号712−1をアナログ・デジタル変換する。
本実施の形態の音声入力装置は、第2のAD変換手段790−2を含んで構成してもよい。第2のAD変換手段790−2は、第2のマイクロフォン710−2で取得された第2の電圧信号712−2をアナログ・デジタル変換する。
本実施の形態の音声入力装置は、差分信号生成部720を含む。差分信号生成部720は、第1のAD変換手段790−1によってデジタル信号に変換された前記第1の電圧信号782−1と、前記第2のAD変換手段790−2によってデジタル信号に変換された前記第2の電圧信号782−2とに基づき、全てデジタル信号処理演算によりゲインバランス調整および遅延バランス調整を行い、第1の電圧信号と第2の電圧信号の差分信号742を生成してもよい。
ここで差分信号生成部720は、図29,図31、図34、図36等で説明した構成でもよい。
8.第5の実施の形態に係る音声入力装置の構成
図20は第5の実施の形態の音声入力装置の構成の一例を示す図である。
本実施の形態の音声入力装置は第1のマイクロフォン(の第1の振動膜711−1)および前記第2のマイクロフォン(の第2の振動膜711−2)から等距離に設置された音源部770を含んで構成してもよい。音源部770は発振器等で構成することができ、第1のマイクロフォン710−1の第1の振動膜(ダイヤフラム)711−1の中心点C1と第2のマイクロフォン710−2の第2の振動膜(ダイヤフラム)711−2の中心点C2から等距離に設置してもよい。
そして音源部770からの音に基づいて差分信号生成部740の入力となる第1の電圧信号S1と第2の電圧信号S2の位相差あるいは遅延差が零となるように調整してもよい。
また音源部770からの音に基づいてゲイン部760における増幅率を変化させる制御を行うようにしてもよい。
そして音源部770からの音に基づいて差分信号生成部740の入力となる第1の電圧信号S1と第2の電圧信号S2の振幅差が零となるように調整してもよい。
ここで音源部770は、単一周波数の音を発生する音源を用いてもよい。例えば1kHzの音を発生させてもよい。
また音源部770の周波数は、可聴帯域外に設定してもよい。例えば20kHzより高い周波数(例えば30kHz)の音を使用すれば人間の耳には聞こえない。音源部770の周波数を可聴帯域外に設定すると、ユーザ使用時においても支障をきたすことなく音源部770を用いて入力信号の位相差あるいは遅延差、および感度(ゲイン)差を調整することができる。
例えば遅延部732−1をアナログフィルタで構成する場合、温度特性によって遅延量が変化する場合もあるが、本実施の形態によれば、温度変化等の周囲の環境変化に対応した遅延調整を行うことができる。遅延調整は常時行うようにしてもよいし、間欠的に行うようにしてもよいし、電源投入時等に行うようにしても良い。
9.第6の実施の形態に係る音声入力装置の構成
図39は第6の実施の形態の音声入力装置の構成の一例を示す図である。
本実施の形態の音声入力装置は、第1の振動膜を有する第1のマイクロフォン710−1と、第2の振動膜を有する第2のマイクロフォン710−2と、前記第1のマイクロフォンで取得された第1の電圧信号と、前記第2のマイクロフォンで取得された第2の電圧信号との差を示す差分信号を生成する図示しない差分信号生成部とを含んでおり、前記第1の振動膜及び前記第2の振動膜の少なくとも一方は、膜面に対して垂直になるように設置された筒状の導音管1100を介して音波を取得するように構成してもよい。
導音管1100は、筒の開口部1102からから入力した音波が音響孔714−2を介して外部に漏れないよう第2のマイクロフォン710−2の振動膜まで届くように、振動膜の周囲の基板1110に設置してもよい。このようすると、導音管1100に入った音は減衰することなく第2のマイクロフォン710−2の振動膜に届く。本実施の形態によれば前記第1の振動膜及び前記第2の振動膜の少なくとも一方に導音管を設置することにより、音が振動膜に届くまでの距離を変えることができる。従って遅延バランスのばらつきに応じて、適当な長さ(例えば数ミリ)の導音管を設置することにより遅延を解消することができる。
なお、本発明は、上述の実施の形態に限定されるものではなく、種々の変形が可能である。本発明は、実施の形態で説明した構成と実質的に同一の構成(例えば、機能、方法及び結果が同一の構成、あるいは目的及び効果が同一の構成)を含む。また、本発明は、実施の形態で説明した構成の本質的でない部分を置き換えた構成を含む。また、本発明は、実施の形態で説明した構成と同一の作用効果を奏する構成又は同一の目的を達成することができる構成を含む。また、本発明は、実施の形態で説明した構成に公知技術を付加した構成を含む。
音声入力装置について説明するための図。 音声入力装置について説明するための図。 音声入力装置について説明するための図。 音声入力装置について説明するための図。 音声入力装置を製造する方法について説明するための図。 音声入力装置を製造する方法について説明するための図。 音声入力装置について説明するための図。 音声入力装置について説明するための図。 音声入力装置の一例としての携帯電話を示す図。 音声入力装置の一例としてのマイクを示す図。 音声入力装置の一例としてのリモートコントローラを示す図。 情報処理システムの概略図。 音声入力装置の構成の一例を示す図。 音声入力装置の構成の一例を示す図。 遅延部と遅延制御部の具体的構成の一例を示す図。 図16(A)(B)は、群遅延フィルタの遅延量をスタティックに制御する構成の一例。 音声入力装置の構成の一例を示す図。 音声入力装置の構成の一例を示す図。 位相差検出部のタイミングチャート。 音声入力装置の構成の一例を示す図。 音声入力装置の構成の一例を示す図。 図22(A)(B)は差動マイクの指向性について説明するための図。 ノイズ検出手段を備えた音声入力装置の構成の一例を示す図。 ノイズ検出による信号切り替えの動作例を示すフローチャート。 ノイズ検出によるスピーカの音量制御の動作例を示すフローチャート。 AD変換手段を備えた音声入力装置の構成の一例を示す図。 ゲイン調整手段を備えた音声入力装置の構成の一例を示す図。 音声入力装置の構成の一例を示す図。 音声入力装置の構成の一例を示す図。 音声入力装置の構成の一例を示す図。 音声入力装置の構成の一例を示す図。 ゲイン部とゲイン制御部の具体的構成の一例を示す図。 図33(A)(B)は、ゲイン部の増幅率をスタティックに制御する構成の一例。 音声入力装置の構成の一例を示す図。 音声入力装置の構成の一例を示す図。 音声入力装置の構成の一例を示す図。 音声入力装置の構成の一例を示す図。 AD変換手段を備えた音声入力装置の構成の一例を示す図。 音声入力装置の構成の一例を示す図。 レーザートリミングにより抵抗値を調整する例を示す図。 マイク間距離が5mmの場合のユーザー音声強度比の位相成分の分布の関係について説明するための図。 マイク間距離が10mmの場合のユーザー音声強度比の位相成分の分布について説明するための図。 マイク間距離が20mmの場合のユーザー音声強度比の位相成分の分布について説明するための図。 マイク間距離5mm、音源周波数1kHz、マイク−音源間の距離2.5cm及び1mの場合の差動マイクの指向性について説明するための図。 マイク間距離10mm、音源周波数1kHz、マイク−音源間の距離2.5cm及び1mの場合の差動マイクの指向性について説明するための図。 マイク間距離20mm、音源周波数1kHz、マイク−音源間の距離2.5cm及び1mの場合の差動マイクの指向性について説明するための図。 マイク間距離5mm、音源周波数7kHz、マイク−音源間の距離2.5cm及び1mの場合の差動マイクの指向性について説明するための図。 マイク間距離10mm、音源周波数7kHz、マイク−音源間の距離2.5cm及び1mの場合の差動マイクの指向性について説明するための図。 マイク間距離20mm、音源周波数7kHz、マイク−音源間の距離2.5cm及び1mの場合の差動マイクの指向性について説明するための図。 マイク間距離5mm、音源周波数300Hz、マイク−音源間の距離2.5cm及び1mの場合の差動マイクの指向性について説明するための図。 マイク間距離10mm、音源周波数300Hz、マイク−音源間の距離2.5cm及び1mの場合の差動マイクの指向性について説明するための図。 マイク間距離20mm、音源周波数300Hz、マイク−音源間の距離2.5cm及び1mの場合の差動マイクの指向性について説明するための図。
符号の説明
1…音声入力装置、 10…第1のマイクロフォン、 12…第1の振動膜、 20…第2のマイクロフォン、 22…第2の振動膜、 30…差分信号生成部、 40…筐体、 50…演算処理部、 60…通信処理部、 70…基部、 72…主面、 74…凹部、 75…底面、 76…領域、 78…開口、 80…基部、 82…主面、 84…第1の凹部、 85…第1の開口、 86…第2の凹部、 87…第2の開口、 100…コンデンサ型マイクロフォン、 102…振動膜、 104…電極、 300…携帯電話、 400…マイク、 500…リモートコントローラ、 600…情報処理システム、 602…情報入力端末、 604…ホストコンピュータ、700 音声入力装置、710−1 第1のマイクロフォン、710−2 第2のマイクロフォン、712−1 第1の電圧信号、712−2 第2の電圧信号、714−1 第1の振動膜、714−2 第2の振動膜、720 差分信号生成回路、730 遅延部、734 遅延制御部、740 差分信号出力部、742 差分信号、750 位相差検出部、752−1 第1の2値化部、752−2 第2の2値化部、754 位相差信号生成部、756−1 第1のバンドパスフィルタ、756−2 第2のバンドパスフィルタ、760 ゲイン部、770 音源部、780 ノイズ検出量遅延部、782 ノイズ検出用差分信号生成部、784 ノイズ検出部、786 信号切り替え部、790−1 第1のAD変換手段、790−2 第2のAD変換手段、910 ゲイン制御部、900 振幅差検出部、920−1 第1の振幅検出手段、920−2 第2の振幅検出手段、930 振幅差検出部、1100 導音管

Claims (36)

  1. 第1の振動膜を有する第1のマイクロフォンと、
    第2の振動膜を有する第2のマイクロフォンと、
    前記第1のマイクロフォンで取得された第1の電圧信号と、前記第2のマイクロフォンで取得された第2の電圧信号とに基づき第1の電圧信号と第2の電圧信号の差分信号を生成する差分信号生成部とを含む音声入力装置であって、
    前記第1及び第2の振動膜は、
    前記差分信号に含まれる雑音成分の強度の、前記第1又は第2の電圧信号に含まれる前記雑音成分の強度に対する比率を示す雑音強度比が、前記差分信号に含まれる入力音声成分の強度の、前記第1又は第2の電圧信号に含まれる前記入力音声成分の強度に対する比率を示す入力音声強度比よりも小さくなるように配置され、
    前記差分信号生成部は、
    前記第1のマイクロフォンで取得された第1の電圧信号に所定のゲインを与えるゲイン部と、
    前記ゲイン部によって所定のゲインを与えられた第1の電圧信号と、前記第2のマイクロフォンで取得された第2の電圧信号を入力して、所定のゲインを与えられた第1の電圧信号と第2の電圧信号の差分信号を生成して出力する差分信号出力部とを含むことを特徴とする音声入力装置。
  2. 請求項1において、
    前記差分信号生成部は、
    所定の端子にかかる電圧または流れる電流に応じて増幅率が変化するよう構成されたゲイン部と、
    前記所定の端子にかかる電圧または流れる電流を制御するゲイン制御部を含み、
    前記ゲイン制御部は、
    複数の抵抗が直列または並列に接続された抵抗アレーを含み、前記抵抗アレーを構成する抵抗体又は導体の一部を切断する、もしくは少なくとも1つの抵抗体を含み、該抵抗体の一部を切断することでゲイン部の所定の端子にかかる電圧または流れる電流が変更可能に構成されていることを特徴とする音声入力装置。
  3. 請求項1又は2のいずれかにおいて、
    前記差分信号生成部は、
    前記差分信号出力部の入力となる第1の電圧信号と第2の電圧信号を受け取り、受けとった第1の電圧信号と第2の電圧信号に基づいて、差分信号が生成される際の第1の電圧信号と第2の電圧信号との振幅差を検出して、検出結果に基づき振幅差信号を生成して出力する振幅差検出部と、
    前記振幅差信号に基づき、前記ゲイン部における増幅率を変化させる制御を行うゲイン制御部と、を含むことを特徴とする音声入力装置。
  4. 請求項2又は3のいずれかにおいて、
    前記ゲイン制御部は、
    前記ゲイン部の出力信号と、前記第2のマイクロフォンで取得された第2の電圧信号との振幅の差が、いずれかの信号に対して所定の割合以下になるように、または所定のデシベルのノイズ抑圧効果を得るようにゲイン部の増幅率を制御することを特徴とする音声入力装置。
  5. 請求項3又は4のいずれかにおいて、
    前記第1のマイクロフォンおよび前記第2のマイクロフォンから等距離に設置された音源部を含み、
    前記差分信号生成部は、
    前記音源部からの音に基づいて前記ゲイン部における増幅率を変化させる制御を行うことを特徴とする音声入力装置。
  6. 音声入力装置であって、
    第1の振動膜を有する第1のマイクロフォンと、
    第2の振動膜を有する第2のマイクロフォンと、
    前記第1のマイクロフォンで取得された第1の電圧信号と、前記第2のマイクロフォンで取得された第2の電圧信号とに基づき第1の電圧信号と第2の電圧信号の差分信号を生成する差分信号生成部と、
    前記第1のマイクロフォンおよび前記第2のマイクロフォンから等距離に設置された音源部を含み、
    前記差分信号生成部は、
    前記第1のマイクロフォンで取得された第1の電圧信号に所定のゲインを与えるゲイン部と、
    前記差分信号出力部の入力となる第1の電圧信号と第2の電圧信号を受け取り、受けとった第1の電圧信号と第2の電圧信号に基づいて、差分信号が生成される際の第1の電圧信号と第2の電圧信号との振幅差を検出して、検出結果に基づき振幅差信号を生成して出力する振幅差検出部と、
    前記振幅差信号に基づき、前記ゲイン部における増幅率を変化させる制御を行うゲイン制御部と、を含み、
    前記音源部からの音に基づいて前記第1の電圧信号と第2の電圧信号の振幅が等しくなるように前記ゲイン部における増幅率を調整することを特徴とする音声入力装置。
  7. 請求項5又は6のいずれかにおいて、
    前記音源部は、単一周波数の音を発生する音源であることを特徴とする音声入力装置。
  8. 請求項5乃至7のいずれかにおいて、
    前記音源部の周波数は、可聴帯域外に設定されることを特徴とする音声入力装置。
  9. 請求項7又は8のいずれかにおいて、
    前記振幅差検出部は、
    差分信号出力部の入力となる第1の電圧信号と第2の電圧信号の前記単一周波数近傍帯域を通過させるバンドパスフィルタを含み、
    前記バンドパスフィルタ通過後の前記第1の電圧信号と前記第2の電圧信号との振幅差を検出して、検出結果に基づき振幅差信号を生成することを特徴とする音声入力装置。
  10. 請求項1乃至9のいずれかにおいて、
    前記差分信号生成部は、
    前記差分信号の高域成分をカットするローパスフィルタ部を含むことを特徴とする音声入力装置。
  11. 請求項10において、
    前記ローパスフィルタ部は、1次の遮断特性を有するフィルタであることを特徴とする音声入力装置。
  12. 請求項10又は11のいずれかにおいて、
    前記ローパスフィルタ部のカットオフ周波数は、1kHz以上、5kHz以下のいずれかの値に設定されることを特徴とする音声入力装置。
  13. 請求項1乃至12のいずれかにおいて、
    前記第1の電圧信号をアナログ・デジタル変換する第1のAD変換手段と、
    前記第2の電圧信号をアナログ・デジタル変換する第2のAD変換手段と、をさらに含み、
    前記差分信号生成部は、
    前記第1のAD変換手段によってデジタル信号に変換された前記第1の電圧信号と、前記第2のAD変換手段によってデジタル信号に変換された前記第2の電圧信号と、に基づき第1の電圧信号と第2の電圧信号の差分信号を生成することを特徴とする音声入力装置。
  14. 音声入力装置であって、
    第1の振動膜を有する第1のマイクロフォンと、
    第2の振動膜を有する第2のマイクロフォンと、
    前記第1のマイクロフォンで取得された第1の電圧信号と、前記第2のマイクロフォンで取得された第2の電圧信号との差を示す差分信号を生成する差分信号生成部と、
    を含み、
    前記第1及び第2の振動膜は、前記差分信号に含まれる雑音成分の強度の、前記第1又は第2の電圧信号に含まれる前記雑音成分の強度に対する比率を示す雑音強度比が、前記差分信号に含まれる入力音声成分の強度の、前記第1又は第2の電圧信号に含まれる前記入力音声成分の強度に対する比率を示す入力音声強度比よりも小さくなるように配置されていることを特徴とする音声入力装置。
  15. 請求項1乃至14のいずれかにおいて、
    主面に凹部が形成された基部をさらに含み、
    前記第1の振動膜は前記凹部の底面に設置され、
    前記第2の振動膜は前記主面に設置されていることを特徴とする音声入力装置。
  16. 請求項15において、
    前記基部が、前記凹部に連通する開口が、前記主面における前記第2の振動膜の形成領域よりも、前記入力音声のモデル音源の近くに配置されるように設置されたことを特徴とする音声入力装置。
  17. 請求項1乃至16のいずれかにおいて、
    前記凹部は、前記開口と前記第2の振動膜の形成領域との間隔よりも浅いことを特徴とする音声入力装置。
  18. 請求項1乃至17のいずれかにおいて、
    主面に、第1の凹部と、前記第1の凹部よりも浅い第2の凹部が形成された基部をさらに含み、
    前記第1の振動膜は前記第1の凹部の底面に設置され、
    前記第2の振動膜は前記第2の凹部の底面に設置されていることを特徴とする音声入力装置。
  19. 請求項18において、
    前記基部が、前記第1の凹部に連通する第1の開口が、前記第2の凹部に連通する第2の開口よりも、前記入力音声のモデル音源の近くに配置されるように設置されたことを特徴とする音声入力装置。
  20. 請求項18又は20のいずれかにおいて、
    前記第1及び第2の凹部の深さの差は、前記第1及び第2の開口の間隔よりも小さいことを特徴とする音声入力装置。
  21. 請求項15乃至20のいずれかにおいて、
    前記基部が、前記入力音声が、第1及び第2の振動膜に同時に到着するように設置されたことを特徴とする音声入力装置。
  22. 請求項15乃至21のいずれかにおいて、
    前記第1及び第2の振動膜は、法線が平行になるように配置されていることを特徴とする音声入力装置。
  23. 請求項15乃至22のいずれかにおいて、
    前記第1及び第2の振動膜は、法線が同一直線とならないように配置されていることを特徴とする音声入力装置。
  24. 請求項15乃至23のいずれかにおいて、
    前記第1及び第2のマイクロフォンは、半導体装置として構成されていることを特徴とする音声入力装置。
  25. 請求項15乃至24のいずれかにおいて、
    前記第1及び第2の振動膜の中心間距離は、5.2mm以下であることを特徴とする音声入力装置。
  26. 請求項1乃至請求項25のいずれかにおいて、
    前記振動膜を、SN比が約60デシベル以上の振動子で構成することを特徴とする音声入力装置。
  27. 請求項1乃至請求項26のいずれかにおいて、
    前記第1及び第2の振動膜の中心間距離が、10kHz以下の周波数帯域の音に対して第1の振動膜に入射する音声の音圧の強度に対する第1の振動膜と第2の振動膜に入射する音声の差分音圧の強度の比率である音声強度比の位相成分が0デシベル以下となる距離に設定されていることを特徴とする音声入力装置。
  28. 請求項1乃至請求項27のいずれかにおいて、
    前記第1及び第2の振動膜の中心間距離が、抽出対象周波数帯域の音に対して、前記振動膜を差動マイクとして使用した場合の音圧が全方位において単体マイクとして使用した場合の音圧を上回らない範囲の距離に設定されていることを特徴とする音声入力装置。
  29. 請求項1乃至28のいずれかに記載の音声入力装置と、
    前記差分信号に基づいて、前記音声入力装置に入力された音声情報の解析処理を行う解析処理部と、を含むことを特徴とする情報処理システム。
  30. 請求項1から請求項29のいずれかに記載の音声入力装置と、
    前記差分信号に基づいて、前記音声入力装置に入力された音声情報の解析処理を行うホストコンピュータと、を含み、
    前記通信処理部によって、前記ホストコンピュータとのネットワークを介した通信処理を行うことを特徴とする情報処理システム。
  31. 第1の振動膜を有する第1のマイクロフォンと、第2の振動膜を有する第2のマイクロフォンと、前記第1のマイクロフォンで取得された第1の電圧信号と、前記第2のマイクロフォンで取得された第2の電圧信号との差を示す差分信号を生成する差分信号生成部と、を含む、雑音成分を除去する機能を有する音声入力装置を製造する方法であって、
    前記第1及び第2の振動膜の中心間距離Δrと雑音の波長λとの比率を示すΔr/λの値と、前記差分信号に含まれる前記雑音成分の強度の、前記第1又は第2の電圧信号に含まれる前記雑音成分の強度に対する比率を示す雑音強度比との対応関係を示すデータを用意する手順と、
    前記データに基づいて、前記Δr/λの値を設定する手順と、
    設定された前記Δr/λの値、及び、前記雑音の波長に基づいて、前記中心間距離を設定する手順と、
    を含むことを特徴とする音声入力装置の製造方法。
  32. 請求項31に記載の音声入力装置の製造方法の前記Δr/λの値を設定する手順では、
    前記データに基づいて、前記雑音強度比が、前記差分信号に含まれる入力音声成分の強度の、前記第1又は第2の電圧信号に含まれる前記入力音声成分の強度に対する比率を示す入力音声強度比よりも小さくなるように、前記Δr/λの値を設定することを特徴とする音声入力装置の製造方法。
  33. 請求項31又は32のいずれかに記載の音声入力装置の製造方法において、
    前記入力音声強度比は、前記入力音声の振幅成分に基づく強度比であることを特徴とする音声入力装置の製造方法。
  34. 請求項31乃至33のいずれかに記載の音声入力装置の製造方法において、
    前記雑音強度比は、前記雑音成分の位相差に基づく強度比であることを特徴とする音声入力装置の製造方法。
  35. 請求項31乃至34のいずれかに記載の音声入力装置の製造方法において、
    前記音声入力装置の差分信号生成部は、
    所定の端子にかかる電圧または流れる電流に応じて、前記第1のマイクロフォンで取得された第1の電圧信号に所定ゲインを与えるゲイン部と、
    前記所定の端子にかかる電圧または流れる電流を制御するゲイン制御部と、
    前記ゲイン部によって所定のゲインを与えられた第1の電圧信号と、前記第2のマイクロフォンで取得された第2の電圧信号を入力して、所定のゲインを与えられた第1の電圧信号と第2の電圧信号の差分信号を生成して出力する差分信号出力部とを含んで構成され、
    前記ゲイン制御部を複数の抵抗が直列または並列に接続された抵抗アレーを含むように構成し、前記抵抗アレーを構成する抵抗体又は導体の一部を切断する手順、又は前記ゲイン制御部を少なくとも1つの抵抗体を含むように構成し、該抵抗体の一部を切断する手順のいずれかの手順を含むことを特徴とする音声入力装置の製造方法。
  36. 請求項35に記載の音声入力装置の製造方法のゲイン設定手順において、
    前記第1のマイクロフォンおよび前記第2のマイクロフォンから等距離に音源を設置し、
    前記音源部からの音に基づいて、第1のマイクロフォンおよび前記第2のマイクロフォンかとの振幅差を判定し、当該振幅差が所定の範囲内におさまる抵抗値となるように前記抵抗アレーを構成する抵抗体又は導体の一部、又は前記少なくとも1つの抵抗体の一部を切断することを特徴とする音声入力装置の製造方法。
JP2008132459A 2008-05-20 2008-05-20 音声入力装置及びその製造方法、並びに、情報処理システム Withdrawn JP2009284110A (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP2008132459A JP2009284110A (ja) 2008-05-20 2008-05-20 音声入力装置及びその製造方法、並びに、情報処理システム
US12/994,142 US20110172996A1 (en) 2008-05-20 2009-05-20 Voice input device, method for manufacturing the same, and information processing system
PCT/JP2009/059291 WO2009145096A1 (ja) 2008-05-20 2009-05-20 音声入力装置及びその製造方法、並びに、情報処理システム
CN2009801186556A CN102037738A (zh) 2008-05-20 2009-05-20 声音输入装置及其制造方法、以及信息处理系统
EP09754604A EP2280559A1 (en) 2008-05-20 2009-05-20 Audio input device, method for manufacturing the same, and information processing system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008132459A JP2009284110A (ja) 2008-05-20 2008-05-20 音声入力装置及びその製造方法、並びに、情報処理システム

Publications (1)

Publication Number Publication Date
JP2009284110A true JP2009284110A (ja) 2009-12-03

Family

ID=41376975

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008132459A Withdrawn JP2009284110A (ja) 2008-05-20 2008-05-20 音声入力装置及びその製造方法、並びに、情報処理システム

Country Status (5)

Country Link
US (1) US20110172996A1 (ja)
EP (1) EP2280559A1 (ja)
JP (1) JP2009284110A (ja)
CN (1) CN102037738A (ja)
WO (1) WO2009145096A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014143569A (ja) * 2013-01-24 2014-08-07 Nippon Telegr & Teleph Corp <Ntt> 収音装置及び再生装置

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101777350A (zh) * 2009-12-24 2010-07-14 中兴通讯股份有限公司 抗噪声干扰的音频输入装置及音频噪声干扰的消除方法
CN103858446A (zh) * 2011-08-18 2014-06-11 美商楼氏电子有限公司 用于mems装置的灵敏度调整装置和方法
DE102012215239B4 (de) 2012-08-28 2023-12-21 Robert Bosch Gmbh Bauteil und Verfahren zum Prüfen eines solchen Bauteils
TWI533289B (zh) * 2013-10-04 2016-05-11 晨星半導體股份有限公司 用於降噪的電子裝置、調校系統與方法
US9602930B2 (en) 2015-03-31 2017-03-21 Qualcomm Incorporated Dual diaphragm microphone
CN106323455B (zh) * 2016-08-18 2018-12-04 中国地震局地壳应力研究所 基于mems微气压计的差分式次声波监测仪
WO2018173267A1 (ja) * 2017-03-24 2018-09-27 ヤマハ株式会社 収音装置および収音方法
JP7139628B2 (ja) * 2018-03-09 2022-09-21 ヤマハ株式会社 音処理方法および音処理装置
WO2019178355A1 (en) * 2018-03-16 2019-09-19 Vesper Technologies, Inc. Transducer system with configurable acoustic overload point
KR102477099B1 (ko) 2018-08-21 2022-12-13 삼성전자주식회사 소리 방향 탐지 센서 및 이를 포함하는 전자 장치
CN109756818B (zh) * 2018-12-29 2021-04-06 上海瑾盛通信科技有限公司 双麦克风降噪方法、装置、存储介质及电子设备
CN110970052B (zh) * 2019-12-31 2022-06-21 歌尔光学科技有限公司 降噪方法、装置、头戴显示设备和可读存储介质
CN112073872B (zh) * 2020-07-31 2022-03-11 深圳市沃特沃德信息有限公司 远距离声音放大方法、装置、系统、存储介质及智能设备

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5720088A (en) * 1980-07-10 1982-02-02 Mitsubishi Electric Corp Amplifier for microphone
US5029215A (en) * 1989-12-29 1991-07-02 At&T Bell Laboratories Automatic calibrating apparatus and method for second-order gradient microphone
CA2032080C (en) * 1990-02-28 1996-07-23 John Charles Baumhauer Jr. Directional microphone assembly
AT407815B (de) * 1990-07-13 2001-06-25 Viennatone Gmbh Hörgerät
JPH04181897A (ja) * 1990-11-15 1992-06-29 Ricoh Co Ltd マイクロホン
US5732143A (en) * 1992-10-29 1998-03-24 Andrea Electronics Corp. Noise cancellation apparatus
JP3046203B2 (ja) 1994-05-18 2000-05-29 三菱電機株式会社 ハンズフリー通話装置
JPH08256196A (ja) * 1995-03-17 1996-10-01 Casio Comput Co Ltd 音声入力装置および電話機
JPH09331377A (ja) 1996-06-12 1997-12-22 Nec Corp ノイズキャンセル回路
JP2001186241A (ja) 1999-12-27 2001-07-06 Toshiba Corp 電話端末装置
JP2002218583A (ja) * 2001-01-17 2002-08-02 Sony Corp 音場合成演算方法及び装置
JP2003032779A (ja) * 2001-07-17 2003-01-31 Sony Corp 音処理装置、音処理方法及び音処理プログラム
JP2004129038A (ja) * 2002-10-04 2004-04-22 Sony Corp マイクロホンのレベル調整方法及びマイクロホンのレベル調整装置及び電子機器
JP2005247181A (ja) * 2004-03-05 2005-09-15 Matsushita Electric Ind Co Ltd 車載ハンズフリー装置
JP4390716B2 (ja) * 2005-01-06 2009-12-24 Necエレクトロニクス株式会社 電圧供給回路、マイクユニットおよびマイクユニットの感度調整方法
JP2007129038A (ja) * 2005-11-02 2007-05-24 Sony Corp 半導体装置およびその製造方法
JP4640208B2 (ja) * 2006-02-23 2011-03-02 パナソニック電工株式会社 通話装置
WO2008062848A1 (fr) * 2006-11-22 2008-05-29 Funai Electric Advanced Applied Technology Research Institute Inc. Dispositif d'entrée vocale, procédé de production de ce dernier et système de traitement d'informations
JP2008132459A (ja) 2006-11-29 2008-06-12 Technos Kk 微生物脱臭装置
JP5166117B2 (ja) * 2008-05-20 2013-03-21 株式会社船井電機新応用技術研究所 音声入力装置及びその製造方法、並びに、情報処理システム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014143569A (ja) * 2013-01-24 2014-08-07 Nippon Telegr & Teleph Corp <Ntt> 収音装置及び再生装置

Also Published As

Publication number Publication date
EP2280559A1 (en) 2011-02-02
US20110172996A1 (en) 2011-07-14
WO2009145096A1 (ja) 2009-12-03
CN102037738A (zh) 2011-04-27

Similar Documents

Publication Publication Date Title
WO2009145096A1 (ja) 音声入力装置及びその製造方法、並びに、情報処理システム
JP5166117B2 (ja) 音声入力装置及びその製造方法、並びに、情報処理システム
JP4293377B2 (ja) 音声入力装置及びその製造方法、並びに、情報処理システム
US8180082B2 (en) Microphone unit, close-talking voice input device, information processing system, and method of manufacturing microphone unit
JP5129024B2 (ja) 音声入力装置及び音声会議システム
JP5166122B2 (ja) 音声入力装置
WO2009142250A1 (ja) 集積回路装置及び音声入力装置、並びに、情報処理システム
WO2008062850A1 (fr) Dispositif d&#39;entrée vocale, procédé de production de ce dernier et système de traitement d&#39;informations
JP2008258904A (ja) マイクロフォンユニット、及び、接話型の音声入力装置、並びに、情報処理システム
JP2009005071A (ja) 音声入出力装置及び通話装置
JP5088950B2 (ja) 集積回路装置及び音声入力装置、並びに、情報処理システム
WO2009119852A1 (ja) マイクロフォンユニット、接話型の音声入力装置、情報処理システム、及びマイクロフォンユニットの製造方法
WO2008062848A1 (fr) Dispositif d&#39;entrée vocale, procédé de production de ce dernier et système de traitement d&#39;informations
JP4212635B1 (ja) 音声入力装置及びその製造方法、並びに、情報処理システム
JP5097511B2 (ja) 音声入力装置及びその製造方法、並びに、情報処理システム
JP2009296517A (ja) 音声入力装置及び音声リモコンシステム
JP5097692B2 (ja) 音声入力装置及びその製造方法、並びに、情報処理システム
JP5008638B2 (ja) マイクロフォンユニット、音声入力装置、情報処理システム及びマイクロフォンユニットの製造方法

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20110802