JP2015194753A - マイクロホン装置 - Google Patents

マイクロホン装置 Download PDF

Info

Publication number
JP2015194753A
JP2015194753A JP2015063665A JP2015063665A JP2015194753A JP 2015194753 A JP2015194753 A JP 2015194753A JP 2015063665 A JP2015063665 A JP 2015063665A JP 2015063665 A JP2015063665 A JP 2015063665A JP 2015194753 A JP2015194753 A JP 2015194753A
Authority
JP
Japan
Prior art keywords
microphone
signal processing
omnidirectional
voice
speaker
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2015063665A
Other languages
English (en)
Inventor
陸男 高野
Rikuo Takano
陸男 高野
雅敏 小野
Masatoshi Ono
雅敏 小野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Funai Electric Co Ltd
Original Assignee
Funai Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Funai Electric Co Ltd filed Critical Funai Electric Co Ltd
Priority to JP2015063665A priority Critical patent/JP2015194753A/ja
Priority to US14/669,584 priority patent/US20150281834A1/en
Priority to EP15161387.4A priority patent/EP2925016A3/en
Publication of JP2015194753A publication Critical patent/JP2015194753A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/20Arrangements for obtaining desired frequency or directional characteristics
    • H04R1/32Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
    • H04R1/326Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only for microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/08Mouthpieces; Microphones; Attachments therefor
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/005Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2410/00Microphones
    • H04R2410/01Noise reduction using microphones having different directional characteristics
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2410/00Microphones
    • H04R2410/05Noise reduction with a separate noise microphone

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Otolaryngology (AREA)
  • General Health & Medical Sciences (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
  • Telephone Function (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)

Abstract

【課題】小型化されたマイクロホンユニットにおいても、音声信号処理後の話者音声の品質が低下するのを抑制することが可能なマイクロホン装置を提供する。【解決手段】この携帯情報端末100(マイクロホン装置)は、全指向性マイクロホン61と、指向性感度の相対的に低い方向(Null方向)が話者音声1に向くように配置されることにより指向性感度の相対的に高い方向から環境雑音3が取得されるように構成された双指向性マイクロホン62と、全指向性マイクロホン61により取得される環境雑音3を含む話者音声1から、双指向性マイクロホン62により全指向性マイクロホン61と同じタイミングで取得される環境雑音3を減算して、環境雑音3が低減された話者音声1を抽出する音声信号処理を行う第1音声信号処理部70aと、を備える。【選択図】図2

Description

この発明は、マイクロホン装置に関し、特に、全指向性マイクロホンと指向性マイクロホンとを備えるマイクロホン装置に関する。
従来、全指向性マイクロホンと指向性マイクロホンとを備えるマイクロホン装置が知られている(たとえば、特許文献1参照)。
上記特許文献1には、無指向性(全指向性)マイクロホンと単一指向性マイクロホンとを備えたマイクロホン(マイクロホンユニット)の構成が開示されている。この特許文献1に記載のマイクロホンでは、無指向性(全指向性)マイクロホンを話者音声側(音声信号源側)に向けて音声取得用のマイクロホンとして使用するとともに、単一指向性マイクロホンを環境雑音側(ノイズ源側)に向けて雑音取得用のマイクロホンとして使用するように構成されている。そして、所定のノイズ抑制アルゴリズムに基づく音声信号処理(背景雑音信号の除去処理)が行われることにより、無指向性マイクロホンにより取得された環境雑音を含む話者音声から単一指向性マイクロホンにより取得された環境雑音の推定値が減算されて話者音声が抽出されるように構成されている。なお、単一指向性マイクロホンにおいて感度が相対的に高い方向を環境雑音に向けて雑音を取得するので、感度を必要以上に高める必要がないと考えられる。すなわち、単一指向性マイクロホンを構成する複数の振動膜の間隔を広げる必要がないので、その分、マイクロホンユニットの小型化が図られている。
ここで、ノイズ抑制アルゴリズムに基づく背景雑音信号の除去処理として、主音声(話者音声)と環境雑音とが混在した音声信号スペクトルから、環境雑音スペクトルを減算するスペクトルサブトラクション(SS)法が知られている。スペクトルサブトラクション法では、話者の主音声が途絶えて環境雑音だけが存在する無音区間(主音声のない空き時間)において環境雑音スペクトルを推定しておき、この推定された環境雑音スペクトルをリアルタイムで取得される話者音声と環境騒音とが混じった音声信号スペクトルから減算して話者音声を抽出する。上記特許文献1に記載のマイクロホンでは、一例としてこのスペクトルサブトラクション法を適用することにより、無指向性(全指向性)マイクロホンにより取得された環境雑音を含む話者音声から単一指向性マイクロホンにより取得された環境雑音の推定値(平均値)が減算されて話者音声が抽出されるように構成されている。
特表2005−522078号公報
しかしながら、上記特許文献1に記載されたマイクロホンの構成では、スペクトルサブトラクション法による音声信号処理(背景雑音信号の除去処理)を行うにあたって、環境雑音スペクトルの推定を、話者の主音声(話者音声)の途絶えた無音区間中に平均周波数特性スペクトルとして推定するため、除去される環境雑音スペクトルは、厳密にはリアルタイムに存在する雑音スペクトルとは異なると考えられる。このため、話者音声と環境雑音とが混在した音声信号スペクトルから推定値である環境雑音スペクトルを減算した場合、抽出された話者音声が適切に得られない場合があり、この場合には、音声信号処理後の主音声(話者音声)の品質が低下するという問題点がある。また、従来のスペクトルサブトラクション法では、音声信号スペクトルから推定値として得られた環境雑音スペクトルを減算するため、音声信号処理後の主音声(話者音声)中に含まれる雑音がかえって大きくなる現象(ミッシング現象)を誘発することも懸念される。
この発明は、上記のような課題を解決するためになされたものであり、この発明の1つの目的は、小型化されたマイクロホンユニットにおいても、音声信号処理後の話者音声の品質が低下するのを抑制することが可能なマイクロホン装置を提供することである。
この発明の一の局面によるマイクロホン装置は、全指向性マイクロホンと、指向性マイクロホンと、全指向性マイクロホンにより取得されるデータと指向性マイクロホンにより取得されるデータとの両方が存在する場合に、二つのデータの減算処理を行う第1音声信号処理部と、を備える。なお、本発明における「全指向性マイクロホン」は、指向性を持たないいわゆる無指向性マイクロホンのことを意味する。
この発明の一の局面によるマイクロホン装置では、上記のように、全指向性マイクロホンと、指向性マイクロホンと、全指向性マイクロホンにより取得されるデータと指向性マイクロホンにより取得されるデータとの両方が存在する場合に、これら二つのデータの減算処理を行う第1音声信号処理部とを備えることによって、全指向性マイクロホンが独立的に取得するデータ(環境雑音を含む話者音声)と、指向性マイクロホンがリアルタイムかつ独立的に取得するデータ(環境雑音)とに対して、同時進行的かつ連続的に行われる本発明の「減算処理」に基づいて背景雑音信号の除去を行うことができる。すなわち、従来のスペクトルサブトラクション法を用いて、リアルタイムで取得されるデータ(環境雑音を含む話者音声)から話者音声の途絶えた無音区間中(主音声のない空き時間中)に取得されるデータ(環境雑音)の推定値(平均値)を減算する手法を用いる場合と異なり、環境雑音を含む話者音声から同一時刻に存在する環境雑音を減算して話者音声を抽出することができる分、ありのままに近い主音声(より自然に近い状態の話者音声)を得ることができる。なお、全指向性マイクロホンと、指向性マイクロホンとを備えることによって、環境雑音を取得する指向性マイクロホンの感度を必要以上に高める必要がなくマイクロホン装置を構成するマイクロホンユニットの小型化が図られる。これらにより、小型化されたマイクロホンユニットにおいても、音声信号処理後の話者音声の品質が低下するのを抑制することができる。
また、上記一の局面によるマイクロホン装置では、第1音声信号処理部において、全指向性マイクロホンにより取得されるデータと指向性マイクロホンにより取得されるデータとの両方が存在する場合に、これら二つのデータの減算処理を行うことによって、本発明における「減算処理」は、時々刻々変化するデータ(環境雑音を含む話者音声)を全指向性マイクロホンと指向性マイクロホンとで同時並行的に捕捉し減算して話者音声を抽出することができる分、突発性の非定常雑音を除去することにも適切に対応することができる。すなわち、環境雑音の過渡的変動に対して雑音除去処理を確実に行うことができるので、いわゆるミュージカルノイズ(雑音抑圧の副作用として生じるトーン性の雑音)が極力排除された状態の話者音声を得ることができる。これにより、明瞭性を損なわない話者音声(ミュージカルノイズが排除された話者音声)を得ることができる。また、明瞭性を有する話者音声を提供することができるので、高い音声認識性能のための音源(話者音声)を提供することができる。
上記一の局面によるマイクロホン装置において、好ましくは、指向性マイクロホンまたは全指向性マイクロホンからのデータが入力されデータ処理を行う第2音声信号処理部をさらに備え、第2音声信号処理部からの出力が第1音声信号処理部に入力されるように構成されている。このように構成すれば、全指向性マイクロホンが有する周波数特性と指向性マイクロホンが有する周波数特性とが電気的に略同一の特性に揃えられた状態で、第1音声信号処理部における音声信号処理(全指向性マイクロホンにより取得されるデータと指向性マイクロホンにより取得されるデータとの両方が存在する場合に、これらの二つのデータ間での減算処理(たとえば、話者音声から同じタイミングで取得された環境雑音を減算して話者音声を抽出する処理))を行うことができる。
上記第2音声信号処理部をさらに備える構成において、好ましくは、第2音声信号処理部は、出力レベルを調整する増幅器と、ローパスフィルタ回路との少なくとも一方を含む。このように構成すれば、第2音声信号処理部により、全指向性マイクロホンが有する感度特性(周波数特性)に対して、指向性マイクロホンが有する感度特性(周波数特性)を容易に揃えることができる。すなわち、増幅器とローパスフィルタ回路との少なくとも一方を含む第2音声信号処理部によって、全指向性マイクロホンにより取得された環境雑音を含む話者音声から指向性マイクロホンにより取得された環境雑音を除去するために必要な電気的な条件を容易に得ることができる。
上記第2音声信号処理部をさらに備える構成において、好ましくは、第2音声信号処理部は、全指向性マイクロホンからのデータが入力されるハイパスフィルタ回路を含む。このように構成すれば、第2音声信号処理部により、全指向性マイクロホンが有する感度特性(周波数特性)に対して、指向性マイクロホンが有する感度特性(周波数特性)を容易に揃えることができる。すなわち、ハイパスフィルタ回路を含む第2音声信号処理部によって、全指向性マイクロホンにより取得された環境雑音を含む話者音声から指向性マイクロホンにより取得された環境雑音を除去するために必要な電気的な条件を容易に得ることができる。
上記一の局面によるマイクロホン装置において、好ましくは、第1音声信号処理部は、全指向性マイクロホンにより取得される音声をフーリエ変換したスペクトルから、指向性マイクロホンにより取得される音声をフーリエ変換したスペクトルを減算する信号処理を行うように構成されている。このように構成すれば、全指向性マイクロホンにより取得された音声(環境雑音を含む話者音声)から指向性マイクロホンにより感度よく取得された音声(環境雑音)を減算して話者音声を容易に抽出することができる。
上記一の局面によるマイクロホン装置において、好ましくは、指向性マイクロホンは、双指向性マイクロホンであり、指向性感度の最も低い方向を中心として指向性感度の相対的に高い方向に向かって30度以内の角度範囲で、双指向性マイクロホンが話者音声に向けられるように構成されている。このように構成すれば、双指向性マイクロホンをNull方向を中心に指向性感度の相対的に高い方向に向かう30度以内の非感度域内(Null領域:指向性における感度の得られない角度範囲内)で話者音声に傾けて配置しても、双指向性マイクロホンは話者音声を拾わないとともに、話者音声と直交する方向から双指向性マイクロホンに到来する環境雑音を感度よく取得することができる。このように、指向性感度の最も低い方向(Null方向)を中心として指向性感度の相対的に高い方向に向かって30度以内の角度範囲で双指向性マイクロホンが話者音声に向けられていれば、実使用上、環境雑音を支障なく取得することができる。
上記一の局面によるマイクロホン装置において、好ましくは、指向性マイクロホンは、感度レベルがオフセット可能に構成されている。このように構成すれば、指向性マイクロホンに到来する環境雑音の方向(最大感度が得られる方向から所定の角度だけ傾けられた方向)に起因して指向性マイクロホンの感度が変化(低下)する場合においても、感度レベルをオフセット(増加)させることができるので、環境雑音が到来する方向に応じてマイク感度が変化(低下)するのを抑制することができる。すなわち、環境雑音が指向性マイクロホンに到来する角度に大きく影響を受けることなく、第1音声信号処理部における音声信号処理(話者音声から環境雑音を減算して話者音声を抽出する処理)が有する環境雑音の除去性能を均一化させることができる。
上記一の局面によるマイクロホン装置において、好ましくは、指向性マイクロホンは、一対の振動膜を有するとともに、一対の振動膜の各々に作用する音圧の差分に基づいて音波が検知されるように構成されており、指向性マイクロホンが有する一方側の振動膜は、全指向性マイクロホンの振動膜を兼ねている。このように構成すれば、一対の振動膜の各々に作用する音圧の差分に基づいて音波を検知する構造の指向性マイクロホンを有効に利用して、その片側の振動膜を全指向性マイクロホンの出力としても用いることができるので、指向性マイクロホンとこの指向性マイクロホンを構成しない全指向性マイクロホンとを別々に設ける場合と比較して、マイクロホン装置の部品点数が増加するのを抑制することができる。
この場合、好ましくは、指向性マイクロホンは、各々が振動膜を有する一対の全指向性マイクロホンにより構成される単一指向性マイクロホンであり、単一指向性マイクロホンにおける一対の全指向性マイクロホンは、話者音声の到来方向に向かって列状に配置されている。このように構成すれば、指向性感度の相対的に低い方向(Null領域:指向性における感度の得られない角度範囲)が話者音声の到来方向に向けられ、かつ、指向性感度の相対的に高い方向から環境雑音が取得されるように、単一指向性マイクロホンを容易に配置することができる。
上記一の局面によるマイクロホン装置において、好ましくは、指向性マイクロホンは、一対の音孔の各々を介して互いに反対方向から単一の振動膜に到達する音圧の差分に基づいて音波が検知されるように構成されており、全指向性マイクロホンは、一方の音孔と単一の振動膜の一方側とを接続する音道内に配置されている。このように構成すれば、指向性マイクロホンを構成する音道内(空洞内部)に全指向性マイクロホンを配置することができるので、指向性マイクロホンの外部に全指向性マイクロホンを配置する場合と比較して、指向性マイクロホン内に全指向性マイクロホンを内蔵することができる分、マイクロホン装置内のマイクロホンを構成する部分(マイクロホンユニット)が大型化するのを抑制することができる。
この場合、好ましくは、指向性マイクロホンは、双指向性マイクロホンであり、双指向性マイクロホンにおける一対の音孔は、話者音声の到来方向と交差する方向に沿って列状に配置されている。このように構成すれば、指向性感度の相対的に低い方向(Null領域:指向性における感度の得られない角度範囲)が話者音声の到来方向に向けられ、かつ、指向性感度の相対的に高い方向(話者音声の到来方向と交差する方向)から環境雑音が取得されるように、双指向性マイクロホンを容易に配置することができる。
上記一の局面によるマイクロホン装置において、好ましくは、全指向性マイクロホンにより取得された音が、第1音声信号処理部を介さずに出力されるように構成されている。このように、全指向性マイクロホンにより取得された音(環境雑音を含む話者音声)をそのままスピーカなどから出力させる拡声機能付きのマイクロホン装置に対しても本発明による音声信号処理(全指向性マイクロホンにより取得されるデータ(話者音声)と指向性マイクロホンにより取得されるデータ(環境雑音を含む話者音声)との両方が存在する場合に、これらの二つのデータ間での減算処理を行って環境雑音を減算して話者音声を抽出する処理)の機能を付加することができる。この点で、本発明は、有用性(実用性)が高い。
本発明によれば、上記のように、小型化されたマイクロホンユニットにおいても、音声信号処理後の話者音声の品質が低下するのを抑制することが可能なマイクロホン装置を提供することができる。
本発明の第1実施形態によるマイクロホンユニットが内蔵された携帯情報端末の構成を示した斜視図である。 本発明の第1実施形態によるマイクロホンユニットが内蔵された携帯情報端末の構成を示した下面図である。 本発明の第1実施形態による携帯情報端末におけるマイクロホンユニットの構成を示した上面図である。 本発明の第1実施形態による携帯情報端末におけるマイクロホンユニットが有する指向性パターンに対する話者音声と環境雑音との配置関係を示した概略図である。 本発明の第1実施形態による携帯情報端末におけるマイクロホンユニットと音声信号処理部とのブロック構成を示した図である。 本発明の第1実施形態による携帯情報端末において全指向性マイクロホンが有する感度数特性と、指向性マイクロホンが有する調整前後の感度特性との関係を示した図である。 本発明の第2実施形態によるマイクロホンユニットが内蔵されたタブレット端末の構成を示した斜視図である。 本発明の第2実施形態によるマイクロホンユニットが内蔵されたタブレット端末の構成を示した上面図である。 本発明の第2実施形態によるタブレット端末におけるマイクロホンユニットの構成を示した図である。 本発明の第2実施形態によるタブレット端末におけるマイクロホンユニットが有する指向性パターンに対する話者音声と環境雑音との配置関係を示した概略図である。 本発明の第3実施形態によるタブレット端末におけるマイクロホンユニットの構成を示した図である。 本発明の第4実施形態による携帯情報端末におけるマイクロホンユニットと音声信号処理部とのブロック構成を示した図である。 本発明の第5実施形態による携帯情報端末における増幅率の自動調整に関する制御処理フローを示した図である。 本発明の第1変形例による携帯情報端末におけるマイクロホンユニットと音声信号処理部とのブロック構成を示した図である。 本発明の第2変形例による携帯情報端末におけるマイクロホンユニットと音声信号処理部とのブロック構成を示した図である。
以下、本発明を具体化した実施形態を図面に基づいて説明する。
(第1実施形態)
図1〜図6を参照して、本発明の第1実施形態による携帯情報端末100の構成について説明する。なお、携帯情報端末100は、本発明の「マイクロホン装置」の一例である。
本発明の第1実施形態による携帯情報端末100は、図1に示すように、タッチパネル式の表示部10と、表示部10を取り囲むとともに装置本体の外形を形成する筐体20とを備えている。ここで、携帯情報端末100として、たとえば、スマートフォンが挙げられる。すなわち、携帯情報端末100は、ユーザの指などによる直接的な機器操作によって所定の動作が実行されることに加えて、ユーザ(話者)が発した話者音声1を記録したり、電話回線(無線通信)を介して他の通信機器に話者音声1を発信したりする機能を有している。
携帯情報端末100は、Z方向に厚みD1(たとえば、約6mm)を有して薄板状に形成されている。また、筐体20は、表示部10を露出させる矩形形状を有する開口部21と、開口部21を囲む枠状の上面22(Z1側)と、各々が短手方向(X方向)に延びるとともに上面22と直交する上端面23(Y1側)および下端面24(Y2側)と、各々が長手方向(Y方向)に延びるとともに上面22および上端面23(下端面24)と直交する側端面25(X1側)および側端面26(X2側)とを有している。ここで、上端面23(下端面24)は、たとえば、約60mmの長さ(X方向)を有している。
また、携帯情報端末100は、通話相手先の音声などを出力するスピーカ11と、所定の機器操作を行う際に押下(タッチ)される操作ボタン12とが、上面22の所定位置にそれぞれ設けられている。また、携帯情報端末100は、通信用のケーブル(図示せず)が接続されるコネクタ部13が下端面24のX方向の中央部近傍に設けられている。
また、図1および図2に示すように、筐体20の下端面24の内側に、小型のマイクロホンユニット50(外形を破線で示す)が設けられている。マイクロホンユニット50は、Z方向に約3mmの幅(携帯情報端末100の厚みD1の約半分)を有するとともに、X方向に約7mmの幅を有している。この非常に小型化されたマイクロホンユニット50は、X方向の中心位置がコネクタ部13の中心位置よりも下端面24の一方側(X2側)に所定距離(たとえば、約20mm程度)寄せられた状態で筐体20の内部に収納されている。
また、マイクロホンユニット50は、遠方の環境雑音3を抑圧して近接音(口元の音)のみを捕らえる接話型マイクロホンとして機能するように構成される。その一方で、図2に示すように、話者とマイクロホンユニット50(携帯情報端末100)とが距離L1を有している状態でも話者音声1を拾うことが可能に構成されている。ここで、距離L1は、最大で約250mm(最小値は約40mm程度)を想定している。すなわち、明視距離(ユーザ(話者)が目を疲れさせずに表示部10をはっきり見ることが可能な最短距離)だけ携帯情報端末100が離された状況下でも、マイクロホンユニット50が支障なく話者音声1を拾うことが可能に構成されている。
また、マイクロホンユニット50は、図3に示すように、約1mmの内径を有する一対の音孔51(X1側)および音孔52(X2側)と、音孔51から矢印X2方向に沿って内部を延びる音道53と、音孔52から矢印X1方向に沿って内部を延びる音道54と、音道53および音道54を互いに遮断するように設けられた差動型の振動膜55とを有している。なお、音孔51と音孔52とは、約5mm程度、互いに離間した状態で、話者音声1(図2参照)の到来するZ方向と略直交するX方向に沿って列状に配置されている。また、音孔51および52と、音道53および54と、振動膜55とによって、双指向性マイクロホン62が形成されている。すなわち、一対の音孔51および音孔52を介して入力される音圧の各々は、振動膜55の一方表面(X1側)および他方表面(X2側)へと伝達される。そして、振動膜55が一方表面と他方表面との音圧の差圧によって振動することによって、この振動変化が電気信号として双指向性マイクロホン62から出力される。なお、双指向性マイクロホン62は、本発明の「指向性マイクロホン」の一例である。
また、双指向性マイクロホン62は、図2および図4に示すように、略8の字状の指向性パターン(2点鎖線101により指向性の範囲を示す)を有している。この場合、音孔51および音孔52の中心同士を結ぶ方向(X方向)に対する感度が最も大きく、この方向(X方向)と直交する方向(Z方向)には感度が最も小さくなる(感度がない)ように構成されている。また、図4において、略8の字状の指向性パターンから外れる角度範囲(図において、互いに交差する2本の破線102により挟まれた左右に角度α1を有する領域内)は、音波(音声)の感度を全く持たない方向であり、いわゆるNull領域(非感度域)として知られている。なお、筐体20の下端面24にも約1mmの内径を有する一対の孔24aおよび孔24bが約5mm程度の離間距離を有して形成されている。そして、下端面24における孔24aの裏側に音孔51が重ねられ、孔24bの裏側に音孔52が重ねられるようにしてマイクロホンユニット50は配置されている。
また、図3に示すように、1つの全指向性マイクロホン61(破線で示す)が、音道53の内部空間に組み込まれている。すなわち、マイクロホンユニット50は、全指向性マイクロホン61と、双指向性マイクロホン62とを備えている。なお、全指向性マイクロホン61には、全指向型の振動膜61aが内蔵されており、音道53内において音孔51を介して到来する環境雑音3および話者音声1の両方を同時に取得する機能を有している。そして、全指向性マイクロホン61は、360度の指向性パターン(図4において2点鎖線103により指向性を示す)を有しており、振動膜61aが全方位から同じ感度で音波(音声)を検知して電気信号を出力する機能を有している。なお、全指向性マイクロホン61は、指向性を持たないいわゆる無指向性マイクロホンである。
また、図5に示すように、携帯情報端末100は、マイクロホンユニット50から出力された電気信号(音声信号)に所定の音声信号処理を行うための音声信号処理部70を備えている。すなわち、全指向性マイクロホン61および双指向性マイクロホン62は、それぞれ、音声信号処理部70に電気的に接続されている。そして、音声信号処理部70を通過した電気信号(音声信号)が携帯情報端末100における装置本体側の制御回路部(図示せず)に出力されるように構成されている。
また、音声信号処理部70は、後述する音声信号処理を行うための第1音声信号処理部70a(破線で範囲を示す)と、第1音声信号処理部70aに入力される双指向性マイクロホン62から出力された電気信号(音声信号)に対して所定の音声信号処理(前処理)を行うための第2音声信号処理部70b(破線で範囲を示す)とを有している。
第1音声信号処理部70aは、高速フーリエ変換を行って電気信号(音声信号)の周波数特性(スペクトル)を得るためのFFT(高速フーリエ変換)部71およびFFT(高速フーリエ変換)部72と、減算器73と、逆フーリエ変換を行って周波数特性(スペクトル)から電気信号(音声信号)を得るためのIFFT(高速逆フーリエ変換)部74とによって構成されている。また、全指向性マイクロホン61が、FFT部71に電気的に接続されるとともに、双指向性マイクロホン62が、FFT部72に電気的に接続されている。減算器73は、FFT部71により得られたスペクトルから、FFT部72により得られたスペクトルを取り除く(減算する)役割を有している。また、減算器73の下流側に配置されたIFFT部74は、端子81に接続されている。そして、IFFT部74により得られた音声信号(雑音が低減された後の音声信号)は、端子81を介して装置本体側の制御回路部(図示せず)に出力されるように構成されている。
第2音声信号処理部70bは、双指向性マイクロホン62と第1音声信号処理部70aとの間に配置されている。また、第2音声信号処理部70bは、双指向性マイクロホン62から出力された電気信号(音声信号)の感度レベルを調整するための増幅器75と、増幅器75の下流側に接続されたローパスフィルタ回路76とによって構成されている。すなわち、第2音声信号処理部70bは、双指向性マイクロホン62から出力された電気信号(音声信号)が有する電気的な条件を調整して、第1音声信号処理部70aにおける音声信号処理(背景雑音信号の除去処理)を効果的に得ることを目的に設けられている。
携帯情報端末100では、図1に示すように、全指向性マイクロホン61と双指向性マイクロホン62とを有するマイクロホンユニット50が下端面24の内側の狭小領域に設けられ、かつ、マイクロホンユニット50は、音声信号処理部70を介して装置本体側の制御回路部(図示せず)に接続されている。また、マイクロホンユニット50に内蔵されている双指向性マイクロホン62の向き(略8の字状の指向性パターンの向き)が、音声信号処理部70による音声信号処理(背景雑音信号(ノイズ信号)の除去処理)の効果を適切に得ることを意図した方向に向けられている。これにより、携帯情報端末100においてマイクロホンユニット50によりユーザの音声(話者音声1)が入力された際、以下の音声信号処理(背景雑音信号の除去処理)が行われるように構成されている。
より具体的には、第1実施形態では、図1および図2に示すように、マイクロホンユニット50は、双指向性マイクロホン62が、指向性感度の相対的に低いNull方向(表示部10側が面する矢印Z1方向)が話者(音源)から発せられる話者音声1に向けられることで指向性感度の相対的に高い方向(Z方向と直交するX方向に主に沿った方向)から環境雑音3を取得することが可能なように筐体20内に設置されている。また、マイクロホンユニット50が上記した方向に設置された状態で、図5に示すように、音声信号処理部70(第1音声信号処理部70a)において、全指向性マイクロホン61により取得される環境雑音3を含む話者音声1と、双指向性マイクロホン62により取得される環境雑音3との両方が存在する場合に、これら二つのデータの減算処理(環境雑音3を含む話者音声1から環境雑音3を減算する音声信号処理(背景雑音信号の除去処理))が行われるように構成されている。ここで、全指向性マイクロホン61および双指向性マイクロホン62によりそれぞれ取得されるデータが存在する場合とは、双指向性マイクロホン62により全指向性マイクロホン61と同じタイミングで環境雑音3が取得される場合も含まれる。なお、全指向性マイクロホン61により取得される環境雑音3を含む話者音声1は、本発明の「全指向性マイクロホンにより取得されるデータ」の一例である。また、双指向性マイクロホン62により取得される環境雑音3は、本発明の「指向性マイクロホンにより取得されるデータ」の一例である。
すなわち、第1音声信号処理部70aは、全指向性マイクロホン61により取得される環境雑音3を含む話者音声1をFFT部71にてフーリエ変換してスペクトル空間にマッピングされたスペクトルから、双指向性マイクロホン62により取得される環境雑音3をFFT部72にてフーリエ変換してスペクトル空間にマッピングされたスペクトルを減算器73にて減算する。そして、環境雑音3が低減されたスペクトルをIFFT部74にて逆フーリエ変換して実時間空間に戻す処理が行われて環境雑音3が極力除去された話者音声1を抽出するような音声信号処理を行うように構成されている。
なお、全指向性マイクロホン61は、時々刻々変化する環境雑音3を含んだ話者音声1を拾う。また、双指向性マイクロホン62は、時々刻々変化する環境雑音3を拾う。そして、第1音声信号処理部70aでは、全指向性マイクロホン61が拾った時々刻々変化する環境雑音3を含んだ話者音声1に基づく電気信号(音声信号)と、双指向性マイクロホン62が拾った時々刻々変化する環境雑音3に基づく電気信号(音声信号)とを、各々独立的かつ同時進行的に高速フーリエ変換して連続的なスペクトル減算処理を行っている。そして、連続的なスペクトル減算処理が行われた後の電気信号(音声信号)を高速逆フーリエ変換して話者音声1を抽出している。
なお、一例として、高速フーリエ変換時の処理条件として、フレーム長を5ms、フレーム周期を2.6ms、窓関数をハミング窓として設定した。また、この条件下で、話者(音源)とマイクロホンユニット50との距離L1(図2参照)を約250mm、環境雑音3の音源を双指向性マイクロホン62の最大感度方向(X方向)に沿ってマイクロホンユニット50から約1mだけ離れた位置に配置した。そして、話者(音源)から発せられる話者音声1であって音声信号処理部70(第1音声信号処理部70a)による音声信号処理後の話者音声1を実測した。その結果、話者音声1と環境雑音3のSN比(信号対ノイズ比)が約20dBであり、背景雑音信号の除去処理として良好な結果を得ることが可能であることが分かった。
なお、第1音声信号処理部70aにおいては、スペクトル減算処理時にマイナス値になる場合(所定の周波数において話者音声1が有するスペクトルの大きさよりも環境雑音3が有するスペクトルの大きさが大きい場合)は、減算値を「ゼロ」に置き換えるようにしてもよい。
また、第1実施形態では、第2音声信号処理部70b(図5参照)は、全指向性マイクロホン61が有する周波数特性に対して双指向性マイクロホン62が有する周波数特性を近似させるための音声信号処理を行う機能を有している。すなわち、双指向性マイクロホン62から出力された電気信号(音声信号)は、まず、増幅器75(図5参照)によって最大感度レベルがオフセットされるように構成されている。この場合、双指向性マイクロホン62は、略8の字状の指向性パターン(2点鎖線101)を有しているので、環境雑音3の方向(最大感度が得られるX方向から所定の角度だけZ1方向またはZ2方向に傾けられた方向)により感度が変化する。一例として、最大感度軸(X方向)に対して約45度の方向から到来する環境雑音3は、その感度レベルが全体に約3dB低下する。したがって、環境雑音3の到来方向により感度レベルが異なるのを均一化するためには、感度が約3dB高くオフセットされるように増幅器75の特性が調整されていればよい。また、これにより、環境雑音3が双指向性マイクロホン62に到来する角度に大きく影響を受けることなく、第1音声信号処理部70aにおける音声信号処理(背景雑音信号の除去処理)が有する環境雑音3の除去性能を均一化させることが可能になる。
また、電気信号(音声信号)が増幅器75の下流側のローパスフィルタ回路76(図5参照)を通過することによって、双指向性マイクロホン62が元々有している感度特性(周波数特性)が平坦化されるように構成されている。これにより、ローパスフィルタ回路76通過後の感度特性(周波数特性)は、全指向性マイクロホン61が有する感度特性(周波数特性)により近付けられるように構成されている。
一例として、図6に示すように、まず、全指向性マイクロホン61は、平坦性を有する(周波数に関係なく略一定の感度を有する)周波数特性A(太い実線で示す)を有している。これに対して、双指向性マイクロホン62は、第2音声信号処理部70b(図5参照)に入力される前の元々の状態では、周波数特性B(細い実線で示す)を有している。ここで、折れ曲がる周波数特性Bのうちの特性B1(傾斜した直線部分)は、双指向性マイクロホン62の遠方(約0.5m以上の遠方)からの環境雑音3に対する特性(最大感度)であり、周波数の増加とともに増大(約+6dBの上り勾配)して、約4kHz近辺で全指向性マイクロホン61の周波数特性Aと交差する。また、双指向性マイクロホン62は、低域周波数域では、約0.5kHz以下では、平坦な特性B2になり、そのレベルは、全指向性マイクロホン61の平坦な周波数特性Aよりも約20dB低い状態になっている。
したがって、双指向性マイクロホン62の出力信号を増幅器75(図5参照)に通過させることによって、まず、双指向性マイクロホン62の周波数特性B(特性B2+特性B1)を、全体的に約20dBだけゲイン(利得)を増幅させて、全指向性マイクロホン61の周波数特性Aに近づける。次に、0.5kHzの部分に約−6dBの下り勾配を有するように設定されたローパスフィルタ回路76を入れることによって、周波数特性Bの平坦化が図られる。このようにして、周波数特性Bを周波数特性Aと同じような周波数特性C(太い破線で示す)に調整するように構成されている。第2音声信号処理部70bでは、周波数特性Bから周波数特性Cへと双指向性マイクロホン62の感度特性が変更される。そして、図5に示すように、増幅器75とローパスフィルタ回路76とによる音声信号処理(双指向性マイクロホン62の感度特性が変更処理)の後、第1音声信号処理部70aにおいてスペクトル減算処理が行われる。
このように、全指向性マイクロホン61が有する周波数特性に対して双指向性マイクロホン62が有する周波数特性を近似させるための信号処理が第2音声信号処理部70bにより行われた後、第1音声信号処理部70aにおいて、全指向性マイクロホン61により取得される環境雑音3を含む話者音声1から、双指向性マイクロホン62により取得されかつ第2音声信号処理部70bによる信号処理が行われた後の環境雑音3を減算して、環境雑音3が低減された話者音声1を抽出する音声信号処理(背景雑音信号の除去処理)が行われるように構成されている。
また、第1実施形態では、図4に示すように、双指向性マイクロホン62は、指向性感度の最も低いNull方向(Z方向)を中心軸として最大感度軸(X方向)に向かって一方側(X1側)または他方側(X2側)に30度以内の角度範囲を有して話者音声1に向けられるように構成されている。すなわち、左右に設けられた角度α1の最大値はそれぞれ30度であり、この角度α1の範囲内において話者音声1が双指向性マイクロホン62に到来する(ただし話者音声1は拾われない)ようにマイクロホンユニット50の配置位置が設定されている。
たとえば、図2において、携帯情報端末100の中心位置(X方向)からX2側に約20mm程度寄せられた位置にマイクロホンユニット50が配置されている場合には、距離L1は、約40mm以上確保されていれば上記要件が満たされる。したがって、話者が明視距離(距離L1=約250mm)の位置から話者音声1を発した場合には、話者音声1は、角度α1の範囲内に十分に収まっている状態で環境雑音3のみがマイクロホンユニット50(双指向性マイクロホン62)に拾われる。また、明視距離だけ離れた位置からの話者音声1に対して、環境雑音3は、ほぼ直交する関係にあるので、略Z方向から到来する話者音声1が、X1側またはX2側に回り込んで双指向性マイクロホン62が主として拾う環境雑音3に影響を与えることもない。
実測では、話者音声1の環境雑音3への回り込み(話者音声1の矢印Z2方向から矢印X1方向および矢印X2方向への回り込み)の影響は、約−20dBであり、環境雑音3への影響は無視できる程度と考えられる。その一方で、話者音声1と直交するX1方向またはX2方向から双指向性マイクロホン62に到来する環境雑音3は、感度よく取得される。したがって、指向性感度の最も低いNull方向を中心として最大感度軸(X方向)に向かって一方側または他方側に30度以内の角度範囲で双指向性マイクロホン62が話者音声1に向けられていれば、実使用上、環境雑音3は支障なく取得される。したがって、話者の話者音声1の位置が、携帯情報端末100の表示部10から明視距離(約250mm程度)だけ離れていても、話者音声1と環境雑音3との分離が可能である。
また、さらなる考察として、話者音声1を、マイクロホンユニット50(双指向性マイクロホン62)に近付けるほど、話者音声1の回り込み(図2においては話者音声1の矢印Z2方向から矢印X1方向および矢印X2方向への回り込み)の影響はさらに小さくなる。このため、双指向性マイクロホン62のNull方向を話者音声1に向けた場合の話者音声1から環境雑音3を分離する性能が向上される点は、実験的にも確認済みである。加えて、遠方からの環境雑音3は、周囲の環境の影響を受けて反射および回折などを繰り返すため、双指向性マイクロホン62が有する非感度域(Null方向)の鋭いくびれ形状は緩和される傾向になる。これにより、最大感度軸(X方向)を中心に広い角度に亘って環境雑音3の感度が高まり、双指向性マイクロホン62を雑音センサとして有効に機能させることが可能になる。なお、話者音声1を双指向性マイクロホン62のNull方向の中心から最大感度軸(X方向)方向に±20度程度に傾けて配置しても環境雑音3への影響は約−10dBと小さい。さらには、話者音声1をNull方向の中心から最大感度軸(X方向)方向に±30度程度に傾けて配置しても環境雑音3への影響は約−6dBであり、いずれの条件においても実用上許容範囲であると考えられる。
これにより、携帯情報端末100では、話者(ユーザ)が明視距離程度(約250mm程度)離れた位置から話者音声1を発した場合であっても、マイクロホンユニット50に内蔵されている双指向性マイクロホン62の指向特性(略8の字状の指向性パターン)を考慮した向きが適切に設定され、かつ、双指向性マイクロホン62の指向特性を考慮した向きに合わせるようにして独自の音声信号処理(背景雑音信号の除去処理)が構成された音声信号処理部70を備えているので、話者が発した音声(環境雑音3が元々含まれる話者音声1)から、環境雑音3を明確に区別(判別)するとともに環境雑音3を極力取り除いて、元の話者音声1をありのままに近い状態で抽出することが可能とされている。
また、第1実施形態では、図5に示すように、全指向性マイクロホン61とFFT(高速フーリエ変換)部71との間において全指向性マイクロホン61の出力が分岐される配線77が音声信号処理部70に設けられている。なお、配線77は、端子82に接続されている。これにより、携帯情報端末100では、装置本体側の切替操作などにより、全指向性マイクロホン61により取得された話者音声1が、音声信号処理部70を介さずに装置本体のスピーカ11から拡声された状態で出力されたり、全指向性マイクロホン61により取得された話者音声1が音声信号処理部70を介さずに音声通話として他の通信機器に出力されることも可能に構成されている。第1実施形態における携帯情報端末100は、上記のように構成されている。
第1実施形態では、以下のような効果を得ることができる。
すなわち、第1実施形態では、上記のように、全指向性マイクロホン61と、指向性感度の相対的に低いNull方向が話者音声1に向くことにより指向性感度の相対的に高い方向から環境雑音3を取得する双指向性マイクロホン62と、全指向性マイクロホン61により取得される環境雑音3を含む話者音声1から、双指向性マイクロホン62により取得される環境雑音3を減算して、環境雑音3が低減された話者音声1を抽出する音声信号処理を行う第1音声信号処理部70aとを備える。これにより、全指向性マイクロホン61が独立的に取得する環境雑音3を含む話者音声1と、双指向性マイクロホン62が独立的に取得する環境雑音3との同時進行的かつ連続的な音声信号処理に基づいて背景雑音信号の除去を行うことができる。すなわち、従来のスペクトルサブトラクション法を用いて、リアルタイムで取得される環境雑音3を含む話者音声1から話者音声1の途絶えた無音区間中(主音声のない空き時間中)に取得される環境雑音3の推定値(平均値)を減算する手法を用いる場合と異なり、環境雑音3を含む話者音声1から同一時刻に存在する環境雑音3を減算して話者音声1を抽出することができる分、ありのままに近い主音声(より自然に近い状態の話者音声1)を得ることができる。なお、全指向性マイクロホン61と、指向性感度の相対的に低いNull方向が話者音声1に向くことにより指向性感度の相対的に高い方向から環境雑音3を取得する双指向性マイクロホン62とを備えることによって、環境雑音3を取得する双指向性マイクロホン62の感度を必要以上に高める必要がなく携帯情報端末100を構成するマイクロホンユニット50の小型化が図られる。これらにより、小型化されたマイクロホンユニット50においても、音声信号処理後の話者音声1の品質が低下するのを抑制することができる。
また、第1実施形態では、第1音声信号処理部70aにおいて、全指向性マイクロホン61により取得される環境雑音3を含む話者音声1から、双指向性マイクロホン62により取得される環境雑音3を減算する音声信号処理を行うことによって、第1音声信号処理部70aにより行われる音声信号処理は、時々刻々変化する環境雑音3を含む話者音声1を全指向性マイクロホン61と指向性マイクロホン62とで同時並行的に捕捉し減算して話者音声1を抽出することができる分、突発性の非定常雑音を除去することにも適切に対応することができる。すなわち、環境雑音3の過渡的変動に対して雑音除去処理を確実に行うことができるので、いわゆるミュージカルノイズ(雑音抑圧の副作用として生じるトーン性の雑音)が極力排除された状態の話者音声1を得ることができる。これにより、明瞭性を損なわない話者音声1(ミュージカルノイズが排除された話者音声1)を得ることができる。また、明瞭性を有する話者音声1を提供することができるので、高い音声認識性能のための音源(話者音声1)を提供することができる。
また、第1実施形態では、1つの全指向性マイクロホン61を用いてマイクロホンユニット50を小型に構成しているので、たとえば、複数の振動膜の位相差に基づいて話者音声1の到来方向を判定し、さらには、自己相関演算を実行して話者音声1のスペクトルを判定するような信号処理を極めて短時間で行う必要もない。したがって、処理能力の優れた高性能な信号処理プロセッサ(デジタルシグナルプロセッサ)を携帯情報端末100に搭載する必要もないので、マイクロホンユニット50が搭載された携帯情報端末100を広く市場に普及させることができる。
また、第1実施形態では、全指向性マイクロホン61が有する周波数特性に対して双指向性マイクロホン62が有する周波数特性を近似させるための信号処理を行う第2音声信号処理部70bをさらに備える。そして、第1音声信号処理部70aにおいて、全指向性マイクロホン61により取得される環境雑音3を含む話者音声1から、双指向性マイクロホン62により取得されかつ第2音声信号処理部70bによる信号処理が行われた後の環境雑音3を減算して、環境雑音3が低減された話者音声1を抽出する音声信号処理を行うように構成する。これにより、第2音声信号処理部70bにより、全指向性マイクロホン61が有する周波数特性と双指向性マイクロホン62が有する周波数特性とが電気的に略同一の特性に揃えられた状態で、第1音声信号処理部70aにおける音声信号処理(話者音声1から同じタイミングで取得された環境雑音3を減算して話者音声1を抽出する処理)を行うことができる。
また、第1実施形態では、双指向性マイクロホン62と第1音声信号処理部70aとの間に配置され、出力レベルを調整する増幅器75とローパスフィルタ回路76とがこの順に接続されて第2音声信号処理部70bを構成する。これにより、第2音声信号処理部70bにより、全指向性マイクロホン61が有する感度特性(周波数特性)に対して、双指向性マイクロホン62が有する感度特性(周波数特性)を容易に揃えることができる。すなわち、増幅器75とローパスフィルタ回路76とがこの順に接続された第2音声信号処理部70bによって、全指向性マイクロホン61により取得された環境雑音3を含む話者音声1から双指向性マイクロホン62により取得された環境雑音3を除去するために必要な電気的な条件を容易に得ることができる。
また、第1実施形態では、全指向性マイクロホン61により取得される環境雑音3を含む話者音声1をフーリエ変換したスペクトルから、双指向性マイクロホン62により取得される環境雑音3をフーリエ変換したスペクトルを減算した後、環境雑音3が低減されたスペクトルを逆フーリエ変換して話者音声1を抽出する音声信号処理を行うように第1音声信号処理部70aを構成する。これにより、全指向性マイクロホン61により取得された環境雑音3を含む話者音声1から、双指向性マイクロホン62により感度よく取得された環境雑音3を減算して話者音声1を容易に抽出することができる。
また、第1実施形態では、双指向性マイクロホン62を用いてマイクロホンユニット50を構成する。これにより、双指向性マイクロホン62が有する8の字状の指向性(両指向性)を有効に利用して、環境雑音3を感度よく取得することができる。また、既存の双指向性マイクロホン62を使用して、音声信号処理後の話者音声1の品質が低下するのが抑制可能な携帯情報端末100を容易に得ることができる。
また、第1実施形態では、指向性感度の最も低いZ方向(Null方向)を中心として最大感度軸(X方向)に向かって一方側(X1側)または他方側(X2側)に30度以内の角度範囲(左右に角度α1の範囲)で、双指向性マイクロホン62が話者音声1に向けられるように筐体20内におけるマイクロホンユニット50の配置を構成する。これにより、双指向性マイクロホン62(マイクロホンユニット50)を上記した±30度以内の非感度域(Null領域:指向性における感度の得られない角度範囲)内で話者音声1に傾けて配置しても、双指向性マイクロホン62は話者音声1を拾わないとともに、話者音声1と直交するX1方向およびX2方向から双指向性マイクロホン62に到来する環境雑音3を感度よく取得することができる。このように、指向性感度の最も低いNull方向を中心として最大感度軸(X方向)に向かって一方側または他方側に30度以内の角度範囲で双指向性マイクロホン62が話者音声1に向けられていれば、実使用上、環境雑音3を支障なく取得することができる。
また、第1実施形態では、双指向性マイクロホン62は、最大感度レベルがオフセット可能に構成されている。これにより、8の字状の指向性を有する双指向性マイクロホン62に到来する環境雑音3の方向(最大感度が得られる方向から所定の角度だけ傾けられた方向)に起因して双指向性マイクロホン62の感度が変化(低下)する場合においても、最大感度レベルをオフセット(増加)させることができるので、環境雑音3が到来する方向に応じてマイク感度が変化(低下)するのを抑制することができる。すなわち、環境雑音3が双指向性マイクロホン62に到来する角度に大きく影響を受けることなく、第1音声信号処理部70aにおける音声信号処理(環境雑音3を含む話者音声1から環境雑音3を減算して話者音声1を抽出する処理)が有する環境雑音3の除去性能を均一化させることができる。
また、第1実施形態では、音孔51および音孔52の各々を介して互いに反対方向から単一の振動膜55に到達する音圧の差分に基づいて音波が検知されるように双指向性マイクロホン62を構成する。そして、一方の音孔51と振動膜55の一方側(X1側)とを接続する音道53内に全指向性マイクロホン61を配置するようにマイクロホンユニット50を構成する。これにより、双指向性マイクロホン62を構成する音道53内(空洞内部)に全指向性マイクロホン61を配置することができるので、双指向性マイクロホン62の外部に全指向性マイクロホン61を配置する場合と比較して、双指向性マイクロホン62内に全指向性マイクロホン61を内蔵することができる分、マイクロホンユニット50が大型化するのを抑制することができる。
また、第1実施形態では、双指向性マイクロホン62を構成する一対の音孔51および52を話者音声1の到来するZ方向と略直交するX方向に沿って列状に配置するように構成する。これにより、指向性感度の相対的に低い方向(Null領域:指向性における感度の得られない角度範囲)が話者音声1の到来方向(矢印Z1方向)に向けられ、かつ、指向性感度の相対的に高い方向(話者音声1の到来方向と交差する矢印X1方向および矢印X2方向)から環境雑音3が取得されるように、双指向性マイクロホン62を筐体20の内部に容易に配置することができる。
また、第1実施形態では、全指向性マイクロホン61により取得された話者音声1を、第1音声信号処理部70aを介さずに出力するための配線77および端子82を設ける。このように、環境雑音3を含む話者音声1をそのままスピーカ11などから出力させる拡声機能付きの携帯情報端末100に対しても第1音声信号処理部70aによる音声信号処理(環境雑音3を含む話者音声1から環境雑音3を減算して話者音声1を抽出する処理)の機能を付加することができる。この点で、有用性(実用性)の高い携帯情報端末100を提供することができる。
(第2実施形態)
次に、図1、図5および図7〜図10を参照して、本発明の第2実施形態について説明する。この第2実施形態によるタブレット端末200では、上記第1実施形態と異なり、単一指向性マイクロホン270を使用して、マイクロホンユニット250を構成した例について示す。また、図中において、上記第1実施形態と同様の構成には、上記第1実施形態と同じ符号を付して図示している。なお、タブレット端末200は、本発明の「マイクロホン装置」の一例である。また、単一指向性マイクロホン270は、本発明の「指向性マイクロホン」の一例である。
本発明の第2実施形態によるタブレット端末200は、図7に示すように、タッチパネル式の表示部210と、表示部210を取り囲むとともに装置本体の外形を形成する筐体220とを備えている。ここで、タブレット端末200は、携帯情報端末100(図1参照)よりも大きい。また、タブレット端末200においても、ユーザの指などによる直接的な機器操作によって所定の動作が実行されることに加えて、ユーザ(話者)が発した話者音声1を記録したり、インターネット回線(無線通信)を介して他の通信機器に話者音声1を発信したりする機能を有している。
タブレット端末200は、Z方向に厚みD2(たとえば、約12mm)を有して薄板状に形成されている。また、筐体220は、表示部210を露出させる矩形形状を有する開口部221と、開口部221を囲む枠状の上面222(Z1側)と、各々が長手方向(X方向)に延びるとともに上面222と直交する上端面223(Y1側)および下端面224(Y2側)と、各々が短手方向(Y方向)に延びるとともに上面222および上端面223(下端面224)と直交する側端面225(X1側)および側端面226(X2側)とを有している。ここで、上端面223(下端面224)は、たとえば、約210mmの長さ(X方向)を有している。
また、タブレット端末200は、音声などを出力するスピーカ(図示せず)と、所定の機器操作を行う際に押下(タッチ)される操作ボタン212とが設けられている。また、タブレット端末200は、通信用のケーブル(図示せず)が接続されるコネクタ部213aおよび213bが側端面225に設けられている。
また、図7および図8に示すように、筐体220の上端面223の内側に、小型のマイクロホンユニット250(外形を破線で示す)が設けられている。マイクロホンユニット250は、X方向に約5mmの幅を有するとともに、Z方向に約9mmの幅を有している。この非常に小型化されたマイクロホンユニット250は、X方向の中心位置がタブレット端末200の中心位置に揃えられた状態で筐体220の内部に収納されている。なお、図8では、マイクロホンユニット250の大きさを若干大きめに図示している。
また、マイクロホンユニット250についても、接話型マイクロホンとしての機能と、図8に示すように、話者とマイクロホンユニット250(タブレット端末200)とが距離L2を有している状態で話者音声1を拾う機能とを有して構成されている。この場合も、距離L2は、最大で約250mmを想定している。
また、マイクロホンユニット250は、図9に示すように、基板251に、一組の全指向性マイクロホン261および全指向性マイクロホン265が互いに近接した状態で実装されている。全指向性マイクロホン261は、約1mmの内径を有する音孔262と、全指向型の振動膜263とを有している。同様に、全指向性マイクロホン265は、約0.3mmの内径を有する音孔266と、全指向型の振動膜267とを有している。ここで、音孔266と振動膜267との間には通気性を有する通気性膜(図示せず)が配置されており、音孔266を通過した音圧はこの通気性膜を通過する際に減圧される。また、振動膜263と振動膜267とは、約7mm程度、互いに離間(Z方向)している。これにより、全指向性マイクロホン261と全指向性マイクロホン265とによって、振動膜263に作用する音圧(電気信号)と振動膜267に作用する音圧(電気信号)との差分が得られるとともに、得られた差分(電気信号)に基づいて音波が検知されるように構成されている。すなわち、全指向性マイクロホン261と全指向性マイクロホン265とによって、単一指向性マイクロホン270が構成されている。なお、単一指向性マイクロホン270は、本発明の「指向性マイクロホン」の一例である。
また、単一指向性マイクロホン270は、図8および図10に示すように、カージオイド型の指向性パターン(2点鎖線201により指向性の範囲を示す)を有している。この場合、音孔262および音孔266の中心同士を結ぶ方向(Z方向)のうち、Z2方向に対する感度が最も大きく、反対のZ1方向には感度が最も小さくなる(感度がない)ように構成されている。また、図10において、カージオイド型の指向性パターンから外れる角度範囲(図において、互いに交差する2本の破線202により挟まれた左右に角度α2を有する領域内)は、音波(音声)の感度を全く持たないNull領域である。なお、単一指向性マイクロホン270を構成する一組の全指向性マイクロホン261および全指向性マイクロホン265は、話者音声1に向かうZ方向に沿って列状に配置されている。なお、筐体220の上端面223には、1つの孔223aが形成されている。孔223aは、音孔262と音孔266との中間位置(Z方向)において外部に開口している。そして、マイクロホンユニット250は、音孔262および音孔266が孔223aに重ならない(孔223aから見えない)ようにして上端面223の裏側に配置されている。
また、第2実施形態では、単一指向性マイクロホン270が有する一方側の振動膜263は、全指向性マイクロホン261の振動膜を兼ねている。すなわち、全指向性マイクロホン261は、360度の指向性パターン(図10において2点鎖線203により指向性を示す)を有しており、振動膜263が全方位から同じ感度で音波(音声)を検知して電気信号を出力する機能を有している。
これにより、第2実施形態では、図7および図8に示すように、マイクロホンユニット250は、単一指向性マイクロホン270が、指向性感度の相対的に低いNull方向(表示部210側が面する矢印Z1方向)が話者(音源)から発せられる話者音声1に向けられることで指向性感度の相対的に高い方向(Z1方向と反対のZ2方向に主に沿ったタブレット端末200の裏面側が面する方向)から環境雑音3を取得することが可能なように筐体220内に設置されている。また、マイクロホンユニット250が上記した方向に設置された状態で、図5に示すように、音声信号処理部70(第1音声信号処理部70a)において、全指向性マイクロホン261により取得される環境雑音3を含む話者音声1と、単一指向性マイクロホン270により取得される環境雑音3との両方が存在する場合に、これら二つのデータの減算処理(環境雑音3を含む話者音声1から環境雑音3を減算する音声信号処理(ノイズ低減処理))が行われるように構成されている。ここで、全指向性マイクロホン261および単一指向性マイクロホン270によりそれぞれ取得されるデータが存在する場合とは、単一指向性マイクロホン270により全指向性マイクロホン261と同じタイミングで環境雑音3が取得される場合も含まれる。なお、全指向性マイクロホン261により取得される環境雑音3を含む話者音声1は、本発明の「全指向性マイクロホンにより取得されるデータ」の一例である。また、単一指向性マイクロホン270により取得される環境雑音3は、本発明の「指向性マイクロホンにより取得されるデータ」の一例である。
この場合も、全指向性マイクロホン261は、時々刻々変化する環境雑音3を含んだ話者音声1を拾う。また、単一指向性マイクロホン270は、時々刻々変化する環境雑音3を拾う。そして、第1音声信号処理部70aでは、全指向性マイクロホン261が拾った時々刻々変化する環境雑音3を含んだ話者音声1に基づく電気信号(音声信号)と、単一指向性マイクロホン270が拾った時々刻々変化する環境雑音3に基づく電気信号(音声信号)とを各々独立的かつ同時進行的に高速フーリエ変換して連続的なスペクトル減算処理を行っている。そして、連続的なスペクトル減算処理が行われた後の電気信号(音声信号)を高速逆フーリエ変換して話者音声1を抽出している。
マイクロホンユニット250においては、話者音声1の到来方向と環境雑音3の到来方向とは、互いに反対方向(180度、逆の方向)の配置関係にある。このため、話者音声1が回り込みにより環境雑音3に影響を与えない。実際のところ、ユーザがテレビジョン装置(図示せず)などを視聴しながらタブレット端末200を操作する環境では、環境雑音3と話者音声1との配置関係が、上記した関係に相当する。
これにより、タブレット端末200では、話者(ユーザ)が明視距離程度(約250mm程度)離れた位置から話者音声1を発した場合であっても、マイクロホンユニット250に内蔵されている単一指向性マイクロホン270の指向特性を考慮した向きが適切に設定され、かつ、単一指向性マイクロホン270の指向特性を考慮した向きに合わせるようにして独自の音声信号処理(背景雑音信号の除去処理)が構成された音声信号処理部70を備えているので、話者が発した音声(環境雑音3が元々含まれる話者音声1)から、環境雑音3を明確に区別(判別)するとともに環境雑音3を極力取り除いて元の話者音声1ありのままに近い状態で抽出することが可能とされている。なお、第2実施形態におけるタブレット端末200のその他の構成は、上記第1実施形態と同様である。
第2実施形態では、以下のような効果を得ることができる。
すなわち、第2実施形態では、上記のように、単一指向性マイクロホン270を用いてマイクロホンユニット250を構成する。これにより、単一指向性マイクロホン270が有する指向性(単一指向性)を有効に利用して、環境雑音3を感度よく取得することができる。また、全指向性マイクロホン261が独立的に取得する環境雑音3を含む話者音声1と、単一指向性マイクロホン270が独立的に取得する環境雑音3との同時進行的かつ連続的な音声信号処理に基づいて背景雑音信号の除去を行うことができる。すなわち、環境雑音3を含む話者音声1から同一時刻に存在する環境雑音3を減算して話者音声1を抽出することができる分、ありのままに近い主音声(より自然に近い状態の話者音声1)を得ることができる。したがって、小型化されたマイクロホンユニット250においても、音声信号処理後の話者音声1の品質が低下するのを抑制することができる。また、既存の単一指向性マイクロホン270を使用して、音声信号処理後の話者音声1の品質が低下するのが抑制可能なタブレット端末200を容易に得ることができる。
また、第2実施形態では、一対の振動膜263および振動膜267を有するとともに、一対の振動膜263および振動膜267の各々に作用する音圧の差分に基づいて音波が検知されるように単一指向性マイクロホン270を構成する。そして、単一指向性マイクロホン270が有する一方側の振動膜263は、全指向性マイクロホン261の振動膜263を兼ねている。これにより、一対の振動膜263および振動膜267の各々に作用する音圧の差分に基づいて音波を検知する構造の単一指向性マイクロホン270を有効に利用して、その片側の振動膜263を全指向性マイクロホン261の出力としても用いることができるので、単一指向性マイクロホン270とこの単一指向性マイクロホン270を構成しない全指向性マイクロホン261とを別々に設ける場合と比較して、タブレット端末200の部品点数が増加するのを抑制することができる。
また、第2実施形態では、単一指向性マイクロホン270における一対の全指向性マイクロホン261および265を話者音声1の到来方向に向かうZ方向に沿って列状に配置するように構成する。これにより、指向性感度の相対的に低い方向(Null領域:指向性における感度の得られない角度範囲)が話者音声1の到来方向(矢印Z1方向)に向けられ、かつ、指向性感度の相対的に高い方向(Z2側)から環境雑音3が取得されるように、単一指向性マイクロホン270を筐体220の内部に容易に配置することができる。なお、第2実施形態のその他の効果は、上記第1実施形態と同様である。
(第3実施形態)
次に、図5および図11を参照して、本発明の第3実施形態について説明する。この第3実施形態によるタブレット端末300では、上記第2実施形態と異なり、全指向性マイクロホン261と全指向性マイクロホン265とからなる単一指向性マイクロホン370とは別に、1つの全指向性マイクロホン61を設けてマイクロホンユニット350を構成した例について示す。また、図中において、上記第2実施形態と同様の構成には、上記第2実施形態と同じ符号を付して図示している。なお、タブレット端末300は、本発明の「マイクロホン装置」の一例である。
すなわち、タブレット端末300は、図11に示すように、筐体320の上端面323の内側に小型のマイクロホンユニット350を備えている。マイクロホンユニット350は、単一指向性マイクロホン370と、1つの全指向性マイクロホン61とを有している。また、全指向性マイクロホン61は、単一指向性マイクロホン370とは別に基板351における側方(矢印X2方向側)に配置されている。
これにより、第3実施形態では、マイクロホンユニット350は、単一指向性マイクロホン370が、指向性感度の相対的に低い方向(矢印Z1方向)が話者(音源)から発せられる話者音声1に向けられることで指向性感度の相対的に高い方向(Z1方向と反対のZ2方向に主に沿った方向)から環境雑音3を取得することが可能なように筐体320内に設置されている。また、マイクロホンユニット350が上記した方向に設置された状態で、音声信号処理部70(図5参照)において、全指向性マイクロホン61により取得される環境雑音3を含む話者音声1と、単一指向性マイクロホン370により取得される環境雑音3(単一指向性マイクロホン370により全指向性マイクロホン61と同じタイミングで取得される環境雑音3)との両方が存在する場合に、これら二つのデータの減算処理(環境雑音3を含む話者音声1から環境雑音3を減算する音声信号処理(ノイズ低減処理))が行われるように構成されている。ここで、全指向性マイクロホン61および単一指向性マイクロホン370によりそれぞれ取得されるデータが存在する場合とは、単一指向性マイクロホン370により全指向性マイクロホン61と同じタイミングで環境雑音3が取得される場合も含まれる。なお、単一指向性マイクロホン370により取得される環境雑音3は、本発明の「指向性マイクロホンにより取得されるデータ」の一例である。
この場合も、全指向性マイクロホン61は、時々刻々変化する環境雑音3を含んだ話者音声1を拾う。また、単一指向性マイクロホン370は、時々刻々変化する環境雑音3を拾う。そして、第1音声信号処理部70a(図5参照)では、全指向性マイクロホン61が拾った時々刻々変化する環境雑音3を含んだ話者音声1に基づく電気信号(音声信号)と、単一指向性マイクロホン370が拾った時々刻々変化する環境雑音3に基づく電気信号(音声信号)とを各々独立的かつ同時進行的に高速フーリエ変換して連続的なスペクトル減算処理を行っている。そして、連続的なスペクトル減算処理が行われた後の電気信号(音声信号)を高速逆フーリエ変換して話者音声1を抽出している。
これにより、タブレット端末300では、話者(ユーザ)が明視距離程度(約250mm程度)離れた位置から話者音声1を発した場合であっても、マイクロホンユニット350に内蔵されている単一指向性マイクロホン370の向きが適切に設定され、かつ、単一指向性マイクロホン370の向きに合わせるようにして独自の音声信号処理(背景雑音信号の除去処理)が構成された音声信号処理部70を備えているので、話者が発した音声(環境雑音3が元々含まれる話者音声1)から、環境雑音3を明確に区別(判別)するとともに環境雑音3を極力取り除いて元の話者音声1をありのままに近い状態で抽出することが可能とされている。なお、第3実施形態におけるタブレット端末300のその他の構成は、上記第1実施形態と同様である。
第3実施形態では、以下のような効果を得ることができる。
すなわち、第3実施形態では、上記のように、全指向性マイクロホン61と単一指向性マイクロホン370とを別々に設けてマイクロホンユニット350を構成する。これによっても、全指向性マイクロホン61が独立的に取得する環境雑音3を含む話者音声1と、単一指向性マイクロホン370が独立的に取得する環境雑音3との同時進行的かつ連続的な音声信号処理に基づいて背景雑音信号の除去を行うことができる。すなわち、環境雑音3を含む話者音声1から同一時刻に存在する環境雑音3を減算して話者音声1を抽出することができる分、ありのままに近い主音声(より自然に近い状態の話者音声1)を得ることができる。したがって、小型化されたマイクロホンユニット350においても、音声信号処理後の話者音声1の品質が低下するのを抑制することができる。なお、第3実施形態のその他の効果は、上記第2実施形態と同様である。
(第4実施形態)
次に、図12を参照して、本発明の第4実施形態について説明する。この第4実施形態による携帯情報端末400では、全指向性マイクロホン61と第1音声信号処理部70aとの間に第2音声信号処理部470bを配置して音声信号処理部470を構成した例について示す。また、図中において、上記第1実施形態と同様の構成には、上記第1実施形態と同じ符号を付して図示している。なお、携帯情報端末400は、本発明の「マイクロホン装置」の一例である。
すなわち、図12に示すように、第2音声信号処理部470bは、全指向性マイクロホン61から出力された電気信号(音声信号)の感度レベルを調整するためのハイパスフィルタ回路476を含むように構成されている。
この場合、電気信号(音声信号)がハイパスフィルタ回路476を通過することによって、全指向性マイクロホン61の低周波領域の感度は低下される。したがって、全指向性マイクロホン61の感度特性(周波数特性)を双指向性マイクロホン62の感度特性(周波数特性)に合わせる(近似させる)ように構成されている。全指向性マイクロホン61から出力された電気信号の高周波領域に音声信号の主要部分がある場合や低周波領域の雑音が極めて大きい場合には、感度特性を揃えるためにハイパスフィルタ回路476を設けることが有効に作用する。なお、第4実施形態における携帯情報端末400のその他の構成は、上記第1実施形態と同様である。
第4実施形態では、以下のような効果を得ることができる。
第4実施形態では、上記のように、全指向性マイクロホン61と第1音声信号処理部70aとの間に配置されたハイパスフィルタ回路476により第2音声信号処理部470bを構成する。これにより、第2音声信号処理部470bにより、双指向性マイクロホン62が有する感度特性(周波数特性)に対して、全指向性マイクロホン61が有する感度特性(周波数特性)を容易に揃えることができる。すなわち、ハイパスフィルタ回路476を含む第2音声信号処理部470bによって、全指向性マイクロホン61により取得された環境雑音3を含む話者音声1から双指向性マイクロホン62により取得された環境雑音3を除去するために必要とされる電気的な条件を容易に得ることができる。なお、第4実施形態のその他の効果は、上記第1実施形態と同様である。
(第5実施形態)
次に、図1、図2、図5および図13を参照して、本発明の第5実施形態について説明する。この第5実施形態による携帯情報端末500では、双指向性マイクロホン62の感度レベルをオフセットして環境雑音3の感度の角度依存性を低減させた携帯情報端末100(第1実施形態)とは異なる処理演算を用いて指向性マイクロホンの感度の角度依存性を低減させるように構成した例について示す。また、図中において、上記第1実施形態と同様の構成には、上記第1実施形態と同じ符号を付して図示している。なお、携帯情報端末500は、本発明の「マイクロホン装置」の一例である。
携帯情報端末500は、図1および図5に示すように、携帯情報端末100と同様のハード構成を備えている。ここで、第5実施形態では、全指向性マイクロホン61が有する周波数特性に対して双指向性マイクロホン62が有する周波数特性を近似させる音声信号処理が、携帯情報端末100の場合とは別な方法で行われるように構成されている。
具体的には、ある一定の時間間隔で双指向性マイクロホン62から一定以上の出力(雑音を含む音声)が得られる際に、増幅器75(図5参照)の増幅率を徐々に変更して第1音声信号処理部70aにおけるスペクトル減算処理後の信号値がマイナスとなる周波数が発生する時点の増幅率に増幅器75を調整する手法が適用される。これは、双指向性マイクロホン62の指向性感度が高い方向(図2におけるX方向)のみから発生している周波数を有する音は、双指向性マイクロホン62の感度レベルが正しく調整された場合に減算処理後の信号値がほぼゼロになる点を利用するものである。
すなわち、話者の存在する方向(図2におけるZ方向)から発生している話者音声1(周波数)については双指向性マイクロホン62の感度レベルが正しく調整された場合にも減算器73(図5参照)による減算処理後の信号値がプラスの値となる一方、図2におけるX方向のみから発生している環境雑音3については双指向性マイクロホン62の感度レベルが正しく調整された場合にも減算器73による減算処理後の信号値がほぼゼロになるからである。携帯情報端末500には、上述のような双指向性マイクロホン62の感度の調整モードが備わっている。以下、この調整モードの制御処理フローについて説明する。
図13に示すように、まず、ステップS1では、ユーザにより携帯情報端末500が「調整モード」に設定されているか否かが装置本体側の制御部(図示せず)により判断される。なお、「調整モード」への設定は、タッチパネル式の表示部10(図1参照)を介してユーザにより行われる。
ステップS1において携帯情報端末500が「調整モード」に設定されていると判断された場合、ステップS2では、所定時間(たとえば2秒)が経過したか否かが判断される。そして、ステップS2において所定時間が経過したと判断された場合、ステップS3では、双指向性マイクロホン62から一定以上の出力(音声)を有する周波数(スペクトル)が存在するか否かが判断される。
ステップS3において双指向性マイクロホン62から一定以上の出力(音声)を有する周波数が存在すると判断された場合、ステップS4では、増幅器75(図5参照)の増幅率を所定の刻み幅で徐々に変更しながら減算器73(図5参照)による信号値(FFT部71により得られた全指向性マイクロホン61からのスペクトルから、FFT部72により得られた双指向性マイクロホン62からのスペクトルを減算した信号値)がマイナスとなる周波数(スペクトル)が得られた時点での前後の増幅率の平均値が記憶(保存)される。
その後、ステップS5では、ステップS4での記憶データ(増幅率の平均値)が5個以上蓄積されたか否かが判断されるとともに、ステップS4での記憶データが5個以上になった場合には、ステップS6において、記憶された直近の5個のデータ(増幅率の平均値)の中央値が増幅器75における調整後の増幅率に設定される。その後、処理フローは、ステップS1に戻される。
なお、ユーザがスピーカ11(図1参照)などから発せられる音声を聴きながら双指向性マイクロホン62の感度レベルが適切に調整された(環境雑音3が低減されたクリアな音である)と感じた時点で表示部10を介して「調整モード」の設定が解除(オフ)された場合に、本処理フローは終了される。また、ステップS1においてユーザにより携帯情報端末500の「調整モード」がオン状態に設定されていない場合には、本処理フローは行われずに終了される。また、スピーカ11からの音声を聴きながらマイクロホンユニット50からの出力に環境雑音3が多く含まれているとユーザが感じた場合には、再度「調整モード」がユーザによりオン状態に設定される。これにより、本処理フローが再び実行されて、増幅器75の増幅率が自動的に調整される。なお、第5実施形態における携帯情報端末500のその他の構成は、上記第1実施形態と同様である。
第5実施形態では、以下のような効果を得ることができる。
すなわち、第5実施形態では、上記のように、増幅器75の増幅率を徐々に変更して第1音声信号処理部70aにおけるスペクトル減算処理後の信号値がマイナスとなる周波数が発生する時点の増幅率に増幅器75を調整する手法を適用する。これにより、マイクロホンユニット50が音声を取得する環境に応じて増幅器75の増幅率を詳細に調整することができる。したがって、明瞭性を有する高品質な話者音声1を常に提供することができる。
また、第5実施形態では、上記した増幅器75の増幅率の調整モードの実行の可否をユーザ操作に基づいて行うように構成する。これにより、増幅率の調整が必要のない場合には調整モードに関する演算処理を行う必要がないので、制御部における処理負荷が軽減されて、明瞭性を有する話者音声1を遅延なく提供することができる。
なお、今回開示された実施形態は、すべての点で例示であって制限的なものではないと考えられるべきである。本発明の範囲は、上記した実施形態の説明ではなく特許請求の範囲によって示され、さらに特許請求の範囲と均等の意味および範囲内でのすべての変更が含まれる。
たとえば、上記第1および第5実施形態では、指向性マイクロホンとして双指向性マイクロホン62を用いるとともに、上記第2実施形態では、指向性マイクロホンとして単一指向性マイクロホン270を用いた例について示したが、本発明はこれに限られない。本発明では、双指向性または単一指向性以外の、たとえば、スーパーカージオイド型またはハイパーカージオイド型の指向性パターンを有する指向性マイクロホンを用いてもより。そして、これらの指向性マイクロホンにおける指向性感度の相対的に低い方向が話者音声1に向くように配置されることにより指向性感度の相対的に高い方向から環境雑音3が取得されるようにマイクロホン装置(マイクロホンユニット)の内部を構成してもよい。
また、上記第1〜第3および第5実施形態では、増幅器75とローパスフィルタ回路76とによって第2音声信号処理部70bを構成した例について示したが、本発明はこれに限られない。すなわち、指向性マイクロホンの感度特性(周波数特性)が全指向性マイクロホンの感度特性(周波数特性)に揃えられていればよいので、増幅器75およびローパスフィルタ回路76を設けなくてもよいし、使用される指向性マイクロホンの感度特性(周波数特性)に応じて増幅器75またはローパスフィルタ回路76のいずれかのみによって第2音声信号処理部70bを構成してもよい。たとえば、マイクロホン仕様(製造上のスペック)の差異や使用環境温度に起因して同じ音声入力について全指向性マイクロホンの感度特性(出力信号のレベル)に対する指向性マイクロホンの感度特性(出力信号のレベル)がばらつきを有する場合には、図14に示す本発明の第1変形例のように、増幅器75のみを設けた第2音声信号処理部175bにより携帯情報端末105の音声信号処理部175を構成してもよい。これにより、指向性マイクロホンの感度特性が全指向性マイクロホンの感度特性に効果的に揃えられる。また、同じ音声入力について全指向性マイクロホンの感度特性(出力信号のレベル)に対する指向性マイクロホンの感度特性(出力信号のレベル)がほとんど同じであるような場合には、図15に示す本発明の第2変形例のように、増幅器75を設けずにローパスフィルタ回路76のみを設けた第2音声信号処理部185bにより携帯情報端末115の音声信号処理部185を構成してもよい。
また、上記第1、第4および第5実施形態では、スマートフォンなどの携帯情報端末100(400、500)に本発明を適用し、上記第2および第3実施形態では、タブレット端末200(300)に本発明を適用した例について示したが、本発明はこれに限られない。マイクロホンユニットを備えて音声入力および音声認識機能を必要とする電子機器(音声入力装置)としての、たとえば、ノート型パソコンや、携帯型のゲーム機、マイクロホンユニット付きのヘッドセット(音響装置)、さらには、電子機器を操作するための音声入力機能付きのリモコン装置や、無線通信機器(トランシーバなどの無線機)などに、本発明を適用してもよい。
また、上記第1〜第5実施形態では、全指向性マイクロホン61(261)の信号出力をFFT部71に直接入力するとともに、双指向性マイクロホン62(単一指向性マイクロホン270および370)の信号出力を、第2音声信号処理部70bを介してFFT部72に直接入力するように構成した例について示したが、本発明はこれに限られない。たとえば、全指向性マイクロホン61(261)の信号出力が有する位相および双指向性マイクロホン62(単一指向性マイクロホン270および370)の信号出力が有する位相をそれぞれ補正するとともに、この状態で各々の信号出力をFFT部71およびFFT部72に入力することが可能な、音声信号処理部をさらに設けてもよい。
また、上記第1、第4および第5実施形態では、マイクロホンユニット50を携帯情報端末100(400、500)における下端面24のX方向の中心位置から一方側(X2側)に約20mmずらした位置に設けた例について示したが、本発明はこれに限られない。すなわち、明視距離(距離L1=約250mm)において話者音声1に対して±30度以内の角度範囲に双指向性マイクロホン62のNull方向が含まれるのであれば、下端面24内部におけるマイクロホンユニット50の位置は約20mm以外であってもよい。たとえば、マイクロホンユニット50を上記第2実施形態で示したタブレット端末200の下端面224(長さ:約210mm)に組み込む場合には、マイクロホンユニット50を下端面224のX方向の中心位置から一方側(X2側)に約100mm程度ずらして配置してもよい。
また、上記第2および第3実施形態では、マイクロホンユニット250(350)をX方向の中心位置がタブレット端末200(300)の上端面223(323)の中心位置に揃えられた状態で筐体220(320)の内部に収納した例について示したが、本発明はこれに限られない。すなわち、指向性感度の最も低いZ方向(Null方向)を中心として、一方側(X1側)または他方側(X2側)にNull領域内(角度α2(図10参照)の範囲内)で単一指向性マイクロホン270(370)が話者音声1に向けられるように、マイクロホンユニット250(350)をタブレット端末200(300)の上端面223(323)の中心位置から一方側(他方側)にずらされた位置に配置してもよい。
また、上記第5実施形態では、双指向性マイクロホン62を備えた携帯情報端末500に対して増幅器75の増幅率を自動調整する手法を適用した例について示したが、本発明はこれに限られない。すなわち、単一指向性マイクロホン270(370)を備えたタブレット端末200(300)に対して増幅器75の増幅率を自動調整する手法を適用してもよい。
1 話者音声
3 環境雑音
20、220 筐体
24 下端面
50、250、350 マイクロホンユニット
55、振動膜
61、261 全指向性マイクロホン
62 双指向性マイクロホン(指向性マイクロホン)
63、270、370 単一指向性マイクロホン(指向性マイクロホン)
70、175、185、470 音声信号処理部
70a 第1音声信号処理部
70b、175b、185b、470b 第2音声信号処理部
71、72 FFT部
73 減算器
74 IFFT部
75 増幅部
76 ローパスフィルタ回路
100、105、115、400、500 携帯情報端末(マイクロホン装置)
200、300 タブレット端末(マイクロホン装置)
223、323 上端面
263、267 振動膜
476 ハイパスフィルタ回路

Claims (12)

  1. 全指向性マイクロホンと、
    指向性マイクロホンと、
    前記全指向性マイクロホンにより取得されるデータと前記指向性マイクロホンにより取得されるデータとの両方が存在する場合に、前記二つのデータの減算処理を行う第1音声信号処理部と、を備える、マイクロホン装置。
  2. 前記指向性マイクロホンまたは前記全指向性マイクロホンからのデータが入力されデータ処理を行う第2音声信号処理部をさらに備え、
    前記第2音声信号処理部からの出力が前記第1音声信号処理部に入力されるように構成されている、請求項1に記載のマイクロホン装置。
  3. 前記第2音声信号処理部は、出力レベルを調整する増幅器と、ローパスフィルタ回路との少なくとも一方を含む、請求項2に記載のマイクロホン装置。
  4. 前記第2音声信号処理部は、前記全指向性マイクロホンからのデータが入力されるハイパスフィルタ回路を含む、請求項2に記載のマイクロホン装置。
  5. 前記第1音声信号処理部は、前記全指向性マイクロホンにより取得される音声をフーリエ変換したスペクトルから、前記指向性マイクロホンにより取得される音声をフーリエ変換したスペクトルを減算する信号処理を行うように構成されている、請求項1〜4のいずれか1項に記載のマイクロホン装置。
  6. 前記指向性マイクロホンは、双指向性マイクロホンであり、
    指向性感度の最も低い方向を中心として指向性感度の相対的に高い方向に向かって30度以内の角度範囲で、前記双指向性マイクロホンが話者音声に向けられるように構成されている、請求項1〜5のいずれか1項に記載のマイクロホン装置。
  7. 前記指向性マイクロホンは、感度レベルがオフセット可能に構成されている、請求項1〜6のいずれか1項に記載のマイクロホン装置。
  8. 前記指向性マイクロホンは、一対の振動膜を有するとともに、前記一対の振動膜の各々に作用する音圧の差分に基づいて音波が検知されるように構成されており、
    前記指向性マイクロホンが有する一方側の前記振動膜は、前記全指向性マイクロホンの振動膜を兼ねている、請求項1〜5および7のいずれか1項に記載のマイクロホン装置。
  9. 前記指向性マイクロホンは、各々が前記振動膜を有する一対の全指向性マイクロホンにより構成される単一指向性マイクロホンであり、
    前記単一指向性マイクロホンにおける前記一対の全指向性マイクロホンは、話者音声の到来方向に向かって列状に配置されている、請求項8に記載のマイクロホン装置。
  10. 前記指向性マイクロホンは、一対の音孔の各々を介して互いに反対方向から単一の振動膜に到達する音圧の差分に基づいて音波が検知されるように構成されており、
    前記全指向性マイクロホンは、一方の前記音孔と前記単一の振動膜の一方側とを接続する音道内に配置されている、請求項1〜7のいずれか1項に記載のマイクロホン装置。
  11. 前記指向性マイクロホンは、双指向性マイクロホンであり、
    前記双指向性マイクロホンにおける前記一対の音孔は、話者音声の到来方向と交差する方向に沿って列状に配置されている、請求項10に記載のマイクロホン装置。
  12. 前記全指向性マイクロホンにより取得された音が、前記第1音声信号処理部を介さずに出力されるように構成されている、請求項1〜11のいずれか1項に記載のマイクロホン装置。
JP2015063665A 2014-03-28 2015-03-26 マイクロホン装置 Pending JP2015194753A (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2015063665A JP2015194753A (ja) 2014-03-28 2015-03-26 マイクロホン装置
US14/669,584 US20150281834A1 (en) 2014-03-28 2015-03-26 Microphone device and microphone unit
EP15161387.4A EP2925016A3 (en) 2014-03-28 2015-03-27 Microphone device and microphone unit

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2014070167 2014-03-28
JP2014070167 2014-03-28
JP2015063665A JP2015194753A (ja) 2014-03-28 2015-03-26 マイクロホン装置

Publications (1)

Publication Number Publication Date
JP2015194753A true JP2015194753A (ja) 2015-11-05

Family

ID=52737003

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015063665A Pending JP2015194753A (ja) 2014-03-28 2015-03-26 マイクロホン装置

Country Status (3)

Country Link
US (1) US20150281834A1 (ja)
EP (1) EP2925016A3 (ja)
JP (1) JP2015194753A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018173267A1 (ja) * 2017-03-24 2018-09-27 ヤマハ株式会社 収音装置および収音方法
KR20200077686A (ko) * 2018-12-20 2020-07-01 삼성전자주식회사 공간 음향 녹음 소자, 공간 음향 녹음 방법 및 공간 음향 녹음 소자를 포함하는 전자 장치
US10873810B2 (en) 2017-03-24 2020-12-22 Yamaha Corporation Sound pickup device and sound pickup method
CN113421566A (zh) * 2021-08-20 2021-09-21 航天科工通信技术研究院有限责任公司 基于风噪用便携式语音减噪装置

Families Citing this family (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2953380A1 (en) 2014-06-04 2015-12-09 Sonion Nederland B.V. Acoustical crosstalk compensation
DE102016204448A1 (de) * 2015-03-31 2016-10-06 Sony Corporation Verfahren und Gerät
US9554207B2 (en) * 2015-04-30 2017-01-24 Shure Acquisition Holdings, Inc. Offset cartridge microphones
US9565493B2 (en) 2015-04-30 2017-02-07 Shure Acquisition Holdings, Inc. Array microphone system and method of assembling the same
US20160342774A1 (en) * 2015-05-21 2016-11-24 Castar, Inc. Method of co-located software object sharing for multi-player augmented reality games
CN105939503B (zh) * 2016-06-08 2024-01-16 钰太芯微电子科技(上海)有限公司 一种多模式麦克风
US10367948B2 (en) 2017-01-13 2019-07-30 Shure Acquisition Holdings, Inc. Post-mixing acoustic echo cancellation systems and methods
US10304447B2 (en) * 2017-01-25 2019-05-28 International Business Machines Corporation Conflict resolution enhancement system
US20190029563A1 (en) * 2017-07-26 2019-01-31 Intel Corporation Methods and apparatus for detecting breathing patterns
US10111000B1 (en) * 2017-10-16 2018-10-23 Tp Lab, Inc. In-vehicle passenger phone stand
CN108091344A (zh) * 2018-02-28 2018-05-29 科大讯飞股份有限公司 一种降噪方法、装置及系统
US11523212B2 (en) 2018-06-01 2022-12-06 Shure Acquisition Holdings, Inc. Pattern-forming microphone array
US11297423B2 (en) 2018-06-15 2022-04-05 Shure Acquisition Holdings, Inc. Endfire linear array microphone
US11310596B2 (en) 2018-09-20 2022-04-19 Shure Acquisition Holdings, Inc. Adjustable lobe shape for array microphones
KR102607863B1 (ko) * 2018-12-03 2023-12-01 삼성전자주식회사 음원 분리 장치 및 음원 분리 방법
WO2020191354A1 (en) 2019-03-21 2020-09-24 Shure Acquisition Holdings, Inc. Housings and associated design features for ceiling array microphones
US11558693B2 (en) 2019-03-21 2023-01-17 Shure Acquisition Holdings, Inc. Auto focus, auto focus within regions, and auto placement of beamformed microphone lobes with inhibition and voice activity detection functionality
US11438691B2 (en) 2019-03-21 2022-09-06 Shure Acquisition Holdings, Inc. Auto focus, auto focus within regions, and auto placement of beamformed microphone lobes with inhibition functionality
TW202101422A (zh) 2019-05-23 2021-01-01 美商舒爾獲得控股公司 可操縱揚聲器陣列、系統及其方法
EP3977449A1 (en) 2019-05-31 2022-04-06 Shure Acquisition Holdings, Inc. Low latency automixer integrated with voice and noise activity detection
US11297426B2 (en) 2019-08-23 2022-04-05 Shure Acquisition Holdings, Inc. One-dimensional array microphone with improved directivity
US11552611B2 (en) 2020-02-07 2023-01-10 Shure Acquisition Holdings, Inc. System and method for automatic adjustment of reference gain
WO2021243368A2 (en) 2020-05-29 2021-12-02 Shure Acquisition Holdings, Inc. Transducer steering and configuration systems and methods using a local positioning system
US11657794B2 (en) * 2020-08-27 2023-05-23 Canon Kabushiki Kaisha Audio processing apparatus for reducing noise using plurality of microphones, control method, and recording medium
US11729548B2 (en) * 2020-08-27 2023-08-15 Canon Kabushiki Kaisha Audio processing apparatus, control method, and storage medium, each for performing noise reduction using audio signals input from plurality of microphones
CN116918351A (zh) 2021-01-28 2023-10-20 舒尔获得控股公司 混合音频波束成形系统
JP2022183849A (ja) * 2021-05-31 2022-12-13 キヤノン株式会社 音声処理装置、制御方法、およびプログラム

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2523951B2 (ja) * 1990-06-28 1996-08-14 松下電器産業株式会社 マイクロホン装置
US8467543B2 (en) 2002-03-27 2013-06-18 Aliphcom Microphone and voice activity detection (VAD) configurations for use with communication systems
WO2003017718A1 (en) * 2001-08-13 2003-02-27 Nanyang Technological University, Centre For Signal Processing Post-processing scheme for adaptive directional microphone system with noise/interference suppression
US7171008B2 (en) * 2002-02-05 2007-01-30 Mh Acoustics, Llc Reducing noise in audio systems
EP1773100A1 (de) * 2005-10-04 2007-04-11 Siemens Audiologische Technik GmbH Anpassung eines Richtmikrofons an langandauernde Einflüsse
US8433076B2 (en) * 2010-07-26 2013-04-30 Motorola Mobility Llc Electronic apparatus for generating beamformed audio signals with steerable nulls

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018173267A1 (ja) * 2017-03-24 2018-09-27 ヤマハ株式会社 収音装置および収音方法
CN110495184A (zh) * 2017-03-24 2019-11-22 雅马哈株式会社 拾音装置及拾音方法
JPWO2018173267A1 (ja) * 2017-03-24 2020-01-23 ヤマハ株式会社 収音装置および収音方法
US10873810B2 (en) 2017-03-24 2020-12-22 Yamaha Corporation Sound pickup device and sound pickup method
US10979839B2 (en) 2017-03-24 2021-04-13 Yamaha Corporation Sound pickup device and sound pickup method
CN110495184B (zh) * 2017-03-24 2021-12-03 雅马哈株式会社 拾音装置及拾音方法
KR20200077686A (ko) * 2018-12-20 2020-07-01 삼성전자주식회사 공간 음향 녹음 소자, 공간 음향 녹음 방법 및 공간 음향 녹음 소자를 포함하는 전자 장치
KR102664399B1 (ko) 2018-12-20 2024-05-14 삼성전자주식회사 공간 음향 녹음 소자, 공간 음향 녹음 방법 및 공간 음향 녹음 소자를 포함하는 전자 장치
CN113421566A (zh) * 2021-08-20 2021-09-21 航天科工通信技术研究院有限责任公司 基于风噪用便携式语音减噪装置
CN113421566B (zh) * 2021-08-20 2021-11-12 航天科工通信技术研究院有限责任公司 基于风噪用便携式语音减噪装置

Also Published As

Publication number Publication date
US20150281834A1 (en) 2015-10-01
EP2925016A3 (en) 2015-10-07
EP2925016A2 (en) 2015-09-30

Similar Documents

Publication Publication Date Title
JP2015194753A (ja) マイクロホン装置
JP5097523B2 (ja) 音声入力装置
US20080175408A1 (en) Proximity filter
JP5293275B2 (ja) マイクロホンユニット
US9167337B2 (en) Ear microphone and voltage control device for ear microphone
US20100098266A1 (en) Multi-channel audio device
JP5129024B2 (ja) 音声入力装置及び音声会議システム
WO2009145096A1 (ja) 音声入力装置及びその製造方法、並びに、情報処理システム
JP4293378B2 (ja) マイクロフォンユニット、及び、接話型の音声入力装置、並びに、情報処理システム
JP5114106B2 (ja) 音声入出力装置及び通話装置
NO328582B1 (no) Mikrofon for lydkildesporing
US8774429B2 (en) Voice input device, method for manufacturing the same, and information processing system
JP2009135777A (ja) マイクロフォンユニット及び音声入力装置
US9532125B2 (en) Noise cancellation microphones with shared back volume
US20140341386A1 (en) Noise reduction
CN106919225A (zh) 用于移动装置的声处理器
NO326892B1 (no) Mikrofonanordning
EP2265038A1 (en) Microphone unit, voice input device of close-talking type, information processing system, and method for manufacturing microphone unit
WO2008062850A1 (fr) Dispositif d'entrée vocale, procédé de production de ce dernier et système de traitement d'informations
US9438986B2 (en) In-ear headphone with sound pick-up capability
WO2008062848A1 (fr) Dispositif d'entrée vocale, procédé de production de ce dernier et système de traitement d'informations
US11871193B2 (en) Microphone system
US8135144B2 (en) Microphone system, sound input apparatus and method for manufacturing the same
US10109292B1 (en) Audio systems with active feedback acoustic echo cancellation
JP2010212904A (ja) マイクロホンユニット