JP2009296517A - 音声入力装置及び音声リモコンシステム - Google Patents

音声入力装置及び音声リモコンシステム Download PDF

Info

Publication number
JP2009296517A
JP2009296517A JP2008150475A JP2008150475A JP2009296517A JP 2009296517 A JP2009296517 A JP 2009296517A JP 2008150475 A JP2008150475 A JP 2008150475A JP 2008150475 A JP2008150475 A JP 2008150475A JP 2009296517 A JP2009296517 A JP 2009296517A
Authority
JP
Japan
Prior art keywords
microphone
sound hole
input device
voice input
sound
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2008150475A
Other languages
English (en)
Inventor
Takeshi Inota
岳司 猪田
Rikuo Takano
陸男 高野
Toshimi Fukuoka
敏美 福岡
Ryusuke Horibe
隆介 堀邊
Fuminori Tanaka
史記 田中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Funai Electric Co Ltd
Funai Electric Advanced Applied Technology Research Institute Inc
Original Assignee
Funai Electric Co Ltd
Funai Electric Advanced Applied Technology Research Institute Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Funai Electric Co Ltd, Funai Electric Advanced Applied Technology Research Institute Inc filed Critical Funai Electric Co Ltd
Priority to JP2008150475A priority Critical patent/JP2009296517A/ja
Publication of JP2009296517A publication Critical patent/JP2009296517A/ja
Withdrawn legal-status Critical Current

Links

Images

Landscapes

  • Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Selective Calling Equipment (AREA)

Abstract

【課題】全方位からの周囲雑音と遅延歪とをともに抑制し、話者音声を忠実に抽出できる音声入力装置及び音声リモコンシステムを提供する。
【解決手段】第1のマイクロホン40及び第2のマイクロホン50を含み、音声を入力して音声信号を生成する音声入力装置において、回転放物曲面11を有する反射板10と、第1のマイクロホン40に対応する第1の音孔41と、第2のマイクロホン50に対応する第2の音孔51と、反射板10の回転放物曲面11に設けられ、第1の音孔41及び第2の音孔51を有するマイク保持部20と、第1のマイクロホン40及び第2のマイクロホン50の出力に基づく信号処理を行う信号処理部60とを含み、第1の音孔41と第2の音孔51との距離が8.1mm以下となる位置に設けられている。
【選択図】図2

Description

本発明は、音声入力装置及び音声リモコンシステムに関する。
周囲雑音を抑制可能な音声入力装置として、例えば、差動マイクの特性を利用した接話型マイクロホン装置(特許文献1)や、エコーキャンセラをノイズキャンセラとして利用する構成が提案されている(特許文献2)。
また、近年では、音声認識技術を用いて、テレビやパソコン、DVDプレーヤなどの電子機器を数m離れた位置から音声で行う音声リモコンが開発されている。
特開2007−300513号公報 特開2004−120717号公報
従来の音声入力装置では、話者以外の人の声や、壁からの反射音などの雑音が入るため、例えば音声認識システムに用いる場合には音声認識率が低くなることがあった。
また、差動マイクの特性を利用して、精度の高い雑音除去機能を実現するためには、複数のマイクロホンに到来する音波の位相差による遅延歪の影響を考慮することが好ましい。音声認識システムは音声翻訳システムにおいて使用される音声入力装置としては、例えば英語の子音もはっきりと抽出する必要があり、そのためには、例えば7kHz帯域までは歪まずに抽出できることが好ましい。
本発明は、以上のような事情に鑑みてなされたものであり、全方位からの周囲雑音と遅延歪とをともに抑制し、話者音声を忠実に抽出できる音声入力装置及び音声リモコンシステムを提供することを目的とする。
(1)本発明に係る音声入力装置は、
第1のマイクロホン及び第2のマイクロホンを含み、音声を入力して音声信号を生成する音声入力装置において、
回転放物曲面を有する反射板と、
前記第1のマイクロホンに対応する第1の音孔と、
前記第2のマイクロホンに対応する第2の音孔と、
前記反射板の回転放物曲面に設けられ、前記第1の音孔及び前記第2の音孔を有するマイク保持部と、
前記第1のマイクロホン及び前記第2のマイクロホンの出力に基づく信号処理を行う信号処理部とを含み、
前記第1の音孔と前記第2の音孔との距離が、所与の周波数帯域の音に対して、前記第1の音孔に入射する音声の音圧の強度に対する、前記第1の音孔と前記第2の音孔に入射する音声の差分音圧に含まれる音声成分の強度の比率である音声強度比の位相成分が0dB以下となる距離に設定されていることを特徴とする。
第1の音孔及び第2の音孔は、それぞれ対応する第1のマイクロホン及び第2のマイクロホンの採音口となる孔である。
第1の音孔と第2の音孔との距離は、第1の音孔の開口面内に仮想的に定めた代表点と、第2の音孔の開口面内に仮想的に定めた代表点との距離としてもよい。例えば、第1の音孔の開口面の中心点と、第2の音孔の開口面の中心点との距離としてもよい。
本発明によれば、全方位からの周囲雑音と遅延歪とをともに抑制し、話者音声を忠実に抽出できる音声入力装置が実現できる。
(2)この音声入力装置において、
前記所与の周波数帯域は、7kHz以下の周波数帯域であってもよい。
(3)本発明に係る音声入力装置は、
第1のマイクロホン及び第2のマイクロホンを含み、音声を入力して音声信号を生成する音声入力装置において、
回転放物曲面を有する反射板と、
前記第1のマイクロホンに対応する第1の音孔と、
前記第2のマイクロホンに対応する第2の音孔と、
前記反射板の回転放物曲面に設けられ、前記第1の音孔及び前記第2の音孔を有するマイク保持部と、
前記第1のマイクロホン及び前記第2のマイクロホンの出力に基づく信号処理を行う信号処理部とを含み、
前記第1の音孔と前記第2の音孔との距離が8.1mm以下となる位置に設けられていることを特徴とする。
(4)この音声入力装置において、
前記第1の音孔は、前記反射板の焦点以外の位置に設けられ、
前記第2の音孔は、前記反射板の焦点と前記第1の音孔とを結ぶ線分上に設けられていてもよい。
(5)この音声入力装置において、
前記第1の音孔の断面積と前記第2の音孔の断面積とが等しく構成されていてもよい。
(6)この音声入力装置において、
前記第1の音孔の内部空間の容積と前記第2の音孔の内部空間の容積とが等しく構成されていてもよい。
音孔の内部空間は、音孔の開口面と壁面とを含む平面で囲まれた空間である。
(7)この音声入力装置において、
前記第1のマイクロホンに対応する第1の振動板と、
前記第2のマイクロホンに対応する第2の振動板とを含み、
前記第1のマイクロホンにおける前記第1の音孔の開口面から前記第1の振動板までの経路長と、前記第2のマイクロホンにおける前記第2の音孔の開口面から前記第2の振動板までの経路長が等しく構成されていてもよい。
音孔の開口面から振動板までの経路長は、例えば、音孔の断面の中心を結ぶ線の長さであってもよい。
(8)この音声入力装置において、
前記信号処理部は、前記第1のマイクロホンの出力信号と前記第2のマイクロホンの出力信号との差分信号を生成する差動マイク出力処理を行ってもよい。
(9)この音声入力装置において、
前記信号処理部は、前記差動マイク出力処理と、前記第1のマイクロホン及び前記第2のマイクロホンの出力信号のいずれかのみに基づく信号を生成する単体マイク出力処理とを切り替える切替処理を行ってもよい。
(10)この音声入力装置において、
前記信号処理部は、前記第1のマイクロホン及び前記第2のマイクロホンの少なくとも一方の出力感度を変更する感度変更処理を行い、前記感度変更処理後の信号を用いて前記差動マイク出力処理を行ってもよい。
(11)この音声入力装置において、
前記信号処理部は、前記第1のマイクロホン及び前記第2のマイクロホンの出力感度を検出する感度検出処理を行い、前記感度検出処理結果に基づいて前記切替処理又は前記感度変更処理を行ってもよい。
例えば、出力感度が閾値以下となった場合にのみ、差動マイク出力処理から単体マイク出力処理への切替処理を行ってもよい。
また例えば、出力感度が閾値以下となった場合にのみ、どちらか一方のマイクロホンの出力感度を上げる感度変更処理を行ってもよい。
(12)この音声入力装置において、
前記第1のマイクロホン及び前記第2のマイクロホンに対応する共通振動板を含み、
前記第1のマイクロホンにおける前記第1の音孔の開口面から前記共通振動板までの経路長と、前記第2のマイクロホンにおける前記第2の音孔の開口面から前記共通振動板までの経路長が等しく構成されていてもよい。
(13)この音声入力装置において、
前記マイク保持部は、前記第1の音孔と前記第2の音孔との距離を調節可能に構成されていてもよい。
例えば、マイク保持部が第1の音孔と第2の音孔を有し、第1の音孔と第2の音孔との間に調節部を設け、調節部において回動、伸縮及び変形のいずれかを行うことにより第1の音孔と第2の音孔との距離を調節してもよい。
(14)この音声入力装置において、
前記マイク保持部は、前記第1の音孔と前記第2の音孔との距離が固定されていてもよい。
例えば、マイク保持部が第1の音孔と第2の音孔を有し、第1の音孔と第2の音孔との間では回動、伸縮及び変形のいずれも行わず、第1の音孔と第2の音孔との距離を固定してもよい。
(15)この音声入力装置において、
前記マイク保持部は、前記反射板の焦点と前記第1の音孔及び前記第2の音孔との距離を調節可能に構成されていてもよい。
例えば、マイク保持部が第1の音孔と第2の音孔を有し、反射板と第1の音孔及び第2の音孔との間に調節部を設け、調節部において回動、伸縮及び変形のいずれかを行うことにより反射板の焦点と第1の音孔及び第2の音孔との距離を調節してもよい。
(16)本発明に係る音声リモコンシステムは、
これらのいずれかの音声入力装置を含むことを特徴とする。
本発明に係る音声リモコンシステムによれば、周囲雑音と遅延歪とをともに抑制し、話者音声を忠実に抽出できるため、音声認識率の高い音声リモコンシステムを実現することができる。
以下、本発明を適用した実施の形態について図面を参照して説明する。ただし、本発明は以下の実施の形態に限定されるものではない。また、本発明は、以下の内容を自由に組み合わせたものを含むものとする。
1.音声入力装置の構成例
図1は、本実施の形態に係る音声入力装置の構成の一例を示す機能ブロック図である。
本実施の形態に係る音声入力装置1は、第1のマイクロホン40、第2のマイクロホン50、信号処理部60、を含む。第1のマイクロホン40及び第2のマイクロホン50は、入力された音声を電気信号に変換する。信号処理部60は、第1のマイクロホン40及び第2のマイクロホン50の出力に基づいて、音声信号を生成する。信号処理部の詳細については後述する。
また、音声入力装置1は、信号処理部60で生成した音声信号を他の処理回路や電子機器に出力するための出力インターフェイス70を含んでもよい。出力インターフェイス70は、電極やコネクタ、ケーブルなどにより他の処理回路や電子機器と接続されていてもよいし、無線通信により他の処理回路や電子機器と通信してもよい。
図2は、本実施の形態に係る音声入力装置の構成の一例を示す斜視図である。
本実施の形態に係る音声入力装置1は、音声を入力して音声信号を生成する装置であり、反射板10とマイク保持部20を含んで構成されている。
反射板10は、回転放物曲面11を含んで構成される。また、反射板10全体を支持する支持部12を含んでいてもよい。
マイク保持部20は、反射板10の回転放物曲面11に設けられている。本実施の形態においては、反射板10の回転放物曲面11の中心から垂直方向に延びる棒形状に構成されている。マイク保持部20の外観は特に限定されるものではない。本実施の形態においては、断面が円形となる棒形状に構成されている。
本実施の形態に係る音声入力装置1は、第1のマイクロホン40及び第2のマイクロホン50を含む。第1のマイクロホン40は、対応する第1の音孔41及び第1の振動板42(図示せず)を含んで構成されている。同様に、第2のマイクロホン50は、対応する第2の音孔51及び第2の振動板52(図示せず)を含んで構成されている。
図3は、本実施の形態におけるマイク保持部20の一例を拡大した斜視図である。本実施の形態において、マイク保持部20は、マイク保持部材20−1及び20−2から構成されている。
図3に示す例においては、第1の音孔41及び第1の振動板42は、マイク保持部材20−1に設けられている。同様に、第2の音孔51及び第2の振動板52は、マイク保持部材20−2に設けられている。なお、第1の振動板42は、第1の振動板位置42−1に設けられ、第2の振動板52は、第2の振動板位置52−1に設けられている。
第1の音孔41及び第2の音孔51は、それぞれ対応する第1のマイクロホン40及び第2のマイクロホン50の採音口となる孔であり、それぞれ第1の振動板42及び第2の振動板52と外部空間とを繋ぐ孔である。第1の音孔41及び第2の音孔51の開口面の形状は特に限定されるものではなく、例えば矩形、多角形や円形としてもよい。本実施の形態においては、第1の音孔41及び第2の音孔51の開口面の形状は円形としている。
第1の振動板42及び第2の振動板52は、音波が入射すると法線方向に振動する部材である。そして、音声入力装置1では、第1の振動板42及び第2の振動板52の振動に基づいて電気信号を抽出することで、第1の振動板42及び第2の振動板52に入射した音声を示す電気信号を取得する。すなわち、第1の振動板42及び第2の振動板52は、マイクロホンの振動板である。
以下、本実施の形態に適用可能なマイクロホンの一例として、コンデンサ型マイクロホン200の構成について説明する。図4は、コンデンサ型マイクロホン200の構成を模式的に示した断面図である。
コンデンサ型マイクロホン200は、振動板202を有する。なお、振動板202が、本実施の形態に係る音声入力装置1の振動板22に相当する。振動板202は、音波を受けて振動する膜(薄膜)で、導電性を有し、電極の一端を形成している。コンデンサ型マイクロホン200は、また、電極204を有する。電極204は、振動板202と対向、近接して配置されている。これにより、振動板202と電極204とは容量を形成する。コンデンサ型マイクロホン200に音波が入射すると、振動板202が振動して、振動板202と電極204との間隔が変化し、振動板202と電極204との間の静電容量が変化する。この静電容量の変化を、例えば電圧の変化として取り出すことによって、振動板202の振動に基づく電気信号を取得することができる。すなわち、コンデンサ型マイクロホン200に入射する音波を、電気信号に変換して出力することができる。なお、コンデンサ型マイクロホン200では、電極204は、音波の影響を受けない構造をなしていてもよい。例えば、電極204はメッシュ構造をなしていてもよい。
ただし、本発明に適用可能なマイクロホンは、コンデンサ型マイクロホンに限られるものではなく、既に公知となっているいずれかのマイクロホンを適用することができる。例えば、第1の振動板42及び第2の振動板52は、動電型(ダイナミック型)、電磁型(マグネティック型)、圧電型(クリスタル型)等の、種々のマイクロホンの振動板であってもよい。
あるいは、第1の振動板42及び第2の振動板52は、半導体膜(例えばシリコン膜)であってもよい。すなわち、第1の振動板42及び第2の振動板52は、シリコンマイク(Siマイク)の振動板であってもよい。シリコンマイクを利用することで、音声入力装置1の小型化、及び、高性能化を実現することができる。
なお、第1の振動板42及び第2の振動板52の形状は特に限定されるものではない。本実施の形態においては、第1の振動板42及び第2の振動板52の振動面は円形をなしているが、例えば円形であっても矩形や多角形であってもよい。
本実施の形態に係る音声入力装置1は、信号処理部60を含む。信号処理部60は、第1のマイクロホン40及び第2のマイクロホン50の出力に基づく信号処理を行う。本実施の形態においては、信号処理部60は、第1のマイクロホン40の出力信号と第2のマイクロホン50の出力信号との差分信号を生成する差動マイク出力処理を行う差動マイク出力処理部61を含む。すなわち、音声入力装置1は、第1のマイクロホン40及び第2のマイクロホン50を差動マイクとして利用している。なお、本実施の形態においては、信号処理部60は、マイク保持部20の内部に設けられている(図示せず)。
本実施の形態に係る音声入力装置1においては、第1の音孔41と第2の音孔51との距離は、第1の音孔41と第2の音孔51との距離が、所与の周波数帯域の音に対して、第1の音孔41に入射する音声の音圧の強度に対する、第1の音孔41と第2の音孔51に入射する音声の差分音圧に含まれる音声成分の強度の比率である音声強度比の位相成分が0dB以下となる距離に設定されていてもよい。所与の周波数帯域は、7kHz以下の周波数帯域としてもよい。例えば、第1の音孔41と第2の音孔51との距離が5.0mm以上8.1mm以下となる位置に設けられていてもよい。第1の音孔41と第2の音孔51との距離は、第1の音孔41の開口面内に仮想的に定めた代表点と、第2の音孔51の開口面内に仮想的に定めた代表点との距離としてもよい。例えば、第1の音孔41の開口面の中心点と、第2の音孔51の開口面の中心点との距離としてもよい。
これにより、特に音声認識システムにおいて使用される7kHz以下の帯域において、遅延歪を抑制することができるとともに、全方位からの周囲雑音を抑制することができる音声入力装置を実現することができる。なお、これらの効果についての詳細は後述する。
また、本実施の形態に係る音声入力装置1においては、マイク保持部20は、調節部22を境にして伸縮することにより、第1の音孔41と第2の音孔51との距離を調節可能に構成されている。
図3を参照して説明すると、マイク保持部20は、第1のマイク保持部材20−1と第2のマイク保持部材20−2から構成されている。第2のマイク保持部材20−2は筒状に構成され、第1のマイク保持部材20−1が第2のマイク保持部材20−1の内側に挿入されて構成されている。第1の音孔41は第1のマイク保持部材20−1に、第2の音孔51は第2のマイク保持部材20−2に設けられている。すなわち、第1の音孔41と第2の音孔51を、伸縮部22を挟んだ位置に設けることにより、第1の音孔41と第2の音孔51との距離を調節可能に構成されている。
このような構成により、第1のマイクロホン40及び第2のマイクロホン50から構成される差動マイクの特性を、ユーザが必要に応じて調整することが可能になる。
また、マイク保持部20が第1の音孔41と第2の音孔51を有し、反射板10と第1の音孔41及び第2の音孔51との間に調節部22を設け、調節部22において回動、伸縮及び変形のいずれかを行うことにより反射板の焦点と第1の音孔及び第2の音孔との距離を調節してもよい。これにより、ユーザ(話者)の位置により焦点がずれることにも対応が可能になる。
なお、マイク保持部20は、第1の音孔41と第2の音孔51との距離が固定されている構成であってもよい。
また、第1の音孔41は、反射板10の焦点以外の位置に設けられ、第2の音孔51は、反射板10の焦点と第1の音孔41とを結ぶ線分上に設けられていてもよい。
図5(a)及び図5(b)は、反射板10からの距離とマイクロホンの感度(音圧レベル)との関係を示すグラフである。横軸は反射板10の焦点からの距離R、縦軸はマイクロホンの感度(音圧レベル)Pである。また、第1の音孔41と第2の音孔51との距離をΔrとする。
図5(a)及び図5(b)に示すように、マイクロホンの感度(音圧レベル)Pは、焦点において最大となる。反射板10の焦点から遠い領域においては、マイクロホンの感度(音圧レベル)Pは焦点からの距離の絶対値|R|に反比例する。反射板10の焦点付近に近づくにつれて、マイクロホンの感度(音圧レベル)Pは有限の値の最大値となるようになだらかに増加し、反射板10の焦点において最大値となる。
図5(a)は、第1の音孔41を反射板10の焦点からΔrの距離に、第2の音孔51を反射板10の焦点に設けた場合を示しており、グラフ上においては第1の音孔41の位置を点411、第2の音孔の位置を点511で示す。同様に、図5(b)は、第1の音孔41を反射板10の焦点から2×Δrの距離に、第2の音孔51を反射板10の焦点からΔrの距離に設けた場合を示す。
図5(a)に示すように、音孔間距離Δrが小さい場合には、反射板10の焦点付近においてはマイクロホンの感度(音圧レベル)Pの差ΔP1が小さくなる。したがって、第1の音孔41及び第2の音孔51のいずれかを反射板10の焦点に設けると、差動マイクとしての出力が小さくなる。
一方、図5(b)に示すように、第1の音孔41は、反射板10の焦点以外の位置に設けられ、第2の音孔51は、反射板10の焦点と第1の音孔41との間の距離に設けられている場合には、同じ音孔間距離Δrであっても、マイクロホンの感度(音圧レベル)Pの差ΔP2が大きくなる。したがって、第1の音孔41及び第2の音孔51のいずれかを反射板10の焦点に設けた場合に比べて、差動マイクとしての出力が大きくなる。
さらに、反射板10の焦点から遠い方の音孔を第1の音孔41としたとき、第2の音孔51を反射板10の焦点と第1の音孔41とを結ぶ線分上に設けることにより、第1の音孔41の位置及び音孔間距離Δrを同じにした場合におけるマイクロホンの感度(音圧レベル)Pの差ΔP2を最大にすることができる。すなわち、差動マイクとしての出力を最大とすることができる。
図19は、反射板10の焦点F、第1の音孔41及び第2の音孔51の位置関係を説明するための模式図である。
第1の音孔41の位置及び音孔間距離Δrを同じにした場合、第2の音孔51は仮想球面C上のいずれかに位置することになる。第2の音孔51が位置51aにあるとき、反射板10の焦点Fとの距離が最小となる。すなわち、第2の音孔51が第2の音孔51を反射板10の焦点Fと第1の音孔41とを結ぶ線分上に位置するときに、反射板10の焦点Fから第1の音孔41までの距離と、反射板10の焦点Fから第2の音孔51までの距離との差が最大となる。したがって、差動マイクとしての出力を最大とすることができる。
また、音孔間距離Δrが小さいとき、焦点付近に第1の音孔41及び第2の音孔51を配置すると、反射板10の反りや、マイクロホンの取り付け誤差、あるいは話者の移動等によって焦点が移動した場合、距離Rに対するマイクロホンの感度(音圧レベル)Pの傾きが小さくなるため、マイクロホンの感度(音圧レベル)Pの差ΔPが小さくなる。また、第1の音孔41と第2の音孔51の位置が焦点を挟んで対称の位置になった場合にはΔP=0となり、出力が全く得られなくなるといった問題が発生する。
それに対し、図5(b)に示すように、第1の音孔41は、反射板10の焦点以外の位置に設けられ、第2の音孔51は、反射板10の焦点と第1の音孔41との間の位置に設けられている場合には、同じ音孔間距離Δrであっても、マイクロホンの感度(音圧レベル)Pの差ΔP2が大きくなり、ΔP=0となる問題が避けられる。さらに、距離Rに対する感度Pの傾きが大きい領域で差動をとるため、焦点の移動に対するマージンをとることが可能となる。
また、信号処理部60は、第1のマイクロホン40及び第2のマイクロホン50の出力信号のいずれかのみに基づく信号を生成する単体マイク出力処理を行う単体マイク出力処理部62を含み、さらに、差動マイク出力処理と単体マイク出力処理とを切り替える切替処理を行う切替処理部63を含んでもよい。
例えば、第1の音孔41と反射板10の焦点との距離が大きく離れて、差動出力ΔPが小さくなる場合、切替処理部63は、信号処理部60で行う信号処理を差動マイク出力処理から単体マイク出力処理に切り替える切替処理を行ってもよい。
また、信号処理部60は、第1のマイクロホン40及び第2のマイクロホン50の少なくとも一方の出力感度を変更する感度変更処理を行う感度変更処理部64を含み、差動マイク出力処理部61は、感度変更処理後の信号を用いて差動マイク出力処理を行ってもよい。
さらに、信号処理部60は、第1のマイクロホン40及び第2のマイクロホン50の出力感度を検出する感度検出処理を行う感度検出処理部65を含み、切替処理部63は感度検出処理結果に基づいて切替処理を行ってもよい。例えば出力感度が閾値以下となった場合にのみ、差動マイク出力処理から単体マイク出力処理への切替処理を行ってもよい。
同様に、感度変更処理部64は感度検出処理結果に基づいて感度変更処理を行ってもよい。例えば出力感度が閾値以下となった場合にのみ、どちらか一方のマイクロホンの出力感度を上げる感度変更処理を行ってもよい。
〔変形例1〕
図2に示す音声入力装置1では、マイク保持部20は反射板10の回転放物曲面11の中心から垂直方向に延びる棒形状に構成され、第1の音孔41及び第2の音孔51も反射板10の回転放物曲面11の中心から垂直方向に設けられていたが、第1の音孔41及び第2の音孔51は反射板10の回転放物曲面11の中心から垂直方向には限られない。
図6は、音声入力装置の構成の他の一例を示す斜視図である。図6に示す音声入力装置2では、第1の音孔41及び第2の音孔51のいずれも、反射板10の回転放物曲面11の中心から垂直方向から外れた位置に設けられている。
このような構成であっても、先に説明した音声入力装置1と同様の効果を奏する。
また、図7に示す音声入力装置3のように、マイク保持部20の一部が取り外し可能に構成されていたり、マイク保持部20の一部が回動可能に構成されていたりしてもよい。図7に示す例では、マイク保持部材23とマイク保持部材24とが取付部25で取り付け、取り外し及び回動が可能に構成されている。
〔変形例2〕
上述の音声入力装置1乃至3においては、第1のマイクロホン40に対応する第1の振動板42と、第2のマイクロホン50に対応する第2の振動板52との2つの振動板を有する構成であったが、第1のマイクロホン40と第2のマイクロホン50が1つの振動板を共有する構成でもよい。すなわち、第1のマイクロホン40は、第1の音孔41と共通振動板45を含んで構成され、第2のマイクロホン50は、第2の音孔51と共通振動板45を含んで構成されてもよい。
図8は、第1のマイクロホン40と第2のマイクロホン50が1つの共通振動板45(図示せず)を共有する場合の音声入力装置4におけるマイク保持部20の一例を拡大し、模式的に示した断面図である。
図8において、マイク保持部20は、内部空間90を有し、共通振動板45により第1の内部空間91と第2の内部空間92に仕切られている。第1の内部空間91は、第1の音孔41を介して外部空間と連通する。また、第2の内部空間92は、第2の音孔51を介して外部空間と連通する。
本実施の形態では、共通振動板45は、両側から音圧を受ける。そのため、共通振動板45の両側に、同時に、同じ大きさの音圧がかかると、当該2つの音圧は共通振動板45で打ち消しあい、共通振動板45を振動させる力とはならない。逆に言うと、共通振動板45は、両側に受ける音圧に差があるときに、その音圧の差によって振動する。
また、第1及び第2の音孔41,51に入射した音波の音圧は、第1及び第2の内部空間91,92の内壁面に均等に伝達される(パスカルの原理)。そのため、共通振動板45の第1の内部空間91を向く面は、第1の音孔41に入射した音圧と等しい音圧を受け、共通振動板45の第2の内部空間92を向く面は、第2の音孔51に入射した音圧と等しい音圧を受ける。
すなわち、共通振動板45は、第1及び第2の音孔41,51に入射した音波の音圧の差によって振動する。
したがって、共通振動板45は、第1の音孔41から入力される音圧と第2の音孔51から入力される音圧との差を出力する。すなわち、第1の音孔41、第2の音孔51及び共通振動板45により、差動マイクが構成されている。
なお、図8においては、第1の音孔41の断面積と第2の音孔51の断面積とが等しく(例えば、ともに直径0.3mmの円形で)構成されている。
また、第1の音孔41の断面積と第2の音孔51の断面積に加え、第1の音孔41の内部空間(第1の内部空間91)の容積と、第2の音孔51の内部空間(第2の内部空間92)の容積、及び第1の音孔41の開口面から共通振動板45までの経路長と、第2の音孔51の開口面から共通振動板45までの経路長とを等しくすることにより、理想的な差動特性を得ることができる。また、第1の音孔41及び第2の音孔51の内部空間の容積を可能な限り小さく、また各音孔の開口面から共通振動板45までの経路長を可能な限り短くすることで、各音孔からの音圧の共振周波数を高周波域側にシフトさせることが可能となり、広い周波数範囲にわたりフラットな周波数特性を確保できるため、性能の高い差動マイクを得ることができる。
2.音声入力装置1の周囲雑音除去原理
音波は、媒質中を進行するにつれ減衰し、音圧(音波の強度・振幅)が低下する。音圧は、音源からの距離に反比例するため、音圧Pは、音源からの距離Rとの関係において、以下の式で表すことができる。
Figure 2009296517
なお、式(1)中、Kは比例定数である。図9には、式(1)を表すグラフを示すが、本図からもわかるように、音圧(音波の振幅)は、音源に近い位置(グラフの左側)では急激に減衰し、音源から離れるほどなだらかに減衰する。
音声入力装置1を接話型の音声入力装置として使用する場合、ユーザの音声は、第1及び第2の音孔41,51の近傍から発生する。そのため、ユーザの音声は、第1及び第2の音孔41,51の間で大きく減衰し、第1及び第2音孔41,51に入射するユーザ音声の音圧には、大きな差が現れる。
これに対して雑音成分は、ユーザの音声に比べて、音源が、第1及び第2の音孔41,51から遠い位置に存在する。そのため、雑音の音圧は、第1及び第2の音孔41,51の間でほとんど減衰せず、第1及び第2の音孔41,51に入射する雑音の音圧には、ほとんど差が現れない。
したがって、本実施の形態に係る音声入力装置1によると、差動マイクの特性により、雑音が除去されたユーザ音声を示す電気信号を取得することが可能な音声入力装置を提供することができる。
なお、音声入力装置2乃至4においても、同様の効果を有する。
3.本実施の形態に係る音声入力装置1で、より精度の高い雑音除去機能を実現するための条件
上述したように、音声入力装置1によると、差動マイクの特性により、雑音が除去された、ユーザ音声のみを示す電気信号を取得することが可能になる。ただし、音波は位相成分を含んでいる。そのため、第1及び第2の音孔41,51に入射する音波の位相差による遅延歪を考慮すれば、より精度の高い雑音除去機能を実現した音声入力装置の設計が可能となる。以下、より精度の高い雑音除去機能を実現するために、音声入力装置1が満たすべき条件について説明する。なお、音声入力装置2についても同様の条件が成立する。
差動マイクの特性を利用した音声入力装置1によると、第1及び第2の音孔41,51に入射する音圧の差(差分音圧)に含まれる雑音成分が、第1及び第2の音孔41,51に入射する音圧に含まれる雑音成分よりも小さくなったことをもって、雑音除去機能が実現されたと評価することができる。詳しくは、差分音圧に含まれる雑音成分の強度の、第1及び第2の音孔41,51に入射する音圧に含まれる雑音成分の強度に対する比を示す雑音強度比が、差分音圧に含まれるユーザ音声成分の強度の、第1及び第2の音孔41,51に入射する音圧に含まれるユーザ音声成分の強度に対する比を示すユーザ音声強度比よりも小さくなれば、この雑音除去機能が実現されたと評価することができる。
以下、この雑音除去機能を実現するために、音声入力装置1が満たすべき具体的な条件について説明する。
はじめに、第1及び第2の音孔41,51に入射する音声の音圧について検討する。ユーザ音声の音源から第1の音孔41までの距離をR、第1及び第2の音孔41,51の中心間距離をΔrとすると、位相差を無視すれば、第1及び第2の音孔41,51に入射する、ユーザ音声の音圧(強度)P(S1)及びP(S2)は、以下の式で表すことができる。
Figure 2009296517
そのため、ユーザ音声の位相差を無視したときの、第1の音孔41に入射するユーザ音声の音圧の強度に対する、差分音圧に含まれるユーザ音声成分の強度の比率を示すユーザ音声強度比ρ(P)は、以下の式で表すことができる。
Figure 2009296517
ここで、音声入力装置1が接話型の音声入力装置として使用される場合、ΔrはRに比べて充分小さいとみなすことができる。
そのため、上述の式(4)は、以下の式に変形することができる。
Figure 2009296517
すなわち、ユーザ音声の位相差を無視した場合のユーザ音声強度比は、式(A)と表されることがわかる。
ところで、ユーザ音声の位相差を考慮すると、ユーザ音声の音圧Q(S1)及びQ(S2)は、以下の式で表すことができる。
Figure 2009296517
なお、式中、αは位相差である。
このとき、ユーザ音声強度比ρ(S)は、以下の式で表すことができる。
Figure 2009296517
式(7)を考慮すると、ユーザ音声強度比ρ(S)の大きさは、以下の式で表すことができる。
Figure 2009296517
ところで、式(8)のうち、sinωt−sin(ωt−α)項は位相成分の強度比を示し、(Δr/R)・s inωt項は振幅成分の強度比を示す。ユーザ音声成分であっても、位相差成分は、振幅成分に対するノイズとなるため、ユーザ音声を精度よく抽出するためには、位相成分の強度比が、振幅成分の強度比よりも充分に小さいことが必要である。すなわち、sinωt−sin(ωt−α)と、(Δr/R)・sinωtとは、以下の関係を満たしていることが重要である。
Figure 2009296517
ここで、
Figure 2009296517
と表すことができるため、上述の式(B)は、以下の式で表すことができる。
Figure 2009296517
式(10)の振幅成分を考慮すると、本実施の形態に係る音声入力装置1は、以下の条件を満たす必要があることがわかる。
Figure 2009296517
なお、上述したように、ΔrはRに比べて充分小さいとみなすことができるため、sin
(α/2)は充分小さいとみなすことができ、以下の近似が成立する。
Figure 2009296517
そのため、式(C)は、以下の式に変形することができる。
Figure 2009296517
また、位相差であるαとΔrとの関係を、
Figure 2009296517
と表せば、式(D)は、以下の式に変形することができる。
Figure 2009296517
すなわち、本実施の形態では、音声入力装置1が式(E)に示す関係を満たしていれば、ユーザ音声を精度よく抽出することができる。
次に、第1及び第2の音孔41,51に入射する雑音の音圧について検討する。
第1及び第2の音孔41,51に入射する雑音成分の振幅を、A,A´とすると、位相差成分を考慮した雑音の音圧Q(N1)及びQ(N2)は、以下の式で表すことができる。
Figure 2009296517
また、第1の音孔41に入射する雑音成分の音圧の強度に対する、差分音圧に含まれる雑音成分の強度の比率を示す雑音強度比ρ(N)は、以下の式で表すことができる。
Figure 2009296517
なお、先に説明したように、第1及び第2の音孔41,51に入射する雑音成分の振幅(強度)はほぼ同じであり、A=A´と扱うことができる。そのため、上記の式(15)は、以下の式に変形することができる。
Figure 2009296517
そして、雑音強度比の大きさは、以下の式で表すことができる。
Figure 2009296517
ここで、上述の式(9)を考慮すると、式(17)は、以下の式に変形することができる。
Figure 2009296517
そして、式(11)を考慮すると、式(18)は、以下の式に変形することができる。
Figure 2009296517
ここで、式(D)を参照すれば、雑音強度比の大きさは、以下の式で表すことができる。
Figure 2009296517
なお、Δr/Rとは、式(A)に示すように、ユーザ音声の振幅成分の強度比である。式(F)から、この音声入力装置1では、雑音強度比がユーザ音声の強度比Δr/Rよりも小さくなることがわかる。
以上のことから、ユーザ音声の位相成分の強度比が振幅成分の強度比よりも小さくなる音声入力装置1によれば(式(B)参照)、雑音強度比がユーザ音声強度比よりも小さくなる(式(F)参照)。逆に言うと、雑音強度比がユーザ音声強度比よりも小さくなるように設計された音声入力装置1によると、精度の高い雑音除去機能を実現することができる。
4.本実施の形態に係る音声入力装置1の製造方法
以下、本実施の形態に係る音声入力装置1の製造方法について説明する。本実施の形態では、第1及び第2の音孔41,51の中心間距離Δrと雑音の波長λとの比率を示すΔr/λの値と、雑音強度比(雑音の位相成分に基づく強度比)との対応関係を示すデータを利用して、音声入力装置1を製造している。なお、音声入力装置2及び3についても、同様の方法で製造することができる。
雑音の位相成分に基づく強度比は、上述した式(18)で表される。そのため、雑音の位相成分に基づく強度比のデシベル値は、以下の式で表すことができる。
Figure 2009296517
そして、式(20)のαに各値を代入すれば、位相差αと、雑音の位相成分に基づく強度比との対応関係を明らかにすることができる。図10には、横軸をα/2πとし、縦軸に雑音の位相成分に基づく強度比(デシベル値)を取った時の、位相差と強度比との対応関係を表すデータの一例を示す。
なお、位相差αは、式(12)に示すように、距離Δrと波長λとの比であるΔr/λの関数で表すことができ、図10の横軸は、Δr/λとみなすことができる。すなわち、図10は、雑音の位相成分に基づく強度比と、Δr/λとの対応関係を示すデータであるといえる。
本実施の形態では、このデータを利用して、音声入力装置1を製造する。図11は、このデータを利用して音声入力装置1を製造する手順について説明するためのフローチャート図である。
はじめに、雑音の強度比(雑音の位相成分に基づく強度比)と、Δr/λとの対応関係を示すデータ(図10参照)を用意する(ステップS10)。
次に、用途に応じて、雑音の強度比を設定する(ステップS12)。なお、本実施の形態では、雑音の強度が低下するように雑音の強度比を設定する必要がある。そのため、本ステップでは、雑音の強度比を、0dB以下に設定する。
次に、当該データに基づいて、雑音の強度比に対応するΔr/λの値を導出する(ステップS14)。
そして、λに主要な雑音の波長を代入することによって、Δrが満たすべき条件を導出する(ステップS16)。
具体例として、音声認識システムや音声翻訳システムで使用される音声周波数帯域の上限である7kHz、その波長が約0.050mとなる環境下で、雑音の強度比が0dB以下になる音声入力装置1を製造する場合について考える。
図10を参照すると、雑音の強度比を0dB以下とするためには、Δr/λの値を約0.16以下とすればよいことがわかる。そして、Δrの値が約8mm以下とすればよいことがわかる。すなわち、Δrの値を、例えば8.1mm以下に設定すれば、雑音除去機能を有する音声入力装置を製造することが可能になる。
なお、通常、雑音は単一の周波数に限定されるものではない。しかし、想定された周波数よりも周波数の低い雑音は、想定された周波数の音波よりも波長が長くなるため、Δr/λの値は小さくなり、この音声入力装置1で除去される。また、音波は、周波数が高いほどエネルギーの減衰が早い。そのため、想定された周波数よりも周波数の高い雑音は、想定された周波数の音波よりも早く減衰するため、音声入力装置1に与える影響を無視することができる。このことから、本実施の形態に係る音声入力装置1は、想定された周波数の音波とは異なる周波数の雑音が存在する環境下でも、優れた雑音除去機能を発揮することができる。
また、本実施の形態では、式(12)からもわかるように、第1及び第2の音孔41,51を結ぶ直線上から入射する雑音を想定した。この雑音は、第1及び第2の音孔41,51の見かけ上の間隔が最も大きくなる雑音であり、現実の使用環境において、位相差が最も大きくなる雑音である。すなわち、本実施の形態に係る音声入力装置1は、位相差が最も大きくなる雑音を除去することが可能に構成されている。そのため、本実施の形態に係る音声入力装置1によると、すべての方向から入射する雑音を除去することができる。
5.本実施の形態に係る音声入力装置1の雑音除去効果
以下、音声入力装置1が奏する効果についてまとめる。なお、音声入力装置2及び3についても同様の効果を奏する。
先に説明したように、音声入力装置1によると、複雑な解析演算処理を行うことなく雑音除去機能を実現することができる。そのため、簡単な構成で、深い雑音除去が可能な高品質の音声入力装置を提供することができる。特に、第1及び第2の音孔41,51の中心間距離Δrを8.1mm以下に設定することで、位相歪が少なく、より精度の高い雑音除去機能を実現することが可能な音声入力装置を提供することができる。
また、複雑な解析演算処理を必要としないため、リアルタイムに話者音声を送信することが可能になる。
次に、音声入力装置1が奏する遅延歪除去効果について説明する。なお、音声入力装置2についても同様の効果を奏する。
先に説明したように、ユーザ音声強度比ρ(S)は以下の式(8)で表される。
Figure 2009296517
ここで、ユーザ音声強度比ρ(S)の位相成分ρ(S)phaseは、sinωt−sin(ωt−α)の項である。式(8)に、
Figure 2009296517
Figure 2009296517
を代入すると、ユーザ音声強度比ρ(S)の位相成分ρ(S)phaseは、以下の式で表すことができる。
Figure 2009296517
したがって、ユーザ音声強度比ρ(S)の位相成分ρ(S)phaseのデシベル値は、以下の式で表すことができる。
Figure 2009296517
そして、式(22)のαに各値を代入すれば、位相差αと、ユーザ音声の位相成分に基づく強度比との対応関係を明らかにすることができる。
図12から図14はマイク間距離とユーザ音声強度比ρ(S)の位相成分ρ(S)phaseの関係について説明するための図である。図12から図14は横軸はΔr/λであり、縦軸はユーザ音声強度比ρ(S)の位相成分ρ(S)phaseである。ユーザ音声強度比ρ(S)の位相成分ρ(S)ph aseとは差動マイクと単体マイクの音圧比の位相成分(ユーザ音声の位相成分に基づく強度比)であり、差動マイクを構成するマイクを単体マイクとして使用した場合の音圧が差動音圧と同じになるところを0デシベルとしている。
すなわち図12から図14のグラフは、Δr/λに対応した差動音圧の遷移を示しており、縦軸が0デシベル以上のエリアは、遅延歪(ノイズ)が大きいと考えることができる。
現行の電話回線は3.4kHzの音声周波数帯域で設計されているが、音声認識システムや音声翻訳システムでは7kHzの周波数まで忠実に再現する必要があるので、以下、7kHzの音声周波数帯域を想定した場合における、遅延による音声歪みの影響について考察する。
図12はマイク間距離(Δr)が8.1mmである場合の、1kHz、7kHzの周波数の音を差動マイクでとらえた場合のユーザ音声強度比ρ(S)の位相成分ρ(S)phaseの分布を示している。
マイク間距離が8.1mmの場合には、図12に示すように1kHz、7kHzのいずれの周波数の音についてもユーザ音声強度比ρ(S)の位相成分ρ(S)phaseは0デシベル以下である。
また図13はマイク間距離(Δr)が20mmである場合の、1kHz、7kHzの周波数の音を差動マイクでとらえた場合のユーザ音声強度比ρ(S)の位相成分ρ(S)phaseの分布を示している。
マイク間距離が20mmになると、図13に示すように1kHzの周波数の音についてはユーザ音声強度比ρ(S)の位相成分ρ(S)phaseは0デシベル以下であるが、7kHzの周波数の音についてはユーザ音声強度比ρ(S)の位相成分ρ(S)phaseが0デシベル以上となり遅延歪(ノイズ)が大きくなっている。なお、ユーザ音声強度比ρ(S)の位相成分ρ(S)phaseが0デシベルとなる周波数は2.8kHzである。
また図14はマイク間距離(Δr)が30mmである場合の、1kHz、7kHzの周波数の音を差動マイクでとらえた場合のユーザ音声強度比ρ(S)の位相成分ρ(S)phaseの分布を示している。
マイク間距離が30mmになると、図14に示すように1kHzの周波数の音についてはユーザ音声強度比ρ(S)の位相成分ρ(S)phaseは0デシベル以下であるが、7kHzの周波数の音についてはユーザ音声強度比ρ(S)の位相成分ρ(S)phaseが0デシベル以上となり遅延歪(ノイズ)が大きくなっている。なお、ユーザ音声強度比ρ(S)の位相成分ρ(S)phaseが0デシベルとなる周波数は1.9kHzである。
したがってマイク間距離を8.1mm以下にすることで、周波数が7kHz帯域まで話者音声を忠実に抽出し、かつ遠方雑音の抑制効果の高い音声入力装置を実現することができる。
本実施の形態では第1及び第2の音孔41,51の中心間距離を8.1mm以下にすることで、7kHz帯域まで話者音声を忠実に抽出し、かつ遠方雑音の抑制効果の高い音声入力装置を実現することができる。
また、音声入力装置1では、位相差が最も大きくなる雑音を除去することができるように、第1及び第2の音孔41,51を設計することが可能になる。そのため、この音声入力装置1によると、全方位から入射する雑音を除去することができる。すなわち、本発明によると、全方位から入射する雑音を除去することが可能な音声入力装置を提供することができる。
図15(A)(B)から図17(A)(B)は周波数とマイク間距離とマイク−音源間の距離毎の差動マイクの指向特性について説明するための図である。
図15(A)(B)はマイク間距離が8.1mm、マイク−音源間距離が1m(遠方雑音に相当)の場合において、音源の周波数がそれぞれ1kHz、7kHzの場合の差動マイクの指向特性を示す図である。
1110は差動マイクの全方位に対する感度(差動音圧)を示すグラフであり、差動マイクの指向特性を示している。また1112は差動マイクを単体マイクとして使用した場合の全方位に対する感度(音圧)を示すグラフであり、単体マイクの均等特性を示している。
1114はマイクを2つ用いて差動マイクを構成する場合の両マイクを結ぶ直線の方向又はマイクを1つで差動マイクを実現する場合にマイクの両面に音波を到達させるための第1の音孔41と第2の音孔51を結ぶ直線の方向(0度−180度、差動マイクを構成する第1の音孔41と第2の音孔51はこの直線上に置かれている)を示している。この直線の方向を0度、180度とし、この直線の方向と直角な方向を90度、270度とする。
1112、1122に示すように単体マイクは全方位から均一に音を取っており指向性を有していない。また、1110、1120に示すように差動マイクは90度、270度方向で多少感度が落ちるが全方位に略均一な指向性を有している。
図15(A)(B)に示すようにマイク間距離が8.1mmの場合には、音源の周波数が1kHz、7kHzの場合ともに、差動マイクの指向特性を示す差動音圧のグラフ1110、1120の示す領域は、それぞれ単体マイクの均等特性を示すグラフ1112、1122の示す領域に内包されており、差動マイクは単体マイクに比べ遠方雑音の抑制効果に優れているといえる。
図16(A)(B)はマイク間距離が20mm、マイク−音源間距離が1mの場合において、音源の周波数がそれぞれ1kHz、7kHzの場合の差動マイクの指向特性を示す図である。
図16(A)に示すように、音源の周波数が1kHzの場合には、差動マイクの指向特性を示すグラフ1130は、単体マイクの均等特性を示すグラフ1132の示す領域に内包されており、差動マイクは単体マイクに比べ遠方雑音の抑制効果に優れているといえる。しかし、図16(B)に示すように、音源の周波数が7kHzの場合には、差動マイクの指向特性を示すグラフ1140は、単体マイクの均等特性を示すグラフ1142の示す領域に内包されておらず、差動マイクは単体マイクに比べ遠方雑音の抑制効果に優れているとはいえない。
図17(A)(B)はマイク間距離が30mm、マイク−音源間距離が1mの場合において、音源の周波数がそれぞれ1kHz、7kHzの場合の差動マイクの指向特性を示す図である。
図17(A)に示すように、音源の周波数が1kHzの場合には、差動マイクの指向特性を示すグラフ1150は、単体マイクの均等特性を示すグラフ1152の示す領域に内包されており、差動マイクは単体マイクに比べ遠方雑音の抑制効果に優れているといえる。しかし、図17(B)に示すように、音源の周波数が7kHzの場合には、差動マイクの指向特性を示すグラフ1160は、単体マイクの均等特性を示すグラフ1162の示す領域に内包されておらず、差動マイクは単体マイクに比べ遠方雑音の抑制効果に優れているとはいえない。
したがって、差動マイクのマイク間距離を8.1mm以下にすることで、7kHz以下の周波数の音については全方位の遠方雑音の抑圧効果が単体マイクに比べ高いといえる。
なお振動板1つで差動マイクを実現する場合にも、マイクの両面に音波を到達させるための第1の音孔41と第2の音孔51の距離について上記と同様のことがいえる。したがって、本実施の形態では第1及び第2の音孔41,51の中心間距離を8.1mm以下にすることで、7kHz以下の音については指向性によらず全方位の遠方雑音を抑圧することが可能なマイクロフォンユニットを実現することができる。
なお、音声入力装置1によると、壁などで反射した後に第1及び第2の音孔41,51に入射したユーザ音声成分も除去することができる。詳しくは、壁などで反射したユーザ音声は、長距離を伝搬した後に音声入力装置1に入射するため、通常のユーザ音声よりも遠くに存在する音源から発生した音声であるとみなすことができ、かつ、反射により大きくエネルギーを消失しているため、雑音成分と同様に、第1及び第2の音孔41,51の間で音圧が大きく減衰することがない。そのため、この音声入力装置1によると、壁などで反射した後に入射するユーザ音声成分も、雑音と同様に(雑音の一種として)除去される。
同様に、ハウリングした音や、工事現場等の大きな非定常雑音についても、全方位に亘って抑圧することができる。
そして、音声入力装置1を利用すれば、雑音を含まない、ユーザ音声を示す信号を取得することができる。そのため、音声入力装置1を利用することで、精度の高い音声認識や音声認証、コマンド生成処理や音声リモコンシステムを実現することができる。
6.音声リモコンシステムの構成例
図18は、本実施の形態に係る音声入力装置の一例を示す概略図である。図18において、音声入力装置1は、電子機器300の上に配置され、電子機器300を遠隔操作するための音声リモコンシステム500の一部として構成されている。電子機器100は、例えばテレビやパソコン、DVDプレーヤであってもよい。音声入力装置1と電子機器300とは、出力インターフェイス70を介して通信する。
音声リモコンシステム500は、音声認識技術を用いてユーザ(話者)の音声による命令を解析し、電子機器300を制御する。音声認識処理は、音声入力装置1の信号処理部60で行ってもよいし、電子機器300で行ってもよい。
これにより、ユーザ(話者)は、音声入力装置1から数m離れた場所から電子機器300に対する命令を音声で指示することにより、電子機器100を操作することができる。
本実施の形態に係る音声リモコンシステム500によれば、周囲雑音と遅延歪とをともに抑制し、話者音声を忠実に抽出できるため、音声認識率の高い音声リモコンシステムを実現することができる。
なお、上述の音声入力装置1に代えて、上述の音声入力装置2乃至4のいずれかを用いても同様の効果が得られる。
上記実施の形態に記載の音声入力装置に含まれる反射板10は、テレビ又はテレビリモコン等の上部に設けるものであってもよい。また、デザイン的に考慮し、通常はテレビ又はテレビリモコン等の背面に配置し、必要時にユーザの操作によってユーザの前に現れる構成でもよい。
本発明は、実施の形態で説明した構成と実質的に同一の構成(例えば、機能、方法及び結果が同一の構成、あるいは目的及び効果が同一の構成)を含む。また、本発明は、実施の形態で説明した構成の本質的でない部分を置き換えた構成を含む。また、本発明は、実施の形態で説明した構成と同一の作用効果を奏する構成又は同一の目的を達成することができる構成を含む。また、本発明は、実施の形態で説明した構成に公知技術を付加した構成を含む。
本実施の形態に係る音声入力装置の構成例を示す機能ブロック図。 本実施の形態に係る音声入力装置の構成例を示す図。 本実施の形態に係る音声入力装置の構成例を示す図。 コンデンサ型マイクロホンの構成例。 焦点からの距離とマイクロホンの感度の関係を示すグラフ。 本実施の形態に係る音声入力装置の構成例を示す図。 本実施の形態に係る音声入力装置の構成例を示す図。 本実施の形態に係る音声入力装置の構成例を示す図。 音波の減衰特性について説明するための図。 位相差と強度比との対応関係を表すデータの一例を示す図。 音声入力装置を製造する手順を示すフローチャート。 音声強度比の分布について説明するための図。 音声強度比の分布について説明するための図。 音声強度比の分布について説明するための図。 差動マイクの指向特性について説明するための図。 差動マイクの指向特性について説明するための図。 差動マイクの指向特性について説明するための図。 本実施の形態に係る音声リモコンシステムの構成例を示す図。 反射板の焦点、第1の音孔及び第2の音孔の位置関係を説明するための模式図。
符号の説明
1,2,3,4 音声入力装置、10 反射板、11 回転放物曲面、12 支持部、20 マイク保持部、20−1,20−2,23,24 マイク保持部材、22 調節部、25 取付部、40 第1のマイクロホン、41 第1の音孔、42 第1の振動板、45 共通振動板、50 第2のマイクロホン、51 第2の音孔、52 第2の振動板、60 信号処理部、70 出力インターフェイス、90 内部空間、91 第1の内部空間、92 第2の内部空間、200 コンデンサ型マイクロホン、202 振動板、204 電極、300 電子機器、500 音声リモコンシステム

Claims (16)

  1. 第1のマイクロホン及び第2のマイクロホンを含み、音声を入力して音声信号を生成する音声入力装置において、
    回転放物曲面を有する反射板と、
    前記第1のマイクロホンに対応する第1の音孔と、
    前記第2のマイクロホンに対応する第2の音孔と、
    前記反射板の回転放物曲面に設けられ、前記第1の音孔及び前記第2の音孔を有するマイク保持部と、
    前記第1のマイクロホン及び前記第2のマイクロホンの出力に基づく信号処理を行う信号処理部とを含み、
    前記第1の音孔と前記第2の音孔との距離が、所与の周波数帯域の音に対して、前記第1の音孔に入射する音声の音圧の強度に対する、前記第1の音孔と前記第2の音孔に入射する音声の差分音圧に含まれる音声成分の強度の比率である音声強度比の位相成分が0dB以下となる距離に設定されていることを特徴とする音声入力装置。
  2. 請求項1に記載の音声入力装置において、
    前記所与の周波数帯域は、7kHz以下の周波数帯域であることを特徴とする音声入力装置。
  3. 第1のマイクロホン及び第2のマイクロホンを含み、音声を入力して音声信号を生成する音声入力装置において、
    回転放物曲面を有する反射板と、
    前記第1のマイクロホンに対応する第1の音孔と、
    前記第2のマイクロホンに対応する第2の音孔と、
    前記反射板の回転放物曲面に設けられ、前記第1の音孔及び前記第2の音孔を有するマイク保持部と、
    前記第1のマイクロホン及び前記第2のマイクロホンの出力に基づく信号処理を行う信号処理部とを含み、
    前記第1の音孔と前記第2の音孔との距離が8.1mm以下となる位置に設けられていることを特徴とする音声入力装置。
  4. 請求項1乃至3のいずれかに記載の音声入力装置において、
    前記第1の音孔は、前記反射板の焦点以外の位置に設けられ、
    前記第2の音孔は、前記反射板の焦点と前記第1の音孔とを結ぶ線分上に設けられていることを特徴とする音声入力装置。
  5. 請求項1乃至4のいずれかに記載の音声入力装置において、
    前記第1の音孔の断面積と前記第2の音孔の断面積とが等しく構成されていることを特徴とする音声入力装置。
  6. 請求項1乃至5のいずれかに記載の音声入力装置において、
    前記第1の音孔の内部空間の容積と前記第2の音孔の内部空間の容積とが等しく構成されていることを特徴とする音声入力装置。
  7. 請求項1乃至6のいずれかに記載の音声入力装置において、
    前記第1のマイクロホンに対応する第1の振動板と、
    前記第2のマイクロホンに対応する第2の振動板とを含み、
    前記第1のマイクロホンにおける前記第1の音孔の開口面から前記第1の振動板までの経路長と、前記第2のマイクロホンにおける前記第2の音孔の開口面から前記第2の振動板までの経路長が等しく構成されていることを特徴とする音声入力装置。
  8. 請求項1乃至7のいずれかに記載の音声入力装置において、
    前記信号処理部は、前記第1のマイクロホンの出力信号と前記第2のマイクロホンの出力信号との差分信号を生成する差動マイク出力処理を行うことを特徴とする音声入力装置。
  9. 請求項8に記載の音声入力装置において、
    前記信号処理部は、前記差動マイク出力処理と、前記第1のマイクロホン及び前記第2のマイクロホンの出力信号のいずれかのみに基づく信号を生成する単体マイク出力処理とを切り替える切替処理を行うことを特徴とする音声入力装置。
  10. 請求項8に記載の音声入力装置において、
    前記信号処理部は、前記第1のマイクロホン及び前記第2のマイクロホンの少なくとも一方の出力感度を変更する感度変更処理を行い、前記感度変更処理後の信号を用いて前記差動マイク出力処理を行うことを特徴とする音声入力装置。
  11. 請求項9及び10のいずれかに記載の音声入力装置において、
    前記信号処理部は、前記第1のマイクロホン及び前記第2のマイクロホンの出力感度を検出する感度検出処理を行い、前記感度検出処理結果に基づいて前記切替処理又は前記感度変更処理を行うことを特徴とする音声入力装置。
  12. 請求項1乃至6のいずれかに記載の音声入力装置において、
    前記第1のマイクロホン及び前記第2のマイクロホンに対応する共通振動板を含み、
    前記第1のマイクロホンにおける前記第1の音孔の開口面から前記共通振動板までの経路長と、前記第2のマイクロホンにおける前記第2の音孔の開口面から前記共通振動板までの経路長が等しく構成されていることを特徴とする音声入力装置。
  13. 請求項1乃至12のいずれかに記載の音声入力装置において、
    前記マイク保持部は、前記第1の音孔と前記第2の音孔との距離を調節可能に構成されていることを特徴とする音声入力装置。
  14. 請求項1乃至12のいずれかに記載の音声入力装置において、
    前記マイク保持部は、前記第1の音孔と前記第2の音孔との距離が固定されていることを特徴とする音声入力装置。
  15. 請求項1乃至14のいずれかに記載の音声入力装置において、
    前記マイク保持部は、前記反射板の焦点と前記第1の音孔及び前記第2の音孔との距離を調節可能に構成されていることを特徴とする音声入力装置。
  16. 請求項1乃至15のいずれかに記載の音声入力装置を含むことを特徴とする音声リモコンシステム。
JP2008150475A 2008-06-09 2008-06-09 音声入力装置及び音声リモコンシステム Withdrawn JP2009296517A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008150475A JP2009296517A (ja) 2008-06-09 2008-06-09 音声入力装置及び音声リモコンシステム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008150475A JP2009296517A (ja) 2008-06-09 2008-06-09 音声入力装置及び音声リモコンシステム

Publications (1)

Publication Number Publication Date
JP2009296517A true JP2009296517A (ja) 2009-12-17

Family

ID=41544232

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008150475A Withdrawn JP2009296517A (ja) 2008-06-09 2008-06-09 音声入力装置及び音声リモコンシステム

Country Status (1)

Country Link
JP (1) JP2009296517A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011217052A (ja) * 2010-03-31 2011-10-27 Ntt Docomo Inc 端末装置、番組特定システム、番組特定方法及びプログラム
JP2015198412A (ja) * 2014-04-03 2015-11-09 日本電信電話株式会社 変換装置
JP2017116486A (ja) * 2015-12-25 2017-06-29 フォスター電機株式会社 パラボラ集音装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011217052A (ja) * 2010-03-31 2011-10-27 Ntt Docomo Inc 端末装置、番組特定システム、番組特定方法及びプログラム
JP2015198412A (ja) * 2014-04-03 2015-11-09 日本電信電話株式会社 変換装置
JP2017116486A (ja) * 2015-12-25 2017-06-29 フォスター電機株式会社 パラボラ集音装置

Similar Documents

Publication Publication Date Title
JP5166122B2 (ja) 音声入力装置
JP4293377B2 (ja) 音声入力装置及びその製造方法、並びに、情報処理システム
JP5128919B2 (ja) マイクロフォンユニット及び音声入力装置
US8180082B2 (en) Microphone unit, close-talking voice input device, information processing system, and method of manufacturing microphone unit
JP5129024B2 (ja) 音声入力装置及び音声会議システム
US8155707B2 (en) Voice input-output device and communication device
JP5114106B2 (ja) 音声入出力装置及び通話装置
JP4293378B2 (ja) マイクロフォンユニット、及び、接話型の音声入力装置、並びに、情報処理システム
JP5325554B2 (ja) 音声入力装置
WO2009145096A1 (ja) 音声入力装置及びその製造方法、並びに、情報処理システム
JP5166117B2 (ja) 音声入力装置及びその製造方法、並びに、情報処理システム
US8605930B2 (en) Microphone unit, close-talking type speech input device, information processing system, and method for manufacturing microphone unit
WO2009142250A1 (ja) 集積回路装置及び音声入力装置、並びに、情報処理システム
US8135144B2 (en) Microphone system, sound input apparatus and method for manufacturing the same
WO2008062848A1 (fr) Dispositif d'entrée vocale, procédé de production de ce dernier et système de traitement d'informations
JP2009296517A (ja) 音声入力装置及び音声リモコンシステム
JP4212635B1 (ja) 音声入力装置及びその製造方法、並びに、情報処理システム
JP5097511B2 (ja) 音声入力装置及びその製造方法、並びに、情報処理システム
JP5097692B2 (ja) 音声入力装置及びその製造方法、並びに、情報処理システム
JP5008638B2 (ja) マイクロフォンユニット、音声入力装置、情報処理システム及びマイクロフォンユニットの製造方法
JP5166007B2 (ja) マイクロフォンユニットおよびその製造方法

Legal Events

Date Code Title Description
A300 Withdrawal of application because of no request for examination

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20110906