JP2009005071A - Voice input/output device and speech apparatus - Google Patents

Voice input/output device and speech apparatus Download PDF

Info

Publication number
JP2009005071A
JP2009005071A JP2007163912A JP2007163912A JP2009005071A JP 2009005071 A JP2009005071 A JP 2009005071A JP 2007163912 A JP2007163912 A JP 2007163912A JP 2007163912 A JP2007163912 A JP 2007163912A JP 2009005071 A JP2009005071 A JP 2009005071A
Authority
JP
Japan
Prior art keywords
voice
microphone
signal
input
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2007163912A
Other languages
Japanese (ja)
Other versions
JP5114106B2 (en
JP2009005071A5 (en
Inventor
Rikuo Takano
陸男 高野
Kiyoshi Sugiyama
精 杉山
Toshimi Fukuoka
敏美 福岡
Masatoshi Ono
雅敏 小野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Funai Electric Co Ltd
Funai Electric Advanced Applied Technology Research Institute Inc
Original Assignee
Funai Electric Co Ltd
Funai Electric Advanced Applied Technology Research Institute Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Funai Electric Co Ltd, Funai Electric Advanced Applied Technology Research Institute Inc filed Critical Funai Electric Co Ltd
Priority to JP2007163912A priority Critical patent/JP5114106B2/en
Priority to CN200810125329.5A priority patent/CN101330769B/en
Priority to EP08011279A priority patent/EP2007167A3/en
Priority to US12/144,284 priority patent/US8155707B2/en
Publication of JP2009005071A publication Critical patent/JP2009005071A/en
Publication of JP2009005071A5 publication Critical patent/JP2009005071A5/ja
Application granted granted Critical
Publication of JP5114106B2 publication Critical patent/JP5114106B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

<P>PROBLEM TO BE SOLVED: To provide a voice input/output device and speech apparatus for providing a comfortable speech environment with less effect of surrounding noise, impulse noise, echo, howling and the like. <P>SOLUTION: The voice input/output device 3010 includes a voice input unit 3030 and a voice output unit 3040. The voice input unit 3030 includes a case with an internal space, a partition member at least partially constituted of a vibrating diaphragm for dividing the internal space into a first space and a second space and an electric signal output circuit which outputs an electric signal that is a first audio signal based on vibration of the vibrating diaphragm. In the case, a microphone unit is mounted having a first through-hole connecting the first space and an external space of the case and a second through-hole connecting the second space and the external space of the case. The voice output unit 3040 includes a surrounding noise detecting section 3042 for detecting the surrounding noise during a speech based on the first audio signal and a volume control section 3044 for controlling the volume of a speaker 3046 based on the level of the detected surrounding noise. <P>COPYRIGHT: (C)2009,JPO&INPIT

Description

本発明は、音声入出力装置及び通話装置に関する。   The present invention relates to a voice input / output device and a communication device.

電話などによる通話や、音声認識、音声録音などに際しては、目的の音声(ユーザの音声)のみを収音することが好ましい。しかし、音声入力装置の使用環境では、背景雑音など目的の音声以外の音が存在することがある。そのため、雑音を除去する機能を有する音声入力装置の開発が進んでいる。   In a telephone call, voice recognition, voice recording, etc., it is preferable to pick up only the target voice (user voice). However, in a usage environment of the voice input device, there may be a sound other than the target voice such as background noise. Therefore, development of a voice input device having a function of removing noise has been advanced.

雑音が存在する使用環境で雑音を除去する技術として、マイクロフォンに鋭い指向性を持たせること、あるいは、音波の到来時刻差を利用して音波の到来方向を識別して信号処理により雑音を除去する方法が知られている。   As a technology to remove noise in a usage environment where noise exists, the microphone has a sharp directivity, or the arrival direction of the sound wave is identified using the difference in arrival time of the sound wave, and the noise is removed by signal processing. The method is known.

また、近年では、電子機器の小型化が進んでおり、音声入力装置を小型化する技術が重要になっている。
特開平7−312638号公報 特開平9−331377号公報 特開2001−186241号公報
In recent years, electronic devices have been downsized, and technology for downsizing a voice input device has become important.
JP 7-312638 A Japanese Patent Laid-Open No. 9-331377 JP 2001-186241 A

マイクロフォンに鋭い指向性を持たせるためには、多数の振動膜を並べる必要があり、小型化は困難である。   In order to give the microphone a sharp directivity, it is necessary to arrange a large number of vibrating membranes, and miniaturization is difficult.

また、音波の到来時刻差を利用して音波の到来方向を精度よく検出するためには、複数の振動膜を、可聴音波の数波長分の1程度の間隔で設置する必要があるため、小型化は困難である。   In addition, in order to accurately detect the direction of arrival of sound waves using the difference in arrival times of sound waves, it is necessary to install a plurality of vibrating membranes at intervals of about one-several wavelengths of audible sound waves. Is difficult.

また電話機、携帯電話、あるいはヘッドセットのマイク・スピーカユニットなどの音声入出力機器を雑音環境において使用する場合、一般に相手の音声を明瞭に聞き取ることは困難である。   In addition, when a voice input / output device such as a telephone, a mobile phone, or a headset microphone / speaker unit is used in a noisy environment, it is generally difficult to clearly hear the voice of the other party.

本発明の目的は、周囲雑音や衝撃音やエコーやハウリング等の影響の少ない快適な通話環境を提供可能な音声入出力装置及び通話装置を提供することにある。   An object of the present invention is to provide a voice input / output device and a call device that can provide a comfortable call environment with less influence of ambient noise, impact sound, echo, howling, and the like.

(1)本発明は、
マイクロフォンからの入力に基づき第1の音声信号を生成する音声入力部と、
第2の音声信号に基づきスピーカから音声を出力する音声出力部とを含む音声入出力装置であって、
前記音声入力部は、
内部空間を有する筐体と、前記筐体内に設けられた、前記内部空間を第1の空間と第2の空間とに分割する、少なくとも一部が振動膜で構成された仕切り部材と、前記振動膜の振動に基づいて第1の音声信号である電気信号を出力する電気信号出力回路と、を含み、前記筐体には、前記第1の空間と前記筐体の外部空間とを連通する第1の貫通穴と、前記第2の空間と前記筐体の外部空間とを連通する第2の貫通穴とが形成されているマイクロフォンユニットが実装され、
前記音声出力部は、
前記第1の音声信号に基づき通話時の周囲雑音を検出する周囲雑音検出部と、
検出された周囲雑音の大きさに基づき、前記スピーカの音量を制御する音量制御部とを含むことを特徴とする。
(1) The present invention
An audio input unit that generates a first audio signal based on an input from a microphone;
A voice input / output device including a voice output unit that outputs voice from a speaker based on a second voice signal,
The voice input unit
A housing having an internal space, a partition member provided in the housing, which divides the internal space into a first space and a second space, at least a part of which is made of a vibrating membrane; and the vibration An electrical signal output circuit that outputs an electrical signal that is a first audio signal based on vibrations of the membrane, and the housing communicates with the first space and an external space of the housing. A microphone unit in which a through-hole of 1 and a second through-hole communicating with the second space and the external space of the housing are formed is mounted;
The audio output unit
An ambient noise detector for detecting ambient noise during a call based on the first audio signal;
And a volume control unit that controls the volume of the speaker based on the magnitude of the detected ambient noise.

通話時の周囲雑音は、例えば通話開始時に検出された電気信号(音圧、例えばマイクロフォンが検出する電圧)で判断してもよい。一般に通話開始可能状態になってすぐにではなく、1秒程度立ってから、音声のやり取りを開始するので、通話開始直後に検出された電気信号は周囲雑音とみおなして出力する音量を制御するようにしてもよい。   The ambient noise during a call may be determined by, for example, an electrical signal (sound pressure, for example, a voltage detected by a microphone) detected at the start of the call. In general, voice exchange starts after standing for about 1 second, not immediately after the call can be started, so that the electrical signal detected immediately after the start of the call is regarded as ambient noise and controls the output volume. You may do it.

また通話中の電気信号の遷移に基づき、音声が入力有り区間と音声入力無し区間を判断し、音声入力無し区間に検出された電気信号は周囲雑音とみおなして出力する音量を制御するようにしてもよい。   Also, based on the transition of the electrical signal during a call, it is determined whether there is a voice input section or no voice input section, and the electrical signal detected in the voice input no section is regarded as ambient noise and the output volume is controlled. May be.

音声入出力装置は、電話機、携帯電話等の通話装置、あるいはヘッドセットのマイク・スピーカユニット等でもよいし、マイクとスピーカを備えた楽音再生装置(カラオケセット)、マイクとスピーカを備えたテレビやラジオやパーソナルコンピュータ等でもよい。   The voice input / output device may be a telephone, a mobile phone or other telephone communication device, or a headset microphone / speaker unit, a musical sound playback device (karaoke set) having a microphone and a speaker, a TV having a microphone and a speaker, A radio or personal computer may be used.

スピーカの音量は検出された周囲雑音の大きさに基づき、連続的または段階的に変化させるように制御してもよい。   The loudspeaker volume may be controlled to change continuously or stepwise based on the magnitude of the detected ambient noise.

本発明によると、振動膜の両面に、ユーザ音声及び雑音が入射する。振動膜の両面に入射する音声のうち、雑音成分は、ほぼ同じ音圧になるため、振動膜で打ち消しあう。そのため、振動膜を振動させる音圧は、ユーザ音声を示す音圧であるとみなすことができ、振動膜の振動に基づいて取得された電気信号は、雑音が除去された、ユーザ音声を示す電気信号であるとみなすことができる。   According to the present invention, user voice and noise are incident on both sides of the diaphragm. Of the sound incident on both sides of the diaphragm, the noise component has almost the same sound pressure, and therefore cancels with the diaphragm. Therefore, the sound pressure that vibrates the diaphragm can be regarded as the sound pressure indicating the user voice, and the electric signal acquired based on the vibration of the diaphragm is an electric signal indicating the user voice from which noise has been removed. It can be considered as a signal.

このことから、本発明によると、簡単な構成で、深い雑音除去が可能な高品質のマイクロフォンユニットを提供することができる。   Therefore, according to the present invention, it is possible to provide a high-quality microphone unit capable of deep noise removal with a simple configuration.

かかる音声入出力機器等を雑音環境において使用する場合、第2の音声信号(例えば通話相手の音声)を明瞭に聞き取ることが難いが、本発明によれば音声入力用のマイクロフォンユニットを用いて、当該のマイクロフォンユニットから得る周囲雑音の強度に合わせてスピーカの音量を連続的または段階的に制御することにより、音声入力者にスピーカから出力される音を聞き取りやすくすること、例えば通話の場合には送話と受話を容易にならしめる音声音声入出力装置を提供することができる。   When such a voice input / output device or the like is used in a noisy environment, it is difficult to clearly hear the second voice signal (for example, the voice of the other party), but according to the present invention, the microphone unit for voice input is used, By controlling the volume of the speaker continuously or stepwise according to the intensity of the ambient noise obtained from the microphone unit, it is easy for the voice input person to hear the sound output from the speaker. It is possible to provide a voice / voice input / output device that facilitates transmission and reception.

(2)本発明は、
マイクロフォンからの入力に基づき第1の音声信号を生成する音声入力部と、
第2の音声信号に基づきスピーカから音声を出力する音声出力部とを含む音声入出力装置であって、
前記音声入力部は、
第1のマイクロフォンを構成する第1の振動膜と、第2のマイクロフォンを構成する第2の振動膜と、前記第1のマイクロフォンで取得された第1の電圧信号と、前記第2のマイクロフォンで取得された第2の電圧信号とを受け付けて、前記第1及び第2の電圧信号の差を示す差分信号に基づき第1の音声信号を生成する差分信号生成回路と、が形成された半導体基板を有する集積回路装置が実装され、
前記音声出力部は、
前記第1の音声信号に基づき通話時の周囲雑音を検出する周囲雑音検出部と、
検出された周囲雑音の大きさに基づき、前記スピーカの音量を制御する音量制御部とを含むことを特徴とする。
(2) The present invention
An audio input unit that generates a first audio signal based on an input from a microphone;
A voice input / output device including a voice output unit that outputs voice from a speaker based on a second voice signal,
The voice input unit
A first vibrating membrane constituting a first microphone, a second vibrating membrane constituting a second microphone, a first voltage signal acquired by the first microphone, and a second microphone; A semiconductor substrate formed with a difference signal generation circuit that receives the acquired second voltage signal and generates a first audio signal based on a difference signal indicating a difference between the first and second voltage signals An integrated circuit device is mounted,
The audio output unit
An ambient noise detector for detecting ambient noise during a call based on the first audio signal;
And a volume control unit that controls the volume of the speaker based on the magnitude of the detected ambient noise.

通話時の周囲雑音は、例えば通話開始時に検出された電気信号(音圧、例えばマイクロフォンが検出する電圧)で判断してもよい。一般に通話開始可能状態になってすぐにではなく、1秒程度立ってから、音声のやり取りを開始するので、通話開始直後に検出された電気信号は周囲雑音とみおなして出力する音量を制御するようにしてもよい。   The ambient noise during a call may be determined by, for example, an electrical signal (sound pressure, for example, a voltage detected by a microphone) detected at the start of the call. In general, voice exchange starts after standing for about 1 second, not immediately after the call can be started, so that the electrical signal detected immediately after the start of the call is regarded as ambient noise and controls the output volume. You may do it.

また通話中の電気信号の遷移に基づき、音声が入力有り区間と音声入力無し区間を判断し、音声入力無し区間に検出された電気信号は周囲雑音とみおなして出力する音量を制御するようにしてもよい。   Also, based on the transition of the electrical signal during a call, it is determined whether there is a voice input section or no voice input section, and the electrical signal detected in the voice input no section is regarded as ambient noise and the output volume is controlled. May be.

音声入出力装置は、電話機、携帯電話等の通話装置、あるいはヘッドセットのマイク・スピーカユニット等でもよいし、マイクとスピーカを備えた楽音再生装置(カラオケセット)、マイクとスピーカを備えたテレビやラジオやパーソナルコンピュータ等でもよい。   The voice input / output device may be a telephone, a mobile phone or other telephone communication device, or a headset microphone / speaker unit, a musical sound playback device (karaoke set) having a microphone and a speaker, a TV having a microphone and a speaker, A radio or personal computer may be used.

スピーカの音量は検出された周囲雑音の大きさに基づき、連続的または段階的に変化させるように制御してもよい。   The loudspeaker volume may be controlled to change continuously or stepwise based on the magnitude of the detected ambient noise.

本発明によると、2つの電圧信号の差を示す差分信号を生成するだけの単純な処理で、雑音成分が除去された音声を示す信号を生成することができる。また、本発明によると、第1及び第2の振動膜と、差分信号生成回路30とが、1つの半導体基板に形成されるため、集積回路装置の外形を小さくすることができるとともに、集積回路装置の精度を高くすることができる。   According to the present invention, it is possible to generate a signal indicating a sound from which a noise component has been removed by a simple process that only generates a difference signal indicating a difference between two voltage signals. According to the present invention, since the first and second vibrating membranes and the differential signal generation circuit 30 are formed on one semiconductor substrate, the external shape of the integrated circuit device can be reduced, and the integrated circuit The accuracy of the apparatus can be increased.

このことから、本発明によると、外形が小さく、かつ、精度の高い雑音除去機能を実現することが可能な集積回路装置を提供することができる。   Thus, according to the present invention, it is possible to provide an integrated circuit device that has a small outer shape and can realize a highly accurate noise removal function.

なお集積回路装置は、接話型の音声入力装置の音声入力素子(マイク素子)として適用することができる。このとき、集積回路装置は、前記第1及び第2の振動膜が、前記差分信号に含まれる前記雑音成分の強度の、前記第1又は第2の電圧信号に含まれる前記雑音成分の強度に対する比率を示す雑音強度比が、前記差分信号に含まれる入力音声成分の強度の、前記第1又は第2の電圧信号に含まれる前記入力音声成分の強度に対する比率を示す音声強度比よりも小さくなるように配置されていてもよい。このとき、雑音強度比は雑音の位相差成分に基づく強度比であってもよく、音声強度比は入力音声の振幅成分に基づく強度比であってもよい。   Note that the integrated circuit device can be applied as a voice input element (microphone element) of a close-talking voice input device. At this time, in the integrated circuit device, the first and second vibrating membranes have an intensity of the noise component included in the difference signal with respect to an intensity of the noise component included in the first or second voltage signal. The noise intensity ratio indicating the ratio is smaller than the audio intensity ratio indicating the ratio of the intensity of the input audio component included in the difference signal to the intensity of the input audio component included in the first or second voltage signal. It may be arranged as follows. At this time, the noise intensity ratio may be an intensity ratio based on the phase difference component of noise, and the voice intensity ratio may be an intensity ratio based on the amplitude component of the input voice.

なお、この集積回路装置(半導体基板)は、いわゆるメムス(MEMS:Micro Electro Mechanical Systems)として構成されていてもよい。   The integrated circuit device (semiconductor substrate) may be configured as a so-called MEMS (Micro Electro Mechanical Systems).

かかる音声入出力機器等を雑音環境において使用する場合、第2の音声信号(例えば通話相手の音声)を明瞭に聞き取ることが難いが、本発明によれば音声入力用のマイクロフォンユニットを用いて、当該のマイクロフォンユニットから得る周囲雑音の強度に合わせてスピーカの音量を連続的または段階的に制御することにより、音声入力者にスピーカから出力される音を聞き取りやすくすること、例えば通話の場合には送話と受話を容易にならしめる音声音声入出力装置を提供することができる。   When such a voice input / output device or the like is used in a noisy environment, it is difficult to clearly hear the second voice signal (for example, the voice of the other party), but according to the present invention, the microphone unit for voice input is used, By controlling the volume of the speaker continuously or stepwise according to the intensity of the ambient noise obtained from the microphone unit, it is easy for the voice input person to hear the sound output from the speaker. It is possible to provide a voice / voice input / output device that facilitates transmission and reception.

(3)本発明は、
マイクロフォンからの入力に基づき第1の音声信号を生成する音声入力部と、
第2の音声信号に基づきスピーカから音声を出力する音声出力部とを含む音声入出力装置であって、
前記音声入力部は、
第1の振動膜を有する第1のマイクロフォンと、
第2の振動膜を有する第2のマイクロフォンと、
前記第1のマイクロフォンで取得された第1の電圧信号と、前記第2のマイクロフォンで取得された第2の電圧信号との差を示す差分信号に基づき第1の音声信号を生成する差分信号生成部と、を含み、
前記第1及び第2の振動膜は、前記差分信号に含まれる雑音成分の強度の、前記第1又は第2の電圧信号に含まれる前記雑音成分の強度に対する比率を示す雑音強度比が、前記差分信号に含まれる入力音声成分の強度の、前記第1又は第2の電圧信号に含まれる前記入力音声成分の強度に対する比率を示す入力音声強度比よりも小さくなるように配置され、
前記音声出力部は、
前記第1の音声信号に基づき通話時の周囲雑音を検出する周囲雑音検出部と、
検出された周囲雑音の大きさに基づき、前記スピーカの音量を制御する音量制御部とを含むことを特徴とする。
(3) The present invention
An audio input unit that generates a first audio signal based on an input from a microphone;
A voice input / output device including a voice output unit that outputs voice from a speaker based on a second voice signal,
The voice input unit
A first microphone having a first vibrating membrane;
A second microphone having a second vibrating membrane;
Difference signal generation for generating a first audio signal based on a difference signal indicating a difference between a first voltage signal acquired by the first microphone and a second voltage signal acquired by the second microphone And
The first and second diaphragms have a noise intensity ratio indicating a ratio of the intensity of the noise component included in the differential signal to the intensity of the noise component included in the first or second voltage signal. Arranged so as to be smaller than the input voice intensity ratio indicating the ratio of the intensity of the input voice component included in the difference signal to the intensity of the input voice component included in the first or second voltage signal;
The audio output unit
An ambient noise detector for detecting ambient noise during a call based on the first audio signal;
And a volume control unit that controls the volume of the speaker based on the magnitude of the detected ambient noise.

通話時の周囲雑音は、例えば通話開始時に検出された電気信号(音圧、例えばマイクロフォンが検出する電圧)で判断してもよい。一般に通話開始可能状態になってすぐにではなく、1秒程度立ってから、音声のやり取りを開始するので、通話開始直後に検出された電気信号は周囲雑音とみおなして出力する音量を制御するようにしてもよい。   The ambient noise during a call may be determined by, for example, an electrical signal (sound pressure, for example, a voltage detected by a microphone) detected at the start of the call. In general, voice exchange starts after standing for about 1 second, not immediately after the call can be started, so that the electrical signal detected immediately after the start of the call is regarded as ambient noise and controls the output volume. You may do it.

また通話中の電気信号の遷移に基づき、音声が入力有り区間と音声入力無し区間を判断し、音声入力無し区間に検出された電気信号は周囲雑音とみおなして出力する音量を制御するようにしてもよい。   Also, based on the transition of the electrical signal during a call, it is determined whether there is a voice input section or no voice input section, and the electrical signal detected in the voice input no section is regarded as ambient noise and the output volume is controlled. May be.

音声入出力装置は、電話機、携帯電話等の通話装置、あるいはヘッドセットのマイク・スピーカユニット等でもよいし、マイクとスピーカを備えた楽音再生装置(カラオケセット)、マイクとスピーカを備えたテレビやラジオやパーソナルコンピュータ等でもよい。   The voice input / output device may be a telephone, a mobile phone or other telephone communication device, or a headset microphone / speaker unit, a musical sound playback device (karaoke set) having a microphone and a speaker, a TV having a microphone and a speaker, A radio or personal computer may be used.

スピーカの音量は検出された周囲雑音の大きさに基づき、連続的または段階的に変化させるように制御してもよい。   The loudspeaker volume may be controlled to change continuously or stepwise based on the magnitude of the detected ambient noise.

本発明によれば、第1及び第2のマイクロフォン(第1及び第2の振動膜)が所定の条件を満たすように配置されている。これによると、第1及び第2のマイクロフォンで取得された第1及び第2の電圧信号の差を示す差分信号を、雑音成分が除去された、入力音声を示す信号とみなすことができる。そのため、本発明によると、差分信号を生成するだけの単純な構成で雑音除去機能を実現することが可能な音声入力装置を提供することができる。   According to the present invention, the first and second microphones (first and second vibrating membranes) are arranged so as to satisfy a predetermined condition. According to this, the difference signal indicating the difference between the first and second voltage signals acquired by the first and second microphones can be regarded as a signal indicating the input sound from which the noise component has been removed. Therefore, according to the present invention, it is possible to provide a voice input device capable of realizing a noise removal function with a simple configuration that only generates a differential signal.

なお、本発明の音声入出力装置では、差分信号生成部は、第1及び第2の電圧信号に対する解析処理(フーリエ解析処理など)を行うことなく、差分信号を生成する。そのため、差分信号生成部の信号処理負担を軽減し、あるいは、差分信号生成部を非常に簡易な回路によって実現することが可能になる。   In the voice input / output device of the present invention, the difference signal generation unit generates a difference signal without performing analysis processing (Fourier analysis processing or the like) on the first and second voltage signals. Therefore, it is possible to reduce the signal processing load of the differential signal generation unit, or to realize the differential signal generation unit with a very simple circuit.

このことから、本発明によると、小型化が可能で、かつ、精度の高い雑音除去機能を実現することが可能な音声入力装置を提供することができる。   Therefore, according to the present invention, it is possible to provide a voice input device that can be miniaturized and can realize a highly accurate noise removal function.

なお、この音声入力装置では、第1及び第2の振動膜は、雑音成分の位相差成分に基づく強度比が、入力音声成分の振幅に基づく強度比よりも小さくなるように配置されていてもよい。   In this voice input device, the first and second diaphragms may be arranged such that the intensity ratio based on the phase difference component of the noise component is smaller than the intensity ratio based on the amplitude of the input voice component. Good.

かかる音声入出力機器等を雑音環境において使用する場合、第2の音声信号(例えば通話相手の音声)を明瞭に聞き取ることが難いが、本発明によれば音声入力用のマイクロフォンユニットを用いて、当該のマイクロフォンユニットから得る周囲雑音の強度に合わせてスピーカの音量を連続的または段階的に制御することにより、音声入力者にスピーカから出力される音を聞き取りやすくすること、例えば通話の場合には送話と受話を容易にならしめる音声音声入出力装置を提供することができる。   When such a voice input / output device or the like is used in a noisy environment, it is difficult to clearly hear the second voice signal (for example, the voice of the other party), but according to the present invention, the microphone unit for voice input is used, By controlling the volume of the speaker continuously or stepwise according to the intensity of the ambient noise obtained from the microphone unit, it is easy for the voice input person to hear the sound output from the speaker. It is possible to provide a voice / voice input / output device that facilitates transmission and reception.

(4)本発明は、
マイクロフォンからの入力に基づき第1の音声信号を生成するハンズフリー型の音声入力部と、
第2の音声信号に基づきスピーカから音声を出力する音声出力部とを含むハンズフリー型の音声入出力装置であって、
前記音声入力部は、
内部空間を有する筐体と、前記筐体内に設けられた、前記内部空間を第1の空間と第2の空間とに分割する、少なくとも一部が振動膜で構成された仕切り部材と、前記振動膜の振動に基づいて第1の音声信号である電気信号を出力する電気信号出力回路と、を含み、前記筐体には、前記第1の空間と前記筐体の外部空間とを連通する第1の貫通穴と、前記第2の空間と前記筐体の外部空間とを連通する第2の貫通穴とが形成されているマイクロフォンユニットが実装されていることを特徴とする。
(4) The present invention
A hands-free type audio input unit that generates a first audio signal based on an input from a microphone;
A hands-free type voice input / output device including a voice output unit that outputs voice from a speaker based on a second voice signal,
The voice input unit
A housing having an internal space, a partition member provided in the housing, which divides the internal space into a first space and a second space, at least a part of which is made of a vibrating membrane; and the vibration An electrical signal output circuit that outputs an electrical signal that is a first audio signal based on vibrations of the membrane, and the housing communicates with the first space and an external space of the housing. A microphone unit in which one through hole and a second through hole that communicates the second space and the external space of the housing are formed is mounted.

ハンズフリー型の音声入力部とは、音声入力者が音声入力部を把持せずに音声入力可能な音声入力部のことをいい、音声入力部は例えば卓上や壁等に設置されて、周囲の音声を拾うもので、例えば自動車内に設置されるハンズフリー型携帯電話やTV会議等で用いられるハンズフリー拡声通話装置等も是に該当する。   A hands-free voice input unit refers to a voice input unit that allows a voice input person to input voice without gripping the voice input unit. The voice input unit is installed on a table or a wall, for example, For example, a hands-free mobile phone installed in an automobile or a hands-free loudspeaker used in a video conference or the like is also applicable.

本発明によると、振動膜の両面に、ユーザ音声及び雑音が入射する。振動膜の両面に入射する音声のうち、雑音成分は、ほぼ同じ音圧になるため、振動膜で打ち消しあう。そのため、振動膜を振動させる音圧は、ユーザ音声を示す音圧であるとみなすことができ、振動膜の振動に基づいて取得された電気信号は、雑音が除去された、ユーザ音声を示す電気信号であるとみなすことができる。   According to the present invention, user voice and noise are incident on both sides of the diaphragm. Of the sound incident on both sides of the diaphragm, the noise component has almost the same sound pressure, and therefore cancels with the diaphragm. Therefore, the sound pressure that vibrates the diaphragm can be regarded as the sound pressure indicating the user voice, and the electric signal acquired based on the vibration of the diaphragm is an electric signal indicating the user voice from which noise has been removed. It can be considered as a signal.

このことから、本発明によると、簡単な構成で、深い雑音除去が可能な高品質のマイクロフォンユニットを提供することができる。   Therefore, according to the present invention, it is possible to provide a high-quality microphone unit capable of deep noise removal with a simple configuration.

またマイクロフォンユニットは、機器に直接的・間接的作用する衝撃音を容易にかつ極めて効果的に抑圧する特性を備えている。すなわち空気中を伝搬する音のみならず、固体中を伝搬する音も除去することが可能である。固体中の音の伝搬速度は空気中の伝搬速度に比べて極めて速い(約10倍程度)ため、マイクロフォンユニットが設置された固体に加わった衝撃音(雑音)は、ほぼ同時に前記振動膜に到達するため、空気中を伝搬する雑音と同様に除去することができる。   In addition, the microphone unit has a characteristic of easily and extremely effectively suppressing the impact sound that acts directly or indirectly on the device. That is, not only the sound propagating in the air but also the sound propagating in the solid can be removed. Since the propagation speed of sound in solids is extremely fast (about 10 times) compared to the propagation speed in air, the impact sound (noise) applied to the solid on which the microphone unit is installed reaches the vibrating membrane almost simultaneously. Therefore, it can be removed in the same way as noise propagating in the air.

またマイクロフォンとスピーカ間に生じるハウリング抑圧性能にも優れることから、例えば卓上に設置したハンズフリー電話機などに組み込むことにより、高性能のハンズフリー拡声通話装置を提供することができる。   Further, since it is excellent in the performance of suppressing howling generated between the microphone and the speaker, it is possible to provide a high-performance hands-free loudspeaker device by incorporating it in a hands-free telephone set on a table, for example.

従って、本発明によればマイクロフォンに直接・間接に作用する衝撃雑音などに対しても雑音抑圧性能に優れることから、ハンズフリー型の音声入出力装置に組み込むことにより従来から極めて不快でまた除去が困難であった衝撃雑音下においても優れた性能の機器を提供することが出来る。   Therefore, according to the present invention, it is excellent in noise suppression performance against impact noise directly or indirectly acting on a microphone. Therefore, by incorporating it in a hands-free type voice input / output device, it has been extremely uncomfortable and can be removed. It is possible to provide a device with excellent performance even under impact noise that has been difficult.

なおパソコンのキーボード、作業ロボット、デジタル録音機、補聴器などに組み込んでも同様の効果を得ることができる。   The same effect can be obtained by incorporating it into a keyboard of a personal computer, a working robot, a digital recorder, a hearing aid, or the like.

(5)本発明は、
マイクロフォンからの入力に基づき第1の音声信号を生成するハンズフリー型の音声入力部と、
第2の音声信号に基づきスピーカから音声を出力する音声出力部とを含むハンズフリー型の音声入出力装置であって、
前記音声入力部は、
第1のマイクロフォンを構成する第1の振動膜と、第2のマイクロフォンを構成する第2の振動膜と、前記第1のマイクロフォンで取得された第1の電圧信号と、前記第2のマイクロフォンで取得された第2の電圧信号とを受け付けて、前記第1及び第2の電圧信号の差を示す差分信号に基づき第1の音声信号を生成する差分信号生成回路と、が形成された半導体基板を有する集積回路装置が実装されていることを特徴とする。
(5) The present invention
A hands-free type audio input unit that generates a first audio signal based on an input from a microphone;
A hands-free type voice input / output device including a voice output unit that outputs voice from a speaker based on a second voice signal,
The voice input unit
A first vibrating membrane constituting a first microphone, a second vibrating membrane constituting a second microphone, a first voltage signal acquired by the first microphone, and a second microphone; A semiconductor substrate formed with a difference signal generation circuit that receives the acquired second voltage signal and generates a first audio signal based on a difference signal indicating a difference between the first and second voltage signals An integrated circuit device having the above is mounted.

ハンズフリー型の音声入力部とは、音声入力者が音声入力部を把持せずに音声入力可能な音声入力部のことをいい、音声入力部は例えば卓上や壁等に設置されて、周囲の音声を拾うもので、例えば自動車内に設置されるハンズフリー型携帯電話やTV会議等で用いられるハンズフリー拡声通話装置等も是に該当する。   A hands-free voice input unit refers to a voice input unit that allows a voice input person to input voice without gripping the voice input unit. The voice input unit is installed on a table or a wall, for example, For example, a hands-free mobile phone installed in an automobile, a hands-free loudspeaker used in a TV conference, or the like, which is used to pick up voice, also corresponds to the right.

本発明によると、2つの電圧信号の差を示す差分信号を生成するだけの単純な処理で、雑音成分が除去された音声を示す信号を生成することができる。また、本発明によると、第1及び第2の振動膜と、差分信号生成回路30とが、1つの半導体基板に形成されるため、集積回路装置の外形を小さくすることができるとともに、集積回路装置の精度を高くすることができる。   According to the present invention, it is possible to generate a signal indicating a sound from which a noise component has been removed by a simple process that only generates a difference signal indicating a difference between two voltage signals. According to the present invention, since the first and second vibrating membranes and the differential signal generation circuit 30 are formed on one semiconductor substrate, the external shape of the integrated circuit device can be reduced, and the integrated circuit The accuracy of the apparatus can be increased.

このことから、本発明によると、外形が小さく、かつ、精度の高い雑音除去機能を実現することが可能な集積回路装置を提供することができる。   Thus, according to the present invention, it is possible to provide an integrated circuit device that has a small outer shape and can realize a highly accurate noise removal function.

なお集積回路装置は、接話型の音声入力装置の音声入力素子(マイク素子)として適用することができる。このとき、集積回路装置は、前記第1及び第2の振動膜が、前記差分信号に含まれる前記雑音成分の強度の、前記第1又は第2の電圧信号に含まれる前記雑音成分の強度に対する比率を示す雑音強度比が、前記差分信号に含まれる入力音声成分の強度の、前記第1又は第2の電圧信号に含まれる前記入力音声成分の強度に対する比率を示す音声強度比よりも小さくなるように配置されていてもよい。このとき、雑音強度比は雑音の位相差成分に基づく強度比であってもよく、音声強度比は入力音声の振幅成分に基づく強度比であってもよい。   Note that the integrated circuit device can be applied as a voice input element (microphone element) of a close-talking voice input device. At this time, in the integrated circuit device, the first and second vibrating membranes have an intensity of the noise component included in the difference signal with respect to an intensity of the noise component included in the first or second voltage signal. The noise intensity ratio indicating the ratio is smaller than the audio intensity ratio indicating the ratio of the intensity of the input audio component included in the difference signal to the intensity of the input audio component included in the first or second voltage signal. It may be arranged as follows. At this time, the noise intensity ratio may be an intensity ratio based on the phase difference component of noise, and the voice intensity ratio may be an intensity ratio based on the amplitude component of the input voice.

なお、この集積回路装置(半導体基板)は、いわゆるメムス(MEMS:Micro Electro Mechanical Systems)として構成されていてもよい。   The integrated circuit device (semiconductor substrate) may be configured as a so-called MEMS (Micro Electro Mechanical Systems).

またマイクロフォンユニットは、機器に直接的・間接的作用する衝撃音を容易にかつ極めて効果的に抑圧する特性を備えている。すなわち空気中を伝搬する音のみならず、固体中を伝搬する音も除去することが可能である。固体中の音の伝搬速度は空気中の伝搬速度に比べて極めて速い(約10倍程度)ため、マイクロフォンユニットが設置された固体に加わった衝撃音(雑音)は、ほぼ同時に前記第1,第2の振動膜に到達するため、空気中を伝搬する雑音と同様に除去することができる。   In addition, the microphone unit has a characteristic of easily and extremely effectively suppressing the impact sound that acts directly or indirectly on the device. That is, not only the sound propagating in the air but also the sound propagating in the solid can be removed. Since the propagation speed of sound in a solid is extremely high (about 10 times) compared to the propagation speed in air, the impact sound (noise) applied to the solid on which the microphone unit is installed is almost simultaneously Since it reaches the vibration film 2, it can be removed in the same manner as noise that propagates in the air.

またマイクロフォンとスピーカ間に生じるハウリング抑圧性能にも優れることから、例えば卓上に設置したハンズフリー電話機などに組み込むことにより、高性能のハンズフリー拡声通話装置を提供することができる。   Further, since it is excellent in the performance of suppressing howling generated between the microphone and the speaker, it is possible to provide a high-performance hands-free loudspeaker device by incorporating it in a hands-free telephone set on a table, for example.

従って、本発明によればマイクロフォンに直接・間接に作用する衝撃雑音などに対しても雑音抑圧性能に優れることから、ハンズフリー型の音声入出力装置に組み込むことにより従来から極めて不快でまた除去が困難であった衝撃雑音下においても優れた性能の機器を提供することが出来る。   Therefore, according to the present invention, it is excellent in noise suppression performance against impact noise directly or indirectly acting on a microphone. Therefore, by incorporating it in a hands-free type voice input / output device, it has been extremely uncomfortable and can be removed. It is possible to provide a device with excellent performance even under impact noise that has been difficult.

なおパソコンのキーボード、作業ロボット、デジタル録音機、補聴器などに組み込んでも同様の効果を得ることができる。   The same effect can be obtained by incorporating it into a keyboard of a personal computer, a working robot, a digital recorder, a hearing aid, or the like.

(6)本発明は、
マイクロフォンからの入力に基づき第1の音声信号を生成するハンズフリー型の音声入力部と、
第2の音声信号に基づきスピーカから音声を出力する音声出力部とを含むハンズフリー型の音声入出力装置であって、
前記音声入力部は、
第1の振動膜を有する第1のマイクロフォンと、
第2の振動膜を有する第2のマイクロフォンと、
前記第1のマイクロフォンで取得された第1の電圧信号と、前記第2のマイクロフォンで取得された第2の電圧信号との差を示す差分信号に基づき第1の音声信号を生成する差分信号生成部と、を含み、
前記第1及び第2の振動膜は、前記差分信号に含まれる雑音成分の強度の、前記第1又は第2の電圧信号に含まれる前記雑音成分の強度に対する比率を示す雑音強度比が、前記差分信号に含まれる入力音声成分の強度の、前記第1又は第2の電圧信号に含まれる前記入力音声成分の強度に対する比率を示す入力音声強度比よりも小さくなるように配置されていることを特徴とする。
(6) The present invention
A hands-free type audio input unit that generates a first audio signal based on an input from a microphone;
A hands-free type voice input / output device including a voice output unit that outputs voice from a speaker based on a second voice signal,
The voice input unit
A first microphone having a first vibrating membrane;
A second microphone having a second vibrating membrane;
Difference signal generation for generating a first audio signal based on a difference signal indicating a difference between a first voltage signal acquired by the first microphone and a second voltage signal acquired by the second microphone And
The first and second diaphragms have a noise intensity ratio indicating a ratio of the intensity of the noise component included in the differential signal to the intensity of the noise component included in the first or second voltage signal. The input voice component included in the difference signal is disposed so as to be smaller than an input voice intensity ratio indicating a ratio of the intensity of the input voice component included in the first or second voltage signal to the intensity of the input voice component. Features.

ハンズフリー型の音声入力部とは、音声入力者が音声入力部を把持せずに音声入力可能な音声入力部のことをいい、音声入力部は例えば卓上や壁等に設置されて、周囲の音声を拾うもので、例えば自動車内に設置されるハンズフリー型携帯電話やTV会議等で用いられるハンズフリー拡声通話装置等も是に該当する。   A hands-free voice input unit refers to a voice input unit that allows a voice input person to input voice without gripping the voice input unit. The voice input unit is installed on a table or a wall, for example, For example, a hands-free mobile phone installed in an automobile, a hands-free loudspeaker used in a TV conference, or the like, which is used to pick up voice, also corresponds to the right.

本発明によれば、第1及び第2のマイクロフォン(第1及び第2の振動膜)が所定の条件を満たすように配置されている。これによると、第1及び第2のマイクロフォンで取得された第1及び第2の電圧信号の差を示す差分信号を、雑音成分が除去された、入力音声を示す信号とみなすことができる。そのため、本発明によると、差分信号を生成するだけの単純な構成で雑音除去機能を実現することが可能な音声入力装置を提供することができる。   According to the present invention, the first and second microphones (first and second vibrating membranes) are arranged so as to satisfy a predetermined condition. According to this, the difference signal indicating the difference between the first and second voltage signals acquired by the first and second microphones can be regarded as a signal indicating the input sound from which the noise component has been removed. Therefore, according to the present invention, it is possible to provide a voice input device capable of realizing a noise removal function with a simple configuration that only generates a differential signal.

なお、本発明の音声入出力装置では、差分信号生成部は、第1及び第2の電圧信号に対する解析処理(フーリエ解析処理など)を行うことなく、差分信号を生成する。そのため、差分信号生成部の信号処理負担を軽減し、あるいは、差分信号生成部を非常に簡易な回路によって実現することが可能になる。   In the voice input / output device of the present invention, the difference signal generation unit generates a difference signal without performing analysis processing (Fourier analysis processing or the like) on the first and second voltage signals. Therefore, it is possible to reduce the signal processing load of the differential signal generation unit, or to realize the differential signal generation unit with a very simple circuit.

このことから、本発明によると、小型化が可能で、かつ、精度の高い雑音除去機能を実現することが可能な音声入力装置を提供することができる。   Therefore, according to the present invention, it is possible to provide a voice input device that can be miniaturized and can realize a highly accurate noise removal function.

なお、この音声入力装置では、第1及び第2の振動膜は、雑音成分の位相差成分に基づく強度比が、入力音声成分の振幅に基づく強度比よりも小さくなるように配置されていてもよい。   In this voice input device, the first and second diaphragms may be arranged such that the intensity ratio based on the phase difference component of the noise component is smaller than the intensity ratio based on the amplitude of the input voice component. Good.

またマイクロフォンユニットは、機器に直接的・間接的作用する衝撃音を容易にかつ極めて効果的に抑圧する特性を備えている。すなわち空気中を伝搬する音のみならず、固体中を伝搬する音も除去することが可能である。固体中の音の伝搬速度は空気中の伝搬速度に比べて極めて速い(約10倍程度)ため、マイクロフォンユニットが設置された固体に加わった衝撃音(雑音)は、ほぼ同時に前記第1,第2の振動膜に到達するため、空気中を伝搬する雑音と同様に除去することができる。   In addition, the microphone unit has a characteristic of easily and extremely effectively suppressing the impact sound that acts directly or indirectly on the device. That is, not only the sound propagating in the air but also the sound propagating in the solid can be removed. Since the propagation speed of sound in a solid is extremely high (about 10 times) compared to the propagation speed in air, the impact sound (noise) applied to the solid on which the microphone unit is installed is almost simultaneously Since it reaches the vibration film 2, it can be removed in the same manner as noise that propagates in the air.

またマイクロフォンとスピーカ間に生じるハウリング抑圧性能にも優れることから、例えば卓上に設置したハンズフリー電話機などに組み込むことにより、高性能のハンズフリー拡声通話装置を提供することができる。   Further, since it is excellent in the performance of suppressing howling generated between the microphone and the speaker, it is possible to provide a high-performance hands-free loudspeaker device by incorporating it in a hands-free telephone set on a table, for example.

従って、本発明によればマイクロフォンに直接・間接に作用する衝撃雑音などに対しても雑音抑圧性能に優れることから、ハンズフリー型の音声入出力装置に組み込むことにより従来から極めて不快でまた除去が困難であった衝撃雑音下においても優れた性能の機器を提供することが出来る。   Therefore, according to the present invention, it is excellent in noise suppression performance against impact noise directly or indirectly acting on a microphone. Therefore, by incorporating it in a hands-free type voice input / output device, it has been extremely uncomfortable and can be removed. It is possible to provide a device with excellent performance even under impact noise that has been difficult.

なおパソコンのキーボード、作業ロボット、デジタル録音機、補聴器などに組み込んでも同様の効果を得ることができる。   The same effect can be obtained by incorporating it into a keyboard of a personal computer, a working robot, a digital recorder, a hearing aid, or the like.

(7)本発明は、
マイクロフォンからの入力に基づき第1の音声信号を生成する音声入力部と、
第2の音声信号に基づきスピーカから音声を出力する音声出力部とを含む音声入出力装置であって、
前記音声入力部は、
内部空間を有する筐体と、前記筐体内に設けられた、前記内部空間を第1の空間と第2の空間とに分割する、少なくとも一部が振動膜で構成された仕切り部材と、前記振動膜の振動に基づいて第1の音声信号である電気信号を出力する電気信号出力回路と、を含み、前記筐体には、前記第1の空間と前記筐体の外部空間とを連通する第1の貫通穴と、前記第2の空間と前記筐体の外部空間とを連通する第2の貫通穴とが形成されているマイクロフォンユニットが実装され、
前記音声出力部と前記音声入力部とは、分離して設置されていることを特徴とする。
(7) The present invention
An audio input unit that generates a first audio signal based on an input from a microphone;
A voice input / output device including a voice output unit that outputs voice from a speaker based on a second voice signal,
The voice input unit
A housing having an internal space, a partition member provided in the housing, which divides the internal space into a first space and a second space, at least a part of which is made of a vibrating membrane; and the vibration An electrical signal output circuit that outputs an electrical signal that is a first audio signal based on vibrations of the membrane, and the housing communicates with the first space and an external space of the housing. A microphone unit in which a through-hole of 1 and a second through-hole communicating with the second space and the external space of the housing are formed is mounted;
The voice output unit and the voice input unit are installed separately.

前記音声出力部と前記音声入力部とは分離して設置されているとは、例えば携帯機器、リモコンなどに本発明のマイクロフォンユニットを組み込んだ用いた音声送話部とテレビなどのスピーカから出力する相手の音声受話部とを組にして分離配置する構成を含む。   The audio output unit and the audio input unit are installed separately from each other. For example, the audio output unit using the microphone unit of the present invention incorporated in a portable device, a remote controller, or the like, and a speaker such as a television set are used for output. It includes a configuration in which the voice receiving unit of the other party is paired and separated.

本発明によると、振動膜の両面に、ユーザ音声及び雑音が入射する。振動膜の両面に入射する音声のうち、雑音成分は、ほぼ同じ音圧になるため、振動膜で打ち消しあう。そのため、振動膜を振動させる音圧は、ユーザ音声を示す音圧であるとみなすことができ、振動膜の振動に基づいて取得された電気信号は、雑音が除去された、ユーザ音声を示す電気信号であるとみなすことができる。   According to the present invention, user voice and noise are incident on both sides of the diaphragm. Of the sound incident on both sides of the diaphragm, the noise component has almost the same sound pressure, and therefore cancels with the diaphragm. Therefore, the sound pressure that vibrates the diaphragm can be regarded as the sound pressure indicating the user voice, and the electric signal acquired based on the vibration of the diaphragm is an electric signal indicating the user voice from which noise has been removed. It can be considered as a signal.

このことから、本発明によると、簡単な構成で、深い雑音除去が可能な高品質のマイクロフォンユニットを提供することができる。   Therefore, according to the present invention, it is possible to provide a high-quality microphone unit capable of deep noise removal with a simple configuration.

またマイクロフォンとスピーカ間に生じるハウリング抑圧性能にも優れることから、雑音環境に強い新しい音声入出力装置を提供することが出来る。   In addition, since it is excellent in the howling suppression performance generated between the microphone and the speaker, it is possible to provide a new voice input / output device resistant to a noise environment.

(8)本発明は、
マイクロフォンからの入力に基づき第1の音声信号を生成する音声入力部と、
第2の音声信号に基づきスピーカから音声を出力する音声出力部とを含む音声入出力装置であって、
前記音声入力部は、
第1のマイクロフォンを構成する第1の振動膜と、第2のマイクロフォンを構成する第2の振動膜と、前記第1のマイクロフォンで取得された第1の電圧信号と、前記第2のマイクロフォンで取得された第2の電圧信号とを受け付けて、前記第1及び第2の電圧信号の差を示す差分信号に基づき第1の音声信号を生成する差分信号生成回路と、が形成された半導体基板を有する集積回路装置が実装され、
前記音声出力部と前記音声入力部とは、分離して設置されていることを特徴とする。
(8) The present invention
An audio input unit that generates a first audio signal based on an input from a microphone;
A voice input / output device including a voice output unit that outputs voice from a speaker based on a second voice signal,
The voice input unit
A first vibrating membrane constituting a first microphone, a second vibrating membrane constituting a second microphone, a first voltage signal acquired by the first microphone, and a second microphone; A semiconductor substrate formed with a difference signal generation circuit that receives the acquired second voltage signal and generates a first audio signal based on a difference signal indicating a difference between the first and second voltage signals An integrated circuit device is mounted,
The voice output unit and the voice input unit are installed separately.

前記音声出力部と前記音声入力部とは分離して設置されているとは、例えば携帯機器、リモコンなどに本発明のマイクロフォンユニットを組み込んだ用いた音声送話部とテレビなどのスピーカから出力する相手の音声受話部とを組にして分離配置する構成を含む。   The audio output unit and the audio input unit are installed separately from each other. For example, the audio output unit using the microphone unit of the present invention incorporated in a portable device, a remote controller, or the like, and a speaker such as a television set are used for output. It includes a configuration in which the voice receiving unit of the other party is paired and separated.

本発明によると、2つの電圧信号の差を示す差分信号を生成するだけの単純な処理で、雑音成分が除去された音声を示す信号を生成することができる。また、本発明によると、第1及び第2の振動膜と、差分信号生成回路30とが、1つの半導体基板に形成されるため、集積回路装置の外形を小さくすることができるとともに、集積回路装置の精度を高くすることができる。   According to the present invention, it is possible to generate a signal indicating a sound from which a noise component has been removed by a simple process that only generates a difference signal indicating a difference between two voltage signals. According to the present invention, since the first and second vibrating membranes and the differential signal generation circuit 30 are formed on one semiconductor substrate, the external shape of the integrated circuit device can be reduced, and the integrated circuit The accuracy of the apparatus can be increased.

このことから、本発明によると、外形が小さく、かつ、精度の高い雑音除去機能を実現することが可能な集積回路装置を提供することができる。   Thus, according to the present invention, it is possible to provide an integrated circuit device that has a small outer shape and can realize a highly accurate noise removal function.

なお集積回路装置は、接話型の音声入力装置の音声入力素子(マイク素子)として適用することができる。このとき、集積回路装置は、前記第1及び第2の振動膜が、前記差分信号に含まれる前記雑音成分の強度の、前記第1又は第2の電圧信号に含まれる前記雑音成分の強度に対する比率を示す雑音強度比が、前記差分信号に含まれる入力音声成分の強度の、前記第1又は第2の電圧信号に含まれる前記入力音声成分の強度に対する比率を示す音声強度比よりも小さくなるように配置されていてもよい。このとき、雑音強度比は雑音の位相差成分に基づく強度比であってもよく、音声強度比は入力音声の振幅成分に基づく強度比であってもよい。   Note that the integrated circuit device can be applied as a voice input element (microphone element) of a close-talking voice input device. At this time, in the integrated circuit device, the first and second vibrating membranes have an intensity of the noise component included in the difference signal with respect to an intensity of the noise component included in the first or second voltage signal. The noise intensity ratio indicating the ratio is smaller than the audio intensity ratio indicating the ratio of the intensity of the input audio component included in the difference signal to the intensity of the input audio component included in the first or second voltage signal. It may be arranged as follows. At this time, the noise intensity ratio may be an intensity ratio based on the phase difference component of noise, and the voice intensity ratio may be an intensity ratio based on the amplitude component of the input voice.

なお、この集積回路装置(半導体基板)は、いわゆるメムス(MEMS:Micro Electro Mechanical Systems)として構成されていてもよい。   The integrated circuit device (semiconductor substrate) may be configured as a so-called MEMS (Micro Electro Mechanical Systems).

またマイクロフォンとスピーカ間に生じるハウリング抑圧性能にも優れることから、雑音環境に強い新しい音声入出力装置を提供することが出来る。   In addition, since it is excellent in the howling suppression performance generated between the microphone and the speaker, it is possible to provide a new voice input / output device resistant to a noise environment.

(9)本発明は、
マイクロフォンからの入力に基づき第1の音声信号を生成する音声入力部と、
第2の音声信号に基づきスピーカから音声を出力する音声出力部とを含む音声入出力装置であって、
前記音声入力部は、
第1の振動膜を有する第1のマイクロフォンと、
第2の振動膜を有する第2のマイクロフォンと、
前記第1のマイクロフォンで取得された第1の電圧信号と、前記第2のマイクロフォンで取得された第2の電圧信号との差を示す差分信号に基づき第1の音声信号を生成する差分信号生成部と、を含み、
前記第1及び第2の振動膜は、前記差分信号に含まれる雑音成分の強度の、前記第1又は第2の電圧信号に含まれる前記雑音成分の強度に対する比率を示す雑音強度比が、前記差分信号に含まれる入力音声成分の強度の、前記第1又は第2の電圧信号に含まれる前記入力音声成分の強度に対する比率を示す入力音声強度比よりも小さくなるように配置され、
前記音声出力部と前記音声入力部とは、分離して設置されていることを特徴とする。
(9) The present invention
An audio input unit that generates a first audio signal based on an input from a microphone;
A voice input / output device including a voice output unit that outputs voice from a speaker based on a second voice signal,
The voice input unit
A first microphone having a first vibrating membrane;
A second microphone having a second vibrating membrane;
Difference signal generation for generating a first audio signal based on a difference signal indicating a difference between a first voltage signal acquired by the first microphone and a second voltage signal acquired by the second microphone And
The first and second diaphragms have a noise intensity ratio indicating a ratio of the intensity of the noise component included in the differential signal to the intensity of the noise component included in the first or second voltage signal. Arranged so as to be smaller than the input voice intensity ratio indicating the ratio of the intensity of the input voice component included in the difference signal to the intensity of the input voice component included in the first or second voltage signal;
The voice output unit and the voice input unit are installed separately.

前記音声出力部と前記音声入力部とは分離して設置されているとは、例えば携帯機器、リモコンなどに本発明のマイクロフォンユニットを組み込んだ用いた音声送話部とテレビなどのスピーカから出力する相手の音声受話部とを組にして分離配置する構成を含む。   The audio output unit and the audio input unit are installed separately from each other. For example, the audio output unit using the microphone unit of the present invention incorporated in a portable device, a remote controller, or the like, and a speaker such as a television set are used for output. It includes a configuration in which the voice receiving unit of the other party is paired and separated.

本発明によれば、第1及び第2のマイクロフォン(第1及び第2の振動膜)が所定の条件を満たすように配置されている。これによると、第1及び第2のマイクロフォンで取得された第1及び第2の電圧信号の差を示す差分信号を、雑音成分が除去された、入力音声を示す信号とみなすことができる。そのため、本発明によると、差分信号を生成するだけの単純な構成で雑音除去機能を実現することが可能な音声入力装置を提供することができる。   According to the present invention, the first and second microphones (first and second vibrating membranes) are arranged so as to satisfy a predetermined condition. According to this, the difference signal indicating the difference between the first and second voltage signals acquired by the first and second microphones can be regarded as a signal indicating the input sound from which the noise component has been removed. Therefore, according to the present invention, it is possible to provide a voice input device capable of realizing a noise removal function with a simple configuration that only generates a differential signal.

なお、本発明の音声入出力装置では、差分信号生成部は、第1及び第2の電圧信号に対する解析処理(フーリエ解析処理など)を行うことなく、差分信号を生成する。そのため、差分信号生成部の信号処理負担を軽減し、あるいは、差分信号生成部を非常に簡易な回路によって実現することが可能になる。   In the voice input / output device of the present invention, the difference signal generation unit generates a difference signal without performing analysis processing (Fourier analysis processing or the like) on the first and second voltage signals. Therefore, it is possible to reduce the signal processing load of the differential signal generation unit, or to realize the differential signal generation unit with a very simple circuit.

このことから、本発明によると、小型化が可能で、かつ、精度の高い雑音除去機能を実現することが可能な音声入力装置を提供することができる。   Therefore, according to the present invention, it is possible to provide a voice input device that can be miniaturized and can realize a highly accurate noise removal function.

なお、この音声入力装置では、第1及び第2の振動膜は、雑音成分の位相差成分に基づく強度比が、入力音声成分の振幅に基づく強度比よりも小さくなるように配置されていてもよい。   In this voice input device, the first and second diaphragms may be arranged such that the intensity ratio based on the phase difference component of the noise component is smaller than the intensity ratio based on the amplitude of the input voice component. Good.

またマイクロフォンとスピーカ間に生じるハウリング抑圧性能にも優れることから、雑音環境に強い新しい音声入出力装置を提供することが出来る。   In addition, since it is excellent in the howling suppression performance generated between the microphone and the speaker, it is possible to provide a new voice input / output device resistant to a noise environment.

(10)本発明は、
上記のいずれかに記載の音声入出力装置と、
音声入力部が生成した第1の音声信号を通話相手の装置に送信する送信部と、
通話相手の装置から送信される第2の音声信号を受信する受信部と、を含むことを特徴とする通話装置である。
(10) The present invention
A voice input / output device according to any one of the above;
A transmission unit for transmitting the first audio signal generated by the audio input unit to the device of the other party;
And a receiving unit that receives a second audio signal transmitted from the device of the other party.

以下、本発明を適用した実施の形態について図面を参照して説明する。ただし、本発明は以下の実施の形態に限定されるものではない。また、本発明は、以下の内容を自由に組み合わせたものを含むものとする。   Embodiments to which the present invention is applied will be described below with reference to the drawings. However, the present invention is not limited to the following embodiments. Moreover, this invention shall include what combined the following content freely.

1−1.マイクロフォンユニット1の構成
はじめに、本実施の形態に係るマイクロフォンユニット1の構成について説明する。
1-1. Configuration of Microphone Unit 1 First, the configuration of the microphone unit 1 according to the present embodiment will be described.

本実施の形態に係るマイクロフォンユニット1は、図1及び図2(A)に示すように、筐体10を含む。筐体10は、マイクロフォンユニット1の外形を構成する部材である。筐体10(マイクロフォンユニット1)の外形は多面体構造となっていてもよい。筐体10の外形は、図1に示すように、六面体(直方体又は立方体)となっていてもよい。ただし、筐体10の外形は六面体以外の多面体構造となっていてもよい。あるいは、筐体10の外形は、球状構造(半球状構造)等の、多面体以外の構造となっていてもよい。   The microphone unit 1 according to the present embodiment includes a housing 10 as shown in FIGS. 1 and 2A. The housing 10 is a member that forms the outer shape of the microphone unit 1. The outer shape of the housing 10 (microphone unit 1) may have a polyhedral structure. The outer shape of the housing 10 may be a hexahedron (a cuboid or a cube) as shown in FIG. However, the outer shape of the housing 10 may have a polyhedral structure other than a hexahedron. Or the external shape of the housing | casing 10 may be structures other than a polyhedron, such as a spherical structure (hemispherical structure).

筐体10は、図2(A)に示すように、内部空間100(第1及び第2の空間102,104)を有する。すなわち、筐体10は所定の空間を区画する構造をなしており、内部空間100とは、筐体10によって区画される空間である。筐体10は、内部空間100と、筐体10の外部の空間(外部空間110)とを電気的・磁気的に遮蔽する遮蔽構造(電磁シールド構造)をなしていてもよい。これにより、後述する振動膜30及び電気信号出力回路40が、筐体10の外部(外部空間110)に配置された電子部品の影響を受けにくくすることができるため、精度の高い雑音除去機能を実現することが可能なマイクロフォンユニットを提供することができる。   As shown in FIG. 2A, the housing 10 has an internal space 100 (first and second spaces 102 and 104). That is, the housing 10 has a structure that partitions a predetermined space, and the internal space 100 is a space partitioned by the housing 10. The housing 10 may have a shielding structure (electromagnetic shield structure) that electrically and magnetically shields the internal space 100 and a space outside the housing 10 (external space 110). As a result, the diaphragm 30 and the electric signal output circuit 40 described later can be made less susceptible to the influence of electronic components arranged outside the housing 10 (external space 110). A microphone unit that can be realized can be provided.

そして、筐体10には、図1及び図2(A)に示すように、筐体10の内部空間100と外部空間110とを連通させる貫通穴が形成されている。本実施の形態では、筐体10には、第1の貫通穴12と第2の貫通穴14とが形成されている。ここで、第1の貫通穴12は、第1の空間102と外部空間110とを連通する貫通穴である。また、第2の貫通穴14は、第2の空間104と外部空間110とを連通する貫通穴である。なお、第1及び第2の空間102,104については後で詳述する。第1及び第2の貫通穴12,14の外形は特に限定されるものではないが、例えば図1に示すように、円形となっていてもよい。ただし、第1及び第2の貫通穴12,14の外形は、円形以外の形状であってもよく、例えば矩形であってもよい。   As shown in FIGS. 1 and 2A, the housing 10 is formed with a through hole that allows the internal space 100 and the external space 110 of the housing 10 to communicate with each other. In the present embodiment, the housing 10 is formed with a first through hole 12 and a second through hole 14. Here, the first through hole 12 is a through hole that communicates the first space 102 and the external space 110. The second through hole 14 is a through hole that communicates the second space 104 and the external space 110. The first and second spaces 102 and 104 will be described in detail later. Although the external shape of the 1st and 2nd through-holes 12 and 14 is not specifically limited, For example, as shown in FIG. 1, you may be circular. However, the outer shape of the first and second through holes 12 and 14 may be a shape other than a circle, for example, a rectangle.

本実施の形態では、図1及び図2(A)に示すように、第1及び第2の貫通穴12,14は、六面体構造(多面体構造)をなす筐体10の1つの面15に形成されている。ただし、変形例として、第1及び第2の貫通穴12,14は、それぞれ、多面体の異なる面に形成されていてもよい。例えば、第1及び第2の貫通穴12,14は、六面体の対向する面に形成されていてもよく、六面体の隣り合う面に形成されていてもよい。また、本実施の形態では、筐体10には、1つの第1の貫通穴12と1つの第2の貫通穴14とが形成されている。ただし、本発明はこれに限られず、筐体10には、複数の第1の貫通穴12及び複数の第2の貫通穴14が形成されていてもよい。   In the present embodiment, as shown in FIGS. 1 and 2A, the first and second through holes 12 and 14 are formed on one surface 15 of the housing 10 having a hexahedral structure (polyhedral structure). Has been. However, as a modification, the first and second through holes 12 and 14 may be formed on different surfaces of the polyhedron, respectively. For example, the first and second through holes 12 and 14 may be formed on opposing surfaces of the hexahedron, or may be formed on adjacent surfaces of the hexahedron. In the present embodiment, the housing 10 is formed with one first through hole 12 and one second through hole 14. However, the present invention is not limited to this, and the housing 10 may be formed with a plurality of first through holes 12 and a plurality of second through holes 14.

本実施の形態に係るマイクロフォンユニット1は、図2(A)及び図2(B)に示すように、仕切り部材20を含む。ここで、図2(B)は、仕切り部材20を正面から観察した図である。仕切り部材20は、筐体10内に、内部空間100を分割するように設けられる。本実施の形態では、仕切り部材20は、内部空間100を、第1の空間102及び第2の空間104に分割するように設けられる。すなわち、第1及び第2の空間102,104は、それぞれ、筐体10及び仕切り部材20で区画された空間であるといえる。   The microphone unit 1 according to the present embodiment includes a partition member 20 as shown in FIGS. 2 (A) and 2 (B). Here, FIG. 2B is a view of the partition member 20 observed from the front. The partition member 20 is provided in the housing 10 so as to divide the internal space 100. In the present embodiment, the partition member 20 is provided so as to divide the internal space 100 into a first space 102 and a second space 104. That is, it can be said that the first and second spaces 102 and 104 are spaces defined by the housing 10 and the partition member 20, respectively.

仕切り部材20は、音波を伝搬する媒質が、筐体10の内部で、第1の空間102と第2の空間104との間を移動しないように(移動できないように)設けられていてもよい。例えば、仕切り部材20は、内部空間100(第1及び第2の空間102,104)を筐体10内部で気密に分離する、気密隔壁であってもよい。   The partition member 20 may be provided so that the medium that propagates the sound wave does not move between the first space 102 and the second space 104 inside the housing 10 (so that the medium cannot move). . For example, the partition member 20 may be an airtight partition that airtightly separates the internal space 100 (the first and second spaces 102 and 104) inside the housing 10.

仕切り部材20は、図2(A)及び図2(B)に示すように、少なくとも一部が振動膜30で構成されている。振動膜30は、音波が入射すると、法線方向に振動する部材である。そして、マイクロフォンユニット1では、振動膜30の振動に基づいて電気信号を抽出することで、振動膜30に入射した音声を示す電気信号を取得する。すなわち、振動膜30は、マイクロフォン(音響信号を電気信号に変換する電気音響変換器)の振動膜であってもよい。   As shown in FIGS. 2A and 2B, at least a part of the partition member 20 is composed of a vibration film 30. The vibration film 30 is a member that vibrates in the normal direction when a sound wave enters. In the microphone unit 1, an electrical signal indicating the sound incident on the diaphragm 30 is acquired by extracting an electrical signal based on the vibration of the diaphragm 30. That is, the vibration film 30 may be a vibration film of a microphone (an electroacoustic transducer that converts an acoustic signal into an electric signal).

以下、本実施の形態に適用可能なマイクロフォンの一例として、コンデンサ型マイクロフォン200の構成について説明する。なお、図3は、コンデンサ型マイクロフォン200について説明するための図である。   Hereinafter, a configuration of a condenser microphone 200 will be described as an example of a microphone applicable to the present embodiment. FIG. 3 is a diagram for explaining the condenser microphone 200.

コンデンサ型マイクロフォン200は、振動膜202を有する。なお、振動膜202が、本実施の形態に係るマイクロフォンユニット1の振動膜30に相当する。振動膜202は、音波を受けて振動する膜(薄膜)で、導電性を有し、電極の一端を形成している。コンデンサ型マイクロフォン200は、また、電極204を有する。電極204は、振動膜202と対向して配置されている。これにより、振動膜202と電極204とは容量を形成する。コンデンサ型マイクロフォン200に音波が入射すると、振動膜202が振動して、振動膜202と電極204との間隔が変化し、振動膜202と電極204との間の静電容量が変化する。この静電容量の変化を、例えば電圧の変化として取り出すことによって、振動膜202の振動に基づく電気信号を取得することができる。すなわち、コンデンサ型マイクロフォン200に入射する音波を、電気信号に変換して出力することができる。なお、コンデンサ型マイクロフォン200では、電極204は、音波の影響を受けない構造をなしていてもよい。例えば、電極204はメッシュ構造をなしていてもよい。   The condenser microphone 200 has a vibration film 202. The vibration film 202 corresponds to the vibration film 30 of the microphone unit 1 according to the present embodiment. The vibration film 202 is a film (thin film) that vibrates in response to sound waves, has conductivity, and forms one end of the electrode. The condenser microphone 200 also has an electrode 204. The electrode 204 is disposed to face the vibration film 202. Thereby, the vibrating membrane 202 and the electrode 204 form a capacitance. When a sound wave enters the condenser microphone 200, the vibration film 202 vibrates, the distance between the vibration film 202 and the electrode 204 changes, and the capacitance between the vibration film 202 and the electrode 204 changes. By taking out this change in capacitance as, for example, a change in voltage, an electrical signal based on the vibration of the vibration film 202 can be acquired. That is, the sound wave incident on the condenser microphone 200 can be converted into an electric signal and output. In the condenser microphone 200, the electrode 204 may have a structure that is not affected by sound waves. For example, the electrode 204 may have a mesh structure.

ただし、本発明に適用可能なマイクロフォン(振動膜30)は、コンデンサ型マイクロフォンに限られるものではなく、既に公知となっているいずれかのマイクロフォンを適用することができる。例えば、振動膜30は、動電型(ダイナミック型)、電磁型(マグネティック型)、圧電型(クリスタル型)等の、種々のマイクロフォンの振動膜であってもよい。   However, the microphone (vibration membrane 30) applicable to the present invention is not limited to the condenser microphone, and any microphone that is already known can be applied. For example, the vibration film 30 may be a vibration film of various microphones such as an electrodynamic type (dynamic type), an electromagnetic type (magnetic type), and a piezoelectric type (crystal type).

あるいは、振動膜30は、半導体膜(例えばシリコン膜)であってもよい。すなわち、振動膜30は、シリコンマイク(Siマイク)の振動膜であってもよい。シリコンマイクを利用することで、マイクロフォンユニット1の小型化、及び、高性能化を実現することができる。   Alternatively, the vibration film 30 may be a semiconductor film (for example, a silicon film). That is, the vibration film 30 may be a vibration film of a silicon microphone (Si microphone). By using the silicon microphone, the microphone unit 1 can be reduced in size and performance can be improved.

振動膜30の外形は特に限定されるものではない。図2(B)に示すように、振動膜30の外形は円形をなしていてもよい。このとき、振動膜30と第1及び第2の貫通穴12,14とは、径が(ほぼ)同じ円形であってもよい。ただし、振動膜30は、第1及び第2の貫通穴12,14よりも大きくてもよく、小さくてもよい。また、振動膜30は、第1及び第2の面35,37を有する。第1の面35は第1の空間102を向く面であり、第2の面37は第2の空間104を向く面である。   The outer shape of the vibration film 30 is not particularly limited. As shown in FIG. 2B, the outer shape of the vibrating membrane 30 may be circular. At this time, the vibration film 30 and the first and second through holes 12 and 14 may have a circular shape with (substantially) the same diameter. However, the vibration film 30 may be larger or smaller than the first and second through holes 12 and 14. In addition, the vibration film 30 has first and second surfaces 35 and 37. The first surface 35 is a surface facing the first space 102, and the second surface 37 is a surface facing the second space 104.

なお、本実施の形態では、振動膜30は、図2(A)に示すように、法線が筐体10の面15に平行に延びるように設けられていてもよい。言い換えると、振動膜30は、面15と直交するように設けられていてもよい。そして、振動膜30は、第2の貫通穴14の側方(近傍)に配置されていてもよい。すなわち、振動膜30は、第1の貫通穴12からの距離と、第2の貫通穴14からの距離とが等しくならないように配置されていてもよい。ただし、変形例として、振動膜30は、第1及び第2の貫通穴12,14の中間に配置されていてもよい(図示せず)。   In the present embodiment, the vibrating membrane 30 may be provided such that the normal line extends in parallel with the surface 15 of the housing 10 as shown in FIG. In other words, the vibration film 30 may be provided so as to be orthogonal to the surface 15. The vibration film 30 may be disposed on the side (near the side) of the second through hole 14. That is, the vibration film 30 may be arranged such that the distance from the first through hole 12 and the distance from the second through hole 14 are not equal. However, as a modification, the vibration film 30 may be disposed between the first and second through holes 12 and 14 (not shown).

本実施の形態では、仕切り部材20は、図2(A)及び図2(B)に示すように、振動膜30を保持する保持部32を含んでいてもよい。そして、保持部32は、筐体10の内壁面に密着していてもよい。保持部32を筐体10の内壁面に密着させることで、第1及び第2の空間102,104を気密に分離することができる。   In the present embodiment, the partition member 20 may include a holding portion 32 that holds the vibrating membrane 30 as shown in FIGS. 2 (A) and 2 (B). The holding unit 32 may be in close contact with the inner wall surface of the housing 10. The first and second spaces 102 and 104 can be hermetically separated by bringing the holding portion 32 into close contact with the inner wall surface of the housing 10.

本実施の形態に係るマイクロフォンユニット1は、振動膜30の振動に基づいて電気信号を出力する電気信号出力回路40を含む。電気信号出力回路40は、少なくとも一部が、筐体10の内部空間100内に形成されてもよい。電気信号出力回路40は、例えば、筐体10の内壁面に形成されてもよい。すなわち、本実施の形態では、筐体10を電気回路の回路基板として利用してもよい。   The microphone unit 1 according to the present embodiment includes an electric signal output circuit 40 that outputs an electric signal based on the vibration of the vibrating membrane 30. At least a part of the electric signal output circuit 40 may be formed in the internal space 100 of the housing 10. The electric signal output circuit 40 may be formed on the inner wall surface of the housing 10, for example. That is, in the present embodiment, the housing 10 may be used as a circuit board for an electric circuit.

図4には、本実施の形態に適用可能な電気信号出力回路40の一例を示す。電気信号出力回路40は、コンデンサ42(振動膜30を有するコンデンサ型マイクロフォン)の静電容量の変化に基づく電気信号を、信号増幅回路44で増幅して出力するように構成されていてもよい。コンデンサ42は、例えば、振動膜ユニット41の一部を構成していてもよい。なお、電気信号出力回路40は、チャージアップ回路46と、オペアンプ48とを含んで構成されていてもよい。これにより、コンデンサ42の静電容量の変化を精密に取得することが可能になる。本実施の形態では、例えば、コンデンサ42、信号増幅回路44、チャージアップ回路46、オペアンプ48は、筐体10の内壁面に形成されていてもよい。また、電気信号出力回路40は、ゲイン調整回路45を含んでいてもよい。ゲイン調整回路45は、信号増幅回路44の増幅率(ゲイン)を調整する役割を果たす。ゲイン調整回路45は、筐体10の内部に設けられていてもよいが、筐体10の外部に設けられていてもよい。   FIG. 4 shows an example of an electric signal output circuit 40 applicable to this embodiment. The electric signal output circuit 40 may be configured to amplify and output an electric signal based on a change in capacitance of the capacitor 42 (capacitor-type microphone having the vibrating membrane 30) by the signal amplifying circuit 44. The capacitor 42 may constitute a part of the diaphragm unit 41, for example. The electrical signal output circuit 40 may include a charge-up circuit 46 and an operational amplifier 48. As a result, it is possible to accurately acquire a change in the capacitance of the capacitor 42. In the present embodiment, for example, the capacitor 42, the signal amplification circuit 44, the charge-up circuit 46, and the operational amplifier 48 may be formed on the inner wall surface of the housing 10. The electric signal output circuit 40 may include a gain adjustment circuit 45. The gain adjustment circuit 45 plays a role of adjusting the amplification factor (gain) of the signal amplification circuit 44. The gain adjustment circuit 45 may be provided inside the housing 10 or may be provided outside the housing 10.

ただし、振動膜30としてシリコンマイクを適用する場合には、電気信号出力回路40は、シリコンマイクの半導体基板に形成された集積回路によって実現してもよい。   However, when a silicon microphone is applied as the vibration film 30, the electric signal output circuit 40 may be realized by an integrated circuit formed on a semiconductor substrate of the silicon microphone.

また、電気信号出力回路40は、アナログ信号をデジタル信号に変換する変換回路や、デジタル信号を圧縮(符号化)する圧縮回路などをさらに含んでいてもよい。   The electric signal output circuit 40 may further include a conversion circuit that converts an analog signal into a digital signal, a compression circuit that compresses (encodes) the digital signal, and the like.

本実施の形態に係るマイクロフォンユニット1は、以上のように構成されていてもよい。マイクロフォンユニット1によると、簡単な構成で、精度の高い雑音除去機能を実現することができる。以下、マイクロフォンユニット1の雑音除去原理について説明する。   The microphone unit 1 according to the present embodiment may be configured as described above. According to the microphone unit 1, a highly accurate noise removal function can be realized with a simple configuration. Hereinafter, the principle of noise removal of the microphone unit 1 will be described.

1−2.マイクロフォンユニット1の雑音除去原理
(1)マイクロフォンユニット1の構成と、振動膜30の振動原理
はじめに、マイクロフォンユニット1の構成から導き出される、振動膜30の振動原理について説明する。
1-2. Noise Removal Principle of Microphone Unit 1 (1) Structure of Microphone Unit 1 and Vibration Principle of Vibration Film 30 First, the vibration principle of the vibration film 30 derived from the structure of the microphone unit 1 will be described.

本実施の形態では、振動膜30は、両側(第1及び第2の35,37)から音圧を受ける。そのため、振動膜30の両側に、同時に、同じ大きさの音圧がかかると、当該2つの音圧は振動膜30で打ち消しあい、振動膜30を振動させる力とはならない。逆に言うと、振動膜30は、両側に受ける音圧に差があるときに、その音圧の差によって振動する。   In the present embodiment, the vibrating membrane 30 receives sound pressure from both sides (first and second 35, 37). Therefore, if sound pressures of the same magnitude are simultaneously applied to both sides of the vibration film 30, the two sound pressures cancel each other out with the vibration film 30, and do not become a force for vibrating the vibration film 30. Conversely, when there is a difference in sound pressure applied to both sides, the vibrating membrane 30 vibrates due to the difference in sound pressure.

また、第1及び第2の貫通穴12,14に入射した音波の音圧は、第1及び第2の空間102,104の内壁面に均等に伝達される(パスカルの原理)。そのため、振動膜30の第1の空間102を向く面(第1の面35)は、第1の貫通穴12に入射した音圧と等しい音圧を受け、振動膜30の第2の空間104を向く面(第2の面37)は、第2の貫通穴14に入射した音圧と等しい音圧を受ける。   Further, the sound pressure of the sound wave incident on the first and second through holes 12 and 14 is evenly transmitted to the inner wall surfaces of the first and second spaces 102 and 104 (Pascal principle). Therefore, the surface (first surface 35) facing the first space 102 of the vibration film 30 receives a sound pressure equal to the sound pressure incident on the first through hole 12, and the second space 104 of the vibration film 30. The surface (second surface 37) facing the surface receives a sound pressure equal to the sound pressure incident on the second through hole 14.

すなわち、第1及び第2の面35,37が受ける音圧は、それぞれ、第1及び第2の貫通穴12,14に入射した音の音圧であり、振動膜30は、第1及び第2の面35,37(第1及び第2の貫通穴12,14)に入射した音波の音圧の差によって振動する。   That is, the sound pressure received by the first and second surfaces 35 and 37 is the sound pressure of the sound incident on the first and second through holes 12 and 14, respectively. 2 is vibrated by the difference in sound pressure of the sound wave incident on the two surfaces 35 and 37 (first and second through holes 12 and 14).

(2)音波の性質
音波は、媒質中を進行するにつれ減衰し、音圧(音波の強度・振幅)が低下する。音圧は、音源からの距離に反比例するため、音圧Pは、音源からの距離rとの関係において、

Figure 2009005071
と表すことができる。なお、式(1)中、kは比例定数である。図5には、式(1)を表すグラフを示すが、本図からもわかるように、音圧(音波の振幅)は、音源に近い位置(グラフの左側)では急激に減衰し、音源から離れるほどなだらかに減衰する。 (2) Properties of sound waves Sound waves attenuate as they travel through the medium, and sound pressure (sound wave intensity and amplitude) decreases. Since the sound pressure is inversely proportional to the distance from the sound source, the sound pressure P is related to the distance r from the sound source.
Figure 2009005071
It can be expressed as. In equation (1), k is a proportionality constant. FIG. 5 shows a graph representing the expression (1). As can be seen from FIG. 5, the sound pressure (the amplitude of the sound wave) is abruptly attenuated at a position close to the sound source (left side of the graph). Attenuates gently as you move away.

マイクロフォンユニット1を接話型の音声入力装置に適用する場合、ユーザの音声は、マイクロフォンユニット1(第1及び第2の貫通穴12,14)の近傍から発生する。そのため、ユーザの音声は、第1及び第2の貫通穴12,14の間で大きく減衰し、第1及び第2の貫通穴12,14に入射するユーザ音声の音圧、すなわち、第1及び第2の面35,37に入射するユーザ音声の音圧には、大きな差が現れる。   When the microphone unit 1 is applied to a close-talking voice input device, the user's voice is generated from the vicinity of the microphone unit 1 (first and second through holes 12, 14). Therefore, the user's voice is greatly attenuated between the first and second through holes 12 and 14, and the sound pressure of the user voice incident on the first and second through holes 12 and 14, that is, the first and second A large difference appears in the sound pressure of the user voice incident on the second surfaces 35 and 37.

これに対して雑音成分は、ユーザの音声に比べて、音源が、マイクロフォンユニット1(第1及び第2の貫通穴12,14)から遠い位置に存在する。そのため、雑音の音圧は、第1及び第2の貫通穴12,14の間でほとんど減衰せず、第1及び第2の貫通穴12,14に入射する雑音の音圧には、ほとんど差が現れない。   On the other hand, the noise component is present at a position farther from the microphone unit 1 (first and second through holes 12 and 14) than the sound of the user. For this reason, the sound pressure of noise hardly attenuates between the first and second through holes 12 and 14, and there is almost no difference in the sound pressure of noise incident on the first and second through holes 12 and 14. Does not appear.

(3)雑音除去原理
上述したように、振動膜30は、第1及び第2の面35,37に同時に入射する音波の音圧の差によって振動する。そして、第1及び第2の面35,37に入射する雑音の音圧の差は非常に小さいため、振動膜30で打ち消される。これに対して、第1及び第2の面35,37に入射するユーザ音声の音圧の差は大きいため、ユーザ音声は振動膜30で打ち消されず、振動膜30を振動させる。
(3) Noise Removal Principle As described above, the vibration film 30 vibrates due to the difference in sound pressure between sound waves that are simultaneously incident on the first and second surfaces 35 and 37. The difference between the sound pressures of noise incident on the first and second surfaces 35 and 37 is very small and is canceled by the vibration film 30. On the other hand, since the difference in sound pressure between user sounds incident on the first and second surfaces 35 and 37 is large, the user sound is not canceled by the vibration film 30 and vibrates the vibration film 30.

このことから、マイクロフォンユニット1によると、振動膜30は、ユーザの音声のみによって振動しているとみなすことができる。そのため、マイクロフォンユニット1(電気信号出力回路40)から出力される電気信号は、雑音が除去された、ユーザ音声のみを示す信号とみなすことができる。   From this, according to the microphone unit 1, it can be considered that the vibration film 30 vibrates only by a user's voice. Therefore, the electric signal output from the microphone unit 1 (electric signal output circuit 40) can be regarded as a signal indicating only the user voice from which noise is removed.

すなわち、本実施の形態に係るマイクロフォンユニット1によると、簡易な構成で、雑音が除去されたユーザ音声を示す電気信号を取得することが可能な音声入力装置を提供することができる。   That is, according to the microphone unit 1 according to the present embodiment, it is possible to provide a voice input device capable of acquiring an electric signal indicating a user voice from which noise is removed with a simple configuration.

1−3.マイクロフォンユニット1で、より精度の高い雑音除去機能を実現するための条件
上述したように、マイクロフォンユニット1によると、雑音が除去された、ユーザ音声のみを示す電気信号を取得することが可能になる。ただし、音波は位相成分を含んでいる。そのため、第1及び第2の貫通穴12,14(振動膜30の第1及び第2の面35,37)に入射する音波の位相差を考慮すれば、より精度の高い雑音除去機能を実現することが可能な条件(マイクロフォンユニット1の設計条件)を導出することができる。以下、より精度の高い雑音除去機能を実現するために、マイクロフォンユニット1が満たすべき条件について説明する。
1-3. Conditions for realizing a more accurate noise removal function with the microphone unit 1 As described above, according to the microphone unit 1, it is possible to acquire an electric signal indicating only a user voice from which noise has been removed. . However, the sound wave includes a phase component. Therefore, a more accurate noise removal function can be realized by considering the phase difference between the sound waves incident on the first and second through holes 12 and 14 (first and second surfaces 35 and 37 of the vibration film 30). It is possible to derive conditions (design conditions for the microphone unit 1) that can be performed. Hereinafter, conditions that the microphone unit 1 should satisfy in order to realize a more accurate noise removal function will be described.

マイクロフォンユニット1によると、先に説明したように、振動膜30を振動させる音圧(第1及び第2面35,37が受ける音圧の差:以下、適宜、「差分音圧」と称する)に基づいて出力される信号を、ユーザ音声を示す信号とみなす。このマイクロフォンユニットによると、振動膜30を振動させる音圧(差分音圧)に含まれる雑音成分が、第1又は第2の面35,37に入射する音圧に含まれる雑音成分よりも小さくなったことをもって、雑音除去機能が実現されたと評価することができる。詳しくは、差分音圧に含まれる雑音成分の強度の、第1又は第2の面35,37に入射する音圧に含まれる雑音成分の強度に対する比を示す雑音強度比が、差分音圧に含まれるユーザ音声成分の強度の、第1又は第2の面35,37に入射する音圧に含まれるユーザ音声成分の強度に対する比を示すユーザ音声強度比よりも小さくなれば、この雑音除去機能が実現されたと評価することができる。   According to the microphone unit 1, as described above, the sound pressure that vibrates the vibrating membrane 30 (difference in sound pressure applied to the first and second surfaces 35 and 37: hereinafter, appropriately referred to as “differential sound pressure”) Is regarded as a signal indicating the user voice. According to this microphone unit, the noise component included in the sound pressure (differential sound pressure) that vibrates the diaphragm 30 is smaller than the noise component included in the sound pressure incident on the first or second surface 35 or 37. Therefore, it can be evaluated that the noise removal function has been realized. Specifically, the noise intensity ratio indicating the ratio of the intensity of the noise component included in the differential sound pressure to the intensity of the noise component included in the sound pressure incident on the first or second surface 35 or 37 is the differential sound pressure. If the intensity of the included user voice component is smaller than the user voice intensity ratio indicating the ratio of the intensity of the user voice component included in the sound pressure incident on the first or second surface 35, 37 to the intensity of the user voice component, this noise removal function Can be evaluated as realized.

以下、この雑音除去機能を実現するために、マイクロフォンユニット1(筐体10)が満たすべき具体的な条件について説明する。   Hereinafter, specific conditions to be satisfied by the microphone unit 1 (housing 10) in order to realize the noise removal function will be described.

はじめに、振動膜30の第1及び第2の面35,37(第1及び第2の貫通穴12,14)に入射する音声の音圧について検討する。ユーザ音声の音源から第1の貫通穴12までの距離をR、第1及び第2の貫通穴12,14の中心間距離をΔrとすると、位相差を無視すれば、第1及び第2の貫通穴12,14に入射する、ユーザ音声の音圧(強度)P(S1)及びP(S2)は、

Figure 2009005071
と表すことができる。 First, the sound pressure of the sound incident on the first and second surfaces 35 and 37 (first and second through holes 12 and 14) of the vibrating membrane 30 will be examined. If the distance from the sound source of the user voice to the first through hole 12 is R, and the distance between the centers of the first and second through holes 12 and 14 is Δr, the first and second are ignored if the phase difference is ignored. The sound pressures (intensities) P (S1) and P (S2) of the user voice that enter the through holes 12 and 14 are:
Figure 2009005071
It can be expressed as.

そのため、ユーザ音声の位相差を無視したときの、第1の面35(第1の貫通穴12)に入射するユーザ音声の音圧の強度に対する、差分音圧に含まれるユーザ音声成分の強度の比率を示すユーザ音声強度比ρ(P)は、

Figure 2009005071
と表される。 Therefore, the intensity of the user sound component included in the differential sound pressure with respect to the sound pressure intensity of the user sound incident on the first surface 35 (first through hole 12) when the phase difference of the user sound is ignored. The user voice intensity ratio ρ (P) indicating the ratio is
Figure 2009005071
It is expressed.

ここで、マイクロフォンユニット1が接話型の音声入力装置に利用される場合、ΔrはRに比べて充分小さいとみなすことができる。   Here, when the microphone unit 1 is used in a close-talking voice input device, Δr can be considered to be sufficiently smaller than R.

そのため、上述の式(4)は、

Figure 2009005071
と変形することができる。 Therefore, the above equation (4) is
Figure 2009005071
And can be transformed.

すなわち、ユーザ音声の位相差を無視した場合のユーザ音声強度比は、式(A)と表されることがわかる。   That is, it can be seen that the user voice intensity ratio when the phase difference of the user voice is ignored is expressed by the equation (A).

ところで、ユーザ音声の位相差を考慮すると、ユーザ音声の音圧Q(S1)及びQ(S2)は、

Figure 2009005071
と表すことができる。なお、式中、αは位相差である。 By the way, considering the phase difference of the user voice, the sound pressures Q (S1) and Q (S2) of the user voice are
Figure 2009005071
It can be expressed as. In the formula, α is a phase difference.

このとき、ユーザ音声強度比ρ(S)は、

Figure 2009005071
と表される。式(7)を考慮すると、ユーザ音声強度比ρ(S)の大きさは、
Figure 2009005071
と表すことができる。 At this time, the user voice intensity ratio ρ (S) is
Figure 2009005071
It is expressed. Considering equation (7), the magnitude of the user voice strength ratio ρ (S) is
Figure 2009005071
It can be expressed as.

ところで、式(8)のうち、sinωt−sin(ωt−α)項は位相成分の強度比を示し、Δr/Rsinωt項は振幅成分の強度比を示す。ユーザ音声成分であっても、位相差成分は、振幅成分に対するノイズとなるため、ユーザ音声を精度よく抽出するためには、位相成分の強度比が、振幅成分の強度比よりも充分に小さいことが必要である。すなわち、sinωt−sin(ωt−α)と、Δr/Rsinωtとは、

Figure 2009005071
の関係を満たしていることが重要である。 In the equation (8), the term sinωt−sin (ωt−α) indicates the intensity ratio of the phase component, and the Δr / Rsinωt term indicates the intensity ratio of the amplitude component. Even if it is a user voice component, the phase difference component becomes noise with respect to the amplitude component, so that the intensity ratio of the phase component is sufficiently smaller than the intensity ratio of the amplitude component in order to accurately extract the user voice. is required. That is, sinωt−sin (ωt−α) and Δr / Rsinωt are
Figure 2009005071
It is important to satisfy the relationship.

ここで、

Figure 2009005071
と表すことができるため、上述の式(B)は、
Figure 2009005071
と表すことができる。 here,
Figure 2009005071
Therefore, the above formula (B) can be expressed as
Figure 2009005071
It can be expressed as.

式(10)の振幅成分を考慮すると、本実施の形態に係るマイクロフォンユニット1は、

Figure 2009005071
を満たす必要があることがわかる。 Considering the amplitude component of Equation (10), the microphone unit 1 according to the present embodiment is
Figure 2009005071
It turns out that it is necessary to satisfy.

なお、上述したように、ΔrはRに比べて充分小さいとみなすことができるため、sin(α/2)は充分小さいとみなすことができ、

Figure 2009005071
と近似することができる。 As described above, since Δr can be considered to be sufficiently smaller than R, sin (α / 2) can be considered to be sufficiently small.
Figure 2009005071
And can be approximated.

そのため、式(C)は、

Figure 2009005071
と変形することができる。 Therefore, the formula (C) is
Figure 2009005071
And can be transformed.

また、位相差であるαとΔrとの関係を、

Figure 2009005071
と表せば、式(D)は、
Figure 2009005071
と変形することができる。 Also, the relationship between α and Δr, which are phase differences, is
Figure 2009005071
The expression (D) can be expressed as
Figure 2009005071
And can be transformed.

すなわち、本実施の形態では、マイクロフォンユニット1が式(E)に示す関係を満たしていれば、ユーザ音声を精度よく抽出することができる。   That is, in the present embodiment, if the microphone unit 1 satisfies the relationship shown in the equation (E), the user voice can be extracted with high accuracy.

次に、第1及び第2の面35,37(第1及び第2の貫通穴12,14)に入射する雑音の音圧について検討する。   Next, the sound pressure of noise incident on the first and second surfaces 35 and 37 (first and second through holes 12 and 14) will be examined.

第1及び第2の面35,37に入射する雑音成分の振幅を、A,A´とすると、位相差成分を考慮した雑音の音圧Q(N1)及びQ(N2)は、

Figure 2009005071
と表すことができ、第1の面35(第1の貫通穴12)に入射する雑音成分の音圧の強度に対する、差分音圧に含まれる雑音成分の強度の比率を示す雑音強度比ρ(N)は、
Figure 2009005071
と表すことができる。 Assuming that the amplitudes of the noise components incident on the first and second surfaces 35 and 37 are A and A ′, the sound pressures Q (N1) and Q (N2) of the noise considering the phase difference component are
Figure 2009005071
The noise intensity ratio ρ (), which indicates the ratio of the intensity of the noise component included in the differential sound pressure to the intensity of the sound pressure of the noise component incident on the first surface 35 (first through hole 12). N)
Figure 2009005071
It can be expressed as.

なお、先に説明したように、第1及び第2の面35,37(第1及び第2の貫通穴12,14)に入射する雑音成分の振幅(強度)はほぼ同じであり、A=A´と扱うことができる。そのため、上記の式(15)は、

Figure 2009005071
と変形することができる。 As described above, the amplitude (intensity) of the noise component incident on the first and second surfaces 35 and 37 (first and second through holes 12 and 14) is substantially the same, and A = A ′ can be handled. Therefore, the above equation (15) is
Figure 2009005071
And can be transformed.

そして、雑音強度比の大きさは、

Figure 2009005071
と表すことができる。 And the magnitude of the noise intensity ratio is
Figure 2009005071
It can be expressed as.

ここで、上述の式(9)を考慮すると、式(17)は、

Figure 2009005071
と変形することができる。 Here, considering the above equation (9), equation (17) is
Figure 2009005071
And can be transformed.

そして、式(11)を考慮すると、式(18)は、

Figure 2009005071
と変形することができる。 And considering equation (11), equation (18) is
Figure 2009005071
And can be transformed.

ここで、式(D)を参照すれば、雑音強度比の大きさは、

Figure 2009005071
と表すことができる。なお、Δr/Rとは、式(A)に示すように、ユーザ音声の振幅成分の強度比である。式(F)から、このマイクロフォンユニット1では、雑音強度比がユーザ音声の強度比Δr/Rよりも小さくなることがわかる。 Here, referring to equation (D), the magnitude of the noise intensity ratio is
Figure 2009005071
It can be expressed as. Note that Δr / R is the intensity ratio of the amplitude component of the user voice, as shown in Expression (A). From the formula (F), it can be seen that in the microphone unit 1, the noise intensity ratio is smaller than the intensity ratio Δr / R of the user voice.

以上のことから、ユーザ音声の位相成分の強度比が振幅成分の強度比よりも小さくなるマイクロフォンユニット1によれば(式(B)参照)、雑音強度比がユーザ音声強度比よりも小さくなる(式(F)参照)。逆に言うと、雑音強度比がユーザ音声強度比よりも小さくなるように設計されたマイクロフォンユニット1によると、精度の高い雑音除去機能を実現することができる。   From the above, according to the microphone unit 1 in which the intensity ratio of the phase component of the user voice is smaller than the intensity ratio of the amplitude component (see Expression (B)), the noise intensity ratio is smaller than the user voice intensity ratio ( (See formula (F)). In other words, according to the microphone unit 1 designed such that the noise intensity ratio is smaller than the user voice intensity ratio, a highly accurate noise removal function can be realized.

1−4.マイクロフォンユニット1の製造方法
以下、本実施の形態に係るマイクロフォンユニット1の製造方法について説明する。本実施の形態では、第1及び第2の貫通穴12,14の中心間距離Δrと雑音の波長λとの比率を示すΔr/λの値と、雑音強度比(雑音の位相成分に基づく強度比)との対応関係を示すデータを利用して、マイクロフォンユニット1を製造してもよい。
1-4. Method for Manufacturing Microphone Unit 1 Hereinafter, a method for manufacturing the microphone unit 1 according to the present embodiment will be described. In the present embodiment, the value of Δr / λ indicating the ratio between the center-to-center distance Δr of the first and second through holes 12 and 14 and the noise wavelength λ and the noise intensity ratio (the intensity based on the phase component of the noise). The microphone unit 1 may be manufactured using data indicating the correspondence relationship with the ratio).

雑音の位相成分に基づく強度比は、上述した式(18)で表される。そのため、雑音の位相成分に基づく強度比のデシベル値は、

Figure 2009005071
と表すことができる。 The intensity ratio based on the phase component of noise is expressed by the above-described equation (18). Therefore, the decibel value of the intensity ratio based on the phase component of noise is
Figure 2009005071
It can be expressed as.

そして、式(20)のαに各値を代入すれば、位相差αと、雑音の位相成分に基づく強度比との対応関係を明らかにすることができる。図6には、横軸をα/2πとし、縦軸に雑音の位相成分に基づく強度比(デシベル値)を取った時の、位相差と強度比との対応関係を表すデータの一例を示す。   Then, by assigning each value to α in Expression (20), it is possible to clarify the correspondence between the phase difference α and the intensity ratio based on the phase component of noise. FIG. 6 shows an example of data representing the correspondence between the phase difference and the intensity ratio when the horizontal axis is α / 2π and the vertical axis is the intensity ratio (decibel value) based on the phase component of noise. .

なお、位相差αは、式(12)に示すように、距離Δrと波長λとの比であるΔr/λの関数で表すことができ、図6の横軸は、Δr/λとみなすことができる。すなわち、図6は、雑音の位相成分に基づく強度比と、Δr/λとの対応関係を示すデータであるといえる。   The phase difference α can be expressed as a function of Δr / λ, which is the ratio of the distance Δr to the wavelength λ, as shown in Equation (12), and the horizontal axis in FIG. 6 is regarded as Δr / λ. Can do. That is, FIG. 6 can be said to be data indicating a correspondence relationship between the intensity ratio based on the phase component of noise and Δr / λ.

本実施の形態では、このデータを利用して、マイクロフォンユニット1を製造する。図7は、このデータを利用してマイクロフォンユニット1を製造する手順について説明するためのフローチャート図である。   In the present embodiment, the microphone unit 1 is manufactured using this data. FIG. 7 is a flowchart for explaining a procedure for manufacturing the microphone unit 1 using this data.

はじめに、雑音の強度比(雑音の位相成分に基づく強度比)と、Δr/λとの対応関係を示すデータ(図6参照)を用意する(ステップS10)。   First, data (see FIG. 6) showing the correspondence between the noise intensity ratio (intensity ratio based on the phase component of noise) and Δr / λ is prepared (step S10).

次に、用途に応じて、雑音の強度比を設定する(ステップS12)。なお、本実施の形態では、雑音の強度が低下するように雑音の強度比を設定する必要がある。そのため、本ステップでは、雑音の強度比を、0dB以下に設定する。   Next, a noise intensity ratio is set according to the application (step S12). In the present embodiment, it is necessary to set the noise intensity ratio so that the noise intensity decreases. Therefore, in this step, the noise intensity ratio is set to 0 dB or less.

次に、当該データに基づいて、雑音の強度比に対応するΔr/λの値を導出する(ステップS14)。   Next, a value of Δr / λ corresponding to the noise intensity ratio is derived based on the data (step S14).

そして、λに主要な雑音の波長を代入することによって、Δrが満たすべき条件を導出する(ステップS16)。   Then, a condition to be satisfied by Δr is derived by substituting the wavelength of the main noise into λ (step S16).

具体例として、主要な雑音が1KHzであり、その波長が0.347mとなる環境下で、雑音の強度が20dB低下するマイクロフォンユニット1を製造する場合について考える。   As a specific example, let us consider a case where the microphone unit 1 whose noise intensity is reduced by 20 dB is manufactured in an environment where the main noise is 1 KHz and the wavelength is 0.347 m.

はじめに、雑音の強度比が0dB以下になるための条件について検討する。図6を参照すると、雑音の強度比を0dB以下とするためには、Δr/λの値を0.16以下とすればよいことがわかる。すなわち、Δrの値が55.46mm以下とすればよいことがわかり、これが、マイクロフォンユニット1(筐体10)の必要条件となる。   First, the conditions for the noise intensity ratio to be 0 dB or less are examined. Referring to FIG. 6, it can be seen that the value of Δr / λ may be 0.16 or less in order to make the noise intensity ratio 0 dB or less. That is, it is understood that the value of Δr may be 55.46 mm or less, and this is a necessary condition for the microphone unit 1 (housing 10).

次に、1KHzの雑音の強度を20dB低下させるための条件について考える。図6を参照すると、雑音の強度を20dB低下させるためには、Δr/λの値を0.015とすればよいことがわかる。そして、λ=0.347mとすると、Δrの値が5.199mm以下のときに、この条件を満たすことがわかる。すなわち、Δrを約5.2mm以下に設定すれば、雑音除去機能を有するマイクロフォンユニットを製造することが可能になる。   Next, a condition for reducing the intensity of 1 kHz noise by 20 dB will be considered. Referring to FIG. 6, it can be seen that the value of Δr / λ may be set to 0.015 in order to reduce the noise intensity by 20 dB. When λ = 0.347 m, it can be seen that this condition is satisfied when the value of Δr is 5.199 mm or less. That is, if Δr is set to about 5.2 mm or less, a microphone unit having a noise removal function can be manufactured.

なお、本実施の形態に係るマイクロフォンユニット1を接話型の音声入力装置に利用する場合、ユーザ音声の音源とマイクロフォンユニット1(第1及び第2の貫通穴12,14)との間隔は、通常5cm以下である。また、ユーザ音声の音源とマイクロフォンユニット1(第1及び第2の貫通穴12,14)との間隔は、マイクロフォンユニット1が収納される筐体の設計によって設定することが可能である。そのため、ユーザの音声の強度比であるΔr/Rの値は、0.1(雑音の強度比)よりも大きくなり、雑音除去機能が実現されることがわかる。   When the microphone unit 1 according to the present embodiment is used in a close-talking voice input device, the distance between the sound source of the user voice and the microphone unit 1 (first and second through holes 12, 14) is as follows. Usually 5 cm or less. Further, the interval between the sound source of the user voice and the microphone unit 1 (first and second through holes 12 and 14) can be set by the design of the casing in which the microphone unit 1 is housed. Therefore, the value of Δr / R that is the intensity ratio of the user's voice becomes larger than 0.1 (noise intensity ratio), and it can be seen that the noise removal function is realized.

なお、通常、雑音は単一の周波数に限定されるものではない。しかし、主要な雑音として想定された雑音よりも周波数の低い雑音は、当該主要な雑音よりも波長が長くなるため、Δr/λの値は小さくなり、このマイクロフォンユニット1で除去される。また、音波は、周波数が高いほどエネルギーの減衰が早い。そのため、主要な雑音として想定された雑音よりも周波数の高い雑音は、当該主要な雑音よりも早く減衰するため、マイクロフォンユニット1(振動膜30)に与える影響を無視することができる。このことから、本実施の形態に係るマイクロフォンユニット1は、主要な雑音として想定された雑音とは異なる周波数の雑音が存在する環境下でも、優れた雑音除去機能を発揮することができる。   In general, noise is not limited to a single frequency. However, the noise having a frequency lower than the noise assumed as the main noise has a longer wavelength than that of the main noise, so that the value of Δr / λ becomes small and is removed by the microphone unit 1. Further, the sound wave decays faster as the frequency is higher. For this reason, noise having a higher frequency than the noise assumed as the main noise attenuates faster than the main noise, so that the influence on the microphone unit 1 (vibrating film 30) can be ignored. For this reason, the microphone unit 1 according to the present embodiment can exhibit an excellent noise removal function even in an environment where noise having a frequency different from that assumed as main noise exists.

また、本実施の形態では、式(12)からもわかるように、第1及び第2の貫通穴12,14を結ぶ直線上から入射する雑音を想定した。この雑音は、第1及び第2の貫通穴12,14の見かけ上の間隔が最も大きくなる雑音であり、現実の使用環境において、位相差が最も大きくなる雑音である。すなわち、本実施の形態に係るマイクロフォンユニット1は、位相差が最も大きくなる雑音を除去することが可能に構成されている。そのため、本実施の形態に係るマイクロフォンユニット1によると、すべての方向から入射する雑音を除去することができる。   Moreover, in this Embodiment, the noise which injects from the straight line which ties the 1st and 2nd through-holes 12 and 14 was assumed so that Formula (12) might also show. This noise is a noise in which the apparent distance between the first and second through holes 12 and 14 is the largest, and is a noise in which the phase difference is the largest in an actual use environment. In other words, the microphone unit 1 according to the present embodiment is configured to be able to remove noise with the largest phase difference. Therefore, according to the microphone unit 1 according to the present embodiment, it is possible to remove noise incident from all directions.

1−5.効果
以下、マイクロフォンユニット1が奏する効果についてまとめる。
1-5. Effects Hereinafter, effects obtained by the microphone unit 1 will be summarized.

先に説明したように、マイクロフォンユニット1によると、振動膜30の振動を示す電気信号(振動膜30の振動に基づく電気信号)取得するだけで、雑音成分が除去された音声を示す電気信号を取得することができる。すなわち、マイクロフォンユニット1では、複雑な解析演算処理を行うことなく雑音除去機能を実現することができる。そのため、簡単な構成で、深い雑音除去が可能な高品質のマイクロフォンユニットを提供することができる。特に、第1及び第2の貫通穴12,14の中心間距離Δrを5.2mm以下に設定することで、より精度の高い雑音除去機能を実現することが可能なマイクロフォンユニットを提供することができる。   As described above, according to the microphone unit 1, an electric signal indicating a sound from which a noise component has been removed can be obtained simply by acquiring an electric signal indicating the vibration of the vibration film 30 (an electric signal based on the vibration of the vibration film 30). Can be acquired. That is, the microphone unit 1 can realize a noise removal function without performing complicated analysis calculation processing. Therefore, a high-quality microphone unit capable of deep noise removal with a simple configuration can be provided. In particular, it is possible to provide a microphone unit capable of realizing a more accurate noise removal function by setting the center-to-center distance Δr between the first and second through holes 12 and 14 to 5.2 mm or less. it can.

また、マイクロフォンユニット1では、位相差に基づく雑音強度比が最も大きくなるように入射する雑音を除去することができるように、筐体10(第1及び第2の貫通穴12,14の位置)を設計することが可能になる。そのため、このマイクロフォンユニット1によると、全方位から入射する雑音を除去することができる。すなわち、本発明によると、全方位から入射する雑音を除去することが可能なマイクロフォンユニットを提供することができる。   In the microphone unit 1, the housing 10 (positions of the first and second through holes 12 and 14) can be removed so that incident noise can be removed so that the noise intensity ratio based on the phase difference is maximized. Can be designed. Therefore, according to the microphone unit 1, noise incident from all directions can be removed. That is, according to the present invention, it is possible to provide a microphone unit that can remove noise incident from all directions.

なお、マイクロフォンユニット1によると、壁などで反射した後に振動膜30(第1及び第2の面35,37)に入射したユーザ音声成分も除去することができる。詳しくは、壁などで反射したユーザ音声は、長距離を伝搬した後にマイクロフォンユニット1に入射するため、通常のユーザ音声よりも遠くに存在する音源から発生した音声であるとみなすことができ、かつ、反射により大きくエネルギーを消失しているため、雑音成分と同様に、第1及び第2の貫通穴12,14の間で音圧が大きく減衰することがない。そのため、このマイクロフォンユニット1によると、壁などで反射した後に入射するユーザ音声成分も、雑音と同様に(雑音の一種として)除去される。   According to the microphone unit 1, it is also possible to remove the user voice component that is incident on the vibration film 30 (the first and second surfaces 35 and 37) after being reflected by a wall or the like. Specifically, since the user sound reflected by a wall or the like is incident on the microphone unit 1 after propagating a long distance, it can be regarded as a sound generated from a sound source that exists farther than a normal user sound, and Since the energy is largely lost due to the reflection, the sound pressure is not greatly attenuated between the first and second through holes 12 and 14 like the noise component. Therefore, according to the microphone unit 1, the user voice component incident after being reflected by the wall or the like is also removed (as a kind of noise) in the same manner as the noise.

そして、マイクロフォンユニット1を利用すれば、雑音を含まない、ユーザ音声を示す信号を取得することができる。そのため、マイクロフォンユニット1を利用することで、精度の高い音声認識や音声認証、コマンド生成処理を実現することができる。   And if the microphone unit 1 is utilized, the signal which shows a user voice | voice which does not contain noise can be acquired. Therefore, by using the microphone unit 1, highly accurate voice recognition, voice authentication, and command generation processing can be realized.

1−6.音声入力装置
次に、マイクロフォンユニット1を有する音声入力装置2について説明する。
1-6. Voice Input Device Next, the voice input device 2 having the microphone unit 1 will be described.

(1)音声入力装置2の構成
はじめに、音声入力装置2の構成について説明する。図8及び図9は、音声入力装置2の構成について説明するための図である。なお、以下に説明する音声入力装置2は、接話型の音声入力装置であって、例えば、携帯電話やトランシーバー等の音声通信機器や、入力された音声を解析する技術を利用した情報処理システム(音声認証システム、音声認識システム、コマンド生成システム、電子辞書、翻訳機や、音声入力方式のリモートコントローラなど)、あるいは、録音機器やアンプシステム(拡声器)、マイクシステムなどに適用することができる。
(1) Configuration of Voice Input Device 2 First, the configuration of the voice input device 2 will be described. 8 and 9 are diagrams for explaining the configuration of the voice input device 2. The voice input device 2 described below is a close-talking type voice input device, for example, a voice communication device such as a mobile phone or a transceiver, or an information processing system using technology for analyzing input voice. (Voice authentication system, voice recognition system, command generation system, electronic dictionary, translator, voice input remote controller, etc.), recording equipment, amplifier system (loudspeaker), microphone system, etc. .

図8は、音声入力装置2の構造を説明するための図である。   FIG. 8 is a diagram for explaining the structure of the voice input device 2.

音声入力装置2は、筐体50を有する。筐体50は、音声入力装置2の外形を構成する部材である。筐体50には基本姿勢が設定されていてもよく、これにより、ユーザ音声の進行径路を規制することができる。筐体50には、ユーザの音声を受け付けるための開口52が形成されていてもよい。   The voice input device 2 has a housing 50. The casing 50 is a member that forms the outer shape of the voice input device 2. A basic posture may be set in the housing 50, thereby restricting the travel path of the user voice. The housing 50 may be formed with an opening 52 for receiving the user's voice.

音声入力装置2では、マイクロフォンユニット1は、筐体50内部に設置される。マイクロフォンユニット1は、第1及び第2の貫通穴12,14が開口52に連通(重複)するように、筐体50に設置されていてもよい。マイクロフォンユニット1は、弾性体54を介して、筐体50に設置されていてもよい。これにより、筐体50の振動がマイクロフォンユニット1(筐体10)に伝わりにくくなるため、マイクロフォンユニット1を精度よく動作させることができる。   In the voice input device 2, the microphone unit 1 is installed inside the housing 50. The microphone unit 1 may be installed in the housing 50 so that the first and second through holes 12 and 14 communicate (overlap) with the opening 52. The microphone unit 1 may be installed in the housing 50 via the elastic body 54. Thereby, since the vibration of the housing | casing 50 becomes difficult to be transmitted to the microphone unit 1 (housing 10), the microphone unit 1 can be operated accurately.

マイクロフォンユニット1は、第1及び第2の貫通穴12,14がユーザ音声の進行方向に沿ってずれて配置されるように、筐体50に設置されていてもよい。そして、ユーザ音声の進行径路の上流側に配置される貫通穴を第1の貫通穴12とし、下流側に配置される貫通穴を第2の貫通穴14としてもよい。振動膜30が第2の貫通穴14の側方に配置されたマイクロフォンユニット1を、上記のように配置すると、ユーザ音声を、振動膜30の両面(第1及び第2の面35,37)に同時に入射させることができる。詳しくは、マイクロフォンユニット1では、第1の貫通穴12の中心から第1の面35までの距離が、第1の貫通穴12から第2の貫通穴14までの距離とほぼ等しくなるため、第1の貫通穴12を通過したユーザ音声が第1の面35に入射するまでに必要な時間は、第1の貫通穴12上を通過したユーザ音波が第2の貫通穴14を介して第2の面37に入射するまでに必要な時間と、ほぼ等しくなる。すなわち、ユーザが発声した音声が、第1の面35に入射するまでにかかる時間と、第2の面37に入射するまでにかかる時間とが等しくなる。そのため、ユーザ音声を、第1及び第2の面35,37に同時に入射させることができ、位相ずれによるノイズが発生しないように、振動膜30を振動させることができる。言い換えると、先に説明した式(8)においてα=0となり、sinωt−sin(ωt−α)=0となることから、Δr/Rsinωt項(振幅成分のみ)が抽出されることがわかる。そのため、人の音声としては高周波帯域である7KHz程度のユーザ音声が入力された場合でも、第1の面35に入射する音圧と第2の面37に入射する音圧との位相ひずみの影響を無視することができ、ユーザ音声を正確に示す電気信号を取得することが可能になる。   The microphone unit 1 may be installed in the housing 50 such that the first and second through holes 12 and 14 are arranged so as to be shifted along the traveling direction of the user voice. Then, the through hole disposed on the upstream side of the travel path of the user voice may be the first through hole 12, and the through hole disposed on the downstream side may be the second through hole 14. When the microphone unit 1 in which the vibration film 30 is disposed on the side of the second through hole 14 is disposed as described above, the user voice is transmitted to both surfaces of the vibration film 30 (first and second surfaces 35 and 37). Can be incident simultaneously. Specifically, in the microphone unit 1, the distance from the center of the first through hole 12 to the first surface 35 is substantially equal to the distance from the first through hole 12 to the second through hole 14. The time required for the user voice that has passed through the first through hole 12 to enter the first surface 35 is the second time when the user sound wave that has passed over the first through hole 12 passes through the second through hole 14. Is approximately equal to the time required to enter the surface 37. That is, the time taken for the voice uttered by the user to enter the first surface 35 is equal to the time taken for the sound to enter the second surface 37. Therefore, the user voice can be incident on the first and second surfaces 35 and 37 at the same time, and the vibration film 30 can be vibrated so that noise due to phase shift does not occur. In other words, since α = 0 and sinωt−sin (ωt−α) = 0 in the above-described equation (8), it can be seen that the Δr / Rsinωt term (only the amplitude component) is extracted. Therefore, even when a user voice having a high frequency band of about 7 KHz is input as a human voice, the influence of the phase distortion between the sound pressure incident on the first surface 35 and the sound pressure incident on the second surface 37. Can be ignored, and an electric signal accurately indicating the user's voice can be obtained.

(2)音声入力装置2の機能
次に、図9を参照して、音声入力装置2の機能について説明する。なお、図9は、音声入力装置2の機能を説明するためのブロック図である。
(2) Function of Voice Input Device 2 Next, the function of the voice input device 2 will be described with reference to FIG. FIG. 9 is a block diagram for explaining the function of the voice input device 2.

音声入力装置2は、マイクロフォンユニット1を有する。マイクロフォンユニット1は、振動膜30の振動に基づいて生成された電気信号を出力する。なお、マイクロフォンユニット1から出力される電気信号は、雑音成分が除去された、ユーザ音声を示す電気信号である。   The voice input device 2 has a microphone unit 1. The microphone unit 1 outputs an electric signal generated based on the vibration of the vibration film 30. Note that the electric signal output from the microphone unit 1 is an electric signal indicating the user voice from which the noise component has been removed.

音声入力装置2は、演算処理部60を有していてもよい。演算処理部60は、マイクロフォンユニット1(電気信号出力回路40)から出力された電気信号に基づいて各種の演算処理を行う。演算処理部60は、電気信号に対する解析処理を行ってもよい。演算処理部60は、マイクロフォンユニット1からの出力信号を解析することにより、ユーザ音声を発した人物を特定する処理(いわゆる音声認証処理)を行ってもよい。あるいは、演算処理部60は、マイクロフォンユニット1の出力信号を解析処理することにより、ユーザ音声の内容を特定する処理(いわゆる音声認識処理)を行ってもよい。演算処理部60は、マイクロフォンユニット1からの出力信号に基づいて、各種のコマンドを作成する処理を行ってもよい。演算処理部60は、マイクロフォンユニット1からの出力信号を増幅する処理を行ってもよい。また、演算処理部60は、後述する通信処理部70の動作を制御してもよい。なお、演算処理部60は、上記各機能を、CPUやメモリによる信号処理によって実現してもよい。あるいは、演算処理部60は、上記各機能を、専用のハードウエアによって実現してもよい。   The voice input device 2 may have an arithmetic processing unit 60. The arithmetic processing unit 60 performs various arithmetic processes based on the electric signal output from the microphone unit 1 (electric signal output circuit 40). The arithmetic processing unit 60 may perform analysis processing on the electrical signal. The arithmetic processing unit 60 may perform processing (so-called voice authentication processing) for identifying a person who has uttered a user voice by analyzing an output signal from the microphone unit 1. Or the arithmetic processing part 60 may perform the process (what is called a speech recognition process) which specifies the content of a user voice by analyzing the output signal of the microphone unit 1. The arithmetic processing unit 60 may perform processing for creating various commands based on an output signal from the microphone unit 1. The arithmetic processing unit 60 may perform processing for amplifying the output signal from the microphone unit 1. The arithmetic processing unit 60 may control the operation of the communication processing unit 70 described later. Note that the arithmetic processing unit 60 may realize the above functions by signal processing using a CPU or a memory. Or the arithmetic processing part 60 may implement | achieve each said function with exclusive hardware.

音声入力装置2は、通信処理部70をさらに含んでいてもよい。通信処理部70は、音声入力装置2と、他の端末(携帯電話端末や、ホストコンピュータなど)との通信を制御する。通信処理部70は、ネットワークを介して、他の端末に信号(マイクロフォンユニット1からの出力信号)を送信する機能を有していてもよい。通信処理部70は、また、ネットワークを介して、他の端末から信号を受信する機能を有していてもよい。そして、例えばホストコンピュータで、通信処理部70を介して取得した出力信号を解析処理して、音声認識処理や音声認証処理、コマンド生成処理や、データ蓄積処理など、種々の情報処理を行ってもよい。すなわち、音声入力装置2は、他の端末と協働して、情報処理システムを構成していてもよい。言い換えると、音声入力装置2は、情報処理システムを構築する情報入力端末であるとみなしてもよい。ただし、音声入力装置2は、通信処理部70を有しない構成となっていてもよい。   The voice input device 2 may further include a communication processing unit 70. The communication processing unit 70 controls communication between the voice input device 2 and another terminal (such as a mobile phone terminal or a host computer). The communication processing unit 70 may have a function of transmitting a signal (an output signal from the microphone unit 1) to another terminal via a network. The communication processing unit 70 may also have a function of receiving signals from other terminals via a network. For example, the host computer may analyze the output signal acquired via the communication processing unit 70 and perform various information processing such as voice recognition processing, voice authentication processing, command generation processing, and data storage processing. Good. That is, the voice input device 2 may constitute an information processing system in cooperation with other terminals. In other words, the voice input device 2 may be regarded as an information input terminal that constructs an information processing system. However, the voice input device 2 may not have the communication processing unit 70.

なお、上述した演算処理部60及び通信処理部70は、パッケージングされた半導体装置(集積回路装置)として、筐体50内に配置されていてもよい。ただし、本発明はこれに限られるものではない。例えば、演算処理部60は、筐体50の外部に配置されていてもよい。演算処理部60が筐体50の外部に配置されている場合、演算処理部60は、通信処理部70を介して、差分信号を取得してもよい。   Note that the arithmetic processing unit 60 and the communication processing unit 70 described above may be arranged in the housing 50 as a packaged semiconductor device (integrated circuit device). However, the present invention is not limited to this. For example, the arithmetic processing unit 60 may be disposed outside the housing 50. When the arithmetic processing unit 60 is disposed outside the housing 50, the arithmetic processing unit 60 may acquire a differential signal via the communication processing unit 70.

なお、音声入力装置2は、表示パネルなどの表示装置や、スピーカ等の音声出力装置をさらに含んでいてもよい。また、音声入力装置2は、操作情報を入力するための操作キーをさらに含んでいてもよい。   Note that the voice input device 2 may further include a display device such as a display panel, and a voice output device such as a speaker. The voice input device 2 may further include an operation key for inputting operation information.

音声入力装置2は、以上の構成をなしていてもよい。この音声入力装置2は、マイクロフォンユニット1を利用する。そのため、この音声入力装置2は、雑音を含まない、入力音声を示す信号を取得することができ、精度の高い音声認識や音声認証、コマンド生成処理を実現することができる。   The voice input device 2 may have the above configuration. The voice input device 2 uses a microphone unit 1. Therefore, the voice input device 2 can acquire a signal indicating input voice that does not include noise, and can realize highly accurate voice recognition, voice authentication, and command generation processing.

また、音声入力装置2をマイクシステムに適用すれば、スピーカから出力されるユーザの声も、雑音として除去される。そのため、ハウリングが起こりにくいマイクシステムを提供することができる。   Further, when the voice input device 2 is applied to a microphone system, the user's voice output from the speaker is also removed as noise. Therefore, it is possible to provide a microphone system in which howling hardly occurs.

図10〜図12には、音声入力装置2の例として、携帯電話300、マイク(マイクシステム)400、及び、リモートコントローラ500を、それぞれ示す。また、図13には、情報入力端末としての音声入力装置602と、ホストコンピュータ604とを含む、情報処理システム600の概略図を示す。   10 to 12 show a mobile phone 300, a microphone (microphone system) 400, and a remote controller 500 as examples of the voice input device 2. FIG. 13 is a schematic diagram of an information processing system 600 including a voice input device 602 as an information input terminal and a host computer 604.

1−7.変形例
なお、本発明は、上述の実施の形態に限定されるものではなく、種々の変形が可能である。本発明は、実施の形態で説明した構成と実質的に同一の構成(例えば、機能、方法及び結果が同一の構成、あるいは目的及び効果が同一の構成)を含む。また、本発明は、実施の形態で説明した構成の本質的でない部分を置き換えた構成を含む。また、本発明は、実施の形態で説明した構成と同一の作用効果を奏する構成又は同一の目的を達成することができる構成を含む。また、本発明は、実施の形態で説明した構成に公知技術を付加した構成を含む。
1-7. Modifications The present invention is not limited to the above-described embodiment, and various modifications can be made. The present invention includes configurations that are substantially the same as the configurations described in the embodiments (for example, configurations that have the same functions, methods, and results, or configurations that have the same objects and effects). In addition, the invention includes a configuration in which a non-essential part of the configuration described in the embodiment is replaced. In addition, the present invention includes a configuration that exhibits the same operational effects as the configuration described in the embodiment or a configuration that can achieve the same object. Further, the invention includes a configuration in which a known technique is added to the configuration described in the embodiment.

以下、具体的な変形例を示す。   Hereinafter, a specific modification is shown.

(1)第1の変形例
図14には、本発明を適用した実施の形態の第1の変形例に係るマイクロフォンユニット3を示す。
(1) First Modification FIG. 14 shows a microphone unit 3 according to a first modification of the embodiment to which the present invention is applied.

マイクロフォンユニット3は、振動膜80を含む。振動膜80は、筐体10の内部空間100を第1の空間112と、第2の空間114とに分割する仕切り部材の一部を構成する。振動膜80は、法線が面15と直交するように(すなわち、面15と平行になるように)設けられている。振動膜80は、第2の貫通穴14の側方に、第1及び第2の貫通穴12,14と重複しないように設けられていてもよい。また、振動膜80は、筐体10の内壁面と間隔をあけて配置されていてもよい。   The microphone unit 3 includes a vibration film 80. The vibrating membrane 80 constitutes a part of a partition member that divides the internal space 100 of the housing 10 into a first space 112 and a second space 114. The vibration film 80 is provided so that the normal line is orthogonal to the surface 15 (that is, parallel to the surface 15). The vibration film 80 may be provided on the side of the second through hole 14 so as not to overlap with the first and second through holes 12 and 14. Further, the vibration film 80 may be disposed with a space from the inner wall surface of the housing 10.

(2)第2の変形例
図15には、本発明を適用した実施の形態の第2の変形例に係るマイクロフォンユニット4を示す。
(2) Second Modification FIG. 15 shows a microphone unit 4 according to a second modification of the embodiment to which the present invention is applied.

マイクロフォンユニット4は、振動膜90を含む。振動膜90は、筐体10の内部空間100を第1の空間122と、第2の空間124とに分割する仕切り部材の一部を構成する。振動膜90は、法線が面15と直交するように設けられている。振動膜90は、筐体10の内壁面(面15とは反対側の面)と面一になるように設けられていてもよい。振動膜90は、筐体10の内側(内部空間100)から、第2の貫通穴14をふさぐように設けられていてもよい。すなわち、マイクロフォンユニット3では、第2の貫通穴14の内部空間のみを第2の空間124とし、内部空間100のうち、第2の空間124以外の空間を第1の空間122としてもよい。これによると、筐体10を薄く設計することが可能になる。   The microphone unit 4 includes a vibration film 90. The vibration film 90 constitutes a part of a partition member that divides the internal space 100 of the housing 10 into a first space 122 and a second space 124. The vibration film 90 is provided so that the normal line is orthogonal to the surface 15. The vibration film 90 may be provided so as to be flush with the inner wall surface (surface opposite to the surface 15) of the housing 10. The vibration film 90 may be provided so as to block the second through hole 14 from the inside (inner space 100) of the housing 10. That is, in the microphone unit 3, only the internal space of the second through hole 14 may be the second space 124, and the space other than the second space 124 in the internal space 100 may be the first space 122. According to this, it becomes possible to design the housing | casing 10 thinly.

(3)第3の変形例
図16には、本発明を適用した実施の形態の第3の変形例に係るマイクロフォンユニット5を示す。
(3) Third Modification FIG. 16 shows a microphone unit 5 according to a third modification of the embodiment to which the present invention is applied.

マイクロフォンユニット5は、筐体11を含む。筐体11は、内部空間101を有する。そして、内部空間101は、仕切り部材20によって、第1の領域132と第2の領域134とに分割されている。マイクロフォンユニット5では、仕切り部材20は、第2の貫通穴14の側方に配置される。また、マイクロフォンユニット5では、仕切り部材20は、内部空間101を、第1及び第2の空間132,134の容積が等しくなるように分割する。   The microphone unit 5 includes a housing 11. The housing 11 has an internal space 101. The internal space 101 is divided into a first region 132 and a second region 134 by the partition member 20. In the microphone unit 5, the partition member 20 is disposed on the side of the second through hole 14. In the microphone unit 5, the partition member 20 divides the internal space 101 so that the volumes of the first and second spaces 132 and 134 are equal.

(4)第4の変形例
図17には、本発明を適用した実施の形態の第4の変形例に係るマイクロフォンユニット6を示す。
(4) Fourth Modification FIG. 17 shows a microphone unit 6 according to a fourth modification of the embodiment to which the present invention is applied.

マイクロフォンユニット6は、図17に示すように、仕切り部材21を有する。そして、仕切り部材21は、振動膜31を有する。振動膜31は、筐体10内部で、法線が面15と斜めに交差するように保持されている。   The microphone unit 6 includes a partition member 21 as shown in FIG. The partition member 21 has a vibration film 31. The vibration film 31 is held inside the housing 10 so that the normal line obliquely intersects the surface 15.

(5)第5の変形例
図18には、本発明を適用した実施の形態の第5の変形例に係るマイクロフォンユニット7を示す。
(5) Fifth Modification FIG. 18 shows a microphone unit 7 according to a fifth modification of the embodiment to which the present invention is applied.

マイクロフォンユニット7では、図18に示すように、仕切り部材20が、第1及び第2の貫通穴12,14の中間に配置されている。すなわち、第1の貫通穴12と仕切り部材20との距離が、第2の貫通穴14と仕切り部材20との距離と等しくなっている。なお、マイクロフォンユニット7では、仕切り部材20は、筐体10の内部空間100を均等に分割するように配置されていてもよい。   In the microphone unit 7, as shown in FIG. 18, the partition member 20 is disposed between the first and second through holes 12 and 14. That is, the distance between the first through hole 12 and the partition member 20 is equal to the distance between the second through hole 14 and the partition member 20. In the microphone unit 7, the partition member 20 may be arranged so as to equally divide the internal space 100 of the housing 10.

(6)第6の変形例
図19には、本発明を適用した実施の形態の第6の変形例に係るマイクロフォンユニット8を示す。
(6) Sixth Modification FIG. 19 shows a microphone unit 8 according to a sixth modification of the embodiment to which the present invention is applied.

マイクロフォンユニット8では、図19に示すように、筐体が、凸曲面16を有する構造となっている。そして、第1及び第2の貫通穴12,14は、凸曲面16に形成されている。   In the microphone unit 8, the housing has a convex curved surface 16 as shown in FIG. 19. The first and second through holes 12 and 14 are formed on the convex curved surface 16.

(7)第7の変形例
図20には、本発明を適用した実施の形態の第7の変形例に係るマイクロフォンユニット9を示す。
(7) Seventh Modification FIG. 20 shows a microphone unit 9 according to a seventh modification of the embodiment to which the present invention is applied.

マイクロフォンユニット9では、図20に示すように、筐体が、凹曲面17を有する構造となっている。そして、第1及び第2の貫通穴12,14は、凹曲面17の両側に配置されていてもよい。ただし、第1及び第2の貫通穴12,14は、凹曲面17に形成されていてもよい。   In the microphone unit 9, the housing has a concave curved surface 17 as shown in FIG. 20. The first and second through holes 12 and 14 may be disposed on both sides of the concave curved surface 17. However, the first and second through holes 12 and 14 may be formed in the concave curved surface 17.

(8)第8の変形例
図21には、本発明を適用した実施の形態の第8の変形例に係るマイクロフォンユニット13を示す。
(8) Eighth Modification FIG. 21 shows a microphone unit 13 according to an eighth modification of the embodiment to which the present invention is applied.

マイクロフォンユニット13では、図21に示すように、筐体が、球面18を有する構造となっている。なお、球面18の底面は円形であってもよいが、これに限られるものではなく、底面は楕円形となっていてもよい。そして、第1及び第2の貫通穴12,14は、球面18に形成されている。   In the microphone unit 13, the casing has a spherical surface 18 as shown in FIG. 21. The bottom surface of the spherical surface 18 may be circular, but is not limited thereto, and the bottom surface may be elliptical. The first and second through holes 12 and 14 are formed in the spherical surface 18.

これらのマイクロフォンユニットによっても、上述と同様の効果を奏することができる。そのため、振動膜の振動に基づいて電気信号を取得することで、雑音成分を含まない、ユーザ音声のみを示す電気信号を取得することができる。   These microphone units can also provide the same effects as described above. Therefore, by acquiring an electrical signal based on the vibration of the diaphragm, it is possible to acquire an electrical signal indicating only the user voice that does not include a noise component.

2−1.集積回路装置の構成
はじめに、図22〜図24を参照して、本発明を適用した実施の形態に係る集積回路装置1の構成について説明する。なお、本実施の形態に係る集積回路装置1は、音声入力素子(マイク素子)として構成され、接話型の音声入力装置等に適用することができる。
2-1. Configuration of Integrated Circuit Device First, the configuration of an integrated circuit device 1 according to an embodiment to which the present invention is applied will be described with reference to FIGS. The integrated circuit device 1 according to the present embodiment is configured as a voice input element (microphone element), and can be applied to a close-talking voice input device or the like.

本実施の形態に係る集積回路装置1は、図22及び図23に示すように、半導体基板1100を有する。なお、図22は集積回路装置1001(半導体基板1100)の斜視図であり、図23は、集積回路装置1001の断面図である。半導体基板1100は、半導体チップであってもよい。あるいは、半導体基板1100は、集積回路装置1001となる領域を複数有する半導体ウエハであってもよい。半導体基板1100は、シリコン基板であってもよい。   The integrated circuit device 1 according to the present embodiment includes a semiconductor substrate 1100 as shown in FIGS. 22 is a perspective view of the integrated circuit device 1001 (semiconductor substrate 1100), and FIG. 23 is a cross-sectional view of the integrated circuit device 1001. The semiconductor substrate 1100 may be a semiconductor chip. Alternatively, the semiconductor substrate 1100 may be a semiconductor wafer having a plurality of regions to be the integrated circuit device 1001. The semiconductor substrate 1100 may be a silicon substrate.

半導体基板1100には、第1の振動膜1012が形成されている。第1の振動膜1012は、半導体基板1100の所与の面1101から形成された第1の凹部1102の底部であってもよい。第1の振動膜1012は、第1のマイクロフォン1010を構成する振動膜である。すなわち、第1の振動膜1012は音波が入射することによって振動するように形成されており、間隔をあけて対向配置された第1の電極1014と対になって第1のマイクロフォン1010を構成する。第1の振動膜1012に音波が入射すると、第1の振動膜1012が振動し、第1の振動膜1012と第1の電極1014との間隔が変化して、第1の振動膜1012と第1の電極1014との間の静電容量が変化する。この静電容量の変化を、例えば電圧の変化として出力することによって、第1の振動膜1012を振動させる音波(第1の振動膜1012に入射する音波)を、電気信号(電圧信号)に変換して出力することができる。以下、第1のマイクロフォン1010から出力される電圧信号を、第1の電圧信号と呼ぶ。   A first vibration film 1012 is formed on the semiconductor substrate 1100. The first vibrating membrane 1012 may be the bottom of the first recess 1102 formed from a given surface 1101 of the semiconductor substrate 1100. The first vibration film 1012 is a vibration film constituting the first microphone 1010. That is, the first vibrating membrane 1012 is formed so as to vibrate when a sound wave is incident thereon, and constitutes the first microphone 1010 in a pair with the first electrodes 1014 arranged to face each other with a space therebetween. . When sound waves are incident on the first vibration film 1012, the first vibration film 1012 vibrates, the distance between the first vibration film 1012 and the first electrode 1014 changes, and the first vibration film 1012 and the first vibration film 1012 change. The capacitance between the electrode 1014 and the first electrode 1014 changes. By outputting this change in capacitance as, for example, a change in voltage, a sound wave that vibrates the first vibration film 1012 (a sound wave incident on the first vibration film 1012) is converted into an electric signal (voltage signal). Can be output. Hereinafter, the voltage signal output from the first microphone 1010 is referred to as a first voltage signal.

半導体基板1100には、第2の振動膜1022が形成されている。第2の振動膜1022は、半導体基板1100の所与の面1101から形成された第2の凹部1104の底部であってもよい。第2の振動膜1022は、第2のマイクロフォン1020を構成する振動膜である。すなわち、第2の振動膜1022は音波が入射することによって振動するように形成されており、間隔をあけて対向配置された第2の電極1024と対になって第2のマイクロフォン1020を構成する。第2のマイクロフォン1020は、第1のマイクロフォン1010と同様の作用によって、第2の振動膜1022を振動させる音波(第2の振動膜22に入射する音波)を、電圧信号に変換して出力する。以下、第2のマイクロフォン1020から出力される電圧信号を、第2の電圧信号と呼ぶ。   A second vibration film 1022 is formed on the semiconductor substrate 1100. The second vibrating membrane 1022 may be the bottom of the second recess 1104 formed from a given surface 1101 of the semiconductor substrate 1100. The second vibration film 1022 is a vibration film constituting the second microphone 1020. That is, the second vibrating membrane 1022 is formed so as to vibrate when a sound wave is incident thereon, and forms a second microphone 1020 in a pair with the second electrode 1024 arranged to face the gap. . The second microphone 1020 converts a sound wave that vibrates the second vibration film 1022 (a sound wave incident on the second vibration film 22) into a voltage signal by the same action as the first microphone 1010 and outputs the voltage signal. . Hereinafter, the voltage signal output from the second microphone 1020 is referred to as a second voltage signal.

本実施の形態では、第1及び第2の振動膜1012,1022は半導体基板1100に形成されており、例えばシリコン膜であってもよい。すなわち、第1及び第2のマイクロフォン1010,1020は、シリコンマイク(Siマイク)であってもよい。シリコンマイクを利用することで、第1及び第2のマイクロフォン1010,1020の小型化、及び、高性能化を実現することができる。第1及び第2の振動膜1012,1022は、法線が平行になるように配置されていてもよい。また、第1及び第2の振動膜1012,1022は、法線と直交する方向にずれて配置されていてもよい。   In the present embodiment, the first and second vibration films 1012 and 1022 are formed on the semiconductor substrate 1100, and may be silicon films, for example. That is, the first and second microphones 1010 and 1020 may be silicon microphones (Si microphones). By using the silicon microphone, the first and second microphones 1010 and 1020 can be reduced in size and performance. The first and second vibrating membranes 1012 and 1022 may be arranged so that the normal lines are parallel to each other. Further, the first and second vibrating membranes 1012 and 1022 may be arranged so as to be shifted in a direction orthogonal to the normal line.

第1及び第2の電極1014,1024は、半導体基板1100の一部であってもよく、あるいは、半導体基板1100上に配置された導電体であってもよい。また、第1及び第2の電極1014,1024は、音波の影響を受けない構造をなしていてもよい。例えば、第1及び第2の電極1014,1024は、メッシュ構造をなしていてもよい。   The first and second electrodes 1014 and 1024 may be part of the semiconductor substrate 1100, or may be a conductor disposed on the semiconductor substrate 1100. The first and second electrodes 1014 and 1024 may have a structure that is not affected by sound waves. For example, the first and second electrodes 1014 and 1024 may have a mesh structure.

半導体基板1100には、集積回路1016が形成されている。集積回路1016の構成は特に限定されないが、例えば、トランジスタ等の能動素子や、抵抗等の受動素子を含んでいてもよい。   An integrated circuit 1016 is formed on the semiconductor substrate 1100. The configuration of the integrated circuit 1016 is not particularly limited, and may include, for example, an active element such as a transistor or a passive element such as a resistor.

本実施の形態に係る集積回路装置は、差分信号生成回路1030を有する。差分信号生成回路1030は、第1の電圧信号と、第2の電圧信号とを受け付けて、両者の差を示す差分信号を生成(出力)する。差分信号生成回路1030では、第1及び第2の電圧信号に対して例えばフーリエ解析などの解析処理を行うことなく、差分信号を生成する処理を行う。差分信号生成回路1030は、半導体基板1100に構成された集積回路1016の一部であってもよい。図24には、差分信号生成回路1030の回路図の一例を示すが、差分信号生成回路1030の回路構成はこれに限られるものではない。   The integrated circuit device according to this embodiment includes a differential signal generation circuit 1030. The difference signal generation circuit 1030 receives the first voltage signal and the second voltage signal, and generates (outputs) a difference signal indicating the difference between the two. The difference signal generation circuit 1030 performs a process for generating a difference signal without performing an analysis process such as Fourier analysis on the first and second voltage signals. The differential signal generation circuit 1030 may be a part of the integrated circuit 1016 configured on the semiconductor substrate 1100. FIG. 24 shows an example of a circuit diagram of the differential signal generation circuit 1030, but the circuit configuration of the differential signal generation circuit 1030 is not limited to this.

なお、本実施の形態に係る集積回路装置1001は、差分信号を増幅する信号増幅回路をさらに含んでいてもよい。信号増幅回路は、集積回路1016の一部を構成していてもよい。ただし、集積回路装置は、信号増幅回路を含まない構成になっていてもよい。   Note that the integrated circuit device 1001 according to this embodiment may further include a signal amplifier circuit that amplifies the differential signal. The signal amplifier circuit may constitute part of the integrated circuit 1016. However, the integrated circuit device may be configured not to include a signal amplifier circuit.

本実施の形態に係る集積回路装置1001では、第1及び第2の振動膜1012,1022、及び、集積回路1016(差分信号生成回路1030)は、1つの半導体基板1100に形成されている。半導体基板1100は、いわゆるメムス(MEMS:Micro Electro Mechanical Systems)ととらえてもよい。第1及び第2の振動膜1012,1022を、同一基板(半導体基板1100)に形成することで、第1及び第2の振動膜1012,1022を精度よく形成することができるとともに、第1及び第2の振動膜1012,1022を極めて近接させることが可能になる。   In the integrated circuit device 1001 according to this embodiment, the first and second vibrating membranes 1012 and 1022 and the integrated circuit 1016 (difference signal generation circuit 1030) are formed on one semiconductor substrate 1100. The semiconductor substrate 1100 may be regarded as so-called MEMS (Micro Electro Mechanical Systems). By forming the first and second vibrating membranes 1012 and 1022 on the same substrate (semiconductor substrate 1100), the first and second vibrating membranes 1012 and 1022 can be accurately formed, The second vibrating membranes 1012 and 1022 can be extremely close to each other.

なお、本実施の形態に係る集積回路装置1001によると、後述するように、第1及び第2の電圧信号の差を示す差分信号を利用して、雑音成分を除去する機能を実現する。この機能を高精度に実現するために、第1及び第2の振動膜1012,1022は、一定の制約を満たすように配置してもよい。第1及び第2の振動膜1012,1014が満たすべき制約の詳細については後述するが、本実施の形態では、第1及び第2の振動膜1012,1022は、雑音強度比が、入力音声強度比よりも小さくなるように配置されてもよい。これにより、差分信号を、雑音成分が除去された音声成分を示す信号とみなすことが可能になる。第1及び第2の振動膜1012,1022は、例えば、中心間距離Δrが5.2mm以下になるように配置されていてもよい。   Note that the integrated circuit device 1001 according to the present embodiment realizes a function of removing a noise component by using a difference signal indicating a difference between the first and second voltage signals, as will be described later. In order to realize this function with high accuracy, the first and second vibrating membranes 1012 and 1022 may be arranged to satisfy certain restrictions. Although details of the constraints to be satisfied by the first and second vibrating membranes 1012 and 1014 will be described later, in the present embodiment, the first and second vibrating membranes 1012 and 1022 have a noise intensity ratio and an input voice intensity. You may arrange | position so that it may become smaller than ratio. As a result, the difference signal can be regarded as a signal indicating the audio component from which the noise component has been removed. The first and second vibrating membranes 1012 and 1022 may be arranged, for example, such that the center-to-center distance Δr is 5.2 mm or less.

本実施の形態に係る集積回路装置1001は以上のように構成されていてもよい。これによると、精度の高い雑音除去機能を実現することが可能な集積回路装置を提供することができる。なお、その原理については後述する。   The integrated circuit device 1001 according to this embodiment may be configured as described above. According to this, an integrated circuit device capable of realizing a highly accurate noise removal function can be provided. The principle will be described later.

2−2.雑音除去機能
以下、集積回路装置1001による音声除去原理、及び、これを実現するための条件について説明する。
2-2. Noise Removal Function Hereinafter, the principle of voice removal by the integrated circuit device 1001 and the conditions for realizing it will be described.

(1)雑音除去原理
はじめに、雑音除去原理について説明する。
(1) Principle of noise removal First, the principle of noise removal will be described.

音波は、媒質中を進行するにつれ減衰し、音圧(音波の強度・振幅)が低下する。音圧は、音源からの距離に反比例するため、音圧Pは、音源からの距離Rとの関係において、

Figure 2009005071
と表すことができる。なお、式(1)中、kは比例定数である。図5には、式(1)を表すグラフを示すが、本図からもわかるように、音圧(音波の振幅)は、音源に近い位置(グラフの左側)では急激に減衰し、音源から離れるほどなだらかに減衰する。本実施の形態に係る集積回路装置では、この減衰特性を利用して雑音成分を除去する。 The sound wave attenuates as it travels through the medium, and the sound pressure (the intensity and amplitude of the sound wave) decreases. Since the sound pressure is inversely proportional to the distance from the sound source, the sound pressure P is related to the distance R from the sound source.
Figure 2009005071
It can be expressed as. In equation (1), k is a proportionality constant. FIG. 5 shows a graph representing the expression (1). As can be seen from FIG. 5, the sound pressure (the amplitude of the sound wave) is abruptly attenuated at a position close to the sound source (left side of the graph). Attenuates gently as you move away. In the integrated circuit device according to the present embodiment, noise components are removed using this attenuation characteristic.

すなわち、集積回路装置1001を接話型の音声入力装置に適用する場合、ユーザは、雑音の音源よりも、集積回路装置1001(第1及び第2の振動膜1012,1022)に近い位置で音声を発することになる。そのため、第1及び第2の振動膜1012,1022の間で、ユーザの音声は大きく減衰し、第1及び第2の電圧信号に含まれるユーザ音声の強度には差が現れる。これに対して雑音成分は、ユーザの音声に比べて音源が遠いため、第1及び第2の振動膜1012,1022の間でほとんど減衰しない。そのため、第1及び第2の電圧信号に含まれる雑音の強度には、差が現れないとみなすことができる。このことから、第1及び第2の電圧信号の差を検出すれば雑音が消去され、集積回路装置1の近傍で発声されたユーザの音声成分のみが残ることになる。すなわち、第1及び第2の電圧信号の差を検出することで、雑音成分が含まれない、ユーザの音声成分のみを示す電圧信号(差分信号)を取得することができる。そして、この集積回路装置1によると、2つの電圧信号の差を示す差分信号を生成するだけの単純な処理によって、精度よく雑音が除去された、ユーザ音声を示す信号を取得することができる。   In other words, when the integrated circuit device 1001 is applied to a close-talking sound input device, the user speaks at a position closer to the integrated circuit device 1001 (first and second vibrating membranes 1012 and 1022) than a noise source. Will be issued. Therefore, the user's voice is greatly attenuated between the first and second vibrating membranes 1012 and 1022, and a difference appears in the intensity of the user voice included in the first and second voltage signals. On the other hand, the noise component is hardly attenuated between the first and second vibrating membranes 1012 and 1022 because the sound source is farther than the user's voice. Therefore, it can be considered that no difference appears in the intensity of noise included in the first and second voltage signals. From this, if the difference between the first and second voltage signals is detected, the noise is eliminated, and only the voice component of the user uttered in the vicinity of the integrated circuit device 1 remains. That is, by detecting the difference between the first and second voltage signals, it is possible to obtain a voltage signal (difference signal) that does not include a noise component and that indicates only the user's voice component. And according to this integrated circuit device 1, the signal which shows a user voice from which noise was removed accurately can be acquired by simple processing which only generates the difference signal which shows the difference of two voltage signals.

ただし、音波は位相成分を有する。そのため、より精度の高い雑音除去機能を実現するためには、第1及び第2の電圧信号に含まれる音声成分及び雑音成分の位相差を考慮する必要がある。   However, the sound wave has a phase component. Therefore, in order to realize a more accurate noise removal function, it is necessary to consider the phase difference between the speech component and the noise component included in the first and second voltage signals.

以下、差分信号を生成することによって雑音除去機能を実現するために、集積回路装置1が満たすべき具体的な条件について説明する。   Hereinafter, specific conditions that the integrated circuit device 1 should satisfy in order to realize the noise removal function by generating the differential signal will be described.

(2)集積回路装置が満たすべき具体的条件
集積回路装置1001によると、先に説明したように、第1及び第2の電圧信号の差分を示す差分信号を、雑音を含まない入力音声信号であるとみなす。この集積回路装置によると、差分信号に含まれる雑音成分が、第1又は第2の電圧信号に含まれる雑音成分よりも小さくなったことをもって、雑音除去機能が実現できたと評価することができる。詳しくは、差分信号に含まれる雑音成分の強度の、第1又は第2の電圧信号に含まれる雑音成分の強度に対する比を示す雑音強度比が、差分信号に含まれる音声成分の強度の、第1又は第2の電圧信号に含まれる音声成分の強度に対する比を示す音声強度比よりも小さくなれば、この雑音除去機能が実現されたと評価することができる。
(2) Specific conditions to be satisfied by the integrated circuit device According to the integrated circuit device 1001, as described above, the difference signal indicating the difference between the first and second voltage signals can be converted into an input voice signal that does not include noise. Consider it. According to this integrated circuit device, it can be evaluated that the noise removal function can be realized when the noise component included in the differential signal is smaller than the noise component included in the first or second voltage signal. Specifically, the noise intensity ratio indicating the ratio of the intensity of the noise component included in the difference signal to the intensity of the noise component included in the first or second voltage signal is equal to the intensity of the audio component included in the difference signal. If the ratio is smaller than the voice intensity ratio indicating the ratio of the voice component included in the first or second voltage signal, it can be evaluated that the noise removal function has been realized.

以下、この雑音除去機能を実現するために、集積回路装置1001(第1及び第2の振動膜1012,1022)が満たすべき具体的な条件について説明する。   Hereinafter, specific conditions that the integrated circuit device 1001 (first and second vibrating membranes 1012 and 1022) should satisfy in order to realize this noise removal function will be described.

はじめに、第1及び第2のマイクロフォン1010,1020(第1及び第2の振動膜1012,1022)に入射する音声の音圧について検討する。入力音声(ユーザの音声)の音源から第1の振動膜1012までの距離をRとし、位相差を無視すれば、第1及び第2のマイクロフォン1010,1020で取得される、入力音声の音圧(強度)P(S1)及びP(S2)は、

Figure 2009005071
と表すことができる。 First, the sound pressure of the sound incident on the first and second microphones 1010 and 1020 (first and second vibrating membranes 1012 and 1022) will be examined. If the distance from the sound source of the input voice (user's voice) to the first diaphragm 1012 is R, and the phase difference is ignored, the sound pressure of the input voice acquired by the first and second microphones 1010 and 1020 (Strength) P (S1) and P (S2) are
Figure 2009005071
It can be expressed as.

そのため、入力音声の位相差を無視した時の、第1のマイクロフォン10で取得される入力音声成分の強度に対する、差分信号に含まれる入力音声成分の強度の比率を示す音声強度比ρ(P)は、

Figure 2009005071
と表される。 Therefore, a speech intensity ratio ρ (P) indicating the ratio of the strength of the input speech component included in the difference signal to the strength of the input speech component acquired by the first microphone 10 when the phase difference of the input speech is ignored. Is
Figure 2009005071
It is expressed.

ここで、本実施の形態に係る集積回路装置が接話式の音声入力装置に利用されるマイク素子である場合、ΔrはRに比べて充分小さいとみなすことができるため、上述の式(4)は、

Figure 2009005071
と変形することができる。 Here, when the integrated circuit device according to the present embodiment is a microphone element used in a close-talking voice input device, Δr can be considered to be sufficiently smaller than R, and therefore, the above equation (4) )
Figure 2009005071
And can be transformed.

すなわち、入力音声の位相差を無視した場合の音声強度比は、式(A)と表されることがわかる。   That is, it can be seen that the voice intensity ratio when the phase difference of the input voice is ignored is expressed by the equation (A).

ところで、入力音声の位相差を考慮すると、ユーザ音声の音圧Q(S1)及びQ(S2)は、

Figure 2009005071
と表すことができる。なお、式中、αは位相差である。 By the way, considering the phase difference of the input voice, the sound pressures Q (S1) and Q (S2) of the user voice are
Figure 2009005071
It can be expressed as. In the formula, α is a phase difference.

このとき、音声強度比ρ(S)は、

Figure 2009005071
と表される。式(7)を考慮すると、音声強度比ρ(S)の大きさは、
Figure 2009005071
と表すことができる。 At this time, the voice intensity ratio ρ (S) is
Figure 2009005071
It is expressed. Considering equation (7), the magnitude of the voice intensity ratio ρ (S) is
Figure 2009005071
It can be expressed as.

ところで、式(8)のうち、sinωt−sin(ωt−α)項は位相成分の強度比を示し、Δr/Rsinωt項は振幅成分の強度比を示す。入力音声成分であっても、位相差成分は、振幅成分に対するノイズとなるため、入力音声(ユーザの音声)を精度よく抽出するためには、位相成分の強度比が、振幅成分の強度比よりも充分に小さいことが必要である。すなわち、sinωt−sin(ωt−α)と、Δr/Rsinωtとは、

Figure 2009005071
の関係を満たしていることが必要である。 By the way, in equation (8), the term sinωt−sin (ωt−α) indicates the intensity ratio of the phase component, and the Δr / Rsinωt term indicates the intensity ratio of the amplitude component. Even if it is an input audio component, the phase difference component becomes noise with respect to the amplitude component. Therefore, in order to accurately extract the input audio (user's audio), the intensity ratio of the phase component is greater than the intensity ratio of the amplitude component. Must be sufficiently small. That is, sinωt−sin (ωt−α) and Δr / Rsinωt are
Figure 2009005071
It is necessary to satisfy the relationship.

ここで、

Figure 2009005071
と表すことができるため、上述の式(B)は、
Figure 2009005071
と表すことができる。 here,
Figure 2009005071
Therefore, the above formula (B) can be expressed as
Figure 2009005071
It can be expressed as.

式(10)の振幅成分を考慮すると、本実施の形態に係る集積回路装置1は、

Figure 2009005071
を満たす必要があることがわかる。 Considering the amplitude component of equation (10), the integrated circuit device 1 according to the present embodiment is
Figure 2009005071
It turns out that it is necessary to satisfy.

なお、上述したように、ΔrはRに比べて充分小さいとみなすことができるため、sin(α/2)は充分小さいとみなすことができ、

Figure 2009005071
と近似することができる。 As described above, since Δr can be considered to be sufficiently smaller than R, sin (α / 2) can be considered to be sufficiently small.
Figure 2009005071
And can be approximated.

そのため、式(C)は、

Figure 2009005071
と変形することができる。 Therefore, the formula (C) is
Figure 2009005071
And can be transformed.

また、位相差であるαとΔrとの関係を、

Figure 2009005071
と表せば、式(D)は、
Figure 2009005071
と変形することができる。 Also, the relationship between α and Δr, which are phase differences, is
Figure 2009005071
The expression (D) can be expressed as
Figure 2009005071
And can be transformed.

すなわち、本実施の形態では、入力音声(ユーザの音声)を精度よく抽出するためには、集積回路装置1が式(E)に示す関係を満たすことが必要である。   In other words, in the present embodiment, in order to accurately extract the input voice (user's voice), it is necessary for the integrated circuit device 1 to satisfy the relationship represented by the equation (E).

次に、第1及び第2のマイクロフォン10,20(第1及び第2の振動膜12,22)に入射する雑音の音圧について検討する。   Next, the sound pressure of noise incident on the first and second microphones 10 and 20 (first and second vibrating membranes 12 and 22) will be examined.

第1及び第2のマイクロフォン10,20で取得される雑音成分の振幅を、A,A´とすると、位相差成分を考慮した雑音の音圧Q(N1)及びQ(N2)は、

Figure 2009005071
と表すことができ、第1のマイクロフォン10で取得される雑音成分の強度に対する、差分信号に含まれる雑音成分の強度の比率を示す雑音強度比ρ(N)は、
Figure 2009005071
と表すことができる。 Assuming that the amplitudes of the noise components acquired by the first and second microphones 10 and 20 are A and A ′, the sound pressures Q (N1) and Q (N2) of the noise considering the phase difference component are
Figure 2009005071
The noise intensity ratio ρ (N) indicating the ratio of the intensity of the noise component included in the difference signal to the intensity of the noise component acquired by the first microphone 10 is expressed as follows:
Figure 2009005071
It can be expressed as.

なお、先に説明したように、第1及び第2のマイクロフォン10,20で取得される雑音成分の振幅(強度)はほぼ同じであり、A=A´と扱うことができる。そのため、上記の式(15)は、

Figure 2009005071
と変形することができる。 As described above, the amplitudes (intensities) of the noise components acquired by the first and second microphones 10 and 20 are substantially the same, and can be handled as A = A ′. Therefore, the above equation (15) is
Figure 2009005071
And can be transformed.

そして、雑音強度比の大きさは、

Figure 2009005071
と表すことができる。 And the magnitude of the noise intensity ratio is
Figure 2009005071
It can be expressed as.

ここで、上述の式(9)を考慮すると、式(17)は、

Figure 2009005071
と変形することができる。 Here, considering the above equation (9), equation (17) is
Figure 2009005071
And can be transformed.

そして、式(11)を考慮すると、式(18)は、

Figure 2009005071
と変形することができる。 And considering equation (11), equation (18) is
Figure 2009005071
And can be transformed.

ここで、式(D)を参照すれば、雑音強度比の大きさは、

Figure 2009005071
と表すことができる。なお、Δr/Rとは、式(A)に示すように、入力音声(ユーザ音声)の振幅成分の強度比である。式(F)から、この集積回路装置1では、雑音強度比が入力音声の強度比Δr/Rよりも小さくなることがわかる。 Here, referring to equation (D), the magnitude of the noise intensity ratio is
Figure 2009005071
It can be expressed as. Note that Δr / R is the intensity ratio of the amplitude component of the input voice (user voice) as shown in Expression (A). From the equation (F), it can be seen that in this integrated circuit device 1, the noise intensity ratio is smaller than the intensity ratio Δr / R of the input voice.

以上のことから、入力音声の位相成分の強度比が振幅成分の強度比よりも小さくなる集積回路装置1によれば(式(B)参照)、雑音強度比が入力音声強度比よりも小さくなる(式(F)参照)。逆に言うと、雑音強度比が入力音声強度比よりも小さくなるように設計された集積回路装置1によると、精度の高い雑音除去機能を実現することができる。   From the above, according to the integrated circuit device 1 in which the intensity ratio of the phase component of the input sound is smaller than the intensity ratio of the amplitude component (see equation (B)), the noise intensity ratio is smaller than the input sound intensity ratio. (See formula (F)). In other words, according to the integrated circuit device 1 designed so that the noise intensity ratio is smaller than the input voice intensity ratio, a highly accurate noise removal function can be realized.

2−3.集積回路装置の製造方法
以下、本実施の形態に係る集積回路装置の製造方法について説明する。本実施の形態では、第1及び第2の振動膜1012,1022の中心間距離Δrと雑音の波長λとの比率を示すΔr/λの値と、雑音強度比(雑音の位相成分に基づく強度比)との対応関係を示すデータを利用して、集積回路装置を製造してもよい。
2-3. Hereinafter, a method for manufacturing an integrated circuit device according to the present embodiment will be described. In the present embodiment, the value of Δr / λ indicating the ratio between the center-to-center distance Δr of the first and second vibrating membranes 1012 and 1022 and the noise wavelength λ and the noise intensity ratio (the intensity based on the phase component of the noise). The integrated circuit device may be manufactured using data indicating the correspondence relationship with the ratio.

雑音の位相成分に基づく強度比は、上述した式(18)で表される。そのため、雑音の位相成分に基づく強度比のデシベル値は、

Figure 2009005071
と表すことができる。 The intensity ratio based on the phase component of noise is expressed by the above-described equation (18). Therefore, the decibel value of the intensity ratio based on the phase component of noise is
Figure 2009005071
It can be expressed as.

そして、式(20)のαに各値を代入すれば、位相差αと雑音の位相成分に基づく強度比との対応関係を明らかにすることができる。図6には、横軸をα/2πとし、縦軸に雑音の位相成分に基づく強度比(デシベル値)を取った時の、位相差と強度比との対応関係を表すデータの一例を示す。   Then, by substituting each value into α in Expression (20), it is possible to clarify the correspondence between the phase difference α and the intensity ratio based on the phase component of noise. FIG. 6 shows an example of data representing the correspondence between the phase difference and the intensity ratio when the horizontal axis is α / 2π and the vertical axis is the intensity ratio (decibel value) based on the phase component of noise. .

なお、位相差αは、式(12)に示すように、距離Δrと波長λとの比であるΔr/λの関数で表すことができ、図5の横軸は、Δr/λとみなすことができる。すなわち、図5は、雑音の位相成分に基づく強度比と、Δr/λとの対応関係を示すデータであるといえる。   The phase difference α can be expressed as a function of Δr / λ, which is the ratio of the distance Δr to the wavelength λ, as shown in Equation (12), and the horizontal axis in FIG. 5 is regarded as Δr / λ. Can do. That is, FIG. 5 can be said to be data indicating a correspondence relationship between the intensity ratio based on the phase component of noise and Δr / λ.

本実施の形態では、このデータを利用して、集積回路装置1001を製造する。図7は、このデータを利用して集積回路装置1を製造する手順について説明するためのフローチャート図である。   In this embodiment, the integrated circuit device 1001 is manufactured using this data. FIG. 7 is a flowchart for explaining a procedure for manufacturing the integrated circuit device 1 using this data.

はじめに、雑音の強度比(雑音の位相成分に基づく強度比)と、Δr/λとの対応関係を示すデータ(図6参照)を用意する(ステップS10)。   First, data (see FIG. 6) showing the correspondence between the noise intensity ratio (intensity ratio based on the phase component of noise) and Δr / λ is prepared (step S10).

次に、用途に応じて、雑音の強度比を設定する(ステップS12)。なお、本実施の形態では、雑音の強度が低下するように雑音の強度比を設定する必要がある。そのため、本ステップでは、雑音の強度比を、0dB以下に設定する。   Next, a noise intensity ratio is set according to the application (step S12). In the present embodiment, it is necessary to set the noise intensity ratio so that the noise intensity decreases. Therefore, in this step, the noise intensity ratio is set to 0 dB or less.

次に、当該データに基づいて、雑音の強度比に対応するΔr/λの値を導出する(ステップS14)。   Next, a value of Δr / λ corresponding to the noise intensity ratio is derived based on the data (step S14).

そして、λに主要な雑音の波長を代入することによって、Δrが満たすべき条件を導出する(ステップS16)。   Then, a condition to be satisfied by Δr is derived by substituting the wavelength of the main noise into λ (step S16).

具体例として、主要な雑音が1KHzであり、その波長が0.347mとなる環境下で、雑音の強度が20dB低下する集積回路装置を製造する場合について考える。   As a specific example, consider the case of manufacturing an integrated circuit device in which the noise intensity is reduced by 20 dB in an environment where the main noise is 1 KHz and the wavelength is 0.347 m.

はじめに、必要条件として、雑音の強度比が0dB以下になるための条件について検討する。図6を参照すると、雑音の強度比を0dB以下とするためには、Δr/λの値を0.16以下とすればよいことがわかる。すなわち、Δrの値が55.46mm以下とすればよいことがわかり、これが、この集積回路装置の必要条件となる。   First, as a necessary condition, a condition for the noise intensity ratio to be 0 dB or less is examined. Referring to FIG. 6, it can be seen that the value of Δr / λ may be 0.16 or less in order to make the noise intensity ratio 0 dB or less. That is, it can be seen that the value of Δr should be 55.46 mm or less, which is a necessary condition for this integrated circuit device.

次に、1KHzの雑音の強度を20dB低下させるための条件について考える。図6を参照すると、雑音の強度を20dB低下させるためには、Δr/λの値を0.015とすればよいことがわかる。そして、λ=0.347mとすると、Δrの値が5.199mm以下のときに、この条件を満たすことがわかる。すなわち、Δrを約5.2mm以下に設定すれば、雑音除去機能を有する集積回路装置を製造することが可能になる。   Next, a condition for reducing the intensity of 1 kHz noise by 20 dB will be considered. Referring to FIG. 6, it can be seen that the value of Δr / λ may be set to 0.015 in order to reduce the noise intensity by 20 dB. When λ = 0.347 m, it can be seen that this condition is satisfied when the value of Δr is 5.199 mm or less. That is, if Δr is set to about 5.2 mm or less, an integrated circuit device having a noise removal function can be manufactured.

なお、本実施の形態に係る集積回路装置1001は接話式の音声入力装置に利用されるため、ユーザの音声の音源と集積回路装置1001(第1又は第2の振動膜1012,1022)との間隔は、通常5cm以下である。また、ユーザ音声の音源と集積回路装置1001(第1及び第2の振動膜1012,1022)との間隔は、筐体の設計によって制御することが可能である。そのため、入力音声(ユーザの音声)の強度比であるΔr/Rの値は、0.1(雑音の強度比)よりも大きくなり、雑音除去機能が実現されることがわかる。   Note that the integrated circuit device 1001 according to the present embodiment is used in a close-talking voice input device, and therefore, the sound source of the user's voice, the integrated circuit device 1001 (first or second vibrating membranes 1012 and 1022), and The interval is usually 5 cm or less. Further, the distance between the sound source of the user voice and the integrated circuit device 1001 (first and second vibrating membranes 1012 and 1022) can be controlled by the design of the housing. Therefore, the value of Δr / R, which is the intensity ratio of the input voice (user's voice), becomes larger than 0.1 (noise intensity ratio), and it can be seen that the noise removal function is realized.

なお、通常、雑音は単一の周波数に限定されるものではない。しかし、主要な雑音として想定された雑音よりも周波数の低い雑音は、当該主要な雑音よりも波長が長くなるため、Δr/λの値は小さくなり、この集積回路装置によって除去される。また、音波は、周波数が高いほどエネルギーの減衰が早い。そのため、主要な雑音として想定された雑音よりも周波数の高い雑音は、当該主要な雑音よりも早く減衰するため、集積回路装置に与える影響を無視することができる。このことから、本実施の形態に係る集積回路装置は、主要な雑音として想定された雑音とは異なる周波数の雑音が存在する環境下でも、優れた雑音除去機能を発揮することができる。   In general, noise is not limited to a single frequency. However, since noise having a frequency lower than that of noise assumed as main noise has a longer wavelength than that of main noise, the value of Δr / λ becomes small and is removed by the integrated circuit device. Further, the sound wave decays faster as the frequency is higher. For this reason, noise having a higher frequency than the noise assumed as the main noise attenuates faster than the main noise, so that the influence on the integrated circuit device can be ignored. Therefore, the integrated circuit device according to the present embodiment can exhibit an excellent noise removal function even in an environment where noise having a frequency different from that assumed as main noise exists.

また、本実施の形態では、式(12)からもわかるように、第1及び第2の振動膜1012,1022を結ぶ直線上から入射する雑音を想定した。この雑音は、第1及び第2の振動膜1012,1022の見かけ上の間隔が最も大きくなる雑音であり、現実の使用環境において、位相差が最も大きくなる雑音である。すなわち、本実施の形態に係る集積回路装置1001は、位相差が最も大きくなる雑音を除去することが可能に構成されている。そのため、本実施の形態に係る集積回路装置1001によると、すべての方向から入射する雑音が除去される。   Further, in this embodiment, as can be seen from the equation (12), it is assumed that noise is incident on a straight line connecting the first and second vibrating membranes 1012 and 1022. This noise is a noise in which the apparent distance between the first and second vibrating membranes 1012 and 1022 is the largest, and is a noise in which the phase difference is the largest in an actual use environment. In other words, the integrated circuit device 1001 according to the present embodiment is configured to be able to remove noise with the largest phase difference. Therefore, according to the integrated circuit device 1001 according to the present embodiment, noise incident from all directions is removed.

2−4.効果
以下、集積回路装置1001が奏する効果についてまとめる。
2-4. Effects The effects achieved by the integrated circuit device 1001 will be summarized below.

先に説明したように、集積回路装置1001によると、第1及び第2のマイクロフォン1010,1020で取得された電圧信号の差分を示す差分信号を生成するだけで、雑音成分が除去された音声成分を取得することができる。すなわち、この音声入力装置では、複雑な解析演算処理を行うことなく雑音除去機能を実現することができる。そのため、簡単な構成で、精度の高い雑音除去機能を実現することが可能な集積回路装置(マイク素子・音声入力素子)を提供することができる。   As described above, according to the integrated circuit device 1001, the sound component from which the noise component has been removed can be obtained only by generating a differential signal indicating the difference between the voltage signals acquired by the first and second microphones 1010 and 1020. Can be obtained. That is, in this voice input device, a noise removal function can be realized without performing complicated analysis calculation processing. Therefore, it is possible to provide an integrated circuit device (microphone element / audio input element) that can realize a highly accurate noise removal function with a simple configuration.

また、集積回路装置1001では、位相差に基づく雑音強度比が最も大きくなるように入射する雑音を除去することができるように、第1及び第2の振動膜1012,1022が配置されている。そのため、この集積回路装置1001によると、全方位から入射する雑音が除去される。すなわち、本発明によると、全方位から入射する雑音を除去することが可能な集積回路装置を提供することができる。   In the integrated circuit device 1001, the first and second vibrating membranes 1012 and 1022 are arranged so that incident noise can be removed so that the noise intensity ratio based on the phase difference is maximized. Therefore, according to this integrated circuit device 1001, noise incident from all directions is removed. That is, according to the present invention, it is possible to provide an integrated circuit device capable of removing noise incident from all directions.

なお、集積回路装置1001によると、壁などで反射した後に集積回路装置1001に入射したユーザ音声成分も除去することができる。詳しくは、壁などで反射したユーザ音声の音源は、長距離を伝搬した後に集積回路装置1に入射するため、通常のユーザ音声の音源よりも遠いとみなすことができ、かつ、反射により大きくエネルギーを消失しているため、雑音成分と同様に、第1及び第2の振動膜1012,1022の間で音圧が大きく減衰することがない。そのため、この集積回路装置1001によると、壁などで反射した後に入射するユーザ音声成分も、雑音と同様に(雑音の一種として)除去される。   Note that according to the integrated circuit device 1001, it is also possible to remove the user voice component incident on the integrated circuit device 1001 after being reflected by a wall or the like. Specifically, since the sound source of the user sound reflected by the wall or the like is incident on the integrated circuit device 1 after propagating a long distance, it can be regarded as being farther than the sound source of the normal user sound, and the energy is greatly increased by the reflection. Therefore, the sound pressure is not greatly attenuated between the first and second vibrating membranes 1012 and 1022, similarly to the noise component. Therefore, according to the integrated circuit device 1001, the user voice component incident after being reflected by a wall or the like is also removed in the same manner as noise (as a kind of noise).

また、集積回路装置1001によると、第1及び第2の振動膜1012,1022と、差分信号生成回路1030とが1つの半導体基板1100に形成されている。これによると、第1及び第2の振動膜1012,1022を、高精度に形成することができ、また、第1及び第2の振動膜1012,1022の中心間距離を極めて近接させることができる。そのため、雑音除去精度が高く、かつ、外形が小さい集積回路装置を提供することができる。   Further, according to the integrated circuit device 1001, the first and second vibrating membranes 1012 and 1022 and the differential signal generation circuit 1030 are formed on one semiconductor substrate 1100. According to this, the first and second vibrating membranes 1012 and 1022 can be formed with high accuracy, and the distance between the centers of the first and second vibrating membranes 1012 and 1022 can be extremely close. . Therefore, an integrated circuit device with high noise removal accuracy and a small external shape can be provided.

そして、集積回路装置1001を利用すれば、雑音を含まない、入力音声を示す信号を取得することができる。そのため、この集積回路装置を利用することで、精度の高い音声認識や音声認証、コマンド生成処理を実現することができる。   If the integrated circuit device 1001 is used, a signal indicating input speech that does not include noise can be acquired. Therefore, by using this integrated circuit device, highly accurate voice recognition, voice authentication, and command generation processing can be realized.

2−5.音声入力装置
次に、集積回路装置1001を有する音声入力装置1002について説明する。
2-5. Next, the voice input device 1002 having the integrated circuit device 1001 will be described.

(1)音声入力装置の構成
はじめに、音声入力装置2の構成について説明する。図25及び図26は、音声入力装置1002の構成について説明するための図である。なお、以下に説明する音声入力装置1002は、接話式の音声入力装置であって、例えば、携帯電話やトランシーバー等の音声通信機器や、入力された音声を解析する技術を利用した情報処理システム(音声認証システム、音声認識システム、コマンド生成システム、電子辞書、翻訳機や、音声入力方式のリモートコントローラなど)、あるいは、録音機器やアンプシステム(拡声器)、マイクシステムなどに適用することができる。
(1) Configuration of Voice Input Device First, the configuration of the voice input device 2 will be described. 25 and 26 are diagrams for explaining the configuration of the voice input device 1002. Note that a voice input device 1002 described below is a close-talking voice input device, for example, a voice communication device such as a mobile phone or a transceiver, or an information processing system using technology for analyzing input voice. (Voice authentication system, voice recognition system, command generation system, electronic dictionary, translator, voice input remote controller, etc.), recording equipment, amplifier system (loudspeaker), microphone system, etc. .

図25は、音声入力装置2002の構造を説明するための図である。   FIG. 25 is a diagram for explaining the structure of the voice input device 2002.

音声入力装置1002は、筐体1040を有する。筐体1040は、音声入力装置1002の外形を構成する部材であってもよい。筐体1040には基本姿勢が設定されていてもよく、これにより、入力音声(ユーザの音声)の進行径路を規制することができる。筐体1040には、入力音声(ユーザの音声)を受け付けるための開口1042が形成されていてもよい。   The voice input device 1002 includes a housing 1040. The housing 1040 may be a member that forms the outer shape of the voice input device 1002. A basic posture may be set for the housing 1040, and thereby the travel path of the input voice (user's voice) can be restricted. The housing 1040 may have an opening 1042 for receiving input voice (user's voice).

音声入力装置1002では、集積回路装置1001は、筐体1040に設置される。集積回路装置1001は、第1及び第2の凹部1102,1104が開口1042に連通するように、筐体1040に設置されていてもよい。集積回路装置1001は、第1及び第2の振動膜1012,1022が入力音声の進行径路に沿ってずれて配置されるように、筐体1040に設置されていてもよい。そして、入力音声の進行径路の上流側に配置される振動膜を第1の振動膜1012とし、下流側に配置される振動膜を第2の振動膜1022としてもよい。   In the voice input device 1002, the integrated circuit device 1001 is installed in the housing 1040. The integrated circuit device 1001 may be installed in the housing 1040 so that the first and second recesses 1102 and 1104 communicate with the opening 1042. The integrated circuit device 1001 may be installed in the housing 1040 so that the first and second vibrating membranes 1012 and 1022 are displaced along the traveling path of the input sound. The vibration film disposed on the upstream side of the traveling path of the input voice may be the first vibration film 1012, and the vibration film disposed on the downstream side may be the second vibration film 1022.

次に、図26を参照して、音声入力装置1002の機能について説明する。なお、図26は、音声入力装置1002の機能を説明するためのブロック図である。   Next, the function of the voice input device 1002 will be described with reference to FIG. FIG. 26 is a block diagram for explaining the function of the voice input device 1002.

音声入力装置1002は、第1及び第2のマイクロフォン1010,1020を有する。第1及び第2のマイクロフォン1010,1020は、第1及び第2の電圧信号を出力する。   The voice input device 1002 includes first and second microphones 1010 and 1020. The first and second microphones 1010 and 1020 output first and second voltage signals.

音声入力装置1002は、差分信号生成回路1030を有する。差分信号生成回路1030は、第1及び第2のマイクロフォン1010,1020から出力された第1及び第2の電圧信号を受け付けて、両者の差を示す差分信号を生成する。   The voice input device 1002 includes a differential signal generation circuit 1030. The difference signal generation circuit 1030 receives the first and second voltage signals output from the first and second microphones 1010 and 1020, and generates a difference signal indicating the difference between them.

なお、第1及び第2のマイクロフォン1010,1020と、差分信号生成回路1030とは、1つの半導体基板1100で実現される。   Note that the first and second microphones 1010 and 1020 and the differential signal generation circuit 1030 are realized by one semiconductor substrate 1100.

音声入力装置1002は、演算処理部1050を有していてもよい。演算処理部1050は、差分信号生成回路1030で生成された差分信号に基づいて各種の演算処理を行う。演算処理部1050は、差分信号に対する解析処理を行ってもよい。演算処理部1050は、差分信号を解析することにより、入力音声を発した人物を特定する処理(いわゆる音声認証処理)を行ってもよい。あるいは、演算処理部1050は、差分信号を解析処理することにより、入力音声の内容を特定する処理(いわゆる音声認識処理)を行ってもよい。演算処理部1050は、入力音声に基づいて、各種のコマンドを作成する処理を行ってもよい。演算処理部1050は、差分信号を増幅する処理を行ってもよい。また、演算処理部1050は、後述する通信処理部1060の動作を制御してもよい。なお、演算処理部1050は、上記各機能を、CPUやメモリによる信号処理によって実現してもよい。   The voice input device 1002 may have an arithmetic processing unit 1050. The arithmetic processing unit 1050 performs various arithmetic processes based on the difference signal generated by the difference signal generation circuit 1030. The arithmetic processing unit 1050 may perform analysis processing on the difference signal. The arithmetic processing unit 1050 may perform a process (so-called voice authentication process) for identifying the person who has emitted the input voice by analyzing the difference signal. Alternatively, the arithmetic processing unit 1050 may perform processing (so-called speech recognition processing) for specifying the content of the input speech by analyzing the difference signal. The arithmetic processing unit 1050 may perform processing for creating various commands based on the input voice. The arithmetic processing unit 1050 may perform processing for amplifying the difference signal. In addition, the arithmetic processing unit 1050 may control the operation of the communication processing unit 1060 described later. Note that the arithmetic processing unit 1050 may realize the above functions by signal processing using a CPU or a memory.

音声入力装置1002は、通信処理部1060をさらに含んでいてもよい。通信処理部1060は、音声入力装置と、他の端末(携帯電話端末や、ホストコンピュータなど)との通信を制御する。通信処理部1060は、ネットワークを介して、他の端末に信号(差分信号)を送信する機能を有していてもよい。通信処理部1060は、また、ネットワークを介して、他の端末から信号を受信する機能を有していてもよい。そして、例えばホストコンピュータで、通信処理部1060を介して取得した差分信号を解析処理して、音声認識処理や音声認証処理、コマンド生成処理や、データ蓄積処理など、種々の情報処理を行ってもよい。すなわち、音声入力装置は、他の端末と協働して、情報処理システムを構成していてもよい。言い換えると、音声入力装置は、情報処理システムを構築する情報入力端末であるとみなしてもよい。ただし、音声入力装置は、通信処理部1060を有しない構成となっていてもよい。   The voice input device 1002 may further include a communication processing unit 1060. The communication processing unit 1060 controls communication between the voice input device and another terminal (such as a mobile phone terminal or a host computer). The communication processing unit 1060 may have a function of transmitting a signal (difference signal) to another terminal via a network. The communication processing unit 1060 may also have a function of receiving signals from other terminals via a network. For example, the host computer may analyze the differential signal acquired via the communication processing unit 1060 and perform various information processing such as voice recognition processing, voice authentication processing, command generation processing, and data storage processing. Good. That is, the voice input device may constitute an information processing system in cooperation with other terminals. In other words, the voice input device may be regarded as an information input terminal that constructs an information processing system. However, the voice input device may not have the communication processing unit 1060.

なお、上述した演算処理部1050及び通信処理部1060は、パッケージングされた半導体装置(集積回路装置)として、筐体1040内に配置されていてもよい。ただし、本発明はこれに限られるものではない。例えば、演算処理部1050は、筐体1040の外部に配置されていてもよい。演算処理部1050が筐体1040の外部に配置されている場合、演算処理部1050は、通信処理部1060を介して、差分信号を取得してもよい。   Note that the arithmetic processing unit 1050 and the communication processing unit 1060 described above may be disposed in the housing 1040 as a packaged semiconductor device (integrated circuit device). However, the present invention is not limited to this. For example, the arithmetic processing unit 1050 may be disposed outside the housing 1040. When the arithmetic processing unit 1050 is disposed outside the housing 1040, the arithmetic processing unit 1050 may acquire a difference signal via the communication processing unit 1060.

なお、音声入力装置1002は、表示パネルなどの表示装置や、スピーカ等の音声出力装置をさらに含んでいてもよい。また、本実施の形態に係る音声入力装置は、操作情報を入力するための操作キーをさらに含んでいてもよい。   Note that the voice input device 1002 may further include a display device such as a display panel and a voice output device such as a speaker. In addition, the voice input device according to the present embodiment may further include an operation key for inputting operation information.

音声入力装置1002は、以上の構成をなしていてもよい。この音声入力装置1002は、マイク素子(音声入力素子)として集積回路装置1を利用する。そのため、この音声入力装置1002は、雑音を含まない、入力音声を示す信号を取得することができ、精度の高い音声認識や音声認証、コマンド生成処理を実現することができる。   The voice input device 1002 may have the above configuration. The voice input device 1002 uses the integrated circuit device 1 as a microphone element (voice input element). Therefore, the voice input device 1002 can acquire a signal indicating input voice that does not include noise, and can realize highly accurate voice recognition, voice authentication, and command generation processing.

また、音声入力装置1002をマイクシステムに適用すれば、スピーカから出力されるユーザの声も、雑音として除去される。そのため、ハウリングが起こりにくいマイクシステムを提供することができる。   Further, when the voice input device 1002 is applied to a microphone system, the user's voice output from the speaker is also removed as noise. Therefore, it is possible to provide a microphone system in which howling hardly occurs.

2−6.変形例
以下、本発明を適用した実施の形態の変形例について説明する。
2-6. Modified Examples Hereinafter, modified examples of the embodiment to which the present invention is applied will be described.

図27は、本実施の形態に係る集積回路装置1003について説明するための図である。   FIG. 27 is a diagram for explaining the integrated circuit device 1003 according to this embodiment.

本実施の形態に係る集積回路装置1003は、図27に示すように、半導体基板1200を有する。半導体基板1200には、第1及び第2の振動膜1012,1022が形成されている。ここで、第1の振動膜1015は、半導体基板1200の第1の面1201から形成された第1の凹部1210の底部である。また、第2の振動膜1025は、半導体基板1200の第2の面1202(第1の面1201と対向する面)から形成された第2の凹部1220の底部である。すなわち、集積回路装置1003(半導体基板1200)によると、第1及び第2の振動膜1015,1025は、法線方向に(半導体基板1200の厚み方向に)ずれて配置される。なお、半導体基板1200では、第1及び第2の振動膜1015,1025は、法線距離が5.2mm以下になるように配置されていてもよい。あるいは、第1及び第2の振動膜1015,1025は、中心間距離が5.2mm以下になるように配置されていてもよい。   The integrated circuit device 1003 according to this embodiment includes a semiconductor substrate 1200 as shown in FIG. First and second vibrating membranes 1012 and 1022 are formed on the semiconductor substrate 1200. Here, the first vibration film 1015 is the bottom of the first recess 1210 formed from the first surface 1201 of the semiconductor substrate 1200. The second vibration film 1025 is the bottom of the second recess 1220 formed from the second surface 1202 of the semiconductor substrate 1200 (the surface facing the first surface 1201). That is, according to the integrated circuit device 1003 (semiconductor substrate 1200), the first and second vibrating membranes 1015 and 1025 are arranged so as to be shifted in the normal direction (in the thickness direction of the semiconductor substrate 1200). In the semiconductor substrate 1200, the first and second vibrating membranes 1015 and 1025 may be arranged so that the normal distance is 5.2 mm or less. Alternatively, the first and second vibrating membranes 1015 and 1025 may be arranged so that the center-to-center distance is 5.2 mm or less.

図28は、集積回路装置1003が実装された音声入力装置1004について説明するための図である。集積回路装置1003は、筐体1040に実装される。集積回路装置1003は、図28に示すように、第1の面1201が、筐体1040におけるの開口1042が形成された面を向くように、筐体1040に実装されていてもよい。そして、集積回路装置1003は、第1の凹部1210が開口1042に連通するように、かつ、第2の振動膜1025が開口1042と重複するように、筐体1040に実装されていてもよい。   FIG. 28 is a diagram for explaining the voice input device 1004 in which the integrated circuit device 1003 is mounted. The integrated circuit device 1003 is mounted on the housing 1040. As shown in FIG. 28, the integrated circuit device 1003 may be mounted on the housing 1040 such that the first surface 1201 faces the surface of the housing 1040 where the opening 1042 is formed. The integrated circuit device 1003 may be mounted on the housing 1040 so that the first recess 1210 communicates with the opening 1042 and the second vibrating membrane 1025 overlaps with the opening 1042.

本実施の形態では、集積回路装置1003は、第1の凹部1210に連通する開口1212の中心が、第2の振動膜1025(第2の凹部1220の底面)の中心よりも、入力音声の音源に近い位置に配置されるように設置されていてもよい。集積回路装置1003は、入力音声が、第1及び第2の振動膜1015,1025に、同時に到着するように設置されていてもよい。例えば、集積回路装置1003は、入力音声の音源(モデル音源)と第1の振動膜1015との間隔が、モデル音源と第2の振動膜1025との間隔と同じになるように設置されていてもよい。集積回路装置1003は、上記の条件を満たすように、基本姿勢が設定された筐体に設置されていてもよい。   In this embodiment mode, the integrated circuit device 1003 is configured such that the center of the opening 1212 that communicates with the first recess 1210 is a sound source of input sound, rather than the center of the second vibration film 1025 (the bottom surface of the second recess 1220). It may be installed so that it may be arrange | positioned in the position near. The integrated circuit device 1003 may be installed so that the input sound arrives at the first and second vibrating membranes 1015 and 1025 at the same time. For example, the integrated circuit device 1003 is installed such that the distance between the input sound source (model sound source) and the first diaphragm 1015 is the same as the distance between the model sound source and the second diaphragm 1025. Also good. The integrated circuit device 1003 may be installed in a housing in which a basic posture is set so as to satisfy the above conditions.

本実施の形態に係る音声入力装置によると、第1及び第2の振動膜1015,1025に入射する入力音声(ユーザの音声)の、入射時間のずれを低減することができる。そのため、入力音声の位相差成分が含まれないように差分信号を生成することができることから、入力音声の振幅成分を精度よく抽出することが可能になる。   According to the voice input device according to the present embodiment, it is possible to reduce a shift in incident time of input voices (user voices) incident on the first and second vibrating membranes 1015 and 1025. Therefore, since the difference signal can be generated so as not to include the phase difference component of the input sound, the amplitude component of the input sound can be accurately extracted.

なお、凹部(第1の凹部1210)内では音波は拡散しないため、音波の振幅ほとんど減衰しない。そのため、この音声入力装置では、第1の振動膜1015を振動させる入力音声の強度(振幅)は、開口1212における入力音声の強度と同じとみなすことができる。このことから、音声入力装置が、入力音声が第1及び第2の振動膜1015,1025に同時に到達するように構成されている場合でも、第1及び第2の振動膜1015,1025を振動させる入力音声の強度には差が現れる。そのため、第1及び第2の電圧信号の差を示す差分信号を取得することで、入力音声を抽出することができる。   In addition, since the sound wave does not diffuse in the recess (first recess 1210), the amplitude of the sound wave is hardly attenuated. Therefore, in this voice input device, the intensity (amplitude) of the input voice that vibrates the first diaphragm 1015 can be regarded as the same as the intensity of the input voice in the opening 1212. Thus, even when the voice input device is configured so that the input voice reaches the first and second vibrating membranes 1015 and 1025 at the same time, the first and second vibrating membranes 1015 and 1025 are vibrated. A difference appears in the intensity of the input speech. Therefore, the input sound can be extracted by acquiring a differential signal indicating the difference between the first and second voltage signals.

まとめると、この音声入力装置によると、入力音声の位相差成分に基づくノイズを含まないように、入力音声の振幅成分(差分信号)を取得することができる。そのため、精度の高い雑音除去機能を実現することが可能になる。   In summary, according to the voice input device, the amplitude component (difference signal) of the input voice can be acquired so as not to include noise based on the phase difference component of the input voice. Therefore, it is possible to realize a highly accurate noise removal function.

最後に、図29〜図31に、本発明の実施の形態に係る音声入力装置の例として、携帯電話1300、マイク(マイクシステム)1400、及び、リモートコントローラ1500を、それぞれ示す。また、図32には、情報入力端末としての音声入力装置1602と、ホストコンピュータ1604とを含む、情報処理システム1600の概略図を示す。   Finally, FIGS. 29 to 31 show a mobile phone 1300, a microphone (microphone system) 1400, and a remote controller 1500, respectively, as examples of the voice input device according to the embodiment of the present invention. FIG. 32 shows a schematic diagram of an information processing system 1600 including a voice input device 1602 as an information input terminal and a host computer 1604.

3−1.本実施の形態に係る音声入力装置の構成
はじめに、図33〜図35を参照して、本発明を適用した実施の形態に係る音声入力装置2001の構成について説明する。なお、以下に説明する音声入力装置2001は、接話式の音声入力装置であって、例えば、携帯電話やトランシーバー等の音声通信機器や、入力された音声を解析する技術を利用した情報処理システム(音声認証システム、音声認識システム、コマンド生成システム、電子辞書、翻訳機や、音声入力方式のリモートコントローラなど)、あるいは、録音機器やアンプシステム(拡声器)、マイクシステムなどに適用することができる。
3-1. Configuration of Voice Input Device According to this Embodiment First, the configuration of a voice input device 2001 according to an embodiment to which the present invention is applied will be described with reference to FIGS. Note that a voice input device 2001 described below is a close-talking voice input device, for example, a voice communication device such as a mobile phone or a transceiver, or an information processing system using technology for analyzing input voice. (Voice authentication system, voice recognition system, command generation system, electronic dictionary, translator, voice input remote controller, etc.), recording equipment, amplifier system (loudspeaker), microphone system, etc. .

本実施の形態に係る音声入力装置は、第1の振動膜2012を有する第1のマイクロフォン2010と、第2の振動膜2022を有する第2のマイクロフォン2020とを含む。ここで、マイクロフォンとは、音響信号を電気信号へ変換する電気音響変換器である。第1及び第2のマイクロフォン2010,2020は、それぞれ、第1及び第2の振動膜2012,2022(振動板)の振動を、電圧信号として出力する変換器であってもよい。   The voice input device according to the present embodiment includes a first microphone 2010 having a first vibration film 2012 and a second microphone 2020 having a second vibration film 2022. Here, the microphone is an electroacoustic transducer that converts an acoustic signal into an electrical signal. The first and second microphones 2010 and 2020 may be converters that output the vibrations of the first and second diaphragms 2012 and 2022 (diaphragm) as voltage signals, respectively.

本実施の形態に係る音声入力装置では、第1のマイクロフォン2010は第1の電圧信号を生成する。また、第2のマイクロフォン2020は第2の電圧信号を生成する。すなわち、第1及び第2のマイクロフォン2010,2020で生成された電圧信号を、それぞれ、第1及び第2の電圧信号と呼んでもよい。   In the voice input device according to the present embodiment, the first microphone 2010 generates a first voltage signal. Further, the second microphone 2020 generates a second voltage signal. That is, the voltage signals generated by the first and second microphones 2010 and 2020 may be called first and second voltage signals, respectively.

第1及び第2のマイクロフォン2010,2020の機構については特に限定されるものではない。図34には、第1及び第2のマイクロフォン2010,2020に適用可能なマイクロフォンの一例として、コンデンサ型マイクロフォン2100の構造を示す。コンデンサ型マイクロフォン2100は、振動膜2102を有する。振動膜2102は、音波を受けて振動する膜(薄膜)で、導電性を有し、電極の一端を形成している。コンデンサ型マイクロフォン2100は、また、電極2104を有する。電極2104は、振動膜2102と対向して配置されている。これにより、振動膜2102と電極2104とは容量を形成する。コンデンサ型マイクロフォン2100に音波が入射すると、振動膜2102が振動して、振動膜2102と電極2104との間隔が変化し、振動膜2102と電極2104との間の静電容量が変化する。この静電容量の変化を、例えば電圧の変化として出力することによって、コンデンサ型マイクロフォン2100に入射する音波を、電気信号に変換することができる。なお、コンデンサ型マイクロフォン2100では、電極2104は、音波の影響を受けない構造をなしていてもよい。例えば、電極2104はメッシュ構造をなしていてもよい。   The mechanism of the first and second microphones 2010 and 2020 is not particularly limited. FIG. 34 shows a structure of a condenser microphone 2100 as an example of a microphone applicable to the first and second microphones 2010 and 2020. The condenser microphone 2100 has a vibration film 2102. The vibration film 2102 is a film (thin film) that vibrates in response to sound waves, has conductivity, and forms one end of the electrode. The condenser microphone 2100 also has an electrode 2104. The electrode 2104 is disposed to face the vibration film 2102. Thereby, the vibrating membrane 2102 and the electrode 2104 form a capacitance. When a sound wave enters the condenser microphone 2100, the vibration film 2102 vibrates, the distance between the vibration film 2102 and the electrode 2104 changes, and the capacitance between the vibration film 2102 and the electrode 2104 changes. By outputting this change in capacitance as, for example, a change in voltage, a sound wave incident on the condenser microphone 2100 can be converted into an electrical signal. In the capacitor microphone 2100, the electrode 2104 may have a structure that is not affected by sound waves. For example, the electrode 2104 may have a mesh structure.

ただし、本発明に適用可能なマイクロフォンは、コンデンサ型マイクロフォンに限られるものではなく、既に公知となっているいずれかのマイクロフォンを適用することができる。例えば、第1及び第2のマイクロフォン2010,2020として、動電型(ダイナミック型)、電磁型(マグネティック型)、圧電型(クリスタル型)等のマイクロフォンを適用してもよい。   However, the microphone applicable to the present invention is not limited to the condenser microphone, and any microphone that is already known can be applied. For example, as the first and second microphones 2010 and 2020, electrodynamic (dynamic), electromagnetic (magnetic), and piezoelectric (crystal) microphones may be applied.

第1及び第2のマイクロフォン2010,2020は、第1及び第2の振動膜2012,2022がシリコンによって構成されたシリコンマイク(Siマイク)であってもよい。シリコンマイクを利用することで、第1及び第2のマイクロフォン2010,2020の小型化、及び、高性能化を実現することができる。このとき、第1及び第2のマイクロフォン2010,2020は、1つの集積回路装置として構成されていてもよい。すなわち、第1及び第2のマイクロフォン2010,2020は、1つの半導体基板に構成されていてもよい。このとき、後述する差分信号生成部2030も、同一の半導体基板に形成されていてもよい。すなわち、第1及び第2のマイクロフォン2010,2020は、いわゆるメムス(MEMS:Micro Electro Mechanical Systems)として構成されていてもよい。ただし、第1のマイクロフォン2010と第2のマイクロフォン2020とは、別々のシリコンマイクとして構成されていてもよい。   The first and second microphones 2010 and 2020 may be silicon microphones (Si microphones) in which the first and second vibrating membranes 2012 and 2022 are made of silicon. By using the silicon microphone, the first and second microphones 2010 and 2020 can be reduced in size and performance. At this time, the first and second microphones 2010 and 2020 may be configured as one integrated circuit device. That is, the first and second microphones 2010 and 2020 may be configured on one semiconductor substrate. At this time, a differential signal generation unit 2030 described later may also be formed on the same semiconductor substrate. That is, the first and second microphones 2010 and 2020 may be configured as so-called MEMS (Micro Electro Mechanical Systems). However, the first microphone 2010 and the second microphone 2020 may be configured as separate silicon microphones.

本実施の形態に係る音声入力装置では、後述するように、第1及び第2の電圧信号の差を示す差分信号を利用して、雑音成分を除去する機能を実現する。この機能を実現するために、第1及び第2のマイクロフォン(第1及び第2の振動膜2012,2022)は、一定の制約を満たすように配置される。第1及び第2の振動膜2012,2022が満たすべき制約の詳細については後述するが、本実施の形態では、第1及び第2の振動膜2012,2022(第1及び第2のマイクロフォン2010,2020)は、雑音強度比が、入力音声強度比よりも小さくなるように配置される。これにより、差分信号を、雑音成分が除去された音声成分を示す信号とみなすことが可能になる。第1及び第2の振動膜2012,2022は、例えば、中心間距離が5.2mm以下になるように配置されていてもよい。   In the voice input device according to the present embodiment, as described later, a function of removing a noise component is realized by using a differential signal indicating a difference between the first and second voltage signals. In order to realize this function, the first and second microphones (first and second vibrating membranes 2012 and 2022) are arranged so as to satisfy certain restrictions. Although details of the constraints to be satisfied by the first and second vibrating membranes 2012 and 2022 will be described later, in the present embodiment, the first and second vibrating membranes 2012 and 2022 (first and second microphones 2010, 2020) is arranged such that the noise intensity ratio is smaller than the input voice intensity ratio. As a result, the difference signal can be regarded as a signal indicating the audio component from which the noise component has been removed. For example, the first and second vibrating membranes 2012 and 2022 may be arranged such that the center-to-center distance is 5.2 mm or less.

なお、本実施の形態に係る音声入力装置では、第1及び第2の振動膜2012,2022の向きは、特に限定されるものではない。第1及び第2の振動膜2012,2022は、法線が平行になるように配置されていてもよい。このとき、第1及び第2の振動膜2012,2022は、法線が同一直線にならないように配置されていてもよい。例えば、第1及び第2の振動膜2012,2022は、図示しない基部(例えば回路基板)の表面に、間隔をあけて配置されていてもよい。あるいは、第1及び第2の振動膜2012,2022は、法線方向にずれて配置されていてもよい。ただし、第1及び第2の振動膜2012,2022は、法線が平行にならないように配置されていてもよい。第1及び第2の振動膜2012,2022は、法線が直交するように配置されていてもよい。   In the voice input device according to the present embodiment, the directions of the first and second vibrating membranes 2012 and 2022 are not particularly limited. The first and second vibrating membranes 2012 and 2022 may be arranged so that the normal lines are parallel. At this time, the first and second vibrating membranes 2012 and 2022 may be arranged so that the normal lines are not the same straight line. For example, the first and second vibrating membranes 2012 and 2022 may be arranged on the surface of a base (not shown) (for example, a circuit board) with a space therebetween. Alternatively, the first and second vibrating membranes 2012 and 2022 may be arranged shifted in the normal direction. However, the first and second vibrating membranes 2012 and 2022 may be arranged so that the normal lines do not become parallel. The first and second vibrating membranes 2012 and 2022 may be arranged so that the normal lines are orthogonal to each other.

そして、本実施の形態に係る音声入力装置は、差分信号生成部2030を有する。差分信号生成部2030は、第1のマイクロフォン2010で取得された第1の電圧信号と、第2のマイクロフォン2020で取得された第2の電圧信号との差(電圧差)を示す差分信号を生成する。差分信号生成部2030では、第1及び第2の電圧信号に対して例えばフーリエ解析などの解析処理を行うことなく、両者の差を示す差分信号を生成する処理を行う。差分信号生成部2030の機能は、専用のハードウェア回路(差分信号生成回路)によって実現してもよく、CPUなどによる信号処理によって実現してもよい。   The voice input device according to this embodiment includes a differential signal generation unit 2030. The difference signal generation unit 2030 generates a difference signal indicating a difference (voltage difference) between the first voltage signal acquired by the first microphone 2010 and the second voltage signal acquired by the second microphone 2020. To do. The difference signal generation unit 2030 performs a process of generating a difference signal indicating a difference between the first and second voltage signals without performing an analysis process such as Fourier analysis. The function of the difference signal generation unit 2030 may be realized by a dedicated hardware circuit (difference signal generation circuit) or may be realized by signal processing by a CPU or the like.

本実施の形態に係る音声入力装置は、差分信号を増幅する信号増幅部をさらに含んでいてもよい。差分信号生成部2030と信号増幅部とは、1つの制御回路によって実現してもよい。ただし、本実施の形態に係る音声入力装置は、信号増幅部を内部に持たない構成をなしていてもよい。   The voice input device according to the present embodiment may further include a signal amplifying unit that amplifies the differential signal. The difference signal generation unit 2030 and the signal amplification unit may be realized by one control circuit. However, the voice input device according to the present embodiment may be configured not to have a signal amplifying unit therein.

図35には、差分信号生成部2030と信号増幅部とを実現可能な回路の一例を示す。図35に示す回路によれば、第1及び第2の電圧信号を受け付けて、その差を示す差分信号を10倍に増幅した信号を出力することになる。ただし、差分信号生成部2030及び信号増幅部を実現するための回路構成は、これに限られるものではない。   FIG. 35 shows an example of a circuit that can realize the differential signal generation unit 2030 and the signal amplification unit. According to the circuit shown in FIG. 35, the first and second voltage signals are received, and a signal obtained by amplifying the difference signal indicating the difference by 10 times is output. However, the circuit configuration for realizing the differential signal generation unit 2030 and the signal amplification unit is not limited to this.

本実施の形態に係る音声入力装置は、筐体2040を含んでいてもよい。このとき、音声入力装置の外形は、筐体2040によって構成されていてもよい。筐体2040には基本姿勢が設定されていてもよく、これにより、入力音声の進行径路を規制することができる。第1及び第2の振動膜2012,2022は、筐体2040の表面に形成されていてもよい。あるいは、第1及び第2の振動膜2012,2022は、筐体2040に形成された開口(音声入射口)と対向するように、筐体2040内部に配置されていてもよい。そして、第1及び第2の振動膜2012,2022は、音源(入射音声のモデル音源)からの距離が異なるように配置されていてもよい。例えば図33に示すように、筐体2040は、入力音声の進行径路が筐体2040の表面に沿うように、基本姿勢が設定されていてもよい。そして、第1及び第2の振動膜2012,2022は、入力音声の進行径路に沿って配置されていてもよい。そして、入力音声の進行径路の上流側に配置される振動膜を第1の振動膜2012とし、下流側に配置される振動膜を第2の振動膜2022としてもよい。   The voice input device according to this embodiment may include a housing 2040. At this time, the outer shape of the voice input device may be configured by the housing 2040. A basic posture may be set for the housing 2040, thereby restricting the travel path of the input voice. The first and second vibrating membranes 2012 and 2022 may be formed on the surface of the housing 2040. Alternatively, the first and second vibrating membranes 2012 and 2022 may be disposed inside the housing 2040 so as to face an opening (sound entrance) formed in the housing 2040. The first and second vibrating membranes 2012 and 2022 may be arranged so that the distances from the sound source (incident sound model sound source) are different. For example, as shown in FIG. 33, the basic posture of the housing 2040 may be set so that the travel path of the input voice is along the surface of the housing 2040. The first and second vibrating membranes 2012 and 2022 may be disposed along the traveling path of the input voice. Then, the vibration film disposed on the upstream side of the traveling path of the input sound may be the first vibration film 2012, and the vibration film disposed on the downstream side may be the second vibration film 2022.

本実施の形態に係る音声入力装置は、演算処理部2050をさらに含んでいてもよい。演算処理部2050は、差分信号生成部2030で生成された差分信号に基づいて各種の演算処理を行う。演算処理部2050は、差分信号に対する解析処理を行ってもよい。演算処理部2050は、差分信号を解析することにより、入力音声を発した人物を特定する処理(いわゆる音声認証処理)を行ってもよい。あるいは、演算処理部2050は、差分信号を解析処理することにより、入力音声の内容を特定する処理(いわゆる音声認識処理)を行ってもよい。演算処理部2050は、入力音声に基づいて、各種のコマンドを作成する処理を行ってもよい。演算処理部2050は、差分信号を増幅する処理を行ってもよい。また、演算処理部2050は、後述する通信処理部2060の動作を制御してもよい。なお、演算処理部2050は、上記各機能を、CPUやメモリによる信号処理によって実現してもよい。   The voice input device according to this embodiment may further include an arithmetic processing unit 2050. The arithmetic processor 2050 performs various arithmetic processes based on the difference signal generated by the difference signal generator 2030. The arithmetic processing unit 2050 may perform analysis processing on the difference signal. The arithmetic processing unit 2050 may perform processing (so-called voice authentication processing) for identifying a person who has emitted the input voice by analyzing the difference signal. Alternatively, the arithmetic processing unit 2050 may perform processing (so-called speech recognition processing) for specifying the content of the input speech by analyzing the difference signal. The arithmetic processing unit 2050 may perform processing for creating various commands based on the input voice. The arithmetic processing unit 2050 may perform processing for amplifying the difference signal. Further, the arithmetic processing unit 2050 may control the operation of the communication processing unit 2060 described later. Note that the arithmetic processing unit 2050 may realize the above functions by signal processing using a CPU or a memory.

演算処理部2050は、筐体2040の内部に配置されていてもよいが、筐体2040の外部に配置されていてもよい。演算処理部2050が筐体2040の外部に配置されている場合、演算処理部2050は、後述する通信処理部2060を介して、差分信号を取得してもよい。   The arithmetic processing unit 2050 may be disposed inside the housing 2040, but may be disposed outside the housing 2040. When the arithmetic processing unit 2050 is arranged outside the housing 2040, the arithmetic processing unit 2050 may acquire the difference signal via the communication processing unit 2060 described later.

本実施の形態に係る音声入力装置は、通信処理部2060をさらに含んでいてもよい。通信処理部2060は、音声入力装置と、他の端末(携帯電話端末や、ホストコンピュータなど)との通信を制御する。通信処理部2060は、ネットワークを介して、他の端末に信号(差分信号)を送信する機能を有していてもよい。通信処理部2060は、また、ネットワークを介して、他の端末から信号を受信する機能を有していてもよい。そして、例えばホストコンピュータで、通信処理部2060を介して取得した差分信号を解析処理して、音声認識処理や音声認証処理、コマンド生成処理や、データ蓄積処理など、種々の情報処理を行ってもよい。すなわち、音声入力装置は、他の端末と協働して、情報処理システムを構成していてもよい。言い換えると、音声入力装置は、情報処理システムを構築する情報入力端末であるとみなしてもよい。ただし、音声入力装置は、通信処理部2060を有しない構成となっていてもよい。   The voice input device according to the present embodiment may further include a communication processing unit 2060. The communication processing unit 2060 controls communication between the voice input device and another terminal (such as a mobile phone terminal or a host computer). The communication processing unit 2060 may have a function of transmitting a signal (difference signal) to another terminal via a network. The communication processing unit 2060 may also have a function of receiving signals from other terminals via a network. For example, the host computer may analyze the differential signal acquired via the communication processing unit 2060 and perform various information processing such as voice recognition processing, voice authentication processing, command generation processing, and data storage processing. Good. That is, the voice input device may constitute an information processing system in cooperation with other terminals. In other words, the voice input device may be regarded as an information input terminal that constructs an information processing system. However, the voice input device may not have the communication processing unit 2060.

本実施の形態に係る音声入力装置は、表示パネルなどの表示装置や、スピーカ等の音声出力装置をさらに含んでいてもよい。また、本実施の形態に係る音声入力装置は、操作情報を入力するための操作キーをさらに含んでいてもよい。   The audio input device according to the present embodiment may further include a display device such as a display panel and an audio output device such as a speaker. In addition, the voice input device according to the present embodiment may further include an operation key for inputting operation information.

本実施の形態に係る音声入力装置は、以上の構成をなしていてもよい。この音声入力装置によると、第1及び第2の電圧信号の差を出力するだけの簡単な処理によって、雑音成分が除去された音声成分を示す信号(電圧信号)が生成される。そのため、本発明によると、小型化が可能で、かつ、優れた雑音除去機能を有する音声入力装置を提供することができる。なお、その原理、製造方法及び効果については、2−2〜2−4で説明した内容と同様である。   The voice input device according to the present embodiment may have the above configuration. According to this voice input device, a signal (voltage signal) indicating the voice component from which the noise component has been removed is generated by a simple process that simply outputs the difference between the first and second voltage signals. Therefore, according to the present invention, it is possible to provide a voice input device that can be miniaturized and has an excellent noise removal function. The principle, manufacturing method, and effects are the same as those described in 2-2 to 2-4.

3−2.他の実施の形態に係る音声入力装置
次に、本発明を適用した他の実施の形態に係る音声入力装置について、図36を参照して説明する。
3-2. Voice Input Device According to Another Embodiment Next, a voice input device according to another embodiment to which the present invention is applied will be described with reference to FIG.

本実施の形態に係る音声入力装置は、基部2070を含む。基部2070の主面2072には、凹部2074が形成されている。そして、本実施の形態に係る音声入力装置では、凹部2074の底面2075に第1の振動膜2012(第1のマイクロフォン2010)が配置され、基部2070の主面2072に第2の振動膜2022(第2のマイクロフォン2020)が配置される。なお、凹部2074は、主面2072に対して垂直に延びていてもよく、凹部2074の底面2075は、主面2072と平行な面であってもよい。底面2075は、凹部2074と直交する面であってもよい。また、凹部2074は、第1の振動膜2012と同じ外形をなしていてもよい。   The voice input device according to the present embodiment includes a base 2070. A recess 2074 is formed in the main surface 2072 of the base 2070. In the voice input device according to this embodiment, the first vibration film 2012 (first microphone 2010) is disposed on the bottom surface 2075 of the recess 2074, and the second vibration film 2022 (on the main surface 2072 of the base 2070). A second microphone 2020) is arranged. The recess 2074 may extend perpendicular to the main surface 2072, and the bottom surface 2075 of the recess 2074 may be a surface parallel to the main surface 2072. The bottom surface 2075 may be a surface orthogonal to the recess 2074. The recess 2074 may have the same outer shape as the first vibrating membrane 2012.

本実施の形態では、凹部2074は、領域2076と開口2078との間隔よりも浅くなっていてもよい。すなわち、凹部2074の深さをdとし、領域2076と開口2078との間隔をΔGとすると、基部2070は、d≦ΔGを満たしていてもよい。基部2070は、2d=ΔGを満たしていてもよい。なお、ΔGは5.2mm以下であってもよい。あるいは、基部2070は、第1及び第2の振動膜2012,2022の中心間を結ぶ直線距離が5.2mm以下になるように構成されていてもよい。   In the present embodiment, the recess 2074 may be shallower than the distance between the region 2076 and the opening 2078. That is, if the depth of the recess 2074 is d and the interval between the region 2076 and the opening 2078 is ΔG, the base 2070 may satisfy d ≦ ΔG. The base 2070 may satisfy 2d = ΔG. Note that ΔG may be 5.2 mm or less. Alternatively, the base 2070 may be configured such that a linear distance connecting the centers of the first and second vibrating membranes 2012 and 2022 is 5.2 mm or less.

基部2070は、凹部2074に連通する開口2078が、主面2072における第2の振動膜2022が配置される領域2076よりも、入力音声の音源に近い位置に配置されるように設置される。基部2070は、入力音声が、第1及び第2の振動膜2012,2022に、同時に到着するように設置されていてもよい。例えば、基部2070は、入力音声の音源(モデル音源)と第1の振動膜2012との間隔が、モデル音源と第2の振動膜22との間隔と同じになるように設置されていてもよい。基部2070は、上記の条件を満たすように、基本姿勢が設定された筐体に設置されていてもよい。   The base 2070 is installed such that the opening 2078 communicating with the recess 2074 is disposed at a position closer to the sound source of the input sound than the region 2076 in the main surface 2072 where the second vibrating membrane 2022 is disposed. The base 2070 may be installed so that the input sound arrives at the first and second vibrating membranes 2012 and 2022 at the same time. For example, the base 2070 may be installed such that the distance between the input sound source (model sound source) and the first diaphragm 2012 is the same as the distance between the model sound source and the second diaphragm 22. . The base 2070 may be installed in a housing in which a basic posture is set so as to satisfy the above conditions.

本実施の形態に係る音声入力装置によると、第1及び第2の振動膜2012,2022に入射する入力音声(ユーザの音声)の、入射時間のずれを低減することができる。すなわち、入力音声の位相差成分が含まれないように差分信号を生成することができることから、入力音声の振幅成分を精度よく抽出することが可能になる。   According to the voice input device according to the present embodiment, it is possible to reduce a shift in incident time of input voices (user voices) incident on the first and second vibrating membranes 2012 and 2022. That is, since the difference signal can be generated so as not to include the phase difference component of the input sound, the amplitude component of the input sound can be accurately extracted.

なお、凹部74内では音波は拡散しないため、音波の振幅ほとんど減衰しない。そのため、この音声入力装置では、第1の振動膜2012を振動させる入力音声の強度(振幅)は、開口2078における入力音声の強度と同じとみなすことができる。このことから、音声入力装置が、入力音声が第1及び第2の振動膜2012,2022に同時に到達するように構成されている場合でも、第1及び第2の振動膜2012,2022を振動させる入力音声の強度には差が現れる。そのため、第1及び第2の電圧信号の差を示す差分信号を取得することで、入力音声を抽出することができる。   In addition, since the sound wave does not diffuse in the recess 74, the amplitude of the sound wave is hardly attenuated. Therefore, in this voice input device, the intensity (amplitude) of the input voice that vibrates the first diaphragm 2012 can be regarded as the same as the intensity of the input voice in the opening 2078. Therefore, even when the voice input device is configured so that the input voice reaches the first and second vibrating membranes 2012 and 2022 at the same time, the first and second vibrating membranes 2012 and 2022 are vibrated. A difference appears in the intensity of the input speech. Therefore, the input sound can be extracted by acquiring a differential signal indicating the difference between the first and second voltage signals.

まとめると、この音声入力装置によると、入力音声の位相差成分に基づくノイズを含まないように、入力音声の振幅成分(差分信号)を取得することができる。そのため、精度の高い雑音除去機能を実現することが可能になる。   In summary, according to the voice input device, the amplitude component (difference signal) of the input voice can be acquired so as not to include noise based on the phase difference component of the input voice. Therefore, it is possible to realize a highly accurate noise removal function.

なお、凹部2074の深さをΔG以下(5.2mm以下)とすることで、凹部2074の共振周波数を高く設定することができるため、凹部2074で共振ノイズが発生することを防止することができる。   In addition, since the resonance frequency of the recess 2074 can be set high by setting the depth of the recess 2074 to ΔG or less (5.2 mm or less), it is possible to prevent the generation of resonance noise in the recess 2074. .

図37には、本実施の形態に係る音声入力装置の変形例を示す。   FIG. 37 shows a modification of the voice input device according to this embodiment.

本実施の形態に係る音声入力装置は、基部2080を含む。基部2080の主面2082には、第1の凹部2084と、第1の凹部2084よりも浅い第2の凹部2086が形成されている。第1及び第2の凹部2084,2086の深さの差であるΔdは、第1の凹部2084に連通する第1の開口2085と、第2の凹部2086に連通する第2の開口2087との間隔であるΔGよりも小さくなっていてもよい。そして、第1の振動膜2012は第1の凹部2084の底面に配置され、第2の振動膜2022は第2の凹部2086の底面に配置される。   The voice input device according to the present embodiment includes a base 2080. A main surface 2082 of the base 2080 is formed with a first recess 2084 and a second recess 2086 that is shallower than the first recess 2084. Δd, which is the difference between the depths of the first and second recesses 2084 and 2086, is between the first opening 2085 that communicates with the first recess 2084 and the second opening 2087 that communicates with the second recess 2086. It may be smaller than ΔG which is the interval. The first vibration film 2012 is disposed on the bottom surface of the first recess 2084, and the second vibration film 2022 is disposed on the bottom surface of the second recess 2086.

この音声入力装置であっても、上記と同様の効果を奏するため、精度の高い雑音除去機能を実現することが可能になる。   Even with this voice input device, the same effects as described above can be obtained, so that a highly accurate noise removal function can be realized.

4−1.音声入出力装置及び通話装置
図38は、本実施の形態の音声入出力装置及び通話装置の機能ブロック図である。
4-1. Voice Input / Output Device and Call Device FIG. 38 is a functional block diagram of the voice input / output device and the call device of this embodiment.

本実施の形態の音声入出力装置3010は、マイクロフォン3032からの入力に基づき第1の音声信号3034を生成する音声入力部3030と、第2の音声信号3048に基づきスピーカ3046から音声を出力する音声出力部3040とを含む。   The audio input / output device 3010 of this embodiment includes an audio input unit 3030 that generates a first audio signal 3034 based on an input from a microphone 3032, and an audio that outputs audio from a speaker 3046 based on a second audio signal 3048. Output unit 3040.

音声入力部3030は、内部空間を有する筐体と、前記筐体内に設けられた、前記内部空間を第1の空間と第2の空間とに分割する、少なくとも一部が振動膜で構成された仕切り部材と、前記振動膜の振動に基づいて第1の音声信号である電気信号を出力する電気信号出力回路と、を含み、前記筐体には、前記第1の空間と前記筐体の外部空間とを連通する第1の貫通穴と、前記第2の空間と前記筐体の外部空間とを連通する第2の貫通穴とが形成されているマイクロフォンユニットが実装されてもよい。ここでマイクロフォンユニットは、図1から図21で説明した構成で実現してもよい。   The voice input unit 3030 includes a housing having an internal space, and the internal space provided in the housing divides the internal space into a first space and a second space, and at least a part thereof is configured by a vibration film. A partition member, and an electric signal output circuit that outputs an electric signal that is a first audio signal based on vibration of the diaphragm, wherein the casing includes the first space and an exterior of the casing A microphone unit in which a first through hole that communicates with a space and a second through hole that communicates between the second space and the external space of the housing may be mounted. Here, the microphone unit may be realized by the configuration described with reference to FIGS.

また音声入力部3030は、第1のマイクロフォンを構成する第1の振動膜と、第2のマイクロフォンを構成する第2の振動膜と、前記第1のマイクロフォンで取得された第1の電圧信号と、前記第2のマイクロフォンで取得された第2の電圧信号とを受け付けて、前記第1及び第2の電圧信号の差を示す差分信号に基づき第1の音声信号を生成する差分信号生成回路と、が形成された半導体基板を有する集積回路装置が実装されてもよい。ここで集積回路装置は、図22から図28で説明した構成で実現してもよい。   The voice input unit 3030 also includes a first diaphragm that forms a first microphone, a second diaphragm that forms a second microphone, and a first voltage signal acquired by the first microphone. A differential signal generation circuit that receives a second voltage signal acquired by the second microphone and generates a first audio signal based on a differential signal indicating a difference between the first and second voltage signals; An integrated circuit device having a semiconductor substrate on which is formed may be mounted. Here, the integrated circuit device may be realized by the configuration described with reference to FIGS.

また音声入力部3030は、第1の振動膜を有する第1のマイクロフォンと、第2の振動膜を有する第2のマイクロフォンと、前記第1のマイクロフォンで取得された第1の電圧信号と、前記第2のマイクロフォンで取得された第2の電圧信号との差を示す差分信号に基づき第1の音声信号を生成する差分信号生成部と、を含み、前記第1及び第2の振動膜は、前記差分信号に含まれる雑音成分の強度の、前記第1又は第2の電圧信号に含まれる前記雑音成分の強度に対する比率を示す雑音強度比が、前記差分信号に含まれる入力音声成分の強度の、前記第1又は第2の電圧信号に含まれる前記入力音声成分の強度に対する比率を示す入力音声強度比よりも小さくなるように配置されていてもよい。ここで音声入力部3030は、図33から図37で説明した構成で実現してもよい。   The voice input unit 3030 includes a first microphone having a first diaphragm, a second microphone having a second diaphragm, a first voltage signal acquired by the first microphone, A differential signal generation unit that generates a first audio signal based on a differential signal indicating a difference from the second voltage signal acquired by the second microphone, and the first and second diaphragms are The noise intensity ratio indicating the ratio of the intensity of the noise component included in the difference signal to the intensity of the noise component included in the first or second voltage signal is the intensity of the input speech component included in the difference signal. The input sound intensity ratio indicating the ratio of the input sound component included in the first or second voltage signal to the intensity may be smaller than the input sound intensity ratio. Here, the voice input unit 3030 may be realized by the configuration described with reference to FIGS.

また音声入力部3030はマイクロフォンからの入力に基づき第1の音声信号を生成するハンズフリー型に構成してもよい。   The voice input unit 3030 may be configured as a hands-free type that generates the first voice signal based on an input from a microphone.

音声出力部3040は、記第1の音声信号3034に基づき通話時の周囲雑音を検出する周囲雑音検出部3042と、検出された周囲雑音の大きさに基づき、前記スピーカ3046の音量を制御する音量制御部3044とを含むように構成してもよい。   An audio output unit 3040 detects an ambient noise during a call based on the first audio signal 3034, and a volume for controlling the volume of the speaker 3046 based on the detected ambient noise level. You may comprise so that the control part 3044 may be included.

また音声出力部3040と前記音声入力部2030とは、分離して設置される構成でもよい。   The audio output unit 3040 and the audio input unit 2030 may be separately installed.

本実施の形態によれば、雑音環境において使用する場合でも音声入力用のマイクロフォンから得る周囲雑音の強度に合わせてスピーカの音量を連続的または段階的に制御することにより、音声入力者にスピーカから出力される音を聞き取りやすくすること、例えば通話の場合には送話と受話を容易にならしめる音声音声入出力装置を提供することができる。   According to the present embodiment, even when used in a noisy environment, the volume of the speaker is controlled continuously or stepwise in accordance with the intensity of ambient noise obtained from the microphone for voice input, so that the voice input person can It is possible to provide a voice / sound input / output device that makes it easy to hear the output sound, for example, in the case of a telephone call, which facilitates transmission and reception.

またマイクロフォンは、機器に直接的・間接的作用する衝撃音を容易にかつ極めて効果的に抑圧する特性を備えている。すなわち空気中を伝搬する音のみならず、固体中を伝搬する音も除去することが可能である。固体中の音の伝搬速度は空気中の伝搬速度に比べて極めて速い(約10倍程度)ため、マイクロフォンが設置された固体に加わった衝撃音(雑音)は、ほぼ同時に前記振動膜に到達するため、空気中を伝搬する雑音と同様に除去することができる。   In addition, the microphone has a characteristic of easily and extremely effectively suppressing an impact sound that acts directly or indirectly on the device. That is, not only the sound propagating in the air but also the sound propagating in the solid can be removed. Since the propagation speed of sound in a solid is extremely high (about 10 times) compared to the propagation speed in air, the impact sound (noise) applied to the solid on which the microphone is installed reaches the vibrating membrane almost simultaneously. Therefore, it can be removed in the same manner as noise propagating in the air.

したがって、従来きわめて不快な現象であった「スピーカから発した音が装置の筺体内または固体内を伝播してマイクに伝わり、マイクから再び通話の相手に音声エコーとなって戻っていくエコー現象」を効果的に除去することができる。   Therefore, it was a very unpleasant phenomenon in the past: “Echo phenomenon where sound emitted from the speaker propagates through the device's enclosure or solid body to the microphone and then returns to the other party as a voice echo” Can be effectively removed.

またマイクロフォンとスピーカ間に生じるハウリング抑圧性能にも優れることから、例えば卓上に設置したハンズフリー電話機などに組み込むことにより、高性能のハンズフリー拡声通話装置を提供することができる。   Further, since it is excellent in the performance of suppressing howling generated between the microphone and the speaker, it is possible to provide a high-performance hands-free loudspeaker device by incorporating it in a hands-free telephone set on a table, for example.

従って、本実施の形態によればマイクロフォンに直接・間接に作用する衝撃雑音などに対しても雑音抑圧性能に優れることから、ハンズフリー型の音声入出力装置に組み込むことにより従来から極めて不快でまた除去が困難であった衝撃雑音下においても優れた性能の機器を提供することが出来る。   Therefore, according to the present embodiment, it is excellent in noise suppression performance against impact noise that directly or indirectly acts on the microphone. It is possible to provide a device having excellent performance even under impact noise that is difficult to remove.

なおパソコンのキーボード、作業ロボット、デジタル録音機、補聴器などに組み込んでも同様の効果を得ることができる。   The same effect can be obtained by incorporating it into a keyboard of a personal computer, a working robot, a digital recorder, a hearing aid, or the like.

またマイクロフォンとスピーカ間に生じるハウリング抑圧性能にも優れることから、雑音環境に強い新しい音声入出力装置を提供することが出来る。   In addition, since it is excellent in the howling suppression performance generated between the microphone and the speaker, it is possible to provide a new voice input / output device resistant to a noise environment.

本実施の形態の通話装置3020は、音声入出力装置3010と、音声入力部3030が生成した第1の音声信号3034を通話相手の装置に送信する送信部3050と、通話相手の装置から送信される第2の音声信号3048を受信する受信部3060と、を含む。   Call device 3020 according to the present embodiment is transmitted from voice input / output device 3010, transmission unit 3050 that transmits first voice signal 3034 generated by voice input unit 3030 to the other party's device, and the other party's device. Receiving unit 3060 for receiving second audio signal 3048.

なお、本発明は、上述の実施の形態に限定されるものではなく、種々の変形が可能である。本発明は、実施の形態で説明した構成と実質的に同一の構成(例えば、機能、方法及び結果が同一の構成、あるいは目的及び効果が同一の構成)を含む。また、本発明は、実施の形態で説明した構成の本質的でない部分を置き換えた構成を含む。また、本発明は、実施の形態で説明した構成と同一の作用効果を奏する構成又は同一の目的を達成することができる構成を含む。また、本発明は、実施の形態で説明した構成に公知技術を付加した構成を含む。   In addition, this invention is not limited to the above-mentioned embodiment, A various deformation | transformation is possible. The present invention includes configurations that are substantially the same as the configurations described in the embodiments (for example, configurations that have the same functions, methods, and results, or configurations that have the same objects and effects). In addition, the invention includes a configuration in which a non-essential part of the configuration described in the embodiment is replaced. In addition, the present invention includes a configuration that exhibits the same operational effects as the configuration described in the embodiment or a configuration that can achieve the same object. Further, the invention includes a configuration in which a known technique is added to the configuration described in the embodiment.

マイクロフォンユニットについて説明するための図。The figure for demonstrating a microphone unit. マイクロフォンユニットについて説明するための図。The figure for demonstrating a microphone unit. マイクロフォンユニットについて説明するための図。The figure for demonstrating a microphone unit. マイクロフォンユニットについて説明するための図。The figure for demonstrating a microphone unit. 音波の減衰特性について説明するための図。The figure for demonstrating the attenuation | damping property of a sound wave. 位相差と強度比との対応関係を表すデータの一例を示す図。The figure which shows an example of the data showing the correspondence of a phase difference and an intensity ratio. マイクロフォンユニットを製造する手順を示すフローチャート図。The flowchart figure which shows the procedure which manufactures a microphone unit. 音声入力装置について説明するための図。The figure for demonstrating an audio | voice input apparatus. 音声入力装置について説明するための図。The figure for demonstrating an audio | voice input apparatus. 音声入力装置の一例としての携帯電話を示す図。The figure which shows the mobile telephone as an example of a voice input device. 音声入力装置の一例としてのマイクを示す図。The figure which shows the microphone as an example of an audio | voice input apparatus. 音声入力装置の一例としてのリモートコントローラを示す図。The figure which shows the remote controller as an example of an audio | voice input apparatus. 情報処理システムの概略図。1 is a schematic diagram of an information processing system. 変形例に係るマイクロフォンユニットについて説明するための図。The figure for demonstrating the microphone unit which concerns on a modification. 変形例に係るマイクロフォンユニットについて説明するための図。The figure for demonstrating the microphone unit which concerns on a modification. 変形例に係るマイクロフォンユニットについて説明するための図。The figure for demonstrating the microphone unit which concerns on a modification. 変形例に係るマイクロフォンユニットについて説明するための図。The figure for demonstrating the microphone unit which concerns on a modification. 変形例に係るマイクロフォンユニットについて説明するための図。The figure for demonstrating the microphone unit which concerns on a modification. 変形例に係るマイクロフォンユニットについて説明するための図。The figure for demonstrating the microphone unit which concerns on a modification. 変形例に係るマイクロフォンユニットについて説明するための図。The figure for demonstrating the microphone unit which concerns on a modification. 変形例に係るマイクロフォンユニットについて説明するための図。The figure for demonstrating the microphone unit which concerns on a modification. 集積回路装置について説明するための図。4A and 4B illustrate an integrated circuit device. 集積回路装置について説明するための図。4A and 4B illustrate an integrated circuit device. 集積回路装置について説明するための図。4A and 4B illustrate an integrated circuit device. 集積回路装置を有する音声入力装置について説明するための図。4A and 4B illustrate a voice input device including an integrated circuit device. 集積回路装置を有する音声入力装置について説明するための図。4A and 4B illustrate a voice input device including an integrated circuit device. 変形例に係る集積回路装置について説明するための図。The figure for demonstrating the integrated circuit device which concerns on a modification. 変形例に係る集積回路装置を有する音声入力装置について説明するための図。The figure for demonstrating the voice input device which has the integrated circuit device which concerns on a modification. 集積回路装置を有する音声入力装置の一例としての携帯電話を示す図。1 is a diagram showing a mobile phone as an example of a voice input device having an integrated circuit device. 集積回路装置を有する音声入力装置の一例としてのマイクを示す図。The figure which shows the microphone as an example of the audio | voice input apparatus which has an integrated circuit device. 集積回路装置を有する音声入力装置の一例としてのリモートコントローラを示す図。The figure which shows the remote controller as an example of the audio | voice input apparatus which has an integrated circuit device. 情報処理システムの概略図。1 is a schematic diagram of an information processing system. 音声入力装置について説明するための図。The figure for demonstrating an audio | voice input apparatus. 音声入力装置について説明するための図。The figure for demonstrating an audio | voice input apparatus. 音声入力装置について説明するための図。The figure for demonstrating an audio | voice input apparatus. 音声入力装置について説明するための図。The figure for demonstrating an audio | voice input apparatus. 音声入力装置について説明するための図。The figure for demonstrating an audio | voice input apparatus. 音声入出力装置及び通話装置の機能ブロック図。The functional block diagram of a voice input / output device and a communication device.

符号の説明Explanation of symbols

1…マイクロフォンユニット、2…音声入力装置、3…マイクロフォンユニット、4…マイクロフォンユニット、5…マイクロフォンユニット、6…マイクロフォンユニット、7…マイクロフォンユニット、8…マイクロフォンユニット、9…マイクロフォンユニット、10…筐体、11…筐体、12…第1の貫通穴、13…マイクロフォンユニット、14…第2の貫通穴、16…凸曲面、17…凹曲面、18…球面、20…仕切り部材、21…仕切り部材、30…振動膜、31…振動膜、32…保持部、40…電気信号出力回路、41…振動膜ユニット、42…コンデンサ、44…信号増幅回路、45…ゲイン調整回路、46…チャージアップ回路、48…オペアンプ、50…筐体、52…開口、54…弾性体、 60…演算処理部、70…通信処理部、80…振動膜、100…内部空間、101…内部空間、102…第1の空間、104…第2の空間、112…第1の空間、114…第2の空間、110…外部空間、112…第1の空間、114…第2の空間、122…第1の空間、124…第2の空間、132…第1の空間、134…第2の空間、200…コンデンサ型マイクロフォン、202…振動膜、204…電極、300…携帯電話、400…マイク、500…リモートコントローラ、600…情報処理システム、602…音声入力装置、604…ホストコンピュータ、1001…集積回路装置、1002…音声入力装置、1003…集積回路装置、1004、音声入力装置、1010…第1のマイクロフォン、1012…第1の振動膜、1014…第1の電極、1015…第1の振動膜、1016…集積回路、1020…第2のマイクロフォン、1022…第2の振動膜、1024…第2の電極、1025…第2の振動膜、1030…差分信号生成回路、1040…筐体、1042…開口、1050…演算処理部、1060…通信処理部、1100…半導体基板、1102…第1の凹部、1104…第2の凹部、1200…半導体基板、1201…第1の面、1202…第2の面、1210…第1の凹部、1212…開口、1220…第2の凹部、1300…携帯電話、1400…マイク、1500…リモートコントローラ、1600…情報処理システム、1602…音声入力装置、1604…ホストコンピュータ
2001…音声入力装置、2010…第1のマイクロフォン、2012…第1の振動膜、2020…第2のマイクロフォン、2022…第2の振動膜、2030…差分信号生成部、2040…筐体、2050…演算処理部、2060…通信処理部、2070…基部、2072…主面、2074…凹部、2075…底面、2076…領域、2078…開口、2080…基部、2082…主面、2084…第1の凹部、2085…第1の開口、2086…第2の凹部、2087…第2の開口、2100…コンデンサ型マイクロフォン、20102…振動膜、2104…電極、3010…音声入出力装置、3020…通話装置、3030…音声入力部、3032…マイクロフォン、3034…第1の音声信号、3040…音声出力部、3042…周囲雑音検出部、3044…音量制御部、3046…スピーカ、3050…送信部、3060…受信部
DESCRIPTION OF SYMBOLS 1 ... Microphone unit, 2 ... Voice input device, 3 ... Microphone unit, 4 ... Microphone unit, 5 ... Microphone unit, 6 ... Microphone unit, 7 ... Microphone unit, 8 ... Microphone unit, 9 ... Microphone unit, 10 ... Housing DESCRIPTION OF SYMBOLS 11 ... Housing | casing 12 ... 1st through-hole, 13 ... Microphone unit, 14 ... 2nd through-hole, 16 ... Convex curved surface, 17 ... Concave curved surface, 18 ... Spherical surface, 20 ... Partition member, 21 ... Partition member , 30 ... Vibration membrane, 31 ... Vibration membrane, 32 ... Holding part, 40 ... Electric signal output circuit, 41 ... Vibration membrane unit, 42 ... Capacitor, 44 ... Signal amplification circuit, 45 ... Gain adjustment circuit, 46 ... Charge-up circuit , 48 ... operational amplifier, 50 ... housing, 52 ... opening, 54 ... elastic body, 60 ... arithmetic processing unit, 70 ... Communication processing unit 80 ... vibrating membrane 100 ... internal space 101 ... internal space 102 ... first space 104 ... second space 112 ... first space 114 ... second space 110 ... outside Space, 112 ... first space, 114 ... second space, 122 ... first space, 124 ... second space, 132 ... first space, 134 ... second space, 200 ... condenser microphone, 202 ... Vibration membrane, 204 ... Electrode, 300 ... Mobile phone, 400 ... Microphone, 500 ... Remote controller, 600 ... Information processing system, 602 ... Voice input device, 604 ... Host computer, 1001 ... Integrated circuit device, 1002 ... Voice input Device 1003 Integrated circuit device 1004 Voice input device 1010 First microphone 1012 First vibration membrane 1014 First electrode 101 1st diaphragm, 1016 ... Integrated circuit, 1020 ... 2nd microphone, 1022 ... 2nd diaphragm, 1024 ... 2nd electrode, 1025 ... 2nd diaphragm, 1030 ... Differential signal generation circuit, 1040 ... Case, 1042 ... Opening, 1050 ... Arithmetic processing unit, 1060 ... Communication processing unit, 1100 ... Semiconductor substrate, 1102 ... First recess, 1104 ... Second recess, 1200 ... Semiconductor substrate, 1201 ... First surface DESCRIPTION OF SYMBOLS 1202 ... 2nd surface, 1210 ... 1st recessed part, 1212 ... Opening, 1220 ... 2nd recessed part, 1300 ... Mobile phone, 1400 ... Microphone, 1500 ... Remote controller, 1600 ... Information processing system, 1602 ... Voice input Apparatus 1604 ... host computer 2001 ... voice input device 2010 ... first microphone 2012 ... first diaphragm 20 DESCRIPTION OF SYMBOLS 0 ... 2nd microphone, 2022 ... 2nd diaphragm, 2030 ... Difference signal generation part, 2040 ... Case, 2050 ... Arithmetic processing part, 2060 ... Communication processing part, 2070 ... Base part, 2072 ... Main surface, 2074 ... Recess, 2075 ... Bottom, 2076 ... Region, 2078 ... Opening, 2080 ... Base, 2082 ... Main surface, 2084 ... First recess, 2085 ... First opening, 2086 ... Second recess, 2087 ... Second opening DESCRIPTION OF SYMBOLS 2100 ... Capacitor type microphone, 20102 ... Vibration membrane, 2104 ... Electrode, 3010 ... Voice input / output device, 3020 ... Communication device, 3030 ... Voice input part, 3032 ... Microphone, 3034 ... First voice signal, 3040 ... Voice output , 3042 ... Ambient noise detection unit, 3044 ... Volume control unit, 3046 ... Speaker, 3050 ... Transmission unit, 3060 ... Reception Nobube

Claims (10)

マイクロフォンからの入力に基づき第1の音声信号を生成する音声入力部と、
第2の音声信号に基づきスピーカから音声を出力する音声出力部とを含む音声入出力装置であって、
前記音声入力部は、
内部空間を有する筐体と、前記筐体内に設けられた、前記内部空間を第1の空間と第2の空間とに分割する、少なくとも一部が振動膜で構成された仕切り部材と、前記振動膜の振動に基づいて第1の音声信号である電気信号を出力する電気信号出力回路と、を含み、前記筐体には、前記第1の空間と前記筐体の外部空間とを連通する第1の貫通穴と、前記第2の空間と前記筐体の外部空間とを連通する第2の貫通穴とが形成されているマイクロフォンユニットが実装され、
前記音声出力部は、
前記第1の音声信号に基づき通話時の周囲雑音を検出する周囲雑音検出部と、
検出された周囲雑音の大きさに基づき、前記スピーカの音量を制御する音量制御部とを含むことを特徴とする音声入出力装置。
An audio input unit that generates a first audio signal based on an input from a microphone;
A voice input / output device including a voice output unit that outputs voice from a speaker based on a second voice signal,
The voice input unit
A housing having an internal space, a partition member provided in the housing, which divides the internal space into a first space and a second space, at least a part of which is made of a vibrating membrane; and the vibration An electrical signal output circuit that outputs an electrical signal that is a first audio signal based on vibrations of the membrane, and the housing communicates with the first space and an external space of the housing. A microphone unit in which a through-hole of 1 and a second through-hole communicating with the second space and the external space of the housing are formed is mounted;
The audio output unit
An ambient noise detector for detecting ambient noise during a call based on the first audio signal;
A voice input / output device comprising: a volume control unit that controls the volume of the speaker based on the detected magnitude of ambient noise.
マイクロフォンからの入力に基づき第1の音声信号を生成する音声入力部と、
第2の音声信号に基づきスピーカから音声を出力する音声出力部とを含む音声入出力装置であって、
前記音声入力部は、
第1のマイクロフォンを構成する第1の振動膜と、第2のマイクロフォンを構成する第2の振動膜と、前記第1のマイクロフォンで取得された第1の電圧信号と、前記第2のマイクロフォンで取得された第2の電圧信号とを受け付けて、前記第1及び第2の電圧信号の差を示す差分信号に基づき第1の音声信号を生成する差分信号生成回路と、が形成された半導体基板を有する集積回路装置が実装され、
前記音声出力部は、
前記第1の音声信号に基づき通話時の周囲雑音を検出する周囲雑音検出部と、
検出された周囲雑音の大きさに基づき、前記スピーカの音量を制御する音量制御部とを含むことを特徴とする音声入出力装置。
An audio input unit that generates a first audio signal based on an input from a microphone;
A voice input / output device including a voice output unit that outputs voice from a speaker based on a second voice signal,
The voice input unit
A first vibrating membrane constituting a first microphone, a second vibrating membrane constituting a second microphone, a first voltage signal acquired by the first microphone, and a second microphone; A semiconductor substrate formed with a difference signal generation circuit that receives the acquired second voltage signal and generates a first audio signal based on a difference signal indicating a difference between the first and second voltage signals An integrated circuit device is mounted,
The audio output unit
An ambient noise detector for detecting ambient noise during a call based on the first audio signal;
A voice input / output device comprising: a volume control unit that controls the volume of the speaker based on the detected magnitude of ambient noise.
マイクロフォンからの入力に基づき第1の音声信号を生成する音声入力部と、
第2の音声信号に基づきスピーカから音声を出力する音声出力部とを含む音声入出力装置であって、
前記音声入力部は、
第1の振動膜を有する第1のマイクロフォンと、
第2の振動膜を有する第2のマイクロフォンと、
前記第1のマイクロフォンで取得された第1の電圧信号と、前記第2のマイクロフォンで取得された第2の電圧信号との差を示す差分信号に基づき第1の音声信号を生成する差分信号生成部と、を含み、
前記第1及び第2の振動膜は、前記差分信号に含まれる雑音成分の強度の、前記第1又は第2の電圧信号に含まれる前記雑音成分の強度に対する比率を示す雑音強度比が、前記差分信号に含まれる入力音声成分の強度の、前記第1又は第2の電圧信号に含まれる前記入力音声成分の強度に対する比率を示す入力音声強度比よりも小さくなるように配置され、
前記音声出力部は、
前記第1の音声信号に基づき通話時の周囲雑音を検出する周囲雑音検出部と、
検出された周囲雑音の大きさに基づき、前記スピーカの音量を制御する音量制御部とを含むことを特徴とする音声入出力装置。
An audio input unit that generates a first audio signal based on an input from a microphone;
A voice input / output device including a voice output unit that outputs voice from a speaker based on a second voice signal,
The voice input unit
A first microphone having a first vibrating membrane;
A second microphone having a second vibrating membrane;
Difference signal generation for generating a first audio signal based on a difference signal indicating a difference between a first voltage signal acquired by the first microphone and a second voltage signal acquired by the second microphone And
The first and second diaphragms have a noise intensity ratio indicating a ratio of the intensity of the noise component included in the differential signal to the intensity of the noise component included in the first or second voltage signal. Arranged so as to be smaller than the input voice intensity ratio indicating the ratio of the intensity of the input voice component included in the difference signal to the intensity of the input voice component included in the first or second voltage signal;
The audio output unit
An ambient noise detector for detecting ambient noise during a call based on the first audio signal;
A voice input / output device comprising: a volume control unit that controls the volume of the speaker based on the detected magnitude of ambient noise.
マイクロフォンからの入力に基づき第1の音声信号を生成するハンズフリー型の音声入力部と、
第2の音声信号に基づきスピーカから音声を出力する音声出力部とを含むハンズフリー型の音声入出力装置であって、
前記音声入力部は、
内部空間を有する筐体と、前記筐体内に設けられた、前記内部空間を第1の空間と第2の空間とに分割する、少なくとも一部が振動膜で構成された仕切り部材と、前記振動膜の振動に基づいて第1の音声信号である電気信号を出力する電気信号出力回路と、を含み、前記筐体には、前記第1の空間と前記筐体の外部空間とを連通する第1の貫通穴と、前記第2の空間と前記筐体の外部空間とを連通する第2の貫通穴とが形成されているマイクロフォンユニットが実装されていることを特徴とする音声入出力装置。
A hands-free type audio input unit that generates a first audio signal based on an input from a microphone;
A hands-free type voice input / output device including a voice output unit that outputs voice from a speaker based on a second voice signal,
The voice input unit
A housing having an internal space, a partition member provided in the housing, which divides the internal space into a first space and a second space, at least a part of which is made of a vibrating membrane; and the vibration An electrical signal output circuit that outputs an electrical signal that is a first audio signal based on vibrations of the membrane, and the housing communicates with the first space and an external space of the housing. An audio input / output device comprising: a microphone unit in which one through hole and a second through hole that communicates the second space and the external space of the housing are formed.
マイクロフォンからの入力に基づき第1の音声信号を生成するハンズフリー型の音声入力部と、
第2の音声信号に基づきスピーカから音声を出力する音声出力部とを含むハンズフリー型の音声入出力装置であって、
前記音声入力部は、
第1のマイクロフォンを構成する第1の振動膜と、第2のマイクロフォンを構成する第2の振動膜と、前記第1のマイクロフォンで取得された第1の電圧信号と、前記第2のマイクロフォンで取得された第2の電圧信号とを受け付けて、前記第1及び第2の電圧信号の差を示す差分信号に基づき第1の音声信号を生成する差分信号生成回路と、が形成された半導体基板を有する集積回路装置が実装されていることを特徴とする音声入出力装置。
A hands-free type audio input unit that generates a first audio signal based on an input from a microphone;
A hands-free type voice input / output device including a voice output unit that outputs voice from a speaker based on a second voice signal,
The voice input unit
A first vibrating membrane constituting a first microphone, a second vibrating membrane constituting a second microphone, a first voltage signal acquired by the first microphone, and a second microphone; A semiconductor substrate formed with a difference signal generation circuit that receives the acquired second voltage signal and generates a first audio signal based on a difference signal indicating a difference between the first and second voltage signals An audio input / output device, characterized in that an integrated circuit device is mounted.
マイクロフォンからの入力に基づき第1の音声信号を生成するハンズフリー型の音声入力部と、
第2の音声信号に基づきスピーカから音声を出力する音声出力部とを含むハンズフリー型の音声入出力装置であって、
前記音声入力部は、
第1の振動膜を有する第1のマイクロフォンと、
第2の振動膜を有する第2のマイクロフォンと、
前記第1のマイクロフォンで取得された第1の電圧信号と、前記第2のマイクロフォンで取得された第2の電圧信号との差を示す差分信号に基づき第1の音声信号を生成する差分信号生成部と、を含み、
前記第1及び第2の振動膜は、前記差分信号に含まれる雑音成分の強度の、前記第1又は第2の電圧信号に含まれる前記雑音成分の強度に対する比率を示す雑音強度比が、前記差分信号に含まれる入力音声成分の強度の、前記第1又は第2の電圧信号に含まれる前記入力音声成分の強度に対する比率を示す入力音声強度比よりも小さくなるように配置されていることを特徴とする音声入出力装置。
A hands-free type audio input unit that generates a first audio signal based on an input from a microphone;
A hands-free type voice input / output device including a voice output unit that outputs voice from a speaker based on a second voice signal,
The voice input unit
A first microphone having a first vibrating membrane;
A second microphone having a second vibrating membrane;
Difference signal generation for generating a first audio signal based on a difference signal indicating a difference between a first voltage signal acquired by the first microphone and a second voltage signal acquired by the second microphone And
The first and second diaphragms have a noise intensity ratio indicating a ratio of the intensity of the noise component included in the differential signal to the intensity of the noise component included in the first or second voltage signal. The input voice component included in the difference signal is disposed so as to be smaller than an input voice intensity ratio indicating a ratio of the intensity of the input voice component included in the first or second voltage signal to the intensity of the input voice component. Characteristic voice input / output device.
マイクロフォンからの入力に基づき第1の音声信号を生成する音声入力部と、
第2の音声信号に基づきスピーカから音声を出力する音声出力部とを含む音声入出力装置であって、
前記音声入力部は、
内部空間を有する筐体と、前記筐体内に設けられた、前記内部空間を第1の空間と第2の空間とに分割する、少なくとも一部が振動膜で構成された仕切り部材と、前記振動膜の振動に基づいて第1の音声信号である電気信号を出力する電気信号出力回路と、を含み、前記筐体には、前記第1の空間と前記筐体の外部空間とを連通する第1の貫通穴と、前記第2の空間と前記筐体の外部空間とを連通する第2の貫通穴とが形成されているマイクロフォンユニットが実装され、
前記音声出力部と前記音声入力部とは、分離して設置されていることを特徴とする音声入出力装置。
An audio input unit that generates a first audio signal based on an input from a microphone;
A voice input / output device including a voice output unit that outputs voice from a speaker based on a second voice signal,
The voice input unit
A housing having an internal space, a partition member provided in the housing, which divides the internal space into a first space and a second space, at least a part of which is made of a vibrating membrane; and the vibration An electrical signal output circuit that outputs an electrical signal that is a first audio signal based on vibrations of the membrane, and the housing communicates with the first space and an external space of the housing. A microphone unit in which a through-hole of 1 and a second through-hole communicating with the second space and the external space of the housing are formed is mounted;
The voice input / output apparatus, wherein the voice output unit and the voice input unit are installed separately.
マイクロフォンからの入力に基づき第1の音声信号を生成する音声入力部と、
第2の音声信号に基づきスピーカから音声を出力する音声出力部とを含む音声入出力装置であって、
前記音声入力部は、
第1のマイクロフォンを構成する第1の振動膜と、第2のマイクロフォンを構成する第2の振動膜と、前記第1のマイクロフォンで取得された第1の電圧信号と、前記第2のマイクロフォンで取得された第2の電圧信号とを受け付けて、前記第1及び第2の電圧信号の差を示す差分信号に基づき第1の音声信号を生成する差分信号生成回路と、が形成された半導体基板を有する集積回路装置が実装され、
前記音声出力部と前記音声入力部とは、分離して設置されていることを特徴とする音声入出力装置。
An audio input unit that generates a first audio signal based on an input from a microphone;
A voice input / output device including a voice output unit that outputs voice from a speaker based on a second voice signal,
The voice input unit
A first vibrating membrane constituting a first microphone, a second vibrating membrane constituting a second microphone, a first voltage signal acquired by the first microphone, and a second microphone; A semiconductor substrate formed with a difference signal generation circuit that receives the acquired second voltage signal and generates a first audio signal based on a difference signal indicating a difference between the first and second voltage signals An integrated circuit device is mounted,
The voice input / output apparatus, wherein the voice output unit and the voice input unit are installed separately.
マイクロフォンからの入力に基づき第1の音声信号を生成する音声入力部と、
第2の音声信号に基づきスピーカから音声を出力する音声出力部とを含む音声入出力装置であって、
前記音声入力部は、
第1の振動膜を有する第1のマイクロフォンと、
第2の振動膜を有する第2のマイクロフォンと、
前記第1のマイクロフォンで取得された第1の電圧信号と、前記第2のマイクロフォンで取得された第2の電圧信号との差を示す差分信号に基づき第1の音声信号を生成する差分信号生成部と、を含み、
前記第1及び第2の振動膜は、前記差分信号に含まれる雑音成分の強度の、前記第1又は第2の電圧信号に含まれる前記雑音成分の強度に対する比率を示す雑音強度比が、前記差分信号に含まれる入力音声成分の強度の、前記第1又は第2の電圧信号に含まれる前記入力音声成分の強度に対する比率を示す入力音声強度比よりも小さくなるように配置され、
前記音声出力部と前記音声入力部とは、分離して設置されていることを特徴とする音声入出力装置。
An audio input unit that generates a first audio signal based on an input from a microphone;
A voice input / output device including a voice output unit that outputs voice from a speaker based on a second voice signal,
The voice input unit
A first microphone having a first vibrating membrane;
A second microphone having a second vibrating membrane;
Difference signal generation for generating a first audio signal based on a difference signal indicating a difference between a first voltage signal acquired by the first microphone and a second voltage signal acquired by the second microphone And
The first and second diaphragms have a noise intensity ratio indicating a ratio of the intensity of the noise component included in the differential signal to the intensity of the noise component included in the first or second voltage signal. Arranged so as to be smaller than the input voice intensity ratio indicating the ratio of the intensity of the input voice component included in the difference signal to the intensity of the input voice component included in the first or second voltage signal;
The voice input / output apparatus, wherein the voice output unit and the voice input unit are installed separately.
請求項1乃至9のいずれかに記載の音声入出力装置と、
音声入力部が生成した第1の音声信号を通話相手の装置に送信する送信部と、
通話相手の装置から送信される第2の音声信号を受信する受信部と、を含むことを特徴とする通話装置。
The voice input / output device according to any one of claims 1 to 9,
A transmission unit for transmitting the first audio signal generated by the audio input unit to the device of the other party;
And a receiver that receives a second audio signal transmitted from the device of the other party.
JP2007163912A 2007-06-21 2007-06-21 Voice input / output device and communication device Expired - Fee Related JP5114106B2 (en)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2007163912A JP5114106B2 (en) 2007-06-21 2007-06-21 Voice input / output device and communication device
CN200810125329.5A CN101330769B (en) 2007-06-21 2008-06-20 Voice input-output device and communication device
EP08011279A EP2007167A3 (en) 2007-06-21 2008-06-20 Voice input-output device and communication device
US12/144,284 US8155707B2 (en) 2007-06-21 2008-06-23 Voice input-output device and communication device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007163912A JP5114106B2 (en) 2007-06-21 2007-06-21 Voice input / output device and communication device

Publications (3)

Publication Number Publication Date
JP2009005071A true JP2009005071A (en) 2009-01-08
JP2009005071A5 JP2009005071A5 (en) 2010-06-24
JP5114106B2 JP5114106B2 (en) 2013-01-09

Family

ID=40206299

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007163912A Expired - Fee Related JP5114106B2 (en) 2007-06-21 2007-06-21 Voice input / output device and communication device

Country Status (2)

Country Link
JP (1) JP5114106B2 (en)
CN (1) CN101330769B (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010206541A (en) * 2009-03-03 2010-09-16 Funai Electric Co Ltd Microphone unit
US7933428B2 (en) 2009-06-02 2011-04-26 Panasonic Corporation Microphone apparatus
JP2013505089A (en) * 2009-10-01 2013-02-14 ヴェーデクス・アクティーセルスカプ Portable monitoring device using hearing aid and EEG monitor
KR20150093801A (en) * 2013-02-13 2015-08-18 아나로그 디바이시즈 인코포레이티드 Signal source separation

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102946583A (en) * 2012-10-11 2013-02-27 杨志豪 Wireless intelligent remote control loudspeaker system
JP6597053B2 (en) * 2015-08-24 2019-10-30 ヤマハ株式会社 Sound emission and collection device
CN105163050B (en) * 2015-08-25 2018-09-25 青岛海信电器股份有限公司 A kind of television set
CN106954119B (en) * 2017-05-13 2019-04-05 门立山 A kind of solid sound box and its mating microphone
CN109005489B (en) * 2017-06-07 2021-03-16 美商富迪科技股份有限公司 Microphone device
CN107274895B (en) * 2017-08-18 2020-04-17 京东方科技集团股份有限公司 Voice recognition device and method
KR102607863B1 (en) * 2018-12-03 2023-12-01 삼성전자주식회사 Blind source separating apparatus and method
CN109756818B (en) * 2018-12-29 2021-04-06 上海瑾盛通信科技有限公司 Dual-microphone noise reduction method and device, storage medium and electronic equipment

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04217199A (en) * 1990-02-28 1992-08-07 American Teleph & Telegr Co <Att> Directional microphone assembly
JPH07307697A (en) * 1994-05-13 1995-11-21 Nec Corp Communication equipment
JPH07312638A (en) * 1994-05-18 1995-11-28 Mitsubishi Electric Corp Hands free speaking equipment
JPH09331377A (en) * 1996-06-12 1997-12-22 Nec Corp Noise cancellation circuit
JPH11298988A (en) * 1998-04-14 1999-10-29 Fujitsu Ten Ltd Device controlling directivity for microphone
JPH11308329A (en) * 1998-04-20 1999-11-05 Nec Corp Voice communication system
JP2001186241A (en) * 1999-12-27 2001-07-06 Toshiba Corp Telephone terminal device
JP2005295278A (en) * 2004-03-31 2005-10-20 Hosiden Corp Microphone device
JP2006211468A (en) * 2005-01-31 2006-08-10 Sanyo Electric Co Ltd Semiconductor sensor

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5226076A (en) * 1993-02-28 1993-07-06 At&T Bell Laboratories Directional microphone assembly
US5969838A (en) * 1995-12-05 1999-10-19 Phone Or Ltd. System for attenuation of noise
US20010028718A1 (en) * 2000-02-17 2001-10-11 Audia Technology, Inc. Null adaptation in multi-microphone directional system
JP2003319095A (en) * 2002-04-26 2003-11-07 Matsushita Electric Ind Co Ltd Voice control apparatus
TW588540B (en) * 2002-11-29 2004-05-21 Inventec Appliances Corp Intelligent method for adjusting earphone volume of mobile communication device
JP4857652B2 (en) * 2005-08-17 2012-01-18 ソニー株式会社 Noise canceller and microphone device

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04217199A (en) * 1990-02-28 1992-08-07 American Teleph & Telegr Co <Att> Directional microphone assembly
JPH07307697A (en) * 1994-05-13 1995-11-21 Nec Corp Communication equipment
JPH07312638A (en) * 1994-05-18 1995-11-28 Mitsubishi Electric Corp Hands free speaking equipment
JPH09331377A (en) * 1996-06-12 1997-12-22 Nec Corp Noise cancellation circuit
JPH11298988A (en) * 1998-04-14 1999-10-29 Fujitsu Ten Ltd Device controlling directivity for microphone
JPH11308329A (en) * 1998-04-20 1999-11-05 Nec Corp Voice communication system
JP2001186241A (en) * 1999-12-27 2001-07-06 Toshiba Corp Telephone terminal device
JP2005295278A (en) * 2004-03-31 2005-10-20 Hosiden Corp Microphone device
JP2006211468A (en) * 2005-01-31 2006-08-10 Sanyo Electric Co Ltd Semiconductor sensor

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010206541A (en) * 2009-03-03 2010-09-16 Funai Electric Co Ltd Microphone unit
US7933428B2 (en) 2009-06-02 2011-04-26 Panasonic Corporation Microphone apparatus
JP2013505089A (en) * 2009-10-01 2013-02-14 ヴェーデクス・アクティーセルスカプ Portable monitoring device using hearing aid and EEG monitor
US9782103B2 (en) 2009-10-01 2017-10-10 Widex A/S Portable monitoring device with hearing aid and EEG monitor
KR20150093801A (en) * 2013-02-13 2015-08-18 아나로그 디바이시즈 인코포레이티드 Signal source separation
KR101688354B1 (en) * 2013-02-13 2016-12-20 아나로그 디바이시즈 인코포레이티드 Signal source separation

Also Published As

Publication number Publication date
CN101330769B (en) 2013-10-30
JP5114106B2 (en) 2013-01-09
CN101330769A (en) 2008-12-24

Similar Documents

Publication Publication Date Title
JP5114106B2 (en) Voice input / output device and communication device
US8155707B2 (en) Voice input-output device and communication device
JP4293378B2 (en) Microphone unit, close-talking voice input device, and information processing system
JP4293377B2 (en) Voice input device, manufacturing method thereof, and information processing system
JP5128919B2 (en) Microphone unit and voice input device
US8180082B2 (en) Microphone unit, close-talking voice input device, information processing system, and method of manufacturing microphone unit
JP5129024B2 (en) Audio input device and audio conference system
WO2009119852A1 (en) Microphone unit, voice input device of close-talking type, information processing system, and method for manufacturing microphone unit
JP5166122B2 (en) Voice input device
WO2009145096A1 (en) Audio input device, method for manufacturing the same, and information processing system
WO2009142249A1 (en) Voice input device and manufacturing method thereof, and information processing system
US8135144B2 (en) Microphone system, sound input apparatus and method for manufacturing the same
JP2008154224A (en) Integrated circuit device, voice input device and information processing system
KR20100101545A (en) Microphone unit
JP5250899B2 (en) Mobile phone and microphone unit
JP5257920B2 (en) Mobile phone and microphone unit
JP4212635B1 (en) Voice input device, manufacturing method thereof, and information processing system
JP5008638B2 (en) Microphone unit, voice input device, information processing system, and method of manufacturing microphone unit
JP2009296517A (en) Voice input device, and voice remote control system
JP5166007B2 (en) Microphone unit and manufacturing method thereof
JP5097692B2 (en) Voice input device, manufacturing method thereof, and information processing system
JP2009130390A (en) Voice input device, its manufacturing method and information processing system

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100420

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100420

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20100420

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110916

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110928

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111125

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120711

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120906

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20121003

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20121015

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20151019

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313117

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees