JP2003044092A - Voice recognizing device - Google Patents

Voice recognizing device

Info

Publication number
JP2003044092A
JP2003044092A JP2001236312A JP2001236312A JP2003044092A JP 2003044092 A JP2003044092 A JP 2003044092A JP 2001236312 A JP2001236312 A JP 2001236312A JP 2001236312 A JP2001236312 A JP 2001236312A JP 2003044092 A JP2003044092 A JP 2003044092A
Authority
JP
Japan
Prior art keywords
signal
microphone
voice
microphones
speaker
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2001236312A
Other languages
Japanese (ja)
Inventor
Shingo Kiuchi
真吾 木内
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alpine Electronics Inc
Original Assignee
Alpine Electronics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alpine Electronics Inc filed Critical Alpine Electronics Inc
Priority to JP2001236312A priority Critical patent/JP2003044092A/en
Publication of JP2003044092A publication Critical patent/JP2003044092A/en
Withdrawn legal-status Critical Current

Links

Abstract

PROBLEM TO BE SOLVED: To provide a voice recognizing device with which the voices of a speaker can be collected with a satisfactory S/N (signal-noise ratio) at all times even when the position of a microphone changes. SOLUTION: The angle of a sun visor 19, to which microphones M1 and M2 are attached, is detected by an angle sensor 18. On the basis of the output of the angle sensor 18, the direction of the mouth of the speaker to the microphones M1 and M2 is found by a microphone directivity calculating part 16, and suitable delay time is calculated. Signal delayers 12a and 12b are controlled by a delay time control part 15 so that the delay time calculated by the microphone directivity calculating part 16 can be provided. Thus, even when the sun visor 19 is moved, voices from the direction of the speaker are extracted with the satisfactory S/N at all times and the recognition rate of voices by a voice recognizing processing part 14 is prevented from being lowered.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【発明の属する技術分野】本発明は、マイクと話者との
相対的な位置関係が変化する環境で使用される音声認識
装置に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a voice recognition device used in an environment where the relative positional relationship between a microphone and a speaker changes.

【0002】[0002]

【従来の技術】近年、音声認識技術が著しく発達し、種
々の分野で使用されるようになった。例えば車載用ナビ
ゲーション装置では、目的地の設定や画面の切換えなど
の操作を音声でできるようにしたものも多い。この場
合、音声入力用マイクを車室内に設置するが、マイクが
運転者の視界を妨げず、運転者の音声をよく収音し、且
つ車室内のノイズの影響を極力小さくする工夫が必要で
ある。
2. Description of the Related Art In recent years, voice recognition technology has been remarkably developed and has been used in various fields. For example, in many on-vehicle navigation devices, operations such as destination setting and screen switching can be performed by voice. In this case, a voice input microphone is installed in the vehicle interior, but it is necessary to devise a microphone that does not obstruct the driver's view, collects the driver's voice well, and minimizes the effect of noise in the vehicle interior. is there.

【0003】音声認識機能を備えた車載用ナビゲーショ
ン装置の音声入力用マイクとして、ヘッドセットマイク
を使用することも考えられる。しかし、ヘッドセットマ
イクを頭に装着したまま車両を運転することは煩わし
く、一般的ではない。そこで、一般的な車載用ナビゲー
ション装置では、運転席の前方のサンバイザーに指向性
マイクを取り付けるようになっている。この方法は、車
室内へのマイクの取り付けが容易であるという利点もあ
る。
It is also conceivable to use a headset microphone as a voice input microphone of a vehicle-mounted navigation device having a voice recognition function. However, driving a vehicle with the headset microphone mounted on the head is cumbersome and not common. Therefore, in a general vehicle-mounted navigation device, a directional microphone is attached to the sun visor in front of the driver's seat. This method also has an advantage that the microphone can be easily attached to the vehicle interior.

【0004】[0004]

【発明が解決しようとする課題】しかしながら、サンバ
イザーに指向性マイクを取り付ける方法では、例えば車
両前方からの日差しがまぶしいときに運転者がサンバイ
ザーを下げて日差しを避けようとすると、マイクの向き
が変わってしまう。このため、運転者の音声が収音しに
くくなり、SN比(信号とノイズとの比)が劣化して音
声認識の精度が著しく低下する。
However, in the method of attaching the directional microphone to the sun visor, for example, when the driver lowers the sun visor to avoid the sunshine when the sunshine from the front of the vehicle is dazzling, the direction of the mic Will change. For this reason, it becomes difficult for the driver's voice to be picked up, the SN ratio (ratio of signal to noise) deteriorates, and the accuracy of voice recognition significantly decreases.

【0005】以上から、本発明の目的は、マイクの位置
が変化しても常に良好なSN比で話者の音声を収音する
ことができる音声認識装置を提供することである。
In view of the above, an object of the present invention is to provide a voice recognition device which can always pick up the voice of the speaker with a good SN ratio even if the position of the microphone changes.

【0006】[0006]

【課題を解決するための手段】本発明の音声認識装置
は、相互に離隔して配置される複数個のマイクと、前記
複数個のマイクの位置変化量を検出するマイク位置変化
量検出手段と、前記マイク位置変化量検出手段で検出し
たマイク位置変化量を入力し、各マイクの位置の差に応
じた信号の遅れを利用して前記複数個のマイクの出力か
ら話者の方向からの音声信号を選択的に抽出する音声信
号抽出手段と、前記音声信号抽出手段により抽出された
音声信号に対し音声認識処理を行う音声認識処理部とを
有することを特徴とする。
A voice recognition device of the present invention comprises a plurality of microphones arranged apart from each other, and a microphone position change amount detecting means for detecting a position change amount of the plurality of microphones. The microphone position change amount detected by the microphone position change amount detecting means is input, and a signal from the direction of the speaker is output from the outputs of the plurality of microphones by using a signal delay according to a difference in position of each microphone. It is characterized by comprising a voice signal extraction means for selectively extracting a signal and a voice recognition processing section for performing voice recognition processing on the voice signal extracted by the voice signal extraction means.

【0007】本発明においては、相互に離隔して配置さ
れた複数個のマイクの出力を音声信号抽出手段により信
号処理し、話者の方向からの音声による信号を強調する
か、又は所定の方向からのノイズによる信号を減衰させ
ることによって、話者の方向からの音声信号を選択的に
抽出する。相互に離隔して配置された複数個のマイクを
使用すると、各マイクと話者との距離の差により、各マ
イクからの信号に時間差が生じる。どの程度の時間差が
生じるのかは、マイクに対する話者の口元の方向に関係
する。例えば、話者の音声による各マイクの出力信号が
同時に信号合成器に入力されるように各マイクと信号合
成器との間に信号遅延器を接続すると、話者の方向から
の音声は同位相であるため加算により強調される。一
方、別方向から到来するノイズは遅延により同位相とな
らないため、加算しても音声ほどは強調されない。その
結果、SN比が向上する。
In the present invention, the output of a plurality of microphones arranged apart from each other is subjected to signal processing by the voice signal extraction means to emphasize the signal by the voice from the direction of the speaker, or a predetermined direction. The sound signal from the direction of the speaker is selectively extracted by attenuating the signal due to the noise from. When a plurality of microphones arranged apart from each other are used, a time difference occurs in signals from each microphone due to a difference in distance between each microphone and a speaker. How much time difference occurs depends on the direction of the speaker's mouth with respect to the microphone. For example, if a signal delay device is connected between each microphone and the signal synthesizer so that the output signals of each microphone from the speaker's voice are input to the signal synthesizer at the same time, the voice from the speaker's direction will have the same phase. Therefore, it is emphasized by addition. On the other hand, noises coming from different directions do not have the same phase due to the delay, so even if they are added, they are not emphasized as much as speech. As a result, the SN ratio is improved.

【0008】また、例えば所定の方向にノイズの発生源
がある場合は、その方向からのノイズによる信号が逆位
相になるように信号遅延器の遅延時間を設定すると、ノ
イズ成分が減衰される。一方、話者の方向からの音声信
号は、完全に逆位相とはならないため、ノイズほどは減
衰されず、その結果SN比が向上する。いずれの方法に
よっても、マイクの位置が変化すると、適切な遅延時間
が変化する。従って、マイク位置の変化量を検出するマ
イク位置変化量検出手段と、マイク位置の変化量に応じ
て信号遅延器の遅延時間を決定する遅延時間決定部と、
遅延時間決定部で決定した遅延時間となるように信号遅
延器を制御する遅延時間制御部とが必要である。
Further, for example, when there is a noise source in a predetermined direction, the noise component is attenuated by setting the delay time of the signal delay device so that the signal due to the noise from that direction has the opposite phase. On the other hand, the voice signal from the direction of the speaker is not completely out of phase and is not attenuated as much as noise, resulting in an improvement in the SN ratio. With either method, when the position of the microphone changes, the appropriate delay time changes. Therefore, a microphone position change amount detecting means for detecting the change amount of the microphone position, a delay time determining unit for determining the delay time of the signal delay unit according to the change amount of the microphone position,
A delay time control unit that controls the signal delay device so that the delay time determined by the delay time determination unit is required.

【0009】[0009]

【発明の実施の形態】以下、本発明の実施の形態につい
て、添付の図面を参照して説明する。 (第1の実施の形態)図1は本発明の第1の実施の形態
の音声認識装置の原理を示す図である。本実施の形態の
音声認識装置においては、2個の無指向性マイクM1
2 を使用し、話者の音声がこれらのマイクM1 ,M2
にそれぞれ到達するまでの時間の差を利用して、話者
(の口元)の方向からの音声を選択的に収音する。
BEST MODE FOR CARRYING OUT THE INVENTION Embodiments of the present invention will be described below with reference to the accompanying drawings. (First Embodiment) FIG. 1 is a diagram showing the principle of a voice recognition apparatus according to a first embodiment of the present invention. In the voice recognition device of the present embodiment, two omnidirectional microphones M 1 ,
M 2 is used, and the voice of the speaker is transmitted to these microphones M 1 and M 2.
The sound from the direction of the speaker (the mouth of the speaker) is selectively picked up by using the difference in the time until reaching each of the.

【0010】例えば、図1に示すように、第1のマイク
1 と第2のマイクM2 との間隔がL(m)、音速がC
(m/秒)であるとすると、第1のマイクM1 から出力
される信号は、第2のマイクM2 から出力される信号に
対してL/C秒だけ時間差が生じる。従って、第2のマ
イクM2 の出力をL/C秒だけ遅延して第1のマイクM
1 の出力との和をとれば、マイクM1 とマイクM2 の音
声出力が同相化されているため、話者の方向の音声が強
調され、SN比が向上して、話者の方向からの音声だけ
を選択的に収音することができる。
For example, as shown in FIG. 1, the distance between the first microphone M 1 and the second microphone M 2 is L (m), and the speed of sound is C.
(M / sec), the signal output from the first microphone M 1 has a time difference of L / C seconds with respect to the signal output from the second microphone M 2 . Therefore, the output of the second microphone M 2 is delayed by L / C seconds and the first microphone M 2 is delayed.
If the output of 1 is summed, the voice outputs of the microphones M 1 and M 2 are in-phase, so that the voice in the direction of the speaker is emphasized, the SN ratio is improved, and the direction of the speaker is increased. Only the voice of can be selectively picked up.

【0011】図2に示すように、第1のマイクM1 と第
2のマイクM2 との間隔をdとし、話者の方向をθとす
ると、話者からマイクM1 ,M2 までの距離の差Lは、
下記(1)式に示すように、dsin θとなる。
As shown in FIG. 2, when the distance between the first microphone M 1 and the second microphone M 2 is d and the direction of the speaker is θ, the distance from the speaker to the microphones M 1 and M 2 is The distance difference L is
As shown in the following equation (1), dsin θ.

【0012】[0012]

【数1】 [Equation 1]

【0013】従って、第2のマイクM2 の出力を(dsi
n θ)/C秒だけ遅延して第1のマイクM1 の出力との
和をとれば、話者の方向からの音声だけを選択的に収音
することができる。図3は第1の実施の形態の音声認識
装置の構成を示すブロック図である。図3は、本発明を
車載用ナビゲーション装置の音声認識装置に適用した例
を示している。
Therefore, the output of the second microphone M 2 is (dsi
By delaying by n θ) / C seconds and summing with the output of the first microphone M 1 , only the voice from the direction of the speaker can be selectively picked up. FIG. 3 is a block diagram showing the configuration of the voice recognition device according to the first embodiment. FIG. 3 shows an example in which the present invention is applied to a voice recognition device of a vehicle-mounted navigation device.

【0014】本実施の形態の音声認識装置は、2個の無
指向性マイクM1 ,M2 と、信号遅延器12a,12b
と、加算器(信号合成器)13と、音声認識処理部14
と、遅延時間制御部15と、マイク指向性算出部(遅延
時間決定部)16と、座席位置センサ17と、角度セン
サ18とにより構成されている。無指向性マイクM1
2 は、運転席の前方のサンバイザー19に相互に離隔
して取り付けられている。マイクM1 は信号遅延器12
aに接続され、マイクM 2 は信号遅延器12bに接続さ
れている。これらの信号遅延器12a,12bは、遅延
時間制御部15により遅延時間が個別に制御される。な
お、マイクM1 ,M2 は必ずしも無指向性である必要は
ないが、位置が変化しても話者の方向に対する感度の変
化が少ないものであることが好ましい。
The speech recognition apparatus of this embodiment has two
Directional microphone M1, M2And the signal delay devices 12a and 12b
, Adder (signal synthesizer) 13, and voice recognition processing unit 14
, Delay time control unit 15, microphone directivity calculation unit (delay
(Time determination unit) 16, seat position sensor 17, angle sensor
It is composed of the service 18 and the service. Omnidirectional microphone M1
M2Are separated from each other by the sun visor 19 in front of the driver's seat.
And is installed. Mike M1Is the signal delay unit 12
a, connected to a microphone M 2Is connected to the signal delay device 12b
Has been. These signal delay devices 12a and 12b are
The delay time is individually controlled by the time control unit 15. Na
Oh, Mike M1, M2Need not be omnidirectional
However, even if the position changes, the sensitivity to the direction of the speaker changes.
It is preferable that there is little change.

【0015】加算器13は、信号遅延器12a,12b
から出力された信号を加算する。この加算器13から出
力された信号は音声認識処理部14に送られる。音声認
識処理部14は、信号合成部13から入力した信号を音
声処理して文字データに変換する。音声認識処理部14
から出力された文字データはナビゲーション装置本体
(図示せず)に送られ、ナビゲーション装置本体ではこ
れらの文字データに応じた処理が実行される。
The adder 13 is a signal delay device 12a, 12b.
Add the signals output from. The signal output from the adder 13 is sent to the voice recognition processing unit 14. The voice recognition processing unit 14 performs voice processing on the signal input from the signal synthesis unit 13 and converts the signal into character data. Speech recognition processing unit 14
The character data output from the device is sent to the navigation device body (not shown), and the navigation device body executes processing according to the character data.

【0016】座席位置センサ17は、運転席を車両の前
後方向にスライドさせることによる話者(の口元)の位
置変化を検出する。座席位置センサ17は必須ではない
が、音声認識の精度を向上させるためには、座席位置セ
ンサ17で座席の位置を検出したり、キーボード等の入
力装置から話者の身長を入力するようにして、それらの
データから話者の口元の位置をより正確に決めることが
好ましい。
The seat position sensor 17 detects a change in the position of the speaker (or his / her mouth) caused by sliding the driver's seat in the longitudinal direction of the vehicle. Although the seat position sensor 17 is not essential, in order to improve the accuracy of voice recognition, the seat position sensor 17 is used to detect the seat position, or the height of the speaker is input from an input device such as a keyboard. , It is preferable to more accurately determine the position of the speaker's mouth from those data.

【0017】角度センサ18は、例えば図4に示すよう
に、マイクM1 ,M2 が取り付けられたサンバイザー1
9の軸受け部19aに配置され、回転軸19bに対する
サンバイザー19の回転角度を検出する。角度センサ1
8としては、例えば回転角度に応じて抵抗値が変化する
ポテンショメータや、センサ内の液面の位置変化に応じ
てインピーダンスが変化することを利用して回転角度を
検出する液体封入型センサなどを使用することができ
る。
The angle sensor 18 is, for example, as shown in FIG. 4, a sun visor 1 to which microphones M 1 and M 2 are attached.
It is arranged in the bearing portion 19a of 9 and detects the rotation angle of the sun visor 19 with respect to the rotation shaft 19b. Angle sensor 1
As 8, for example, a potentiometer whose resistance value changes according to the rotation angle, or a liquid-filled type sensor that detects the rotation angle by utilizing the impedance change according to the position change of the liquid level in the sensor is used. can do.

【0018】マイク指向性算出部16は、座席位置セン
サ17の出力と、角度センサ18の出力とからマイクM
1 ,M2 に対する話者の口元方向を算出し、更にマイク
1,M2 から出力される話者の音声信号が同相となる
ために必要な遅延時間を算出する。遅延時間制御部15
は、マイク指向性算出部16で算出した遅延時間となる
ように、信号遅延器12a,12bを制御する。
The microphone directivity calculation unit 16 determines the microphone M from the output of the seat position sensor 17 and the output of the angle sensor 18.
1 calculates a mouth direction of the speaker with respect to M 2, further calculates the delay time required for the speaker of the audio signal outputted from the microphone M 1, M 2 are the same phase. Delay time control unit 15
Controls the signal delay units 12a and 12b so that the delay time calculated by the microphone directivity calculation unit 16 is reached.

【0019】以下、本実施の形態の音声認識装置の動作
について説明する。なお、以下の説明では、話者の口元
の位置は一定であるとする。図5は、遅延時間の算出方
法を説明するための模式図である。サンバイザーの回転
軸の位置を原点O(0,0)とし、マイクM1 ,M
2 (マイクアレイ)の取り付け位置をm0 (a0
0 )とし、話者の位置をV(a2 ,b2 )とし、マイ
クアレイに対する話者の口元の方向をθ0 とする。ここ
では、サンバイザーが水平に配置されているものとす
る。従って、a0 =0であり、サンバイザーの回転軸か
らマイクアレイまでの距離はb0 である。
The operation of the speech recognition apparatus of this embodiment will be described below. In the following description, it is assumed that the position of the speaker's mouth is constant. FIG. 5 is a schematic diagram for explaining the method of calculating the delay time. The position of the rotation axis of the sun visor is the origin O (0,0), and the microphones M 1 and M
The mounting position of 2 (microphone array) is m 0 (a 0 ,
b 0 ), the speaker position is V (a 2 , b 2 ), and the direction of the speaker's mouth with respect to the microphone array is θ 0 . Here, it is assumed that the sun visor is arranged horizontally. Therefore, a 0 = 0, and the distance from the rotation axis of the sun visor to the microphone array is b 0 .

【0020】この場合、ベクトルの内積の定義より、下
記(2)式が成り立つ。
In this case, the following equation (2) is established from the definition of the inner product of the vectors.

【0021】[0021]

【数2】 [Equation 2]

【0022】話者の口元の位置V(a2 ,b2 )及びマ
イクアレイの位置m0 (a0 ,b0)は既知であるの
で、(2)式より、マイクアレイに対する話者の方向θ
0 を算出することができる。その後、(1)式に示す関
係から、話者からマイクM1 ,M2 までの距離の差Lを
計算し、話者の方向からの音声を選択的に収音するのに
必要な遅延時間(L/C)を算出する。この遅延時間を
信号遅延部12bに設定することにより、話者の方向か
らの音声を選択的に収音することができる。
Since the position V (a 2 , b 2 ) of the speaker's mouth and the position m 0 (a 0 , b 0 ) of the microphone array are known, the direction of the speaker with respect to the microphone array is expressed by the equation (2). θ
0 can be calculated. After that, the delay time required to calculate the difference L in the distance from the speaker to the microphones M 1 and M 2 from the relationship shown in equation (1) and selectively pick up the voice from the direction of the speaker. Calculate (L / C). By setting this delay time in the signal delay unit 12b, the voice from the direction of the speaker can be selectively picked up.

【0023】図6は、サンバイザーを図5に示す位置か
ら角度θだけ回転した状態を示す。ここで、マイクアレ
イの位置をm1 (a1 ,b1 )とし、マイクアレイに対
する話者の口元の方向をθ1 とすると、ベクトルの内積
の定義より、下記(3)式が成り立つ。
FIG. 6 shows the sun visor rotated from the position shown in FIG. 5 by an angle θ. Here, assuming that the position of the microphone array is m 1 (a 1 , b 1 ) and the direction of the speaker's mouth with respect to the microphone array is θ 1 , the following expression (3) is established from the definition of the inner product of the vector.

【0024】[0024]

【数3】 [Equation 3]

【0025】マイクアレイのX座標a1 はa1 =b0 co
s θ、Y座標b1 はb1 =b0 sinθであり、話者の口
元の位置V(a2 ,b2 )は既知であるので、(3)式
より、マイクアレイに対する話者の方向θ1 を算出する
ことができる。その後、(1)式に示す関係から、話者
からマイクM1 ,M2 までの距離の差Lを計算し、話者
の方向からの音声を選択的に収音するのに必要な遅延時
間を算出する。この遅延時間を信号遅延部12bに設定
することにより、話者の方向からの音声を選択的に収音
することができる。
The X coordinate a 1 of the microphone array is a 1 = b 0 co
Since s θ and the Y coordinate b 1 are b 1 = b 0 sin θ, and the position V (a 2 , b 2 ) of the speaker's mouth is known, the direction of the speaker with respect to the microphone array is calculated from the equation (3). θ 1 can be calculated. After that, the delay time required to calculate the difference L in the distance from the speaker to the microphones M 1 and M 2 from the relationship shown in equation (1) and selectively pick up the voice from the direction of the speaker. To calculate. By setting this delay time in the signal delay unit 12b, the voice from the direction of the speaker can be selectively picked up.

【0026】このように、マイクアレイ(マイクM1
2 )が取り付けられたサンバイザー19の角度に応じ
て信号遅延器12a,12bの遅延時間を調整すれば、
常に話者の方向からの音声を選択的に収音することがで
きる。音声認識処理部14では、加算器13から出力さ
れた音声信号を音声認識処理して文字データに変換し、
ナビゲーション装置本体(図示せず)に出力する。ナビ
ゲーション装置本体では、音声認識処理部14から出力
された文字データを入力し、文字データに応じた処理を
実行する。
In this way, the microphone array (microphone M 1 ,
If the delay times of the signal delay units 12a and 12b are adjusted according to the angle of the sun visor 19 to which M 2 ) is attached,
The voice from the direction of the speaker can always be selectively picked up. In the voice recognition processing unit 14, the voice signal output from the adder 13 is subjected to voice recognition processing and converted into character data,
Output to the navigation device body (not shown). In the main body of the navigation device, the character data output from the voice recognition processing unit 14 is input and a process according to the character data is executed.

【0027】上述したように、本実施の形態の音声認識
装置は、サンバイザー19を動かしても話者の口元方向
からの音声信号を選択的に収音できるので、音声認識処
理部14にはノイズ成分が相対的に少ない信号が入力さ
れる。これにより、音声認識率の低下が防止される。な
お、上記の実施の形態では、マイク指向性算出部16で
サンバイザー19の回転角度θからマイクに対する話者
口元の方向を算出するものとした。しかし、マイク指向
性算出部16に代えて、サンバイザーの回転角度θとマ
イクに対する話者口元の方向との関係を示すテーブル
(表)を記憶させたデータ記憶部を設けてもよい。この
場合、データ記憶部は角度センサ18から角度θが入力
されると、テーブルを用いて角度θに対応したマイクに
対する話者口元の方向を出力する。このマイクに対する
と話者口元位置の方向情報とに基づいて、遅延時間制御
部15は信号遅延器12a,12bの遅延時間を制御す
る。
As described above, the voice recognition device of the present embodiment can selectively pick up the voice signal from the mouth direction of the speaker even if the sun visor 19 is moved. A signal having a relatively small noise component is input. This prevents the voice recognition rate from decreasing. In the above embodiment, the microphone directivity calculation unit 16 calculates the direction of the speaker's mouth with respect to the microphone from the rotation angle θ of the sun visor 19. However, instead of the microphone directivity calculation unit 16, a data storage unit that stores a table showing the relationship between the rotation angle θ of the sun visor and the direction of the speaker's mouth with respect to the microphone may be provided. In this case, when the angle θ is input from the angle sensor 18, the data storage unit outputs the direction of the speaker's mouth to the microphone corresponding to the angle θ using the table. The delay time control unit 15 controls the delay time of the signal delay units 12a and 12b based on the direction information of the speaker mouth position with respect to the microphone.

【0028】上記実施の形態では2個のマイクの出力の
遅延和をとる遅延和アレイを用いた場合について説明し
たが、3個又はそれ以上の遅延和アレイを用いることに
より、話者の方向からの音声をより一層高い精度で強調
することができる。 (第2の実施の形態)図7は本発明の第2の実施の形態
の音声認識装置の構成を示すブロック図である。本実施
の形態では、ノイズ発生源の方向に死角(感度の低い方
向)を形成する減算型アレイを用いることにより、ノイ
ズ発生源の方向が特定できる場合に、話者の方向からの
音声を選択的に収音することができる。本実施の形態
も、本発明を車載用ナビゲーション装置の音声認識装置
に適用した例を示している。
In the above embodiment, the case where the delay sum array for taking the delay sum of the outputs of the two microphones is used has been described, but by using the delay sum array of three or more, the direction of the speaker can be improved. Can be emphasized with even higher accuracy. (Second Embodiment) FIG. 7 is a block diagram showing the configuration of a speech recognition apparatus according to the second embodiment of the present invention. In the present embodiment, by using a subtraction type array that forms a blind spot (direction with low sensitivity) in the direction of the noise source, when the direction of the noise source can be specified, the voice from the direction of the speaker is selected. The sound can be picked up. This embodiment also shows an example in which the present invention is applied to a voice recognition device of a vehicle-mounted navigation device.

【0029】本実施の形態の音声認識装置は、2個の無
指向性マイクM1 ,M2 と、信号遅延器22と、減算器
(信号合成器)23と、音声認識処理部24と、遅延時
間制御部25と、マイク指向性算出部26と、座席位置
センサ27と、角度センサ28とにより構成されてい
る。マイクM1 ,M2 は、第1の実施の形態と同様に、
運転席前方のサンバイザー(図示せず)に相互に離隔し
て取り付けられる。この例では、マイクM1 がマイクM
2 に比べて話者に近い位置に配置される。マイクM1
出力は減算器23に直接入力され、マイクM2 の出力は
信号遅延器22を介して減算器23に入力される。減算
器23は、マイクM1 の出力から信号遅延器22の出力
を減算した信号を出力する。音声認識処理部24は、減
算器23から出力された信号に対し音声認識処理を実施
して、文字データを出力する。この文字データは、ナビ
ゲーション装置本体(図示せず)に送られる。
The speech recognition apparatus of this embodiment has two omnidirectional microphones M 1 and M 2 , a signal delay unit 22, a subtractor (signal synthesizer) 23, a speech recognition processing unit 24, The delay time control unit 25, the microphone directivity calculation unit 26, the seat position sensor 27, and the angle sensor 28 are included. The microphones M 1 and M 2 are similar to those in the first embodiment.
The sun visors (not shown) in front of the driver's seat are mounted separately from each other. In this example, microphone M 1 is microphone M 1.
It is placed closer to the speaker compared to 2 . The output of the microphone M 1 is directly input to the subtractor 23, and the output of the microphone M 2 is input to the subtractor 23 via the signal delay unit 22. The subtractor 23 outputs a signal obtained by subtracting the output of the signal delay unit 22 from the output of the microphone M 1 . The voice recognition processing unit 24 performs voice recognition processing on the signal output from the subtractor 23 and outputs character data. This character data is sent to the navigation device body (not shown).

【0030】座席位置センサ27は、運転席を車両の前
後方向にスライドさせることによる話者(の口元)の位
置変化量を検出する。また、角度センサ28は、マイク
1,M2 が取り付けられたサンバイザーの角度に応じ
た信号を出力する。マイク指向性算出部26は、第1の
実施の形態と同様に、角度センサ28の出力からマイク
1 ,M2 に対するノイズ発生源のある方向を求め、ノ
イズ成分を減衰するために必要な遅延時間を算出する。
遅延時間制御部25は、マイク指向性算出部26で算出
した遅延時間となるように、信号遅延器22を制御す
る。
The seat position sensor 27 detects the amount of change in the position of the speaker (or his / her mouth) when the driver's seat is slid in the longitudinal direction of the vehicle. Further, the angle sensor 28 outputs a signal according to the angle of the sun visor to which the microphones M 1 and M 2 are attached. Similar to the first embodiment, the microphone directivity calculation unit 26 obtains the direction in which the noise source is generated with respect to the microphones M 1 and M 2 from the output of the angle sensor 28, and delays necessary to attenuate the noise component. Calculate time.
The delay time control unit 25 controls the signal delay unit 22 so that the delay time calculated by the microphone directivity calculation unit 26 is reached.

【0031】以下、上述した構成の音声認識装置の動作
について説明する。本実施の形態では、マイクM1 を基
準マイクとし、マイクM2 に接続した信号遅延器22の
遅延時間をノイズ源の方向に応じて設定する。例えば、
エンジンルームの方向からのノイズを除去する場合、マ
イクM1 で検出したエンジンルームの方向からのノイズ
と、マイクM2 で検出したエンジンルームの方向からの
ノイズが同じタイミングで減算器23に入力されるよう
に信号遅延器22の遅延時間を設定する。
The operation of the speech recognition apparatus having the above-mentioned structure will be described below. In the present embodiment, the microphone M 1 is used as the reference microphone, and the delay time of the signal delay device 22 connected to the microphone M 2 is set according to the direction of the noise source. For example,
When removing noise from the direction of the engine room, noise from the direction of the engine room detected by the microphone M 1 and noise from the direction of the engine room detected by the microphone M 2 are input to the subtractor 23 at the same timing. Thus, the delay time of the signal delay unit 22 is set.

【0032】減算器23では、マイクM1 の出力から信
号遅延器22の出力を減算することにより、ノイズ源の
方向からのノイズ成分を抑圧(低減)した音声信号が出
力される。この出力信号は音声認識処理部24に入力さ
れ、音声認識処理される。音声認識処理部24から出力
された文字データはナビゲーション装置本体に入力さ
れ、ナビゲーション装置本体では音声認識処理部24か
ら入力した文字データに応じた処理が実行される。
The subtractor 23 subtracts the output of the signal delay unit 22 from the output of the microphone M 1 to output an audio signal in which the noise component from the direction of the noise source is suppressed (reduced). This output signal is input to the voice recognition processing unit 24 and subjected to voice recognition processing. The character data output from the voice recognition processing unit 24 is input to the navigation device body, and the navigation device body executes processing according to the character data input from the voice recognition processing unit 24.

【0033】一方、角度センサ28は、第1の実施の形
態と同様に、サンバイザーの角度に応じた信号を出力す
る。マイク指向性算出部26は、角度センサ28の出力
を基にマイクM1 ,M2 の変位を求め、マイクM1 ,M
2 に対するノイズ発生源の方向を算出する。遅延時間制
御部25は、マイク指向性算出部26で算出された遅延
時間となるように信号遅延器22を制御する。
On the other hand, the angle sensor 28 outputs a signal corresponding to the angle of the sun visor, as in the first embodiment. The microphone directivity calculation unit 26 obtains the displacements of the microphones M 1 and M 2 based on the output of the angle sensor 28, and determines the microphones M 1 and M.
Calculate the direction of the noise source with respect to 2 . The delay time control unit 25 controls the signal delay unit 22 so that the delay time calculated by the microphone directivity calculation unit 26 is reached.

【0034】本実施の形態では、角度センサ28により
マイクM1 ,M2 が取り付けられたサンバイザーの角度
を検出し、その検出結果に応じて信号遅延器22の遅延
時間を制御するので、サンバイザーを動かしてもノイズ
発声源の方向に常に死角が形成される。これにより、本
実施の形態においても、第1の実施の形態と同様に、音
声認識処理部24における音声認識率の低下が回避され
る。
In this embodiment, the angle sensor 28 detects the angle of the sun visor to which the microphones M 1 and M 2 are attached, and the delay time of the signal delay device 22 is controlled according to the detection result. Even if the visor is moved, a blind spot is always formed in the direction of the noise vocal source. As a result, in the present embodiment as well, a decrease in the voice recognition rate in the voice recognition processing unit 24 is avoided, as in the first embodiment.

【0035】(第3の実施の形態)以下、本発明の第3
の実施の形態の音声認識装置について説明する。本実施
の形態では、Griffith-Jim型アレイを用いて話者の方向
からの音声を選択的に抽出する。本実施の形態も、本発
明を車載用ナビゲーション装置の音声認識装置に適用し
た例を示している。
(Third Embodiment) The third embodiment of the present invention will be described below.
The voice recognition device according to the embodiment will be described. In the present embodiment, a Griffith-Jim type array is used to selectively extract voice from the direction of the speaker. This embodiment also shows an example in which the present invention is applied to a voice recognition device of a vehicle-mounted navigation device.

【0036】図8は本発明の第3の実施の形態の音声認
識装置の構成を示すブロック図である。本実施の形態の
音声認識装置は、4個の無指向性マイクM1 〜M4 と、
4個の信号遅延器D1〜D4と、4個の減算器(信号合
成器)S0〜S3と、3個の適応フィルタW1〜W3
と、2個の加算器(信号合成器)A1,A2と、音声認
識処理部34と、遅延時間制御部35と、マイク指向性
算出部36と、座席位置センサ37と、角度センサ38
とにより構成されている。
FIG. 8 is a block diagram showing the structure of a speech recognition apparatus according to the third embodiment of the present invention. The voice recognition device according to the present embodiment includes four omnidirectional microphones M 1 to M 4 ,
Four signal delay units D1 to D4, four subtractors (signal combiners) S0 to S3, and three adaptive filters W1 to W3
, Two adders (signal synthesizers) A1 and A2, a voice recognition processing unit 34, a delay time control unit 35, a microphone directivity calculation unit 36, a seat position sensor 37, and an angle sensor 38.
It is composed of and.

【0037】マイクM1 〜M4 はいずれも運転席前方の
サンバイザー(図示せず)に、相互に離隔して取り付け
られる。信号遅延器D1〜D4はそれぞれ対応するマイ
クM 1 〜M4 に接続されており、マイクM1 〜M4 から
出力された信号を遅延して出力する。これらの信号遅延
器D1〜D4は、遅延時間制御部35により遅延時間が
個別に制御される。マイクM1 は基準マイクであり、こ
のマイクM1 に接続された信号遅延器D1の出力は、減
算器S1に伝達されるとともに、減算器S0にも伝達さ
れる。
Mike M1~ MFourBoth are in front of the driver's seat
Mounted separately on a sun visor (not shown)
To be The signal delay devices D1 to D4 respectively correspond to
Ku M 1~ MFourIs connected to the microphone M1~ MFourFrom
The output signal is delayed and output. These signal delays
The delay time of the delay time of the units D1 to D4 is controlled by the delay time control unit 35.
Individually controlled. Mike M1Is the reference microphone,
Mike M1The output of the signal delay device D1 connected to
It is transmitted to the calculator S1 and also to the subtractor S0.
Be done.

【0038】減算器S1は、信号遅延器D1の出力から
信号遅延器D2の出力を減算した信号を適応フィルタW
1に出力する。減算器S2は信号遅延器D2の出力から
信号遅延器D3の出力を減算した信号を適応フィルタW
2に出力する。減算器S3は、信号遅延器D3の出力か
ら信号遅延器D4の出力を減算した信号を適応フィルタ
W2に出力する。
The subtractor S1 subtracts the output of the signal delay device D2 from the output of the signal delay device D1 to obtain an adaptive filter W.
Output to 1. The subtracter S2 subtracts the output of the signal delay device D3 from the output of the signal delay device D2, and outputs the signal obtained by the adaptive filter W.
Output to 2. The subtractor S3 outputs a signal obtained by subtracting the output of the signal delay device D4 from the output of the signal delay device D3 to the adaptive filter W2.

【0039】加算器A2は、適応フィルタW2の出力と
適応フィルタW3の出力とを加算した信号を加算器A1
に伝達する。また、加算器A1は適応フィルタW1の出
力と加算器A2の出力とを加算した信号を減算器S0に
伝達する。減算器S0は、信号遅延器D1の出力から加
算器A1の出力を減算した信号を音声認識処理部24に
伝達する。
The adder A2 adds a signal obtained by adding the output of the adaptive filter W2 and the output of the adaptive filter W3 to the adder A1.
Communicate to. Further, the adder A1 transmits the signal obtained by adding the output of the adaptive filter W1 and the output of the adder A2 to the subtractor S0. The subtractor S0 transfers the signal obtained by subtracting the output of the adder A1 from the output of the signal delay unit D1 to the voice recognition processing unit 24.

【0040】適応フィルタW1〜W3は、減算器S0の
出力を誤差とし、誤差のパワーが最小になるように、適
応アルゴリズムによってフィルタ係数を逐次変化させ
る。一方、角度センサ38は、第1の実施の形態と同様
に、マイクM1 〜M4 が取り付けられたサンバイザーの
角度を検出する。マイク指向性算出部36は,角度セン
サ38の出力を基にマイクM1 〜M4 の変位を求め、マ
イクM1 〜M4 に対する話者口元位置の方向を算出す
る。遅延時間制御部35は、マイク指向性算出部36で
算出された遅延時間となるように信号遅延部D1〜D4
を制御する。
The adaptive filters W1 to W3 use the output of the subtractor S0 as an error and sequentially change the filter coefficient by an adaptive algorithm so that the error power is minimized. On the other hand, the angle sensor 38 detects the angle of the sun visor to which the microphones M 1 to M 4 are attached, as in the first embodiment. The microphone directivity calculation unit 36 obtains the displacements of the microphones M 1 to M 4 based on the output of the angle sensor 38, and calculates the direction of the speaker mouth position with respect to the microphones M 1 to M 4 . The delay time control unit 35 sets the signal delay units D1 to D4 so that the delay time calculated by the microphone directivity calculation unit 36 is obtained.
To control.

【0041】以下、本実施の形態の音声認識装置の動作
について説明する。マイクM1 は、話者の音声と周囲の
ノイズとを収音し、音声信号にノイズ成分が重畳した信
号を出力する。また、マイクM2 は、話者の音声と周囲
のノイズとを収音し、音声信号にノイズ成分が重畳した
信号を出力する。従って、信号遅延器D1,D2の遅延
時間を適切に調整すると、減算器S1からは、音声信号
が除去されたノイズ成分のみの信号が出力される。この
ノイズ成分のみの信号が適応フィルタW1に入力され
る。
The operation of the speech recognition apparatus of this embodiment will be described below. The microphone M 1 picks up the speaker's voice and ambient noise, and outputs a signal in which a noise component is superimposed on the voice signal. Further, the microphone M 2 picks up the voice of the speaker and ambient noise and outputs a signal in which a noise component is superimposed on the voice signal. Therefore, when the delay times of the signal delay units D1 and D2 are appropriately adjusted, the subtractor S1 outputs a signal of only the noise component from which the audio signal has been removed. The signal of only this noise component is input to the adaptive filter W1.

【0042】これと同様に、信号遅延器D3,D4の遅
延時間を適切に調整すると、減算器S2,S3からも音
声信号が除去されたノイズ成分のみ信号が出力される。
これらのノイズ成分のみ信号はそれぞれ適応フィルタW
2、W3に入力される。減算器S0は、信号遅延器D1
の出力信号から、適応フィルタW1〜W3の出力を加算
した信号を減算する。初めは減算器S0の出力には音声
信号にノイズ成分が重畳しているが、適応フィルタW1
〜W3は減算器S0の出力が最小となるように働くの
で、十分時間が経過した後には、減算器S0からはノイ
ズ成分が除去された音声信号が出力されるようになる。
Similarly, when the delay times of the signal delay units D3 and D4 are properly adjusted, only the noise component from which the audio signal has been removed is output from the subtracters S2 and S3.
Signals containing only these noise components are adaptive filters W respectively.
2, W3 is input. The subtractor S0 is a signal delay device D1.
The signal obtained by adding the outputs of the adaptive filters W1 to W3 is subtracted from the output signal of. At first, the noise component is superimposed on the audio signal at the output of the subtractor S0, but the adaptive filter W1
Since ~ W3 works so as to minimize the output of the subtractor S0, the audio signal from which the noise component is removed is output from the subtractor S0 after a sufficient time has elapsed.

【0043】音声認識処理部34では、減算器S0から
ノイズ成分が除去された音声信号が入力されるので、音
声認識の認識性能が、ノイズのない環境のそれと比較し
て劣化しない。ところで、減算器S1〜S3の出力に音
声信号を含まないようにするためには、上述の如く、信
号遅延器D1〜D4の遅延時間を適切に制御する必要が
ある。マイクM1 〜M4 が取り付けられたサンバイザー
の角度が変化すると、適切な遅延時間も変化する。従っ
て、マイク指向性算出部36は、角度センサ38で検出
したサンバイザーの角度から各信号遅延器D1〜D4毎
の適切な遅延時間を計算し、その計算結果に応じて遅延
時間制御部35は信号遅延器D1〜D4を制御する。
In the voice recognition processing unit 34, since the voice signal from which the noise component has been removed is input from the subtractor S0, the recognition performance of voice recognition does not deteriorate as compared with that in a noise-free environment. By the way, in order to prevent the outputs of the subtracters S1 to S3 from including the audio signal, it is necessary to appropriately control the delay times of the signal delay units D1 to D4 as described above. When the angle of the sun visor of the microphone M 1 ~M 4 is attached changes, changes also suitable delay. Therefore, the microphone directivity calculation unit 36 calculates an appropriate delay time for each of the signal delay units D1 to D4 from the angle of the sun visor detected by the angle sensor 38, and the delay time control unit 35 calculates the appropriate delay time according to the calculation result. The signal delay devices D1 to D4 are controlled.

【0044】これにより、サンバイザーを動かしても常
に話者の方向からの音声を選択的に収音することがで
き、音声認識処理部34における音声認識率の低下が回
避される。なお、上記第3の実施の形態では、4個のマ
イクM1 〜M4 を用いた場合について説明しているが、
マイクの数を増やすことにより、話者の方向からの音声
をより一層高い精度で抽出することができる。
As a result, even if the sun visor is moved, the voice from the direction of the speaker can always be selectively picked up, and the reduction in the voice recognition rate in the voice recognition processing section 34 can be avoided. In addition, in the third embodiment, the case where the four microphones M 1 to M 4 are used has been described.
By increasing the number of microphones, the voice from the direction of the speaker can be extracted with higher accuracy.

【0045】また、第1〜第3の実施の形態では、いず
れも音声信号抽出手段が信号遅延器及び遅延時間制御部
により構成されている場合について説明したが、これに
より本発明の音声認識装置の音声信号抽出手段が上記構
成に限定されるものではない。例えば音声信号抽出手段
として、各マイクからの出力信号を周波数毎に分割し、
各周波数毎の時間差及びレベル差を算出して話者の方向
からの音声を抽出するようにしてもよい。
In each of the first to third embodiments, the case where the voice signal extraction means is composed of the signal delay unit and the delay time control unit has been described. The audio signal extracting means is not limited to the above configuration. For example, as an audio signal extraction means, the output signal from each microphone is divided for each frequency,
The sound from the direction of the speaker may be extracted by calculating the time difference and the level difference for each frequency.

【0046】更に、第1〜第3の実施の形態では、いず
れも本発明を車載用ナビゲーション装置の音声認識装置
に適用した場合について説明したが、本発明はこれによ
り車載用の音声認識装置に限定されるものではない。本
発明は、マイクと話者との相対位置が変化するような環
境で使用される種々の音声認識装置に適用することがで
きる。
Further, in each of the first to third embodiments, the case where the present invention is applied to the voice recognition device of the vehicle-mounted navigation device has been described, but the present invention is applied to the voice recognition device for the vehicle. It is not limited. INDUSTRIAL APPLICABILITY The present invention can be applied to various voice recognition devices used in an environment where the relative position between a microphone and a speaker changes.

【0047】[0047]

【発明の効果】以上説明したように、本発明によれば、
相互に離隔して配置された複数個のマイクの出力を音声
信号抽出手段で信号処理して、話者の方向からの音声に
よる信号を強調し、又はノイズ成分を減衰させることに
よって,話者の方向からの音声信号を選択的に抽出する
ので、ノイズ環境下での音声認識処理部での音声の認識
性能が、ノイズのない環境のそれと比較して劣化しな
い。また、音声信号抽出手段では、マイク位置変化量検
出手段により検出したマイクの位置の変化に応じた信号
処理を実行するので、マイクの位置が変化しても、音声
認識処理部での音声認識率の低下が回避される。
As described above, according to the present invention,
The output of a plurality of microphones arranged apart from each other is subjected to signal processing by the voice signal extraction means to enhance the signal by the voice from the direction of the speaker or to attenuate the noise component, Since the voice signal from the direction is selectively extracted, the voice recognition performance of the voice recognition processing unit in a noise environment does not deteriorate as compared with that in a noise-free environment. Further, since the voice signal extraction means executes signal processing according to the change in the position of the microphone detected by the microphone position change amount detection means, even if the position of the microphone changes, the voice recognition rate in the voice recognition processing section is increased. Is reduced.

【図面の簡単な説明】[Brief description of drawings]

【図1】図1は本発明の第1の実施の形態の音声認識装
置の原理を示す図(その1)である。
FIG. 1 is a diagram (No. 1) showing the principle of a speech recognition apparatus according to a first embodiment of the present invention.

【図2】図2は本発明の第1の実施の形態の音声認識装
置の原理を示す図(その2)である。
FIG. 2 is a diagram (part 2) showing the principle of the voice recognition device in the first embodiment of the present invention.

【図3】図3は第1の実施の形態の音声認識装置の構成
を示すブロック図である。
FIG. 3 is a block diagram showing a configuration of a voice recognition device according to the first embodiment.

【図4】図4は角度センサの取り付け部の例を示す模式
図である。
FIG. 4 is a schematic diagram showing an example of a mounting portion of an angle sensor.

【図5】図5は遅延時間の算出方法を説明するための模
式図(その1)である。
FIG. 5 is a schematic diagram (No. 1) for explaining a delay time calculation method.

【図6】図6は遅延時間の算出方法を説明するための模
式図(その2)である。
FIG. 6 is a schematic view (No. 2) for explaining a delay time calculation method.

【図7】図7は本発明の第2の実施の形態の音声認識装
置の構成を示すブロック図である。
FIG. 7 is a block diagram showing a configuration of a voice recognition device according to a second embodiment of the present invention.

【図8】図8は本発明の第3の実施の形態の音声認識装
置の構成を示すブロック図である。
FIG. 8 is a block diagram showing a configuration of a voice recognition device according to a third embodiment of the present invention.

【符号の説明】[Explanation of symbols]

12a,12b,22,D1〜D4…信号遅延器、 13,A1,A2…加算器(信号合成器)、 14,24,34…音声認識処理部、 15,25.35…遅延時間制御部、 16,26,36…マイク指向性算出部、 17,27,37…座席位置センサ、 18,28,38…角度センサ、 23,S0〜S3…減算器(信号合成部)、 M1 〜M4 …マイク。12a, 12b, 22, D1 to D4 ... Signal delay device, 13, A1, A2 ... Adder (signal synthesizer), 14, 24, 34 ... Speech recognition processing unit, 15, 25.35 ... Delay time control unit, 16, 26, 36 ... microphone directivity calculation unit, 17, 27, 37 ... seat position sensor, 18,28,38 ... angle sensor, 23, S0 to S3 ... subtractor (signal combining unit), M 1 ~M 4 …Microphone.

フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) G10L 15/20 G10L 3/02 301D 21/02 301E Front page continuation (51) Int.Cl. 7 Identification code FI theme code (reference) G10L 15/20 G10L 3/02 301D 21/02 301E

Claims (8)

【特許請求の範囲】[Claims] 【請求項1】 相互に離隔して配置される複数個のマイ
クと、 前記複数個のマイクの位置変化量を検出するマイク位置
変化量検出手段と、 前記マイク位置変化量検出手段で検出したマイク位置変
化量を入力し、各マイクの位置の差に応じた信号の遅れ
を利用して前記複数個のマイクの出力から話者の方向か
らの音声信号を選択的に抽出する音声信号抽出手段と、 前記音声信号抽出手段により抽出された音声信号に対し
音声認識処理を行う音声認識処理部とを有することを特
徴とする音声認識装置。
1. A plurality of microphones arranged apart from each other, a microphone position change amount detecting means for detecting a position change amount of the plurality of microphones, and a microphone detected by the microphone position change amount detecting means. A voice signal extraction means for inputting a position change amount and selectively extracting a voice signal from the direction of the speaker from the outputs of the plurality of microphones by utilizing the delay of the signal according to the difference in the position of each microphone. A voice recognition processing unit that performs voice recognition processing on the voice signal extracted by the voice signal extraction means.
【請求項2】 前記複数個のマイクは、いずれも無指向
性マイクであることを特徴とする請求項1に記載の音声
認識装置。
2. The voice recognition device according to claim 1, wherein each of the plurality of microphones is an omnidirectional microphone.
【請求項3】 前記音声信号抽出手段は、前記複数個の
マイクの出力を用い、前記話者の方向からの音声を強調
することによって、前記話者の方向からの音声信号を選
択的に抽出することを特徴とする請求項1に記載の音声
認識装置。
3. The voice signal extracting means selectively extracts a voice signal from the direction of the speaker by emphasizing a voice from the direction of the speaker by using outputs of the plurality of microphones. The voice recognition device according to claim 1, wherein
【請求項4】 前記音声信号抽出手段は、前記複数個の
マイクの出力を用い、所定の方向からのノイズ成分を減
衰させることによって、前記話者の方向からの音声信号
を選択的に抽出することを特徴とする請求項1に記載の
音声認識装置。
4. The voice signal extracting means selectively extracts voice signals from the direction of the speaker by using outputs from the plurality of microphones to attenuate noise components from a predetermined direction. The voice recognition device according to claim 1, wherein the voice recognition device is a voice recognition device.
【請求項5】 前記音声信号抽出手段は、 前記複数個のマイクの出力を合成する信号合成器と、 前記複数個のマイクのうちの少なくとも1個と前記信号
合成器との間に接続された信号遅延器と、 前記マイク位置変化量検出手段によるマイク位置変化量
の検出結果に基づいて前記信号遅延器の遅延時間を決め
る遅延時間決定部と、 前記遅延時間決定部で決定した遅延時間に応じて前記信
号遅延器を制御する遅延時間制御部とにより構成されて
いることを特徴とする請求項1に記載の音声認識装置。
5. The audio signal extraction means is connected between a signal synthesizer for synthesizing outputs of the plurality of microphones, and between the signal synthesizer and at least one of the plurality of microphones. A signal delay unit, a delay time determination unit that determines a delay time of the signal delay unit based on a detection result of the microphone position change amount by the microphone position change amount detection unit, and a delay time determined by the delay time determination unit. The speech recognition apparatus according to claim 1, further comprising a delay time control unit that controls the signal delay device.
【請求項6】 前記遅延時間決定部は、前記マイク位置
変化量検出手段の検出結果を基に、前記複数個のマイク
に対する話者の位置する方向を演算により算出して遅延
時間を決定することを特徴とする請求項5に記載の音声
認識装置。
6. The delay time determination unit calculates the direction in which the speaker is located with respect to the plurality of microphones by calculation based on the detection result of the microphone position change amount detection means, and determines the delay time. The voice recognition device according to claim 5, wherein
【請求項7】 前記複数個のマイクのうちの少なくとも
1個は、自動車の運転席前方のサンバイザーに取り付け
られることを特徴とする請求項1に記載の音声認識装
置。
7. The voice recognition device according to claim 1, wherein at least one of the plurality of microphones is attached to a sun visor in front of a driver's seat of an automobile.
【請求項8】 前記マイク位置変化量検出手段は、前記
サンバイザーの角度を検出するセンサであることを特徴
とする請求項7に記載の音声認識装置。
8. The voice recognition device according to claim 7, wherein the microphone position change amount detection means is a sensor that detects an angle of the sun visor.
JP2001236312A 2001-08-03 2001-08-03 Voice recognizing device Withdrawn JP2003044092A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001236312A JP2003044092A (en) 2001-08-03 2001-08-03 Voice recognizing device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001236312A JP2003044092A (en) 2001-08-03 2001-08-03 Voice recognizing device

Publications (1)

Publication Number Publication Date
JP2003044092A true JP2003044092A (en) 2003-02-14

Family

ID=19067603

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001236312A Withdrawn JP2003044092A (en) 2001-08-03 2001-08-03 Voice recognizing device

Country Status (1)

Country Link
JP (1) JP2003044092A (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150010186A1 (en) * 2013-07-03 2015-01-08 Gn Netcom A/S Car Speakerphone With Automatic Adjustment Of Microphone Directivity
EP3051838A1 (en) * 2015-01-30 2016-08-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. In-car loudspeaker array positioning
CN112075088A (en) * 2018-05-18 2020-12-11 索尼公司 Signal processing device, signal processing method, and program
JP7374783B2 (en) 2020-01-23 2023-11-07 Sanei株式会社 voice recognition faucet

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150010186A1 (en) * 2013-07-03 2015-01-08 Gn Netcom A/S Car Speakerphone With Automatic Adjustment Of Microphone Directivity
EP3051838A1 (en) * 2015-01-30 2016-08-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. In-car loudspeaker array positioning
WO2016120451A1 (en) * 2015-01-30 2016-08-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. In-car loudspeaker array positioning
CN112075088A (en) * 2018-05-18 2020-12-11 索尼公司 Signal processing device, signal processing method, and program
CN112075088B (en) * 2018-05-18 2022-06-28 索尼公司 Signal processing apparatus, signal processing method, and computer readable medium
US11386904B2 (en) 2018-05-18 2022-07-12 Sony Corporation Signal processing device, signal processing method, and program
JP7374783B2 (en) 2020-01-23 2023-11-07 Sanei株式会社 voice recognition faucet

Similar Documents

Publication Publication Date Title
JP4225430B2 (en) Sound source separation device, voice recognition device, mobile phone, sound source separation method, and program
US8370140B2 (en) Method of filtering non-steady lateral noise for a multi-microphone audio device, in particular a “hands-free” telephone device for a motor vehicle
US7613310B2 (en) Audio input system
US9002027B2 (en) Space-time noise reduction system for use in a vehicle and method of forming same
US8195246B2 (en) Optimized method of filtering non-steady noise picked up by a multi-microphone audio device, in particular a “hands-free” telephone device for a motor vehicle
JPWO2004034734A1 (en) Array device and mobile terminal
JP6635394B1 (en) Audio processing device and audio processing method
JP2001509659A (en) Method and apparatus for measuring signal level and delay with multiple sensors
JP2012025270A (en) Apparatus for controlling sound volume for vehicle, and program for the same
KR20140030686A (en) System for improving voice recognition of the array microphone for vehicle and method thereof
JP2007180896A (en) Voice signal processor and voice signal processing method
JP3435686B2 (en) Sound pickup device
JP2000312395A (en) Microphone system
JP2003174699A (en) Voice input and output device
JP3434215B2 (en) Sound pickup device, speech recognition device, these methods, and program recording medium
JP2003044092A (en) Voice recognizing device
JP3257832B2 (en) Noise reduction circuit for speech recognition device
US20220189450A1 (en) Audio processing system and audio processing device
JP3424761B2 (en) Sound source signal estimation apparatus and method
JP2005354223A (en) Sound source information processing apparatus, sound source information processing method, and sound source information processing program
JP2000322074A (en) Voice input section determination device, aural data extraction device, speech recognition device, vehicle navigation device and input microphone
JP2008070877A (en) Voice signal pre-processing device, voice signal processing device, voice signal pre-processing method and program for voice signal pre-processing
JP3919337B2 (en) Voice recognition device for vehicle
JPH1155784A (en) Method and system for in-hall loudspeaking
JP2965301B2 (en) Sound collector

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20081007