JP2001042888A - Method of setting microphone, method for processing sound signal, and devices for inputting, recording and processing sound signal, using these methods and voice recognition processing device and recording medium recording program for processing sound signal - Google Patents

Method of setting microphone, method for processing sound signal, and devices for inputting, recording and processing sound signal, using these methods and voice recognition processing device and recording medium recording program for processing sound signal

Info

Publication number
JP2001042888A
JP2001042888A JP11215812A JP21581299A JP2001042888A JP 2001042888 A JP2001042888 A JP 2001042888A JP 11215812 A JP11215812 A JP 11215812A JP 21581299 A JP21581299 A JP 21581299A JP 2001042888 A JP2001042888 A JP 2001042888A
Authority
JP
Japan
Prior art keywords
microphone
sampling
sound
sphere
sound source
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP11215812A
Other languages
Japanese (ja)
Inventor
Hiroyuki Mori
弘之 森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Omron Corp
Original Assignee
Omron Corp
Omron Tateisi Electronics Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Omron Corp, Omron Tateisi Electronics Co filed Critical Omron Corp
Priority to JP11215812A priority Critical patent/JP2001042888A/en
Publication of JP2001042888A publication Critical patent/JP2001042888A/en
Pending legal-status Critical Current

Links

Landscapes

  • Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

PROBLEM TO BE SOLVED: To reduce the operation quantity for arranging phases of sound signals. SOLUTION: Concentric spheres whose respective radii change by λwhich is a moving distance of sound during a sampling period T by making a sound source S as the center are virtually set. Respective microphones M0, M1, M2 and M3 are mounted on the basis of peripheral surfaces of the spheres C0, C1, C2 and C3 selected from among the concentric spheres. The output signal of every microphone Mn is sampled with a fixed sampling period, thereafter, is delayed by the sampling number (n) corresponding to the difference n λof sphere radius between the sphere Cn which is the setting reference of the respective microphones and the sphere C0 which is the setting reference of the microphone M0 which is the most remote from the sound source S. Further, by summing the delayed sampling values and the sampling values at the present time of the microphone M0, the sound signal from the sound source S is extracted.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【産業上の利用分野】この発明は、複数個のマイクロホ
ンを用いて所定の空間位置より発生した音を抽出するた
めの技術分野に属するもので、特に、各マイクロホンの
設置、および設置されたマイクロホンからの音信号を処
理するための技術に関連する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a technical field for extracting a sound generated from a predetermined spatial position by using a plurality of microphones, and more particularly, to the installation of each microphone and the installed microphone. Related to techniques for processing sound signals from a computer.

【0002】[0002]

【従来の技術】特定の話者の発声による音信号をコンピ
ュータに取り込んで所定の認識処理を行ったり、その音
信号をディジタル化して記録するには、収集された音信
号から周囲環境の雑音にかかる信号を除去する必要があ
る。従来、この種の目的のために、複数個のマイクロホ
ンを一列に並べた「マイクロホンアレイ」により、話者
のいる方向からの音声を同相化して強調する一方、他の
方向からの雑音を打ち消し合って低減させることが提案
されている。
2. Description of the Related Art To take a sound signal generated by a specific speaker into a computer and perform a predetermined recognition process or to digitize and record the sound signal, the collected sound signal is converted into noise in the surrounding environment. It is necessary to remove such a signal. Conventionally, for this kind of purpose, a microphone array in which a plurality of microphones are arranged in a row, in-phase and emphasizes speech from the direction where the speaker is, while canceling out noise from other directions. It has been proposed to reduce it.

【0003】従来のマイクロホンアレイを用いた音信号
処理では、音源から所定の時刻に発せられた音声が各マ
イクロホンに到達する時刻のずれを補正するために、遅
延フィルタを用いた畳み込み演算処理を行った後、各サ
ンプリングの総和を算出して、音源からの位相の揃った
音信号が強められた信号を生成するようにしている。
In conventional sound signal processing using a microphone array, a convolution operation using a delay filter is performed in order to correct a time difference when sound emitted from a sound source at a predetermined time reaches each microphone. After that, the sum of each sampling is calculated to generate a signal in which the sound signal of the same phase from the sound source is strengthened.

【0004】図23は、上記マイクロホンアレイによる
音信号処理をハードウエアにより行う場合の概略構成を
示す。各マイクロホンMn(図中、n=0〜3)は、話
者の口の位置として仮想的に設定された音源(図示せ
ず)に対し、所定距離を隔てた直線上に等間隔をおいて
設置される。各マイクロホンMn毎に、マイクロホンア
ンプ50(以下単に「アンプ50」という),A/Dコ
ンバータ51が配備されるほか、音信号記憶部52,フ
ィルタ係数記憶部53,畳み込み演算器54などが設定
される。
FIG. 23 shows a schematic configuration in a case where sound signal processing by the microphone array is performed by hardware. Each microphone M n (n = 0 to 3 in the figure) is equally spaced on a straight line separated by a predetermined distance from a sound source (not shown) virtually set as the position of the speaker's mouth. And installed. For each microphone Mn , a microphone amplifier 50 (hereinafter simply referred to as “amplifier 50”), an A / D converter 51, and a sound signal storage unit 52, a filter coefficient storage unit 53, a convolution arithmetic unit 54, and the like are set. Is done.

【0005】各マイクロホンMnより出力される音信号
は、アンプ50により増幅された後に、A/Dコンバー
タ51により所定のサンプリング周期でサンプリングさ
れる。前記音信号記憶部52,フィルタ係数記憶部53
は、いずれもNT個(NT>0)分のデータ容量を有す
るもので、音信号記憶部52には、現時点を含むNT回
分のサンプリング値が、フィルタ係数記憶部53には、
各サンプリング値に対応するNT次のフィルタ係数が、
それぞれ格納されている。各畳み込み演算器54は、前
記サンプリング周期に合わせて、その時点で音信号記憶
部に保持されている各サンプリング値と前記フィルタ係
数との乗算値の総和を算出し、その算出値Rnを他のマ
イクロホンのサンプリング値との位相のずれが補正され
た補正データとして出力する。さらに各マイクロホン毎
の補正データRnは加算器に入力されて平均化され、認
識処理用のディジタル量の音信号O(t)として出力さ
れる。
The sound signal output from each microphone M n is amplified by an amplifier 50 and then sampled by an A / D converter 51 at a predetermined sampling cycle. The sound signal storage unit 52 and the filter coefficient storage unit 53
Have a data capacity of NT (NT> 0), the sound signal storage unit 52 stores NT sampled values including the current time, and the filter coefficient storage unit 53 stores
The NT-order filter coefficient corresponding to each sampling value is
Each is stored. Each convolution calculator 54 calculates the sum of the multiplication value of each sampling value held in the sound signal storage unit and the filter coefficient at that time in accordance with the sampling period, and calculates the calculated value R n as another value. Is output as correction data in which the phase shift from the sampling value of the microphone is corrected. Further correction data R n for each microphone is averaged is input to the adder, and output as a sound signal O of the digital quantity for recognition processing (t).

【0006】上記した畳み込み演算処理は、実際には、
コンピュータ内において、各マイクロホンMn毎に過去
NT回分のサンプリングデータに対し、つぎの(1)式
を実行することにより得られるものである。なお(1)
式において、D(t)はt回目のサンプリングにより得
られたサンプリング値である。またH(k)は、現時点
よりk回前のサンプリング値に対応する遅延フィルタで
あって、サンプリング周期をT,遅延時間をDTとおく
と、(2)式により算出される。
The above-described convolution operation is actually performed by
This is obtained by executing the following equation (1) on the past NT sampling data for each microphone Mn in the computer. (1)
In the equation, D (t) is a sampling value obtained by the t-th sampling. H (k) is a delay filter corresponding to the sampling value k times before the current time, and is calculated by Expression (2), where T is the sampling period and DT is the delay time.

【0007】[0007]

【数1】 (Equation 1)

【0008】[0008]

【数2】 (Equation 2)

【0009】図24(1)は、前記図23の処理をコン
ピュータにより実行する場合の処理の流れを示す。なお
図中、nは処理対象のマイクロホンを特定するためのカ
ウンタを、tはサンプリング回数を係数するためのカウ
ンタを、Nはマイクロホンの設置数を、それぞれ示す。
またMAXは、所定期間(たとえば1秒間)内に実行さ
れるサンプリング回数に相当し、O(t)はt回目のサ
ンプリング時に出力される信号(以下このO(t)を出
力信号O(t)という)にあたる。
FIG. 24A shows a flow of processing when the processing of FIG. 23 is executed by a computer. In the drawing, n indicates a counter for specifying the microphone to be processed, t indicates a counter for counting the number of times of sampling, and N indicates the number of microphones installed.
MAX is equivalent to the number of times of sampling performed within a predetermined period (for example, one second), and O (t) is a signal output at the time of the t-th sampling (hereinafter O (t) is output signal O (t) ).

【0010】制御部は、処理に先立ち、各マイクロホン
毎に、その設置位置などに基づき、所定方向からの音信
号が各マイクロホンに到達する時刻のずれを算出し、そ
のずれ量DTやサンプリング周期T(T=1sec/MA
X)を(2)式にあてはめて遅延フィルタH(k)を算
出する(ST2)。この後、制御部は、ST2〜4で各
カウンタや出力信号O(t)をゼロリセットした後、S
T5〜8のループにおいて、各マイクロホンにつき、前
記畳み込み演算により補正データRnを算出しつつ、算
出された各補正データRnの加算演算を繰り返して、O
(t)の値を更新してゆく。
Prior to the processing, the control unit calculates a time difference at which a sound signal from a predetermined direction reaches each microphone based on the installation position of each microphone, and calculates a shift amount DT and a sampling period T. (T = 1sec / MA
X) is applied to equation (2) to calculate a delay filter H (k) (ST2). Thereafter, the control unit resets each counter and the output signal O (t) to zero in ST2 to ST4,
In the loop of T5~8, for each microphone, while calculating correction data R n by the convolution operation, by repeating the calculated addition operations of the correction data R n, O
The value of (t) is updated.

【0011】特にST5では、図24(2)のST5−
1〜ST−9の手順を実行することにより、現時点から
過去NT回分のサンプリング値D(p)(t≧p≧t−
NT+1)を順次メモリより読み出すとともに、各サン
プリング値D(p)をk番目のフィルタ係数H(k)
(0≦k≦N−1)と掛け合わせ、その乗算値を順次加
算することにより、補正データRnを算出する。
In particular, in ST5, ST5- in FIG.
By executing the procedures of 1 to ST-9, the sampling values D (p) (t ≧ p ≧ t−
NT + 1) are sequentially read from the memory, and each sampling value D (p) is converted to a k-th filter coefficient H (k).
(0 ≦ k ≦ N−1), and the multiplied values are sequentially added to calculate the correction data R n .

【0012】ST5〜8のループが終了すると、制御部
は、各補正データRnの総和として表されていたO
(t)をマイクの設置数Mで割って平均化し、t回目の
サンプリング時の出力信号として出力する。以下同様に
して、音信号をサンプリングする毎に、それぞれ、各マ
イクロホン毎のサンプリング値を図24(2)のアルゴ
リズムにより補正した後、各補正データRnが平均化さ
れた信号を出力信号O(t)として外部に出力する。
[0012] ST5~8 loop is completed, control unit has been represented as a sum of the correction data R n O
(T) is divided by the number M of microphones, averaged, and output as an output signal at the time of the t-th sampling. In the same way, each time samples the sound signal, respectively, after correcting by the algorithm of FIG. 24 (2) the sampling values of each microphone, the correction data R n is averaged signal an output signal O ( Output to the outside as t).

【0013】[0013]

【発明が解決しようとする課題】上記した制御によれ
ば、N個のマイクロホンについて、それぞれNT回の乗
算処理のほか、ST5−6での補正データRnの更新処
理およびST5−7,5−8でのカウンタp,kのイン
クリメント処理が行われることになるから、図5(2)
のアルゴリズムを1度実行するだけで、計4*NT回の
演算が実行されることになる。このほか、N個のマイク
ロホンについて、それぞれ図5(1)のST6,7の加
算処理が行われる。したがってST9での除算処理やS
T10でのカウンタtのインクリメント処理も含める
と、1サンプリング期間内に[N*(4*NT+2)+
2]回の演算が実行されることになる。
According to the control described above [0008], for N microphones, other respective NT multiplication processing, update processing and the correction data R n in ST5-6 ST5-7,5- Since the increment processing of the counters p and k at step 8 is performed, FIG.
By executing the above algorithm only once, a total of 4 * NT calculations are performed. In addition, addition processing of ST6 and ST7 in FIG. 5A is performed for each of the N microphones. Therefore, the division processing in ST9 and S
Including the increment processing of the counter t at T10, [N * (4 * NT + 2) +
2] calculations are executed.

【0014】各マイクロホンからの音信号により音声認
識処理に必要なディジタルデータを生成するには、各音
信号を音波の数倍の周波数によりサンプリングするとと
もに、10数個のマイクロホンにつきそれぞれタップ数
NTが100程度に設定された畳み込み演算を行う必要
がある。しかしながらこのような設定による演算を行う
場合、1秒間の演算量は数億回を越えるから、パーソナ
ルコンピュータなどに組み込まれる汎用のCPUによる
処理では、到底、実現できない。
In order to generate digital data necessary for voice recognition processing from sound signals from the microphones, each sound signal is sampled at a frequency several times that of a sound wave, and the number of taps NT is set to each of ten or more microphones. It is necessary to perform a convolution operation set to about 100. However, when performing calculations with such settings, the amount of calculation per second exceeds hundreds of millions of times, so that it cannot be realized at all by processing using a general-purpose CPU incorporated in a personal computer or the like.

【0015】したがってこの演算処理を行うには、複数
個のCPUを並列させて動かしたり、DSPを用いた処
理を行う必要があるが、今度は、装置構成が大型化した
り、コスト高になるといった問題が発生する。特に近年
では、音声認識処理の技術レベルが、パーソナルコンピ
ュータへのデータ入力や、自動販売機の操作などの処理
を実現可能なレベルに近づいているので、これらの技術
を実用化するためにも、入力用の音信号を低コストかつ
短時間で生成できるようにする必要がある。
Therefore, in order to perform this arithmetic processing, it is necessary to operate a plurality of CPUs in parallel or to perform processing using a DSP, but this time, the apparatus configuration becomes large and the cost increases. Problems arise. In particular, in recent years, the technical level of voice recognition processing is approaching a level at which processing such as data input to a personal computer and operation of a vending machine can be realized. It is necessary to be able to generate a sound signal for input at low cost and in a short time.

【0016】この発明は上記問題点に着目してなされた
もので、各マイクロホンからの音信号の位相を揃えるた
めの演算量を大幅に減らして、ハードウエアによる処理
を行う場合は構成を簡易化し、ソフトウエアによる処理
を行う場合は、汎用のCPUでも十分に対応できるよう
にすることを目的とする。
The present invention has been made in view of the above problems, and the amount of calculation for aligning the phases of the sound signals from the microphones is greatly reduced, and the configuration is simplified when processing by hardware is performed. It is another object of the present invention to enable a general-purpose CPU to sufficiently perform processing by software.

【0017】さらにこの発明は、音信号の位相を揃える
ための演算量を大幅に減らすとともに、各マイクロホン
を直線に沿わせて設置したり、機器の前面などの設置面
上に設置することを可能とすることにより、音声入力に
かかる構成を簡単にして、実用的な装置を提供すること
を、第2の目的とする。
Further, according to the present invention, it is possible to greatly reduce the amount of calculation for aligning the phases of sound signals, and to install each microphone along a straight line or on an installation surface such as a front surface of a device. Accordingly, it is a second object to provide a practical device by simplifying the configuration relating to voice input.

【0018】加えてこの発明では、音源に対するマイク
ロホンの設置位置が不正確であっても、サンプリング周
波数の調整により、そのマイクロホンにより取り込まれ
る音信号の位相のずれを許容値の範囲に留めて、信号処
理を安定化することを、第3の目的とする。
[0018] In addition, according to the present invention, even if the installation position of the microphone with respect to the sound source is inaccurate, by adjusting the sampling frequency, the phase shift of the sound signal captured by the microphone is kept within an allowable value range. A third object is to stabilize the processing.

【0019】[0019]

【課題を解決するための手段】いま音を遮る物体が何も
ない空間において、所定の空間位置で音が発生したもの
と仮定すると、その音は、音源から周囲の各方向に向か
ってそれぞれ同一の速度で進行することになる。したが
って音が発生してから所定の時間が経過した時点での音
の到達位置は、前記音源を中心として前記経過時間内に
音が進む距離を半径とする球の周面により表される。同
様にして、前記音源からの音の到達位置を所定の周期T
毎に抽出していくと、毎時の音の到達位置は、前記音源
を中心として、周期Tの間に音が進む距離λずつ半径が
大きくなるような同心球の各周面により表されることに
なる。言い換えれば、ある時刻に音源より発せられた音
は、前記同心球の各周面に、周期Tずつ遅れて到達する
ことになる。
Assuming that a sound is generated at a predetermined spatial position in a space where there is no object blocking the sound, the sound is the same from the sound source toward the surrounding directions. It will progress at the speed of. Therefore, the arrival position of the sound at a point in time when a predetermined time has elapsed since the sound was generated is represented by a peripheral surface of a sphere whose radius is the distance from the sound source to which the sound travels within the elapsed time. Similarly, the arrival position of the sound from the sound source is determined by a predetermined period T
When the sound is extracted every time, the arrival position of the sound every hour is represented by each peripheral surface of a concentric sphere whose radius increases by the distance λ where the sound travels during the period T around the sound source. become. In other words, the sound emitted from the sound source at a certain time arrives at each peripheral surface of the concentric sphere with a delay of the period T.

【0020】図1は、上記原理を応用してマイクロホン
を設置した例であって、所定の空間位置に仮想的に設定
された音源Sに対し、この音源Sを中心として半径が前
記距離λずつ変化する4個の同心球C0〜C3を仮想的に
設定し、これらの球の周面、具体的には各球を通過する
直線と球との交差位置に、それぞれマイクロホンM0
3を設置してある。図示例において、同心球のうちの
最も大きな球C0を基準にして、前記音源Sからの音が
この球C0の周面に時刻tに到達したものとすると、内
側の各球C1〜C3の周面に対しては、それぞれ前記周期
Tずつ早い時刻に同じ音が到達していることになる。
FIG. 1 shows an example in which a microphone is installed by applying the above principle. For a sound source S virtually set at a predetermined spatial position, a radius around the sound source S is set to the distance λ. Four changing concentric spheres C 0 to C 3 are virtually set, and the microphones M 0 to M 0 are respectively set on the peripheral surface of these spheres, specifically, at the intersection of a straight line passing through each sphere and the sphere.
It is established the M 3. In the illustrated example, the largest sphere C 0 of concentric spheres on the basis, said the sound from the sound source S is assumed to have reached the time t on the peripheral surface of the sphere C 0, each sphere C 1 ~ inside against the peripheral surface of the C 3, the same sound at an earlier time by the period T respectively it will have been reached.

【0021】すなわち前記基準の球C0と内側の各球C1
〜C3との半径の差をnλ(n=1,2,3)とおく
と、各球C1〜C3の周面には、(t−nT)の時点に前
記音源Sからの音が到達していることになる。したがっ
て前記音源Sから各球C1〜C3の周面に到達した音を、
それぞれnT時間だけ遅延させることにより、各球C1
〜C3の周面に到達した音信号と基準の球C0の周面に到
達した音信号との位相を揃えて取り出すことが可能とな
る。
That is, the reference sphere C 0 and each inner sphere C 1
When the difference in radius between the -C 3 put a nλ (n = 1,2,3), on the peripheral surface of each sphere C 1 -C 3, sound from the sound source S to a point in time (t-nT) Has been reached. Therefore, the sound arriving at the peripheral surface of each ball C 1 to C 3 from the sound source S is
By delaying each nT time, each ball C 1
It becomes possible to take out align the phase of a sound signal that has reached the peripheral surface of the sound signal and the reference sphere C 0 that has reached the peripheral surface of -C 3.

【0022】これに対し、前記音源S以外の空間位置で
音が発生した場合、この音の発生位置と同心球C0〜C3
との間には、前記したような周期Tによる規則的な関係
は存在しないから、各球C0〜C3の周面に到達した音を
nT時間だけ遅延させても、音信号の位相は揃わない。
On the other hand, when a sound is generated at a spatial position other than the sound source S, the position at which the sound is generated and the concentric spheres C 0 to C 3 are set.
Does not have a regular relationship with the period T as described above, so even if the sound arriving at the peripheral surface of each of the spheres C 0 to C 3 is delayed by nT time, the phase of the sound signal is Not aligned.

【0023】よって各球C0〜C3の周面上に配置された
マイクロホンM0〜M3からの出力信号を前記周期Tによ
りサンプリングしつつ、それぞれそのサンプリング値
を、前記マイクロホンM0〜M3の設置基準となる球との
半径の差nλに応じたサンプリング回数n分だけ遅延さ
せ(ただしマイクロホンM0についての遅延量はゼロと
なる)、各マイクロホンについての遅延させたサンプリ
ング値の総和をとると、前記音源Sより同じ時刻に発せ
られた音が強調される一方、他の位置から発せられた音
は打ち消されるようになり、音源からの音を精度よく抽
出することが可能となる。
[0023] Thus, while the output signal from the microphone M 0 ~M 3 disposed on the peripheral surface of each sphere C 0 -C 3 sampled by the period T, the sampled value respectively, the microphone M 0 ~M The delay is delayed by the number of samplings n according to the difference nλ between the radius of the sphere and the reference criterion of 3 (however, the delay amount for the microphone M 0 is zero), and the sum of the delayed sampling values for each microphone is calculated. Then, while the sound emitted from the sound source S at the same time is emphasized, the sound emitted from another position is canceled, and the sound from the sound source can be accurately extracted.

【0024】請求項1の発明は、上記の原理に基づきな
されたもので、音源を中心としてそれぞれの球径が一定
のサンプリング周期に相当する音の進行距離だけ順次変
わるような同心球を仮想的に設定した後、前記同心球の
うちの選ばれた複数の球の周面を位置決めの基準として
各マイクロホンを設置することを特徴とする。この場
合、各マイクロホンは、図1に示すように、半径がλず
つ変わる複数個の球の周面毎に設置されるだけでなく、
同心球の中から任意の球を選択して、これら球の周面ま
たはその周面の近傍位置に設置されることになる。
The invention of claim 1 is based on the above-mentioned principle, and concentric spheres whose diameters change sequentially by a sound traveling distance corresponding to a fixed sampling period around a sound source are virtually assumed. After the setting, the microphones are set using the peripheral surfaces of a plurality of spheres selected from the concentric spheres as positioning criteria. In this case, as shown in FIG. 1, each microphone is installed not only on each of the peripheral surfaces of a plurality of spheres whose radius changes by λ,
An arbitrary sphere is selected from the concentric spheres, and is set on the peripheral surface of these spheres or at a position near the peripheral surface.

【0025】請求項2の発明では、図1に示すように、
音源から所定距離だけ離れた位置に各球と交差する直線
と各球の周面とが交差する位置を基準として、各マイク
ロホンが設置される。また請求項3の発明では、直線に
代えてマイクロホンの設置面を仮想設定し、この設置面
と各球の周面とが交差する位置を基準として、マイクロ
ホンが設置される。なお請求項3における「設置面」と
は、平坦な面に限らず、曲面であってもよい。また設置
面は、目的とする音源に対向していることが望ましい
が、必ずしもこれに限定されるものではない。
According to the second aspect of the present invention, as shown in FIG.
Each microphone is installed at a position separated by a predetermined distance from the sound source with reference to a position at which a straight line intersecting each ball and the peripheral surface of each ball intersects. According to the third aspect of the present invention, a microphone installation surface is virtually set instead of a straight line, and the microphone is installed with reference to a position where the installation surface intersects with the peripheral surface of each ball. The “installation surface” in claim 3 is not limited to a flat surface but may be a curved surface. The installation surface is desirably opposed to the target sound source, but is not necessarily limited to this.

【0026】請求項4の発明は、所定の空間位置の音源
に向けて設置された複数個のマイクロホンからの音声出
力信号を取り込んで処理する方法であって、前記音源を
中心としてそれぞれの球径が一定のサンプリング周期に
相当する音の進行距離だけ順次変わるような同心球を仮
想的に設定した後、各マイクロホンを、それぞれその設
置位置に基づき、前記同心球のうちの選ばれた複数の球
の周面に対応づけておき、各マイクロホンの出力信号を
前記サンプリング周期によりサンプリングするととも
に、マイクロホン毎のサンプリング値を、それぞれその
マイクロホンに対応する球と前記音源から最も遠いマイ
クロホンに対応する球との球径の差に基づくサンプリン
グ数分だけ順次遅延させて加算するようにしている。
According to a fourth aspect of the present invention, there is provided a method for receiving and processing audio output signals from a plurality of microphones installed toward a sound source at a predetermined spatial position, wherein each of the sphere diameters is centered on the sound source. After virtually setting concentric spheres that sequentially change by a traveling distance of a sound corresponding to a fixed sampling period, each microphone is set to a plurality of spheres selected from the concentric spheres based on their installation positions. And the output signal of each microphone is sampled at the sampling period, and the sampling value of each microphone is compared with the sphere corresponding to the microphone and the sphere corresponding to the microphone farthest from the sound source. The addition is performed by sequentially delaying by the number of samplings based on the difference between the ball diameters.

【0027】さらに請求項5の発明では、マイクロホン
が取り込む音源からの音信号と、そのマイクロホンに対
応づけられた球の周面上で取り込まれる音信号との間に
位相差が生じた場合に対応するために、そのマイクロホ
ンを所定の球の周面に対応づけたときに、前記の位相の
ずれが所定の誤差内に入るようなサンプリング周期を設
定して、そのサンプリング周期により各マイクロホンの
出力信号のサンプリングおよび同心球への対応づけを行
うようにしている。
Further, according to the fifth aspect of the present invention, it is possible to cope with a case where a phase difference occurs between a sound signal from a sound source taken by a microphone and a sound signal taken on a peripheral surface of a sphere associated with the microphone. Therefore, when the microphone is associated with the peripheral surface of a predetermined sphere, a sampling period is set such that the phase shift falls within a predetermined error, and the output signal of each microphone is set according to the sampling period. Sampling and mapping to concentric spheres.

【0028】請求項6の発明は、所定の空間位置に仮想
設定された音源からの音を複数箇所で集めるための複数
個のマイクロホンを備えた音信号入力装置であって、各
マイクロホンは、音源の仮想位置に対して請求項1の方
法を用いて設置される。
According to a sixth aspect of the present invention, there is provided a sound signal input device including a plurality of microphones for collecting sounds from a sound source virtually set at a predetermined spatial position at a plurality of locations, wherein each microphone is a sound source. Are installed using the method of claim 1 for the virtual position.

【0029】請求項7の発明は、請求項6と同様の構成
による複数個のマイクロホンと、各マイクロホンの出力
信号から入力用の信号を生成して出力する信号処理装置
とを備えた音声入力装置である。前記信号処理装置は、
各マイクロホンの出力信号を各マイクロホンの設置基準
となる同心球を設定した際のサンプリング周期によりサ
ンプリングするサンプリング手段と、マイクロホン毎の
出力信号のサンプリング値を、それぞれそのマイクロホ
ンの設置基準となる球と前記仮想音源より最も遠い位置
のマイクロホンの設置基準となる球との球径の差に基づ
くサンプリング回数分だけ記憶するためのメモリと、各
サンプリングの時点で、前記メモリよりマイクロホン毎
の最も古いサンプリング値を読み出して、これらのサン
プリング値と、前記仮想音源より最も遠い位置のマイク
ロホンについての現時点でのサンプリング値との総和を
算出する演算手段と、前記演算手段により得られたサン
プリング値の総和を示すディジタル信号を外部に出力す
る出力手段とを具備する。
According to a seventh aspect of the present invention, there is provided an audio input device comprising a plurality of microphones having the same configuration as in the sixth aspect, and a signal processing device for generating and outputting an input signal from an output signal of each microphone. It is. The signal processing device,
Sampling means for sampling the output signal of each microphone at a sampling cycle when a concentric sphere as a reference for setting each microphone is set, and a sampling value of an output signal for each microphone, and a sphere serving as a reference for setting the microphone, and A memory for storing the number of times of sampling based on the difference between the diameter of the microphone and the sphere serving as the installation reference of the microphone located farthest from the virtual sound source, and at the time of each sampling, the oldest sampling value for each microphone from the memory. Reading means for calculating the sum of these sampling values and the current sampling value of the microphone located farthest from the virtual sound source; and a digital signal indicating the sum of the sampling values obtained by the calculating means. Output means for outputting the To.

【0030】一方、請求項8の発明にかかる音声入力装
置は、各マイクロホンを請求項7と同様に設置するとと
もに、信号処理装置にも、請求項7と同様のサンプリン
グ手段、メモリ、演算手段を具備させる。さらにこの信
号処理装置には、演算手段により得られたサンプリング
値の総和をアナログ変換して外部に出力する出力手段が
設けられている。
On the other hand, in the voice input device according to the invention of claim 8, each microphone is installed in the same manner as in claim 7, and the signal processing device also includes the same sampling means, memory, and arithmetic means as in claim 7. To equip it. Further, the signal processing device is provided with output means for converting the sum of the sampling values obtained by the arithmetic means into an analog signal and outputting the converted signal to the outside.

【0031】請求項9の発明は、請求項6〜8と同様の
構成による複数個のマイクロホンと、各マイクロホンの
出力信号を取り込んで記録用の音信号を生成する信号処
理装置と、この記録用の音信号をメモリまたは所定の記
録媒体に記憶させる記憶処理装置とを備えた音声入力装
置である。信号処理装置は、請求項7,8と同様のサン
プリング手段、メモリ、演算手段を具備し、記憶処理装
置は、演算手段により得られたサンプリング値の総和に
応じた音信号を、記録用の音信号として前記メモリまた
は記録媒体に書き込むように構成される。なお前記記録
用の音信号としては、演算手段により得られたディジタ
ル量の音信号をそのまま用いてもよいが、これに限ら
ず、アナログ変換された音信号を記録するようにしても
よい。
According to a ninth aspect of the present invention, there are provided a plurality of microphones having the same structure as those of the sixth to eighth aspects, a signal processing device for taking in an output signal of each microphone and generating a sound signal for recording, And a storage processing device for storing the sound signal in a memory or a predetermined recording medium. The signal processing device includes the same sampling means, memory, and calculation means as in claims 7 and 8, and the storage processing device converts a sound signal corresponding to the sum of the sampling values obtained by the calculation means into a sound signal for recording. It is configured to write to the memory or the recording medium as a signal. As the recording sound signal, a digital sound signal obtained by the arithmetic means may be used as it is, but the present invention is not limited to this, and an analog-converted sound signal may be recorded.

【0032】請求項10および11の発明は、音源から
の音を複数箇所で集めるための複数個のマイクロホンの
出力信号を取り込んで処理する音信号処理装置に関す
る。請求項10の発明による音信号処理装置は、各マイ
クロホンの出力信号を一定のサンプリング周期によりサ
ンプリングするサンプリング手段と、マイクロホン毎に
前記サンプリング手段により得られた所定数のサンプリ
ング値を順次記憶するためのメモリと、音源の仮想位置
を中心としてそれぞれの球径が前記サンプリング周期に
相当する音の進行距離だけ順次変わるような同心球を仮
想的に設定して、各マイクロホンを、それぞれその設置
位置に基づき、前記同心球のうちの所定の球の周面に対
応づける対応づけ手段と、各サンプリングの時点で、マ
イクロホン毎に、それぞれそのマイクロホンに対応する
球と音源の仮想位置から最も遠いマイクロホンに対応す
る球との球径の差に基づくサンプリング回数分だけ遅延
したサンプリング値を前記メモリより読み出して、読み
出された各サンプリング値の総和を算出する演算手段と
を具備している。
[0032] The inventions of claims 10 and 11 relate to a sound signal processing device for taking in and processing output signals of a plurality of microphones for collecting sounds from a sound source at a plurality of locations. A sound signal processing apparatus according to a tenth aspect of the present invention is a sound signal processing apparatus for sampling an output signal of each microphone at a constant sampling cycle, and for sequentially storing a predetermined number of sampling values obtained by the sampling means for each microphone. A memory and a concentric sphere in which each sphere diameter is sequentially changed by a sound traveling distance corresponding to the sampling period around the virtual position of the sound source as a center is virtually set, and each microphone is set based on its installation position. An associating means for associating with the peripheral surface of a predetermined sphere of the concentric spheres, and at the time of each sampling, for each microphone, the sphere corresponding to the microphone and the microphone farthest from the virtual position of the sound source. The sampling value delayed by the number of samplings based on the difference between the sphere diameter and the sphere Serial reading from the memory, and a calculating means for calculating the sum of the sampling value read out.

【0033】さらに請求項11の発明では、請求項5の
方法を実行するために、上記請求項10の装置構成にサ
ンプリング周期設定手段および制御手段を付加してい
る。サンプリング周期設定手段は、各マイクロホンにつ
いて、請求項5の発明に示した音信号の位相のずれが所
定の誤差内に入るようなサンプリング周期を設定する。
制御手段は、前記サンプリング手段および対応づけ手段
がそれぞれ設定されたサンプリング周期に応じて動作す
るように、各手段を制御する。
According to the eleventh aspect of the present invention, in order to execute the method of the fifth aspect, a sampling period setting means and a control means are added to the apparatus configuration of the tenth aspect. The sampling cycle setting means sets a sampling cycle for each microphone such that the phase shift of the sound signal described in the fifth aspect falls within a predetermined error.
The control means controls each means so that the sampling means and the associating means operate in accordance with the respectively set sampling period.

【0034】請求項12〜16の発明は、所定の空間位
置に仮想設定された音源に対し、請求項1の方法により
設置された複数個のマイクロホンと、これらマイクロホ
ンの出力信号を取り込んで処理する制御装置とを備えた
音信号処理装置である。請求項12の発明では、制御装
置に、請求項7〜9と同様のサンプリング手段を具備さ
せるほか、マイクロホン毎に所定数のサンプリング値を
順次記憶するためのメモリと、各サンプリングの時点
で、マイクロホン毎に、それぞれそのマイクロホンの設
置基準となる球と音源の仮想位置から最も遠いマイクロ
ホンの設置基準となる球との球径の差に基づくサンプリ
ング回数分だけ遅延したサンプリング値を前記メモリよ
り読み出して、読み出された各サンプリング値の総和を
算出する演算手段とを具備させている。
According to a twelfth aspect of the present invention, for a sound source virtually set at a predetermined spatial position, a plurality of microphones installed by the method of the first aspect and output signals of these microphones are fetched and processed. A sound signal processing device including a control device. According to the twelfth aspect of the present invention, the control device includes the same sampling means as in the seventh to ninth aspects, a memory for sequentially storing a predetermined number of sampling values for each microphone, and a microphone for each sampling. For each, read from the memory a sampling value delayed by the number of samplings based on the difference between the ball diameter of the sphere as the microphone installation reference and the sphere as the microphone installation reference farthest from the virtual position of the sound source, and Calculating means for calculating the sum of the read sampling values.

【0035】さらに請求項13,14の発明の音信号処
理装置は、音源の仮想位置に対し、所定距離だけ離れて
対向配備されるマイクロホンの設置面を具備している。
請求項13の発明では、この設置面上に、同心球のうち
の選ばれた球の周面と設置面上の所定の直線との交差位
置を位置決めの基準として、各マイクロホンを設置して
いる。他方、請求項14の発明では、設置面上に、同心
球のうちの選ばれた球の周面と設置面全体との交差位置
を基準として、各マイクロホンを設置するようにしてい
る。なおこのマイクロホンの設置面は、制御装置を構成
する機体本体部の一面に設定できるほか、制御装置から
独立する位置に設定することも可能である。
Further, the sound signal processing device according to the present invention has a microphone installation surface which is disposed opposite to the virtual position of the sound source by a predetermined distance.
According to the thirteenth aspect of the present invention, each microphone is installed on the installation surface using the intersection of a peripheral surface of a selected one of the concentric spheres and a predetermined straight line on the installation surface as a reference for positioning. . On the other hand, in the invention of claim 14, each microphone is installed on the installation surface with reference to the intersection of the peripheral surface of the selected concentric sphere and the entire installation surface. In addition, the installation surface of the microphone can be set on one surface of the body of the body constituting the control device, or can be set at a position independent of the control device.

【0036】請求項15の発明では、マイクロホンの設
置基準として選ばれた球の周面について、それぞれ複数
個のマイクロホンを設置するようにしている。
According to the fifteenth aspect of the present invention, a plurality of microphones are installed on the peripheral surface of the sphere selected as the microphone installation reference.

【0037】請求項16の発明にかかる音信号処理装置
は、前記した仮想位置とは異なる位置で発生した音信号
の処理を可能となすために、請求項12の構成に加え、
各マイクロホンの出力信号を用いて音源の実際の位置を
推定する音源位置推定手段と、サンプリング周期設定手
段、制御手段の各手段を具備している。サンプリング周
期設定手段は、音源位置推定手段による音源の推定位置
が仮想位置と異なるとき、その推定位置を中心としてそ
れぞれの球径が一定のサンプリング周期に相当する音の
進行距離だけ順次変わるように仮想的に設定された同心
球を想定して、請求項5、11と同様の原理に基づく位
相のずれが所定の誤差内に入るようなサンプリング値を
設定する。制御装置は、設定されたサンプリング周期に
よる処理を行うように前記サンプリング手段を制御する
とともに、前記演算手段によるマイクロホン毎のサンプ
リング値の読み出し位置を、前記音源の推定位置を中心
とする同心球に対する各マイクロホンの対応関係に応じ
て変更するようにしている。
According to a sixteenth aspect of the present invention, in addition to the configuration of the twelfth aspect, in order to enable processing of a sound signal generated at a position different from the virtual position,
The apparatus includes sound source position estimating means for estimating the actual position of the sound source using output signals of the microphones, sampling period setting means, and control means. When the estimated position of the sound source by the sound source position estimating unit is different from the virtual position, the sampling period setting unit virtually sets each sphere diameter around the estimated position to sequentially change by a sound traveling distance corresponding to a fixed sampling period. Assuming that the concentric sphere is set in a predetermined manner, a sampling value is set such that a phase shift based on the same principle as in claims 5 and 11 falls within a predetermined error. The control device controls the sampling means so as to perform processing at the set sampling period, and sets a reading position of a sampling value for each microphone by the arithmetic means to a concentric sphere centered on the estimated position of the sound source. It changes according to the correspondence of microphones.

【0038】請求項17の発明は、音信号を入力して所
定の音声認識処理を行うための制御装置と、前記制御装
置による音声認識処理の結果を表示するモニタと、モニ
タの前方の空間位置に仮想設定された音源からの音を集
めて前記制御装置に入力するための複数個のマイクロホ
ンとを備えた音声認識処理装置である。各マイクロホン
は、前記モニタの表示画面の周縁部上において、前記音
源の仮想位置を中心として請求項1の方法による同心球
のうちの選ばれた複数の球の周面と周縁部との交差位置
を位置決めの基準として設置される。制御装置は、請求
項12と同様のサンプリング手段、メモリ、演算手段を
備えるほか、演算手段により得られた算出値による時系
列データを処理して、所定の音声認識処理を実行する認
識処理手段を具備している。
A seventeenth aspect of the present invention provides a control device for inputting a sound signal and performing a predetermined voice recognition process, a monitor for displaying a result of the voice recognition process by the control device, and a spatial position in front of the monitor. And a plurality of microphones for collecting sounds from a sound source virtually set as described above and inputting the collected sounds to the control device. 2. The microphone according to claim 1, wherein the microphone is located on a peripheral portion of a display screen of the monitor and at an intersection of a peripheral surface and a peripheral portion of a plurality of selected concentric spheres according to the method of claim 1 around the virtual position of the sound source. Is set as a reference for positioning. The control device includes a sampling unit, a memory, and a calculation unit similar to those of the twelfth aspect, and a recognition processing unit that processes time-series data based on a calculation value obtained by the calculation unit and performs a predetermined voice recognition process. I have it.

【0039】請求項18の発明にかかる音声認識処理装
置は、機械の一面に複数個のマイクロホンが設置される
とともに、機械内部に請求項17と同様の構成の制御装
置が組み込まれている。マイクロホンの設置面には、こ
の設置面に対向する所定の空間位置に仮想設定される音
源を中心として請求項1の方法により仮想的に設定され
た同心球のうち、選ばれた複数の球の周面と前記設置面
との交差位置を位置決めの基準として、各マイクロホン
が設置される。
The speech recognition processing apparatus according to the eighteenth aspect of the present invention has a plurality of microphones installed on one surface of the machine, and a control device having the same configuration as that of the seventeenth aspect is incorporated in the machine. The installation surface of the microphone has a plurality of concentric spheres virtually set by the method of claim 1 centered on a sound source virtually set at a predetermined space position facing the installation surface. Each microphone is installed using the intersection of the peripheral surface and the installation surface as a reference for positioning.

【0040】請求項19,20の各発明は、音源からの
音を複数箇所で集めるための複数個のマイクロホンの出
力信号を、コンピュータにより処理するためのプログラ
ムが記録された記録媒体である。請求項19の発明によ
る記録媒体には、コンピュータに内蔵されたA/D変換
手段を用いて各マイクロホンの出力信号を一定のサンプ
リング周期によりサンプリングするための手順、マイク
ロホン毎に所定数のサンプリング値を順次メモリに記憶
させる手順、音源の仮想位置を中心として請求項1の方
法による同心球を仮想的に設定するとともに、各マイク
ロホンを、それぞれの設置位置に基づき、前記同心球の
うちの選ばれた複数の球の周面に対応づける手順、各サ
ンプリングの時点で、マイクロホン毎に、それぞれその
マイクロホンに対応する球と前記音源の仮想位置から最
も遠いマイクロホンに対応する球との球径の差に応じた
サンプリング回数分だけ遅延したサンプリング値を前記
メモリより読み出して、読み出された各サンプリング値
の総和を算出する手順、の各手順が記録される。
Each of the nineteenth and twentieth aspects of the present invention is a recording medium in which a program for processing by a computer the output signals of a plurality of microphones for collecting sounds from a sound source at a plurality of locations is recorded. In the recording medium according to the nineteenth aspect, a procedure for sampling an output signal of each microphone at a fixed sampling cycle using an A / D conversion means built in a computer, and a predetermined number of sampling values for each microphone are stored. A step of sequentially storing the concentric spheres in the memory according to the method of claim 1, centering on a virtual position of the sound source, and selecting each of the microphones from among the concentric spheres based on the respective installation positions. Procedure for associating with the peripheral surface of a plurality of spheres, at each sampling point, for each microphone according to the difference in sphere diameter between the sphere corresponding to that microphone and the sphere corresponding to the microphone farthest from the virtual position of the sound source The sampling value delayed by the number of sampling times read out from the memory is read out, and each sampled value read out is read out. Procedure for calculating the sum of values, each step of is recorded.

【0041】さらに請求項20の発明による記録媒体に
は、前記請求項5,11と同様の原理による音信号の位
相のずれが、所定の誤差内に入るようなサンプリング周
波数を設定する手順と、前記各マイクロホンの音信号を
サンプリングする手順および各マイクロホンを同心球に
対応づけるための手順が、設定されたサンプリング周期
により行われるように制御する手順とを実行するための
プログラムが記録される。
Further, in the recording medium according to the twentieth aspect, there is provided a procedure for setting a sampling frequency such that a phase shift of a sound signal according to the same principle as in the fifth and eleventh aspects falls within a predetermined error. A program is recorded for executing a procedure of sampling the sound signal of each microphone and a procedure of controlling each microphone to correspond to a concentric sphere at a set sampling cycle.

【0042】[0042]

【作用】請求項1の発明によれば、各マイクロホンに対
するサンプリング周期をT,このサンプリング周期T内
に音が進行する距離をλとすると、音源を中心として半
径がλずつ変わるような同心球が仮想的に設定され、そ
のうち選ばれた複数の球の周面を基準にして各マイクロ
ホンが設置されることになる。したがって各マイクロホ
ン毎のサンプリング値を、それぞれそのマイクロホンの
設置基準となる球と音源より最も遠いマイクロホンの設
置基準となる球との球径の差に応じたサンプリング回
数、具体的には各球の半径の差iλ(iは任意の整数)
に対応するi回のサンプリング回数だけ遅延させること
により、音源から各マイクロホンに到達した音信号の位
相を揃えて取り出すことが可能となる。したがって従来
の遅延フィルタを用いた場合のように、膨大な量の演算
処理を行う必要がない。
According to the first aspect of the present invention, assuming that a sampling period for each microphone is T and a distance at which sound travels within the sampling period T is λ, a concentric sphere whose radius changes by λ around the sound source is obtained. Each microphone is virtually set, and each microphone is set based on the peripheral surface of a plurality of spheres selected among them. Therefore, the sampling value for each microphone is calculated as the number of times of sampling according to the difference between the diameter of the sphere used as the reference of the microphone and the sphere used as the reference of the microphone farthest from the sound source, specifically, the radius of each sphere. (I is an arbitrary integer)
By delaying i times of sampling times corresponding to the above, it is possible to extract the sound signals reaching the respective microphones from the sound source in the same phase. Therefore, there is no need to perform an enormous amount of arithmetic processing as in the case where a conventional delay filter is used.

【0043】請求項6の発明によれば、所定の空間位置
に仮想設定された音源に対して、上記の方法により各マ
イクロホンを設置することにより、複数位置で収集され
た音信号を簡単に処理できる音信号入力装置が生成され
る。
According to the sixth aspect of the present invention, the sound signals collected at a plurality of positions can be easily processed by arranging the microphones according to the above-mentioned method for the sound source virtually set at a predetermined spatial position. A possible sound signal input device is generated.

【0044】請求項2の発明によれば、図1に示すよう
に、各マイクロホンを、直線と各球の周面とが交差する
位置に設置することにより、各マイクロホンが一列に並
べて設置される。また請求項3の発明によれば、直線に
代えてマイクロホンの設置面を仮想設定し、この設置面
と各球の周面とが交差する位置にマイクロホンを設置す
るので、各マイクロホンは、円形状や矩形状など2次元
状の広がりをもって設置されるようになる。さらに設置
面が曲面である場合は、各マイクロホンを3次元状に設
置することができる。
According to the second aspect of the present invention, as shown in FIG. 1, by placing each microphone at a position where a straight line and the peripheral surface of each sphere intersect, each microphone is arranged in a line. . According to the third aspect of the present invention, a microphone installation surface is virtually set instead of a straight line, and the microphone is installed at a position where the installation surface intersects with the peripheral surface of each sphere. It is installed with a two-dimensional spread such as a rectangular shape. Further, when the installation surface is a curved surface, each microphone can be installed three-dimensionally.

【0045】請求項4の発明によれば、各マイクロホン
が請求項1の方法に基づいて設置されている場合に、各
マイクロホンの出力信号のサンプリング値を、その設置
基準となる球の球径に応じたサンプリング回数分だけ遅
延させることにより、各マイクロホンに到達した音源か
らの音信号が、位相を揃えて取り出されるようになる。
さらにこの位相の揃った信号が含まれるサンプリング値
の総和を算出することにより、音源からの音信号が強調
された音信号が生成されることになる。また請求項10
の発明では、請求項4の方法を実行可能な音信号処理装
置を構成したので、この装置に請求項6の音信号入力装
置を接続することにより、各マイクロホンの出力信号の
処理が可能となる。
According to the fourth aspect of the present invention, when each microphone is installed according to the method of the first aspect, the sampling value of the output signal of each microphone is set to the sphere diameter of the sphere serving as the installation reference. By delaying by the corresponding number of times of sampling, the sound signal from the sound source that has reached each microphone can be extracted with the same phase.
Further, by calculating the sum of the sampling values including the signals having the same phase, a sound signal in which the sound signal from the sound source is emphasized is generated. Claim 10
According to the present invention, the sound signal processing device capable of executing the method of claim 4 is configured. By connecting the sound signal input device of claim 6 to this device, the output signal of each microphone can be processed. .

【0046】請求項7の発明によれば、音源の仮想位置
を中心として半径がλずつ変化するような球の周面を基
準に設置された各マイクロホンの出力信号が、それぞれ
サンプリング周期Tによりサンプリングされるととも
に、各マイクロホンの設置基準となる球と音源から最も
遠い基準の球との球径の差に基づくi回分のサンプリン
グ値がメモリに格納される。ついでメモリより各マイク
ロホン毎の最も古いサンプリング値を読み出すことによ
り、音源からの同じ音信号を含むサンプリング値が取り
出される。さらにこれらのサンプリング値および仮想音
源より最も遠い位置のマイクロホンについての現時点で
のサンプリング値の総和を算出することにより、前記音
源からの音信号が強められたディジタル量の音信号が生
成され、音声認識処理やディジタル音声の記録用の装置
などの外部装置に出力される。
According to the seventh aspect of the present invention, the output signals of the microphones installed on the basis of the circumference of the sphere whose radius changes by λ around the virtual position of the sound source are sampled at the sampling period T. At the same time, the sampling values for i times based on the difference in the ball diameter between the sphere as the installation reference of each microphone and the reference sphere farthest from the sound source are stored in the memory. Then, by reading out the oldest sampling value for each microphone from the memory, a sampling value including the same sound signal from the sound source is extracted. Further, by calculating the sum of these sampling values and the current sampling value of the microphone located farthest from the virtual sound source, a sound signal of a digital amount in which the sound signal from the sound source is enhanced is generated, and speech recognition is performed. It is output to an external device such as a device for processing and recording of digital audio.

【0047】請求項8の発明によれば、音源からの音が
強調されたアナログ量の音信号を入力する音信号入力装
置において、請求項7と同様の信号処理が実行される。
また請求項9の発明では、ディジタルまたはアナログ方
式で音信号を記録する装置において、記録用の音信号
が、請求項7,8と同様の処理により作成されることに
なる。
According to the eighth aspect of the present invention, the same signal processing as in the seventh aspect is executed in the sound signal input device for inputting the analog sound signal in which the sound from the sound source is emphasized.
According to the ninth aspect of the present invention, in a device for recording a sound signal in a digital or analog system, a sound signal for recording is created by the same processing as in the seventh and eighth aspects.

【0048】請求項12の発明によれば、請求項1の方
法により設置された複数個のマイクロホンと、これらマ
イクロホンの出力信号を請求項4の方法により処理する
制御装置とによって、音信号の入力機能を備えた音信号
処理装置が構成されることになる。
According to a twelfth aspect of the present invention, a plurality of microphones installed by the method of the first aspect and a control device for processing output signals of these microphones by the method of the fourth aspect allow input of a sound signal. A sound signal processing device having a function is configured.

【0049】請求項13の発明によれば、請求項12の
音信号処理装置において、音源の仮想位置に対向する位
置にマイクロホンの設置面が設けられ、この設置面上に
各マイクロホンが一列に並べて設置される。また請求項
14の発明によれば、同様の設置面上に、各マイクロホ
ンが2次元または3次元状に配置されるようになる。な
おこの設置面を制御装置と独立させれば、音信号の入力
部が制御装置に外付された装置構成となり、音源の位置
に応じて音信号の採取位置を自由に設定することが可能
となる。
According to a thirteenth aspect of the present invention, in the sound signal processing device of the twelfth aspect, a microphone installation surface is provided at a position facing the virtual position of the sound source, and the microphones are arranged in a line on the installation surface. Will be installed. According to the fourteenth aspect, the microphones are two-dimensionally or three-dimensionally arranged on the same installation surface. In addition, if this installation surface is made independent of the control device, the sound signal input section becomes a device configuration external to the control device, and it is possible to freely set the sampling position of the sound signal according to the position of the sound source. Become.

【0050】請求項15の発明によれば、1つの球の周
面に、複数個のマイクロホンが配置されることになるの
で、マイクロホンの設置基準としての球を多数設定しな
くとも、設置基準の球を同じくするマイクロホンの出力
信号を同じサンプリング回数分だけ遅延させてから、サ
ンプリング値の総和を算出することにより、雑音が除去
され、前記音源からの音信号が強められた音信号が抽出
されるようになる。またアナログ信号の段階で、設置基
準の球を同じくするマイクロホン毎に出力信号を重畳す
るようにすれば、サンプリング処理数や演算処理数は、
さらに減少する。
According to the fifteenth aspect of the present invention, a plurality of microphones are arranged on the peripheral surface of one sphere. Therefore, even if a large number of spheres are not set as the microphone installation standard, the installation standard can be maintained. By delaying the output signal of the microphone having the same sphere by the same number of times of sampling and calculating the sum of the sampling values, noise is removed and a sound signal in which the sound signal from the sound source is enhanced is extracted. Become like In addition, if the output signal is superimposed on each microphone having the same sphere as the installation reference at the stage of the analog signal, the number of sampling processes and the number of arithmetic processes are reduced.
Further decrease.

【0051】請求項17の発明によれば、音声認識処理
の結果を表示するためのモニタの周縁部上において、音
源の仮想位置を中心としてλずつ半径が変わる同心球と
モニタの周縁部との交差位置を基準としてマイクロホン
が設置される。したがってユーザーがモニタの表示画面
に向かって入力データの内容を発声すると、各マイクロ
ホンにより取り込まれた音信号からユーザーの音声を表
すディジタル量の音信号が抽出され、その信号に対する
認識処理により、入力データの内容が認識されることに
なる。
According to the seventeenth aspect of the present invention, on the periphery of the monitor for displaying the result of the speech recognition processing, a concentric sphere whose radius changes by λ around the virtual position of the sound source and the periphery of the monitor A microphone is installed based on the intersection position. Therefore, when the user utters the contents of the input data toward the display screen of the monitor, a digital amount of sound signal representing the user's voice is extracted from the sound signal captured by each microphone, and the input data is recognized by a recognition process for the signal. Will be recognized.

【0052】請求項18の発明によれば、仮想設定され
た音源に対向する機械の一面をマイクロホンの設置面と
し、この設置面上において音源を中心としてλずつ半径
が変わる同心球との交差位置を基準としてマイクロホン
が設置されるので、ユーザーが各マイクロホンの設置面
に向けて入力データの内容を発声することにより、その
音声信号が取り込まれてユーザーの音声を表すディジタ
ル量の音信号が抽出される。さらにその信号に対する認
識処理により、入力データの内容が認識されることにな
る。
According to the eighteenth aspect of the present invention, one surface of the machine facing the virtually set sound source is a microphone installation surface, and the intersection position with the concentric sphere where the radius changes by λ around the sound source on this installation surface. When the microphone is installed on the basis of the reference, the user utters the contents of the input data toward the installation surface of each microphone, and the audio signal is captured to extract a digital sound signal representing the user's voice. You. Further, the content of the input data is recognized by the recognition process for the signal.

【0053】請求項19の発明によれば、記録媒体に記
録されたプログラムをA/D変換手段を具備するコンピ
ュータに導入することにより、請求項1の方法により設
置された各マイクロホンの出力信号を処理して、所定の
空間位置からの音信号を抽出する装置が作成される。
According to the nineteenth aspect of the present invention, the program recorded on the recording medium is introduced into a computer having A / D conversion means, so that the output signal of each microphone installed according to the method of the first aspect is obtained. An apparatus is created that processes and extracts sound signals from predetermined spatial locations.

【0054】請求項5,11,20の発明によれば、マ
イクロホンが対応づけられた球の各周面からずれて設置
されている場合には、そのマイクロホンが理想位置であ
る球の周面上に設置されている場合より位相のずれた音
信号が取り込まれることになる。ただしこの場合の同心
球の各球径を決定するサンプリング周波数は、前記の位
相のずれが所定の誤差内に入るような値に調整されてい
るので、最終の演算結果に及ぶマイクロホンの位置ずれ
の影響も、許容範囲に抑えられる。
According to the fifth, eleventh and twentieth aspects of the present invention, when the microphones are set off from the respective peripheral surfaces of the associated sphere, the microphones are located on the peripheral surface of the sphere at the ideal position. In this case, a sound signal having a phase shifted from that in the case where the sound signal is installed is taken in. However, in this case, the sampling frequency for determining the diameter of each concentric sphere is adjusted to a value such that the above-mentioned phase shift falls within a predetermined error. The effect is also kept to an acceptable level.

【0055】請求項16の発明によれば、音源の推定さ
れた位置が仮想設定された位置と異なるとき、各マイク
ロホンを、この推定された音源の位置を中心としてサン
プリングを行う場合の同心球の周面に対応づけし直し
て、信号処理を行う。この場合、各マイクロホンは新た
に対応づけられた球の周面からずれることになるが、請
求項5,11の発明と同様に、各マイクロホンにより取
り込まれる音信号と理想の位置で取り込まれる音信号と
の位相のずれが所定の誤差内に入るような値に調整され
ているので、最終の演算結果に及ぶマイクロホンの位置
ずれの影響も、許容範囲に抑えられる。
According to the sixteenth aspect of the present invention, when the estimated position of the sound source is different from the virtually set position, each microphone is placed in a concentric sphere when sampling is performed around the estimated position of the sound source. The signal processing is performed by associating with the peripheral surface. In this case, each microphone deviates from the peripheral surface of the newly associated sphere, but the sound signal captured by each microphone and the sound signal captured at an ideal position are similar to the inventions of claims 5 and 11. Is adjusted to a value that falls within a predetermined error, so that the effect of the microphone position shift on the final calculation result can be suppressed to an allowable range.

【0056】[0056]

【実施例】図1は、この発明にかかるマイクロホンの設
置方法の一例を、各マイクロホンの出力信号の処理方法
とともに示す。図中のSは、空間内に仮想設定された音
源であって、この音源Sを中心として一定のサンプリン
グ周期Tにおいて音が進む距離λずつ半径が変化するよ
うな同心球が仮想設定される。また音源Sから所定距離
hだけ離れた位置に直線Pが仮想設定され、前記同心球
のうち所定の位置から音源Sの側に向けて順に設定され
る4個の球C0〜C3について、それぞれ球C 0〜C3と直
線Pとが交差する位置にマイクロホンM0〜M3が設置さ
れる。
FIG. 1 shows a microphone arrangement according to the present invention.
An example of the placement method is a method of processing the output signal of each microphone.
Shown together. S in the figure is a sound virtually set in the space
Source, and a fixed sample
The radius changes by the distance λ the sound travels in the gear cycle T
Such a concentric sphere is virtually set. A predetermined distance from the sound source S
h, a straight line P is virtually set at a position separated by h
Are set in order from a predetermined position toward the sound source S.
Four balls C0~ CThreeAbout each sphere C 0~ CThreeDirectly
Microphone M at the position where line P intersects0~ MThreeIs installed
It is.

【0057】上記図1では、先の「課題を解決する手
段」の欄で述べた原理により、音源Sから最も遠いマイ
クロホンM0に対応する球C0を基準として、各マイクロ
ホンM nの出力信号に対するサンプリング値を、それぞ
れそのマイクロホンMnの設置基準となる球Cnと前記基
準の球C0との半径の差nλに応じたサンプリング回数
nだけ遅延させ、遅延された各サンプリング値の総和を
算出する。これにより音源Sからの位相の揃った音信号
が強められる一方、音源Sとは異なる位置で発生した音
信号は打ち消し合って弱められるようになり、目的とす
る音源Sからの音を精度よく取り出すことが可能とな
る。
In FIG. 1 described above, the "hands for solving the problem"
According to the principle described in the column, “
Clohon M0Sphere C corresponding to0Each micro
Hong M nThe sampling value for the output signal of
Microphone MnBall C that serves as an installation standardnAnd the group
Quasi ball C0Number of samplings according to the difference in radius nλ
n, and sum the delayed sampled values
calculate. With this, a sound signal from the sound source S with a uniform phase
Generated at a position different from the sound source S while the
The signals will be canceled out and weakened,
Sound from the sound source S can be accurately extracted.
You.

【0058】なお図1および後記する図3,4の具体例
では、いずれも、半径がλずつ変化する複数個の球の周
面に順にマイクロホンを設置するようにしているが、必
ずしも等間隔の球の周面毎にマイクロホンを設定する必
要はなく、音源Sを中心に無限に広がる同心球の中か
ら、任意の位置にある任意の数の球を選択して、これら
選択された球の周面にそれぞれマイクロホンを設置すれ
ばよい。また詳細は後記するが、1つの球の周面に対
し、2個以上のマイクロホンを設置することも可能であ
り、複数の球の周面にそれぞれ複数個のマイクロホンを
設置するとともに、同じ球の周面に設置されたマイクロ
ホンに対するサンプリング値を同じ遅延時間により処理
するようにすれば、2次元または3次元状の広がりをも
ってマイクロホンを設置することが可能となる。しかも
このような装置によれば、設置基準を同じくするマイク
ロホン毎の出力信号を重畳することができるので、演算
量を減らし、かつノイズを精度良く除去することができ
る。以下、この図1の原理を適用した実施例を順にあげ
て、この発明の詳細を説明することにする。
In each of the specific examples shown in FIG. 1 and FIGS. 3 and 4 described later, the microphones are arranged in order on the peripheral surface of a plurality of spheres whose radius changes by λ. It is not necessary to set a microphone for each peripheral surface of the sphere. An arbitrary number of spheres at arbitrary positions are selected from concentric spheres extending infinitely around the sound source S, and the spheres of these selected spheres are selected. A microphone may be installed on each surface. As will be described later in detail, it is also possible to install two or more microphones on the peripheral surface of one sphere. If the sampling values for the microphones installed on the peripheral surface are processed with the same delay time, the microphones can be installed with a two-dimensional or three-dimensional spread. Moreover, according to such an apparatus, it is possible to superimpose an output signal for each microphone having the same installation reference, so that the amount of calculation can be reduced and noise can be accurately removed. Hereinafter, the present invention will be described in detail with reference to the embodiments to which the principle of FIG. 1 is applied.

【0059】(1) ハードウエアによる信号処理 図2は、上記図1のマイクロホンの設置方法が適用され
たマイクロホンアレイ1の概略構成を示すもので、各マ
イクロホンM0〜M3は、所定幅の設置面上に、前記図1
の原理に応じた間隔をあけて、一列に並べて配備され
る。
(1) Signal Processing by Hardware FIG. 2 shows a schematic configuration of a microphone array 1 to which the microphone installation method of FIG. 1 is applied. Each of the microphones M 0 to M 3 has a predetermined width. Fig. 1 on the installation surface
Are arranged in a line at intervals according to the principle of.

【0060】図3は図2のマイクロホンアレイ1を用い
たディジタル式のボイスレコーダを示す。この装置で
は、マイクロホンM0〜M3毎に、マイクロホンアンプ2
(以下単に「アンプ2」という)およびA/Dコンバー
タ3が設定されるほか、音源Sに対して最も遠いマイク
ロホンM0に対応する球C0(以下これを「基準の球
0」という)よりも内側の球C1〜C3に対応する各マ
イクロホンM1〜M3について、それぞれA/Dコンバー
タ3によりサンプリングされたサンプリング値を一時記
憶するためのFIFOメモリ4A〜4Cが配備される。
さらにその後段には、加算器5と記憶装置6とが配備さ
れる。
FIG. 3 shows a digital voice recorder using the microphone array 1 of FIG. In this apparatus, each microphone M 0 ~M 3, microphone amplifier 2
(Hereinafter simply referred to as “amplifier 2”) and A / D converter 3 are set, and sphere C 0 corresponding to microphone M 0 farthest from sound source S (hereinafter referred to as “reference sphere C 0 ”) for the microphones M 1 ~M 3 corresponding to the inside of the sphere C 1 -C 3, FIFO memory 4A~4C for temporarily storing the sampled sampled value by the a / D converter 3, respectively, are deployed than.
Further, at the subsequent stage, an adder 5 and a storage device 6 are provided.

【0061】各A/Dコンバータ3は、それぞれマイク
ロホンM0〜M3からの出力信号を、一定のサンプリング
周期Tによりサンプリングしてディジタル量の音声信号
を生成する。各FIFOメモリ4A〜4Cは、それぞれ
対応するマイクロホンMn(n=1,2,3)の設置基
準となる球Cnと前記基準の球C0との半径の差nλに応
じたサンプリング回数n分のデータ容量を具備する。
Each A / D converter 3 samples an output signal from each of the microphones M 0 to M 3 at a constant sampling period T to generate a digital amount of audio signal. Each of the FIFO memories 4A to 4C stores a sampling number n according to a difference nλ between a radius of a sphere C n serving as an installation reference of the corresponding microphone M n (n = 1, 2, 3) and the reference sphere C 0. Data capacity.

【0062】この実施例は、各FIFOメモリ4A〜4
Cにより各マイクロホンM1〜M3にかかるサンプリング
値をnサンプル分(n=1,2,3)だけ遅延させた後
に、これら遅延させたサンプリング値とマイクロホンM
0からの現時点でのサンプリング値とを加算器5に入力
して総和を算出するようにしている。この算出結果は、
音源Sから各マイクロホンM0〜M3に届いた音信号を同
相化して平均化した信号に相当する。
In this embodiment, each of the FIFO memories 4A to 4A
C, the sampling values applied to the microphones M 1 to M 3 are delayed by n samples (n = 1, 2, 3, 3), and then the delayed sampling values and the microphone M
The current sampling value from 0 is input to the adder 5 to calculate the sum. The result of this calculation is
This corresponds to a signal obtained by in-phase and averaging sound signals reaching the microphones M 0 to M 3 from the sound source S.

【0063】前記記憶装置6は、ディジタル量の音信号
を記憶するためのメモリ、またはFD,CD−R,MO
などの記録媒体とその記録媒体へのデータ書込み装置に
より構成される。この記憶装置に対し、毎時のサンプリ
ング毎に加算器の算出結果を出力することにより、音源
Sで発声した音をディジタル化した時系列データが記録
されることになる。
The storage device 6 is a memory for storing a digital amount of sound signal, or an FD, CD-R, MO
And the like, and a device for writing data to the recording medium. By outputting the calculation result of the adder for each sampling every hour to this storage device, the time series data obtained by digitizing the sound uttered by the sound source S is recorded.

【0064】図4は、図2のマイクロホンアレイ1を用
いたアナログ式の音声入力装置を示す。この装置では、
各マイクロホンM0〜M3に対し、図3と同様のアンプ
2,A/Dコンバータ3,FIFOメモリ4A〜4Cが
配備されるほか、加算器5やD/Aコンバータ7が設け
られる。加算器5は、図3の実施例と同様に、マイクロ
ホンM1〜M3についての遅延させたサンプリング値とマ
イクロホンM0からの現時点でのサンプリング値との総
和を算出することにより、音源Sからの位相の揃った音
信号を強めて抽出する。D/Aコンバータ7は、図示し
ないアナログ音信号の出力端子に接続されており、加算
器5により得られたサンプリング値の総和をアナログ変
換した後に、前記出力端子を介して外部に出力する。
FIG. 4 shows an analog voice input device using the microphone array 1 of FIG. In this device,
For each microphone M 0 ~M 3, Figure 3 the same amplifier and 2, A / D converter 3, in addition to the FIFO memory 4A~4C is deployed, the adder 5 and the D / A converter 7 is provided. The adder 5, similar to the embodiment of FIG. 3, by calculating the sum of the sampling values at the present time from the sampling values and the microphone M 0 which is delayed for the microphone M 1 ~M 3, from the sound source S The sound signal having the same phase is extracted. The D / A converter 7 is connected to an output terminal of an analog sound signal (not shown), converts the sum of the sampling values obtained by the adder 5 to analog, and then outputs the converted sum to the outside via the output terminal.

【0065】この図4の構成による装置は、パーソナル
コンピュータ、録音装置、電話機など、アナログ式の音
信号用の入力端子を具備する装置に接続することが可能
であるので、その汎用性は非常に高くなる。しかも簡易
な構成ではあるが、前記図1に示した原理による処理が
行われるので、音源S以外の空間位置で発生したノイズ
を精度よく除去することができる。なお同様の原理で動
作するディジタル式の音信号入力装置を製作するには、
加算器5からの出力を、D/Aコンバータ7を介さずに
そのまま出力するように構成すればよい。また図4のD
/Aコンバータ7に録音装置を接続した構成までを一体
化することにより、アナログ式のボイスレコーダを作成
することができる。
The device having the configuration shown in FIG. 4 can be connected to a device having an input terminal for an analog sound signal, such as a personal computer, a recording device, and a telephone. Get higher. In addition, although the configuration is simple, the processing according to the principle shown in FIG. 1 is performed, so that noise generated at a spatial position other than the sound source S can be accurately removed. To produce a digital sound signal input device that operates on the same principle,
The output from the adder 5 may be directly output without passing through the D / A converter 7. Also, D in FIG.
By integrating the configuration up to the connection of the recording device to the / A converter 7, an analog voice recorder can be created.

【0066】(2)マイクロホンの設置について 前記図1〜4の例では、仮想設定された各球C0〜C3
周面に、それぞれマイクロホンを1個ずつ設置するよう
にしているが、実用上のマイクロホンアレイとしては、
図5に示すように、各球C0〜C3と直線Pとの交差位置
に基づき、各球C0〜C3毎に2個ずつマイクロホンM0
〜M3,M´0〜M´3を配置することが可能である。こ
の場合、同じ球Cnの周面に配置される一対のマイクロ
ホンMn,M´nは、アレイの中心点oを介して対称とな
る位置に配置されるから、音源Sに最も近いマイクロホ
ンM3,M´3間の距離w、またはマイクロホンアレイ全
体のアレイ長lのいずれかを決定することにより、音源
Sからアレイ面までの距離hや1サンプリング期間内に
音の進む距離λなどを用いて各マイクロホンM0〜M3
M´0〜M´3の位置を算出することができる。
(2) Installation of Microphone In the example of FIGS. 1 to 4, one microphone is installed on each of the virtually set spheres C 0 to C 3. As the microphone array above,
As shown in FIG. 5, two microphones M 0 are provided for each of the spheres C 0 to C 3 based on the intersection positions of the spheres C 0 to C 3 and the straight line P.
~M 3, it is possible to place the M'0 ~M' 3. In this case, the pair of microphones M n and M ′ n arranged on the peripheral surface of the same sphere C n are arranged at symmetrical positions via the center point o of the array. 3, by determining either a distance w or microphone array across the array length l, between M'3, using a distance λ going from the sound source S of the distance h and sound within one sampling period to the array surface , Each microphone M 0 to M 3 ,
The positions of M ′ 0 to M ′ 3 can be calculated.

【0067】図6および図7は、前記中心点oの両側に
それぞれ4個のマイクロホンを設置する場合を例にし
て、各マイクロホンの設置位置を決定する方法を示す。
なお各図では、図中、中心点oより右側のマイクロホン
0〜M3の設置位置のみを示しているが、左側の各マイ
クロホンM´0〜M´3は、それぞれ前記中心点oを基準
としてマイクロホンM0〜M3と対称の位置に設置される
ことになる。
FIGS. 6 and 7 show a method of determining the installation positions of the microphones, taking as an example a case where four microphones are installed on both sides of the center point o.
In each of the drawings, only the installation positions of the microphones M 0 to M 3 on the right side of the center point o are shown, but each of the microphones M ′ 0 to M ′ 3 on the left side is based on the center point o. It will be placed in the position of the microphone M 0 ~M 3 and symmetric.

【0068】図6は、マイクロホンアレイの全長lを用
いて、アレイの中心点oから各マイクロホンMnの設置
位置までの距離rnを決定するようにしたものである。
この場合、音源Sから最も遠いマイクロホンM0と音源
Sとの距離d0を(3)式により算出することができ
る。また各マイクロホンM0〜M3が、λずつ半径が小さ
くなる同心球C0〜C3の周面上に順に配置されているも
のとすると、内側位置の各マイクロホンMn(n=1,
2,3)と音源Sとの距離dnは、dn=d0−nλと表
されることになる。したがってアレイの中心点oからマ
イクロホンMnまでの距離rnは、(4)式により算出さ
れる。
FIG. 6 is a diagram for determining the distance r n from the center point o of the array to the installation position of each microphone M n using the total length 1 of the microphone array.
In this case, the distance d 0 between the microphone M 0 farthest from the sound source S and the sound source S can be calculated by Expression (3). Assuming that the microphones M 0 to M 3 are sequentially arranged on the peripheral surface of the concentric spheres C 0 to C 3 whose radius decreases by λ, each microphone M n (n = 1,
2,3) the distance d n between the sound source S will be denoted as d n = d 0 -nλ. Thus the distance r n from the center point o of the array to the microphone M n is calculated by the equation (4).

【0069】[0069]

【数3】 (Equation 3)

【0070】[0070]

【数4】 (Equation 4)

【0071】図7は、音源Sに最も近い一対のマイクロ
ホンMx,M´x(図示例ではx=3)間の幅wを先に決
めておき、これらマイクロホンMx,M´xより外側に配
置された各マイクロホンMn,M´n(図示例ではn=
0,1,2)について、それぞれアレイの中心点oから
マイクロホンの設置位置までの距離rnを算出するよう
にしたものである。この場合、音源Sに最も近いマイク
ロホンMxと音源Sとの距離d´は、(5)式により算
出できるから、各マイクロホンM0〜Mxが、λずつ半径
がちいさくなる同心球C0〜Cxの周面上に順に配置され
るならば、他のマイクロホンMnと音源Sとの距離d
nは、dn=d´+(x−n)λと表されることになる。
したがってアレイの中心点oからマイクロホンMnまで
の距離rnは、(6)式により算出される。
FIG. 7 shows a case in which the width w between a pair of microphones M x and M ′ x (x = 3 in the illustrated example) closest to the sound source S is determined in advance, and the width w is outside the microphones M x and M ′ x. Microphones M n and M ′ n (in the illustrated example, n =
For 0,1,2), in which to calculate the distance r n from the center point o of the array to the installation position of the microphone respectively. In this case, the distance d'of the nearest microphone M x and the sound source S to the sound source S, (5) because it is calculated by the equation, the microphones M 0 ~M x is concentric spheres C 0 with a radius smaller by lambda ~ if it is arranged in order on the peripheral surface of the C x, the distance between the other microphone M n and the sound source S d
n will be expressed as d n = d ′ + (x−n) λ.
Thus the distance r n from the center point o of the array to the microphone M n is calculated by the equation (6).

【0072】[0072]

【数5】 (Equation 5)

【0073】[0073]

【数6】 (Equation 6)

【0074】図8は、前記図6の方法に基づき、7個の
マイクロホンMを並べた例を示す。なおここでは、これ
らマイクロホンMによるマイクロホンアレイが、音源S
の仮想位置から50cm離れた位置に配置されているもの
として、44.1kHZのサンプリング周波数でサンプリ
ングを行うことを条件にしている。この条件下でマイク
ロホンアレイの全長が約40cmとなるように、各マイク
ロホンの設置位置を算出した結果、アレイの中心点oの
位置、および中心点oより左右に8.81cm,15.3
8cm,20.01cmだけ離れた対称位置が、それぞれマ
イクロホンMの設置位置として決定される。
FIG. 8 shows an example in which seven microphones M are arranged based on the method of FIG. Here, the microphone array by these microphones M is used as the sound source S
And that sampling is performed at a sampling frequency of 44.1 kHz. Under these conditions, the installation positions of the microphones were calculated so that the total length of the microphone array was about 40 cm. As a result, the position of the center point o of the array and 8.81 cm, 15.3 to the left and right of the center point o.
The symmetrical positions separated by 8 cm and 20.01 cm are determined as the installation positions of the microphone M, respectively.

【0075】図9は、前記図7の方法により、8個のマ
イクロホンMを並べて設置する例を示す。この例でも、
音源Sの仮想位置とマイクロホンアレイまでの距離を5
0cm、サンプリング周波数は44.1kHZとして、音源
Sに最も近い一対のマイクロホン間の間隔が12cmとな
るように、各マイクロホンの設置位置を算出した結果、
アレイの中心点oより左右に6.0cm,10.69cm,
16.56cm,20.96cmだけ離れた対称位置を、そ
れぞれマイクロホンの設置位置として決定している。
FIG. 9 shows an example in which eight microphones M are arranged side by side according to the method of FIG. In this example,
The distance between the virtual position of the sound source S and the microphone array is 5
As a result of calculating the installation positions of the microphones so that the distance between the pair of microphones closest to the sound source S is 12 cm, with 0 cm and the sampling frequency being 44.1 kHz,
6.0 cm, 10.69 cm, left and right from the center o of the array,
Symmetrical positions separated by 16.56 cm and 20.96 cm are determined as microphone installation positions.

【0076】上記図8,9においては、前記サンプリン
グ周波数から得られる1サンプリング期間内に音の進む
距離λを前記(4)(6)式にあてはめて、各マイクロ
ホンMの理論上の設置位置が算出される。さらに音信号
の周波数の帯域が300〜4000HZの範囲にあるとし
た場合、この周波数帯域の信号をサンプリングの定理に
基づいてサンプリングするのに必要なサンプリング周波
数(600〜8000HZ)から、8.5〜113cmの波
長の信号をサンプリングするために各マイクロホンを約
4.25〜66.7cmの間隔をおいて設置する必要があ
る。したがって上記の各実施例では、算出されたマイク
ロホンの理論上の設置位置の中から前記の条件を満たす
設置位置を選択し、さらに選択された設置位置に近似す
る位置に各マイクロホンを設置するようにしている。
In FIGS. 8 and 9, the distance λ of the sound within one sampling period obtained from the sampling frequency is applied to the equations (4) and (6), and the theoretical installation position of each microphone M is determined. Is calculated. Further, assuming that the frequency band of the sound signal is in the range of 300 to 4000 Hz, the sampling frequency (600 to 8000 Hz) necessary for sampling the signal of this frequency band based on the sampling theorem is 8.5 to 8.5 Hz. In order to sample a signal having a wavelength of 113 cm, it is necessary to place the microphones at intervals of about 4.25 to 66.7 cm. Therefore, in each of the above embodiments, an installation position that satisfies the above conditions is selected from the calculated theoretical installation positions of the microphones, and each microphone is installed at a position that is close to the selected installation position. ing.

【0077】ただしこの設置位置は、厳密にいうと、図
1に示した同心球の周面に対し、所定距離だけずれた位
置に配置されていることになる。しかしながらその位置
ずれ量が後記する誤差範囲内であるか、またはサンプリ
ング周波数の調整を行うことにより、認識処理に十分な
精度の音信号を抽出することができる。
However, strictly speaking, this installation position is located at a position shifted by a predetermined distance from the peripheral surface of the concentric sphere shown in FIG. However, if the displacement is within an error range to be described later, or by adjusting the sampling frequency, it is possible to extract a sound signal with sufficient accuracy for recognition processing.

【0078】(3)ソフトウエアによる信号処理 前記した図3,4の実施例では、各マイクロホンM0
3からの出力信号をハードウエアにより処理するよう
にしているが、これに限らず、各マイクロホンM 0〜M3
からの出力信号をコンピュータに入力して、内部に組み
込まれたプログラムにより処理することも可能である。
(3) Signal Processing by Software In the embodiments of FIGS.0~
MThreeOutput signal from hardware
But not limited to this, each microphone M 0~ MThree
Input the output signal from the
It is also possible to perform processing by an embedded program.

【0079】図10は、前記図5に示した配置によるマ
イクロホンアレイ1からの出力信号をソフトウエアによ
り処理する音信号処理装置の構成を示す。この音信号処
理装置10は、4チャンネル方式のアンプ2AやA/D
コンバータ3Aのほか、マイクロコンピュータによる信
号処理部8を具備して成る。同じ球Cnの周面を設置基
準とする一対のマイクロホンMn,M´nは、それぞれミ
キシング回路31a〜31dにより重畳された後、アン
プ2Aを介してA/Dコンバータ3Aに同時に入力され
る。A/Dコンバータ3Aは、各重畳信号を所定のサン
プリング周期により順次サンプリングして信号処理部8
に出力するもので、この結果、信号処理部8には、サン
プリングの都度、各球Cn毎に、その球Cnに対応する2
個のマイクロホンの出力信号が統合された4個のサンプ
リング値が入力されることになる。
FIG. 10 shows a configuration of a sound signal processing apparatus for processing output signals from the microphone array 1 having the arrangement shown in FIG. 5 by software. The sound signal processing device 10 includes a 4-channel amplifier 2A and an A / D
In addition to the converter 3A, a signal processing unit 8 using a microcomputer is provided. A pair of microphones M n of the installation based on the peripheral surface of the same sphere C n, M'n, after being superimposed by respectively mixing circuit 31 a to 31 d, are simultaneously input to the A / D converter 3A via the amplifier 2A . The A / D converter 3A sequentially samples each superimposed signal at a predetermined sampling period, and
As a result, every time sampling is performed, the signal processing unit 8 outputs, for each sphere C n , 2 corresponding to the sphere C n.
Four sampling values obtained by integrating the output signals of the microphones are input.

【0080】この方式を用いれば、各球に多数のマイク
ロホンを対応させた場合にも、ディジタル処理の前に処
理対象の信号数を減らすことができる。したがってA/
D変換の対象となる信号の数や演算量を削減して、効率
の良い信号処理を行うことができる。
By using this method, the number of signals to be processed can be reduced before digital processing even when a large number of microphones are assigned to each sphere. Therefore A /
Efficient signal processing can be performed by reducing the number of signals to be D-converted and the amount of calculation.

【0081】図11は、マイクロホンの設置面(図示せ
ず)上に所定大きさの矩形枠9を仮想設定し、その枠に
沿って20個のマイクロホンを設置した例を示す。なお
この図示例では、音源Sは、この矩形枠9の中心点Oの
位置で設置面に直交する直線ls上に、50cmの距離を
隔てて位置するものと想定されている。またこの図示例
では、各マイクロホンを共通の符号Mで示すとともに、
それぞれの設置位置を、1〜20の数字により示してい
る。
FIG. 11 shows an example in which a rectangular frame 9 of a predetermined size is virtually set on a microphone installation surface (not shown), and 20 microphones are installed along the frame. In the illustrated example, it is assumed that the sound source S is located at a position of the center point O of the rectangular frame 9 on a straight line ls orthogonal to the installation surface at a distance of 50 cm. In this illustrated example, each microphone is indicated by a common symbol M,
The respective installation positions are indicated by numerals 1 to 20.

【0082】図示例の矩形枠9は、幅40cm,長さ30
cmの大きさをとり、音源Sの仮想位置に対し、幅方向
(図中横方向)の各枠体が52.20cmの距離に、長さ
方向(図中縦方向)の各枠体が53.85cmの距離に、
それぞれ位置するように設定されている。そして音源S
の仮想位置を中心として前記距離λずつ半径が変動する
同心球のうち、前記矩形枠と交わる4個の球を選択し、
20個のマイクロホンを、選択された各球と矩形枠との
交差位置に対応させて設置してある。なおこの場合も、
すべての交差位置にマイクロホンを対応させる必要はな
く、また理論上の交差位置から所定の誤差範囲内にマイ
クロホンを設置してもよい。
The rectangular frame 9 in the illustrated example has a width of 40 cm and a length of 30 cm.
With respect to the virtual position of the sound source S, each frame in the width direction (horizontal direction in the figure) is at a distance of 52.20 cm, and each frame in the length direction (vertical direction in the figure) is 53 At a distance of .85 cm,
Each is set to be located. And sound source S
From among the concentric spheres whose radius varies by the distance λ with the virtual position as the center, four spheres that intersect the rectangular frame are selected,
Twenty microphones are installed corresponding to the intersections between the selected spheres and the rectangular frame. Also in this case,
It is not necessary to make the microphone correspond to every intersection position, and the microphone may be set within a predetermined error range from the theoretical intersection position.

【0083】図示例では、各マイクロホンに対するサン
プリング周波数を44.1KHZとすることにより、幅方
向においては枠中心から8.04cm,15.17cm,2
0cm離れた対称位置を、長さ方向においては、枠中心か
ら7.42cm,11.81cm,15cm離れた対称位置
を、それぞれマイクロホンの設置位置に設定し、これら
の設定位置と矩形枠とにより特定される20個の位置
に、それぞれマイクロホンMを設置している。上記の設
定により、図示例では、各マイクロホンMをそれぞれの
設置基準となる球に基づいてグループ分けすると、1,
6,15,20の各位置に設置されたマイクロホンの組
と,7,8,13,14の各位置に設置されたマイクロ
ホンの組と、2,5,9,10,11,12,16,1
9の各位置に設置されたマイクロホンの組と、3,4,
17,18の各位置に設置されたマイクロホンの組との
4グループが設定されるようになる。
In the illustrated example, by setting the sampling frequency for each microphone to 44.1 KHZ, 8.04 cm, 15.17 cm, 2
A symmetrical position separated by 0 cm and a symmetrical position 7.42 cm, 11.81 cm, and 15 cm away from the center of the frame in the length direction are set as microphone installation positions, respectively, and specified by the set position and the rectangular frame. The microphones M are respectively installed at the 20 positions to be set. According to the above setting, in the illustrated example, when the microphones M are grouped based on the spheres serving as the installation reference, 1,
A set of microphones installed at each position of 6,15,20, a set of microphones installed at each position of 7,8,13,14, and a set of microphones 2,5,9,10,11,12,16, 1
9 and a set of microphones installed at each position
Four groups including the microphones set at the positions 17 and 18 are set.

【0084】図12は、上記図11のように設置された
各マイクロホンMを用いた音信号処理装置10の構成を
示す。この装置10は前記図10に示したのと同様の構
成のもので、各マイクロホンMの出力信号は、ミキシン
グ回路31A〜31Dにより設置基準となる球に応じて
設定された4つのグループ毎に重畳されてから、アンプ
2Aを介してA/Dコンバータ3Aに入力され、所定の
サンプリング周期によりサンプリングされる。したがっ
てサンプリング毎に、4個のサンプリング値が生成され
て信号処理部8に入力される。
FIG. 12 shows a configuration of the sound signal processing apparatus 10 using the microphones M installed as shown in FIG. This device 10 has the same configuration as that shown in FIG. 10, and the output signal of each microphone M is superimposed on each of four groups set by the mixing circuits 31A to 31D according to the sphere serving as the installation reference. After that, the signal is input to the A / D converter 3A via the amplifier 2A and is sampled at a predetermined sampling cycle. Therefore, for each sampling, four sampling values are generated and input to the signal processing unit 8.

【0085】従来のこの種の信号処理では、20個のマ
イクロホンMを設置すると、各マイクロホンM毎に遅延
フィルタを用いた畳み込み演算を行う必要が生じるた
め、膨大な量の演算を行う必要があった。これに対し、
この実施例では、サンプリング周期毎に4個の信号の総
和を算出するだけでよいから、演算量は大幅に削減され
る。しかも20個のマイクロホンにより、音源Sを取り
囲む複数位置で音信号を採取することが可能となるの
で、音源S以外の空間位置で発生したノイズを精度よく
除去し、音源Sからの音信号を強めて抽出することが可
能となる。
In conventional signal processing of this type, if 20 microphones M are installed, it is necessary to perform convolution operation using a delay filter for each microphone M, so that an enormous amount of operation needs to be performed. Was. In contrast,
In this embodiment, since it is only necessary to calculate the sum of the four signals for each sampling period, the amount of calculation is greatly reduced. Moreover, since 20 microphones can collect sound signals at a plurality of positions surrounding the sound source S, noise generated at spatial positions other than the sound source S is accurately removed, and the sound signal from the sound source S is strengthened. Can be extracted.

【0086】図13は、前記図10および図12の音信
号処理装置10の具体的な構成を示す。この音信号処理
装置10は、パーソナルコンピュータであって、制御主
体となるCPU11に、ROM12,RAM13の各メ
モリやハードディスク装置14が接続されて制御部15
が構成される。さらにこの制御部15に対し、CD−R
OMドライブ16,キーボード17,モニタ18などの
入出力部のほか、前記4チャンネルのアンプ2AやA/
Dコンバータ3Aなどが搭載されたサウンドカード19
が接続される。
FIG. 13 shows a specific configuration of the sound signal processing device 10 shown in FIGS. 10 and 12. The sound signal processing device 10 is a personal computer, and a CPU 11 serving as a control main body is connected to respective memories such as a ROM 12 and a RAM 13 and a hard disk device 14.
Is configured. Further, a CD-R
In addition to input / output units such as an OM drive 16, a keyboard 17, and a monitor 18, the four-channel amplifiers 2A and A /
Sound card 19 equipped with D converter 3A etc.
Is connected.

【0087】上記構成の装置10では、あらかじめハー
ドディスク装置14内に、後記する図14のアルゴリズ
ムを実行するための制御プログラムが組み込まれるもの
で、CPU11がその制御プログラムを実行することに
より前記図10,11の信号処理部8の機能が実現する
ことになる。なおハードディスク装置14内の制御プロ
グラムは、このプログラムが記録されたCD−ROMを
CD−ROMドライブ16にセットして、所定のインス
トール作業を実行することにより、格納されたものであ
る。ただしこれに限らず、CD−ROM以外の記録媒体
に記録されたプログラムや、外部データベースとの通信
によりダウンロードされたプログラムを、ハードディス
ク装置14内に格納することも可能である。
In the device 10 having the above-described configuration, a control program for executing the algorithm shown in FIG. 14, which will be described later, is incorporated in the hard disk device 14 in advance, and the CPU 11 executes the control program to execute the algorithm shown in FIG. The functions of the eleven signal processing units 8 are realized. The control program in the hard disk device 14 is stored by setting a CD-ROM on which the program is recorded in the CD-ROM drive 16 and performing a predetermined installation operation. However, the present invention is not limited to this, and a program recorded on a recording medium other than the CD-ROM or a program downloaded through communication with an external database can be stored in the hard disk device 14.

【0088】さらにRAM13またはハードディスク装
置14内には、サウンドカードより取り込まれた音声信
号のサンプリング値を格納するための記憶領域が設定さ
れ、設置基準を同じくするマイクロホンM毎に統合され
たサンプリング値が、サンプリング順に所定個数まで記
憶保持される。このサンプリング値の記憶に関しては、
前記図3,4のハード構成による信号処理と同様に、そ
れぞれマイクロホンの設置基準となる球に応じて保持デ
ータ数を変動させるようにしてもよいが、ここでは処理
を簡単化するために、いずれの入力経路についても、処
理に必要な最大のデータ量を考慮した一定量のサンプリ
ング値が格納されるものとする。
Further, in the RAM 13 or the hard disk device 14, a storage area for storing a sampling value of an audio signal taken from a sound card is set, and a sampling value integrated for each microphone M having the same installation standard is stored. , And up to a predetermined number in the sampling order. Regarding the storage of this sampling value,
Similar to the signal processing by the hardware configuration of FIGS. 3 and 4, the number of held data may be varied according to the spheres which are the microphone installation reference. However, in order to simplify the processing, It is also assumed that a fixed amount of sampling value considering the maximum amount of data required for processing is stored also for the input path of.

【0089】ここで説明を簡単にするために、N個のマ
イクロホンが、それぞれ異なる球の周面に対応づけられ
て設定されているものとする。このとき最も外側に設置
されるマイクロホンM0に対応する球C0と、最も内側に
設置されるマイクロホンMN- 1に対応する球CN-1との間
に、所定サンプル数aN-1分の距離の開きがあるものと
すると、各マイクロホンにつき、少なくともaN-1回分
のサンプリングを行うとともに、最も内側のマイクロホ
ンMN-1について、現時点のサンプリング値を含む過去
N-1回のサンプリング値を記憶保持する必要がある。
Here, for the sake of simplicity, it is assumed that N microphones are set in correspondence with the peripheral surfaces of different spheres. At this time, a predetermined number of samples a N−1 is placed between the sphere C 0 corresponding to the microphone M 0 installed on the outermost side and the sphere C N−1 corresponding to the microphone M N− 1 installed on the innermost side. Assuming that there is an interval of minutes, at least a N-1 times of sampling is performed for each microphone, and the past a N-1 times of the innermost microphone M N-1 including the current sampling value are sampled. It is necessary to store the sampling value.

【0090】よって図13の実施例では、設置されるN
個のマイクロホンMn(0≦n≦N−1)について、そ
れぞれ毎時aN-1回分のサンプリング値によるデータ列
nをRAM13内に保持させる(以下このデータ列Dn
を「サンプリング列Dn」という)。またマイクロホン
n毎に、その設置基準となる球Cnの周面と音源Sから
最も遠いマイクロホンM0に対応する球C0の周面との間
の距離anλに対応するサンプリング回数an(n=0の
ときan=0,n>0のときan>0)が、各マイクロホ
ンMnに対応づけてRAM13内に格納されている。
Therefore, in the embodiment shown in FIG.
For each of the microphones M n (0 ≦ n ≦ N−1), a data sequence D n based on a N−1 sampling values per hour is stored in the RAM 13 (hereinafter, this data sequence D n).
Is referred to as “sampling sequence D n ”). Also, for each microphone Mn , the number of samplings a corresponding to the distance a n λ between the peripheral surface of the sphere C n , which is the installation reference, and the peripheral surface of the sphere C 0 corresponding to the microphone M 0 furthest from the sound source S n (an = 0 when n = 0, an> 0 when n > 0) is stored in the RAM 13 in association with each microphone Mn .

【0091】図14は、上記のように設定された音信号
処理装置10による信号処理の手順を示す。なお図中の
STは、処理のステップを意味する。CPU11は、S
T1で、サンプリング回数のカウンタtをゼロリセット
した後、以下このカウンタtがaN-1に達するまで順次
インクリメントしつつ、ST2〜9の処理を行う。これ
により、各マイクロホンより新たな音声信号がサンプリ
ングされる都度、出力データO(t)が生成される。
FIG. 14 shows a procedure of signal processing by the sound signal processing device 10 set as described above. Note that ST in the figure means a processing step. The CPU 11
After resetting the counter t of the number of times of sampling to zero at T1, the processes of ST2 to ST9 are performed while sequentially incrementing the counter t until it reaches aN -1 . Thus, each time a new audio signal is sampled from each microphone, output data O (t) is generated.

【0092】CPU11は、まずST2で出力データO
(t)を、ST3で着目するマイクロホンを特定するた
めのカウンタnを、それぞれゼロリセットした後、続く
ST4,5で、n個目のマイクロホンMnにかかるサン
プリング列Dnに対する読出し位置pをt−anに設定
し、その位置にあるサンプリング値Dn(p)を読み出
す。これにより、最も外側のマイクロホンM0について
は現時点でのサンプリング値が、マイクロホンM0より
内側の任意位置のマイクロホンMnについては、an回前
に得られたサンプリング値が、それぞれ抽出されること
になる。
The CPU 11 first outputs the output data O in ST2.
In (t), the counter n for specifying the microphone of interest in ST3 is reset to zero, and then in ST4 and ST5, the reading position p for the sampling sequence D n for the n-th microphone M n is set to t. set -a n, reads the sampled value D n (p) at that position. As a result, the sampling value at the present time is extracted for the outermost microphone M 0 , and the sampling value obtained a n times earlier is extracted for the microphone M n at an arbitrary position inside the microphone M 0. become.

【0093】さらにつぎのST6で、CPU11は、読
み出されたサンプリング値Dn(p)を前記出力データ
O(t)に加算する。以下、ST7でnをインクリメン
トしつつ、このST4〜6の処理をN個のマイクロホン
について順次行うことにより、つぎの(7)式が実行さ
れ、音源Sからの音信号が強められた出力データO
(t)を得ることになる。
In the next ST6, the CPU 11 adds the read sampling value D n (p) to the output data O (t). Thereafter, the processing of ST4 to ST6 is sequentially performed on N microphones while incrementing n in ST7, whereby the following equation (7) is executed, and the output data O in which the sound signal from the sound source S is strengthened is obtained.
(T) is obtained.

【0094】[0094]

【数7】 (Equation 7)

【0095】こうして得られた出力データO(t)は、
ST9において、音量調整のためにマイク数Nで割られ
て平均化され、t回目のサンプリング処理に対するディ
ジタル音信号として外部に出力もしくはメモリ内に保存
される。なお前記した図10,12の実施例のように、
1つの球の周面に複数個のマイクロホンを対応づけて設
置している場合は、前記ST4〜8のループは、マイク
ロホンの設置数によるN回ではなく、マイクロホンの設
置基準となる球の数に対応する回数だけ、実行されるこ
とになる。
The output data O (t) thus obtained is
In ST9, the volume is divided by the number of microphones N for volume adjustment, averaged, and externally output or stored in a memory as a digital sound signal for the t-th sampling process. In addition, as in the embodiments of FIGS.
When a plurality of microphones are installed in association with the peripheral surface of one sphere, the loop of ST4 to ST8 is not performed N times depending on the number of installed microphones, but is performed based on the number of spheres used as the microphone installation reference. It will be executed a corresponding number of times.

【0096】上記図14のアルゴリズムによれば、ST
4〜8のループを通る毎に3回の加算処理を行い、ルー
プを抜けた後に2回の加算処理を行うだけであるから、
1サンプリング期間内における演算量は、わずか3N+
2回となる。したがって仮にN=20として44.1K
HZのサンプリング周期により処理を行うと、1秒間の演
算量は、約273.42万回となり、汎用のCPUでも
十分に処理できる単位となる。さらに前記した図10や
図12の実施例によればN=4とおけるから、1秒間の
演算量はわずか61.74万回で済む。
According to the algorithm shown in FIG.
Since the addition process is performed three times each time the loop of 4 to 8 is performed, and the addition process is performed twice after the loop is exited,
The amount of calculation within one sampling period is only 3N +
Two times. Therefore, assuming N = 20, 44.1K
When processing is performed at the HZ sampling cycle, the amount of calculation per second is about 273.42 million, which is a unit that can be sufficiently processed by a general-purpose CPU. Further, according to the above-described embodiments of FIGS. 10 and 12, since N = 4, the amount of calculation per second is only 617,400.

【0097】ところで、空間内を音が進行する速度は、
温度によって変動することが知られている。一般に、音
速vと温度TPとの間には、v=331.5+0.60
7TPの関係があるので、温度がTP0からΔtpだけ上
昇した場合、温度がTP0のときの音速v0に対する音速
の変動率RTvは、つぎの(8)式で表される。
By the way, the speed at which the sound travels in the space is
It is known to fluctuate with temperature. Generally, between the sound speed v and the temperature TP, v = 331.5 + 0.60
Since there are relationship 7tp, temperature when increased by Δtp from TP 0, variation rate RT v of sound for the sound velocity v 0 when the temperature TP 0 is expressed by equation (8) below.

【0098】[0098]

【数8】 (Equation 8)

【0099】上記した各実施例においては、各マイクロ
ホンは固定された位置に設置されているので、温度の変
動により音速vが変化すると、各マイクロホンの設置基
準となる同心球の位置関係に狂いが生じ、音源Sからの
音信号を位相を揃えて集められなくなる。この問題を解
決するには、適宜、マイクロホンの設置空間における温
度を検出し、その検出値の変化に応じてサンプリング周
期を変動させるようにする必要がある。具体的には、音
速vがRTv倍になることに応じてサンプリング周波数
fもRTv倍に変動させれば、1サンプリング期間内に
音の進む距離λ(λ=v/f)は常に一定になり、音源
Sからの音信号を安定して取得することができる。
In each of the above embodiments, since each microphone is installed at a fixed position, if the sound speed v changes due to a change in temperature, the positional relationship of concentric spheres, which are the installation reference of each microphone, is not correct. As a result, the sound signals from the sound source S cannot be collected with the same phase. In order to solve this problem, it is necessary to appropriately detect the temperature in the installation space of the microphone, and to change the sampling cycle according to a change in the detected value. Specifically, if the change also RT v times the sampling frequency f in response to the sound velocity v is RT v times, the distance traveled by the sound within one sampling period λ (λ = v / f) is always constant , And a sound signal from the sound source S can be stably acquired.

【0100】図15は、上記のサンプリング周期の補正
機能を備えた音信号処理装置10の概略構成を示す。図
中、信号処理部8には、周波数設定部20,音速算出部
21,サンプリングデータ記憶部23,データ処理部2
4,データ出力部25の各部が設定される。なおこれら
の機能は、前記図10,12の実施例と同様に、前記図
13の制御部15により実現するもので、サンプリング
データ記憶部23はRAM13またはハードディスク装
置14内に設定される。またその他の機能は、ハードデ
ィスク装置14内にインストールされた制御プログラム
とCPU11とにより、実現するものである。さらにハ
ード構成として、前記サウンドカード19のほかに、外
部温度を計測するための温度センサ26が設置される。
FIG. 15 shows a schematic configuration of a sound signal processing device 10 having the above-described function of correcting the sampling period. In the figure, a signal processing unit 8 includes a frequency setting unit 20, a sound velocity calculation unit 21, a sampling data storage unit 23, a data processing unit 2
4. Each part of the data output unit 25 is set. These functions are realized by the control unit 15 of FIG. 13 similarly to the embodiments of FIGS. 10 and 12, and the sampling data storage unit 23 is set in the RAM 13 or the hard disk device 14. Other functions are realized by the control program installed in the hard disk device 14 and the CPU 11. Further, as a hardware configuration, a temperature sensor 26 for measuring an external temperature is installed in addition to the sound card 19.

【0101】図16は、上記図15の装置における処理
手順を示す。なおここでは図14の手順と区別するため
に、各手順を「st」で示す。音速算出部21は、前記
温度センサ26により検知された温度TPを所定のタイ
ミングで読み取って音速vを算出する(st1,2)。
つぎに周波数設定部20により、この音速vの算出値と
所定時間前の算出値v0とから音速の変化率RTvが求め
られ、その算出値に応じて音信号のサンプリング周波数
fを変動設定させる(st3)。
FIG. 16 shows a processing procedure in the apparatus shown in FIG. Here, each procedure is indicated by “st” to distinguish it from the procedure of FIG. The sound speed calculation unit 21 reads the temperature TP detected by the temperature sensor 26 at a predetermined timing and calculates the sound speed v (st1, 2).
Then the frequency setting unit 20, the sound speed v calculated value and a predetermined time before the calculated value v 0 Metropolitan from sound velocity change rate RT v of prompts, variation sets the sampling frequency f of the sound signal according to the calculated value (St3).

【0102】つぎにst4では、サウンドカード19上
のA/Dコンバータにより、前記変動設定されたサンプ
リング周波数による音声信号のサンプリングが行われ、
サンプリングデータ記憶部23に、各マイクロホン毎の
N-1個のサンプリング値が格納される。これによりs
t5でデータ処理部24による一連のデータ処理が行わ
れて出力信号O(t)が生成され、データ出力部25よ
り出力される(st6)。なおこのst5,6の処理
は、前記した図14のST1〜ST9の手順に準ずるも
のであり、こでは詳細な手順の説明は省略する。
Next, at st4, the A / D converter on the sound card 19 samples the audio signal at the sampling frequency set as above.
The sampling data storage unit 23 stores a N−1 sampling values for each microphone. This gives
At t5, a series of data processing is performed by the data processing unit 24 to generate an output signal O (t), which is output from the data output unit 25 (st6). Note that the processing of st5 and st6 is in accordance with the above-described procedure of ST1 to ST9 in FIG. 14, and a detailed description of the procedure will be omitted.

【0103】以下同様にして、サンプリングが行われる
都度、マイクロホン毎のサンプリング列Dnより音源S
からの音信号の位相を揃えたサンプリング値が抽出さ
れ、各抽出値を平均化したディジタル信号による出力信
号O(t)が出力される。そしてaN-1回のサンプリン
グが完了すると、ST7が「YES」となり、処理を終
了する。
Similarly, every time sampling is performed, the sound source S is obtained from the sampling train D n for each microphone.
A sampling value in which the phases of the sound signals from are extracted is extracted, and an output signal O (t) based on a digital signal obtained by averaging the extracted values is output. When the sampling of aN -1 times is completed, ST7 becomes "YES", and the process ends.

【0104】なお上記の実施例によれば、aN-1回分の
サンプリングが終了する都度、温度TPの変化をチェッ
クしてサンプリング周波数fを変動設定するようにして
いるが、これに限らず、aN-1回の所定倍にあたる任意
の時間毎にサンプリング周波数fを設定し直すようにし
てもよい。
According to the above-described embodiment, each time the sampling of a N−1 times is completed, the change of the temperature TP is checked and the sampling frequency f is set to fluctuate. However, the present invention is not limited to this. The sampling frequency f may be reset every arbitrary time corresponding to a predetermined multiple of aN-1 times.

【0105】(4)音声認識処理装置の具体例 図17は、音声認識処理の機能が組み込まれたパーソナ
ルコンピュータ30(以下「PC30」と略す)に、こ
の発明を適用した場合の装置の外観を、図18は、この
装置の各マイクロホンMとPC30との接続状態を示す
回路構成を、それぞれ示す。なおPC30は、前記した
図13と同様の制御部15や周辺装置を具備するもので
あるので、図18では、その詳細な内部構成は割愛する
とともに、図17,18において図13と共通の構成を
同じ符号により示す。
(4) Specific Example of Speech Recognition Processing Apparatus FIG. 17 shows the appearance of the apparatus when the present invention is applied to a personal computer 30 (hereinafter abbreviated as “PC 30”) in which the function of speech recognition processing is incorporated. 18 shows a circuit configuration showing the connection state between each microphone M of this device and the PC 30. Note that the PC 30 includes the same control unit 15 and peripheral devices as those in FIG. 13 described above. Therefore, in FIG. 18, the detailed internal configuration is omitted, and in FIGS. Are denoted by the same reference numerals.

【0106】またPC30には、音信号の処理や音声認
識の機能のほかに、ワープロ、表計算などの各種アプリ
ケーションが組み込まれている。制御部は、これらのア
プリケーションの実行下でデータ入力の必要が生じた場
合に、各マイクロホンアレイ1A〜1Dからの音声入力
を受け付けて、その入力内容を認識し、入力データにに
応じた処理を行う。モニタ18には、認識された音声に
よる入力データやその入力データによる処理結果などが
表示される。
The PC 30 incorporates various applications such as a word processor and a spreadsheet, in addition to the sound signal processing and voice recognition functions. The control unit receives a voice input from each of the microphone arrays 1A to 1D and recognizes the input content when a data input is required under execution of these applications, and performs a process according to the input data. Do. The monitor 18 displays input data based on the recognized voice, a processing result based on the input data, and the like.

【0107】この実施例は、モニタ18の表示画面18
aの周縁部に4個のマイクロホンアレイ1A,1B,1
C,1Dを配置して、これらマイクロホンアレイ1A〜
1D上の各マイクロホンMにより取り込まれた音信号を
処理して、入力データを生成するようにしている。なお
マイクロホンアレイ1A〜1Dの入力対象となる音源S
は、モニタ18の中心点より所定距離だけ前方位置に仮
想設定される。
In this embodiment, the display screen 18 of the monitor 18
a four microphone arrays 1A, 1B, 1
C and 1D are arranged and these microphone arrays 1A to
The sound signal captured by each microphone M on the 1D is processed to generate input data. The sound source S to be input to the microphone arrays 1A to 1D
Is virtually set at a position ahead of the center point of the monitor 18 by a predetermined distance.

【0108】各マイクロホンアレイ1A〜1Dには、そ
れぞれ4個のマイクロホンMが、前記音源Sを中心とし
て半径がiλ(iは所定のサンプリング回数に対応する
自然数)だけ離れた2個の球の周面に対応する位置に、
設置される。図中、アルファベット符号のPを付したマ
イクロホンM(各基板の外側位置に設置されたマイクロ
ホン)は径の大きい方の仮想球に対応し、Qの符号を付
したマイクロホンM(各基板の内側位置に設置されたマ
イクロホン)は径の小さい方の仮想球に対応する。各マ
イクロホンの出力信号は、サウンドカード19の前段に
配置されたミキシング回路31により、P,Qの各グル
ープ毎に重畳された後、サウンドカード19に入力さ
れ、それぞれ一定のサンプリング周期によりサンプリン
グされる。
In each of the microphone arrays 1A to 1D, four microphones M are provided around two spheres having a radius of iλ (i is a natural number corresponding to a predetermined number of samplings) and a center of the sound source S. In the position corresponding to the surface,
Will be installed. In the figure, a microphone M with an alphabetic symbol P (a microphone installed at an outer position on each substrate) corresponds to a virtual sphere having a larger diameter, and a microphone M with a Q symbol (an inner position on each substrate). Microphone) corresponds to the virtual sphere having the smaller diameter. The output signal of each microphone is superimposed for each group of P and Q by a mixing circuit 31 arranged in the preceding stage of the sound card 19, and then input to the sound card 19, and is sampled at a constant sampling period. .

【0109】この実施例の場合、P,Qの各グループと
もに、仮想球とモニタ18の前面との交差により生じる
円弧に沿って設置された8個のマイクロホンMの音信号
を重畳した後にサンプリング処理を行うので、信号の重
畳処理の段階で各方向からのかなりのノイズが除去され
る。PC30内の制御部は、前記図14と同様のアルゴ
リズムにより、サンプリング毎に、Pグループの現時点
でのサンプリング値とQグループのiサンプル分だけ前
のサンプリング値とを加算して、前記音源からの音信号
を強調して抽出する。
In the case of this embodiment, sampling processing is performed after superimposing sound signals of eight microphones M installed along an arc generated by the intersection of the virtual sphere and the front surface of the monitor 18 in each of the groups P and Q. Therefore, considerable noise from each direction is removed at the stage of the signal superimposition process. The control unit in the PC 30 adds the current sampling value of the P group and the sampling value of the i group of the Q group before by the same algorithm as in FIG. The sound signal is emphasized and extracted.

【0110】よってユーザーの口がモニタ18の表示画
面18aの中心に合わせられて、音声によるデータ入力
がなされると、その発声により生じた音信号が各グルー
プP,Qの各マイクロホンMに取り込まれた後、前記し
た信号処理が行われて、ノイズの除去された音源Sから
の音を表す音信号が抽出される。さらに制御部は、この
最終的な音信号による時系列データを、RAMなどに格
納しつつ所定の音声認識処理を実行することにより、入
力データの内容を認識し、その内容に応じた処理を実行
することになる。なお音声によるデータ入力を受け付け
る状態にあるときは、表示画面18a上の仮想音源Sの
位置に対応させた位置に、ユーザーの口の理想位置を示
すポインタを表示してもよい。
Therefore, when the user's mouth is aligned with the center of the display screen 18a of the monitor 18 and data is input by voice, the sound signal generated by the voice is taken into each microphone M of each group P and Q. After that, the above-described signal processing is performed to extract a sound signal representing a sound from the sound source S from which noise has been removed. Further, the control unit recognizes the content of the input data by executing a predetermined voice recognition process while storing the time-series data based on the final sound signal in a RAM or the like, and executes a process according to the content. Will do. When data input by voice is accepted, a pointer indicating the ideal position of the user's mouth may be displayed at a position corresponding to the position of the virtual sound source S on the display screen 18a.

【0111】(5)音声認識処理装置の具体例 図19は、駅に設置される券売機35にこの発明を適用
した場合の装置外観を、図20は、その電気的構成を、
それぞれ示す。この実施例の券売機35は、前面に発券
処理にかかる複数個の操作キー36aが配置された操作
面36や、液晶パネルなどによる情報表示部37,貨幣
投入部38,券発行部39,釣り銭返却口40などが設
けられた公知の構成をとる。さらに前記操作面36の上
端部および下端部には、それぞれ音声入力用のマイクロ
ホンアレイ1E,1Fが設置されている。
(5) Specific Example of Speech Recognition Processing Apparatus FIG. 19 shows an external view of the apparatus when the present invention is applied to a ticket vending machine 35 installed in a station, and FIG.
Shown respectively. The ticket vending machine 35 of this embodiment has an operation surface 36 on the front surface of which a plurality of operation keys 36a related to a ticket issuing process are arranged, an information display unit 37 such as a liquid crystal panel, a currency insertion unit 38, a ticket issuing unit 39, a change. It has a known configuration provided with a return port 40 and the like. Further, microphone arrays 1E and 1F for voice input are provided at the upper end and the lower end of the operation surface 36, respectively.

【0112】上段および下段の各マイクロホンアレイ1
E,1Fは、高さが異なる2つの位置に仮想設定された
音源に対応するもので、それぞれ音源の仮想位置を中心
に半径の異なる3個の球の周面と前記操作面26との交
差位置を基準にして、各球毎に2個ずつ、計6個のマイ
クロホンMが設置されている。なお図20においても、
前記図18と同様に、同じ球を設置基準とするマイクロ
ホンMを、P,Q,R,P´,Q´,R´の符号により
グループ分けしている。
The upper and lower microphone arrays 1
E and 1F correspond to sound sources virtually set at two positions having different heights, and the intersection between the operation surface 26 and the peripheral surfaces of three spheres having different radii around the virtual position of the sound source. A total of six microphones M are provided, two for each ball, based on the position. In FIG. 20,
As in FIG. 18, the microphones M having the same sphere as the installation reference are grouped by the symbols P, Q, R, P ', Q', and R '.

【0113】機械内部には、各マイクロホンアレイ1
E,1F毎のアンプ2B,2B,A/Dコンバータ3
B、音声処理装置41,中央制御装置42が組み込まれ
る。さらに中央制御装置42には、入出力部として、各
操作キー36aや情報表示部37のほか、前記発券口3
9から指定された切符を発行するための発券処理部43
や、入金や釣り銭を処理するための入出金処理部44な
どが接続される。
Inside the machine, each microphone array 1
Amplifier 2B, 2B, A / D converter 3 for each E, 1F
B, the voice processing device 41 and the central control device 42 are incorporated. Further, the central control device 42 includes, as an input / output unit, not only the operation keys 36a and the information display unit 37, but also the
Ticketing processing unit 43 for issuing a ticket designated from 9
Also, a deposit and withdrawal processing unit 44 for processing deposits and changes is connected.

【0114】前記アンプ2B,2Bには3チャンネル方
式のアンプが、A/Dコンバータ3Bには6チャンネル
方式のものが、それぞれ採用される。各マイクロホンM
の音信号は、アンプの前段のミキシング回路31E,3
1Fで組毎に重畳された後、各アンプ2B,2Bを介し
てA/Dコンバータ3Bに入力される。A/Dコンバー
タ3Bは、入力された6個の音信号を順次個別にサンプ
リングして、そのサンプリング値を、音声処理装置41
に出力する。音声処理装置41は、これらサンプリング
値を、上下のマイクロホンアレイ1E,1F毎に前記図
14と同様の手順で処理して、認識処理用の音信号を抽
出する。
A three-channel amplifier is used for the amplifiers 2B and 2B, and a six-channel amplifier is used for the A / D converter 3B. Each microphone M
Is supplied to a mixing circuit 31E, 3 in the preceding stage of the amplifier.
After being superimposed on each set at 1F, the signals are input to the A / D converter 3B via the amplifiers 2B and 2B. The A / D converter 3B samples the input six sound signals sequentially and sequentially, and outputs the sampled values to the sound processing device 41.
Output to The sound processing device 41 processes these sampling values for each of the upper and lower microphone arrays 1E and 1F in the same procedure as in FIG. 14 to extract a sound signal for recognition processing.

【0115】中央処理装置42は、マイクロホンアレイ
1E,1F毎に得られた音信号の時系列データを、個別
に処理して入力データの内容を認識する。このとき発券
処理を指示する音声が認識されると、中央処理装置42
は、発券処理部43や入出金処理部44の動作を制御し
て、指示内容に応じた切符を発行する。なおこの場合、
各マイクロホンアレイ1E,1Fにより発券処理を指示
する音声を抽出できる精度は、利用者の身長によって変
化する。したがってたとえば、各マイクロホンアレイ1
E,1F毎の音声認識結果を統合して最終的な認識を行
ったり、各マイクロホンアレイ1E,1F毎の初期の音
声認識結果から利用者の口の位置に近い方のマイクロホ
ンアレイを選択し、以後、選択されたマイクロホンアレ
イからの音信号を用いた認識処理を行う、などの方法が
とられることになる。
The central processing unit 42 individually processes the time-series data of the sound signals obtained for each of the microphone arrays 1E and 1F and recognizes the contents of the input data. At this time, when the voice instructing the ticket issuing process is recognized, the central processing unit 42
Controls the operations of the ticketing processing unit 43 and the deposit / withdrawal processing unit 44, and issues a ticket according to the instruction content. In this case,
The accuracy with which the voices instructing the ticket issuing process by the microphone arrays 1E and 1F can be extracted varies depending on the height of the user. Therefore, for example, each microphone array 1
The final recognition is performed by integrating the voice recognition results for each of the microphones E and 1F, and the microphone array closer to the mouth position of the user is selected from the initial voice recognition results for each of the microphone arrays 1E and 1F. Thereafter, a method such as performing recognition processing using a sound signal from the selected microphone array is adopted.

【0116】なお図19の操作面36は、下端が前方に
突き出る傾斜面となっているが、マイクロホンMの設置
対象となる面は、このような形態の面に限らず、平坦な
垂直面や曲面であってもよい。また図17の実施例のよ
うに、操作面の周囲に沿って複数個のマイクロホンMを
設置するようにしてもよい。
Although the operation surface 36 in FIG. 19 is an inclined surface whose lower end protrudes forward, the surface on which the microphone M is to be installed is not limited to such a surface, but may be a flat vertical surface or a flat surface. It may be a curved surface. Further, as in the embodiment of FIG. 17, a plurality of microphones M may be installed along the periphery of the operation surface.

【0117】(6)信号処理を安定化するための処理に
ついて 上記した各実施例は、いずれも図1に示した原理に基づ
き、音源Sの仮想位置を中心として1サンプリング期間
内に音が進む距離λずつ半径が変動する同心球のうち、
選ばれた所定数の球の周面上にマイクロホンが設置され
ていることを前提とするものである。しかしながら実際
の装置設計においては、設置面の大きさなどにより、マ
イクロホンを理論どおりに設置するのが困難になる場合
がある。
(6) Processing for Stabilizing Signal Processing In each of the above-described embodiments, the sound advances within one sampling period around the virtual position of the sound source S based on the principle shown in FIG. Of the concentric spheres whose radius varies by the distance λ,
It is assumed that microphones are installed on the peripheral surface of a predetermined number of selected spheres. However, in actual device design, it may be difficult to install the microphone as theoretically due to the size of the installation surface.

【0118】そこで出願人は、図1に示した理想のマイ
クロホンの設置位置に対する実際のマイクロホンの設置
位置のずれ量について、音声認識処理への影響が少ない
と見なされる許容値がどの位になるかを試算してみた。
Therefore, the applicant has determined how much an allowable value of the deviation of the actual microphone installation position from the ideal microphone installation position shown in FIG. 1 is considered to have little effect on the speech recognition processing. I tried to calculate.

【0119】まず説明を簡単にするために、周波数1H
Z,振幅1の正弦波w1とこの正弦波w1よりも位相がθ
(0≦θ<1)遅れた正弦波w2とを加算処理するもの
とする。ここで正弦波w1を、w1(t)=sin(2π
t)と表すと、各正弦波w1,w2を加算した波形w
aは、つぎの(9)式により表される。
First, in order to simplify the explanation, the frequency 1H
Z, a sine wave w 1 having an amplitude of 1 and a phase θ more than this sine wave w 1
(0 ≦ θ <1) Sine wave w 2 delayed is added. Here, the sine wave w 1 is expressed as w 1 (t) = sin (2π
t), a waveform w obtained by adding the sine waves w 1 and w 2
a is represented by the following equation (9).

【0120】[0120]

【数9】 (Equation 9)

【0121】したがってこの波形waについての1周期
あたりのパワーP(θ)を算出すると、つぎの(10)
式のようになる。
[0121] Therefore, when calculating the power P (theta) per one period of the waveform w a, the following (10)
It looks like an expression.

【0122】[0122]

【数10】 (Equation 10)

【0123】よってθ=0のとき、すなわち両正弦波w
1,w2の間に位相差がないとき、P(θ)は最大とな
り、その最大値をPmaxとすると、Pmax=2となる。こ
こで前記(10)式によるパワーP(θ)の低減をP
(θ)≧0.8Pmaxを満たす範囲まで許容するものと
すると、P(θ)=0.8Pmaxのときに位相差θが最
大となる。すなわち1+cos(2πθ)=1.6よ
り、θ=0.15までの位相のずれが認められることに
なる。
Therefore, when θ = 0, that is, both sine waves w
1, when there is no phase difference between w 2, P (θ) is maximum, when the maximum value P max, the P max = 2. Here, the reduction of the power P (θ) by the equation (10) is expressed by P
Assuming that a range satisfying (θ) ≧ 0.8P max is allowed, the phase difference θ becomes maximum when P (θ) = 0.8P max . That is, from 1 + cos (2πθ) = 1.6, a phase shift up to θ = 0.15 is recognized.

【0124】つぎに上記の条件を、音源Sに対し、前記
図1の関係をもって設定された球C nの周面に到達する
音信号と、この球Cnを基準として設置されたマイクロ
ホンM nに到達する音信号との関係にあてはめて考えて
みる。仮にマイクロホンMnが球Cnの周面上に位置して
いるものとすると、音源Sからの音信号は、球Cnの周
面とマイクロホンMnとに同じタイミングで到達するか
ら、球Cnの周面およびマイクロホンMnの得る音信号は
同位相となり、これらの信号を加算処理して得られる信
号のパワー値はPmaxとなる。これに対し、前記マイク
ロホンMnが球Cnの周面より内側または外側にずれた位
置に設置されていると、このマイクロホンMnには、球
nの周面上に到達した音信号に対して位相がずれた信
号が到達することになる。しかしながらこの位相のずれ
量eが0.15までであれば、前記マイクロホンMn
球Cnの周面上にあると見なして処理しても、大きな誤
差は生じない、ということになる。
Next, the above conditions are applied to the sound source S
Sphere C set in relation to FIG. nReach the circumference of
Sound signal and this sphere CnMicro installed based on
Hong M nTo the relationship with the sound signal arriving at
View. Temporarily microphone MnIs the ball CnLocated on the circumference of
If the sound signal from the sound source S isnLap of
Surface and microphone MnArrive at the same time as
Oh, ball CnPeripheral surface and microphone MnThe sound signal
The signals are in phase, and the signals obtained by adding these signals
The power value of the signal is PmaxBecomes In contrast, the microphone
Lohon MnIs the ball CnPosition shifted inward or outward from the circumference of
Microphone MnThe sphere
CnSignal out of phase with respect to the sound signal
No. will arrive. However, this phase shift
If the quantity e is up to 0.15, the microphone MnTo
Ball CnEven if it is regarded as being on the circumference of
That is, there is no difference.

【0125】ここで音速をv,サンプリング周波数をf
とすると、このサンプリング周波数fによる1サンプリ
ング期間に音が進む距離λはλ=v/fとなる。また人
間の音声を表す音信号の周波数の上限値をfmaxとする
と、この周波数fmaxの音が1周期に進む距離λmaxは、
λmax=v/fmaxとなる。また前記サンプリング周波数
fを周波数fmaxの音をサンプリングするのに必要な最
小の値に設定するものとすると、サンプリング定理によ
りf=2fmaxとなる。
Here, the sound speed is v and the sampling frequency is f
Then, the distance λ that the sound travels during one sampling period at this sampling frequency f is λ = v / f. Further, assuming that the upper limit value of the frequency of the sound signal representing a human voice is f max , the distance λ max at which the sound of this frequency f max advances in one cycle is:
λmax = v / fmax . Further assuming that sets the sampling frequency f to the minimum value required to sample the sound frequency f max, the f = 2f max by the sampling theorem.

【0126】この条件下でマイクロホンが理想の設置位
置である球Cnの周面からαλだけずれているものとす
ると、前記周波数fmaxの音信号をサンプリングする場
合に、この音信号に同期する位置よりαλだけずれた位
置での音信号の位相差eは、つぎの(11)式のように
なる。
[0126] When the microphone under these conditions it is assumed that offset by αλ from the circumferential surface of the sphere C n is the installation position of the ideal, when sampling sound signal of the frequency f max, synchronized with the sound signal The phase difference e of the sound signal at the position shifted from the position by αλ is as shown in the following equation (11).

【0127】[0127]

【数11】 [Equation 11]

【0128】したがってα/2<0.15より、理想の
位置に対するマイクロホンの設置位置のずれが0.3λ
以内であれば、音信号の理想のサンプリング値と現実の
サンプリング値とを加算した場合に、前記許容範囲とし
た0.8Pmax以上のパワー値を得ることができるか
ら、前記(7)式の総和演算を行う際に、理想のサンプ
リング値に代えて現実のサンプリング値を用いても、演
算の結果に生じる誤差を許容範囲に収めることができ
る。
Accordingly, from α / 2 <0.15, the deviation of the microphone installation position from the ideal position is 0.3λ.
Within this range, when the ideal sampling value and the actual sampling value of the sound signal are added, a power value of 0.8 P max or more as the allowable range can be obtained. When performing the summation operation, even if an actual sampling value is used instead of the ideal sampling value, an error generated in the calculation result can be kept within an allowable range.

【0129】図21は、サンプリング周波数f=2f
maxである場合のマイクロホンの設置位置の許容範囲を
示す。上記した原理により、半径が(r0−nλ)とな
る任意の球Cn(ただしr0は、音源より最も遠いマイク
ロホンに対応する基準の球C0の半径)の周面から内外
の各方向に距離0.3λ離れた位置(図中破線で示す境
界位置)までが、マイクロホンMnの設置許容範囲とな
る。すなわちこの許容範囲内に設置されたマイクロホン
nに対するサンプリング値をnサンプル分遅延して前
記(7)式に用いることにより、認識処理に十分な精度
の音信号が得られることになる。
FIG. 21 shows that the sampling frequency f = 2f
This shows the allowable range of the installation position of the microphone when it is max . According to the above-described principle, each direction in and out from the peripheral surface of an arbitrary sphere C n having a radius of (r 0 −nλ) (where r 0 is the radius of a reference sphere C 0 corresponding to the microphone farthest from the sound source) The position at which the microphone Mn is located at a distance of 0.3λ (the boundary position indicated by the broken line in the figure) is the installation allowable range of the microphone Mn . In other words, by using the sampling value for the microphone Mn set within the allowable range with a delay of n samples for use in the equation (7), a sound signal with sufficient accuracy for the recognition processing can be obtained.

【0130】さらにサンプリング周波数fを2fmax
り大きく設定した場合も、上記と同様の原理を適用する
ことができる。この場合、理想の設置位置に対するマイ
クロホンの位置ずれ量を0.5λまで許容できるような
サンプリング周波数fを設定すれば、任意の位置に設置
されたマイクロホンを、最も近い球の周面上にあるもの
と見なして処理することが可能となる。
[0130] Also further if the sampling frequency f was set larger than 2f max, principles may be applied in the same manner as mentioned above. In this case, if the sampling frequency f is set such that the amount of positional deviation of the microphone from the ideal installation position can be allowed up to 0.5λ, the microphone installed at an arbitrary position can be located on the peripheral surface of the nearest sphere. And it can be processed.

【0131】すなわちサンプリング周波数fをβ*f
maxとおいた場合、前記位相差eを0.15以内にする
ための条件は、前記(11)式と同様にして、e=0.
5λ/λmax=0.5/β≦0.15より、β≧3.3
3となる。
That is, when the sampling frequency f is β * f
max , the condition for keeping the phase difference e within 0.15 is the same as in the equation (11), e = 0.
From 5λ / λ max = 0.5 / β ≦ 0.15, β ≧ 3.3
It becomes 3.

【0132】よって図22に示すように、音源Sを中心
として半径がλだけ異なる2個の球Cn,Cn-1に対し、
マイクロホンMが各球の周面間の所定位置に設置されて
いるものとすると、このマイクロホンMに近い方の球の
周面(図示例では球Cn-1の周面)がマイクロホンMの
設置位置と見なされることになる。この場合、このマイ
クロホンMからの音信号を、3.33*fmaxの周波数
でサンプリングすることにより、球Cn-1の周面でサン
プリングした場合の音信号に対する位相差を、前記許容
値である0.15以内に留めることができる。
Therefore, as shown in FIG. 22, two spheres C n and C n-1 whose radii are different from each other by λ around the sound source S are
Assuming that the microphone M is installed at a predetermined position between the peripheral surfaces of the respective spheres, the peripheral surface of the sphere closer to the microphone M (in the illustrated example, the peripheral surface of the sphere C n-1 ) is mounted on the microphone M. Will be considered a position. In this case, the sound signal from the microphone M, by sampling at a frequency of 3.33 * f max, the phase difference with respect to a sound signal when sampled at the peripheral surface of a sphere C n-1, with the allowable value It can be kept within a certain 0.15.

【0133】人間の音声の最高周波数fmaxは約10KH
Zであるので、サンプリング周波数fを約34KHzに設
定すれば、任意の位置にあるマイクロホンを、音源Sを
中心とする同心球のうち、周面が最も近い球Cnに対応
づけることができる。すなわちこのマイクロホンのサン
プリング値を、球Cnの半径r0−nλに応じたn回分の
サンプリング分だけ遅延させて、前記(7)式の演算に
用いることにより、認識処理に十分な精度の音信号を得
ることができる。現在市販のA/Dコンバータには、サ
ンプリング周波数を48KHZにまで設定可能なものがあ
る。したがって、このA/Dコンバータと汎用のマイク
ロコンピュータとを組み合わせるとともに、各マイクロ
ホンを、A/Dコンバータのサンプリング周波数に基づ
く仮想の同心球の各周面のうち、マイクロホンに最も近
い周面に対応づけすれば、人間の音声から認識処理用の
ディジタル音声信号を生成する上で十分な精度の信号処
理を行うことができる。
The maximum frequency f max of human voice is about 10 KH
Since at Z, by setting the sampling frequency f of about 34 kHz, the microphone in the arbitrary position, of concentric spheres centered at the sound source S, it can be associated to the closest sphere C n circumferential surface. That is, the sampling value of this microphone is delayed by n sampling times corresponding to the radius r 0 −nλ of the sphere C n and used for the calculation of the above equation (7), whereby the sound with sufficient accuracy for the recognition processing is obtained. A signal can be obtained. There are A / D converters currently available on the market that can set the sampling frequency up to 48 KHz. Therefore, this A / D converter is combined with a general-purpose microcomputer, and each microphone is associated with the peripheral surface closest to the microphone among the respective peripheral surfaces of the virtual concentric sphere based on the sampling frequency of the A / D converter. This makes it possible to perform signal processing with sufficient accuracy for generating a digital voice signal for recognition processing from human voice.

【0134】なお前記パワー値の許容値は、0.8P
maxに限らず、任意の値を設定できるので、その設定値
に応じて、前記マイクロホンのずれ量の許容値αλや、
マイクロホンをいずれかの球の周面に対応づけるための
サンプリング周波数の許容値も、変動することになる。
The allowable value of the power value is 0.8 P
Not only max but an arbitrary value can be set, and according to the set value, an allowable value αλ of the microphone shift amount,
The allowable value of the sampling frequency for associating the microphone with the peripheral surface of one of the spheres also varies.

【0135】上記した原理によれば、各マイクロホンM
が音源Sを中心としてλずつ半径が変化する同心球の周
面上に正しく設置されていなくとも、十分なサンプリン
グ周波数をセットしてサンプリングを行うとともに、各
マイクロホンMが最も近い周面に設置されていると見な
して各サンプリング値を処理すればよい、ということに
なる。特に図13のようなコンピュータによる信号処理
を行う場合は、処理に先立ち、音源Sの仮想位置や各マ
イクロホンの設置位置の入力を受け付けて各マイクロホ
ンの理想の設置位置を自動計算し、その計算結果から各
サンプリング値の遅延時間を割り出して処理することが
できる。
According to the above principle, each microphone M
Is not set correctly on the circumference of a concentric sphere whose radius changes by λ around the sound source S, sampling is performed by setting a sufficient sampling frequency, and each microphone M is set on the closest circumference. That is, it is only necessary to process each sampled value assuming that the sampled value is satisfied. In particular, in the case of performing signal processing by a computer as shown in FIG. 13, prior to the processing, an input of a virtual position of the sound source S and an installation position of each microphone is received, and an ideal installation position of each microphone is automatically calculated. , The delay time of each sampling value can be determined and processed.

【0136】なおあらかじめ複数とおりのサンプリング
周波数毎に、そのサンプリング周波数に基づく各仮想球
の周面の位置データをテーブル化してメモリ内に保存し
ておき、各マイクロホンの設置位置によりこのテーブル
を参照して対応関係を求めるようにすれば、マイクロホ
ン毎のサンプリング値の遅延時間の設定処理を簡単かつ
高速化することができる。
For each of a plurality of sampling frequencies, the position data of the peripheral surface of each virtual sphere based on the sampling frequency is tabulated and stored in the memory, and this table is referred to by the installation position of each microphone. If the correspondence is determined by using the above method, the process of setting the delay time of the sampling value for each microphone can be simplified and speeded up.

【0137】また仮に各マイクロホンが音源Sの仮想位
置に対して図1の原理どおりに設置されたとしても、話
者の口がこの仮想位置からずれた位置におかれて、発声
が行われた場合は、各マイクロホンは、この真の音源位
置を中心とする同心球の周面からずれた位置に設置され
ていることになる。しかしながら各マイクロホンの得た
音信号の位相や強度から真の音源位置を推定した後に、
上記の方法を用いて推定された真の音源位置を中心とす
る仮想球の周面に、各マイクロホンを対応づけて信号処
理を行うようにすれば、音信号の抽出精度を安定させる
ことができる。
Also, even if each microphone is installed in accordance with the principle of FIG. 1 with respect to the virtual position of the sound source S, the speaker's mouth is placed at a position deviated from this virtual position, and utterance is performed. In this case, each microphone is placed at a position shifted from the peripheral surface of the concentric sphere centered on the true sound source position. However, after estimating the true sound source position from the phase and intensity of the sound signal obtained by each microphone,
If signal processing is performed by associating each microphone with the peripheral surface of the virtual sphere centered on the true sound source position estimated using the above method, the accuracy of sound signal extraction can be stabilized. .

【0138】すなわち推定された音源位置を中心として
λずつ半径が変動する同心球の各周面に各マイクロホン
を対応づけ、各マイクロホンのサンプリング値を新たに
対応づけられた球の球径に応じたサンプリング回数分だ
け遅延させて前記(7)式を実行することにより、音源
の位置の変動に対応することが可能となる。勿論、各マ
イクロホンを最も近い球の周面に対応づけるためには、
前記したように34KHZ以上のサンプリング周波数が設
定されている必要があるから、当初のサンプリング周波
数が34KHZを下回る場合は、サンプリング周波数を3
4KHZ以上に変更した上で、前記の対応づけ処理を行う
必要がある。
That is, each microphone is associated with each peripheral surface of a concentric sphere whose radius varies by λ around the estimated sound source position, and the sampling value of each microphone is determined according to the sphere diameter of the newly associated sphere. By executing the equation (7) with a delay corresponding to the number of times of sampling, it is possible to cope with a change in the position of the sound source. Of course, to map each microphone to the nearest sphere circumference,
As described above, it is necessary to set a sampling frequency of 34 KHZ or more. Therefore, if the initial sampling frequency is lower than 34 KHZ, the sampling frequency is set to 3 KHz.
It is necessary to perform the above-mentioned associating process after changing to 4 KHZ or more.

【0139】[0139]

【発明の効果】請求項1および6の発明によれば、所定
の空間位置に仮想設定される音源を中心として、それぞ
れの球径が一定のサンプリング周期に相当する音の進行
距離だけ順次変わるような同心球の周面が仮想設定さ
れ、これら同心球のうちの選ばれた複数の球の周面を基
準として、複数個のマイクロホンが設置される。したが
って各マイクロホン毎のサンプリング値を、それぞれそ
のマイクロホンの設置基準となる球と音源より最も遠い
マイクロホンの設置基準となる球との球径の差に応じた
サンプリング回数だけ順次遅延させつつ加算することに
より、音源からの音信号を強めて取り出すことができる
から、演算量を大幅に減らして処理することが可能な入
力用の音信号を提供できる。
According to the first and sixth aspects of the present invention, the diameters of the respective spheres are sequentially changed by a sound traveling distance corresponding to a fixed sampling period around a sound source virtually set at a predetermined spatial position. A peripheral surface of a concentric sphere is virtually set, and a plurality of microphones are installed based on the peripheral surfaces of a plurality of spheres selected from the concentric spheres. Therefore, by sequentially adding the sampling values for each microphone by sequentially delaying the number of samplings according to the difference in the ball diameter between the sphere that is the reference for setting the microphone and the sphere that is the reference for setting the microphone farthest from the sound source. Since the sound signal from the sound source can be strengthened and extracted, it is possible to provide an input sound signal that can be processed with a significantly reduced amount of calculation.

【0140】請求項2の発明では、各マイクロホンを、
直線と各球の周面とが交差する位置に設置することによ
り、信号処理を簡単に行うことが可能なマイクロホンア
レイを提供することができる。また請求項3の発明で
は、マイクロホンの設置面と各球の周面とが交差する位
置にマイクロホンを設置することにより、たとえば音声
認識機能を備えた装置の前面や上面に、マイクロホンを
所定の形状に並べて設置し、認識対象とする音信号の処
理を効率化することができる。
According to the second aspect of the present invention, each microphone is
By installing the microphone array at a position where the straight line and the peripheral surface of each sphere intersect, it is possible to provide a microphone array that can easily perform signal processing. According to the third aspect of the present invention, the microphone is installed at a position where the installation surface of the microphone and the peripheral surface of each sphere intersect, so that the microphone has a predetermined shape, for example, on the front or upper surface of a device having a voice recognition function. And can efficiently process sound signals to be recognized.

【0141】請求項4,10の発明では、複数のマイク
ロホンが請求項1の方法によって設置されている場合
に、各マイクロホンに対するサンプリング値を、それぞ
れそのマイクロホンの設置基準となる球の球径に応じた
サンプリング回数分だけ遅延させつつ加算してゆくこと
により、音源からの音信号を高速かつ精度良く抽出する
ことが可能となる。しかも演算処理をソフト化した場合
は、汎用のCPUでの演算処理が可能であり、ハードウ
エアによる演算処理を行う場合も、構成が簡易化される
から、装置コストが削減され、各種の機器に組み込みや
すくなる。
According to the fourth and tenth aspects of the present invention, when a plurality of microphones are installed according to the method of the first aspect, the sampling value for each microphone is determined in accordance with the sphere diameter of a sphere which is a reference for installing the microphone. By adding the signals while delaying them by the number of sampling times, a sound signal from the sound source can be extracted at high speed and with high accuracy. In addition, when the arithmetic processing is softwareized, the arithmetic processing can be performed by a general-purpose CPU, and when the arithmetic processing is performed by hardware, the configuration is simplified, so that the apparatus cost is reduced, and various types of equipment are reduced. Easy to incorporate.

【0142】請求項7の発明によれば、ディジタル量の
音信号を入力する音信号入力装置における信号処理速度
が高速化される上、装置構成を簡単化して精度の良い入
力用の信号を生成することができる。請求項8の発明で
も同様にしてアナログ量の音信号を入力する音信号入力
装置が作成されるので、パーソナルコンピュータ,カセ
ットレコーダなど、アナログ式の入力端子を具備する従
来の装置に接続して、直ちに使用することができ、汎用
性の高い音信号入力装置を提供することができる。
According to the seventh aspect of the present invention, the signal processing speed in the sound signal input device for inputting a digital sound signal is increased, and the structure of the device is simplified to generate a high-precision input signal. can do. According to the invention of claim 8, a sound signal input device for inputting a sound signal of an analog amount is similarly produced, so that the sound signal input device is connected to a conventional device having an analog input terminal, such as a personal computer or a cassette recorder. A sound signal input device that can be used immediately and has high versatility can be provided.

【0143】請求項9の発明では、ディジタルまたはア
ナログ方式で音信号を記録する装置が、請求項7,8と
同様の構成を導入することにより簡単に作成できるの
で、簡易な構成で性能のよい音声記録装置を提供するこ
とができる。
According to the ninth aspect of the present invention, a device for recording a sound signal in a digital or analog system can be easily created by introducing the same configuration as in the seventh and eighth aspects, so that the performance is improved with a simple configuration. An audio recording device can be provided.

【0144】請求項12の発明では、請求項1の方法に
より設置された複数個のマイクロホンと、これらマイク
ロホンの出力信号を請求項4の方法により処理する制御
装置とによって、音信号の入力機能を備え、かつ信号の
処理や構成が簡易化された音信号処理装置を提供するこ
とができる。
According to the twelfth aspect of the present invention, a sound signal input function is provided by a plurality of microphones installed by the method of the first aspect and a control device for processing output signals of these microphones by the method of the fourth aspect. It is possible to provide a sound signal processing device provided with a simplified signal processing and configuration.

【0145】請求項13の発明では、上記の音信号処理
装置において、平坦な面または曲面による設置面上に各
マイクロホンを一列に並べて、ユーザーの音声入力を受
け付けることができる。また請求項14の発明によれ
ば、同様の設置面上に、各マイクロホンが2次元または
3次元状に設置されるので、各方向からのノイズを精度
良く除去できる。さらにこれらの請求項の発明によれ
ば、前記設置面を制御装置の前面や上面に設定すること
により、音声入力部が一体化された実用的な信号処理装
置を提供できる。また設置面を制御装置から独立させる
と、外付けの音声入力部により、音源の位置に応じて音
信号の採取位置を自由設定できるという効果が得られ
る。
According to the thirteenth aspect of the present invention, in the above-described sound signal processing apparatus, the microphones can be arranged in a line on a flat or curved installation surface to accept a user's voice input. According to the fourteenth aspect of the present invention, since the microphones are two-dimensionally or three-dimensionally mounted on the same installation surface, noise from each direction can be accurately removed. Further, according to the invention of these claims, by setting the installation surface on the front surface or the upper surface of the control device, it is possible to provide a practical signal processing device with an integrated voice input unit. Further, when the installation surface is made independent of the control device, an effect is obtained in which the sampling position of the sound signal can be freely set according to the position of the sound source by the external audio input unit.

【0146】請求項15の発明によれば、1つの球の周
面を基準として、複数個のマイクロホンが配置されるこ
とになるので、設置基準の球の数が少なくとも多数のマ
イクロホンを設置して、設置基準の球を同じくするマイ
クロホンの出力信号を同じサンプリング回数分だけ遅延
させることにより、目的とする音信号を精度良く抽出す
ることが可能となる。また設置基準の球を同じくするマ
イクロホン毎の出力信号を重畳してからサンプリング処
理を行うようにすれば、サンプリングの回数や演算量を
大幅に削減できる。
According to the fifteenth aspect of the present invention, a plurality of microphones are arranged on the basis of the peripheral surface of one sphere. By delaying the output signal of a microphone having the same sphere as the installation reference by the same number of times of sampling, it is possible to accurately extract a target sound signal. If the sampling process is performed after superimposing the output signals of the microphones having the same sphere as the installation reference, the number of samplings and the amount of calculation can be significantly reduced.

【0147】請求項17の発明では、モニタの表示画面
の周縁部に設置されたマイクロホンにより取り込まれた
音信号からユーザーの音声を簡単かつ精度良く抽出し、
請求項18の発明では、機械の一面に設置されたマイク
ロホンにより取り込まれた音信号から、同様にユーザー
の音声を抽出する。さらに抽出された音声に含まれるデ
ータの内容を認識して所定の処理を行うので、パーソナ
ルコンピュータ,自動販売機,ならびにその他の汎用性
の高い電子機器に音声入力機能を導入して、精度の高い
処理を実行することが可能となる。
According to the seventeenth aspect, the user's voice is simply and accurately extracted from the sound signal captured by the microphone installed at the periphery of the display screen of the monitor.
According to the eighteenth aspect, a user's voice is similarly extracted from a sound signal captured by a microphone installed on one side of the machine. Further, since the contents of the data included in the extracted voice are recognized and the predetermined processing is performed, a voice input function is introduced into a personal computer, a vending machine, and other general-purpose electronic devices, thereby achieving high precision. Processing can be executed.

【0148】請求項19の発明では、記録媒体に記録さ
れたプログラムをA/D変換手段を具備するコンピュー
タに導入することにより、請求項1の方法により設置さ
れた各マイクロホンの出力信号を処理して、所定の空間
位置からの音信号を抽出することが可能となるので、こ
の発明による音信号の処理機能を各種のコンピュータに
簡単に導入することができる。
According to the nineteenth aspect of the present invention, the program recorded on the recording medium is introduced into a computer having A / D conversion means to process the output signal of each microphone installed according to the method of the first aspect. Thus, it is possible to extract a sound signal from a predetermined spatial position, so that the sound signal processing function according to the present invention can be easily introduced into various computers.

【0149】請求項5,11,20の発明によれば、マ
イクロホンが理想の設置位置からずれて設置されている
場合にも、マイクロホンが取り込む音信号に及ぶ位置ず
れの影響が所定の誤差内に入るようにサンプリング周波
数が調整されるので、最終の演算結果に及ぶマイクロホ
ンの位置ずれの影響が許容範囲に抑えられるようにな
り、音信号の抽出精度を安定化することができる。
According to the fifth, eleventh and twentieth aspects of the present invention, even when the microphone is installed at a position deviated from the ideal installation position, the effect of the position shift on the sound signal captured by the microphone is within a predetermined error. Since the sampling frequency is adjusted so as to fall within the range, the effect of the microphone displacement on the final calculation result can be suppressed to an allowable range, and the accuracy of sound signal extraction can be stabilized.

【0150】さらに請求項16の発明によれば、音源の
実際の位置が仮想設定された位置と異なる場合にも、サ
ンプリング周波数の調整により、音源とマイクロホンと
の位置関係の狂いにより生じる誤差を許容範囲内に留め
ることができるので、音声を入力する場合に、ユーザー
によって口の位置が異なっても、各音声を安定して抽出
することができる。
Further, according to the sixteenth aspect, even when the actual position of the sound source is different from the virtually set position, the error caused by the misalignment of the positional relationship between the sound source and the microphone is allowed by adjusting the sampling frequency. Since the voice can be kept within the range, when voice is input, each voice can be stably extracted even if the position of the mouth differs depending on the user.

【図面の簡単な説明】[Brief description of the drawings]

【図1】この発明の原理を示す説明図である。FIG. 1 is an explanatory diagram showing the principle of the present invention.

【図2】図1のマイクロホンの設置方法が適用されたマ
イクロホンアレイの構成を示す説明図である。
FIG. 2 is an explanatory diagram showing a configuration of a microphone array to which the microphone installation method of FIG. 1 is applied.

【図3】図2のマイクロホンアレイを用いたボイスレコ
ーダの構成を示すブロック図である。
FIG. 3 is a block diagram showing a configuration of a voice recorder using the microphone array of FIG. 2;

【図4】図2のマイクロホンアレイを用いた音声入力装
置の構成を示すブロック図である。
FIG. 4 is a block diagram showing a configuration of a voice input device using the microphone array of FIG. 2;

【図5】具体的なマイクロホンアレイの構成を示す説明
図である。
FIG. 5 is an explanatory diagram showing a specific configuration of a microphone array.

【図6】各マイクロホンの設置位置を決定する方法を示
す説明図である。
FIG. 6 is an explanatory diagram showing a method for determining an installation position of each microphone.

【図7】各マイクロホンの設置位置を決定する方法を示
す説明図である。
FIG. 7 is an explanatory diagram showing a method for determining an installation position of each microphone.

【図8】図6の方法によるマイクロホンの具体的な設置
例を示す説明図である。
FIG. 8 is an explanatory diagram showing a specific installation example of a microphone according to the method of FIG. 6;

【図9】図7の方法によるマイクロホンの具体的な設置
例を示す説明図である。
FIG. 9 is an explanatory diagram showing a specific installation example of a microphone according to the method of FIG. 7;

【図10】図5の構成によるマイクロホンアレイの出力
信号を処理する音信号処理装置の構成を示すブロック図
である。
10 is a block diagram illustrating a configuration of a sound signal processing device that processes output signals of the microphone array according to the configuration of FIG. 5;

【図11】マイクロホンを2次元的に設置した具体例を
示す説明図である。
FIG. 11 is an explanatory diagram showing a specific example in which microphones are two-dimensionally installed.

【図12】図11の構成によるマイクロホンアレイの出
力信号を処理する音信号処理装置の構成を示すブロック
図である。
12 is a block diagram illustrating a configuration of a sound signal processing device that processes an output signal of the microphone array according to the configuration of FIG. 11;

【図13】図10および図12の音信号処理装置を実現
するコンピュータの構成を示すブロック図である。
FIG. 13 is a block diagram illustrating a configuration of a computer that realizes the sound signal processing device of FIGS. 10 and 12.

【図14】図13の制御部による音信号処理の手順を示
すフローチャートである。
FIG. 14 is a flowchart showing a procedure of sound signal processing by the control unit in FIG. 13;

【図15】音信号処理装置に温度変化によりサンプリン
グ周波数を変更する機能を組み込んだ例を示すブロック
図である。
FIG. 15 is a block diagram illustrating an example in which a function of changing a sampling frequency according to a temperature change is incorporated in the sound signal processing device.

【図16】図15の音信号処理装置における処理手順を
示すフローチャートである。
16 is a flowchart showing a processing procedure in the sound signal processing device of FIG.

【図17】パーソナルコンピュータによる音声認識装置
の外観を示す斜視図である。
FIG. 17 is a perspective view illustrating an external appearance of a voice recognition device using a personal computer.

【図18】図17の装置の電気構成を示すブロック図で
ある。
FIG. 18 is a block diagram showing an electrical configuration of the device of FIG.

【図19】音声認識機能を具備する券売機の外観を示す
斜視図である。
FIG. 19 is a perspective view showing the appearance of a ticket vending machine having a voice recognition function.

【図20】図19の券売機の電気構成を示すブロック図
である。
FIG. 20 is a block diagram showing an electric configuration of the ticket vending machine shown in FIG. 19;

【図21】マイクロホンの設置位置の許容範囲を示す説
明図である。
FIG. 21 is an explanatory diagram showing an allowable range of an installation position of a microphone.

【図22】マイクロホンを球の周面に対応づける具体例
を示す説明図である。
FIG. 22 is an explanatory diagram showing a specific example of associating a microphone with a peripheral surface of a sphere.

【図23】従来の音信号処理装置の構成を示すブロック
図である。
FIG. 23 is a block diagram showing a configuration of a conventional sound signal processing device.

【図24】従来の音信号処理をソフトウエアにより行う
場合の手順を示すフローチャートである。
FIG. 24 is a flowchart showing a procedure when performing conventional sound signal processing by software.

【符号の説明】[Explanation of symbols]

n マイクロホン Cn (仮想の)球 1 マイクロホンアレイ 3 A/Dコンバータ 4A,4B,4C FIFOメモリ 5 加算器 6 記憶装置 7 D/Aコンバータ 10 音信号処理装置 11 CPU 15 制御部 18 モニタ 30 パーソナルコンピュータ 35 券売機 36 操作面 41 音声処理装置 42 中央制御装置M n microphone C n (virtual) sphere 1 microphone array 3 A / D converter 4A, 4B, 4C FIFO memory 5 adder 6 storage device 7 D / A converter 10 sound signal processing device 11 CPU 15 control unit 18 monitor 30 personal Computer 35 Ticket vending machine 36 Operation surface 41 Voice processing device 42 Central control device

フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) H04R 27/00 (54)【発明の名称】 マイクロホンの設置方法および音信号処理方法、およびこれらの方法を用いた音信号の入力装 置、記録装置、処理装置、ならびに音声認識処理装置、音信号処理用のプログラムが記録された 記録媒体Continuation of the front page (51) Int.Cl. 7 Identification symbol FI Theme coat II (reference) H04R 27/00 (54) [Title of the invention] Microphone installation method, sound signal processing method, and sound using these methods Signal input device, recording device, processing device, voice recognition processing device, recording medium on which program for sound signal processing is recorded

Claims (20)

【特許請求の範囲】[Claims] 【請求項1】 音源からの音を複数箇所で集めるための
複数個のマイクロホンを設置する方法であって、 前記音源を中心としてそれぞれの球径が一定のサンプリ
ング周期に相当する音の進行距離だけ順次変わるような
同心球を仮想的に設定した後、前記同心球のうちの選ば
れた複数の球の周面を位置決めの基準として各マイクロ
ホンを設置することを特徴とするマイクロホンの設置方
法。
1. A method of installing a plurality of microphones for collecting sounds from a sound source at a plurality of places, wherein each of the spheres has a diameter corresponding to a fixed sampling period with respect to the sound source. A microphone installation method, comprising: setting virtually concentric spheres that change sequentially, and then installing each microphone with reference to positioning of a plurality of spheres selected from the concentric spheres.
【請求項2】 音源からの音を複数箇所で集めるための
複数個のマイクロホンを設置する方法であって、 前記音源を中心としてそれぞれの球径が一定のサンプリ
ング周期に相当する音の進行距離だけ順次変わるような
同心球を仮想的に設定するとともに、前記音源に対して
所定距離だけ離れた空間位置に、前記同心球のうちの選
ばれた複数の球と交差する直線を仮想的に設定した後、
前記選ばれた各球の周面と前記直線との交差位置を位置
決めの基準として各マイクロホンを設置することを特徴
とするマイクロホンの設置方法。
2. A method of installing a plurality of microphones for collecting sounds from a sound source at a plurality of places, wherein each of the spheres has a diameter corresponding to a fixed sampling period with respect to the sound source. A concentric sphere that sequentially changes is virtually set, and a straight line that intersects a plurality of selected spheres of the concentric sphere is virtually set at a spatial position separated by a predetermined distance from the sound source. rear,
A microphone installation method, wherein each microphone is installed using an intersection of the peripheral surface of each of the selected spheres and the straight line as a reference for positioning.
【請求項3】 音源からの音を複数箇所で集めるための
マイクロホンを設置する方法であって、 前記音源を中心としてそれぞれの球径が一定のサンプリ
ング周期に相当する音の進行距離だけ順次変わるような
同心球を仮想的に設定するとともに、前記音源に対して
所定距離だけ離れた空間位置に、前記同心球のうちの選
ばれた複数の球と交差するマイクロホンの設置面を仮想
的に設定した後、前記選ばれた各球の周面と前記設置面
との交差位置を位置決めの基準としてマイクロホンを設
置することを特徴とするマイクロホンの設置方法。
3. A method for installing microphones for collecting sounds from a sound source at a plurality of places, wherein each of the sphere diameters is sequentially changed by a sound traveling distance corresponding to a fixed sampling period around the sound source. A virtual concentric sphere was virtually set, and a microphone installation surface intersecting a plurality of spheres selected from the concentric spheres was virtually set at a spatial position separated by a predetermined distance from the sound source. Thereafter, a microphone is installed using the intersection of the selected peripheral surface of each ball and the installation surface as a reference for positioning.
【請求項4】 所定の空間位置の音源に向けて設置され
た複数個のマイクロホンからの音声出力信号を取り込ん
で処理する方法であって、 前記音源を中心としてそれぞれの球径が一定のサンプリ
ング周期に相当する音の進行距離だけ順次変わるような
同心球を仮想的に設定した後、各マイクロホンを、それ
ぞれその設置位置に基づき、前記同心球のうちの選ばれ
た複数の球の周面に対応づけておき、 各マイクロホンの出力信号を前記サンプリング周期によ
りサンプリングするとともに、マイクロホン毎のサンプ
リング値を、それぞれそのマイクロホンに対応する球と
前記音源から最も遠いマイクロホンに対応する球との球
径の差に基づくサンプリング数分だけ順次遅延させて加
算するようにした音信号処理方法。
4. A method for capturing and processing audio output signals from a plurality of microphones installed toward a sound source in a predetermined spatial position, wherein each of the sphere diameters around the sound source has a constant sampling period. After virtually setting concentric spheres that sequentially change by the traveling distance of the sound corresponding to, each microphone corresponds to the peripheral surface of a plurality of spheres selected from the concentric spheres based on their installation positions. In addition, while sampling the output signal of each microphone at the sampling period, the sampling value of each microphone is calculated as the difference between the sphere diameter of the sphere corresponding to the microphone and the sphere corresponding to the microphone farthest from the sound source. A sound signal processing method in which the signals are sequentially delayed by the number of samplings and added.
【請求項5】 請求項4に記載された方法において、 各マイクロホンについて、それぞれそのマイクロホンを
所定の球の周面に対応づけたときに、前記音源からの音
信号がマイクロホンに取り込まれる場合と対応づけられ
た球の周面上で取り込まれる場合との間に生じる音信号
の位相のずれが、所定の誤差内に入るようなサンプリン
グ周期を設定して、そのサンプリング周期により各マイ
クロホンの出力信号のサンプリングおよび同心球への対
応づけを行うようにした音信号処理方法。
5. The method according to claim 4, wherein each microphone is associated with a sound signal from the sound source when the microphone is associated with a peripheral surface of a predetermined sphere. The sampling period is set so that the phase shift of the sound signal occurring between the case where the sound signal is captured on the peripheral surface of the attached sphere is within a predetermined error. A sound signal processing method that performs sampling and association with concentric spheres.
【請求項6】 所定の空間位置に仮想設定された音源か
らの音を複数箇所で集めるための複数個のマイクロホン
を備えた音信号入力装置であって、 各マイクロホンは、前記音源の仮想位置を中心としてそ
れぞれの球径が一定のサンプリング周期に相当する音の
進行距離だけ順次変わるように仮想的に設定された同心
球のうち、選ばれた複数の球の周面を位置決めの基準と
して設置されて成る音信号入力装置。
6. A sound signal input device comprising a plurality of microphones for collecting sound from a sound source virtually set at a predetermined spatial position at a plurality of locations, wherein each microphone determines a virtual position of the sound source. Of the concentric spheres virtually set so that the diameter of each sphere changes sequentially by the sound traveling distance corresponding to a fixed sampling period as the center, the peripheral surface of a plurality of selected spheres is set as a reference for positioning. Sound signal input device.
【請求項7】 所定の空間位置に仮想設定された音源か
らの音を複数箇所で集めるための複数個のマイクロホン
と、各マイクロホンの出力信号から入力用の信号を生成
して出力する信号処理装置とを備えた音声入力装置であ
って、 各マイクロホンは、前記音源の仮想位置を中心としてそ
れぞれの球径が一定のサンプリング周期に相当する音の
進行距離だけ順次変わるように仮想的に設定された同心
球のうち、選ばれた複数の球の周面を位置決めの基準と
して設置されており、 前記信号処理装置は、 各マイクロホンの出力信号を前記サンプリング周期によ
りサンプリングするサンプリング手段と、 マイクロホン毎の出力信号のサンプリング値を、それぞ
れそのマイクロホンの設置基準となる球と前記仮想音源
より最も遠い位置のマイクロホンの設置基準となる球と
の球径の差に基づくサンプリング回数分だけ記憶するた
めのメモリと、 各サンプリングの時点で、前記メモリよりマイクロホン
毎の最も古いサンプリング値を読み出して、これらのサ
ンプリング値と、前記仮想音源より最も遠い位置のマイ
クロホンについての現時点でのサンプリング値との総和
を算出する演算手段と、 前記演算手段により得られたサンプリング値の総和を示
すディジタル信号を外部に出力する出力手段とを具備し
て成る音信号入力装置。
7. A plurality of microphones for collecting sound from a sound source virtually set at a predetermined spatial position at a plurality of locations, and a signal processing device for generating and outputting an input signal from an output signal of each microphone. Wherein each microphone is virtually set so that each sphere diameter is sequentially changed by a traveling distance of a sound corresponding to a fixed sampling period around the virtual position of the sound source. Among the concentric spheres, the peripheral surfaces of a plurality of selected spheres are installed as a reference for positioning, the signal processing device includes a sampling unit that samples an output signal of each microphone at the sampling period, and an output for each microphone. The sampling value of the signal is set to the sphere that is the reference of the microphone and the microphone located farthest from the virtual sound source. A memory for storing the number of times of sampling based on the difference between the ball diameter and the installation reference ball, and at the time of each sampling, reading out the oldest sampling value for each microphone from the memory, these sampling values, Calculating means for calculating the sum of the current sampling value for the microphone located farthest from the virtual sound source, and output means for outputting a digital signal indicating the sum of the sampling values obtained by the calculating means to the outside A sound signal input device comprising:
【請求項8】 所定の空間位置に仮想設定された音源か
らの音を複数箇所で集めるための複数個のマイクロホン
と、各マイクロホンの出力信号から入力用の音信号を生
成して出力する信号処理装置とを備えた音声入力装置で
あって、 各マイクロホンは、前記音源の仮想位置を中心としてそ
れぞれの球径が一定のサンプリング周期に相当する音の
進行距離だけ順次変わるように仮想的に設定された同心
球のうち、選ばれた複数の球の周面を位置決めの基準と
して設置されており、 前記信号処理装置は、 各マイクロホンの出力信号を前記サンプリング周期によ
りサンプリングするサンプリング手段と、 マイクロホン毎の出力信号のサンプリング値を、それぞ
れそのマイクロホンの設置基準となる球と前記仮想音源
より最も遠い位置のマイクロホンの設置基準となる球と
の球径の差に基づくサンプリング回数分だけ記憶するた
めのメモリと、 各サンプリングの時点で、前記メモリよりマイクロホン
毎の最も古いサンプリング値を読み出して、これらのサ
ンプリング値と前記仮想音源より最も遠い位置のマイク
ロホンについての現時点でのサンプリング値との総和を
算出する演算手段と、 前記演算手段により得られたサンプリング値の総和をア
ナログ変換して外部に出力する出力手段とを具備して成
る音信号入力装置。
8. A plurality of microphones for collecting sound from a sound source virtually set at a predetermined spatial position at a plurality of locations, and signal processing for generating and outputting an input sound signal from an output signal of each microphone. A microphone, wherein each microphone is virtually set so that each sphere diameter is sequentially changed by a sound traveling distance corresponding to a fixed sampling period around the virtual position of the sound source. Among the concentric spheres, the peripheral surfaces of a plurality of selected spheres are installed as a reference for positioning, the signal processing device comprises: sampling means for sampling an output signal of each microphone at the sampling period; The sampling value of the output signal is used as the reference sphere for the microphone and the microphone farthest from the virtual sound source. A memory for storing the number of times of sampling based on the difference between the ball diameter and the sphere serving as the installation reference, and at the time of each sampling, the oldest sampled value for each microphone is read from the memory, and these sampled values and A calculating means for calculating the sum of the sampling value at the present time for the microphone located farthest from the virtual sound source, and an output means for converting the sum of the sampling values obtained by the calculating means into an analog signal and outputting the converted signal to the outside. A sound signal input device comprising:
【請求項9】 所定の空間位置に仮想設定された音源か
らの音を複数箇所で集めるための複数個のマイクロホン
と、各マイクロホンの出力信号を取り込んで記録用の音
信号を生成する信号処理装置と、この記録用の音信号を
メモリまたは所定の記録媒体に記憶させる記憶処理装置
とを具備する音信号記録装置であって、 各マイクロホンは、前記音源の仮想位置を中心としてそ
れぞれの球径が一定のサンプリング周期に相当する音の
進行距離だけ順次変わるように仮想的に設定された同心
球のうち、選ばれた複数の球の周面を位置決めの基準と
して設置されており、 前記信号処理装置は、 各マイクロホンの出力信号を前記サンプリング周期によ
りサンプリングするサンプリング手段と、 マイクロホン毎の出力信号のサンプリング値を、それぞ
れそのマイクロホンの設置基準となる球と前記仮想音源
より最も遠い位置のマイクロホンの設置基準となる球と
の球径の差に基づくサンプリング回数分だけ記憶するた
めのメモリと、 各サンプリングの時点で、前記メモリよりマイクロホン
毎の最も古いサンプリング値を読み出して、これらのサ
ンプリング値と前記仮想音源より最も遠い位置のマイク
ロホンについての現時点でのサンプリング値との総和を
算出する演算手段とを具備し、 前記記憶処理装置は、前記演算手段により得られたサン
プリング値の総和に応じた音信号を、前記記録用の音信
号として前記メモリまたは記録媒体に書き込んで成る音
信号記録装置。
9. A plurality of microphones for collecting sound from a sound source virtually set at a predetermined spatial position at a plurality of locations, and a signal processing device for taking in an output signal of each microphone and generating a sound signal for recording. And a storage processing device for storing the recording sound signal in a memory or a predetermined recording medium, wherein each microphone has a sphere diameter around a virtual position of the sound source. Of the concentric spheres virtually set so as to sequentially change by the traveling distance of the sound corresponding to a fixed sampling period, the peripheral surfaces of a plurality of selected spheres are installed as a reference for positioning, and the signal processing device Is a sampling means for sampling the output signal of each microphone at the sampling period, and a sampling value of the output signal for each microphone. A memory for storing the number of times of sampling based on the difference between the sphere as the microphone installation reference sphere and the sphere as the microphone installation reference farthest position from the virtual sound source, at the time of each sampling, Computing means for reading out the oldest sampled value for each microphone from the memory and calculating the sum of these sampled values and the current sampled value for the microphone furthest from the virtual sound source; The sound signal recording device writes the sound signal according to the sum of the sampling values obtained by the arithmetic means in the memory or the recording medium as the sound signal for recording.
【請求項10】 音源からの音を複数箇所で集めるため
の複数個のマイクロホンの出力信号を取り込んで処理す
る装置であって、 各マイクロホンの出力信号を一定のサンプリング周期に
よりサンプリングするサンプリング手段と、 マイクロホン毎に、前記サンプリング手段により得られ
た所定数のサンプリング値を順次記憶するためのメモリ
と、 前記音源の仮想位置を中心としてそれぞれの球径が前記
サンプリング周期に相当する音の進行距離だけ順次変わ
るような同心球を仮想的に設定して、各マイクロホン
を、それぞれその設置位置に基づき、前記同心球のうち
の所定の球の周面に対応づける対応づけ手段と、 各サンプリングの時点で、マイクロホン毎に、それぞれ
そのマイクロホンに対応する球と前記音源の仮想位置か
ら最も遠いマイクロホンに対応する球との球径の差に基
づくサンプリング回数分だけ遅延したサンプリング値を
前記メモリより読み出して、読み出された各サンプリン
グ値の総和を算出する演算手段とを具備して成る信号処
理装置。
10. A device for capturing and processing output signals of a plurality of microphones for collecting sounds from a sound source at a plurality of locations, wherein sampling means for sampling the output signals of each microphone at a constant sampling period; A memory for sequentially storing a predetermined number of sampling values obtained by the sampling means for each microphone; and a sphere diameter corresponding to the sounding distance corresponding to the sampling period, with each sphere diameter sequentially centered on the virtual position of the sound source. Correlation means that virtually sets a concentric sphere that changes, and associates each microphone with the peripheral surface of a predetermined sphere among the concentric spheres based on its installation position, at the time of each sampling, For each microphone, the ball corresponding to that microphone and the microphone furthest from the virtual position of the sound source A signal processing unit that reads out a sampling value delayed by the number of times of sampling based on the difference between the ball diameter and the ball corresponding to the crophone from the memory and calculates the sum of the read out sampling values. apparatus.
【請求項11】 請求項10に記載された信号処理装置
であって、 各マイクロホンについて、それぞれそのマイクロホンを
所定の球の周面に対応づけたときに、前記音源からの音
信号がマイクロホンに取り込まれる場合とマイクロホン
に対応する球の周面上で取り込まれる場合との間に生じ
る音信号の位相のずれが、所定の誤差内に入るようなサ
ンプリング周期を設定するサンプリング周期設定手段
と、 前記サンプリング手段および対応づけ手段がそれぞれ前
記設定されたサンプリング周期に応じて動作するように
制御する制御手段を具備して成る信号処理装置。
11. The signal processing apparatus according to claim 10, wherein a sound signal from the sound source is taken into each microphone when the microphone is associated with a peripheral surface of a predetermined sphere. Sampling period setting means for setting a sampling period such that a phase shift of a sound signal that occurs between the case where the sound signal is captured and the case where the sound signal is captured on the peripheral surface of the sphere is within a predetermined error. A signal processing device comprising a control means for controlling the means and the associating means to operate in accordance with the set sampling period.
【請求項12】 所定の空間位置に仮想設定された音源
からの音を複数箇所で集めるための複数個のマイクロホ
ンと、各マイクロホンの出力信号を取り込んで処理する
制御装置とを備えた音信号処理装置であって、 各マイクロホンは、前記音源の仮想位置を中心としてそ
れぞれの球径が一定のサンプリング周期に相当する音の
進行距離だけ順次変わるように仮想的に設定された同心
球のうち、選ばれた複数の球の周面を位置決めの基準と
して設置されており、 前記制御装置は、 各マイクロホンの出力信号を前記サンプリング周期によ
りサンプリングするサンプリング手段と、 マイクロホン毎に、前記サンプリング手段により得られ
た所定数のサンプリング値を順次記憶するためのメモリ
と、 各サンプリングの時点で、マイクロホン毎に、それぞれ
そのマイクロホンの設置基準となる球と前記音源の仮想
位置から最も遠いマイクロホンの設置基準となる球との
球径の差に基づくサンプリング回数分だけ遅延したサン
プリング値を前記メモリより読み出して、読み出された
各サンプリング値の総和を算出する演算手段とを具備し
て成る音信号処理装置。
12. A sound signal processing apparatus comprising: a plurality of microphones for collecting sound from a sound source virtually set at a predetermined spatial position at a plurality of locations; and a control device for receiving and processing output signals of the microphones. An apparatus, wherein each microphone is selected from among concentric spheres that are virtually set so that their respective sphere diameters sequentially change by a traveling distance of a sound corresponding to a fixed sampling period around the virtual position of the sound source. The control device is provided with sampling means for sampling an output signal of each microphone at the sampling period, and for each microphone, the control means is provided by the sampling means. A memory for sequentially storing a predetermined number of sampling values, and a microphone for each microphone at each sampling time. A sampling value delayed by the number of times of sampling based on the difference between the sphere as the microphone installation reference sphere and the sphere as the microphone installation reference farthest from the virtual position of the sound source is read from the memory, and read. A sound signal processing device comprising: a calculating means for calculating a sum of the respective sampled values output.
【請求項13】 請求項12に記載された音信号処理装
置において、 前記音源の仮想位置に対し、所定距離だけ離れて対向配
備されるマイクロホンの設置面を具備し、 各マイクロホンは、前記同心球のうちの選ばれた球の周
面と前記設置面上の所定の直線との交差位置を位置決め
の基準として、前記設置面上に設置されて成る音信号処
理装置。
13. The sound signal processing device according to claim 12, further comprising: a microphone installation surface that is disposed opposite to a virtual position of the sound source by a predetermined distance, and each microphone is provided with the concentric sphere. A sound signal processing device installed on the installation surface using an intersection of a peripheral surface of the selected sphere and a predetermined straight line on the installation surface as a reference for positioning.
【請求項14】 請求項12に記載された音信号処理装
置において、 前記音源の仮想位置に対し、所定距離だけ離れて対向配
備されるマイクロホンの設置面を具備し、 各マイクロホンは、前記同心球のうちの選ばれた球の周
面と前記設置面との交差位置を位置決めの基準として、
前記設置面上に設置されて成る音信号処理装置。
14. The sound signal processing device according to claim 12, further comprising: a microphone installation surface that is disposed opposite to a virtual position of the sound source by a predetermined distance, and wherein each microphone has the concentric sphere. As a reference for positioning the intersection position between the peripheral surface of the selected sphere and the installation surface,
A sound signal processing device installed on the installation surface.
【請求項15】 請求項12〜14のいずれかに記載さ
れた音信号処理装置において、 前記同心球のうちの選ばれた球の周面について、それぞ
れその周面を位置決めの基準として複数個のマイクロホ
ンが設置されて成る音信号処理装置。
15. The sound signal processing device according to claim 12, wherein a plurality of peripheral surfaces of a selected one of the concentric spheres are used as a reference for positioning. A sound signal processing device equipped with a microphone.
【請求項16】 請求項12に記載された音信号処理装
置において、 各マイクロホンの出力信号を用いて、前記音源の実際の
位置を推定する音源位置推定手段と、 前記音源位置推定手段により前記音源が仮想位置と異な
る位置にあると推定されたとき、この音源の推定位置を
中心としてそれぞれの球径が一定のサンプリング周期に
相当する音の進行距離だけ順次変わるように仮想的に設
定された同心球に対し、前記各マイクロホンについて、
それぞれそのマイクロホンを設置位置に基づき所定の球
の周面に対応づけたときに、前記音源の推定位置からの
音信号がマイクロホンに取り込まれる場合と対応づけら
れた球の周面上で取り込まれる場合との間に生じる音信
号の位相のずれが、所定の誤差内に入るようなサンプリ
ング周期を設定するサンプリング周期設定手段と、 各マイクロホンの音信号を設定されたサンプリング周期
による処理を行うように前記サンプリング手段を制御す
るとともに、前記演算手段によるマイクロホン毎のサン
プリング値の読み出し位置を、前記音源の推定位置を中
心とする同心球に対する各マイクロホンの対応関係に応
じて変更する制御手段とを具備して成る音信号処理装
置。
16. The sound signal processing device according to claim 12, wherein: a sound source position estimating unit that estimates an actual position of the sound source using an output signal of each microphone; Is estimated to be at a position different from the virtual position, concentrically set so that the respective sphere diameters are sequentially changed by the sound traveling distance corresponding to a fixed sampling period around the estimated position of the sound source. For a sphere, for each of the microphones,
When the microphone is associated with the peripheral surface of a predetermined sphere based on the installation position, when the sound signal from the estimated position of the sound source is captured by the microphone and when it is captured on the peripheral surface of the associated sphere A sampling cycle setting means for setting a sampling cycle such that a phase shift of a sound signal occurring between the sampling signal and the sound signal falls within a predetermined error, and processing the sound signal of each microphone according to the set sampling cycle. Control means for controlling the sampling means, and changing the reading position of the sampling value for each microphone by the arithmetic means in accordance with the correspondence of each microphone to a concentric sphere centered on the estimated position of the sound source. Sound signal processing device.
【請求項17】 音信号を入力して所定の音声認識処理
を行うための制御装置と、前記制御装置による音声認識
処理の結果を表示するモニタと、モニタの前方の空間位
置に仮想設定された音源からの音を集めて前記制御装置
に入力するための複数個のマイクロホンとを備えた音声
認識処理装置であって、 各マイクロホンは、前記モニタの表示画面の周縁部上
に、前記音源の仮想位置を中心としてそれぞれの球径が
一定のサンプリング周期に相当する音の進行距離だけ順
次変わるように仮想的に設定された同心球のうち、選ば
れた複数の球の周面と前記周縁部との交差位置を位置決
めの基準として設置されており、 前記制御装置は、 各マイクロホンの出力信号を前記サンプリング周期によ
りサンプリングするサンプリング手段と、 マイクロホン毎に、前記サンプリング手段により得られ
た所定数のサンプリング値を順次記憶するためのメモリ
と、 各サンプリングの時点で、マイクロホン毎に、それぞれ
そのマイクロホンの設置基準となる球と前記音源の仮想
位置から最も遠いマイクロホンの設置基準となる球との
球径の差に基づくサンプリング回数分だけ遅延したサン
プリング値を前記メモリより読み出して、読み出された
各サンプリング値の総和を算出する演算手段と、 前記演算手段により得られた算出値による時系列データ
を処理して、所定の音声認識処理を実行する認識処理手
段とを具備して成る音声認識処理装置。
17. A control device for inputting a sound signal to perform a predetermined voice recognition process, a monitor for displaying a result of the voice recognition process by the control device, and a virtual position set in a spatial position in front of the monitor. A speech recognition processing device comprising: a plurality of microphones for collecting sounds from a sound source and inputting the sounds to the control device, wherein each microphone is provided on the periphery of a display screen of the monitor, and Of the concentric spheres virtually set so that each sphere diameter is sequentially changed by the traveling distance of the sound corresponding to a certain sampling period with the center as the center, the peripheral surface of the plurality of spheres and the peripheral portion are selected. The control device is provided with a sampling unit for sampling an output signal of each microphone at the sampling period, and a microphone. A memory for sequentially storing a predetermined number of sampling values obtained by the sampling means, and at each sampling point, a sphere serving as an installation reference of the microphone and a virtual position of the sound source. Calculating means for reading from the memory sampling values delayed by the number of times of sampling based on the difference between the ball diameter and the ball that is the installation reference of the farthest microphone, and calculating the sum of the read sampling values; A speech recognition processing device comprising: recognition processing means for processing time-series data based on the calculated values obtained by the means and executing predetermined speech recognition processing.
【請求項18】 機械の一面に認識対象の音信号を取り
込むための複数個のマイクロホンが設置されるととも
に、機械内部に前記マイクロホンの出力信号を用いて所
定の認識処理を行う制御装置が組み込まれて成る音声認
識処理装置であって、 各マイクロホンは、前記マイクロホンの設置面上におい
て、設置面に対向する所定の空間位置に仮想設定される
音源を中心としてそれぞれの球径が一定のサンプリング
周期に相当する音の進行距離だけ順次変わるように仮想
的に設定された同心球のうち、選ばれた複数の球の周面
と前記設置面との交差位置を位置決めの基準として設置
されており、 前記制御装置は、 各マイクロホンの出力信号を前記サンプリング周期によ
りサンプリングするサンプリング手段と、 マイクロホン毎に、前記サンプリング手段により得られ
た所定数のサンプリング値を順次記憶するためのメモリ
と、 各サンプリングの時点で、マイクロホン毎に、それぞれ
そのマイクロホンの設置基準となる球と前記音源の仮想
位置から最も遠いマイクロホンの設置基準となる球との
球径の差に基づくサンプリング回数分だけ遅延したサン
プリング値を前記メモリより読み出して、読み出された
各サンプリング値の総和を算出する演算手段と、 所定回数分のサンプリングの間に前記演算手段により得
られた算出値による時系列データを処理して、所定の音
声認識処理を実行する認識処理手段とを具備して成る音
声認識処理装置。
18. A plurality of microphones for capturing a sound signal to be recognized is installed on one surface of a machine, and a control device for performing a predetermined recognition process using an output signal of the microphone is incorporated in the machine. Wherein each sphere has a constant sampling period around a sound source virtually set at a predetermined space position facing the installation surface on the installation surface of the microphone. Of the concentric spheres that are virtually set so as to sequentially change by the travel distance of the corresponding sound, a crossing position between the peripheral surface of the selected plurality of spheres and the installation surface is installed as a reference for positioning, The control device includes a sampling unit that samples an output signal of each microphone at the sampling period, and the sampler for each microphone. A memory for sequentially storing a predetermined number of sampling values obtained by the sampling means, and at each sampling time, for each microphone, a sphere as a reference for setting the microphone and a microphone farthest from the virtual position of the sound source. An arithmetic unit that reads a sampling value delayed by the number of times of sampling based on the difference in ball diameter from the ball serving as an installation reference from the memory, and calculates the sum of the read sampled values; A speech recognition processing device comprising: a recognition processing unit that processes time-series data based on a calculation value obtained by the arithmetic unit in the meantime and executes a predetermined speech recognition process.
【請求項19】 音源からの音を複数箇所で集めるため
の複数個のマイクロホンの出力信号を、コンピュータに
より処理するためのプログラムが記録された記録媒体で
あって、 前記コンピュータに内蔵されたA/D変換手段を用いて
各マイクロホンの出力信号を一定のサンプリング周期に
よりサンプリングするための手順、 マイクロホン毎に、前記サンプリング手段により得られ
た所定数のサンプリング値を順次メモリに記憶させる手
順、 前記音源の仮想位置を中心としてそれぞれの球径が前記
サンプリング周期に相当する音の進行距離だけ順次変わ
るような同心球を仮想的に設定するとともに、各マイク
ロホンを、それぞれその設置位置に基づき、前記同心球
のうちの選ばれた複数の球の周面に対応づける手順、 各サンプリングの時点で、マイクロホン毎に、それぞれ
そのマイクロホンに対応する球と前記音源の仮想位置か
ら最も遠いマイクロホンに対応する球との球径の差に応
じたサンプリング回数分だけ遅延したサンプリング値を
前記メモリより読み出して、読み出された各サンプリン
グ値の総和を算出する手順、の各手順を実行するための
プログラムが記録されて成る音信号処理用のプログラム
が記録された記録媒体。
19. A recording medium storing a program for processing by a computer the output signals of a plurality of microphones for collecting sounds from a sound source at a plurality of places, wherein the A / B is built in the computer. A procedure for sampling the output signal of each microphone at a constant sampling cycle using the D conversion means, a procedure for sequentially storing a predetermined number of sampling values obtained by the sampling means in a memory for each microphone, Concentric spheres whose respective sphere diameters sequentially change by the traveling distance of the sound corresponding to the sampling period with the virtual position as the center are virtually set, and each microphone is placed on the basis of the installation position of the concentric sphere. Procedure for associating multiple selected spheres with the circumference, at each sampling point For each microphone, a sampling value delayed by the number of times of sampling corresponding to the difference in ball diameter between the sphere corresponding to the microphone and the sphere corresponding to the microphone farthest from the virtual position of the sound source is read from the memory, and read. A recording medium for recording a program for processing a sound signal, the program recording a program for executing each of the steps of calculating the sum of each of the output sampling values.
【請求項20】 請求項19に記載された記録媒体にお
いて、 各マイクロホンについて、それぞれそのマイクロホンを
所定の球の周面に対応づけたときに、前記音源からの音
信号がマイクロホンに取り込まれる場合とマイクロホン
に対応する球の周面上で取り込まれる場合との間に生じ
る音信号の位相のずれが、所定の誤差内に入るようなサ
ンプリング周期を設定する手順と、 前記各マイクロホンの音信号をサンプリングする手順お
よび各マイクロホンを同心球に対応づけるための手順
が、前記設定されたサンプリング周期により行われるよ
うに制御する手順とを実行するためのプログラムが記録
されて成る音信号処理用のプログラムが記録された記録
媒体。
20. The recording medium according to claim 19, wherein a sound signal from the sound source is taken into the microphone when the microphone is associated with a peripheral surface of a predetermined sphere. A procedure for setting a sampling period such that a phase shift of a sound signal generated between the case where the sound signal is captured on the peripheral surface of the sphere corresponding to the microphone falls within a predetermined error, and a step of sampling the sound signal of each microphone. And a procedure for controlling each microphone to correspond to a concentric sphere, and a procedure for controlling so as to be performed at the set sampling period. Recording media.
JP11215812A 1999-07-29 1999-07-29 Method of setting microphone, method for processing sound signal, and devices for inputting, recording and processing sound signal, using these methods and voice recognition processing device and recording medium recording program for processing sound signal Pending JP2001042888A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP11215812A JP2001042888A (en) 1999-07-29 1999-07-29 Method of setting microphone, method for processing sound signal, and devices for inputting, recording and processing sound signal, using these methods and voice recognition processing device and recording medium recording program for processing sound signal

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11215812A JP2001042888A (en) 1999-07-29 1999-07-29 Method of setting microphone, method for processing sound signal, and devices for inputting, recording and processing sound signal, using these methods and voice recognition processing device and recording medium recording program for processing sound signal

Publications (1)

Publication Number Publication Date
JP2001042888A true JP2001042888A (en) 2001-02-16

Family

ID=16678674

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11215812A Pending JP2001042888A (en) 1999-07-29 1999-07-29 Method of setting microphone, method for processing sound signal, and devices for inputting, recording and processing sound signal, using these methods and voice recognition processing device and recording medium recording program for processing sound signal

Country Status (1)

Country Link
JP (1) JP2001042888A (en)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005522708A (en) * 2002-04-15 2005-07-28 エポス テクノロジーズ リミテッド Method and system for obtaining positioning data
JP2007129485A (en) * 2005-11-02 2007-05-24 Yamaha Corp Sound pickup device
US7852318B2 (en) 2004-05-17 2010-12-14 Epos Development Ltd. Acoustic robust synchronization signaling for acoustic positioning system
US8861312B2 (en) 2007-03-14 2014-10-14 Qualcomm Incorporated MEMS microphone
US8963890B2 (en) 2005-03-23 2015-02-24 Qualcomm Incorporated Method and system for digital pen assembly
CN111883167A (en) * 2020-08-12 2020-11-03 上海明略人工智能(集团)有限公司 Sound separation method and device, recording equipment and readable storage medium
CN115691496A (en) * 2022-12-29 2023-02-03 北京国安广传网络科技有限公司 TTS-based health management robot voice interaction module

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015163893A (en) * 2002-04-15 2015-09-10 クアルコム,インコーポレイテッド Method and system for obtaining positioning data
US9446520B2 (en) 2002-04-15 2016-09-20 Qualcomm Incorporated Method and system for robotic positioning
JP2009244268A (en) * 2002-04-15 2009-10-22 Epos Technologies Ltd Method and system for obtaining positioning data
JP2005522708A (en) * 2002-04-15 2005-07-28 エポス テクノロジーズ リミテッド Method and system for obtaining positioning data
JP2012027029A (en) * 2002-04-15 2012-02-09 Epos Development Ltd Method and system for obtaining positioning data
US9195325B2 (en) 2002-04-15 2015-11-24 Qualcomm Incorporated Method and system for obtaining positioning data
US7852318B2 (en) 2004-05-17 2010-12-14 Epos Development Ltd. Acoustic robust synchronization signaling for acoustic positioning system
US8963890B2 (en) 2005-03-23 2015-02-24 Qualcomm Incorporated Method and system for digital pen assembly
US9632627B2 (en) 2005-03-23 2017-04-25 Qualcomm Incorporated Method and system for digital pen assembly
JP2007129485A (en) * 2005-11-02 2007-05-24 Yamaha Corp Sound pickup device
US8861312B2 (en) 2007-03-14 2014-10-14 Qualcomm Incorporated MEMS microphone
CN111883167A (en) * 2020-08-12 2020-11-03 上海明略人工智能(集团)有限公司 Sound separation method and device, recording equipment and readable storage medium
CN115691496A (en) * 2022-12-29 2023-02-03 北京国安广传网络科技有限公司 TTS-based health management robot voice interaction module
CN115691496B (en) * 2022-12-29 2023-05-12 北京国安广传网络科技有限公司 TTS-based voice interaction module of health management robot

Similar Documents

Publication Publication Date Title
US11657798B2 (en) Methods and apparatus to segment audio and determine audio segment similarities
CN109670074B (en) Rhythm point identification method and device, electronic equipment and storage medium
US9291697B2 (en) Systems, methods, and apparatus for spatially directive filtering
CN102625946B (en) Systems, methods, apparatus, and computer-readable media for dereverberation of multichannel signal
CN101023469B (en) Digital filtering method, digital filtering equipment
US9632586B2 (en) Audio driver user interface
JP4812302B2 (en) Sound source direction estimation system, sound source direction estimation method, and sound source direction estimation program
US20150186109A1 (en) Spatial audio user interface apparatus
CN110875060A (en) Voice signal processing method, device, system, equipment and storage medium
CN110400571B (en) Audio processing method and device, storage medium and electronic equipment
CN103278801A (en) Noise imaging detection device and detection calculation method for transformer substation
CN110782911A (en) Audio signal processing method, apparatus, device and storage medium
US20220054049A1 (en) High-precision temporal measurement of vibro-acoustic events in synchronisation with a sound signal on a touch-screen device
JP2001042888A (en) Method of setting microphone, method for processing sound signal, and devices for inputting, recording and processing sound signal, using these methods and voice recognition processing device and recording medium recording program for processing sound signal
CN107105384A (en) The synthetic method of near field virtual sound image on a kind of middle vertical plane
CN108429998A (en) Source of sound localization method and system, sound box system localization method and sound box system
CN109979418A (en) Audio-frequency processing method, device, electronic equipment and storage medium
US7856106B2 (en) System and method for determining a representation of an acoustic field
JP2006304124A (en) Apparatus and method for confirming direction of sound source
CN110992972A (en) Sound source noise reduction method based on multi-microphone earphone, electronic equipment and computer readable storage medium
US20070076899A1 (en) Audio collecting device by audio input matrix
JPH09238394A (en) Directivity microphone equipment
CN115150712A (en) Vehicle-mounted microphone system and automobile
CN107452363A (en) Musical instrument tuner method and system
Wang et al. Windcompass: Determine wind direction using smartphones

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20050726

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050802

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050926

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20060905