JP6772890B2 - Signal processing equipment, programs and methods - Google Patents

Signal processing equipment, programs and methods Download PDF

Info

Publication number
JP6772890B2
JP6772890B2 JP2017032567A JP2017032567A JP6772890B2 JP 6772890 B2 JP6772890 B2 JP 6772890B2 JP 2017032567 A JP2017032567 A JP 2017032567A JP 2017032567 A JP2017032567 A JP 2017032567A JP 6772890 B2 JP6772890 B2 JP 6772890B2
Authority
JP
Japan
Prior art keywords
feature amount
filter
sound
frequency
frequency analysis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017032567A
Other languages
Japanese (ja)
Other versions
JP2018136509A (en
Inventor
大 藤枝
大 藤枝
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP2017032567A priority Critical patent/JP6772890B2/en
Publication of JP2018136509A publication Critical patent/JP2018136509A/en
Application granted granted Critical
Publication of JP6772890B2 publication Critical patent/JP6772890B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、信号処理装置、プログラム及び方法に関し、例えば、複数の音源が存在する環境下で、特定の方向の範囲に存在する音源を強調し収音することを欲する通信端末、オーディオ機器、音声認識装置などに適用し得る。 The present invention relates to a signal processing device, a program, and a method, for example, a communication terminal, an audio device, and a voice that want to emphasize and collect sound sources existing in a specific direction in an environment where a plurality of sound sources exist. It can be applied to recognition devices and the like.

複数の音源が存在する環境下において、ある目的の音源を抽出する技術として、複数のマイクを用いた音源分離、マイクを直線上や平面上、球面上等に配置したマイクアレイを用いたビームフォーマやヌルフォーマ等がある。特に、目的の音源以外の音源が非定常である場合や、複数ある場合には、単一のマイクを用いたノイズサプレッサによる目的音源の抽出は難しく、2つ以上のマイクを用いることが必須となる。 As a technique for extracting a certain target sound source in an environment where multiple sound sources exist, sound source separation using multiple microphones and a beam former using a microphone array in which microphones are arranged on a straight line, a plane, a spherical surface, etc. And nullformers. In particular, when sound sources other than the target sound source are non-stationary, or when there are multiple sound sources, it is difficult to extract the target sound source with a noise suppressor using a single microphone, and it is essential to use two or more microphones. Become.

上述したマイクアレイを用いたビームフォーマとは、ある特定の方向の音のみ強調し収音する技術である。ビームフォーマとは、各マイクに到達する信号の時間差を利用して指向性を形成する技術である。 The beam former using the microphone array described above is a technique for emphasizing and collecting sound only in a specific direction. Beam former is a technique for forming directivity by utilizing the time difference of signals arriving at each microphone.

ビームフォーマには、加算型と減算型という2つの種類がある。加算型ビームフォーマに比べて、減算型ビームフォーマはより少ないマイク数で鋭い指向性を形成できるという利点がある。 There are two types of beam formers: addition type and subtraction type. Compared to the additive beamformer, the subtractive beamformer has the advantage that sharp directivity can be formed with a smaller number of microphones.

図13は、マイク数が2個の場合の減算型ビームフォーマに係る構成を示すブロック図である。図13の減算型ビームフォーマは、第1のマイクM1、第2のマイクM2、第1の遅延手段3、第2の遅延手段4、減算手段5から構成される。第1のマイクM1で収音した第1の入力信号は第1の遅延手段3に与えられ、第2のマイクM2で収音した第2の入力信号は第2の遅延手段4に与えられる。妨害音が第1のマイクM1側から到来している場合、第1の遅延手段3は第1の入力信号を遅延させることで、第1の入力信号と第2の入力信号に含まれる妨害音の位相を合わせる。一方、妨害音が第2のマイクM2側から到来している場合、第2の遅延手段4は第2の入力信号を遅延させることで、妨害音の位相を合わせる。第1の遅延手段3から得られた第1の遅延信号と第2の遅延手段から得られた第2の遅延信号は減算手段5に与えられる。減算手段5は、第1の遅延信号から第2の遅延信号を減じることで、強調音声を得る。以上のように、減算型ビームフォーマは、第1の入力信号と第2の入力信号とに含まれる妨害音の位相を合わせ、減算し、妨害音を抑圧することで、目的音を強調する。減算型ビームフォーマは、事前に与えられる妨害音の到来方向情報を必要とする。 FIG. 13 is a block diagram showing a configuration related to a subtraction type beamformer when the number of microphones is two. The subtraction type beamformer of FIG. 13 is composed of a first microphone M1, a second microphone M2, a first delay means 3, a second delay means 4, and a subtraction means 5. The first input signal picked up by the first microphone M1 is given to the first delay means 3, and the second input signal picked up by the second microphone M2 is given to the second delay means 4. When the disturbing sound comes from the first microphone M1 side, the first delay means 3 delays the first input signal, so that the disturbing sound included in the first input signal and the second input signal To match the phase of. On the other hand, when the disturbing sound comes from the second microphone M2 side, the second delay means 4 delays the second input signal to match the phase of the disturbing sound. The first delay signal obtained from the first delay means 3 and the second delay signal obtained from the second delay means are given to the subtraction means 5. The subtracting means 5 obtains the emphasized voice by subtracting the second delay signal from the first delay signal. As described above, the subtraction type beamformer emphasizes the target sound by matching the phases of the disturbing sounds contained in the first input signal and the second input signal, subtracting them, and suppressing the disturbing sounds. The subtraction type beam former requires information on the direction of arrival of the disturbing sound given in advance.

ところで、減算型ビームフォーマには、妨害音源が少しでも移動してしまうと、妨害音の抑圧性能が大きく低下してしまう問題がある。 By the way, the subtraction type beam former has a problem that the suppression performance of the disturbing sound is greatly deteriorated if the disturbing sound source moves even a little.

図14は、従来の信号処理装置Zを用いて、自動車(車両)Aの中における運転手U1の音声を強調する例について示した説明図である。 FIG. 14 is an explanatory diagram showing an example of emphasizing the voice of the driver U1 in the automobile (vehicle) A by using the conventional signal processing device Z.

例えば、図14に示すように音声認識を用いて音声によって操作できるカーナビゲーションシステムなどでは、自動車内において運転手の音声だけを抽出する必要がある。 For example, in a car navigation system or the like that can be operated by voice using voice recognition as shown in FIG. 14, it is necessary to extract only the driver's voice in the car.

したがって、運転席と助手席にそれぞれ人が乗車している場合には、助手席の助手U2の音声(妨害音)を抑圧する必要があるが、助手U2が前後左右に顔(妨害音源)を動かすと、減算型ビームフォーマでは妨害音を抑圧することができない。 Therefore, when a person is in the driver's seat and the passenger's seat, it is necessary to suppress the voice (interfering sound) of the passenger U2 in the passenger's seat, but the assistant U2 makes a face (interfering sound source) in front, back, left and right. When moved, the subtractive beamformer cannot suppress the disturbing sound.

適応ビームフォーマの代表の一つである最小分散ビームフォーマ(Minimum Variance Beamformer:MVB)は、目的音の到来方向を事前に与えることで、妨害音を効率的に抑圧できる方法である。MVBは、目的音の到来方向に対してはゲインが1となるような拘束条件の下で、強調音声の分散を最小化することにより、妨害音を抑圧する。 The Minimum Variance Beamformer (MVB), which is one of the representative adaptive beamformers, is a method that can efficiently suppress disturbing sounds by giving the direction of arrival of the target sound in advance. The MVB suppresses the disturbing sound by minimizing the dispersion of the emphasized sound under the constraint condition that the gain is 1 with respect to the arrival direction of the target sound.

また、スペクトル減算法を用いることで、目的音源の到来方向に強い指向性を形成することができる。非特許文献1では、目的音源は常に正面にあると仮定して、第1に減算型ビームフォーマで正面方向から到来する目的音を抑圧した目的音抑圧信号を得、第2に第1の入力信号の振幅スペクトルから目的音抑圧信号の振幅スペクトルを減算(スペクトル減算)することで目的音を強調した強調音声の振幅スペクトルを得、第3に強調音声の振幅スペクトルと第1の入力信号の位相スペクトルとを用いて強調音声を得る。 Further, by using the spectrum subtraction method, it is possible to form a strong directivity in the direction of arrival of the target sound source. In Non-Patent Document 1, assuming that the target sound source is always in front, a subtraction type beam former first obtains a target sound suppression signal that suppresses a target sound coming from the front direction, and secondly, a first input. By subtracting the amplitude spectrum of the target sound suppression signal from the amplitude spectrum of the signal (spectrum subtraction), the amplitude spectrum of the emphasized sound that emphasizes the target sound is obtained, and thirdly, the amplitude spectrum of the emphasized sound and the phase of the first input signal are obtained. The enhanced sound is obtained using the spectrum.

矢頭 隆、森戸 誠、山田 圭、小川 哲司、“正方形マイクロホンアレイによる音源分離技術”、情報処理、Vol.51、No.11、2010Takashi Yato, Makoto Morito, Kei Yamada, Tetsuji Ogawa, "Sound Source Separation Technology by Square Microphone Array", Information Processing, Vol. 51, No. 11, 2010

しかしながら、従来の技術は以下に述べる問題を有する。 However, conventional techniques have the following problems.

図15は、自動車Aの中における目的音と妨害音のイメージについて示した説明図である。 FIG. 15 is an explanatory diagram showing an image of a target sound and an interfering sound in the automobile A.

MVBは、マイクの数より1つ少ない数の妨害音しか抑圧することができない。したがって、図14のように2つのマイクで目的音を強調する場合、妨害音は図15(b)に示すように伝搬するため、MVBは妨害音の直接音を抑圧できるが反射音を抑圧できないので、目的音を十分に強調することができない。 The MVB can suppress only one less disturbing sound than the number of microphones. Therefore, when the target sound is emphasized by two microphones as shown in FIG. 14, since the disturbing sound propagates as shown in FIG. 15 (b), the MVB can suppress the direct sound of the disturbing sound but cannot suppress the reflected sound. Therefore, the target sound cannot be sufficiently emphasized.

非特許文献1に記載の技術は、正面方向以外から到来した音声は、目的音に由来するものであってもすべて抑圧してしまう。したがって、図14のように2つのマイクで目的音を強調する場合、目的音は図15(a)に示すように伝搬するため、非特許文献1に記載の技術は目的音の反射音をも抑圧してしまうため、目的音の音質が劣化してしまう。 The technique described in Non-Patent Document 1 suppresses all sounds coming from other than the front direction, even if they are derived from the target sound. Therefore, when the target sound is emphasized by two microphones as shown in FIG. 14, the target sound propagates as shown in FIG. 15 (a). Therefore, the technique described in Non-Patent Document 1 also includes the reflected sound of the target sound. Since it is suppressed, the sound quality of the target sound deteriorates.

そのため、より少ない演算コストで、且つ、より少ない歪みで目的音を強調する信号処理装置、プログラム及び方法を提供することができる。 Therefore, it is possible to provide a signal processing device, a program, and a method for emphasizing a target sound with less calculation cost and less distortion.

第1の本発明の信号処理装置は、(1)第1の収音装置から入力された第1の入力信号を周波数解析して第1の入力スペクトルを得る第1の周波数解析手段と、(2)第2の収音装置から入力された第2の入力信号を周波数解析して第2の入力スペクトルを得る第2の周波数解析手段と、(3)前記第1の周波数解析手段で得られた第1の入力スペクトルと前記第2の周波数解析手段で得られた第2の入力スペクトルに基づき、前記第1の収音装置の位置と前記第2の収音装置の位置を結んだ直線と垂直をなす正面方向に対して、正面方向及び前記第1の収音装置側の方向の値を大きくとり、前記第2の収音装置側の方向の値を小さくとる第1の特徴量を算出する特徴量算出手段と、(4)前記特徴量算出手段で算出された前記第1の特徴量を、所定の広義単調増加関数で写像して強調フィルタを得るフィルタ決定手段と、(5)前記第1の周波数解析手段で得られた第1の入力スペクトルに前記フィルタ決定手段で得られた強調フィルタを乗じて強調スペクトルを得る乗算手段とを備えることを特徴とする。 The first signal processing device of the present invention includes (1) a first frequency analysis means for frequency-analyzing a first input signal input from a first sound collecting device to obtain a first input spectrum, and (1). 2) A second frequency analysis means for obtaining a second input spectrum by frequency-analyzing a second input signal input from the second sound collecting device, and (3) obtained by the first frequency analysis means. Based on the first input spectrum and the second input spectrum obtained by the second frequency analysis means, a straight line connecting the position of the first sound collecting device and the position of the second sound collecting device. Calculate the first feature amount in which the values in the front direction and the direction on the first sound collecting device side are made larger and the values in the direction on the second sound collecting device side are made smaller than the vertical front direction. The feature amount calculating means to be used, (4) the filter determining means for obtaining an emphasis filter by mapping the first feature amount calculated by the feature amount calculating means with a predetermined broad-sense monotonous increase function, and (5) the above. It is characterized by including a multiplication means for obtaining an emphasis spectrum by multiplying the first input spectrum obtained by the first frequency analysis means by the enhancement filter obtained by the filter determination means.

第2の本発明の信号処理プログラムは、コンピュータを、(1)第1の収音装置から入力された第1の入力信号を周波数解析して第1の入力スペクトルを得る第1の周波数解析手段と、(2)第2の収音装置から入力された第2の入力信号を周波数解析して第2の入力スペクトルを得る第2の周波数解析手段と、(3)前記第1の周波数解析手段で得られた第1の入力スペクトルと前記第2の周波数解析手段で得られた第2の入力スペクトルに基づき、前記第1の収音装置の位置と前記第2の収音装置の位置を結んだ直線と垂直をなす正面方向に対して、正面方向及び前記第1の収音装置側の方向の値を大きくとり、前記第2の収音装置側の方向の値を小さくとる第1の特徴量を算出する特徴量算出手段と、(4)前記特徴量算出手段で算出された前記第1の特徴量を、所定の広義単調増加関数で写像して強調フィルタを得るフィルタ決定手段と、(5)前記第1の周波数解析手段で得られた第1の入力スペクトルに前記フィルタ決定手段で得られた強調フィルタを乗じて強調スペクトルを得る乗算手段と、(6)前記乗算手段で得られた強調スペクトルを入力して信号波形を復元して強調音声を得る波形復元手段として機能させることを特徴とする。 The second signal processing program of the present invention is a first frequency analysis means for obtaining a first input spectrum by frequency-analyzing a computer with (1) a first input signal input from a first sound collecting device. And (2) a second frequency analysis means for obtaining a second input spectrum by frequency analysis of the second input signal input from the second sound collecting device, and (3) the first frequency analysis means. Based on the first input spectrum obtained in the above and the second input spectrum obtained by the second frequency analysis means, the position of the first sound collecting device and the position of the second sound collecting device are connected. The first feature that the value in the front direction and the direction on the first sound collecting device side is large and the value in the direction on the second sound collecting device side is small with respect to the front direction perpendicular to the straight line. A feature amount calculating means for calculating an amount, and (4) a filter determining means for obtaining an emphasis filter by mapping the first feature amount calculated by the feature amount calculating means with a predetermined broad-sense monotonous increase function. 5) A multiplication means obtained by multiplying the first input spectrum obtained by the first frequency analysis means by the emphasis filter obtained by the filter determination means to obtain an emphasis spectrum, and (6) the multiplication means obtained by the multiplication means. It is characterized in that it functions as a waveform restoration means for inputting an emphasis spectrum and restoring a signal waveform to obtain an emphasized sound.

第3の本発明の信号処理方法は、信号処理方法において、(1)第1の周波数解析手段、第2の周波数解析手段、特徴量算出手段、フィルタ決定手段、及び乗算手段を有し、(2)前記第1の周波数解析手段は、第1の収音装置から入力された第1の入力信号を周波数解析して第1の入力スペクトルを得て、(3)前記第2の周波数解析手段は、第2の収音装置から入力された第2の入力信号を周波数解析して第2の入力スペクトルを得て、(4)前記特徴量算出手段は、前記第1の周波数解析手段で得られた第1の入力スペクトルと前記第2の周波数解析手段で得られた第2の入力スペクトルに基づき、前記第1の収音装置の位置と前記第2の収音装置の位置を結んだ直線と垂直をなす正面方向に対して、正面方向及び前記第1の収音装置側の方向の値を大きくとり、前記第2の収音装置側の方向の値を小さくとる第1の特徴量を算出し、(5)前記フィルタ決定手段は、前記特徴量算出手段で算出された前記第1の特徴量を、所定の広義単調増加関数で写像して強調フィルタを得て、(6)前記乗算手段は、前記第1の周波数解析手段で得られた第1の入力スペクトルに前記フィルタ決定手段で得られた強調フィルタを乗じて強調スペクトルを得ることを特徴とする。 The third signal processing method of the present invention includes (1) a first frequency analysis means, a second frequency analysis means, a feature amount calculation means, a filter determination means, and a multiplication means in the signal processing method. 2) The first frequency analysis means obtains a first input spectrum by frequency-analyzing the first input signal input from the first sound collecting device, and (3) the second frequency analysis means. (4) The feature amount calculation means is obtained by the first frequency analysis means by frequency-analyzing the second input signal input from the second sound collecting device to obtain a second input spectrum. A straight line connecting the position of the first sound collecting device and the position of the second sound collecting device based on the obtained first input spectrum and the second input spectrum obtained by the second frequency analysis means. A first feature amount in which the values in the front direction and the direction on the first sound collecting device side are large and the values in the direction on the second sound collecting device side are small with respect to the front direction perpendicular to the frequency. The filter determining means (5) maps the first feature amount calculated by the feature amount calculating means with a predetermined broad monotonous increase function to obtain an emphasis filter, and (6) the multiplication. The means is characterized in that the enhancement spectrum is obtained by multiplying the first input spectrum obtained by the first frequency analysis means by the enhancement filter obtained by the filter determining means.

本発明によれば、より少ない演算コストで、且つ、より少ない歪みで目的音を強調する信号処理装置、プログラム及び方法を提供することができる。 According to the present invention, it is possible to provide a signal processing device, a program and a method for emphasizing a target sound with less calculation cost and less distortion.

第1の実施形態に係る信号処理装置の機能的構成について示したブロック図である。It is a block diagram which showed the functional structure of the signal processing apparatus which concerns on 1st Embodiment. 第1の実施形態に係る信号処理装置の使用環境の例について示した説明図である。It is explanatory drawing which showed the example of the use environment of the signal processing apparatus which concerns on 1st Embodiment. 第1の実施形態に係る信号処理装置で処理される特徴量Fcenterの例について示している。An example of the feature quantity Fcenter processed by the signal processing apparatus according to the first embodiment is shown. 第1の実施形態に係る信号処理装置で処理される特徴量Fsideの例について示している。An example of the feature quantity F side processed by the signal processing apparatus according to the first embodiment is shown. 第1の実施形態に係る信号処理装置で処理される音の到来方向θとDOA特徴量Fとの関係について示したグラフである。It is a graph which showed the relationship between the arrival direction θ of the sound processed by the signal processing apparatus which concerns on 1st Embodiment, and DOA feature quantity F. 第1の実施形態に係る信号処理装置で処理される広義単調増加関数の例について示したグラフである。It is a graph which showed the example of the broad sense monotonous increase function processed by the signal processing apparatus which concerns on 1st Embodiment. 第1の実施形態に係る信号処理装置で用いられる強調フィルタの例について示したグラフである。It is a graph which showed the example of the emphasis filter used in the signal processing apparatus which concerns on 1st Embodiment. 第1の実施形態に係るフィルタ決定手段で得られる強調フィルタGの例について示したグラフである。It is a graph which showed the example of the emphasis filter G obtained by the filter determination means which concerns on 1st Embodiment. 第2の実施形態に係るフィルタ決定手段で得られる強調フィルタGの例について示したグラフである。It is a graph which showed the example of the emphasis filter G obtained by the filter determination means which concerns on 2nd Embodiment. 第2の実施形態に係るフィルタ決定手段で得られる強調フィルタGと、第3の実施形態に係るフィルタ決定手段で得られる強調フィルタGとの比較について示したグラフである。It is a graph which showed the comparison between the emphasis filter G obtained by the filter determination means which concerns on 2nd Embodiment, and the enhancement filter G obtained by the filter determination means which concerns on 3rd Embodiment. 第4の実施形態に係る信号処理装置で処理される音の到来方向θとDOA特徴量F’との関係について示したグラフである。It is a graph which showed the relationship between the arrival direction θ of the sound processed by the signal processing apparatus which concerns on 4th Embodiment, and DOA feature quantity F'. 第4の実施形態に係るフィルタ決定手段404で得られる強調フィルタGの例について示した説明図である。It is explanatory drawing which showed the example of the emphasis filter G obtained by the filter determination means 404 which concerns on 4th Embodiment. 従来のマイク数が2個の場合の減算型ビームフォーマに係る構成を示すブロック図である。It is a block diagram which shows the structure which concerns on the subtraction type beam former when the number of conventional microphones is two. 従来の信号処理装置を用いて、自動車の中における運転手の音声を強調する例について示した説明図である。It is explanatory drawing which showed the example which emphasizes the voice of a driver in an automobile by using the conventional signal processing apparatus. 自動車の中における目的音と妨害音のイメージについて示した説明図である。It is explanatory drawing which showed the image of the target sound and the disturbing sound in an automobile.

(A)第1の実施形態
以下、本発明による信号処理装置、プログラム及び方法の第1の実施形態を、図面を参照しながら詳述する。
(A) First Embodiment Hereinafter, the first embodiment of the signal processing apparatus, program and method according to the present invention will be described in detail with reference to the drawings.

(A−1)第1の実施形態の構成
図2は、第1の実施形態に係る信号処理装置100が利用される環境について示した説明図である。なお、図2において、括弧内の符号は、後述する第2〜第4の実施形態において用いられる符号である。
(A-1) Configuration of First Embodiment FIG. 2 is an explanatory diagram showing an environment in which the signal processing device 100 according to the first embodiment is used. In FIG. 2, the reference numerals in parentheses are the reference numerals used in the second to fourth embodiments described later.

第1の実施形態に係る信号処理装置100は、自動車Aの中における運転手U1の音声を強調する例について示した説明図である。自動車Aの中では、運転席に運転手U1が座り、助手席に助手U2が座った状態となっている。そして、自動車Aの中では運転手U1の正面(運転席の正面)に、マイクアレイを構成する第1のマイクM1及び第2のマイクM2が配置されている。運転手U1からみて、第1のマイクM1は左側(助手U2と反対の側)に配置されており、第2のマイクM2は右側(助手U2の側)に配置されている。 The signal processing device 100 according to the first embodiment is an explanatory diagram showing an example of emphasizing the voice of the driver U1 in the automobile A. In the automobile A, the driver U1 is seated in the driver's seat, and the passenger U2 is seated in the passenger seat. In the automobile A, the first microphone M1 and the second microphone M2 constituting the microphone array are arranged in front of the driver U1 (front of the driver's seat). The first microphone M1 is arranged on the left side (the side opposite to the assistant U2) and the second microphone M2 is arranged on the right side (the side opposite to the assistant U2) when viewed from the driver U1.

図1は、第1の実施形態に係る信号処理装置100の機能的構成を示すブロック図である。 FIG. 1 is a block diagram showing a functional configuration of the signal processing device 100 according to the first embodiment.

第1の実施形態の信号処理装置100は、第1の周波数解析手段101、第2の周波数解析手段102、特徴量算出手段103、フィルタ決定手段104、乗算手段105、及び波形復元手段106を有している。 The signal processing device 100 of the first embodiment includes a first frequency analysis means 101, a second frequency analysis means 102, a feature amount calculation means 103, a filter determination means 104, a multiplication means 105, and a waveform restoration means 106. are doing.

信号処理装置100は、一部または全部をソフトウェア的に構成するようにしてもよい。信号処理装置100は、例えば、メモリ及びプロセッサを有するコンピュータにプログラム(実施形態に係る信号処理プログラムを含む)をインストールすることにより構成してもよい。 The signal processing device 100 may be partially or wholly configured by software. The signal processing device 100 may be configured, for example, by installing a program (including the signal processing program according to the embodiment) in a computer having a memory and a processor.

第1の周波数解析手段101は、第1の入力信号x1を周波数解析して第1の入力スペクトルX1を得る。 The first frequency analysis means 101 frequency-analyzes the first input signal x1 to obtain the first input spectrum X1.

第2の周波数解析手段102は、第2の入力信号x2を周波数解析して第2の入力スペクトルX2を得る。 The second frequency analysis means 102 frequency-analyzes the second input signal x2 to obtain the second input spectrum X2.

特徴量算出手段103は、第1の入力スペクトルX1と第2の入力スペクトルX2とに基づいて所定の特徴量(以下、「DOA特徴量F」と呼ぶ)を得る。DOA特徴量Fは、目的音の到来方向に応じて変化する特徴量であり、詳細については後述する。 The feature amount calculating means 103 obtains a predetermined feature amount (hereinafter, referred to as “DOA feature amount F”) based on the first input spectrum X1 and the second input spectrum X2. The DOA feature amount F is a feature amount that changes according to the arrival direction of the target sound, and the details will be described later.

特徴量算出手段103は、(1)式または(1)式を式変形した計算式によって前記DOA特徴量Fを得ることができる。 The feature amount calculation means 103 can obtain the DOA feature amount F by a calculation formula obtained by modifying the formula (1) or the formula (1).

(1)式では、ある時刻のある周波数において、前記第1の入力スペクトルをX、前記第2の入力スペクトルをX、前記第2の入力スペクトルの複素共役をX としている。

Figure 0006772890
In the equation (1), the first input spectrum is X 1 , the second input spectrum is X 2 , and the complex conjugate of the second input spectrum is X 2 * at a certain frequency at a certain time.
Figure 0006772890

フィルタ決定手段104は、DOA特徴量Fを所定の広義単調増加関数で写像して強調フィルタGを得る。 The filter determining means 104 maps the DOA feature amount F with a predetermined broad-sense monotonous increasing function to obtain an emphasis filter G.

乗算手段105は、第1の入力スペクトルX1に強調フィルタGを乗じて強調スペクトルYを得る。 The multiplication means 105 multiplies the first input spectrum X1 by the emphasis filter G to obtain the enhancement spectrum Y.

波形復元手段106は、強調スペクトルYに基づいて信号波形を復元して強調音声yを得る。 The waveform restoration means 106 restores the signal waveform based on the enhancement spectrum Y to obtain the enhancement voice y.

次に、特徴量算出手段103が得るDOA特徴量と、フィルタ決定手段104が得る強調フィルタの設計思想について述べる。 Next, the DOA feature amount obtained by the feature amount calculating means 103 and the design concept of the emphasis filter obtained by the filter determining means 104 will be described.

強調フィルタには、第2のマイクM2側(妨害音側)から到来する妨害音の直接音と反射音を抑圧し、第1のマイクM1側(目的音側、また、正面方向を含む)から到来する目的音の直接音と反射音を抑圧しない特徴を与える必要がある。そのため、DOA特徴量には、音が、第1のマイクM1側から到来した場合には大きな値を取り、第2のマイクM2側から到来した場合には小さな値を取るようにしたい。しかし、第1のマイクM1側が正面方向を含んでいるために、このような特徴は音の到来方向に対して対称とはならないため、当該特徴を有する公知の特徴量はない。 The emphasis filter suppresses the direct sound and reflected sound of the disturbing sound coming from the second microphone M2 side (jamming sound side), and suppresses the direct sound and reflected sound from the first microphone M1 side (including the target sound side and the front direction). It is necessary to give a feature that does not suppress the direct sound and the reflected sound of the incoming target sound. Therefore, it is desired that the DOA feature amount take a large value when the sound arrives from the first microphone M1 side and a small value when the sound arrives from the second microphone M2 side. However, since the first microphone M1 side includes the front direction, such a feature is not symmetrical with respect to the arrival direction of the sound, and therefore, there is no known feature amount having the feature.

そこで、正面方向に対して大きな値を取る特徴量と、第2のマイクM2側に対して大きな値を取る特徴量を考える。ある時刻のある周波数において、前記第1の入力スペクトルをX、前記第2の入力スペクトルをX、前記第2の入力スペクトルの複素共役をX とおき、例えば、式(1−1)で表される特徴量Fcenterと、式(1−2)で表される特徴量Fsideを考える。

Figure 0006772890
Therefore, consider a feature amount that takes a large value with respect to the front direction and a feature amount that takes a large value with respect to the second microphone M2 side. At a certain frequency at a certain time, the first input spectrum is X 1 , the second input spectrum is X 2 , and the complex conjugate of the second input spectrum is X 2 * . For example, the equation (1-1) a feature amount F center represented by), consider a feature amount F side of the formula (1-2).
Figure 0006772890

ここで、正面方向(2つのマイクの位置を結んだ直線と垂直をなす方向)を0度、第2のマイクM2側の(第1のマイクM1から見た第2のマイクM2の)方向を+90度とし、音源のスペクトルをS、角周波数をω、2つのマイク間隔をd、音の到来方向をθ(シータ)、音速をcとおくと、XとXはそれぞれ(2)式と(3)式のように書け、式(2)と式(3)を(1−1)式と(1−2)式に代入すると、それぞれ(3−1)式と(3−2)式が得られる。(3−1)式と(3−2)式で表される特徴量FcenterとFsideの、音の到来方向θに対する関係を、それぞれ図3と図4に示す。 Here, the front direction (the direction perpendicular to the straight line connecting the positions of the two microphones) is 0 degrees, and the direction (of the second microphone M2 seen from the first microphone M1) on the second microphone M2 side is. Assuming that the spectrum of the sound source is S, the angular frequency is ω, the distance between the two microphones is d, the direction of arrival of the sound is θ (theta), and the sound velocity is c, then X 1 and X 2 are equations (2), respectively. And (3), and substituting equations (2) and (3) into equations (1-1) and (1-2), equations (3-1) and (3-2), respectively. The formula is obtained. The relationships between the feature quantities F center and F side represented by the equations (3-1) and (3-2) with respect to the sound arrival direction θ are shown in FIGS. 3 and 4, respectively.

図3は、特徴量Fcenterの例について示している。 FIG. 3 shows an example of the feature quantity F center .

図3では、横軸を音源の到来方向θとし縦軸を特徴量Fcenterとしている。図3では、音源の周波数を1kHz、2kHz、4kHzと変化させた場合の到来方向θと特徴量Fcenterの関係を示したグラフとなっている。 In FIG. 3, the horizontal axis is the direction of arrival of the sound source θ, and the vertical axis is the feature amount F center . FIG. 3 is a graph showing the relationship between the arrival direction θ and the feature amount F center when the frequency of the sound source is changed to 1 kHz, 2 kHz, and 4 kHz.

図4は、特徴量Fsideの例について示している。 FIG. 4 shows an example of the feature amount F side .

図4では、横軸を音源の到来方向θとし縦軸を特徴量Fsideとしている。図4では、音源の周波数を1kHz、2kHz、4kHzと変化させた場合の到来方向θと特徴量Fsideの関係を示したグラフとなっている。 In FIG. 4, the horizontal axis is the direction of arrival of the sound source θ, and the vertical axis is the feature amount F side . FIG. 4 is a graph showing the relationship between the arrival direction θ and the feature amount F side when the frequency of the sound source is changed to 1 kHz, 2 kHz, and 4 kHz.

図3と図4から、Fcenterは到来方向0度に対して大きな値となっており、またFsideは0度に対して第2のマイクM2側に対して大きな値となり、第1のマイクM1側に対して小さな値となっている。 From FIGS. 3 and 4, the F center has a large value with respect to the arrival direction of 0 degrees, and the F side has a large value with respect to the second microphone M2 side with respect to 0 degrees, and the first microphone has a large value. It is a small value with respect to the M1 side.

以上のように、DOA特徴量Fは、目的音の方向(0度の方向;正面方向)に対して大きな値となる特性があるFcenterと、第2のマイクM2側(すなわち妨害音の音源である助手U2の側のマイク)に対して大きな値となる特性があるFsideを用いて得られる特徴量であることがわかる。 As described above, DOA feature F, the direction of the target sound (0 ° direction; front direction) of the F center there is a characteristic that a large value relative to the second microphone M2 side (i.e. interference sound source It can be seen that this is a feature amount obtained by using F side, which has a characteristic of having a large value with respect to the microphone on the side of the assistant U2.

次に、音の到来方向とDOA特徴量との関係について述べる。 Next, the relationship between the direction of arrival of sound and the DOA feature amount will be described.

DOA特徴量は(3−3)式で定義する。

Figure 0006772890
DOA features are defined by Eq. (3-3).
Figure 0006772890

(2)式と(3)式を(3−3)式に代入すると(4)式が得られ、式変形すると(5)式が得られる。(5)式で表される音の到来方向θとDOA特徴量Fとの関係を図5に示す。 By substituting Eqs. (2) and (3) into Eqs. (3-3), Eqs. (4) is obtained, and by transforming Eqs., Eqs. (5) is obtained. FIG. 5 shows the relationship between the arrival direction θ of the sound represented by the equation (5) and the DOA feature amount F.

図5は、音の到来方向θとDOA特徴量Fとの関係について示したグラフである。 FIG. 5 is a graph showing the relationship between the sound arrival direction θ and the DOA feature amount F.

図5では、横軸を音源の到来方向θとし縦軸をDOA特徴量Fとしている。図5では、音源の周波数を1kHz、2kHz、4kHzと変化させた場合の到来方向θとDOA特徴量Fの関係を示したグラフとなっている。 In FIG. 5, the horizontal axis is the sound source arrival direction θ, and the vertical axis is the DOA feature amount F. FIG. 5 is a graph showing the relationship between the arrival direction θ and the DOA feature amount F when the frequency of the sound source is changed to 1 kHz, 2 kHz, and 4 kHz.

図5から、DOA特徴量Fは、正面方向に対しては必ずF=1となり、第2のマイクM2側(妨害音側)に対しては必ずF<1となる。一方、第1のマイクM1側に対しては、低い周波数と高い周波数の0度に近いθではF>1となり、高い周波数の90度に近い部分ではF<1となる。 From FIG. 5, the DOA feature amount F always has F = 1 in the front direction and F <1 in the second microphone M2 side (interfering sound side). On the other hand, with respect to the first microphone M1, F> 1 at a low frequency and θ close to 0 degrees at a high frequency, and F <1 at a portion close to 90 degrees at a high frequency.

以上のように、DOA特徴量Fは、音が、第1のマイクM1側から到来した場合には大きな値を取り、第2のマイクM2側から到来した場合には小さな値を取る特徴を備えていることがわかる。言い換えると、DOA特徴量Fは、正面方向から第1のマイクM1側の方向(助手U2からの妨害音と反対方向)にピークが存在し、当該ピークの存在する方向から第2のマイクM2側に方向が傾くほど値が小さくなる特徴があることがわかる。

Figure 0006772890
As described above, the DOA feature amount F has a feature that a large value is taken when the sound arrives from the first microphone M1 side and a small value is taken when the sound arrives from the second microphone M2 side. You can see that. In other words, the DOA feature amount F has a peak in the direction from the front direction to the first microphone M1 side (the direction opposite to the disturbing sound from the assistant U2), and the second microphone M2 side from the direction in which the peak exists. It can be seen that the value becomes smaller as the direction is tilted.
Figure 0006772890

強調フィルタは、DOA特徴量を所定の広義単調増加関数で写像することで得られる。 The emphasis filter is obtained by mapping DOA features with a predetermined broad-sense monotonous increasing function.

図6は、広義単調増加関数fmap(F)の例について示したグラフである。 FIG. 6 is a graph showing an example of an improper monotonic increase function fmap (F).

図6では、横軸をDOA特徴量Fの値とし縦軸を強調フィルタGの値としている。 In FIG. 6, the horizontal axis is the value of the DOA feature amount F, and the vertical axis is the value of the emphasis filter G.

図15からわかるように、強調フィルタは、第2のマイクM2側から到来する音を抑圧し、正面方向と第1のマイクM1側から到来する音は抑圧しないようにしたい。そこで、例えば広義単調増加関数fmap(F)を(6)式のように定義する。図6では、マイク間隔を3cm、音速を332m/s、F=0.9としたfmap(F)の例を示している。 As can be seen from FIG. 15, the emphasis filter suppresses the sound coming from the second microphone M2 side, and does not want to suppress the sound coming from the front direction and the first microphone M1 side. Therefore, for example, the improper monotonic increase function fmap (F) is defined as in Eq. (6). FIG. 6 shows an example of fmap (F) in which the microphone spacing is 3 cm, the speed of sound is 332 m / s, and F 0 = 0.9.

強調フィルタをG=fmap(F)として得ると、音の到来方向θと強調フィルタGとの関係は図7のようになる。 When the emphasis filter is obtained as G = fmap (F), the relationship between the sound arrival direction θ and the emphasis filter G is as shown in FIG.

図7は、強調フィルタの例について示したグラフである。 FIG. 7 is a graph showing an example of an emphasis filter.

図7では、横軸を音の到来方向θの値とし縦軸を強調フィルタGの値としている。図7では、音源の周波数を1kHz、2kHz、4kHzと変化させた場合の到来方向θと強調フィルタGの値の関係を示したグラフとなっている。 In FIG. 7, the horizontal axis is the value of the sound arrival direction θ, and the vertical axis is the value of the emphasis filter G. FIG. 7 is a graph showing the relationship between the arrival direction θ and the value of the emphasis filter G when the frequency of the sound source is changed to 1 kHz, 2 kHz, and 4 kHz.

つまり、DOA特徴量Fが1より少し小さい値より大きい場合には強調フィルタGを1とし、そうでない場合には強調フィルタGは1より小さくすることで、強調フィルタに所望の特性、すなわち妨害音の直接音と反射音を抑圧するが目的音の直接音と妨害音は抑圧しない特性を与えられる。

Figure 0006772890
That is, if the DOA feature amount F is larger than a value slightly smaller than 1, the emphasis filter G is set to 1, and if not, the emphasis filter G is set to be smaller than 1, so that the emphasis filter has the desired characteristics, that is, the disturbing sound. The direct sound and the reflected sound of the target sound are suppressed, but the direct sound and the disturbing sound of the target sound are not suppressed.
Figure 0006772890

なお、本発明と同様の強調フィルタは、例えば第1の入力スペクトルと第2の入力スペクトルとから周波数ごとに到来方向θを算出することで得ることもできるが、逆正接関数(atan、arctan、tan−1などと書かれる)を計算する演算コストがかかる。そのため、演算コストの観点で本発明の方が優位である。 The emphasis filter similar to the present invention can be obtained by calculating the arrival direction θ for each frequency from, for example, the first input spectrum and the second input spectrum, but the inverse tangent function (atan, arctan, It costs a lot to calculate (written as tan -1 etc.). Therefore, the present invention is superior from the viewpoint of calculation cost.

(A−2)第1の実施形態の動作
次に、上述した構成を有する第1の実施形態の信号処理装置100の動作(実施形態の信号処理方法)を、図1を参照しながら説明する。
(A-2) Operation of First Embodiment Next, the operation of the signal processing device 100 of the first embodiment having the above-described configuration (signal processing method of the embodiment) will be described with reference to FIG. ..

信号処理装置100は、目的音源を含む第1の入力信号xと第2の入力信号x(時間領域の入力信号)について、目的音強調を行って、強調音声y(時間領域の出力信号)を生成するものである。 The signal processing device 100 emphasizes the target sound for the first input signal x 1 and the second input signal x 2 (input signal in the time domain) including the target sound source, and emphasizes the sound y (output signal in the time domain). ) Is generated.

第1の周波数解析手段101及び第2の周波数解析手段は、フーリエ変換に代表される任意の周波数解析手法、またはフィルタバンクに代表される任意の帯域分割手段によって、第1の入力信号xと第2の入力信号xをそれぞれK個の帯域に分割し、第1の入力スペクトルXと第2の入力スペクトルXとを得る。以下、第1の入力スペクトルと第2の入力スペクトルは、帯域の番号(例えばk番目)を明示する必要がある場合はX(k)、X(k)と書き、帯域の番号を明示する必要がない場合は単にX、Xと表記する。第1の周波数解析手段101は、得られた第1の入力スペクトルXを特徴量算出手段103と乗算手段105に与え、第2の周波数解析手段102は、得られた第2の入力スペクトルXを特徴量算出手段103に与える。なお、乗算手段105に与えられる入力スペクトルは第1の入力スペクトルXとしたが、これに限定されるものではなく、第2の入力スペクトルXを乗算手段105に与えても良く、いずれも同様の効果を奏する。 The first frequency analysis means 101 and the second frequency analysis means are combined with the first input signal x 1 by any frequency analysis method represented by the Fourier transform or any band division means represented by the filter bank. The second input signal x 2 is divided into K bands, respectively, to obtain a first input spectrum X 1 and a second input spectrum X 2 . Hereinafter, the first input spectrum and the second input spectrum are written as X 1 (k) and X 2 (k) when it is necessary to specify the band number (for example, the kth), and the band number is specified. If it is not necessary to do so, simply write X 1 and X 2 . The first frequency analysis means 101 gives the obtained first input spectrum X 1 to the feature amount calculation means 103 and the multiplication means 105, and the second frequency analysis means 102 gives the obtained second input spectrum X 1. 2 is given to the feature amount calculating means 103. The input spectrum given to the multiplication means 105 is the first input spectrum X 1 , but the present invention is not limited to this, and the second input spectrum X 2 may be given to the multiplication means 105. It has the same effect.

特徴量算出手段103は、第1の入力スペクトルXと第2の入力スペクトルXとに基づいて(7)式によってDOA特徴量Fを算出し、フィルタ決定手段104に与える。(7)式をそのまま使って計算しても良いが、冗長な演算を含むため、式変形しても良い。XとXは複素数なので、これを(8)式のように書き直して(7)式に代入して整理すると、(9)式を得る。(7)式の代わりに(9)式を用いることで、乗算回数を減らすことができる。

Figure 0006772890
Feature calculating unit 103 has a first input spectrum X 1 and based on the second input spectrum X 2 (7) to calculate the DOA feature F by formula, giving the filter determining unit 104. The formula (7) may be used as it is for calculation, but the formula may be modified because it includes redundant calculations. Since X 1 and X 2 are complex numbers, rewriting them as in Eq. (8) and substituting them into Eq. (7) to obtain Eq. (9). By using the equation (9) instead of the equation (7), the number of multiplications can be reduced.
Figure 0006772890

フィルタ決定手段104は、DOA特徴量Fに基づいて所定の広義単調増加関数によって強調フィルタGを算出し、乗算手段105に与える。第1の実施形態では、すべての周波数に対して同じ広義単調増加関数を用いる。所定の広義単調増加関数fmap(F)として、例えば(10)式で定義される1つの閾値Fを持つ関数や、(11)式で定義される2つの閾値F、Fを持つ関数、(12)式で定義されるスケールF、オフセットFのシグモイド関数を用いることができる。

Figure 0006772890
The filter determining means 104 calculates the emphasis filter G by a predetermined broad-sense monotonous increase function based on the DOA feature amount F, and gives it to the multiplication means 105. In the first embodiment, the same broadly monotonous increasing function is used for all frequencies. As a predetermined broadly defined monotonous increasing function fmap (F), for example, a function having one threshold value F 0 defined by the equation (10) and a function having two threshold values F 1 and F 2 defined by the equation (11). , The sigmoid function of scale F 3 and offset F 0 defined by Eq. (12) can be used.
Figure 0006772890

図8は、第1の実施形態に係るフィルタ決定手段104で得られる強調フィルタGの例について示したグラフである。 FIG. 8 is a graph showing an example of the emphasis filter G obtained by the filter determining means 104 according to the first embodiment.

図8(a)、図8(b)、図8(c)は、それぞれ(10)式、(11)式、(12)式によって得られる強調フィルタGの例を示している。図8(a)、図8(b)、図8(c)では、音源の周波数を1kHz、2kHz、4kHzと変化させた場合の到来方向θと強調フィルタGの関係を示したグラフとなっている。図8(a)、図8(b)、図8(c)では、横軸を音源の到来方向θとし縦軸を強調フィルタGの値(到来方向θに応じた値)としている。 8 (a), 8 (b), and 8 (c) show examples of the emphasis filter G obtained by the equations (10), (11), and (12), respectively. 8 (a), 8 (b), and 8 (c) are graphs showing the relationship between the arrival direction θ and the emphasis filter G when the frequency of the sound source is changed to 1 kHz, 2 kHz, and 4 kHz. There is. In FIGS. 8 (a), 8 (b), and 8 (c), the horizontal axis is the sound source arrival direction θ, and the vertical axis is the value of the emphasis filter G (value corresponding to the arrival direction θ).

ここでは、F=0.8、F=0.7、F=0.9、F=12とした。妨害音の抑圧性能に関して、(10)式と(11)式との差はあまりない。一方、強調音声の歪みに関して、(10)式で得られる強調フィルタGは値を0か1しか持たないためにミュージカルノイズを発生しやすいが、(11)式は遷移帯域があることで抑圧/非抑圧の切り替わりが緩やかになるためにミュージカルノイズが発生しにくい。(12)式は(11)式をさらに滑らかにした特性となっており、更なるミュージカルノイズ低減効果や歪みを減らす効果が期待できる。多少の演算コストの増加が許容されるのであれば、(12)式を用いるのが好適である。 Here, F 0 = 0.8, F 1 = 0.7, F 2 = 0.9, and F 3 = 12. There is not much difference between the equations (10) and (11) in terms of the suppression performance of the disturbing sound. On the other hand, regarding the distortion of the emphasized voice, the emphasis filter G obtained by the equation (10) tends to generate musical noise because it has only 0 or 1, but the equation (11) suppresses / suppresses it by having a transition band. Musical noise is less likely to occur because the switching of non-suppression becomes gentle. Equation (12) has characteristics that are smoother than those of equation (11), and further effects of reducing musical noise and distortion can be expected. If a slight increase in calculation cost is allowed, it is preferable to use Eq. (12).

乗算手段105は、入力スペクトルXに周波数ごとに強調フィルタG(強調ゲイン)を乗じ、得られた強調スペクトルYを波形復元手段106に与える。 Multiplying means 105 multiplies the enhancement filter G (emphasis gain) for each frequency to the input spectrum X 1, giving the resulting enhancement spectrum Y to the waveform restoration means 106.

波形復元手段106は、第1の周波数解析手段101と第2の周波数解析手段102で用いた周波数解析手法または帯域分割手法に対応する波形復元手法を用いて、乗算手段105から与えられた強調スペクトルYに基づいて信号波形を再構成し、得られた強調音声y(強調信号)を出力する。 The waveform restoration means 106 uses the emphasis spectrum given by the multiplication means 105 by using the waveform restoration method corresponding to the frequency analysis method or the band division method used in the first frequency analysis means 101 and the second frequency analysis means 102. The signal waveform is reconstructed based on Y, and the obtained emphasized voice y (emphasized signal) is output.

(A−3)第1の実施形態の効果
第1の実施形態によれば、以下のような効果を奏することができる。
(A-3) Effect of First Embodiment According to the first embodiment, the following effects can be obtained.

第1の実施形態の信号処理装置100では、第2のマイクM2側の方向から到来する音を抑圧し、正面方向と第1のマイクM1側の方向から到来する音は抑圧しないので、自動車内において運転手U1の声(目的音)を強調する場合などにおいて、少ない歪みで目的音を強調することができる。 In the signal processing device 100 of the first embodiment, the sound coming from the direction of the second microphone M2 side is suppressed, and the sound coming from the front direction and the direction of the first microphone M1 side is not suppressed. In the case of emphasizing the voice (target sound) of the driver U1, the target sound can be emphasized with less distortion.

言い換えると、信号処理装置100では、少ない演算コストで、妨害音の直接音と反射音を抑圧するが、目的音の直接音と反射音は抑圧しない強調フィルタGを設計できるので、少ない歪みで目的音を強調できるという効果を奏する。 In other words, the signal processing device 100 can design an emphasis filter G that suppresses the direct sound and the reflected sound of the disturbing sound at a low calculation cost, but does not suppress the direct sound and the reflected sound of the target sound. It has the effect of emphasizing the sound.

(B)第2の実施形態
以下、本発明による信号処理装置、プログラム及び方法の第2の実施形態を、図面を参照しながら詳述する。
(B) Second Embodiment Hereinafter, a second embodiment of the signal processing apparatus, program and method according to the present invention will be described in detail with reference to the drawings.

(B−1)第2の実施形態の構成
第2の実施形態の信号処理装置200も、第1の実施形態と同様に図2に示すような環境で利用されるものとして説明する。
(B-1) Configuration of Second Embodiment The signal processing device 200 of the second embodiment will be described as being used in the environment as shown in FIG. 2 as in the first embodiment.

また、第2の実施形態の信号処理装置200の内部構成についても、上述の図1を用いて示すことができる。 Further, the internal configuration of the signal processing device 200 of the second embodiment can also be shown with reference to FIG. 1 described above.

以下では、第2の実施形態の信号処理装置200について、第1の実施形態との差異を説明する。 Hereinafter, the difference between the signal processing device 200 of the second embodiment and that of the first embodiment will be described.

第1の実施形態では、フィルタ決定手段104において、すべての周波数に同じ広義単調増加関数fmap(F)を適用して強調フィルタGを得ていたため、図8に示した通り、強調フィルタGの特性が周波数ごとに異なっていた。特に低い周波数では抑圧されない到来方向の範囲が広くなる現象が起こる。そこで、第2の実施形態では、どの周波数でも同じような特性となるように、周波数ごとに異なる広義単調増加関数を適用する。 In the first embodiment, in the filter determining means 104, the same broadly defined monotonic increase function fmap (F) is applied to all frequencies to obtain the emphasis filter G. Therefore, as shown in FIG. 8, the characteristics of the emphasis filter G are obtained. Was different for each frequency. Especially at low frequencies, a phenomenon occurs in which the range of the arrival direction that is not suppressed becomes wide. Therefore, in the second embodiment, a broad monotonous increase function different for each frequency is applied so that the characteristics are the same at any frequency.

第2の実施形態の信号処理装置200の構成は、図1に示すように、フィルタ決定手段104がフィルタ決定手段204に替わること以外は、第1の実施形態の信号処理装置100の構成と同じである。 The configuration of the signal processing device 200 of the second embodiment is the same as the configuration of the signal processing device 100 of the first embodiment except that the filter determining means 104 is replaced with the filter determining means 204 as shown in FIG. Is.

(B−2)第2の実施形態の動作
次に、以上のような構成を有する第2の実施形態の信号処理装置200の動作(実施形態の信号処理方法)を説明する。
(B-2) Operation of Second Embodiment Next, the operation of the signal processing device 200 of the second embodiment having the above configuration (signal processing method of the embodiment) will be described.

第2の実施形態の信号処理装置200の動作は、フィルタ決定手段204の動作がフィルタ決定手段104とは異なる点以外は、第1の実施形態の信号処理装置100の動作と同じである。 The operation of the signal processing device 200 of the second embodiment is the same as the operation of the signal processing device 100 of the first embodiment except that the operation of the filter determining means 204 is different from that of the filter determining means 104.

第1の実施形態では、図7に示すように、正面方向から第2のマイクM2の側に到来方向を傾けた際に、周波数によって強調フィルタGのゲインが所定以下(例えば、0.5以下)となる到来角度(以下、「カットオフ到来角度」と呼ぶ)にばらつきがある。言い換えると、第1の実施形態では、周波数によって抑圧しない到来方向の範囲にばらつきがある。これに対して、第2の実施形態のフィルタ決定手段204は、周波数ごとの広義単調増加関数を設定することで、このばらつきを吸収し、複数の周波数でカットオフ到来角度(抑圧しない到来方向の範囲)が近づくようにしている。フィルタ決定手段204において、周波数ごとのカットオフ到来角度のばらつき(抑圧しない到来方向の範囲のばらつき)を抑制するような、周波数ごとの広義単調増加関数を求める方式については限定されないものであるが、例えば、いかのような処理を適用することができる。 In the first embodiment, as shown in FIG. 7, the gain of the emphasis filter G is equal to or less than a predetermined value (for example, 0.5 or less) depending on the frequency when the arrival direction is tilted from the front direction to the side of the second microphone M2. ) (Hereinafter referred to as "cutoff arrival angle"). In other words, in the first embodiment, the range of the arrival direction that is not suppressed varies depending on the frequency. On the other hand, the filter determining means 204 of the second embodiment absorbs this variation by setting a broadly monotonous increasing function for each frequency, and cutoff arrival angles (in the arrival direction without suppression) at a plurality of frequencies. The range) is getting closer. The filter determining means 204 is not limited to a method of obtaining a broad monotonous increase function for each frequency that suppresses variation in the cutoff arrival angle for each frequency (variation in the range of the arrival direction that is not suppressed). For example, any processing can be applied.

フィルタ決定手段204は、DOA特徴量Fに基づいて所定の広義単調増加関数によって強調フィルタGを算出し、乗算手段105に与える。第2の実施形態では、周波数ごとに異なる広義単調増加関数を用いる。ここでは、k番目の周波数のDOA特徴量をF(k)、k番目の周波数の強調ゲインをG(k)と書く。k番目の周波数をfとして、到来方向と周波数の番号をDOA特徴量に変換する関数を(13)式で定義する。そして、所定のk番目の周波数の広義単調増加関数fmap(F(k))として、例えば(14)式で定義される1つの到来方向閾値θを関数や、(15)式で定義される2つの到来方向閾値θ、θを持つ関数、(16)式で定義されるスケールF、オフセット到来方向θのシグモイド関数を用いることができる。

Figure 0006772890
The filter determining means 204 calculates the emphasis filter G by a predetermined broad-sense monotonous increasing function based on the DOA feature amount F, and gives it to the multiplication means 105. In the second embodiment, a broad monotonous increase function that differs for each frequency is used. Here, the DOA feature of the k-th frequency is written as F (k), and the emphasis gain of the k-th frequency is written as G (k). Let fk be the k-th frequency, and define a function that converts the arrival direction and frequency number into DOA features by Eq. (13). Then, as the broadly defined monotonous increasing function fmap k (F (k)) of the predetermined k-th frequency, for example, one arrival direction threshold θ 0 defined by the equation (14) is defined by the function or the equation (15). that two DOA threshold theta 1, function with the theta 2, it is possible to use the scale F a, sigmoid function of the offset arrival direction theta 0 as defined in (16).
Figure 0006772890

図9は、第2の実施形態に係るフィルタ決定手段204で得られる強調フィルタGの例について示したグラフである。 FIG. 9 is a graph showing an example of the emphasis filter G obtained by the filter determining means 204 according to the second embodiment.

図9(a)、図9(b)、図9(c)は、それぞれ(14)式、(15)式、(16)式によって得られる強調フィルタGの例を示している。図9(a)、図9(b)、図9(c)では、音源の周波数を1kHz、2kHz、4kHzと変化させた場合の到来方向θと強調フィルタGの関係を示したグラフとなっている。図9(a)、図9(b)、図9(c)では、横軸を音源の到来方向θとし縦軸を強調フィルタGの値(到来方向θに応じた値)としている。 9 (a), 9 (b), and 9 (c) show examples of the emphasis filter G obtained by the equations (14), (15), and (16), respectively. 9 (a), 9 (b), and 9 (c) are graphs showing the relationship between the arrival direction θ and the emphasis filter G when the frequency of the sound source is changed to 1 kHz, 2 kHz, and 4 kHz. There is. In FIGS. 9A, 9B, and 9C, the horizontal axis is the sound source arrival direction θ, and the vertical axis is the value of the emphasis filter G (value corresponding to the arrival direction θ).

ここでは、θ=15、θ=20、θ=10、F=12とした。第1の実施形態における強調フィルタG(図8)では、抑圧しない到来方向の範囲が周波数ごとに変化していたが、第2の実施形態における強調フィルタG(図9)では、高い周波数の第1のマイクM1側を除いて、抑圧しない到来方向の範囲は周波数が変わっても変化しない。なお、(16)式については周波数によって特性が変化しているが、強調フィルタGのゲインが0.5となるカットオフ到来角度は周波数に依らず一定である。つまり、(13)〜(16)式を用いて強調ゲインを算出すれば、第2のマイクM2側、すなわち妨害音側(助手席側)を何度まで抑圧するかを、すべての周波数共通かつ直接的に設定できる。 Here, θ 0 = 15, θ 1 = 20, θ 2 = 10, and Fa = 12. In the emphasis filter G (FIG. 8) of the first embodiment, the range of the non-suppressing arrival direction changed for each frequency, but in the emphasis filter G (FIG. 9) of the second embodiment, the high frequency first. Except for the microphone M1 side of No. 1, the range of the arrival direction that is not suppressed does not change even if the frequency changes. Although the characteristics of Eq. (16) change depending on the frequency, the cutoff arrival angle at which the gain of the emphasis filter G is 0.5 is constant regardless of the frequency. That is, if the emphasis gain is calculated using the equations (13) to (16), the number of times the second microphone M2 side, that is, the disturbing sound side (passenger seat side) is suppressed is common to all frequencies. Can be set directly.

(B−3)第2の実施形態の効果
第2の実施形態によれば、第1の実施形態の効果に加えて、以下のような効果を奏することができる。
(B-3) Effect of Second Embodiment According to the second embodiment, the following effects can be obtained in addition to the effect of the first embodiment.

第2の実施形態の信号処理装置200では、強調ゲインが抑圧しない到来方向の範囲をすべての周波数で同じように与えることができ、かつその範囲を到来方向の角度そのもので設定できるので、より適切な調整が可能となり、より少ない歪みで目的音を強調できるという効果を奏する。 In the signal processing device 200 of the second embodiment, the range of the arrival direction in which the emphasis gain is not suppressed can be given in the same manner at all frequencies, and the range can be set by the angle of the arrival direction itself, which is more appropriate. The effect is that the target sound can be emphasized with less distortion.

(C)第3の実施形態
以下、本発明による信号処理装置、プログラム及び方法の第3の実施形態を、図面を参照しながら詳述する。
(C) Third Embodiment Hereinafter, a third embodiment of the signal processing apparatus, program and method according to the present invention will be described in detail with reference to the drawings.

(C−1)第3の実施形態の構成
第3の実施形態の信号処理装置200も、第1、第2の実施形態と同様に図2に示すような環境で利用されるものとして説明する。
(C-1) Configuration of Third Embodiment The signal processing device 200 of the third embodiment will be described as being used in the environment as shown in FIG. 2 as in the first and second embodiments. ..

また、第3の実施形態の信号処理装置300の内部構成についても、上述の図1を用いて示すことができる。 Further, the internal configuration of the signal processing device 300 of the third embodiment can also be shown with reference to FIG. 1 described above.

以下では、第3の実施形態の信号処理装置200について、第2の実施形態との差異を説明する。 Hereinafter, the difference between the signal processing device 200 of the third embodiment and that of the second embodiment will be described.

第2の実施形態では、妨害音側の到来方向を何度まで抑圧するかを、すべての周波数共通で設定した。しかし、低い周波数は信号の波長に対してマイク間隔を十分に広く取ることが困難なため(100Hzの波長は約3.3mだが、自動車内でのマイク間隔は数cmとするのが一般的)、低い周波数において数値計算によって得られる到来方向に関する情報(本発明ではDOA特徴量)は一般に曖昧になる(到来方向推定の意味で推定誤差が大きくなる)。そこで、第3の実施形態では、所定よりも低い周波数(例えば、250Hz以下の周波数帯)では強調ゲインが抑圧しない到来方向の範囲を広げる(第2のマイクM2の側に広げる;妨害音を発する助手U2の側に広げる)ように設計する。 In the second embodiment, the number of times the direction of arrival on the disturbing sound side is suppressed is set for all frequencies. However, it is difficult to make the microphone interval sufficiently wide with respect to the signal wavelength at low frequencies (the wavelength of 100 Hz is about 3.3 m, but the microphone interval in the car is generally several cm). Information on the arrival direction (DOA feature amount in the present invention) obtained by numerical calculation at a low frequency is generally ambiguous (the estimation error becomes large in the sense of the arrival direction estimation). Therefore, in the third embodiment, the range of the arrival direction in which the emphasis gain is not suppressed is widened (widened to the side of the second microphone M2; an interfering sound is emitted) at a frequency lower than a predetermined frequency (for example, a frequency band of 250 Hz or less). It is designed to spread to the side of the assistant U2).

第3の実施形態の信号処理装置300の構成は、フィルタ決定手段104がフィルタ決定手段304に替わること以外は、第1の実施形態の信号処理装置100の構成と同じである。 The configuration of the signal processing device 300 of the third embodiment is the same as the configuration of the signal processing device 100 of the first embodiment except that the filter determining means 104 is replaced with the filter determining means 304.

(C−2)第3の実施形態の動作
次に、以上のような構成を有する第3の実施形態の信号処理装置300の動作(実施形態の信号処理方法)を説明する。
(C-2) Operation of Third Embodiment Next, the operation of the signal processing device 300 of the third embodiment having the above configuration (signal processing method of the embodiment) will be described.

第3の実施形態の信号処理装置300の動作は、フィルタ決定手段304の動作がフィルタ決定手段104とは異なる点以外は、第1の実施形態の信号処理装置100の動作と同じである。 The operation of the signal processing device 300 of the third embodiment is the same as the operation of the signal processing device 100 of the first embodiment except that the operation of the filter determining means 304 is different from that of the filter determining means 104.

フィルタ決定手段304は、DOA特徴量Fに基づいて所定の広義単調増加関数によって強調フィルタGを算出し、乗算手段105に与える。第2の実施形態では、周波数ごとに異なる広義単調増加関数を用いる。ここでは、k番目の周波数のDOA特徴量をF(k)、k番目の周波数の強調ゲインをG(k)と書く。k番目の周波数をfとして、到来方向と周波数の番号をDOA特徴量に変換する関数を(17)式で定義する。そして、所定のk番目の周波数の広義単調増加関数fmap(F(k))として、例えば(18)式で定義される1つの到来方向閾値θを持つ関数を用いることができる。

Figure 0006772890
The filter determining means 304 calculates the emphasis filter G by a predetermined broad-sense monotonous increase function based on the DOA feature amount F, and gives it to the multiplication means 105. In the second embodiment, a broad monotonous increase function that differs for each frequency is used. Here, the DOA feature of the k-th frequency is written as F (k), and the emphasis gain of the k-th frequency is written as G (k). Letting the kth frequency be f k , the function for converting the arrival direction and the frequency number into the DOA feature is defined by the equation (17). Then, as the broadly defined monotonic increasing function fmap k (F (k)) of the predetermined k-th frequency, for example, a function having one arrival direction threshold value θ 0 defined by the equation (18) can be used.
Figure 0006772890

図10は、第2の実施形態に係るフィルタ決定手段204で得られる強調フィルタGと、第3の実施形態に係るフィルタ決定手段304で得られる強調フィルタGとの比較について示したグラフである。 FIG. 10 is a graph showing a comparison between the emphasis filter G obtained by the filter determination means 204 according to the second embodiment and the emphasis filter G obtained by the filter determination means 304 according to the third embodiment.

図10(a)は、第2の実施形態におけるフィルタ決定手段204で上述の(13)式及び(14)式を用いて得られる強調フィルタGについて示している。また、図10(b)は、第3の実施形態に係るフィルタ決定手段304で(17)式及び(18)式により得られる強調フィルタGの例を示している。図10(a)、図10(b)では、音源の周波数を1kHz、2kHz、4kHzと変化させた場合の到来方向θと強調フィルタGの関係を示したグラフとなっている。図10(a)、図10(b)では、横軸を音源の到来方向θとし縦軸を強調フィルタGの値(到来方向θに応じた値)としている。 FIG. 10A shows the emphasis filter G obtained by using the above equations (13) and (14) in the filter determining means 204 in the second embodiment. Further, FIG. 10B shows an example of the emphasis filter G obtained by the equations (17) and (18) in the filter determining means 304 according to the third embodiment. 10 (a) and 10 (b) are graphs showing the relationship between the arrival direction θ and the emphasis filter G when the frequency of the sound source is changed to 1 kHz, 2 kHz, and 4 kHz. In FIGS. 10A and 10B, the horizontal axis is the sound source arrival direction θ, and the vertical axis is the value of the emphasis filter G (value corresponding to the arrival direction θ).

ここでは、θ=5、F=0.97とした。図10より、到来方向と周波数の番号をDOA特徴量に変換する関数Φ(ファイ)の上限値をFとしたことで、低い周波数の抑圧しない到来方向の範囲が広くなったことが確認できる。 Here, θ 0 = 5 and F 0 = 0.97. Than 10, the function for converting the number of the arrival direction and frequency in DOA feature quantity Φ the upper limit of (phi) that has a F 0, it can be confirmed that the suppression was not DOA range of low frequencies is wider ..

(C−3)第3の実施形態の効果
第3の実施形態によれば、第1、第2の実施形態の効果に加えてができる。
(C-3) Effect of Third Embodiment According to the third embodiment, the effect can be added to the effects of the first and second embodiments.

第3の実施形態の信号処理装置300では、数値計算によって得られる到来方向に関する情報が曖昧となる低い周波数において、抑圧しない到来方向の範囲を広めに確保できるので、低い周波数の目的音の歪みが軽減され、より少ない歪みで目的音を強調できるという効果を奏する。 In the signal processing device 300 of the third embodiment, at a low frequency where the information about the arrival direction obtained by the numerical calculation is ambiguous, a wide range of the arrival direction that is not suppressed can be secured, so that the distortion of the target sound at the low frequency is distorted. It is reduced and has the effect of emphasizing the target sound with less distortion.

(D)第4の実施形態
以下、本発明による信号処理装置、プログラム及び方法の第4の実施形態を、図面を参照しながら詳述する。
(D) Fourth Embodiment Hereinafter, a fourth embodiment of the signal processing apparatus, program and method according to the present invention will be described in detail with reference to the drawings.

(D−1)第4の実施形態の構成
第4の実施形態の信号処理装置400も、第1〜第3の実施形態と同様に図2に示すような環境で利用されるものとして説明する。
(D-1) Configuration of Fourth Embodiment The signal processing device 400 of the fourth embodiment will be described as being used in the environment as shown in FIG. 2 as in the first to third embodiments. ..

また、第4の実施形態の信号処理装置400の内部構成についても、上述の図1を用いて示すことができる。 Further, the internal configuration of the signal processing device 400 of the fourth embodiment can also be shown with reference to FIG. 1 described above.

以下では、第4の実施形態の信号処理装置400について、第1〜第3の実施形態との差異を説明する。 Hereinafter, the difference between the signal processing device 400 of the fourth embodiment and the first to third embodiments will be described.

第1〜第3の実施形態では、自動車A内において運転手U1の正面に2つのマイクM1、M2をセットする場合を想定して、助手席側(助手U2側)だけを抑圧する強調フィルタGを設計した。これに対して、第4の実施形態では、本発明におけるDOA特徴量を用いて正面方向のみを強調する(抑圧しない)強調フィルタを適用するものとする。 In the first to third embodiments, the emphasis filter G that suppresses only the passenger side (passenger U2 side) is assumed in the case where the two microphones M1 and M2 are set in front of the driver U1 in the automobile A. Designed. On the other hand, in the fourth embodiment, the emphasis filter that emphasizes (does not suppress) only the front direction by using the DOA feature amount in the present invention is applied.

図1に示すように、第4の実施形態の信号処理装置400の構成は、特徴量算出手段103とフィルタ決定手段104がそれぞれ特徴量算出手段403とフィルタ決定手段404に替わること以外は、第1の実施形態の信号処理装置100の構成と同じである。 As shown in FIG. 1, the configuration of the signal processing device 400 of the fourth embodiment is the first except that the feature amount calculating means 103 and the filter determining means 104 are replaced with the feature amount calculating means 403 and the filter determining means 404, respectively. It is the same as the configuration of the signal processing device 100 of the first embodiment.

(D−2)第4の実施形態の動作
次に、以上のような構成を有する第4の実施形態の信号処理装置400の動作(実施形態の信号処理方法)を説明する。
(D-2) Operation of Fourth Embodiment Next, the operation of the signal processing device 400 of the fourth embodiment having the above configuration (signal processing method of the embodiment) will be described.

次に、上述した構成を有する第4の実施形態の信号処理装置400の動作を説明する。第4の実施形態の信号処理装置400の動作は、特徴量算出手段403とフィルタ決定手段304の動作が特徴量算出手段103とフィルタ決定手段104とは異なる点以外は、第1の実施形態の信号処理装置100の動作と同じである。 Next, the operation of the signal processing device 400 of the fourth embodiment having the above-described configuration will be described. The operation of the signal processing device 400 of the fourth embodiment is that of the first embodiment, except that the operations of the feature amount calculating means 403 and the filter determining means 304 are different from those of the feature amount calculating means 103 and the filter determining means 104. The operation is the same as that of the signal processing device 100.

特徴量算出手段403は、第1の入力スペクトルXと第2の入力スペクトルXとに基づいて(19)式によって2つのDOA特徴量FとF’を算出し、フィルタ決定手段404に与える。2つのDOA特徴量を音の到来方向θに関して整理すると、(20)式となる。 The feature amount calculation means 403 calculates two DOA feature amounts F and F'by the equation (19) based on the first input spectrum X 1 and the second input spectrum X 2, and gives them to the filter determination means 404. .. When the two DOA features are arranged with respect to the sound arrival direction θ, it becomes Eq. (20).

図11は、音の到来方向θと(20)式のDOA特徴量F’との関係について示したグラフである。 FIG. 11 is a graph showing the relationship between the sound arrival direction θ and the DOA feature amount F'in equation (20).

図11では、音源の周波数を1kHz、2kHz、4kHzと変化させた場合の到来方向θとDOA特徴量F’の関係を示したグラフとなっている。図11では、横軸を音源の到来方向θとし縦軸をDOA特徴量F’としている。 FIG. 11 is a graph showing the relationship between the arrival direction θ and the DOA feature amount F'when the frequency of the sound source is changed to 1 kHz, 2 kHz, and 4 kHz. In FIG. 11, the horizontal axis is the sound source arrival direction θ, and the vertical axis is the DOA feature amount F'.

図11を見ると、DOA特徴量F(図5)とはちょうど左右が反転していることが確認できる。

Figure 0006772890
Looking at FIG. 11, it can be confirmed that the left and right sides are exactly reversed from the DOA feature amount F (FIG. 5).
Figure 0006772890

フィルタ決定手段404は、2つのDOA特徴量FとF’に基づいて所定の広義単調増加関数によって強調フィルタGを算出し、乗算手段105に与える。所定の広義単調増加関数には、第1の実施形態に係るfmap(F)、第2の実施形態に係るΦ(φ,k)とfmap(F(k))、第3の実施形態に係るΦ(φ,F,k)とfmap(F(k))のいずれを用いても良いが、ここでは一例として、第2の実施形態の所定の広義単調増加関数を用いて説明する。第4の実施形態において、強調フィルタGは(21)式を用いて算出される。 The filter determining means 404 calculates the emphasis filter G by a predetermined broad-sense monotonous increasing function based on the two DOA features F and F', and gives it to the multiplication means 105. The predetermined broadly defined monotonous increasing function includes fmap (F) according to the first embodiment, Φ (φ, k) and fmap k (F (k)) according to the second embodiment, and the third embodiment. Either Φ (φ, F 0 , k) or fmap k (F (k)) may be used, but here, as an example, a predetermined broad-sense monotonic increase function of the second embodiment will be used. .. In the fourth embodiment, the emphasis filter G is calculated using the equation (21).

図12は、第4の実施形態に係るフィルタ決定手段404で得られる強調フィルタGの例について示した説明図である。 FIG. 12 is an explanatory diagram showing an example of the emphasis filter G obtained by the filter determining means 404 according to the fourth embodiment.

図12(a)、図12(b)、図12(c)は、それぞれfmap(F(k))として(14)式、(15)式、(16)式を用いた場合に得られる強調フィルタGの例を示している。図12(a)、図12(b)、図12(c)では、音源の周波数を1kHz、2kHz、4kHzと変化させた場合の到来方向θと強調フィルタGの関係を示したグラフとなっている。図12(a)、図12(b)、図12(c)では、横軸を音源の到来方向θとし縦軸を強調フィルタGの値(到来方向θに応じた値)としている。 12 (a), 12 (b), and 12 (c) are obtained when the formulas (14), (15), and (16) are used as the fmap k (F (k)), respectively. An example of the emphasis filter G is shown. 12 (a), 12 (b), and 12 (c) are graphs showing the relationship between the arrival direction θ and the emphasis filter G when the frequency of the sound source is changed to 1 kHz, 2 kHz, and 4 kHz. There is. In FIGS. 12 (a), 12 (b), and 12 (c), the horizontal axis is the sound source arrival direction θ, and the vertical axis is the value of the emphasis filter G (value corresponding to the arrival direction θ).

ここでは、θ=20、θ=15、θ=25、F=12とした。図12より、正面方向のみを強調する(抑圧しない)強調フィルタが得られていることが分かる。 Here, θ 0 = 20, θ 1 = 15, θ 2 = 25, and Fa = 12. From FIG. 12, it can be seen that an emphasis filter that emphasizes (does not suppress) only the front direction is obtained.

(D−3)第4の実施形態の効果
第4の実施形態によれば、第1〜第3の実施形態と比較して以下のような効果を奏することができる。
(D-3) Effect of Fourth Embodiment According to the fourth embodiment, the following effects can be obtained as compared with the first to third embodiments.

第4の実施形態の信号処理装置400では、強調フィルタG(強調ゲイン)が抑圧しない到来方向の範囲を正面方向に限定した目的音を強調できるという特有の効果を奏することができる。 In the signal processing device 400 of the fourth embodiment, it is possible to achieve a unique effect that the target sound can be emphasized by limiting the range of the arrival direction that the emphasis filter G (emphasis gain) does not suppress to the front direction.

(E)他の実施形態
本発明は、上記の各実施形態に限定されるものではなく、以下に例示するような変形実施形態も挙げることができる。
(E) Other Embodiments The present invention is not limited to each of the above embodiments, and modified embodiments as illustrated below can also be mentioned.

(E−1)上記の実施形態において、信号処理装置は、強調スペクトルYの波形を復元して強調音声yを出力するものとして記載したが、波形を復元せずに強調スペクトルYを出力しても良い。また、強調スペクトルYと強調音声yの両方を出力するようにしても良い。その場合、波形復元手段106は除外するようにしてもよい。 (E-1) In the above embodiment, the signal processing device is described as restoring the waveform of the emphasized spectrum Y and outputting the emphasized voice y, but outputs the enhanced spectrum Y without restoring the waveform. Is also good. Further, both the emphasized spectrum Y and the emphasized voice y may be output. In that case, the waveform restoration means 106 may be excluded.

100…信号処理装置、101…第1の周波数解析手段、102…第2の周波数解析手段、103…特徴量算出手段、104…フィルタ決定手段、105…乗算手段、106…波形復元手段、M1…第1のマイク(第1の収音装置)、M2…第2のマイク(第2の収音装置)。 100 ... Signal processing device, 101 ... First frequency analysis means, 102 ... Second frequency analysis means, 103 ... Feature amount calculation means, 104 ... Filter determination means, 105 ... Multiplying means, 106 ... Waveform restoration means, M1 ... First microphone (first sound collecting device), M2 ... Second microphone (second sound collecting device).

Claims (10)

第1の収音装置から入力された第1の入力信号を周波数解析して第1の入力スペクトルを得る第1の周波数解析手段と、
第2の収音装置から入力された第2の入力信号を周波数解析して第2の入力スペクトルを得る第2の周波数解析手段と、
前記第1の周波数解析手段で得られた第1の入力スペクトルと前記第2の周波数解析手段で得られた第2の入力スペクトルに基づき、前記第1の収音装置の位置と前記第2の収音装置の位置を結んだ直線と垂直をなす正面方向に対して、正面方向及び前記第1の収音装置側の方向の値を大きくとり、前記第2の収音装置側の方向の値を小さくとる第1の特徴量を算出する特徴量算出手段と、
前記特徴量算出手段で算出された前記第1の特徴量を、所定の広義単調増加関数で写像して強調フィルタを得るフィルタ決定手段と、
前記第1の周波数解析手段で得られた第1の入力スペクトルに前記フィルタ決定手段で得られた強調フィルタを乗じて強調スペクトルを得る乗算手段と
を備えることを特徴とする信号処理装置。
A first frequency analysis means for obtaining a first input spectrum by frequency analysis of a first input signal input from the first sound picking device, and
A second frequency analysis means for obtaining a second input spectrum by frequency analysis of the second input signal input from the second sound pickup device, and
Based on the first input spectrum obtained by the first frequency analysis means and the second input spectrum obtained by the second frequency analysis means, the position of the first sound collecting device and the second The values in the front direction and the direction on the first sound collecting device side are set larger than the front direction perpendicular to the straight line connecting the positions of the sound collecting devices, and the values in the direction on the second sound collecting device side are taken. The feature amount calculation means for calculating the first feature amount, and
A filter determining means for obtaining an emphasis filter by mapping the first feature amount calculated by the feature amount calculating means with a predetermined broad-sense monotonous increasing function.
A signal processing apparatus comprising: a multiplication means for obtaining an emphasis spectrum by multiplying a first input spectrum obtained by the first frequency analysis means by a enhancement filter obtained by the filter determination means.
前記第1の特徴量は、前記第1の収音装置の位置と前記第2の収音装置の位置を結んだ直線と垂直をなす正面方向に対して前記第1の収音装置の側の方向にピークが存在し、前記ピークの方向から前記第2の収音装置側に方向が傾くほど値が小さくなることを特徴とする請求項1に記載の信号処理装置。 The first feature amount is on the side of the first sound collecting device with respect to the front direction perpendicular to the straight line connecting the position of the first sound collecting device and the position of the second sound collecting device. The signal processing device according to claim 1, wherein a peak exists in the direction, and the value becomes smaller as the direction is inclined from the direction of the peak toward the second sound collecting device. 前記特徴量算出手段は、正面方向に対して大きな値となる第2の特徴量と、正面方向よりも前記第2の収音装置の側の方向に対して大きな値となる第3の特徴量を用いて、前記第1の特徴量を算出することを特徴とする請求項1又は2に記載の信号処理装置。 The feature amount calculating means has a second feature amount that has a large value with respect to the front direction and a third feature amount that has a large value with respect to the direction toward the second sound collecting device than the front direction. The signal processing apparatus according to claim 1 or 2, wherein the first feature amount is calculated using the above. 前記フィルタ決定手段は、周波数ごとに異なる広義単調増加関数を用いて前記第1の特徴量を写像し、周波数ごとに前記強調フィルタを得ることを特徴とする請求項1〜3のいずれかに記載の信号処理装置。 The method according to any one of claims 1 to 3, wherein the filter determining means maps the first feature quantity using a broad-sense monotonous increase function different for each frequency, and obtains the emphasis filter for each frequency. Signal processing device. 前記フィルタ決定手段は、周波数ごとの前記強調フィルタにおいて、抑圧しない到来方向の範囲を一致させるように、各周波数の広義単調増加関数を設定することを特徴とする請求項4に記載の信号処理装置。 The signal processing apparatus according to claim 4, wherein the filter determining means sets a broad monotonous increasing function of each frequency so as to match the range of the arrival direction that is not suppressed in the emphasis filter for each frequency. .. 前記フィルタ決定手段は、所定の周波数以下の低周波数帯の前記強調フィルタにおいて、前記所定の周波数より高い高周波数帯と比較して抑圧しない到来方向の範囲を広くする広義単調増加関数を設定することを特徴とする請求項4に記載の信号処理装置。 The filter determining means sets a broad monotonous increasing function in the emphasis filter in a low frequency band below a predetermined frequency to widen the range of the arrival direction that is not suppressed as compared with a high frequency band higher than the predetermined frequency. The signal processing apparatus according to claim 4. 前記フィルタ決定手段は、前記低周波数帯の前記強調フィルタにおいて、前記高周波数帯よりも、抑圧しない到来方向の範囲を前記第2の収音装置側に広くする広義単調増加関数を設定することを特徴とする請求項6に記載の信号処理装置。 The filter determining means sets a broad monotonous increasing function in the emphasis filter in the low frequency band to widen the range of the arrival direction that is not suppressed as compared with the high frequency band toward the second sound pickup device. The signal processing apparatus according to claim 6. 前記フィルタ決定手段は、前記第1の特徴量を用いて、正面方向のみを強調する強調フィルタを得る広義単調増加関数を設定することを特徴とする請求項1〜3のいずれかに記載の信号処理装置。 The signal according to any one of claims 1 to 3, wherein the filter determining means uses the first feature amount to set a broadly defined monotonous increasing function for obtaining an emphasis filter that emphasizes only the front direction. Processing equipment. コンピュータを、
第1の収音装置から入力された第1の入力信号を周波数解析して第1の入力スペクトルを得る第1の周波数解析手段と、
第2の収音装置から入力された第2の入力信号を周波数解析して第2の入力スペクトルを得る第2の周波数解析手段と、
前記第1の周波数解析手段で得られた第1の入力スペクトルと前記第2の周波数解析手段で得られた第2の入力スペクトルに基づき、前記第1の収音装置の位置と前記第2の収音装置の位置を結んだ直線と垂直をなす正面方向に対して、正面方向及び前記第1の収音装置側の方向の値を大きくとり、前記第2の収音装置側の方向の値を小さくとる第1の特徴量を算出する特徴量算出手段と、
前記特徴量算出手段で算出された前記第1の特徴量を、所定の広義単調増加関数で写像して強調フィルタを得るフィルタ決定手段と、
前記第1の周波数解析手段で得られた第1の入力スペクトルに前記フィルタ決定手段で得られた強調フィルタを乗じて強調スペクトルを得る乗算手段と、
前記乗算手段で得られた強調スペクトルを入力して信号波形を復元して強調音声を得る波形復元手段と
して機能させることを特徴とする信号処理プログラム。
Computer,
A first frequency analysis means for obtaining a first input spectrum by frequency analysis of a first input signal input from the first sound picking device, and
A second frequency analysis means for obtaining a second input spectrum by frequency analysis of the second input signal input from the second sound pickup device, and
Based on the first input spectrum obtained by the first frequency analysis means and the second input spectrum obtained by the second frequency analysis means, the position of the first sound collecting device and the second The values in the front direction and the direction on the first sound collecting device side are set larger than the front direction perpendicular to the straight line connecting the positions of the sound collecting devices, and the values in the direction on the second sound collecting device side are taken. The feature amount calculation means for calculating the first feature amount, and
A filter determining means for obtaining an emphasis filter by mapping the first feature amount calculated by the feature amount calculating means with a predetermined broad-sense monotonous increasing function.
A multiplication means for obtaining an emphasis spectrum by multiplying the first input spectrum obtained by the first frequency analysis means by the enhancement filter obtained by the filter determination means.
A signal processing program characterized by inputting an emphasis spectrum obtained by the multiplication means and restoring a signal waveform to function as a waveform restoration means for obtaining an emphasized voice.
信号処理方法において、
第1の周波数解析手段、第2の周波数解析手段、特徴量算出手段、フィルタ決定手段、及び乗算手段を有し、
前記第1の周波数解析手段は、第1の収音装置から入力された第1の入力信号を周波数解析して第1の入力スペクトルを得て、
前記第2の周波数解析手段は、第2の収音装置から入力された第2の入力信号を周波数解析して第2の入力スペクトルを得て、
前記特徴量算出手段は、前記第1の周波数解析手段で得られた第1の入力スペクトルと前記第2の周波数解析手段で得られた第2の入力スペクトルに基づき、前記第1の収音装置の位置と前記第2の収音装置の位置を結んだ直線と垂直をなす正面方向に対して、正面方向及び前記第1の収音装置側の方向の値を大きくとり、前記第2の収音装置側の方向の値を小さくとる第1の特徴量を算出し、
前記フィルタ決定手段は、前記特徴量算出手段で算出された前記第1の特徴量を、所定の広義単調増加関数で写像して強調フィルタを得て、
前記乗算手段は、前記第1の周波数解析手段で得られた第1の入力スペクトルに前記フィルタ決定手段で得られた強調フィルタを乗じて強調スペクトルを得る
ことを特徴とする信号処理方法。
In the signal processing method
It has a first frequency analysis means, a second frequency analysis means, a feature amount calculation means, a filter determination means, and a multiplication means.
The first frequency analysis means frequency-analyzes the first input signal input from the first sound collecting device to obtain a first input spectrum.
The second frequency analysis means frequency-analyzes the second input signal input from the second sound collecting device to obtain a second input spectrum.
The feature amount calculation means is based on the first input spectrum obtained by the first frequency analysis means and the second input spectrum obtained by the second frequency analysis means, and the first sound collecting device is used. The values in the front direction and the direction on the side of the first sound collecting device are set larger than those in the front direction perpendicular to the straight line connecting the position of the second sound collecting device and the position of the second sound collecting device. Calculate the first feature amount that keeps the value in the direction of the sound device small,
The filter determining means maps the first feature amount calculated by the feature amount calculating means with a predetermined broad-sense monotonous increase function to obtain an emphasis filter.
The multiplication means is a signal processing method, characterized in that a first input spectrum obtained by the first frequency analysis means is multiplied by an emphasis filter obtained by the filter determination means to obtain an emphasis spectrum.
JP2017032567A 2017-02-23 2017-02-23 Signal processing equipment, programs and methods Active JP6772890B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017032567A JP6772890B2 (en) 2017-02-23 2017-02-23 Signal processing equipment, programs and methods

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017032567A JP6772890B2 (en) 2017-02-23 2017-02-23 Signal processing equipment, programs and methods

Publications (2)

Publication Number Publication Date
JP2018136509A JP2018136509A (en) 2018-08-30
JP6772890B2 true JP6772890B2 (en) 2020-10-21

Family

ID=63366854

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017032567A Active JP6772890B2 (en) 2017-02-23 2017-02-23 Signal processing equipment, programs and methods

Country Status (1)

Country Link
JP (1) JP6772890B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021124537A1 (en) * 2019-12-20 2021-06-24 三菱電機株式会社 Information processing device, calculation method, and calculation program

Also Published As

Publication number Publication date
JP2018136509A (en) 2018-08-30

Similar Documents

Publication Publication Date Title
US9445194B2 (en) Sound source separating apparatus, sound source separating program, sound pickup apparatus, and sound pickup program
KR101555416B1 (en) Apparatus and method for spatially selective sound acquisition by acoustic triangulation
US7991166B2 (en) Microphone apparatus
JP4986248B2 (en) Sound source separation apparatus, method and program
JP6780644B2 (en) Signal processing equipment, signal processing methods, and signal processing programs
JP6131989B2 (en) Sound collecting apparatus, program and method
JP6065028B2 (en) Sound collecting apparatus, program and method
JP6225245B2 (en) Signal processing apparatus, method and program
JP6772890B2 (en) Signal processing equipment, programs and methods
US11482239B2 (en) Joint source localization and separation method for acoustic sources
JP6182169B2 (en) Sound collecting apparatus, method and program thereof
JP6241520B1 (en) Sound collecting apparatus, program and method
JP6260666B1 (en) Sound collecting apparatus, program and method
Bountourakis et al. Parametric spatial post-filtering utilising high-order circular harmonics with applications to underwater sound-field visualisation
JP2016163135A (en) Sound collection device, program and method
JP4738284B2 (en) Blind signal extraction device, method thereof, program thereof, and recording medium recording the program
Kurc et al. Sound source localization with DAS beamforming method using small number of microphones
JP6065029B2 (en) Sound collecting apparatus, program and method
JP7182168B2 (en) Sound information processing device and program
JP6863004B2 (en) Sound collectors, programs and methods
CN110858485A (en) Voice enhancement method, device, equipment and storage medium
Zhao et al. Adapting GCC-PHAT to Co-Prime Circular Microphone Arrays for Speech Direction of Arrival Estimation Using Neural Networks
JP5713933B2 (en) Sound source distance measuring device, acoustic direct ratio estimating device, noise removing device, method and program thereof
JP6923025B1 (en) Sound collectors, programs and methods
JP7004875B2 (en) Information processing equipment, calculation method, and calculation program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20191115

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20200714

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200901

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200914

R150 Certificate of patent or registration of utility model

Ref document number: 6772890

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150