WO2014097637A1 - 指向性マイクロホン装置、音響信号処理方法およびプログラム - Google Patents

指向性マイクロホン装置、音響信号処理方法およびプログラム Download PDF

Info

Publication number
WO2014097637A1
WO2014097637A1 PCT/JP2013/007474 JP2013007474W WO2014097637A1 WO 2014097637 A1 WO2014097637 A1 WO 2014097637A1 JP 2013007474 W JP2013007474 W JP 2013007474W WO 2014097637 A1 WO2014097637 A1 WO 2014097637A1
Authority
WO
WIPO (PCT)
Prior art keywords
acoustic signal
unit
signal
noise suppression
power spectrum
Prior art date
Application number
PCT/JP2013/007474
Other languages
English (en)
French (fr)
Inventor
丈郎 金森
寺田 泰宏
Original Assignee
パナソニック株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by パナソニック株式会社 filed Critical パナソニック株式会社
Priority to EP13865796.0A priority Critical patent/EP2938098B1/en
Priority to JP2014523122A priority patent/JP6226301B2/ja
Priority to US14/379,323 priority patent/US9264797B2/en
Publication of WO2014097637A1 publication Critical patent/WO2014097637A1/ja

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/20Arrangements for obtaining desired frequency or directional characteristics
    • H04R1/32Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
    • H04R1/34Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by using a single transducer with sound reflecting, diffracting, directing or guiding means
    • H04R1/342Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by using a single transducer with sound reflecting, diffracting, directing or guiding means for microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/005Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/20Arrangements for obtaining desired frequency or directional characteristics
    • H04R1/32Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
    • H04R1/326Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only for microphones
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L2021/02161Number of inputs available containing the signal or the noise to be suppressed
    • G10L2021/02165Two microphones, one receiving mainly the noise signal and the other one mainly the speech signal
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/20Arrangements for obtaining desired frequency or directional characteristics
    • H04R1/32Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
    • H04R1/40Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
    • H04R1/406Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2201/00Details of transducers, loudspeakers or microphones covered by H04R1/00 but not provided for in any of its subgroups
    • H04R2201/40Details of arrangements for obtaining desired directional characteristic by combining a number of identical transducers covered by H04R1/40 but not provided for in any of its subgroups
    • H04R2201/403Linear arrays of transducers

Definitions

  • the present invention relates to a directional microphone device, an acoustic signal processing method, and a program.
  • Patent Document 1 cannot form directivity having a sufficiently narrow directivity angle with respect to the target direction. Therefore, there is a problem that sounds other than the target direction (other than the front) (sounds other than the target sound) are collected.
  • the present invention focuses on the above-described problems, and provides a directional microphone device, an acoustic signal processing method, and a program that can form a directivity having a narrower directivity angle with respect to a target direction. Objective.
  • a directional microphone device includes a first directivity synthesis unit that generates a first acoustic signal having sensitivity in a target direction, and a sensitivity blind spot in the target direction.
  • a second directivity synthesis unit that generates a second acoustic signal having the second directivity synthesis unit, and a second directivity synthesis unit that produces the second acoustic signal generated by the second directivity synthesis unit.
  • Noise suppression is performed using the correction unit to be generated and the first acoustic signal generated by the first directivity synthesis unit as a main signal, and the third acoustic signal generated by the correction unit as a reference signal.
  • the directivity of the first acoustic signal in the target direction is And a suppression unit produces an output acoustic signal keratinized.
  • the directional microphone device of the present invention can form directivity having a narrower directivity angle with respect to the target direction.
  • FIG. 1 is a diagram illustrating an example of a configuration of a directional microphone device according to the first embodiment.
  • FIG. 2 is a diagram illustrating an example of a detailed configuration of the correction unit according to the first embodiment.
  • FIG. 3 is a diagram illustrating an example of a detailed configuration of the suppression unit in the first embodiment.
  • FIG. 4A is a characteristic diagram showing a directivity pattern of the first microphone in the first embodiment.
  • FIG. 4B is a characteristic diagram showing a directivity pattern of the second microphone in the first embodiment.
  • FIG. 9 is a diagram illustrating a configuration of a directional microphone device according to a modification of the first embodiment.
  • FIG. 10 is a diagram illustrating an example of a detailed configuration of the suppression unit in the modification of the first embodiment.
  • FIG. 11 is a diagram illustrating an example of the configuration of the directional microphone device according to the second embodiment.
  • FIG. 12 is a diagram illustrating an example of a configuration of the directional microphone device according to the third embodiment.
  • FIG. 13 is a diagram illustrating an example of a detailed configuration of the first directivity synthesis unit in the third embodiment.
  • FIG. 14 is a diagram illustrating an example of a detailed configuration of the second directivity synthesis unit in the third embodiment.
  • FIG. 15A is a diagram illustrating an example of a functional configuration of a correction unit according to Embodiment 3.
  • FIG. 15B is a diagram illustrating an example of a functional configuration of the correction unit according to Embodiment 3.
  • FIG. 16 is a diagram showing the directivity pattern of the input signal and the output signal of the correction unit in the third embodiment.
  • FIG. 17 is a diagram illustrating an example of a configuration of a directional microphone device according to the fourth embodiment.
  • FIG. 18 is a diagram illustrating an example of a configuration of a directional microphone device according to the fourth embodiment.
  • FIG. 19 is a diagram illustrating an example of a detailed configuration of the third directivity synthesis unit in the fourth embodiment.
  • FIG. 20 is a diagram illustrating a modification of the configuration of the directional microphone device according to the fourth embodiment.
  • FIG. 21 is a diagram illustrating an example of a configuration of a conventional directional microphone device.
  • the target sound direction refers to the directivity main axis of the directivity characteristic of the microphone device.
  • FIG. 21 is a diagram showing an example of the configuration of a conventional directional microphone device.
  • the directional microphone device shown in FIG. 21 includes a first microphone unit 901, a second microphone unit 902, a determination unit 910, an adaptive filter unit 920, a signal subtraction unit 930, and a noise suppression filter coefficient calculation unit 940. And a time-varying coefficient filter unit 950.
  • a sound pressure gradient type main signal having a directional main axis in a target direction output from the first microphone unit 901 and the second microphone unit 902 are output.
  • the frequency analysis is performed for each of the sound pressure gradient type reference signals having sensitivity blind spots in the target direction.
  • the noise suppression filter coefficient calculation unit 940 estimates the power spectrum of the sound other than the target direction included in the main signal based on the power spectra of the main signal and the reference signal, and based on the estimated power spectrum.
  • a filter coefficient for suppressing sound other than the target direction is calculated.
  • the time-varying coefficient filter unit 950 suppresses sounds other than the target direction by performing filter processing on the main signal, and emphasizes the sound in the target direction.
  • the sound pressure gradient type directivity synthesis method is used for the reference signal, and it is difficult to form the sensitivity blind spot with respect to the target direction sufficiently narrow (form the angle range sufficiently narrow).
  • the noise suppression filter coefficient calculation unit 940 cannot calculate the coefficient for suppressing the sound near the target sound.
  • Patent Document 2 discloses a technique for enhancing the sound in the target sound direction.
  • the output signal from the first directional microphone having sensitivity in the target sound direction is a main signal
  • the second directional microphone having the sensitivity blind spot in the target sound direction is used.
  • the sound in the target sound direction is emphasized by performing filter processing on the sound.
  • the reference signal in the configuration disclosed in Patent Document 2, in the relationship between the directional pattern of the directional microphone used for the main signal and the directional pattern of the directional microphone used for the reference signal, the reference signal has the target sound direction.
  • the main signal does not match the reference signal with respect to the directivity pattern other than the target sound direction.
  • the directivity pattern indicates the characteristics of the microphone sound pressure sensitivity versus the sound wave arrival direction.
  • the optimum suppression coefficient adaptively according to the noise source direction It was necessary to estimate. As a result, the estimation accuracy of the signal component to be suppressed mixed from the reference signal into the main signal is a factor of the performance limit.
  • one embodiment of the present invention focuses on the above-described problem, and a directional microphone device, an acoustic signal processing method, and an acoustic signal that can form a directivity having a narrower directivity angle with respect to a target direction.
  • An object is to provide a processing program.
  • a directional microphone device includes a first directivity synthesis unit that generates a first acoustic signal having sensitivity in a target direction, and sensitivity in the target direction.
  • a second directivity synthesis unit that generates a second acoustic signal having a blind spot, and the first directivity synthesis unit for the second acoustic signal generated by the second directivity synthesis unit
  • the third acoustic signal in which the angle range of the sensitivity dead angle in the target direction is made narrower than that of the second acoustic signal by multiplying the first acoustic signal generated in step N times (N> 0) in the frequency domain.
  • a noise suppressor using the first acoustic signal generated by the first directivity synthesis unit as a main signal and the third acoustic signal generated by the correction unit as a reference signal.
  • a directional microphone device capable of forming directivity having a narrower directivity angle with respect to the target direction can be realized.
  • the angle range of the sensitivity blind angle with respect to the target direction of the reference signal can be narrowed, and the sound near the target direction can be included in the reference signal.
  • directivity having a narrower directivity angle with respect to the target direction can be formed.
  • the reference signal can be corrected so that the noise component can be estimated with high accuracy, so that not only the directivity can be sharpened but also the sound quality can be improved. Become.
  • the first directivity synthesis unit and the second directivity synthesis unit perform arithmetic processing on an output signal of a microphone array composed of a plurality of microphones, whereby the first acoustic signal and the The second acoustic signal may be generated.
  • the first acoustic signal generated by the first directivity synthesis unit and the second acoustic signal generated by the second directivity synthesis unit are further converted into a frequency domain signal.
  • a first conversion unit that converts the first acoustic signal into a frequency domain signal by the first conversion unit, and the correction unit converts the second acoustic signal into a frequency domain signal by the first conversion unit.
  • the third acoustic signal may be generated by multiplying the first acoustic signal converted into a signal N times (N> 0).
  • the N is 1, and the correction unit performs complex multiplication of the second acoustic signal converted into a frequency domain signal and the first acoustic signal converted into a frequency domain signal.
  • a spectrum multiplying unit that performs calculation, an absolute value calculation unit that calculates an absolute value of an output signal of the spectrum multiplication unit, and a square root of the absolute value calculated by the absolute value calculation unit.
  • a square root calculation unit that generates a signal.
  • the N is 1, and the correction unit converts the first absolute value of the first acoustic signal converted into a frequency domain signal and the second signal converted into a frequency domain signal.
  • An absolute value calculation unit that calculates a second absolute value of the acoustic signal; a multiplication unit that multiplies the first absolute value calculated by the absolute value calculation unit and the second absolute value; and the multiplication A square root calculating unit that generates the third acoustic signal by calculating the square root of the multiplication value performed by the unit.
  • the suppression unit uses a power spectrum of the first acoustic signal and the third acoustic signal, and is noise that is a sound other than the sound in the target direction included in the first acoustic signal.
  • a noise suppression unit that generates the output acoustic signal by performing the noise suppression by suppressing the noise and extracting only the sound in the target direction.
  • it further includes a power spectrum calculation unit that calculates a power spectrum of each of the first acoustic signal and the third acoustic signal that has been converted into a frequency domain signal
  • the suppression unit includes the first acoustic signal 1 main acoustic signal or the first acoustic signal converted into a frequency domain signal by the first converter and the power spectrum of the first acoustic signal calculated by the power spectrum calculator
  • the output acoustic signal may be generated by performing the noise suppression using the power spectrum of the third acoustic signal calculated by the power spectrum calculation unit as a reference signal.
  • the power spectrum calculation unit calculates the power of (2 / (N + 1)) to the absolute value of the third acoustic signal generated by the correction unit, thereby calculating the third acoustic signal.
  • the power spectrum of the signal may be calculated.
  • the suppression unit multiplies a power spectrum of the third acoustic signal by a predetermined coefficient and outputs the first coefficient multiplication unit, and the first acoustic signal from the power spectrum of the first acoustic signal.
  • a first subtracting unit that subtracts the output signal from the coefficient multiplying unit, a power spectrum of the first acoustic signal, and an output signal from the first subtracting unit are included in the first acoustic signal.
  • a noise suppression processing unit that generates the output acoustic signal by performing the noise suppression using the first acoustic signal and the noise suppression coefficient calculated by the noise suppression coefficient calculation unit as inputs may be provided. .
  • the directivity of the directional microphone device is controlled by changing the N that is the number of multiplications in the correction unit and the N value of (2 / (N + 1)) power in the power spectrum calculation unit.
  • a beam width control unit may be provided.
  • the N may be a real number larger than zero.
  • the noise suppression coefficient calculation unit includes: The noise suppression using the power spectrum of the first acoustic signal calculated by the power spectrum calculator as a main signal and the power spectrum of the third acoustic signal calculated by the power spectrum calculator as a reference signal The coefficient may be calculated.
  • the directional microphone device further generates a third acoustic signal having a sensitivity blind spot in the target direction and having a directional pattern different from the second acoustic signal.
  • a directivity synthesis unit, and the suppression unit further uses the third acoustic signal generated by the correction unit as a main signal, and the fourth acoustic signal generated by the third directivity synthesis unit.
  • an opposite direction noise suppression unit that suppresses a first noise that is a sound in a direction opposite to the target direction included in the third acoustic signal, the first acoustic signal, and the first acoustic signal 4 is used to calculate a noise suppression coefficient that suppresses noise that is a sound other than the sound in the target direction including the first noise, using the acoustic signal of 4 and the output signal of the opposite direction noise suppression unit.
  • the first directivity synthesis unit Applying the noise suppression coefficient calculated by the noise suppression coefficient calculation unit to the first acoustic signal that has been performed, suppressing the noise, and extracting only sound in the target direction to perform the noise suppression And a noise suppression unit that generates the output acoustic signal.
  • a power spectrum calculation unit that calculates a power spectrum of each of the signal, the third acoustic signal, and the fourth acoustic signal, and the opposite direction noise suppression unit mainly uses the power spectrum of the third acoustic signal.
  • the first noise may be suppressed by using a signal and a power spectrum of the fourth acoustic signal as a reference signal.
  • the noise suppression coefficient calculation unit uses the power spectrum of the first acoustic signal as a main signal, and uses the output signal of the opposite direction noise suppression unit and the power spectrum of the fourth acoustic signal as a reference signal.
  • the noise suppression coefficient may be calculated.
  • the noise suppression unit suppresses the noise by multiplying the first acoustic signal converted into a frequency domain signal by the noise suppression coefficient calculated by the noise suppression coefficient calculation unit.
  • the noise suppression unit includes a second conversion unit that converts the noise suppression coefficient that is a frequency domain coefficient into a time domain FIR filter coefficient, and one unit that is converted by the second conversion unit.
  • the coefficient of the FIR filter before time is updated using the coefficient of the FIR filter of the current unit time converted by the second conversion unit, and the first sound generated by the first directivity synthesis unit is updated.
  • a time-varying coefficient FIR filter unit that generates the output acoustic signal by performing filter processing on the signal may be included.
  • an acoustic signal processing method includes a first directivity synthesis step for generating a first acoustic signal having sensitivity in a target direction, and the target direction.
  • a second directivity synthesis step for generating a second acoustic signal having a sensitivity blind spot in the first direction, and the first directivity with respect to the second acoustic signal generated in the second directivity synthesis step.
  • a correction step for generating an acoustic signal and the first acoustic signal generated in the first directivity synthesis step as a main signal, and the third acoustic signal generated in the correction step as a reference signal By performing noise suppression by, and a suppression step of generating an output acoustic signal the narrow angle of the target direction of directivity of said first acoustic signal.
  • FIG. 1 is a diagram illustrating an example of a configuration of a directional microphone device according to the first embodiment.
  • the directional microphone device 1 shown in FIG. 1 includes a first microphone 11, a second microphone 12, a conversion unit 104, a correction unit 105, a calculation unit 106, and a suppression unit 107.
  • the first microphone 11 is an example of a first directivity synthesis unit, for example, and generates a first acoustic signal having sensitivity in a target direction.
  • the first microphone 11 has a sensitivity characteristic having sensitivity in the target sound direction, converts a sound wave into an electric signal, and outputs a main signal x (t) as an output signal.
  • having sensitivity in the target direction means having peak sensitivity in the target direction in the sensitivity characteristic.
  • the first microphone 11 is composed of one or a plurality of microphones (microphone array), and the first acoustic signal (main signal x (t) having sensitivity in the target direction is calculated by processing the output signal of the microphone array. )) May be provided.
  • the second microphone 12 is an example of a second directivity synthesis unit, for example, and generates a second acoustic signal having a sensitivity blind spot in the target direction.
  • the second microphone 12 has a sensitivity characteristic having a sensitivity blind spot in the target sound direction, converts a sound wave into an electric signal, and outputs a reference signal r1 (t) as an output signal.
  • the second microphone 12 is composed of one or a plurality of microphones (microphone array), and the second acoustic signal (reference signal r1 (reference signal r1 () having a sensitivity blind spot in the target direction) is calculated by processing the output signal of the microphone array.
  • a second directivity synthesis unit that generates t)) may be provided.
  • the conversion unit 104 is an example of a first conversion unit, for example, and is generated by the first acoustic signal (main signal x (t)) generated by the first microphone 11 and the second microphone 12.
  • the second acoustic signal (reference signal r1 (t)) is converted into a frequency domain signal.
  • the conversion unit 104 includes a first time-frequency conversion unit 1041 and a second time-frequency conversion unit 1042.
  • the first time-frequency converter 1041 receives the main signal x (t) from the first microphone 11 and converts the signal from the time domain to the frequency domain, and outputs the main signal spectrum X ( ⁇ ).
  • the second time-frequency converter 1042 receives the reference signal r1 (t) from the second microphone 12 as an input, converts the signal from the time domain to the frequency domain, and outputs the first reference signal spectrum R1 ( ⁇ ). .
  • the correcting unit 105 multiplies the second acoustic signal generated by the second microphone 12 by the first acoustic signal generated by the first microphone 11 N times (N> 0) in the frequency domain. As a result, a third acoustic signal in which the angular range of the sensitivity blind angle in the target direction is narrower than the second acoustic signal is generated. More specifically, the correction unit 105 converts the second acoustic signal (R1 ( ⁇ )) converted into the frequency domain signal by the conversion unit 104 into the frequency domain signal converted by the conversion unit 104. A third acoustic signal is generated by multiplying one acoustic signal (X ( ⁇ )) N times (N> 0).
  • the correction unit 105 includes the main signal spectrum X ( ⁇ ) from the first time-frequency conversion unit 1041 and the first reference signal spectrum R1 ( ⁇ ) from the second time-frequency conversion unit 1042. ) As an input, the corrected second reference signal spectrum R2 ( ⁇ ) is output.
  • FIG. 2 is a diagram illustrating an example of a detailed configuration of the correction unit according to the first embodiment.
  • the correction unit 105 includes a calculation unit 1050 and a spectrum multiplication unit 1051 and executes the calculation formula shown in (Formula 1).
  • the spectrum multiplier 1051 converts the first acoustic signal (X ( ⁇ )) converted into the frequency domain signal into the second acoustic signal (R1 ( ⁇ )) converted into the frequency domain signal. Is multiplied N times (N> 0), and complex multiplication is performed.
  • the calculation unit 106 is an example of a power spectrum calculation unit, for example, and calculates the power spectrum of each of the first acoustic signal and the third acoustic signal converted into a frequency domain signal.
  • the calculation unit 106 calculates (2 / (N + 1)) to the absolute value of the third acoustic signal (R2 ( ⁇ )) generated by the correction unit 105, thereby calculating the third acoustic signal.
  • a power spectrum (Pr2 ( ⁇ )) is calculated.
  • the calculation unit 106 includes a first power spectrum calculation unit 1061 and a second power spectrum calculation unit 1062.
  • the first power spectrum calculation unit 1061 receives the main signal spectrum X ( ⁇ ) from the first time-frequency conversion unit 1041 and outputs the main signal power spectrum Px ( ⁇ ).
  • the second power spectrum calculation unit 1062 receives the second reference signal spectrum R2 ( ⁇ ) from the correction unit 105, and outputs the second reference signal power spectrum Pr2 ( ⁇ ).
  • the suppression unit 107 performs first noise suppression by performing noise suppression using the first acoustic signal generated by the first microphone 11 as a main signal and the third acoustic signal generated by the correction unit 105 as a reference signal. An output acoustic signal in which the directivity of the target direction of the acoustic signal is narrowed is generated. More specifically, the suppression unit 107 includes the first acoustic signal (X ( ⁇ )) converted into the frequency domain signal by the conversion unit 104 and the power of the first acoustic signal calculated by the calculation unit 106.
  • the output acoustic signal is generated by performing noise suppression using the spectrum (Px ( ⁇ )) as a main signal and the power spectrum (Pr2 ( ⁇ )) of the third acoustic signal calculated by the calculation unit 106 as a reference signal. To do.
  • suppression section 107 has main signal spectrum X ( ⁇ ) from first time-frequency conversion section 1041 and main signal power spectrum Px ( ⁇ ) from first power spectrum calculation section 1061.
  • the second reference signal power spectrum Pr2 ( ⁇ ) from the second power spectrum calculation unit 1062 is input, and the output y (t) of the directional microphone device 1 is output.
  • FIG. 3 is a diagram illustrating an example of a detailed configuration of the noise suppression unit in the first embodiment.
  • the suppression unit 107 includes a first coefficient multiplication unit 110, a first subtraction unit 111, a noise suppression coefficient calculation unit 108, and a noise suppression processing unit 109, as shown in FIG.
  • the first coefficient multiplier 110 multiplies the power spectrum (Pr2 ( ⁇ )) of the third acoustic signal by a predetermined coefficient (coefficient C ( ⁇ )) and outputs the result.
  • the first coefficient multiplier 110 receives the second reference signal power spectrum Pr2 ( ⁇ ) from the second power spectrum calculator 1062, and multiplies the coefficient by the coefficient C ( ⁇ ).
  • the predetermined coefficient that is, the coefficient C ( ⁇ ) may be a predetermined constant, or a variable that varies in a time series or at a predetermined timing.
  • the first subtractor 111 subtracts the output signal (Pr3 ( ⁇ )) of the first coefficient multiplier 110 from the power spectrum (Px ( ⁇ )) of the first acoustic signal. Specifically, the first subtraction unit 111 uses the main signal power spectrum Px ( ⁇ ) from the first power spectrum calculation unit 1061 to the third reference signal power spectrum Pr3 ( ( ⁇ ) is subtracted to output the estimated target sound power spectrum Ps ( ⁇ ).
  • the noise suppression coefficient calculation unit 108 receives the power spectrum (Px ( ⁇ )) of the first acoustic signal and the output signal (Ps ( ⁇ )) of the first subtraction unit 111 as input, and is included in the first acoustic signal.
  • a noise suppression coefficient (H ( ⁇ )) for suppressing noise that is sound other than the sound in the target direction is calculated.
  • the noise suppression coefficient calculation unit 108 uses the main signal power spectrum Px ( ⁇ ) from the first power spectrum calculation unit 1061 and the estimated target sound power spectrum Ps ( ⁇ ) from the first subtraction unit 111.
  • the noise suppression coefficient H ( ⁇ ) is output.
  • the noise suppression processing unit 109 converts the first acoustic signal (X ( ⁇ )) converted into the frequency domain signal by the conversion unit 104 and the noise suppression coefficient (H ( ⁇ )) calculated by the noise suppression coefficient calculation unit 108. Are input, and noise suppression processing is performed using them to generate an output acoustic signal (y (t)). Specifically, the noise suppression processing unit 109 receives the main signal spectrum X ( ⁇ ) from the first time-frequency conversion unit 1041 and the noise suppression coefficient H ( ⁇ ) from the noise suppression coefficient calculation unit 108 as inputs. A signal component other than the target sound direction that is noise is suppressed, a target sound in the directionality main axis direction is extracted, and an output y (t) is output.
  • the target sound direction is the main axis direction (front direction) of directivity formed by the directional microphone device.
  • (t) such as x (t) is attached to the time domain signal
  • ( ⁇ ) such as X ( ⁇ ) is attached to the frequency domain signal.
  • the directivity pattern of X ( ⁇ ) represents the sound wave arrival direction ⁇ vs. sound pressure sensitivity characteristic at the frequency ⁇ of the signal X, and the directivity pattern diagram is illustrated in a polar pattern format. .
  • FIG. 4A is a characteristic diagram showing the directivity pattern of the first microphone in the first embodiment
  • FIG. 4B is a characteristic diagram showing the directivity pattern of the second microphone in the first embodiment.
  • the first microphone 11 has a directivity characteristic having sensitivity in the target sound direction, and has, for example, a directivity pattern (directivity characteristic diagram) shown in FIG. 4A.
  • the directivity pattern shown in FIG. 4A indicates a primary sound pressure gradient type unidirectionality generally used for collecting sounds in the front direction.
  • the output signal x (t) from the first microphone 11 is used as the main signal, and the directivity is further sharpened (narrowed) by the subsequent processing, and the sound selectivity is achieved.
  • the subsequent processing is noise suppression processing based on the power spectrum generated from the main signal x (t) and the reference signal r1 (t).
  • the second microphone 12 has a directivity characteristic having a sensitivity blind spot in the target sound direction, and has, for example, a directivity pattern shown in FIG. 4B.
  • the directivity pattern shown in FIG. 4B indicates a primary sound pressure gradient type bi-directionality having a sensitivity blind spot in front of the target sound direction.
  • the output signal r ⁇ b> 1 (t) from the second microphone 12 is used as a reference signal to perform the sharpening process on the directivity of the main signal.
  • the frequency in the directional pattern diagram is calculated as 1 kHz. However, the frequency is not limited to a specific frequency as long as the above-described conditions for the directional patterns of the first microphone 11 and the second microphone 12 are satisfied. .
  • the first time-frequency conversion unit 1041 and the second time-frequency conversion unit 1042 respectively convert the main signal x (t) and the reference signal r1 (t) using, for example, an FFT operation or a filter bank.
  • the signal is converted into a frequency spectrum signal, and the main signal spectrum X ( ⁇ ) and the first reference signal spectrum R1 ( ⁇ ) are output.
  • the first power spectrum calculation unit 1061 performs the following calculation for each frequency component on the main signal spectrum X ( ⁇ ) and outputs the main signal power spectrum Px ( ⁇ ).
  • the correction unit 105 receives the main signal spectrum X ( ⁇ ) from the first time-frequency conversion unit 1041 and the first reference signal spectrum R1 ( ⁇ ) from the second time-frequency conversion unit 1042. .
  • the correction unit 105 performs the correction shown in (Equation 3) for each frequency ⁇ on the reference signal spectrum R1 ( ⁇ ) in order to bring the directivity pattern closer to an ideal shape, thereby obtaining the second reference signal spectrum R2. ( ⁇ ) is output. Details of the contents of the correction will be described later.
  • Equation 3 indicates that the first reference signal spectrum R1 ( ⁇ ) is multiplied by N times the main signal spectrum X ( ⁇ ). However, N> 0, that is, N is a real number larger than zero.
  • the second power spectrum calculation unit 1062 converts the number of dimensions of the second reference signal spectrum R2 ( ⁇ ) corrected by the correction unit 105 into a power order. Specifically, in the correction unit 105, since the spectrum is multiplied N + 1 times, the dimension is converted to the power (square) order by the calculation shown in (Expression 4), and the reference signal power spectrum Pr2 ( ⁇ ) Is output.
  • the suppression unit 107 suppresses signal components other than the target sound direction from the main signal based on the main signal power spectrum Px ( ⁇ ) and the second reference signal power spectrum Pr2 ( ⁇ ), so that the directivity is in the main axis direction.
  • An output y (t) obtained by extracting the target sound at is output. More specifically, for example, as shown in FIG. 3, the first coefficient multiplication unit 110 converts the second reference signal power spectrum Pr2 ( ⁇ ) by C ( ⁇ ) times (as shown in (Equation 5)).
  • the level-adjusted Pr3 ( ⁇ ) is output by multiplying by (multiplier factor).
  • the first subtraction unit 111 uses the estimated target sound power spectrum Ps ( ⁇ ) generated by subtracting Pr3 ( ⁇ ) from the main signal power spectrum Px ( ⁇ ) as a noise suppression coefficient. It outputs to the calculation part 108.
  • FIG. 5A shows the directivity pattern of the main signal power spectrum Px ( ⁇ ) as a solid line, and the third reference signal power spectrum Pr3 ( ⁇ ) whose level is adjusted by multiplying Pr2 ( ⁇ ) by the coefficient C ( ⁇ ).
  • the directivity pattern is indicated by a broken line.
  • description will be given by calculating N in (Expression 3) and (Expression 4) as (Expression 7).
  • the directivity pattern shown in FIG. 5A has a main signal power spectrum Px ( ⁇ ) (solid line) and a third frequency with respect to the direction of noise A having a coefficient C ( ⁇ ) in the 90 ° direction.
  • C ( ⁇ ) is set so that the reference signal power spectrum Pr3 ( ⁇ ) (broken line) matches is shown.
  • the directivity pattern shown in FIG. 5B shows an estimated target sound power spectrum Ps ( ⁇ ) obtained by subtracting the third reference signal power spectrum Pr3 ( ⁇ ) from the main signal power spectrum Px ( ⁇ ) according to (Equation 6). Yes.
  • the portion where the subtraction result is a negative value is the result of calculation with the value set to zero.
  • the estimated target sound power spectrum Ps ( ⁇ ) shown in FIG. 5B is a signal component other than the target sound direction that is noise using the third reference signal power spectrum Pr3 ( ⁇ ) from the main signal power spectrum Px ( ⁇ ). Is output to the noise suppression coefficient calculation unit 108.
  • the estimated target sound power spectrum Ps ( ⁇ ) corresponds to the directivity pattern of the output (y (t)) of the directional microphone device 1.
  • the noise suppression coefficient calculation unit 108 uses the main signal power spectrum Px ( ⁇ ), which is the input signal before sharpening the directivity, as the denominator, and outputs the estimated target sound power spectrum to be output.
  • the transfer characteristic H ( ⁇ ) using Ps ( ⁇ ) as a molecule is calculated.
  • the noise suppression coefficient calculation unit 108 outputs the calculated transfer characteristic H ( ⁇ ) to the noise suppression processing unit 109.
  • Equation 8 is an example of a calculation method in the case of using the Wiener filter transfer characteristic generally used for noise suppression (noise suppressor) based on the power spectrum.
  • the noise suppression processing unit 109 calculates the product of the noise suppression coefficient H ( ⁇ ) and the main signal spectrum X ( ⁇ ) as shown in (Equation 9), and performs frequency-time conversion to obtain a time waveform output y ( t).
  • Equation 9 as an example, frequency-time conversion processing is expressed by IFFT ⁇ (inverse FFT operation).
  • the characteristic of the directional microphone device 1 is that the correction unit 105 and the second power spectrum calculation unit 1062 perform correction processing that makes the directivity pattern ideally close by focusing on the directivity pattern of the reference signal. It is in. Then, the correction unit 105 performs a correction process of multiplying the first reference signal spectrum R1 ( ⁇ ) by the main signal spectrum N times.
  • the conventional problem will be described with reference to FIG. 5A.
  • FIG. 5A shows a state where the level is adjusted for the noise A in the 90 ° direction by the coefficient C ( ⁇ ), and the solid line (Px ( ⁇ )) and the broken line (Pr3 ( ⁇ )) of the directivity pattern. Are in the 90 ° direction and the values match.
  • the sensitivity of the reference signal is higher than the sensitivity of the main signal, and the noise B in the 120 direction is excessively suppressed. Therefore, a learning mechanism for appropriately adjusting the level of the reference signal as needed depending on the strength of noise A and noise B is required.
  • the directivity pattern of the reference signal has a sensitivity blind spot in the front direction and matches the directivity pattern of the main signal except in the front direction. If the directivity patterns other than the front direction of the main signal and the reference signal match, for example, the reference signal level adjustment value (coefficient C ( ⁇ )) for the noise A in the 90 ° direction and the noise B in the 120 ° direction is necessary. Disappear. In other words, if the degree of coincidence between the directivity patterns of the main signal and the reference signal other than the front direction increases, noise suppression can be performed simultaneously in all directions without excess or deficiency, so the directivity pattern of the reference signal is ideal.
  • the noise suppression accuracy will increase, and the sharpness of directivity and the improvement of sound quality will be obtained.
  • the coefficient C ( ⁇ ) does not have to be adjusted as needed in accordance with the spatial distribution of the noise source, it is possible to simplify the processing as compared with the prior art by using this coefficient as a fixed constant.
  • the correction unit 105 and the second power spectrum calculation unit have ) And (Equation 4), the first signal spectrum R1 ( ⁇ ) is multiplied by the main signal spectrum X ( ⁇ ) N times (N> 0) to obtain a reference signal power spectrum.
  • the angle direction of the sensitivity blind spot is zero sensitivity. Therefore, no matter how many times the first reference signal spectrum R1 ( ⁇ ) is multiplied by the main signal spectrum X ( ⁇ ), zero sensitivity is maintained in the angular direction of the sensitivity blind spot of the first reference signal spectrum R1 ( ⁇ ). .
  • the high / low sensitivity has a certain value even if it exists. Therefore, when the number N of multiplications of the main signal spectrum X ( ⁇ ) is increased, the reference signal directivity is increased. As the N pattern increases, the influence of the main signal spectrum X ( ⁇ ) increases as N increases and approaches the same directivity pattern as the main signal.
  • the degree of coincidence is high in a portion other than the target sound direction.
  • the directivity of the estimated target sound power spectrum Ps ( ⁇ ) obtained by subtracting the third reference signal power spectrum Pr3 ( ⁇ ) from the main signal power spectrum Px ( ⁇ ). It can be seen that the characteristic pattern can also be sharpened as N increases.
  • the directivity pattern of the estimated target sound power spectrum Ps ( ⁇ ) is the target output of the noise suppression unit, it is equal to the directivity pattern of the output y (t) of the directional microphone device.
  • the configuration of the first embodiment it is possible to realize a directional microphone device that can form a directivity having a narrower directivity angle with respect to a target direction. More specifically, according to the directional microphone device 1 of the first embodiment, it is possible to improve the degree of pattern matching other than the target sound direction of the directional pattern of the reference signal with respect to the directional pattern of the main signal. In addition, since the noise estimation accuracy of the noise suppression unit processing unit can be improved, it is possible to achieve a sharper directivity and higher sound quality.
  • the output signal x (t) from the first microphone 11 may be input to the suppression unit 107 instead of the main signal spectrum X ( ⁇ ). This will be specifically described below as a modification.
  • FIG. 9 is a diagram illustrating a configuration of a directional microphone device according to a modification of the first embodiment.
  • FIG. 10 is a diagram illustrating an example of a detailed configuration of the suppression unit in the modification of the first embodiment. Elements similar to those in FIGS. 1 and 3 are denoted by the same reference numerals, and detailed description thereof is omitted.
  • the directional microphone device 1A shown in FIG. 9 differs from the directional microphone device 1 according to Embodiment 1 in the configuration of the suppression unit 107A.
  • the suppression unit 107A uses the first acoustic signal generated by the first microphone 11 as a main signal and performs noise suppression using the third acoustic signal generated by the correction unit 105 as a reference signal.
  • An output acoustic signal in which the directivity of the target direction of the acoustic signal is narrowed is generated. More specifically, the suppression unit 107A includes the first acoustic signal (x (t)) generated by the first microphone 11 and the power spectrum (Px) of the first acoustic signal calculated by the calculation unit 106. ( ⁇ )) as a main signal, and noise suppression is performed using the power spectrum (Pr2 ( ⁇ )) of the third acoustic signal calculated by the calculation unit 106 as a reference signal, thereby generating an output acoustic signal.
  • the suppression unit 107A includes a first coefficient multiplication unit 110, a first subtraction unit 111, a noise suppression coefficient calculation unit 108A, and a noise suppression processing unit 109A.
  • the suppression unit 107A illustrated in FIG. 10 differs from the suppression unit 107 according to Embodiment 1 in the configuration of a noise suppression coefficient calculation unit 108A and a noise suppression processing unit 109A.
  • the noise suppression processing unit 109A generates an output acoustic signal y (t) by performing noise suppression using the first acoustic signal and the noise suppression coefficient calculated by the noise suppression coefficient calculation unit 108A as inputs.
  • the input / output of the noise suppression processing unit 109A is a time domain signal of x (t), y (t).
  • the output of the noise suppression coefficient calculation unit 108A is the filter coefficient h used in the noise suppression processing unit 109A. For example, it can be calculated by the following equation.
  • H (n) IFFT ⁇ Ps ( ⁇ ) / Px ( ⁇ ) ⁇ (Formula 10)
  • the noise suppression processing unit 109 may perform the filtering process shown in (Equation 11).
  • N in (Equation 3) and (Equation 4) may not be an integer, and a real value greater than 0 may be used when detailed adjustment is required.
  • first microphone 11 and the second microphone 12 may be configured by microphone elements, or may be configured by signal processing from a microphone array including a plurality of microphone elements.
  • the correction unit 105 has described the number N of the main signal spectrum X ( ⁇ ) by which the first reference signal spectrum R1 ( ⁇ ) is multiplied as a predetermined value, but is not limited thereto. N may be varied. An example of this case will be described below.
  • FIG. 11 is a diagram illustrating an example of the configuration of the directional microphone device according to the second embodiment. The same components as those in the directional microphone device of FIG.
  • the directional microphone device 2 shown in FIG. 11 differs from the directional microphone device 1 shown in FIG. 1 in the configuration of the correction unit 105A and the calculation unit 106A, and a beam width control unit 200 is added.
  • the correction unit 105A has the function of the correction unit 105, and the beam width control unit 200 controls the value of N that is the number of multiplications shown in (Equation 3).
  • the second power spectrum calculation unit 1062A has the function of the second power spectrum calculation unit 1062, and the beam width control unit 200 controls the value of N shown in (Expression 4).
  • the beam width control unit 200 changes the directivity by changing N, which is the number of multiplications in the correction unit 105A, and the N value of (2 / (N + 1)) to the calculation unit 106 (second power spectrum calculation unit 1062A).
  • N is the number of multiplications in the correction unit 105A
  • N value is the N value of (2 / (N + 1)
  • the beam width control unit 200 controls the value N by inputting a set value for use by the user or a zoom control signal linked to image zoom of the camera system. .
  • the direction of the estimated target sound power spectrum Ps ( ⁇ ) in the case of N 0 shown in FIG. 5B.
  • the directional pattern of the output y (t) of the directional microphone device 2 can be sharpened by increasing the value of N by the beam width controller 200. That is, the directivity of the directional microphone device 2 can be changed from a wide angle to an acute angle by the beam width control unit 200 controlling the value of N.
  • the configuration of the second embodiment it is possible to realize a directional microphone device that can form a directivity having a narrower directivity angle with respect to a target direction. Furthermore, according to the configuration of the second embodiment, the user can set the directivity pattern of the directional microphone device 2 or can obtain a sound zoom effect in conjunction with the zoom of the image.
  • FIG. 12 is a diagram illustrating an example of the configuration of the directional microphone device according to the third embodiment.
  • FIG. 13 is a diagram illustrating an example of a detailed configuration of the first directivity synthesis unit in the third embodiment.
  • FIG. 14 is a diagram illustrating an example of a detailed configuration of the second directivity synthesis unit in the third embodiment.
  • the directional microphone device 3 shown in FIG. 12 includes a microphone array 101, a first directivity synthesis unit 102, a second directivity synthesis unit 103, a conversion unit 104, a correction unit 105B, a calculation unit 106B, and a suppression unit 107B. Is provided.
  • the microphone array 101 is composed of a plurality of microphones. Specifically, the microphone array 101 includes a plurality of omnidirectional microphone units and is disposed in a relatively small space. The microphone array 101 is built in a device such as a video camera or a digital still camera.
  • the microphone array 101 in the microphone array 101, four omnidirectional microphone units 101F, 101B, 101L, and 101R are arranged in a diamond shape with respect to the target direction.
  • the non-directional microphone units 101F, 101B, 101L, and 101R output acoustic signals xf (t), xb (t), xl (t), and xr (t), respectively.
  • the interval d1 is the interval between the omnidirectional microphone units 101F and 101B
  • the interval d2 is the interval between the omnidirectional microphone units 101L and 101R.
  • the interval d1 and the interval d2 are arbitrary values determined by the restriction of the required frequency band and installation space.
  • d1, d2 about 5 mm to 100 mm from the viewpoint of the frequency band.
  • the first directivity synthesis unit 102 generates a first acoustic signal having sensitivity in the target direction by performing arithmetic processing on the output signal of the microphone array 101.
  • the first directivity synthesis unit 102 uses the acoustic signals xf (t) and xb (t) from the omnidirectional microphone units 101F and 101B to provide directivity having a main axis in the target direction.
  • the generated acoustic signal x (t) is generated (also described as a directivity signal x (t)).
  • the acoustic signal x (t) is a specific example of the first acoustic signal.
  • the first directivity synthesis unit 102 includes a first delay unit 1021, a second delay unit 1022, a subtractor 1023, and an EQ (Equalizer) 1024, and a target direction (0 ° ) To form a sound pressure gradient type unidirectionality having a main axis.
  • the first delay device 1021 is composed of a digital filter and receives an acoustic signal xf (t).
  • the second delay device 1022 includes a digital filter, and receives the acoustic signal xb (t).
  • the filter coefficients of the respective digital filters constituting the first delay device 1021 and the second delay device 1022 are designed as follows. That is, the acoustic signal xf (t) and the acoustic signal xb (t) with respect to the incoming sound wave from the 180 ° direction of FIG. 12 at the input of the subtractor 1023 are designed to be in phase at the input of the subtractor 1023, for example.
  • the More specifically, the filter coefficient is designed such that the second delay unit 1022 is delayed by d1 / c [s] relative to the first delay unit 1021.
  • c is the speed of sound [m / s].
  • the subtractor 1023 subtracts the output signal of the second delay device 1022 from the output signal of the first delay device 1021.
  • the sensitivity in the 180 ° direction can be eliminated (having a sensitivity blind spot in the target direction), and a relatively sensitive signal can be obtained in the 0 ° direction (target direction).
  • the output signal of the subtractor 1023 has an amplitude frequency characteristic having a slope of ⁇ 6 dB / linguistic linguistic as the frequency becomes lower in principle (long wavelength) in the 0 ° direction.
  • the EQ 1024 generates and outputs an acoustic signal x (t) by performing correction so that the amplitude frequency characteristic of the output signal of the subtracter 1023 becomes flat.
  • the first directivity synthesis unit 102 is configured.
  • the second directivity synthesis unit 103 generates a second acoustic signal having a sensitivity blind spot in the target direction by performing arithmetic processing on the output signal of the microphone array 101.
  • the second directivity synthesis unit 103 uses the acoustic signals xl (t) and xr (t) from the omnidirectional microphone units 101L and 101R to generate directivity having sensitivity blind spots in the target direction.
  • An acoustic signal r1 (t) (hereinafter also referred to as a directivity signal r1 (t)) is generated.
  • the acoustic signal r1 (t) is a specific example of the second acoustic signal.
  • the second directivity synthesis unit 103 includes a subtractor 1031 and an EQ 1032 and has a sensitivity blind spot in the target direction (0 °) and the direction opposite to the target direction (180 °). Form directivity.
  • the subtracter 1031 subtracts the acoustic signal xr (t) from the acoustic signal xl (t). Note that sound waves from the 0 ° direction (target direction) and the 180 ° direction are input to the omnidirectional microphone units 101L and 101R with the same amplitude and phase in the ideal state, and therefore output from the subtracter 1031. The signal is zero.
  • the output signal of the subtracter 1031 has an amplitude frequency characteristic having a slope of ⁇ 6 dB / linguistics as the frequency becomes lower in principle (longer wavelength) in the 90 ° direction or the 270 ° direction.
  • the EQ 1032 generates and outputs the acoustic signal r1 (t) by performing correction so that the amplitude frequency characteristic of the output signal of the subtracter 1031 becomes flat.
  • the second directivity synthesis unit 103 is configured.
  • the conversion unit 104 is an example of a first conversion unit, for example, and the first acoustic signal generated by the first directivity synthesis unit 102 and the second acoustic signal generated by the second directivity synthesis unit 103. Is converted into a frequency domain signal.
  • conversion section 104 includes a first time-frequency conversion section 1041 and a second time-frequency conversion section 1042.
  • the first time-frequency conversion unit 1041 converts the acoustic signal x (t) from the first directivity synthesis unit 102 into a frame unit in which a plurality of samples are accumulated (for example, the number of samples in one frame is 256, etc.
  • the frequency domain signal X ( ⁇ ) is calculated by performing fast Fourier transform, filter bank, wavelet transform, or the like.
  • the first time-frequency conversion unit 1041 accumulates the acoustic signal x (t) with, for example, 50% overlap, or performs windowing such as a Hamming window on the accumulated acoustic signal x (t). Then, the signal X ( ⁇ ) may be calculated.
  • the second time-frequency conversion unit 1042 applies the frequency domain signal R1 to the acoustic signal r1 (t) from the second directivity synthesis unit 103 in the same manner as the first time-frequency conversion unit 1041 described above. ( ⁇ ) is calculated.
  • the correction unit 105 ⁇ / b> B is an example of a correction unit, for example, and the first sound generated by the first directivity synthesis unit 102 with respect to the second acoustic signal generated by the second directivity synthesis unit 103.
  • the correcting unit 105B uses the second acoustic signal converted into the frequency domain signal by the converting unit 104 with respect to the first acoustic signal converted into the frequency domain signal by the converting unit 104.
  • a third acoustic signal is generated by multiplying N times (N> 0).
  • the second power spectrum calculation unit 1062 converts the signal spectrum multiplied by N + 1 times to the power (square) order. In the following, the second power spectrum is calculated.
  • the calculation unit 1062B converts the amplitude spectrum output from the correction unit 105B into a power spectrum as an input.
  • the correction unit 105B includes a signal X ( ⁇ ) that is an output signal of the first time-frequency conversion unit 1041 and a signal R1 ( ⁇ ) that is an output signal of the second time-frequency conversion unit 1042. Is used to calculate a signal R1 ′ ( ⁇ ) in which the angle range of the sensitivity blind angle in the target direction of the signal R1 ( ⁇ ) is narrowed.
  • the signal R1 ′ ( ⁇ ) is a specific example of the third acoustic signal.
  • FIG. 15A and FIG. 15B are diagrams illustrating an example of a functional configuration of the correction unit according to the third embodiment.
  • the correction unit 105B includes a spectrum multiplication unit 1051, an absolute value calculation unit 1052, and a square root calculation unit 1053, and executes the calculation formula shown in (Formula 12).
  • the spectrum multiplier 1051 performs complex multiplication of the second acoustic signal converted into the frequency domain signal and the first acoustic signal converted into the frequency domain signal.
  • spectrum multiplication section 1051 performs spectrum multiplication of signal X ( ⁇ ) and signal R1 ( ⁇ ) as shown in FIG. 15A.
  • the absolute value calculation unit 1052 calculates the absolute value of the output signal of the spectrum multiplication unit 1051.
  • absolute value calculation section 1052 calculates the absolute value of the multiplication value of signal X ( ⁇ ) and signal R1 ( ⁇ ).
  • the square root calculation unit 1053 generates a third acoustic signal by calculating the square root of the absolute value calculated by the absolute value calculation unit 1052.
  • the square root calculation unit 1053 calculates the signal R1 ′ ( ⁇ ).
  • the correction unit 105B is not limited to having the functional configuration shown in FIG. 15A.
  • the correction unit 105C may include absolute value calculation units 1054 and 1055, a multiplication unit 1056, and a square root calculation unit 1057, and may execute the calculation formula shown in (Formula 13). . This is because even when the calculation formula shown in (Formula 13) is executed, the same result as that obtained when the calculation formula shown in (Formula 12) is executed can be obtained.
  • the absolute value calculation units 1054 and 1055 are the first absolute value of the first acoustic signal converted into the frequency domain signal and the second absolute value of the second acoustic signal converted into the frequency domain signal. Calculate the value.
  • the absolute value calculator 1054 calculates the absolute value (first absolute value) of the signal X ( ⁇ ), and the absolute value calculator 1055 receives the signal R1 ( ⁇ ) (Second absolute value) is calculated.
  • the multiplication unit 1056 performs multiplication of the first absolute value and the second absolute value calculated by the absolute value calculation units 1054 and 1055.
  • the multiplication unit 1056 multiplies the absolute value (first absolute value) of the signal X ( ⁇ ) by the absolute value (second absolute value) of the signal R1 ( ⁇ ).
  • the square root calculation unit 1057 generates a third acoustic signal by calculating the square root of the multiplication value performed by the multiplication unit 1056.
  • the square root calculation unit 1057 calculates the signal R1 ′ ( ⁇ ).
  • FIG. 16 is a diagram showing the directivity pattern of the input signal and the output signal of the correction unit 105B in the third embodiment.
  • 16A shows a directivity pattern of the signal X ( ⁇ ) that is an input signal input to the correction unit 105B shown in FIG. 15A.
  • FIG. 16B shows the directivity pattern of FIG.
  • FIG. 16C illustrates a directivity pattern of the signal R1 ′ ( ⁇ ) that is an output signal output from the correction unit 105B illustrated in FIG. 15A.
  • the correcting unit 105B uses the zero sensitivity (sensitivity in the 0 ° direction in FIG. 16B) formed in the target direction of the signal R1 ( ⁇ ) having bidirectionality as the signal R1 ′ ( ⁇ ) Is also maintained (sensitivity in the 0 ° direction in FIG. 16C). Further, the correction unit 105B calculates the sensitivity (directivity) in the other direction (direction other than the target direction) of the signal R1 ′ ( ⁇ ) to be an intermediate value between the signal R1 ( ⁇ ) and the signal X ( ⁇ ). Process. Thereby, the correcting unit 105B can generate a signal R1 ′ ( ⁇ ) having directivity having a sensitivity blind spot having a narrower angle range than the signal R1 ( ⁇ ) in the target direction.
  • the correction unit 105B is configured to perform calculation processing.
  • the calculation unit 106B is an example of a power spectrum calculation unit, for example, and calculates the power spectrum of each of the first acoustic signal and the second acoustic signal converted into a frequency domain signal.
  • calculation unit 106 includes first power spectrum calculation unit 1061 and second power spectrum calculation unit 1062B.
  • the first power spectrum calculation unit 1061 calculates the power spectrum Px ( ⁇ ) of the signal X ( ⁇ ) that is the output signal of the first time-frequency conversion unit 1041.
  • the first power spectrum calculation unit 1061 calculates the power spectrum Px ( ⁇ ) using the calculation formula shown in (Formula 14).
  • the second power spectrum calculation unit 1062B calculates the power spectrum Pr1 '( ⁇ ) of the signal R1' ( ⁇ ) that is the output signal of the correction unit 105B.
  • the second power spectrum calculation unit 1062B calculates the power spectrum Pr1 ′ ( ⁇ ) using the calculation formula shown in (Formula 15).
  • the calculation unit 106B is configured to calculate a power spectrum.
  • the suppression unit 107B performs noise suppression using the first acoustic signal generated by the first directivity synthesis unit 102 as a main signal and the third acoustic signal generated by the correction unit 105B as a reference signal, An output acoustic signal is generated by narrowing the directivity of the first acoustic signal in the target direction.
  • suppression unit 107B includes noise suppression coefficient calculation unit 108B and noise suppression unit 109B.
  • the noise suppression coefficient calculation unit 108B uses the power spectrum of the first acoustic signal and the third acoustic signal to suppress noise that is noise other than the sound in the target direction included in the first acoustic signal. Calculate the coefficient. For example, the noise suppression coefficient calculation unit 108B uses the power spectrum of the first acoustic signal calculated by the calculation unit 106B as a main signal, and uses the power spectrum of the third acoustic signal calculated by the calculation unit 106B as a reference signal. A noise suppression coefficient is calculated.
  • noise suppression coefficient calculation section 108B uses power spectrum Px ( ⁇ ), which is the output signal of first power spectrum calculation section 1061, as the main signal, and the output signal of second power spectrum calculation section 1062B.
  • a certain power spectrum Pr1 ′ ( ⁇ ) is used as a reference signal, and a noise suppression coefficient H ( ⁇ ) for suppressing noise that is sound other than the target direction is calculated from the power spectrum Px ( ⁇ ) that is the main signal.
  • the noise suppression coefficient calculation unit 108B calculates the noise suppression coefficient H ( ⁇ ) using, for example, a calculation formula shown in (Expression 16). Note that (Expression 16) is an example of a calculation expression for calculating the noise suppression coefficient H ( ⁇ ), and is a calculation expression having the characteristics of a Wiener filter.
  • ⁇ ( ⁇ ) is a weighting factor
  • the calculation method of the weight coefficient ⁇ ( ⁇ ) is disclosed in, for example, the above-mentioned Patent Document 1. That is, first, the spectral ratio Px ( ⁇ ) / Pr1 ′ ( ⁇ ) is calculated. Next, in a situation where ambient noise is dominant over the target sound, in the case of the configuration of the present embodiment, for example, a situation as shown in (Equation 17), using (Equation 18), the spectral ratio Px ( ⁇ ) / The time average of Pr1 ′ ( ⁇ ) is calculated. The calculated time average corresponds to ⁇ ( ⁇ ).
  • the noise suppression coefficient calculation unit 108B only needs to be able to calculate the noise suppression coefficient that suppresses the noise using the power spectra of the first acoustic signal and the third acoustic signal, and thus is not limited to the above-described configuration.
  • the configuration disclosed in Patent Document 3 may be used.
  • description here is abbreviate
  • noise suppression unit 109B applies the noise suppression coefficient calculated by the noise suppression coefficient calculation unit 108B to the first acoustic signal generated by the first directivity synthesis unit 102, thereby suppressing noise and performing the target direction.
  • the output acoustic signal is generated by performing noise suppression that extracts only the sound of the sound.
  • noise suppression unit 109B includes a multiplier 1091 and a frequency-time conversion unit 1092.
  • the multiplier 1091 multiplies the first acoustic signal converted into the frequency domain signal by the noise suppression coefficient calculated by the noise suppression coefficient calculation unit 108B, and suppresses the target acoustic signal in the target direction. Extract only.
  • multiplier 1091 multiplies signal X ( ⁇ ), which is an output signal of first time-frequency conversion section 1041, by noise suppression coefficient H ( ⁇ ) calculated by noise suppression coefficient calculation section 108B.
  • the signal Y ( ⁇ ) X ( ⁇ ) ⁇ H ( ⁇ ) is calculated from the signal X ( ⁇ ) in which noise that is sound other than the target direction is suppressed.
  • the signal Y ( ⁇ ) is a specific example of the target acoustic signal.
  • the frequency-time conversion unit 1092 is an example of an inverse Fourier transform unit, for example, and generates an output acoustic signal by converting the target acoustic signal extracted by the multiplier 1091 into a time domain signal.
  • the frequency-time conversion unit 1092 suppresses noise that is sound other than the target direction, and the signal Y ( ⁇ ) in which the sound in the target direction is emphasized is subjected to time domain acoustic signals by inverse Fourier transform or the like. Convert to y (t).
  • the acoustic signal y (t) is a specific example of the output acoustic signal.
  • these sensitivity blind spots are obtained by using a main signal having a principal axis in the target direction and a reference signal having a sensitivity blind spot in the target direction.
  • a reference signal that can narrow the angle range of the sensitivity blind angle in the target direction.
  • sounds other than the target direction are suppressed by using a plurality of microphone units arranged in a relatively small space on the order of several mm to several cm, and the sound in the target direction is suppressed. Therefore, it is possible to form a reference signal having a narrower angle range of the sensitivity blind angle in the target direction. Then, by performing noise suppression processing using the formed reference signal, it is possible to narrow the target direction.
  • the angle range of the sensitivity blind angle with respect to the target direction of the reference signal can be narrowed, and the reference signal includes a sound near the target direction. Can be made.
  • directivity having a narrower directivity angle can be formed with respect to the target direction, and an acoustic signal having directivity with a narrower directivity angle can be formed with respect to the target direction.
  • FIG. 17 is a diagram illustrating an example of a configuration of a directional microphone device according to the fourth embodiment.
  • the same components as those in FIG. 17 are the same components as those in FIG. 17
  • the directional microphone device 17 is different from the directional microphone device 3 according to Embodiment 3 in the configuration of the noise suppressing unit 209 of the suppressing unit 207.
  • the noise suppression unit 209 shown in FIG. 17 has a multiplier 1091 and a frequency-time conversion unit 1092 deleted from the noise suppression unit 109B shown in FIG. The difference is that a coefficient FIR (Finite Impulse Response) filter unit 2092 is added. Further, along with the change in the configuration, the output destinations of the first directivity synthesis unit 102 and the first time-frequency conversion unit 1041 are changed.
  • FIR Finite Impulse Response
  • the frequency-time conversion unit 2091 is an example of a second conversion unit, for example, and converts a noise suppression coefficient that is a frequency domain coefficient into a filter coefficient of a time domain FIR filter.
  • the frequency-time conversion unit 2091 converts the noise suppression coefficient H ( ⁇ ) calculated by the noise suppression coefficient calculation unit 108B into the coefficient h (t) of the FIR filter in the time domain.
  • the time-varying coefficient FIR filter unit 2092 converts the coefficient of the FIR filter before one unit time (one frame) converted by the frequency-time conversion unit 2091 into the current unit time (current frame) converted by the frequency-time conversion unit 2091. ) Using the coefficients of the FIR filter of (1) and performing filter processing on the first acoustic signal generated by the first directivity synthesis unit 102, thereby generating an output acoustic signal.
  • the time-varying coefficient FIR filter unit 2092 first uses the filter coefficient h (t) calculated by the frequency-time converting unit 2091 according to (Equation 19), for example, to present the current time-varying coefficient FIR filter.
  • the coefficient hw (t) is updated.
  • the coefficient ⁇ is a parameter corresponding to a time constant, and enables control of the sound quality of the output acoustic signal.
  • the noise suppression unit 209 applies noise reduction coefficients calculated by the noise suppression coefficient calculation unit 108B to the first acoustic signal generated by the first directivity synthesis unit 102, thereby reducing noise.
  • An output acoustic signal is generated by performing noise suppression that suppresses and extracts only sound in the target direction.
  • the noise suppression unit 209 further includes a frequency-time conversion unit 2091 and a time-varying coefficient FIR filter unit 2092 so that the noise suppression coefficient is converted into the filter coefficient of the FIR filter and calculated between frames. Since the filter coefficient can be updated in a short time unit, the sound quality of the output acoustic signal can be finely controlled using the convolution operation.
  • FIG. 18 is a diagram illustrating an example of a configuration of a directional microphone device according to the fifth embodiment.
  • FIG. 19 is a diagram illustrating an example of a detailed configuration of the third directivity synthesis unit in the fifth embodiment. Note that the same components as those in FIG. 12 are denoted by the same reference numerals, and description thereof is omitted.
  • the directional microphone device 5 shown in FIG. 18 differs from the directional microphone device 3 (FIG. 12) according to Embodiment 3 in the configuration of the conversion unit 304, the calculation unit 306, and the suppression unit 307, and has a third directivity.
  • a sex synthesis unit 301 is added.
  • the conversion unit 304 shown in FIG. 18 is different from the conversion unit 104 shown in FIG. 12 in that a third time-frequency conversion unit 3043 is added.
  • the calculation unit 306 illustrated in FIG. 18 is different from the calculation unit 106B illustrated in FIG. 12 in that a third power spectrum calculation unit 3063 is added.
  • the suppression unit 307 illustrated in FIG. 18 differs from the suppression unit 107B illustrated in FIG. 12 in the configuration of the noise suppression coefficient calculation unit 308, and a noise suppression unit 310 is added.
  • the third directivity synthesis unit 301 performs arithmetic processing on the output signal of the microphone array 101, thereby having a sensitivity blind spot in the target direction and a fourth directivity pattern different from that of the second acoustic signal. Generate an acoustic signal.
  • the third directivity synthesis unit 301 uses the acoustic signals xb (t) and the acoustic signals xf (t) from the omnidirectional microphone units 101B and 101F, that is, the direction opposite to the target direction, that is, 180.
  • An acoustic signal r2 (t) having a principal axis at 0 ° (also referred to as a directivity signal r2 (t)) is generated.
  • the acoustic signal r2 (t) is a specific example of the fourth acoustic signal.
  • the third directivity synthesis unit 301 includes a first delay unit 3011, a second delay unit 3012, a subtracter 3013, and an EQ 3014, and the first directivity synthesis unit 102
  • a sound pressure gradient type unidirectional pattern having a main axis of directivity in the opposite direction is formed. That is, the third directivity synthesis unit 301 has an input signal opposite to the configuration of the first directivity synthesis unit 102 shown in FIG. 13 and is directed in the opposite direction to the first directivity synthesis unit 102.
  • a sound pressure gradient type unidirectional pattern having a main axis of sexuality is formed. Detailed description is omitted because it is the same as FIG.
  • the conversion unit 304 is an example of a first conversion unit, for example, and the first acoustic signal generated by the first directivity synthesis unit 102 and the second acoustic signal generated by the second directivity synthesis unit 103.
  • the acoustic signal and the fourth acoustic signal generated by the third directivity synthesis unit 301 are converted into a frequency domain signal.
  • the conversion unit 304 includes a first time-frequency conversion unit 1041, a second time-frequency conversion unit 1042, and a third time-frequency conversion unit 3043.
  • the third time-frequency conversion unit 3043 applies the frequency domain signal R2 ( ⁇ ) to the output signal r2 (t) of the third directivity synthesis unit 301 in the same manner as the first time-frequency conversion unit 1041. Is calculated. Note that the first time-frequency conversion unit 1041 and the second time-frequency conversion unit 1042 are the same as those described in Embodiment 3, and thus description thereof is omitted.
  • the calculation unit 306 is an example of a power spectrum calculation unit, for example, and each power spectrum of the first acoustic signal, the third acoustic signal, and the fourth acoustic signal converted into a frequency domain signal by the conversion unit 304. Is calculated.
  • the calculation unit 306 includes a first power spectrum calculation unit 1061, a second power spectrum calculation unit 1062B, and a third power spectrum calculation unit 3063.
  • the third power spectrum calculation unit 3063 calculates the power spectrum Pr2 ( ⁇ ) of the signal R2 ( ⁇ ) that is the output signal of the third time-frequency conversion unit 3043.
  • the third power spectrum calculation unit 3063 calculates the power spectrum Pr2 ( ⁇ ) using the calculation formula shown in (Formula 20).
  • first power spectrum calculation unit 1061 and the second power spectrum calculation unit 1062B are as described in the third embodiment, and thus description thereof is omitted.
  • the noise suppression unit 310 is an example of an opposite direction noise suppression unit, for example, and uses the third acoustic signal generated by the correction unit 105B as a main signal and the fourth directivity generated by the third directivity synthesis unit 301. Using the acoustic signal as a reference signal, the first noise that is a sound in a direction opposite to the target direction included in the third acoustic signal is suppressed. For example, the noise suppression unit 310 suppresses the first noise using the power spectrum of the third acoustic signal as a main signal and the power spectrum of the fourth acoustic signal as a reference signal.
  • noise suppression section 310 uses power spectrum Pr1 ′ ( ⁇ ), which is an output signal of second power spectrum calculation section 1062B, as a main signal, and is an output signal of third power spectrum calculation section 3063.
  • power spectrum Pr2 ( ⁇ ) as a reference signal, noise behind the center of 180 ° from the power spectrum Pr1 ′ ( ⁇ ) as the main signal is suppressed, and the power spectrum Pr1 ′′ ( ⁇ ) as the output signal is calculated. .
  • the noise suppression unit 310 calculates the power spectrum Pr1 ′′ ( ⁇ ), which is an output signal, using the calculation formula shown in (Formula 21).
  • ⁇ ′ ( ⁇ ) is a weighting factor.
  • the weight coefficient ⁇ ′ ( ⁇ ) is calculated using the method disclosed in Patent Document 1 or Patent Document 3 in the same manner as the weight coefficient ⁇ ( ⁇ ) calculated by the noise suppression coefficient calculation unit 308. Detailed description is omitted here.
  • the noise suppression coefficient calculation unit 308 is different from the noise suppression coefficient calculation unit 108B illustrated in FIG. 12 in that the reference signal of the noise suppression coefficient calculation unit 108B is increased. In other words, the noise suppression coefficient calculation unit 308 performs processing that extends the reference signal of the noise suppression coefficient calculation unit 108B to a plurality of channels.
  • the noise suppression coefficient calculation unit 308 uses the first acoustic signal, the fourth acoustic signal, and the output signal of the noise suppression unit 310 to suppress noise that is a sound other than the sound in the target direction including the first noise.
  • the noise suppression coefficient to be calculated is calculated.
  • the noise suppression coefficient calculation unit 308 calculates the noise suppression coefficient using the power spectrum of the first acoustic signal as a main signal and the output signal of the noise suppression unit 310 and the power spectrum of the fourth acoustic signal as a reference signal.
  • the noise suppression coefficient calculation unit 308 uses the output signal Px ( ⁇ ) of the first power spectrum calculation unit 1061 as a main signal, the output signal Pr1 ′′ ( ⁇ ) of the noise suppression unit 310, and the third A power spectrum Pr2 ( ⁇ ) that is an output signal of the power spectrum calculation unit 3063 is used as a reference signal, and a coefficient H ( ⁇ ) that suppresses noise that is sound other than the target direction from the power spectrum Px ( ⁇ ) that is the main signal. calculate.
  • the noise suppression coefficient calculation unit 308 calculates the noise suppression coefficient H ( ⁇ ) using, for example, the calculation formula shown in (Formula 22).
  • (Formula 22) is an example of a calculation formula for calculating the noise suppression coefficient H ( ⁇ ), and is a calculation formula having the characteristics of the Wiener filter.
  • ⁇ 1 ( ⁇ ) and ⁇ 2 ( ⁇ ) are weighting factors.
  • the calculation method of the weight coefficients ⁇ 1 ( ⁇ ) and ⁇ 2 ( ⁇ ) is disclosed in, for example, Patent Document 1 or Patent Document 3 described above, similarly to the weight coefficient ⁇ ( ⁇ ) calculated by the noise suppression coefficient calculation unit 108B. Therefore, detailed description is omitted.
  • Embodiments 3 and 4 it is possible to estimate noise coming from a plurality of directions by configuring so that the reference signal can be calculated for each direction. Thereby, an acoustic signal having directivity having a narrower directivity angle with respect to the target direction can be accurately formed.
  • the directional microphone device has been described based on the embodiment, but the present invention is not limited to this embodiment. Unless it deviates from the gist of the present invention, one or more of the present invention may be applied to various modifications that can be conceived by those skilled in the art, or forms constructed by combining components in different embodiments. It may be included within the scope of the embodiments.
  • FIG. 20 is a diagram illustrating a modification of the configuration of the directional microphone device 3A according to the fifth embodiment.
  • the same reference numerals are used for the same components as those in FIGS.
  • the reference signal is calculated for each direction, and the noise suppression processing is performed by the noise suppression unit 310, so that noise arriving from a plurality of directions can be estimated and filter coefficients calculated between frames can be updated.
  • This can be done in short time units.
  • each of the above devices excluding the microphone are specifically implemented as a computer system including a microprocessor, ROM (Read Only Memory), RAM (Random Access Memory), and the like.
  • a computer program is stored in the RAM.
  • Each device achieves its functions by the microprocessor operating according to the computer program.
  • the computer program is configured by combining a plurality of instruction codes indicating instructions for the computer in order to achieve a predetermined function.
  • a part or all of the constituent elements constituting each of the above-described devices except the microphone may be constituted by a single system LSI (Large Scale Integration).
  • the system LSI is an ultra-multifunctional LSI manufactured by integrating a plurality of components on a single chip, and specifically, a computer system including a microprocessor, ROM, RAM, and the like. .
  • a computer program is stored in the RAM.
  • the system LSI achieves its functions by the microprocessor operating according to the computer program.
  • a part or all of the components constituting each of the above-described devices except for the microphone may be constituted by an IC (Integrated Circuit) card that can be attached to and detached from each device or a single module.
  • the IC card or the module is a computer system including a microprocessor, a ROM, a RAM, and the like.
  • the IC card or module may include the super multifunctional LSI described above.
  • the IC card or the module achieves its function by the microprocessor operating according to the computer program. This IC card or this module may have tamper resistance.
  • An output signal is received from a microphone as an external device, and a first acoustic signal having sensitivity in the target direction and a second acoustic signal having sensitivity blind spot in the target direction may be generated using the received output signal. .
  • a first directivity synthesis unit that generates a first acoustic signal having sensitivity in a target direction
  • a second directivity synthesis unit that generates a second acoustic signal having a sensitivity blind spot in the target direction
  • the first acoustic signal generated by the first directivity synthesis unit and the second directivity synthesis unit By multiplying the second acoustic signal generated in step N by N times (N> 0) in the frequency domain, thereby reducing the angular range of the sensitivity dead angle in the target direction from that of the second acoustic signal.
  • Noise suppression using a correction unit that generates a signal and the first acoustic signal generated by the first directivity synthesis unit as a main signal and the third acoustic signal generated by the correction unit as a reference signal To narrow the directivity of the first acoustic signal in the target direction. It may comprise a suppressor that generates an output sound signal.
  • the present invention may be the method described above. Moreover, the computer program which implement
  • this program generates a first directivity synthesis step for generating a first acoustic signal having sensitivity in a target direction and a second acoustic signal for generating a second acoustic signal having sensitivity dead angle in the target direction.
  • the directivity synthesis step, the first acoustic signal generated in the first directivity synthesis step, and the second acoustic signal generated in the second directivity synthesis step By multiplying the first acoustic signal generated in the first directivity synthesis step N times (N> 0) in the frequency domain, the angular range of the sensitivity blind angle in the target direction is determined from the second acoustic signal.
  • the correction step for generating the narrowed third acoustic signal and the first acoustic signal generated in the first directivity synthesis step as a main signal are generated in the correction step.
  • Performing a suppression step of generating an output acoustic signal in which the directivity in the target direction of the first acoustic signal is narrowed by performing noise suppression using the third acoustic signal thus generated as a reference signal It is good also as a program for.
  • the present invention also relates to a computer-readable recording medium such as a flexible disk, a hard disk, a CD-ROM (Compact Read Only Memory), an MO (Magneto-Optical disc), a DVD (Digital Versatile Disc). ), DVD-ROM, DVD-RAM, BD (Blu-ray (registered trademark) Disc), semiconductor memory, or the like.
  • a computer-readable recording medium such as a flexible disk, a hard disk, a CD-ROM (Compact Read Only Memory), an MO (Magneto-Optical disc), a DVD (Digital Versatile Disc). ), DVD-ROM, DVD-RAM, BD (Blu-ray (registered trademark) Disc), semiconductor memory, or the like.
  • the digital signal currently recorded on these recording media may be sufficient.
  • the present invention may also be a computer program or digital signal transmitted via an electric communication line, a wireless or wired communication line, a network represented by the Internet, data broadcasting, or the like.
  • the present invention may also
  • the memory stores a computer program, and the microprocessor may operate according to the computer program. Further, the program or digital signal may be recorded on a recording medium and transferred, or the program or digital signal may be transferred via a network or the like, and may be implemented by another independent computer system.
  • a plurality of directional signals have been generated using a microphone array and a plurality of directional synthesis units. Instead, the outputs of a plurality of directional microphones arranged in close proximity are used. May be.
  • the present invention can be used for a directional microphone device, an acoustic signal processing method, and a program.
  • the present invention can be used for a directional microphone device, an acoustic signal processing method, and a program that are applied to applications such as an application installed in a portable terminal that collects sound of a direction.
  • Second microphone 101 Microphone array 101L, 101R, 101F, 101B Omnidirectional microphone unit 102
  • First directivity synthesis unit 103 Second directivity synthesis unit 104, 304 Conversion unit 105, 105A, 105B, 105C Correction unit 106, 106A, 106B, 306 Calculation unit 107, 107A, 107B, 207, 307 Suppression unit 108, 108A, 108B Noise suppression coefficient Calculation unit 109, 109A Noise suppression processing unit 109B, 209, 310
  • Noise suppression unit 110 First coefficient multiplication unit 111 First subtraction unit 200 Beam width control unit 301
  • Noise suppression coefficient calculation unit 901 First microphone unit 902
  • Two microphone units 910 Determination unit 920
  • Adaptive filter unit 930 Signal subtraction unit 940
  • Noise suppression filter coefficient calculation unit 950 Time-varying coefficient filter unit 1021, 3011 First delay unit 1022, 3012 Second delay unit 1023, 1031, 30

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Otolaryngology (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)

Abstract

 本開示の指向性マイクロホン装置等は、目的方向に感度を有する第1の音響信号を生成するマイクロホン(11)と、目的方向に感度死角を有する第2の音響信号を生成するマイクロホン(12)と、マイクロホン(12)で生成された第2の音響信号に対して、マイクロホン(11)で生成された前記第1の音響信号と、前記第2の指向性合成部で生成された前記第2の音響信号とをN回(N>0)周波数領域で乗算することによって、目的方向の感度死角の角度範囲を第2の音響信号より狭くした第3の音響信号を生成する補正部(105)と、マイクロホン(11)で生成された第1の音響信号を主信号とし、補正部(105)で生成された第3の音響信号を参照信号として雑音抑圧を行うことで、第1の音響信号の目的方向の指向性を狭角化した出力音響信号を生成する抑圧部(107)とを備える。

Description

指向性マイクロホン装置、音響信号処理方法およびプログラム
 本発明は、指向性マイクロホン装置、音響信号処理方法およびプログラムに関する。
 指向性マイクロホン装置として、目的方向に指向性の主軸を有する主信号と、目的方向に理想上ゼロ感度を持ち一定の角度範囲の感度死角を有する参照信号と、を用いて主信号に含まれる目的方向以外の音を抑圧するものが提案されている(例えば、特許文献1)。
特許第4286637号公報 特開2004-187283号公報 国際公開第12/014451号
 しかしながら、上記特許文献1などに開示される従来構成では、目的方向に対し、十分に狭い指向角を有する指向性を形成することができない。そのため、目的方向以外(真正面以外)の音(目的音以外の音)も収音してしまうという問題がある。
 本発明は、上記の問題点に着目したものであり、目的方向に対し、より狭い指向角を有する指向性を形成することができる指向性マイクロホン装置、音響信号処理方法およびプログラムを提供することを目的とする。
 上記目的を達成するために、本発明の一形態に係る指向性マイクロホン装置は、目的方向に感度を有する第1の音響信号を生成する第1の指向性合成部と、前記目的方向に感度死角を有する第2の音響信号を生成する第2の指向性合成部と、前記第2の指向性合成部で生成された前記第2の音響信号に対して、前記第1の指向性合成部で生成された前記第1の音響信号をN回(N>0)周波数領域で乗算することによって、前記目的方向の感度死角の角度範囲を前記第2の音響信号より狭くした第3の音響信号を生成する補正部と、前記第1の指向性合成部で生成された前記第1の音響信号を主信号とし、前記補正部で生成された前記第3の音響信号を参照信号として雑音抑圧を行うことで、前記第1の音響信号の前記目的方向の指向性を狭角化した出力音響信号を生成する抑圧部とを備える。
 なお、これらの全般的または具体的な態様は、システム、方法、集積回路、コンピュータプログラムまたはコンピュータで読み取り可能なCD-ROMなどの記録媒体で実現されてもよく、システム、方法、集積回路、コンピュータプログラムおよび記録媒体の任意な組み合わせで実現されてもよい。
 本発明の指向性マイクロホン装置等は、目的方向に対し、より狭い指向角を有する指向性を形成することができる。
図1は、実施の形態1における指向性マイクロホン装置の構成の一例を示す図である。 図2は、実施の形態1における補正部の詳細構成の一例を示す図である。 図3は、実施の形態1における抑圧部の詳細構成の一例を示す図である。 図4Aは、実施の形態1における第1のマイクロホンの指向性パターンを示す特性図である。 図4Bは、実施の形態1における第2のマイクロホンの指向性パターンを示す特性図である。 図5Aは、実施の形態1におけるN=0である場合の主信号パワースペクトルPx(ω)および第3の参照信号パワースペクトルPr3(ω)の指向性パターンの関係を示す特性図である。 図5Bは、実施の形態1におけるN=0である場合の推定目的音パワースペクトルPs(ω)の指向性パターンを示す特性図である。 図6Aは、実施の形態1におけるN=1である場合の主信号パワースペクトルPx(ω)および第3の参照信号パワースペクトルPr3(ω)の指向性パターンの関係を示す特性図である。 図6Bは、実施の形態1におけるN=1である場合の推定目的音パワースペクトルPs(ω)の指向性パターンを示す特性図である。 図7Aは、実施の形態1におけるN=3である場合の主信号パワースペクトルPx(ω)および第3の参照信号パワースペクトルPr3(ω)の指向性パターンの関係を示す特性図である。 図7Bは、実施の形態1におけるN=3である場合の推定目的音パワースペクトルPs(ω)の指向性パターンを示す特性図である。 図8Aは、実施の形態1におけるN=7である場合の主信号パワースペクトルPx(ω)および第3の参照信号パワースペクトルPr3(ω)の指向性パターンの関係を示す特性図である。 図8Bは、実施の形態1におけるN=7である場合の推定目的音パワースペクトルPs(ω)の指向性パターンを示す特性図である。 図9は、実施の形態1の変形例における指向性マイクロホン装置の構成を示す図である。 図10は、実施の形態1の変形例における抑圧部の詳細構成の一例を示す図である。 図11は、実施の形態2における指向性マイクロホン装置の構成の一例を示す図である。 図12は、実施の形態3における指向性マイクロホン装置の構成の一例を示す図である。 図13は、実施の形態3における第1の指向性合成部の詳細構成の一例を示す図である。 図14は、実施の形態3における第2の指向性合成部の詳細構成の一例を示す図である。 図15Aは、実施の形態3における補正部の機能構成の一例を示す図である。 図15Bは、実施の形態3における補正部の機能構成の一例を示す図である。 図16は、実施の形態3における補正部の入力信号および出力信号の指向性パターンを示す図である。 図17は、実施の形態4における指向性マイクロホン装置の構成の一例を示す図である。 図18は、実施の形態4における指向性マイクロホン装置の構成の一例を示す図である。 図19は、実施の形態4における第3の指向性合成部の詳細構成の一例を示す図である。 図20は、実施の形態4における指向性マイクロホン装置の構成の変形例を示す図である。 図21は、従来の指向性マイクロホン装置の構成の一例を示す図である。
 (本発明の基礎となった知見)
 まず、特許文献1に開示された、目的方向以外の音を抑圧できる従来の指向性マイクロホン装置について説明する。ここで、目的音方向とはマイクロホン装置が持つ指向特性の指向性主軸を指す。
 図21は、従来の指向性マイクロホン装置の構成の一例を示す図である。
 図21に示す指向性マイクロホン装置は、第1のマイクロホンユニット901と、第2のマイクロホンユニット902と、判定部910と、適応フィルタ部920と、信号減算部930と、雑音抑圧フィルタ係数算出部940と、時変係数フィルタ部950とを備える。
 図21に示す指向性マイクロホン装置は、まず、第1のマイクロホンユニット901から出力された目的方向に指向性の主軸を有する音圧傾度型の主信号と、第2のマイクロホンユニット902から出力された目的方向に感度死角を有する音圧傾度型の参照信号とをそれぞれ周波数分析する。次に、雑音抑圧フィルタ係数算出部940は、主信号と参照信号のそれぞれのパワースペクトルを基に主信号に含まれる目的方向以外の音のパワースペクトルを推定し、この推定したパワースペクトルを基に目的方向以外の音を抑圧するフィルタ係数を算出する。そして、時変係数フィルタ部950は、主信号に対してフィルタ処理を行うことで目的方向以外の音を抑圧し、目的方向の音を強調する。
 しかしながら、上記従来構成では、参照信号に音圧傾度型の指向性合成法を用いており、目的方向に対する感度死角を十分に狭く形成する(角度範囲を十分に狭く形成する)のが難しい。換言すると、上記従来構成では、抑圧したい目的方向近傍の音が参照信号に含まれないので、雑音抑圧フィルタ係数算出部940は、目的音近傍の音を抑圧する係数を算出できない。
 つまり、上記特許文献1などに開示される従来構成では、目的方向に対し、十分に狭い指向角を有する指向性を形成することができない。そのため、目的方向以外(真正面以外)の音(目的音以外の音)も収音してしまうという問題がある。
 また、例えば、特許文献2には、目的音方向の音を強調する技術が開示されている。特許文献2に開示される指向性マイクロホン装置では、目的音方向に感度を有する第1の指向性マイクロホンからの出力信号を主信号とし、目的音方向に感度死角を有する第2の指向性マイクロホンからの出力信号を参照信号として、第1と第2の指向性マイクロホンからの主信号および参照信号のパワースペクトルを用いて目的音方向以外の方向の音を抑圧するフィルタ係数を算出し、主信号に対してフィルタ処理を行うことで、目的音方向の音を強調する。
 しかしながら、特許文献2に開示される構成では、主信号に用いている指向性マイクロホンの指向性パターンと参照信号に用いている指向性マイクロホンの指向性パターンとの関係において、参照信号は目的音方向に対して感度死角を有し、目的音の信号成分を含まず参照信号としての条件を満たすが、目的音方向以外の指向性パターンに関しては、主信号と参照信号との間で一致しない。ここで、指向性パターンは、マイクロホンの音圧感度対音波到来方向の特性を示す。そして、主信号と参照信号との間で指向性パターンが一致しないことが原因で、目的音方向以外に複数方向に雑音源が存在するときに、雑音源方向に応じ適応的に最適な抑圧係数を推定する必要があった。それにより、参照信号から主信号に混入する抑圧すべき信号成分の推定精度などが性能限界の要因となっていた。
 そこで、本発明の一態様は、上記の問題点に着目したものであり、目的方向に対し、より狭い指向角を有する指向性を形成することができる指向性マイクロホン装置、音響信号処理方法および音響処理プログラムを提供することを目的とする。
 このような問題を解決するため、本発明の一態様に係る指向性マイクロホン装置は、目的方向に感度を有する第1の音響信号を生成する第1の指向性合成部と、前記目的方向に感度死角を有する第2の音響信号を生成する第2の指向性合成部と、前記第2の指向性合成部で生成された前記第2の音響信号に対して、前記第1の指向性合成部で生成された前記第1の音響信号をN回(N>0)周波数領域で乗算することによって、前記目的方向の感度死角の角度範囲を前記第2の音響信号より狭くした第3の音響信号を生成する補正部と、前記第1の指向性合成部で生成された前記第1の音響信号を主信号とし、前記補正部で生成された前記第3の音響信号を参照信号として雑音抑圧を行うことで、前記第1の音響信号の前記目的方向の指向性を狭角化した出力音響信号を生成する抑圧部とを備える。
 これにより、目的方向に対し、より狭い指向角を有する指向性を形成することができる指向性マイクロホン装置を実現することができる。
 具体的には、本態様の指向性マイクロホン装置によれば、参照信号の目的方向に対する感度死角の角度範囲をより狭くすることができ、参照信号に目的方向近傍の音を含ませることができる。それにより、目的方向に対し、より狭い指向角を有する指向性を形成することができる。また、本態様の指向性マイクロホン装置によれば、高精度に雑音成分の推定を行うことができるよう参照信号を補正することができるので、指向性を鋭角化できるだけでなく高音質化も可能となる。
 また、例えば、前記第1の指向性合成部および前記第2の指向性合成部は、複数のマイクロホンから構成されるマイクロホンアレイの出力信号を演算処理することで、前記第1の音響信号および前記第2の音響信号を生成するとしてもよい。
 また、例えば、さらに、前記第1の指向性合成部で生成された前記第1の音響信号と、前記第2の指向性合成部で生成された前記第2の音響信号とを周波数領域の信号に変換する第1の変換部を備え、前記補正部は、前記第1の変換部で周波数領域の信号に変換された前記第2の音響信号に対して前記第1の変換部で周波数領域の信号に変換された前記第1の音響信号をN回(N>0)乗算することにより、前記第3の音響信号を生成するとしてもよい。
 また、例えば、前記Nは、1であり、前記補正部は、周波数領域の信号に変換された前記第2の音響信号と周波数領域の信号に変換された前記第1の音響信号とを複素乗算するスペクトル乗算部と、前記スペクトル乗算部の出力信号の絶対値を算出する絶対値演算部と、前記絶対値演算部により算出された前記絶対値の平方根を算出することにより、前記第3の音響信号を生成する平方根算出部と、を有するとしてもよい。
 また、例えば、前記Nは、1であり、前記補正部は、周波数領域の信号に変換された前記第1の音響信号の第1の絶対値および周波数領域の信号に変換された前記第2の音響信号の第2の絶対値を算出する絶対値演算部と、前記絶対値演算部で算出された前記第1の絶対値と前記第2の絶対値との乗算を行う乗算部と、前記乗算部により行われた乗算値の平方根を算出することにより、前記第3の音響信号を生成する平方根算出部と、を有するとしてもよい。
 また、例えば、前記抑圧部は、前記第1の音響信号と前記第3の音響信号とのパワースペクトルを用いて、前記第1の音響信号に含まれる前記目的方向の音以外の音である雑音を抑圧する雑音抑圧係数を算出する雑音抑圧係数算出部と、前記第1の指向性合成部で生成された前記第1の音響信号に前記雑音抑圧係数算出部で算出された前記雑音抑圧係数を適用し、前記雑音を抑圧して前記目的方向の音のみを抽出することにより前記雑音抑圧を行うことで、前記出力音響信号を生成する雑音抑圧部と、を備えるとしてもよい。
 また、例えば、さらに、周波数領域の信号に変換されている前記第1の音響信号および前記第3の音響信号のそれぞれのパワースペクトルを算出するパワースペクトル算出部を備え、前記抑圧部は、前記第1の音響信号または前記第1の変換部で周波数領域の信号に変換された前記第1の音響信号と、前記パワースペクトル算出部で算出された前記第1の音響信号のパワースペクトルとを主信号とし、前記パワースペクトル算出部で算出された前記第3の音響信号のパワースペクトルを参照信号として前記雑音抑圧を行うことで、前記出力音響信号を生成するとしてもよい。
 また、例えば、前記パワースペクトル算出部は、前記補正部で生成された前記第3の音響信号の絶対値に対して(2/(N+1))乗の演算をすることにより、前記第3の音響信号のパワースペクトルを算出するとしてもよい。
 また、例えば、前記抑圧部は、前記第3の音響信号のパワースペクトルに所定の係数を乗算して出力する第1の係数乗算部と、前記第1の音響信号のパワースペクトルから前記第1の係数乗算部からの出力信号を減算する第1の減算部と、前記第1の音響信号のパワースペクトルと前記第1の減算部からの出力信号とを入力として、前記第1の音響信号に含まれる前記目的方向の音以外の音である雑音を抑圧する雑音抑圧係数を算出する雑音抑圧係数算出部と、前記第1の音響信号または前記第1の変換部で周波数領域の信号に変換された前記第1の音響信号と前記雑音抑圧係数算出部で算出された前記雑音抑圧係数とを入力として前記雑音抑圧を行うことで、前記出力音響信号を生成する雑音抑圧処理部とを備えるとしてもよい。
 また、例えば、さらに、前記補正部における乗算回数である前記Nと、前記パワースペクトル算出部における(2/(N+1))乗のN値を変化させることで前記指向性マイクロホン装置の指向性を制御するビーム幅制御部を備えるとしてもよい。
 また、例えば、前記Nは、ゼロより大きい実数であるとしてもよい。
 また、例えば、さらに、周波数領域の信号に変換された、前記第1の音響信号および前記第3の音響信号のそれぞれのパワースペクトルを算出するパワースペクトル算出部を備え、前記雑音抑圧係数算出部は、前記パワースペクトル算出部で算出された前記第1の音響信号のパワースペクトルを主信号とし、前記パワースペクトル算出部で算出された前記第3の音響信号のパワースペクトルを参照信号として、前記雑音抑圧係数を算出するとしてもよい。
 また、例えば、前記指向性マイクロホン装置は、さらに、前記目的方向に感度死角を有し、かつ、前記第2の音響信号とは異なる指向性パターンを有する第4の音響信号を生成する第3の指向性合成部を備え、前記抑圧部は、さらに、前記補正部で生成された前記第3の音響信号を主信号とし、前記第3の指向性合成部で生成された前記第4の音響信号を参照信号として、前記第3の音響信号に含まれる前記目的方向に対して正反対の方向の音である第1の雑音を抑圧する反対方向雑音抑圧部と、前記第1の音響信号と前記第4の音響信号と前記反対方向雑音抑圧部の出力信号とを用いて、前記第1の雑音を含む前記目的方向の音以外の音である雑音を抑圧する雑音抑圧係数を算出する雑音抑圧係数算出部と、前記第1の指向性合成部で生成された前記第1の音響信号に前記雑音抑圧係数算出部で算出された前記雑音抑圧係数を適用し、前記雑音を抑圧して前記目的方向の音のみを抽出することにより前記雑音抑圧を行うことで、前記出力音響信号を生成する雑音抑圧部とを備えるとしてもよい。
 また、例えば、さらに、前記第1の指向性合成部で生成された前記第1の音響信号と、前記第2の指向性合成部で生成された前記第2の音響信号と、前記第3の指向性合成部で生成された前記第4の音響信号とを周波数領域の信号に変換する第1の変換部と、前記第1の変換部で周波数領域の信号に変換された前記第1の音響信号と前記第3の音響信号と前記第4の音響信号とのそれぞれのパワースペクトルを算出するパワースペクトル算出部を備え、前記反対方向雑音抑圧部は、前記第3の音響信号のパワースペクトルを主信号とし、前記第4の音響信号のパワースペクトルを参照信号として、前記第1の雑音を抑圧するとしてもよい。
 また、例えば、前記雑音抑圧係数算出部は、前記第1の音響信号のパワースペクトルを主信号とし、前記反対方向雑音抑圧部の出力信号及び前記第4の音響信号のパワースペクトルを参照信号として、前記雑音抑圧係数を算出するとしてもよい。
 また、例えば、前記雑音抑圧部は、周波数領域の信号に変換された前記第1の音響信号と、前記雑音抑圧係数算出部で算出された前記雑音抑圧係数との乗算を行い、前記雑音を抑圧した前記目的方向の目的音響信号のみを抽出する乗算器と、前記乗算器で抽出された前記目的音響信号を時間領域の信号に変換することで、前記出力音響信号を生成する逆フーリエ変換部と、を有するとしてもよい。
 また、例えば、前記雑音抑圧部は、周波数領域の係数である前記雑音抑圧係数を時間領域のFIRフィルタの係数に変換する第2の変換部と、前記第2の変換部で変換された1単位時間前のFIRフィルタの係数を、前記第2の変換部で変換された現単位時間のFIRフィルタの係数を用いて更新し、前記第1の指向性合成部で生成された前記第1の音響信号にフィルタ処理を行うことにより、前記出力音響信号を生成する時変係数FIRフィルタ部と、を有するとしてもよい。
 また、このような問題を解決するため、本発明の一態様に係る音響信号処理方法は、目的方向に感度を有する第1の音響信号を生成する第1の指向性合成ステップと、前記目的方向に感度死角を有する第2の音響信号を生成する第2の指向性合成ステップと、前記第2の指向性合成ステップにおいて生成された前記第2の音響信号に対して、前記第1の指向性合成ステップにおいて生成された前記第1の音響信号をN回(N>0)周波数領域で乗算することによって、前記目的方向の感度死角の角度範囲を前記第2の音響信号より狭くした第3の音響信号を生成する補正ステップと、前記第1の指向性合成ステップにおいて生成された前記第1の音響信号を主信号とし、前記補正ステップにおいて生成された前記第3の音響信号を参照信号として雑音抑圧を行うことで、前記第1の音響信号の前記目的方向の指向性を狭角化した出力音響信号を生成する抑圧ステップとを含む。
 なお、これらの全般的または具体的な態様は、システム、方法、集積回路、コンピュータプログラムまたはコンピュータで読み取り可能なCD-ROMなどの記録媒体で実現されてもよく、システム、方法、集積回路、コンピュータプログラムおよび記録媒体の任意な組み合わせで実現されてもよい。
 以下、本発明の一態様に係る指向性マイクロホン装置等について、図面を参照しながら具体的に説明する。
 なお、以下で説明する実施の形態は、いずれも本発明の一具体例を示すものである。以下の実施の形態で示される数値、形状、材料、構成要素、構成要素の配置位置及び接続形態、ステップ、ステップの順序などは、一例であり、本発明を限定する主旨ではない。また、以下の実施の形態における構成要素のうち、最上位概念を示す独立請求項に記載されていない構成要素については、任意の構成要素として説明される。
 (実施の形態1)
 図1は、実施の形態1における指向性マイクロホン装置の構成の一例を示す図である。図1に示す指向性マイクロホン装置1は、第1のマイクロホン11と、第2のマイクロホン12と、変換部104と、補正部105と、算出部106と、抑圧部107とを有する。
 第1のマイクロホン11は、例えば第1の指向性合成部の一例であり、目的方向に感度を有する第1の音響信号を生成する。本実施の形態では、第1のマイクロホン11は、目的音方向に感度を有する感度特性を持ち、音波を電気信号に変換し出力信号として主信号x(t)を出力する。ここで、目的方向に感度を有するとは、感度特性において、目的方向にピーク感度を持つことをいう。なお、第1のマイクロホン11は、単数または複数のマイクロホン(マイクロホンアレイ)からなり、マイクロホンアレイの出力信号を演算処理することで、目的方向に感度を有する第1の音響信号(主信号x(t))を生成する第1の指向性合成部を備えるとしてもよい。
 第2のマイクロホン12は、例えば第2の指向性合成部の一例であり、目的方向に感度死角を有する第2の音響信号を生成する。本実施の形態では、第2のマイクロホン12は、目的音方向に感度死角を有する感度特性を持ち、音波を電気信号に変換し出力信号として参照信号r1(t)を出力する。なお、第2のマイクロホン12は、単数または複数のマイクロホン(マイクロホンアレイ)からなり、マイクロホンアレイの出力信号を演算処理することで、目的方向に感度死角を有する第2の音響信号(参照信号r1(t))を生成する第2の指向性合成部を備えるとしてもよい。
 変換部104は、例えば、第1の変換部の一例であり、第1のマイクロホン11で生成された第1の音響信号(主信号x(t))と、第2のマイクロホン12で生成された第2の音響信号(参照信号r1(t))を周波数領域の信号に変換する。
 本実施の形態では、図1に示すように、変換部104は、第1の時間-周波数変換部1041と、第2の時間-周波数変換部1042とを備える。第1の時間-周波数変換部1041は、第1のマイクロホン11からの主信号x(t)を入力として時間領域から周波数領域に信号を変換し主信号スペクトルX(ω)を出力する。第2の時間-周波数変換部1042は、第2のマイクロホン12からの参照信号r1(t)を入力として時間領域から周波数領域に信号を変換し第1の参照信号スペクトルR1(ω)を出力する。
 補正部105は、第2のマイクロホン12で生成された第2の音響信号に対して、第1のマイクロホン11で生成された第1の音響信号をN回(N>0)周波数領域で乗算することによって、上記目的方向の感度死角の角度範囲を第2の音響信号より狭くした第3の音響信号を生成する。より具体的には、補正部105は、変換部104で周波数領域の信号に変換された第2の音響信号(R1(ω))に対して変換部104で周波数領域の信号に変換された第1の音響信号(X(ω))をN回(N>0)乗算することにより、第3の音響信号を生成する。
 本実施の形態では、補正部105は、第1の時間-周波数変換部1041からの主信号スペクトルX(ω)と第2の時間-周波数変換部1042からの第1の参照信号スペクトルR1(ω)を入力として、補正された第2の参照信号スペクトルR2(ω)を出力する。
 以下、図2を用いて補正部105の詳細構成の一例について説明する。ここで、図2は、実施の形態1における補正部の詳細構成の一例を示す図である。
 例えば、図2に示すように、補正部105は、演算部1050と、スペクトル乗算部1051とを備え、(式1)に示す算出式を実行する。
 R2(ω)=R1(ω)・X(ω)^N   (式1)
 つまり、スペクトル乗算部1051は、周波数領域の信号に変換された第2の音響信号(R1(ω))に対して、周波数領域の信号に変換された第1の音響信号(X(ω))をN回(N>0)乗算したものを複素乗算する。
 算出部106は、例えば、パワースペクトル算出部の一例であり、周波数領域の信号に変換されている第1の音響信号および第3の音響信号のそれぞれのパワースペクトルを算出する。算出部106は、補正部105で生成された第3の音響信号(R2(ω))の絶対値に対して(2/(N+1))乗の演算をすることにより、第3の音響信号のパワースペクトル(Pr2(ω))を算出する。
 本実施の形態では、図1に示すように、算出部106は、第1のパワースペクトル算出部1061と第2のパワースペクトル算出部1062とを備える。第1のパワースペクトル算出部1061は、第1の時間-周波数変換部1041からの主信号スペクトルX(ω)が入力され、主信号パワースペクトルPx(ω)を出力する。第2のパワースペクトル算出部1062は、補正部105からの第2の参照信号スペクトルR2(ω)が入力され、第2の参照信号パワースペクトルPr2(ω)を出力する。
 抑圧部107は、第1のマイクロホン11で生成された第1の音響信号を主信号とし、補正部105で生成された第3の音響信号を参照信号として雑音抑圧を行うことで、第1の音響信号の目的方向の指向性を狭角化した出力音響信号を生成する。より具体的には、抑圧部107は、変換部104で周波数領域の信号に変換された第1の音響信号(X(ω))と、算出部106で算出された第1の音響信号のパワースペクトル(Px(ω))とを主信号とし、算出部106で算出された第3の音響信号のパワースペクトル(Pr2(ω))を参照信号として雑音抑圧を行うことで、出力音響信号を生成する。
 本実施の形態では、抑圧部107は、第1の時間-周波数変換部1041からの主信号スペクトルX(ω)と、第1のパワースペクトル算出部1061からの主信号パワースペクトルPx(ω)と、第2のパワースペクトル算出部1062からの第2の参照信号パワースペクトルPr2(ω)が入力され、指向性マイクロホン装置1の出力y(t)を出力する。
 以下、図3を用いて抑圧部107の詳細構成の一例について説明する。ここで、図3は、実施の形態1における雑音抑圧部の詳細構成の一例を示す図である。
 抑圧部107は、図3に示すように、第1の係数乗算部110と、第1の減算部111と、雑音抑圧係数算出部108と、雑音抑圧処理部109とを備える。
 第1の係数乗算部110は、第3の音響信号のパワースペクトル(Pr2(ω))に所定の係数(係数C(ω))を乗算して出力する。具体的には、第1の係数乗算部110は、第2のパワースペクトル算出部1062からの第2の参照信号パワースペクトルPr2(ω)が入力され、係数C(ω)を乗算して第3の参照信号パワースペクトルPr3(ω)を出力する。ここで、所定の係数すなわち係数C(ω)は、予め定められた定数でもよいし、時系列や所定のタイミングで変動する変数でもよい。
 第1の減算部111は、第1の音響信号のパワースペクトル(Px(ω))から第1の係数乗算部110の出力信号(Pr3(ω))を減算する。具体的には、第1の減算部111は、第1のパワースペクトル算出部1061からの主信号パワースペクトルPx(ω)から第1の係数乗算部110からの第3の参照信号パワースペクトルPr3(ω)を減算して、推定目的音パワースペクトルPs(ω)を出力する。
 雑音抑圧係数算出部108は、第1の音響信号のパワースペクトル(Px(ω))と第1の減算部111の出力信号(Ps(ω))とを入力として、第1の音響信号に含まれる目的方向の音以外の音である雑音を抑圧する雑音抑圧係数(H(ω))を算出する。具体的には、雑音抑圧係数算出部108は、第1のパワースペクトル算出部1061からの主信号パワースペクトルPx(ω)と第1の減算部111からの推定目的音パワースペクトルPs(ω)が入力され、雑音抑圧係数H(ω)を出力する。
 雑音抑圧処理部109は、変換部104で周波数領域の信号に変換された第1の音響信号(X(ω))と雑音抑圧係数算出部108で算出された雑音抑圧係数(H(ω))とが入力され、それらを用いて雑音抑圧処理を行うことで出力音響信号(y(t))を生成する。具体的には、雑音抑圧処理部109は、第1の時間-周波数変換部1041からの主信号スペクトルX(ω)と雑音抑圧係数算出部108からの雑音抑圧係数H(ω)を入力として、雑音である目的音方向以外の信号成分を抑圧し、指向性主軸方向にある目的音を抽出して出力y(t)を出力する。
 以上のように構成された指向性マイクロホン装置1の動作について説明する。
 ここで、目的音方向とは、指向性マイクロホン装置が形成する指向性の主軸方向(正面方向)であるとして以下の説明を行う。また、時間領域信号をx(t)など(t)を付け、周波数領域信号にはX(ω)など(ω)を付ける。また、指向性の説明に関して、X(ω)の指向性パターンとは、信号Xの周波数ωにおける音波到来方向θ対音圧感度特性を表し、指向性パターンの図は、ポーラパタンの書式で図示する。
 図4Aは実施の形態1における第1のマイクロホンの指向性パターンを示す特性図であり、図4Bは実施の形態1における第2のマイクロホンの指向性パターンを示す特性図である。
 第1のマイクロホン11は、目的音方向に感度を有する指向特性を有し、例えば、図4Aに示す指向性パターン(指向特性図)を有する。図4Aに示す指向性パターンは、一般に正面方向の音を収音するために用いられる1次音圧傾度型の単一指向性を示している。図1に示す指向性マイクロホン装置1では、第1のマイクロホン11からの出力信号x(t)を主信号として、後段の処理によって、指向性をさらに鋭くし(狭角化し)、音の選択性を高める。後段の処理とは主信号x(t)と参照信号r1(t)から生成されるパワースペクトルに基づく雑音抑圧の処理である。
 第2のマイクロホン12は、目的音方向に感度死角を有する指向特性を有し、例えば、図4Bに示す指向性パターンを有する。図4Bに示す指向性パターンは、目的音方向である正面に感度死角を持つ1次音圧傾度型の双指向性を示している。指向性マイクロホン装置1では、第2のマイクロホン12からの出力信号r1(t)を参照信号として用いることで主信号の指向性に対して鋭角化処理を行う。ここで、指向性パターンの図における周波数は1kHzとして計算しているが、第1のマイクロホン11と第2のマイクロホン12の指向性パターンに対する上記の条件を満たしていれば特に特定の周波数に限らない。
 第1の時間-周波数変換部1041および第2の時間-周波数変換部1042は、例えばFFT演算やフィルタバンクなどの演算を用いて、主信号x(t)と参照信号r1(t)とをそれぞれ周波数スペクトル信号に変換し、主信号スペクトルX(ω)、第1の参照信号スペクトルR1(ω)を出力する。
 第1のパワースペクトル算出部1061は、主信号スペクトルX(ω)に対して、周波数成分毎に次の演算を行い、主信号パワースペクトルPx(ω)を出力する。
 Px(ω)=|X(ω)|^2   (式2)
 補正部105は、第1の時間-周波数変換部1041からの主信号スペクトルX(ω)と第2の時間-周波数変換部1042からの第1の参照信号スペクトルR1(ω)とが入力される。補正部105は、指向性パターンを理想的な形状に近づけるために、参照信号スペクトルR1(ω)に対して周波数ω毎に(式3)に示す補正を行って、第2の参照信号スペクトルR2(ω)を出力する。補正の内容の詳細については後述する。
 R2(ω)=R1(ω)・X(ω)^N   (式3)
 (式3)は、第1の参照信号スペクトルR1(ω)に複数N回主信号スペクトルX(ω)を乗算することを示している。ただし、N>0つまりNはゼロより大きい実数である。
 第2のパワースペクトル算出部1062は、補正部105によって補正された第2の参照信号スペクトルR2(ω)の次元数をパワのオーダーに変換する。具体的には、補正部105では、スペクトルがN+1回乗算されていることから、(式4)に示す演算によって次元をパワ(2乗)のオーダーに変換し、参照信号パワースペクトルPr2(ω)を出力する。
 Pr2(ω)=|R2(ω)|^(2/(N+1))   (式4)
 抑圧部107は、主信号パワースペクトルPx(ω)と第2の参照信号パワースペクトルPr2(ω)とを基に、主信号から目的音方向以外の信号成分を抑圧することで指向性が主軸方向にある目的音を抽出した出力y(t)を出力する。より具体的には、例えば図3に示すように、第1の係数乗算部110は、(式5)に示すように、第2の参照信号パワースペクトルPr2(ω)をC(ω)倍(係数倍)に乗算することでレベル調整したPr3(ω)を出力する。第1の減算部111は、(式6)に示すように、主信号パワースペクトルPx(ω)からPr3(ω)を減算することで生成した推定目的音パワースペクトルPs(ω)を雑音抑圧係数算出部108に出力する。
 Pr3(ω)=C(ω)・Pr2(ω)   (式5)
 Ps(ω)=Px(ω)-Pr3(ω)   (式6)
 図5Aは、主信号パワースペクトルPx(ω)が持つ指向性パターンを実線、Pr2(ω)に係数C(ω)を乗算してレベル調整した第3の参照信号パワースペクトルPr3(ω)が持つ指向性パターンを破線で示す。以下では、(式3)、(式4)におけるNを(式7)として計算したもので説明する。
 N=0   (式7)
 ここで、(式7)の条件は、従来の構成に相当する。
 図5Aは、実施の形態1におけるN=0である場合の主信号パワースペクトルPx(ω)および第3の参照信号パワースペクトルPr3(ω)の指向性パターンの関係を示す特性図である。図5Bは、実施の形態1におけるN=0である場合の推定目的音パワースペクトルPs(ω)の指向性パターンを示す特性図である。
 より具体的には、図5Aに示す指向性パターンは、係数C(ω)を90°方向に存在する雑音Aの方向に対して、主信号パワースペクトルPx(ω)(実線)と第3の参照信号パワースペクトルPr3(ω)(破線)が一致するようにC(ω)を設定した場合を示している。図5Bに示す指向性パターンは、(式6)に従って、主信号パワースペクトルPx(ω)から第3の参照信号パワースペクトルPr3(ω)を減算した推定目的音パワースペクトルPs(ω)を示している。ただし、減算結果が負の値になる部分については、値をゼロとして計算した結果である。
 図5Bに示す推定目的音パワースペクトルPs(ω)は、主信号パワースペクトルPx(ω)から、第3の参照信号パワースペクトルPr3(ω)を使って、雑音である目的音方向以外の信号成分を抑圧したパワースペクトルであり、雑音抑圧係数算出部108に出力される。また、推定目的音パワースペクトルPs(ω)は、指向性マイクロホン装置1の出力(y(t))の指向性パターンに対応する。
 雑音抑圧係数算出部108は、(式8)に示すように、指向性を鋭角化処理する前の入力信号である主信号パワースペクトルPx(ω)を分母にし、出力すべき推定目的音パワースペクトルPs(ω)を分子にした伝達特性H(ω)を計算する。雑音抑圧係数算出部108は、計算した伝達特性H(ω)を雑音抑圧処理部109に出力する。
 H(ω)=Ps(ω)/Px(ω)   (式8)
 ここで、(式8)は、一般にパワースペクトルに基づく雑音抑圧(ノイズサプレッサ)に用いられるウィナーフィルタ伝達特性を用いる場合の計算方法の例である。
 雑音抑圧処理部109は、(式9)に示すように雑音抑圧係数H(ω)と主信号スペクトルX(ω)との積を計算し、周波数-時間変換を行うことにより時間波形出力y(t)を生成する。なお、(式9)では、一例として周波数-時間変換の処理をIFFT{・}(逆FFT演算)で表現している。
 y(t)=IFFT{H(ω)・X(ω)}   (式9)
 このように(式8)および(式9)に示される演算を行うことによって、図5Aに示す実線の指向性パターンである主信号x(t)が、図5Bに示す実線の指向性パターンに鋭角化され、信号y(t)として出力される。
 以上のような処理を行うことによって、目的音方向以外の信号成分を抑圧し、指向性マイクロホンの指向性の鋭角化を行うことができる。
 ところで、指向性マイクロホン装置1における特徴は、参照信号の指向性パターンに着目し、指向性パターンを理想的に近づける補正処理を、補正部105と第2のパワースペクトル算出部1062とで実施することにある。そして、補正部105では、第1の参照信号スペクトルR1(ω)に主信号スペクトルをN回乗算する補正処理を実施する。
 なお、上述したN=0は指向性パターンを補正しない場合に相当し、従来の方法に等しくなる。以下、従来の課題について図5Aを用いて説明する。ここで、正面方向に目的音、90°方向に雑音A、120°方向に雑音Bが存在しているとする。90°方向に存在する雑音Aを過不足なしに抑圧を掛けるには、主信号と参照信号とにおける90°方向の感度を一致させることが必要である。図5Aは、係数C(ω)によって90°方向の雑音Aに対してレベル調整が行われた状態を示しており、指向性パターンの実線(Px(ω))と破線(Pr3(ω))とが90°方向で、値が一致している状態である。
 このとき、120°方向の雑音Bについては、主信号が持つ感度より、参照信号が持つ感度の方が高くなっており、120方向の雑音Bについては、過剰な抑圧がかかることになる。そのため、雑音Aや雑音Bの強弱によって適切な参照信号のレベル調整を随時行う学習の仕組みなどが必要となる。
 理想的には、参照信号の指向性パターンとしては、正面方向については感度死角を有し、正面方向以外は主信号の指向性パターンと一致していることが望ましい。主信号と参照信号の正面方向以外の指向性パターンが一致していれば、例えば90°方向の雑音Aと120°方向の雑音Bに対する参照信号のレベル調整値(係数C(ω))は必要なくなる。つまり、主信号と参照信号の正面方向以外の指向性パターンの一致度が高まれば、雑音抑圧が全ての方向に対して同時に過不足なく行えることになるので、参照信号の指向性パターンが理想形状に近づけば雑音抑圧精度が高まり、指向性の鋭角化や音質の向上が得られることとなる。また、係数C(ω)を雑音源の空間分布に適応して随時調整しなくてもよくなることから、この係数を固定の定数として従来と比べ処理をより簡素化することも可能となる。
 そこで、参照信号の指向性パターンについて、主信号と参照信号の正面方向以外の指向性パターンの一致度を高めるようにするため、補正部105と第2のパワースペクトル算出部とでは、(式3)および(式4)に示されるように、第1の参照信号スペクトルR1(ω)に主信号スペクトルX(ω)をN回乗算(N>0)して、参照信号パワースペクトルを得る。
 ここで、第1の参照信号スペクトルR1(ω)では、感度死角の角度方向が感度ゼロである。そのため、第1の参照信号スペクトルR1(ω)に対して主信号スペクトルX(ω)を何回乗算しても第1の参照信号スペクトルR1(ω)の感度死角の角度方向では感度ゼロを保つ。一方、感度死角の角度方向以外は、感度の高/低は存在してもある値を持っているため、主信号スペクトルX(ω)を乗算する回数Nを増していくと、参照信号の指向性パターンは、Nの増加に応じて、主信号スペクトルX(ω)の影響が高まり、主信号と同じ指向性パターンに近づくことになる。理論上では例えばN=∞とすると、第1の参照信号スペクトルR1(ω)の感度死角(感度=ゼロ)である目的音方向以外の角度範囲は、主信号スペクトルX(ω)と同じ指向性パターンになる。
 図6Aは、実施の形態1におけるN=1である場合の主信号パワースペクトルPx(ω)および第3の参照信号パワースペクトルPr3(ω)の指向性パターンの関係を示す特性図であり、図7Aは、実施の形態1におけるN=3である場合の主信号パワースペクトルPx(ω)および第3の参照信号パワースペクトルPr3(ω)の指向性パターンの関係を示す特性図である。図8Aは、実施の形態1におけるN=7である場合の主信号パワースペクトルPx(ω)および第3の参照信号パワースペクトルPr3(ω)の指向性パターンの関係を示す特性図である。
 具体的には、図6Aから図8Aにおける破線はそれぞれN=1,N=3,N=7と乗算回数Nを増加させたときの、(式3)から(式5)より計算した第3の参照信号Pr3(ω)の指向性パターンである。例えば図8Aに示す主信号パワースペクトルPx(ω)(実線)と参照信号パワースペクトルPr3(ω)(破線)とを比較すると、目的音方向以外の部分で一致度が高いことからわかるように、N=1からN=7のNの増加に伴い主信号パワースペクトルPx(ω)の指向性パターンとの一致度が高まっている。
 また、図6Bは、実施の形態1におけるN=1である場合の推定目的音パワースペクトルPs(ω)の指向性パターンを示す特性図であり、図7Bは、実施の形態1におけるN=3である場合の推定目的音パワースペクトルPs(ω)の指向性パターンを示す特性図である。図8Bは、実施の形態1におけるN=7である場合の推定目的音パワースペクトルPs(ω)の指向性パターンを示す特性図である。
 具体的には、図6Bから図8Bに示されるように、主信号パワースペクトルPx(ω)から第3の参照信号パワースペクトルPr3(ω)を減算した推定目的音パワースペクトルPs(ω)の指向性パターンもNの増加に伴い鋭角化できることがわかる。ここで、推定目的音パワースペクトルPs(ω)の指向性パターンは、雑音抑圧部の目標出力であるので、指向性マイクロホン装置の出力y(t)の指向性パターンと等しくなる。
 このように、実施の形態1の構成によれば、目的方向に対し、より狭い指向角を有する指向性を形成することができる指向性マイクロホン装置を実現することができる。より具体的には、実施の形態1の指向性マイクロホン装置1によれば、主信号の指向性パターンに対して、参照信号の指向性パターンの目的音方向以外のパターン一致度を向上させることができ、雑音抑圧部処理部の雑音推定精度の改善が得られるので、指向性の鋭角化と高音質化とを実現することができる。
 なお、図9に示すように、抑圧部107には、主信号スペクトルX(ω)に代えて、第1のマイクロホン11からの出力信号x(t)が入力されるとしてもよい。以下変形例として具体的に説明する。
 (変形例)
 図9は、実施の形態1の変形例における指向性マイクロホン装置の構成を示す図である。図10は、実施の形態1の変形例における抑圧部の詳細構成の一例を示す図である。なお、図1および図3と同様の要素には同一の符号を付しており、詳細な説明は省略する。
 図9に示す指向性マイクロホン装置1Aは、実施の形態1に係る指向性マイクロホン装置1に対して、抑圧部107Aの構成が異なる。
 抑圧部107Aは、第1のマイクロホン11で生成された第1の音響信号を主信号とし、補正部105で生成された第3の音響信号を参照信号として雑音抑圧を行うことで、第1の音響信号の目的方向の指向性を狭角化した出力音響信号を生成する。より具体的には、抑圧部107Aは、第1のマイクロホン11で生成された第1の音響信号(x(t))と、算出部106で算出された第1の音響信号のパワースペクトル(Px(ω))とを主信号とし、算出部106で算出された第3の音響信号のパワースペクトル(Pr2(ω))を参照信号として雑音抑圧を行うことで、出力音響信号を生成する。
 より具体的には、抑圧部107Aは、図10に示すように、第1の係数乗算部110と、第1の減算部111と、雑音抑圧係数算出部108Aと、雑音抑圧処理部109Aとを備える。図10に示す抑圧部107Aは、実施の形態1に係る抑圧部107に対して、雑音抑圧係数算出部108Aと、雑音抑圧処理部109Aとの構成が異なる。
 雑音抑圧処理部109Aは、第1の音響信号と雑音抑圧係数算出部108Aで算出された雑音抑圧係数とを入力として雑音抑圧を行うことで、出力音響信号y(t)を生成する。
 図10に示すように、雑音抑圧処理部109Aの入出力は、x(t),y(t)の時間領域信号になっている。また、雑音抑圧係数算出部108Aの出力は、雑音抑圧処理部109Aで用いられるフィルタ係数hとなる。例えば次式で計算することができる。
 h(n)=IFFT{Ps(ω)/Px(ω)}   (式10)
 そして、雑音抑圧処理部109で、(式11)に示すフィルタ処理を行っても良い。
 y(t)=Σ x(t-n)・h(n)   (式11)
 以上、実施の形態1の変形例の構成によれば、目的方向に対し、より狭い指向角を有する指向性を形成することができる指向性マイクロホン装置を実現することができる。
 なお、(式3)、(式4)のNは整数でなくても良く、詳細に調整が必要な場合には0より大きい実数値を用いても良い。
 また、第1のマイクロホン11と第2のマイクロホン12は、マイクロホン素子で構成されても良いし、複数のマイクロホン素子から成るマイクロホンアレイからの信号処理で構成されても良い。
 (実施の形態2)
 実施の形態1では、補正部105において、第1の参照信号スペクトルR1(ω)に乗算する主信号スペクトルX(ω)の回数Nを予め定めた値として説明したが、それに限られない。Nは、変動させてもよい。以下この場合の例について説明する。
 図11は、実施の形態2における指向性マイクロホン装置の構成の一例を示す図である。なお、図1の指向性マイクロホン装置と同じ構成要素については同じ符号を用い、説明を省略する。
 図11に示す指向性マイクロホン装置2は、図1の指向性マイクロホン装置1に対して、補正部105Aと、算出部106Aとの構成が異なり、ビーム幅制御部200が追加されている。
 補正部105Aは、補正部105の機能を有し、さらにビーム幅制御部200より、(式3)に示す乗算回数であるNの値が制御される。
 第2のパワースペクトル算出部1062Aは、第2のパワースペクトル算出部1062の機能を有し、さらにビーム幅制御部200より、(式4)に示すNの値が制御される。
 ビーム幅制御部200は、補正部105Aにおける乗算回数であるNと、算出部106(第2のパワースペクトル算出部1062A)における(2/(N+1))乗のN値を変化させることで指向性マイクロホン装置2の指向性を制御する。
 ここで、ビーム幅制御部200は、ユーザが使用する際の設定値が入力されたり、カメラ系の画像ズームに連動させたズーム制御信号が入力されたりすることで、上記Nの値を制御する。
 以上のように構成された指向性マイクロホン装置2の動作について説明する。
 実施の形態1における(式3)と(式4)の主信号スペクトルの乗算回数Nを変数とすることで、図5Bに示すN=0の場合の推定目的音パワースペクトルPs(ω)の指向性パターンから図8Bに示すN=7の場合の推定目的音パワースペクトルPs(ω)の指向性パターンを制御することができる。例えば、ビーム幅制御部200によりNの値が増やされることで指向性マイクロホン装置2の出力y(t)の指向性パターンを鋭角化することができる。つまり、ビーム幅制御部200がNの値を制御することで指向性マイクロホン装置2の指向性を広角から鋭角へと変化させることができる。
 このように、実施の形態2の構成によれば、目的方向に対し、より狭い指向角を有する指向性を形成することができる指向性マイクロホン装置を実現することができる。さらに、実施の形態2の構成によれば、ユーザは、指向性マイクロホン装置2の指向性パターンを設定することができたり、画像のズームに連動した音ズーム効果を得たりすることができる。
 (実施の形態3)
 以下の実施の形態において、同一機能を有する構成には、同一符号を付し、重複する説明は省略する。また、以下では、図中の0°は目的方向を示している。
 図12は、実施の形態3における指向性マイクロホン装置の構成の一例を示す図である。図13は、実施の形態3における第1の指向性合成部の詳細構成の一例を示す図である。図14は、実施の形態3における第2の指向性合成部の詳細構成の一例を示す図である。
 図12に示す指向性マイクロホン装置3は、マイクロホンアレイ101、第1の指向性合成部102、第2の指向性合成部103、変換部104、補正部105B、算出部106B、および、抑圧部107Bを備える。
 マイクロホンアレイ101は、複数のマイクロホンから構成される。具体的には、マイクロホンアレイ101は、複数の無指向性マイクロホンユニットを備え、比較的小さいスペースに配置されている。マイクロホンアレイ101は、例えばビデオカメラやデジタルスチルカメラ等の機器に内蔵される。
 本実施の形態では、例えば図12に示すように、マイクロホンアレイ101は、4個の無指向性マイクロホンユニット101F、101B、101Lおよび101Rが目的方向に対して菱形に配置される。無指向性マイクロホンユニット101F、101B、101Lおよび101Rはそれぞれ、音響信号xf(t)、xb(t)、xl(t)およびxr(t)を出力する。ここで、間隔d1は無指向性マイクロホンユニット101Fと101Bの間隔であり、間隔d2は無指向性マイクロホンユニット101Lと101Rの間隔である。間隔d1および間隔d2は、必要とする周波数帯域や設置スペースの制約によって決定される任意の値である。以下では、一例として周波数帯域の観点からd1、d2=5mm~100mm程度の範囲として説明する。
 第1の指向性合成部102は、マイクロホンアレイ101の出力信号を演算処理することで、目的方向に感度を有する第1の音響信号を生成する。本実施の形態では、第1の指向性合成部102は、無指向性マイクロホンユニット101Fおよび101Bからの音響信号xf(t)およびxb(t)を用いて目的方向に主軸を有す指向性を持つ音響信号x(t)を生成(指向性信号x(t)とも記載)する。ここで、音響信号x(t)は、第1の音響信号の具体例である。
 また、第1の指向性合成部102は、図13に示すように、第1の遅延器1021、第2の遅延器1022、減算器1023、EQ(Equalizer)1024を備え、目的方向(0°)に主軸を有する音圧傾度型の単一指向性を形成する。
 第1の遅延器1021は、デジタルフィルタで構成され、音響信号xf(t)が入力される。同様に、第2の遅延器1022は、デジタルフィルタで構成され、音響信号xb(t)が入力される。
 第1の遅延器1021と第2の遅延器1022とを構成するそれぞれのデジタルフィルタのフィルタ係数は、次のように設計される。すなわち、減算器1023の入力において図12の180°方向からの到来する音波に対する音響信号xf(t)と音響信号xb(t)とが、例えば減算器1023の入力において同相となるように設計される。より具体的には、上記フィルタ係数は、第2の遅延器1022が第1の遅延器1021に対して相対的にd1/c[s]遅れるよう設計される。ここで、cは音速[m/s]である。
 減算器1023は、第1の遅延器1021の出力信号から第2の遅延器1022の出力信号を差し引く。これにより、180°方向の感度を無くす(目的方向に感度死角を有する)ことができ、相対的に0°方向(目的方向)に感度の高い信号を得ることができる。また、減算器1023の出力信号は、0°方向について原理的に周波数が低く(波長が長く)なるにしたがって-6dB/Octaveの傾斜を有する振幅周波数特性となる。
 EQ1024は、減算器1023の出力信号の振幅周波数特性が平坦となるように補正を行うことで、音響信号x(t)を生成して出力する。
 以上のように第1の指向性合成部102は構成される。
 第2の指向性合成部103は、マイクロホンアレイ101の出力信号を演算処理することで、目的方向に感度死角を有する第2の音響信号を生成する。本実施の形態では、第2の指向性合成部103は、無指向性マイクロホンユニット101Lおよび101Rからの音響信号xl(t)およびxr(t)を用いて目的方向に感度死角を有する指向性を持つ音響信号r1(t)(以下、指向性信号r1(t)とも記載)を生成する。ここで、音響信号r1(t)は、第2の音響信号の具体例である。
 また、第2の指向性合成部103は、図14に示すように、減算器1031およびEQ1032を備え、目的方向(0°)と目的方向の正反対方向(180°)とに感度死角を有する双指向性を形成する。
 減算器1031は、音響信号xl(t)から音響信号xr(t)を差し引く。なお、0°方向(目的方向)、及び180°方向からの音波は、理想状態の場合、無指向性マイクロホンユニット101Lおよび101Rに同振幅かつ同位相で入力されるため、減算器1031からの出力信号は0である。
 また、減算器1031の出力信号は、90°方向或いは270°方向について原理的に周波数が低く(波長が長く)なるにしたがって-6dB/Octaveの傾斜を有する振幅周波数特性となる。
 EQ1032は、減算器1031の出力信号の振幅周波数特性が平坦となるように補正を行うことで、音響信号r1(t)を生成して出力する。
 以上のように第2の指向性合成部103は構成される。
 変換部104は、例えば、第1の変換部の一例であり、第1の指向性合成部102で生成された第1の音響信号と、第2の指向性合成部103で生成された第2の音響信号を周波数領域の信号に変換する。本実施の形態では、図12に示すように、変換部104は、第1の時間-周波数変換部1041と、第2の時間-周波数変換部1042とを備える。
 第1の時間-周波数変換部1041は、第1の指向性合成部102からの音響信号x(t)を、複数のサンプル数を蓄積したフレーム単位(例えば、1フレームのサンプル数は256等の2のべき乗)で、高速フーリエ変換、フィルタバンクまたはウェーブレット変換等を行い周波数領域の信号X(ω)を算出する。なお、第1の時間-周波数変換部1041は、音響信号x(t)を例えば50%オーバーラップで蓄積したり、また、蓄積した音響信号x(t)にハミング窓等の窓掛けを行ったりして、信号X(ω)を算出するとしてもよい。
 第2の時間-周波数変換部1042は、第2の指向性合成部103からの音響信号r1(t)に対し、上述した第1の時間-周波数変換部1041と同じ方法で周波数領域の信号R1(ω)を算出する。
 補正部105Bは、例えば補正部の一例であり、第2の指向性合成部103で生成された第2の音響信号に対して、第1の指向性合成部102で生成された第1の音響信号と、第2の指向性合成部103で生成された第2の音響信号とをN回(N>0)周波数領域で乗算することによって、上記目的方向の感度死角の角度範囲を第2の音響信号より狭くした第3の音響信号を生成する。より具体的には、補正部105Bは、変換部104で周波数領域の信号に変換された第1の音響信号に対して変換部104で周波数領域の信号に変換された第2の音響信号とをN回(N>0)乗算することにより、第3の音響信号を生成する。なお、実施の形態1および2において、第2のパワスペクトル算出部1062が、N+1回乗算された信号スペクトルをパワ(2乗)のオーダーに変換していたが、以下では、第2のパワスペクトル算出部1062Bは、補正部105Bより出力された振幅スペクトルを入力としてパワスペクトルに変換するものとする。補正部105BはN+1回乗算された信号スペクトルを振幅スペクトルに変換して出力する構成であるとして説明をする。本実施の形態および以降の実施の形態では、N=1であるものとして説明する。
 本実施の形態では、補正部105Bは、第1の時間-周波数変換部1041の出力信号である信号X(ω)と第2の時間-周波数変換部1042の出力信号である信号R1(ω)とのスペクトル乗算を用いて信号R1(ω)の目的方向の感度死角の角度範囲を狭角化した信号R1’(ω)を算出する。なお、信号R1’(ω)は、第3の音響信号の具体例である。
 以下、より具体的に説明する。
 図15Aおよび図15Bは、実施の形態3における補正部の機能構成の一例を示す図である。
 例えば、図15Aに示すように、補正部105Bは、スペクトル乗算部1051と、絶対値演算部1052と、平方根算出部1053とを備え、(式12)に示す算出式を実行する。
Figure JPOXMLDOC01-appb-M000001
 この場合、スペクトル乗算部1051は、周波数領域の信号に変換された第2の音響信号と周波数領域の信号に変換された第1の音響信号とを複素乗算する。本実施の形態では、スペクトル乗算部1051は、図15Aに示すように、信号X(ω)と信号R1(ω)とのスペクトル乗算を行う。
 絶対値演算部1052は、スペクトル乗算部1051の出力信号の絶対値を算出する。本実施の形態では、絶対値演算部1052は、信号X(ω)と信号R1(ω)との乗算値の絶対値を算出する。
 平方根算出部1053は、絶対値演算部1052により算出された絶対値の平方根を算出することにより、第3の音響信号を生成する。本実施の形態では、平方根算出部1053は、信号R1’(ω)を算出する。
 なお、補正部105Bは、図15Aに示す機能構成を備える場合に限られない。例えば、図15Bに示すように、補正部105Cは、絶対値演算部1054、1055と、乗算部1056と、平方根算出部1057とを備え、(式13)に示す算出式を実行するとしてもよい。(式13)に示す算出式を実行する場合でも、(式12)に示す算出式を実行する場合と同じ結果が得られるからである。
Figure JPOXMLDOC01-appb-M000002
 この場合、絶対値演算部1054、1055は、周波数領域の信号に変換された第1の音響信号の第1の絶対値および周波数領域の信号に変換された第2の音響信号の第2の絶対値を算出する。本実施の形態では、図15Bに示すように、絶対値演算部1054は、信号X(ω)の絶対値(第1の絶対値)を算出し、絶対値演算部1055は、信号R1(ω)の絶対値(第2の絶対値)を算出する。
 乗算部1056は、絶対値演算部1054、1055で算出された第1の絶対値と第2の絶対値との乗算を行う。本実施の形態では、乗算部1056は、信号X(ω)の絶対値(第1の絶対値)と信号R1(ω)の絶対値(第2の絶対値)との乗算を行う。
 平方根算出部1057は、乗算部1056により行われた乗算値の平方根を算出することにより、第3の音響信号を生成する。本実施の形態では、平方根算出部1057は、信号R1’(ω)を算出する。
 なお、補正部105Bは、(式12)または(式13)に示す算出式を実行する機能構成を備える場合について説明したが、同じ結果が得られるのであればこれらに限られない。例えば、信号X(ω)および信号R1(ω)のどちらか、または両方の共役複素数をとって算出してもよい。(式12)に示す算出式を実行する場合と同じ結果が得られる。
 ここで、図16は、実施の形態3における補正部105Bの入力信号および出力信号の指向性パターンを示す図である。図16の(a)には、図15Aに示す補正部105Bに入力される入力信号である信号X(ω)の指向性パターンが示されており、図16の(b)には、図15Aに示す補正部105Bに入力される入力信号である信号R1(ω)の指向性パターンが示されている。図16の(c)には、図15Aに示す補正部105Bが出力する出力信号である信号R1’(ω)の指向性パターンが示されている。
 このように、補正部105Bは、双指向性を持つ信号R1(ω)の目的方向に形成しているゼロ感度(図16の(b)の0°方向の感度)を、信号R1’(ω)でも維持するよう算出処理する(図16の(c)の0°方向の感度)。また、補正部105Bは、信号R1’(ω)のその他の方向(目的方向以外の方向)の感度(指向性)を、信号R1(ω)と信号X(ω)の中間値となるよう算出処理する。それにより、補正部105Bは、目的方向に信号R1(ω)より角度範囲の狭い感度死角を有する指向性を持つ信号R1’(ω)を生成することができる。
 以上のように補正部105Bは構成され、算出処理を行う。
 算出部106Bは、例えば、パワースペクトル算出部の一例であり、周波数領域の信号に変換された、第1の音響信号および第2の音響信号のそれぞれのパワースペクトルを算出する。本実施の形態では、図12に示すように、算出部106は、第1のパワースペクトル算出部1061と、第2のパワースペクトル算出部1062Bとを備える。
 第1のパワースペクトル算出部1061は、第1の時間-周波数変換部1041の出力信号である信号X(ω)のパワースペクトルPx(ω)を算出する。ここで、例えば第1のパワースペクトル算出部1061は、(式14)に示す算出式を用いてパワースペクトルPx(ω)を算出する。
Figure JPOXMLDOC01-appb-M000003
 第2のパワースペクトル算出部1062Bは、補正部105Bの出力信号である信号R1’(ω)のパワースペクトルPr1’(ω)を算出する。ここで、例えば第2のパワースペクトル算出部1062Bは、(式15)に示す算出式を用いてパワースペクトルPr1’(ω)を算出する。
Figure JPOXMLDOC01-appb-M000004
 以上のように算出部106Bは構成され、パワースペクトルを算出する。
 なお、(式14)および(式12)または(式15)および(式13)を比較してわかるように(式12)および(式13)の平方根の計算は省略が可能である。
 抑圧部107Bは、第1の指向性合成部102で生成された第1の音響信号を主信号とし、補正部105Bで生成された第3の音響信号を参照信号として雑音抑圧を行うことで、第1の音響信号の目的方向の指向性を狭角化した出力音響信号を生成する。本実施の形態では、図12に示すように、抑圧部107Bは、雑音抑圧係数算出部108Bと、雑音抑圧部109Bとを備える。
 雑音抑圧係数算出部108Bは、第1の音響信号と第3の音響信号とのパワースペクトルを用いて、第1の音響信号に含まれる目的方向の音以外の音である雑音を抑圧する雑音抑圧係数を算出する。例えば、雑音抑圧係数算出部108Bは、算出部106Bで算出された第1の音響信号のパワースペクトルを主信号とし、算出部106Bで算出された第3の音響信号のパワースペクトルを参照信号として、雑音抑圧係数を算出する。
 本実施の形態では、雑音抑圧係数算出部108Bは、第1のパワースペクトル算出部1061の出力信号であるパワースペクトルPx(ω)を主信号とし、第2のパワースペクトル算出部1062Bの出力信号であるパワースペクトルPr1’(ω)を参照信号とし、主信号であるパワースペクトルPx(ω)から目的方向以外の音である雑音を抑圧する雑音抑圧係数H(ω)を算出する。
 雑音抑圧係数算出部108Bは、例えば(式16)に示す算出式を用いて、雑音抑圧係数H(ω)を算出する。なお、(式16)は、雑音抑圧係数H(ω)を算出するための算出式の一例であり、ウィナーフィルタの特性を有する算出式である。
Figure JPOXMLDOC01-appb-M000005
 ここで、α(ω)は重み係数である。
 重み係数α(ω)の算出方法は、例えば上記特許文献1に開示されている。すなわち、まず、スペクトル比Px(ω)/Pr1’(ω)を算出する。次に、目的音より周囲雑音が支配的な状況、本実施の形態の構成の場合では例えば(式17)に示すような状況において、(式18)を用いて、スペクトル比Px(ω)/Pr1’(ω)の時間平均を算出する。算出した時間平均がα(ω)に相当する。
Figure JPOXMLDOC01-appb-M000006
Figure JPOXMLDOC01-appb-M000007
 ここで、
Figure JPOXMLDOC01-appb-M000008
は時間平均演算を示す。
 なお、重み係数α(ω)の算出方法の詳細は、上記特許文献1に開示されているため、説明を省略する。
 また、雑音抑圧係数算出部108Bは、第1の音響信号と第3の音響信号とのパワースペクトルを用いて、上記雑音を抑圧する雑音抑圧係数を算出できればよいので、上述した構成に限らない。例えば、特許文献3に開示される構成を用いてもよい。なお、構成の例示については、特許文献3に開示されているため、ここでの説明を省略する。
 雑音抑圧部109Bは、第1の指向性合成部102で生成された第1の音響信号に雑音抑圧係数算出部108Bで算出された雑音抑圧係数を適用することで、雑音を抑圧して目的方向の音のみを抽出する雑音抑圧を行うことにより、出力音響信号を生成する。本実施の形態では、図12に示すように、雑音抑圧部109Bは、乗算器1091と、周波数-時間変換部1092とを備える。
 乗算器1091は、周波数領域の信号に変換された前記第1の音響信号と、雑音抑圧係数算出部108Bで算出された雑音抑圧係数との乗算を行い、雑音を抑圧した目的方向の目的音響信号のみを抽出する。本実施の形態では、乗算器1091は、第1の時間-周波数変換部1041の出力信号である信号X(ω)に、雑音抑圧係数算出部108Bで算出した雑音抑圧係数H(ω)を乗ずることにより、信号X(ω)から目的方向以外の音である雑音を抑圧した信号Y(ω)=X(ω)・H(ω)を算出する。ここで、信号Y(ω)は、目的音響信号の具体例である。
 周波数-時間変換部1092は、例えば、逆フーリエ変換部の一例であり、乗算器1091で抽出された目的音響信号を時間領域の信号に変換することで、出力音響信号を生成する。本実施の形態では、周波数-時間変換部1092は、目的方向以外の音である雑音が抑圧され、目的方向の音が強調された信号Y(ω)を逆フーリエ変換等により時間領域の音響信号y(t)に変換する。ここで、音響信号y(t)は、出力音響信号の具体例である。
 以上、本実施の形態によれば、目的方向に対し、より狭い指向角を有する指向性を形成することができる指向性マイクロホン装置および音響信号処理方法を実現することができる。
 より具体的には、本実施の形態の指向性マイクロホン装置および音響信号処理方法によれば、目的方向に主軸を有する主信号と、目的方向に感度死角を有する参照信号と用いて、これら感度死角が異なる2つの指向性信号(主信号、参照信号)のスペクトル乗算を行うことにより、目的方向の感度死角の角度範囲をより狭くできる参照信号を形成することができる。つまり、本実施の形態の指向性マイクロホン装置によれば、数mmから数cmオーダーの比較的小さいスペースに配置した複数のマイクロホンユニットを用いて、目的方向以外の音を抑圧し、目的方向の音のみを収音するため、目的方向の感度死角の角度範囲のより狭い参照信号を形成することができる。そして、形成した参照信号を用いて雑音抑圧処理を行うことにより、目的方向の狭角化が可能となる。
 換言すると、本実施の形態の指向性マイクロホン装置および音響信号処理方法によれば、参照信号の目的方向に対する感度死角の角度範囲をより狭くすることができ、参照信号に目的方向近傍の音を含ませることができる。それにより、目的方向に対し、より狭い指向角を有する指向性を形成することができるので、目的方向に対し、より狭い指向角を有する指向性を有する音響信号を形成することができる。
 (実施の形態4)
 図17は、実施の形態4における指向性マイクロホン装置の構成の一例を示す図である。図17において、図12と同じ構成要素については同じ符号を用い、説明を省略する。
 図17に示す指向性マイクロホン装置4は、実施の形態3に係る指向性マイクロホン装置3に対して、抑圧部207の雑音抑圧部209の構成が異なる。
 具体的には、図17に示す雑音抑圧部209は、図12に示す雑音抑圧部109Bに対して、乗算器1091および周波数-時間変換部1092が削除され、周波数-時間変換部2091、時変係数FIR(Finite Impulse Response)フィルタ部2092を追加した点が異なる。また、上記構成の変更に伴い、第1の指向性合成部102および第1の時間-周波数変換部1041それぞれの出力先が変更となっている。
 周波数-時間変換部2091は、例えば第2の変換部の一例であり、周波数領域の係数である雑音抑圧係数を時間領域のFIRフィルタのフィルタ係数に変換する。本実施の形態では、周波数-時間変換部2091は、雑音抑圧係数算出部108Bで算出した雑音抑圧係数H(ω)を時間領域のFIRフィルタの係数h(t)に変換する。
 時変係数FIRフィルタ部2092は、周波数-時間変換部2091で変換された1単位時間(1フレーム)前のFIRフィルタの係数を、周波数-時間変換部2091で変換された現単位時間(現フレーム)のFIRフィルタの係数を用いて更新し、第1の指向性合成部102で生成された第1の音響信号にフィルタ処理を行うことにより、出力音響信号を生成する。本実施の形態では、時変係数FIRフィルタ部2092は、まず、例えば(式19)にしたがって周波数-時間変換部2091で算出されたフィルタ係数h(t)を用いて現在の時変係数FIRフィルタの係数hw(t)を更新する。
Figure JPOXMLDOC01-appb-M000009
 ここで、係数γは、時定数に相当するパラメータであり、出力音響信号の音質の制御を可能とする。
 このようにして、雑音抑圧部209は、第1の指向性合成部102で生成された第1の音響信号に雑音抑圧係数算出部108Bで算出された雑音抑圧係数を適用することで、雑音を抑圧して目的方向の音のみを抽出する雑音抑圧を行うことにより、出力音響信号を生成する。
 本実施の形態では、さらに、雑音抑圧部209は、周波数-時間変換部2091および時変係数FIRフィルタ部2092を有することにより、雑音抑圧係数がFIRフィルタのフィルタ係数に変換され、フレーム間に算出されるフィルタ係数の更新を短い時間単位で行うことができるので、畳み込み演算を利用して、出力音響信号の音質の細かい制御が可能となる。
 (実施の形態5)
 図18は、実施の形態5における指向性マイクロホン装置の構成の一例を示す図である。図19は、実施の形態5における第3の指向性合成部の詳細構成の一例を示す図である。なお、図12と同じ構成要素については同じ符号を用い、説明を省略する。
 図18に示す指向性マイクロホン装置5は、実施の形態3に係る指向性マイクロホン装置3(図12)に対して、変換部304、算出部306および抑圧部307の構成が異なり、第3の指向性合成部301が追加されている。
 具体的には、図18に示す変換部304は、図12に示す変換部104に対して、第3の時間-周波数変換部3043が追加されている点が異なる。図18に示す算出部306は、図12に示す算出部106Bに対して、第3のパワースペクトル算出部3063が追加されている点が異なる。図18に示す抑圧部307は、図12に示す抑圧部107Bに対して、雑音抑圧係数算出部308の構成が異なり、雑音抑圧部310が追加されている。
 第3の指向性合成部301は、マイクロホンアレイ101の出力信号を演算処理することで、目的方向に感度死角を有し、かつ、第2の音響信号とは異なる指向性パターンを有する第4の音響信号を生成する。
 本実施の形態では、第3の指向性合成部301は、無指向性マイクロホンユニット101Bおよび101Fからの音響信号xb(t)および音響信号xf(t)を用いて目的方向の反対方向、すなわち180°に主軸を有する指向性を有する音響信号r2(t)(指向性信号r2(t)とも記載)を生成する。ここで、音響信号r2(t)は、第4の音響信号の具体例である。
 また、第3の指向性合成部301は、図19に示すように、第1の遅延器3011、第2の遅延器3012、減算器3013、EQ3014を備え、第1の指向性合成部102と正反対の方向に指向性の主軸を有する音圧傾度型の単一指向性を形成する。つまり、第3の指向性合成部301は、図13に示す第1の指向性合成部102の構成と入力信号が逆になっており、第1の指向性合成部102と正反対の方向に指向性の主軸を有する音圧傾度型の単一指向性を形成する。なお、詳細な説明は、図13と同様のために省略する。
 変換部304は、例えば第1の変換部の一例であり、第1の指向性合成部102で生成された第1の音響信号と、第2の指向性合成部103で生成された第2の音響信号と、第3の指向性合成部301で生成された第4の音響信号とを周波数領域の信号に変換する。
 本実施の形態では、変換部304は、第1の時間-周波数変換部1041、第2の時間-周波数変換部1042および第3の時間-周波数変換部3043を備える。第3の時間-周波数変換部3043は、第3の指向性合成部301の出力信号r2(t)に対し、第1の時間-周波数変換部1041と同じ方法で周波数領域の信号R2(ω)を算出する。なお、第1の時間-周波数変換部1041および第2の時間-周波数変換部1042については、実施の形態3で説明した通りであるので、説明は省略する。
 算出部306は、例えばパワースペクトル算出部の一例であり、変換部304で周波数領域の信号に変換された第1の音響信号と第3の音響信号と第4の音響信号とのそれぞれのパワースペクトルを算出する。
 本実施の形態では、算出部306は、第1のパワースペクトル算出部1061、第2のパワースペクトル算出部1062B、および第3のパワースペクトル算出部3063を備える。第3のパワースペクトル算出部3063は、第3の時間-周波数変換部3043の出力信号である信号R2(ω)のパワースペクトルPr2(ω)を算出する。ここで、例えば第3のパワースペクトル算出部3063は、(式20)に示す算出式を用いてパワースペクトルPr2(ω)を算出する。
Figure JPOXMLDOC01-appb-M000010
 なお、第1のパワースペクトル算出部1061および第2のパワースペクトル算出部1062Bについては、実施の形態3で説明した通りであるので、説明は省略する。
 雑音抑圧部310は、例えば、反対方向雑音抑圧部の一例であり、補正部105Bで生成された第3の音響信号を主信号とし、第3の指向性合成部301で生成された第4の音響信号を参照信号として、第3の音響信号に含まれる目的方向に対して正反対の方向の音である第1の雑音を抑圧する。例えば、雑音抑圧部310は、第3の音響信号のパワースペクトルを主信号とし、第4の音響信号のパワースペクトルを参照信号として、第1の雑音を抑圧する。
 本実施の形態では、雑音抑圧部310は、第2のパワースペクトル算出部1062Bの出力信号であるパワースペクトルPr1'(ω)を主信号とし、第3のパワースペクトル算出部3063の出力信号であるパワースペクトルPr2(ω)を参照信号とし、主信号であるパワースペクトルPr1'(ω)から180°を中心とする後方の雑音を抑圧し、出力信号であるパワースペクトルPr1”(ω)を算出する。
 例えば、雑音抑圧部310は、(式21)に示す算出式を用いて出力信号であるパワースペクトルPr1”(ω)を算出する。
Figure JPOXMLDOC01-appb-M000011
 ここで、α’(ω)は重み係数である。重み係数α’(ω)の算出は、例えば、雑音抑圧係数算出部308にて算出する重み係数α(ω)と同様に、上記特許文献1または上記特許文献3に開示されている方法を用いればよいので、詳細な説明は省略する。
 雑音抑圧係数算出部308は、図12に示す雑音抑圧係数算出部108Bと比較して、雑音抑圧係数算出部108Bの参照信号が増加した点が異なっている。換言すると、雑音抑圧係数算出部308は、雑音抑圧係数算出部108Bの参照信号を複数チャンネルに拡張した処理を行うものである。
 雑音抑圧係数算出部308は、第1の音響信号と第4の音響信号と雑音抑圧部310の出力信号とを用いて、第1の雑音を含む目的方向の音以外の音である雑音を抑圧する雑音抑圧係数を算出する。雑音抑圧係数算出部308は、第1の音響信号のパワースペクトルを主信号とし、雑音抑圧部310の出力信号および第4の音響信号のパワースペクトルを参照信号として、雑音抑圧係数を算出する。
 本実施の形態では、雑音抑圧係数算出部308は、第1のパワースペクトル算出部1061の出力信号Px(ω)を主信号とし、雑音抑圧部310の出力信号Pr1”(ω)、及び第3のパワースペクトル算出部3063の出力信号であるパワースペクトルPr2(ω)を参照信号とし、主信号であるパワースペクトルPx(ω)から目的方向以外の音である雑音を抑圧する係数H(ω)を算出する。
 雑音抑圧係数算出部308は、例えば(式22)に示す算出式を用いて、雑音抑圧係数H(ω)を算出する。なお、(式22)は、雑音抑圧係数H(ω)を算出するための算出式の一例であり、ウィナーフィルタの特性を有する算出式である。
Figure JPOXMLDOC01-appb-M000012
 ここで、α1(ω)およびα2(ω)は重み係数である。重み係数α1(ω)およびα2(ω)の算出方法は、例えば、雑音抑圧係数算出部108Bにて算出する重み係数α(ω)と同様に、上記特許文献1または上記特許文献3に開示されている方法を用いればよいので、詳細な説明は省略する。
 以上、本実施の形態によれば、目的方向に対し、より狭い指向角を有する指向性を形成することができる指向性マイクロホン装置および音響信号処理方法を実現することができる。
 本実施の形態では、実施の形態3および4と比較して、さらに、参照信号を方向別に算出できるよう構成することにより、より複数方向から到来する雑音の推定が可能となる。それにより、目的方向に対し、より狭い指向角を有する指向性を有する音響信号を精度よく形成することができる。
 以上、本発明の一つまたは複数の態様に係る指向性マイクロホン装置について、実施の形態に基づいて説明したが、本発明は、この実施の形態に限定されるものではない。本発明の趣旨を逸脱しない限り、当業者が思いつく各種変形を本実施の形態に施したものや、異なる実施の形態における構成要素を組み合わせて構築される形態も、本発明の一つまたは複数の態様の範囲内に含まれてもよい。
 例えば、実施の形態4と実施の形態5に示す指向性マイクロホン装置の構成を組み合わせてもよい。以下、この場合の例について図20に示す。図20は、実施の形態5における指向性マイクロホン装置3Aの構成の変形例を示す図である。なお、図20において、図17および図18と同じ構成要素については同じ符号を用いているため説明は省略する。
 この構成によれば、参照信号を方向別に算出し、かつ、雑音の抑圧処理を雑音抑圧部310で行うことにより、複数方向から到来する雑音の推定と共にフレーム間に算出されるフィルタ係数の更新を短い時間単位で行うことが可能となる。それにより、目的方向に対し、より狭い指向角を有する指向性を有する音響信号を精度よく形成することができるだけでなく、出力音響信号の音質の細かい制御が可能となる。
 以上のように、本出願において開示する技術の例示として、複数の実施の形態を説明した。しかしながら、本発明における技術は、これに限定されず、適宜、変更、置き換え、付加、省略などを行った実施の形態にも適用可能である。また、上記実施の形態で説明した各構成要素を組み合わせて、新たな実施の形態とすることも可能である。
 また、以下のような場合も本開示に含まれる。
 (1)マイクロホンを除く上記の各装置を構成する構成要素は、具体的には、マイクロプロセッサ、ROM(Read Only Memory)、RAM(Ramdom Access Memory)、などから構成されるコンピュータシステムとして実装される。RAMには、コンピュータプログラムが記憶されている。マイクロプロセッサが、コンピュータプログラムに従って動作することにより、各装置は、その機能を達成する。ここでコンピュータプログラムは、所定の機能を達成するために、コンピュータに対する指令を示す命令コードが複数個組み合わされて構成されたものである。
 (2)マイクロホンを除く上記の各装置を構成する構成要素の一部又は全部は、1個のシステムLSI(Large Scale Integration:大規模集積回路)から構成されてもよい。システムLSIは、複数の構成部を1個のチップ上に集積して製造された超多機能LSIであり、具体的には、マイクロプロセッサ、ROM、RAMなどを含んで構成されるコンピュータシステムである。RAMには、コンピュータプログラムが記憶されている。マイクロプロセッサが、コンピュータプログラムに従って動作することにより、システムLSIは、その機能を達成する。
 (3)マイクロホンを除く上記の各装置を構成する構成要素の一部又は全部は、各装置に脱着可能なIC(Integrated Circuit)カード又は単体のモジュールから構成されてもよい。前記ICカード又は前記モジュールは、マイクロプロセッサ、ROM、RAMなどから構成されるコンピュータシステムである。ICカード又はモジュールは、上記の超多機能LSIを含んでもよい。マイクロプロセッサが、コンピュータプログラムに従って動作することにより、ICカード又はモジュールは、その機能を達成する。このICカード又はこのモジュールは、耐タンパ性を有してもよい。
 (4)本発明は、マイクロホンを備えるのは必須ではない。外部装置としてのマイクロホンから出力信号を受け取り、受け取った出力信号を用いて、目的方向に感度を有する第1の音響信号と、目的方向に感度死角を有する第2の音響信号とを生成すればよい。すなわち、目的方向に感度を有する第1の音響信号を生成する第1の指向性合成部と、前記目的方向に感度死角を有する第2の音響信号を生成する第2の指向性合成部と、前記第2の指向性合成部で生成された前記第2の音響信号に対して、前記第1の指向性合成部で生成された前記第1の音響信号と、前記第2の指向性合成部で生成された前記第2の音響信号とをN回(N>0)周波数領域で乗算することによって、前記目的方向の感度死角の角度範囲を前記第2の音響信号より狭くした第3の音響信号を生成する補正部と、前記第1の指向性合成部で生成された前記第1の音響信号を主信号とし、前記補正部で生成された前記第3の音響信号を参照信号として雑音抑圧を行うことで、前記第1の音響信号の前記目的方向の指向性を狭角化した出力音響信号を生成する抑圧部とを備えるとしてもよい。
 (5)本発明は、上記に示す方法であってもよい。また、これらの方法をコンピュータにより実現するコンピュータプログラムであってもよいし、コンピュータプログラムからなるデジタル信号であってもよい。
 すなわち、このプログラムは、コンピュータに、目的方向に感度を有する第1の音響信号を生成する第1の指向性合成ステップと、前記目的方向に感度死角を有する第2の音響信号を生成する第2の指向性合成ステップと、前記第1の指向性合成ステップにおいて生成された前記第1の音響信号と、前記第2の指向性合成ステップにおいて生成された前記第2の音響信号に対して、前記第1の指向性合成ステップにおいて生成された前記第1の音響信号をN回(N>0)周波数領域で乗算することによって、前記目的方向の感度死角の角度範囲を前記第2の音響信号より狭くした第3の音響信号を生成する補正ステップと、前記第1の指向性合成ステップにおいて生成された前記第1の音響信号を主信号とし、前記補正ステップにおいて生成された前記第3の音響信号を参照信号として雑音抑圧を行うことで、前記第1の音響信号の前記目的方向の指向性を狭角化した出力音響信号を生成する抑圧ステップとを、実行させるためのプログラムとしてもよい。
 また、本発明は、コンピュータプログラム又はデジタル信号をコンピュータ読み取り可能な記録媒体、例えば、フレキシブルディスク、ハードディスク、CD-ROM(Compact Disc Read Only Memory)、MO(Magneto-Optical disc)、DVD(Digital Versatile Disc)、DVD-ROM、DVD-RAM、BD(Blu-ray(登録商標) Disc)、半導体メモリなどに記録したものでもよい。また、これらの記録媒体に記録されているデジタル信号であってもよい。また、本発明は、コンピュータプログラム又はデジタル信号を、電気通信回線、無線又は有線通信回線、インターネットを代表とするネットワーク、データ放送等を経由して伝送するものでもよい。また、本発明は、マイクロプロセッサとメモリを備えたコンピュータシステムであって、メモリは、コンピュータプログラムを記憶しており、マイクロプロセッサは、コンピュータプログラムに従って動作してもよい。また、プログラムもしくはデジタル信号を記録媒体に記録して移送することにより、または、プログラムもしくはデジタル信号を、ネットワーク等を経由して移送することにより、独立した他のコンピュータシステムにより実施してもよい。
 (6)上記各実施の形態をそれぞれ組み合わせてもよい。
 なお、上記各実施の形態において、複数の指向性信号を、マイクロホンアレイと複数の指向性合成部とを用いて生成してきたが、代わりに極近接に配置した複数の指向性マイクロホンの出力を用いても良い。
 以上のように、本発明における技術の例示として、実施の形態を説明した。そのために、添付図面および詳細な説明を提供した。
 したがって、添付図面および詳細な説明に記載された構成要素の中には、課題解決のために必須な構成要素だけでなく、上記技術を例示するために、課題解決のためには必須でない構成要素も含まれ得る。そのため、それらの必須ではない構成要素が添付図面や詳細な説明に記載されていることをもって、直ちに、それらの必須ではない構成要素が必須であるとの認定をするべきではない。
 また、上述の実施の形態は、本発明における技術を例示するためのものであるから、請求の範囲またはその均等の範囲において種々の変更、置き換え、付加、省略などを行うことができる。
 本発明は、指向性マイクロホン装置、音響信号処理方法およびプログラムに利用でき、特に、特定方向の音の収音するビデオカメラ、補聴器、車載マイクおよびテレビ等や、外部装置としてのマイクロホンを用いて特定方向の音を収音する携帯端末にインストールされるアプリケーションなどの用途に応用される指向性マイクロホン装置、音響信号処理方法およびプログラムに利用することができる。
 1、1A、2、3、3A、4、5 指向性マイクロホン装置
 11 第1のマイクロホン
 12 第2のマイクロホン
 101 マイクロホンアレイ
 101L、101R、101F、101B 無指向性マイクロホンユニット
 102 第1の指向性合成部
 103 第2の指向性合成部
 104、304 変換部
 105、105A、105B、105C 補正部
 106、106A、106B、306 算出部
 107、107A、107B、207、307 抑圧部
 108、108A、108B 雑音抑圧係数算出部
 109、109A 雑音抑圧処理部
 109B、209、310 雑音抑圧部
 110 第1の係数乗算部
 111 第1の減算部
 200 ビーム幅制御部
 301 第3の指向性合成部
 308 雑音抑圧係数算出部
 901 第1のマイクロホンユニット
 902 第2のマイクロホンユニット
 910 判定部
 920 適応フィルタ部
 930 信号減算部
 940 雑音抑圧フィルタ係数算出部
 950 時変係数フィルタ部
 1021、3011 第1の遅延器
 1022、3012 第2の遅延器
 1023、1031、3013 減算器
 1024、1032、3014 EQ
 1041 第1の時間-周波数変換部
 1042 第2の時間-周波数変換部
 1050 演算部
 1051 スペクトル乗算部 
 1052、1054、1055 絶対値演算部
 1056 乗算部 
 1053、1057 平方根算出部
 1061 第1のパワースペクトル算出部
 1062、1062A、1062B 第2のパワースペクトル算出部
 1091 乗算器
 1092 周波数-時間変換部
 2091 周波数-時間変換部
 2092 時変係数FIRフィルタ部
 3043 第3の時間-周波数変換部
 3063 第3のパワースペクトル算出部

Claims (19)

  1.  目的方向に感度を有する第1の音響信号を生成する第1の指向性合成部と、
     前記目的方向に感度死角を有する第2の音響信号を生成する第2の指向性合成部と、
     前記第2の指向性合成部で生成された前記第2の音響信号に対して、前記第1の指向性合成部で生成された前記第1の音響信号をN回(N>0)周波数領域で乗算することによって、前記目的方向の感度死角の角度範囲を前記第2の音響信号より狭くした第3の音響信号を生成する補正部と、
     前記第1の指向性合成部で生成された前記第1の音響信号を主信号とし、前記補正部で生成された前記第3の音響信号を参照信号として雑音抑圧を行うことで、前記第1の音響信号の前記目的方向の指向性を狭角化した出力音響信号を生成する抑圧部とを備える、
     指向性マイクロホン装置。
  2.  前記第1の指向性合成部および前記第2の指向性合成部は、複数のマイクロホンから構成されるマイクロホンアレイの出力信号を演算処理することで、前記第1の音響信号および前記第2の音響信号を生成する、
     請求項1に記載の指向性マイクロホン装置。
  3.  さらに、前記第1の指向性合成部で生成された前記第1の音響信号と、前記第2の指向性合成部で生成された前記第2の音響信号とを周波数領域の信号に変換する第1の変換部を備え、
     前記補正部は、前記第1の変換部で周波数領域の信号に変換された前記第2の音響信号に対して前記第1の変換部で周波数領域の信号に変換された前記第1の音響信号をN回(N>0)乗算することにより、前記第3の音響信号を生成する、
     請求項1または2に記載の指向性マイクロホン装置。
  4.  前記Nは、1であり、
     前記補正部は、
     周波数領域の信号に変換された前記第2の音響信号と周波数領域の信号に変換された前記第1の音響信号とを複素乗算するスペクトル乗算部と、
     前記スペクトル乗算部の出力信号の絶対値を算出する絶対値演算部と、
     前記絶対値演算部により算出された前記絶対値の平方根を算出することにより、前記第3の音響信号を生成する平方根算出部と、を有する、
     請求項1~3のいずれか1項に記載の指向性マイクロホン装置。
  5.  前記Nは、1であり、
     前記補正部は、
     周波数領域の信号に変換された前記第1の音響信号の第1の絶対値および周波数領域の信号に変換された前記第2の音響信号の第2の絶対値を算出する絶対値演算部と、
     前記絶対値演算部で算出された前記第1の絶対値と前記第2の絶対値との乗算を行う乗算部と、
     前記乗算部により行われた乗算値の平方根を算出することにより、前記第3の音響信号を生成する平方根算出部と、を有する、
     請求項1~3のいずれか1項に記載の指向性マイクロホン装置。
  6.  前記抑圧部は、
     前記第1の音響信号と前記第3の音響信号とのパワースペクトルを用いて、前記第1の音響信号に含まれる前記目的方向の音以外の音である雑音を抑圧する雑音抑圧係数を算出する雑音抑圧係数算出部と、
     前記第1の指向性合成部で生成された前記第1の音響信号に前記雑音抑圧係数算出部で算出された前記雑音抑圧係数を適用し、前記雑音を抑圧して前記目的方向の音のみを抽出することにより前記雑音抑圧を行うことで、前記出力音響信号を生成する雑音抑圧部と、を備える、
     請求項1~5のいずれか1項に記載の指向性マイクロホン装置。
  7.  さらに、周波数領域の信号に変換されている前記第1の音響信号および前記第3の音響信号のそれぞれのパワースペクトルを算出するパワースペクトル算出部を備え、
     前記抑圧部は、前記第1の音響信号または前記第1の変換部で周波数領域の信号に変換された前記第1の音響信号と、前記パワースペクトル算出部で算出された前記第1の音響信号のパワースペクトルとを主信号とし、前記パワースペクトル算出部で算出された前記第3の音響信号のパワースペクトルを参照信号として前記雑音抑圧を行うことで、前記出力音響信号を生成する、
     請求項3に記載の指向性マイクロホン装置。
  8.  前記パワースペクトル算出部は、前記補正部で生成された前記第3の音響信号の絶対値に対して(2/(N+1))乗の演算をすることにより、前記第3の音響信号のパワースペクトルを算出する、
     請求項7に記載の指向性マイクロホン装置。
  9.  前記抑圧部は、
     前記第3の音響信号のパワースペクトルに所定の係数を乗算して出力する第1の係数乗算部と、
     前記第1の音響信号のパワースペクトルから前記第1の係数乗算部からの出力信号を減算する第1の減算部と、
     前記第1の音響信号のパワースペクトルと前記第1の減算部からの出力信号とを入力として、前記第1の音響信号に含まれる前記目的方向の音以外の音である雑音を抑圧する雑音抑圧係数を算出する雑音抑圧係数算出部と、
     前記第1の音響信号または前記第1の変換部で周波数領域の信号に変換された前記第1の音響信号と前記雑音抑圧係数算出部で算出された前記雑音抑圧係数とを入力として前記雑音抑圧を行うことで、前記出力音響信号を生成する雑音抑圧処理部とを備える、
     請求項7または8に記載の指向性マイクロホン装置。
  10.  さらに、前記補正部における乗算回数である前記Nと、前記パワースペクトル算出部における(2/(N+1))乗のN値を変化させることで前記指向性マイクロホン装置の指向性を制御するビーム幅制御部を備える、
     請求項8に記載の指向性マイクロホン装置。
  11.  前記Nは、ゼロより大きい実数である、
     請求項7~10のいずれか1項に記載の指向性マイクロホン装置。
  12.  さらに、周波数領域の信号に変換された、前記第1の音響信号および前記第3の音響信号のそれぞれのパワースペクトルを算出するパワースペクトル算出部を備え、
     前記雑音抑圧係数算出部は、
     前記パワースペクトル算出部で算出された前記第1の音響信号のパワースペクトルを主信号とし、前記パワースペクトル算出部で算出された前記第3の音響信号のパワースペクトルを参照信号として、前記雑音抑圧係数を算出する、
     請求項6に記載の指向性マイクロホン装置。
  13.  前記指向性マイクロホン装置は、さらに、前記目的方向に感度死角を有し、かつ、前記第2の音響信号とは異なる指向性パターンを有する第4の音響信号を生成する第3の指向性合成部を備え、
     前記抑圧部は、さらに、前記補正部で生成された前記第3の音響信号を主信号とし、前記第3の指向性合成部で生成された前記第4の音響信号を参照信号として、前記第3の音響信号に含まれる前記目的方向に対して正反対の方向の音である第1の雑音を抑圧する反対方向雑音抑圧部と、
     前記第1の音響信号と前記第4の音響信号と前記反対方向雑音抑圧部の出力信号とを用いて、前記第1の雑音を含む前記目的方向の音以外の音である雑音を抑圧する雑音抑圧係数を算出する雑音抑圧係数算出部と、
     前記第1の指向性合成部で生成された前記第1の音響信号に前記雑音抑圧係数算出部で算出された前記雑音抑圧係数を適用し、前記雑音を抑圧して前記目的方向の音のみを抽出することにより前記雑音抑圧を行うことで、前記出力音響信号を生成する雑音抑圧部とを備える、
     請求項1~5のいずれか1項に記載の指向性マイクロホン装置。
  14.  さらに、前記第1の指向性合成部で生成された前記第1の音響信号と、前記第2の指向性合成部で生成された前記第2の音響信号と、前記第3の指向性合成部で生成された前記第4の音響信号とを周波数領域の信号に変換する第1の変換部と、
     前記第1の変換部で周波数領域の信号に変換された前記第1の音響信号と前記第3の音響信号と前記第4の音響信号とのそれぞれのパワースペクトルを算出するパワースペクトル算出部を備え、
     前記反対方向雑音抑圧部は、前記第3の音響信号のパワースペクトルを主信号とし、前記第4の音響信号のパワースペクトルを参照信号として、前記第1の雑音を抑圧する、
     請求項13に記載の指向性マイクロホン装置。
  15.  前記雑音抑圧係数算出部は、前記第1の音響信号のパワースペクトルを主信号とし、前記反対方向雑音抑圧部の出力信号及び前記第4の音響信号のパワースペクトルを参照信号として、前記雑音抑圧係数を算出する、
     請求項14に記載の指向性マイクロホン装置。
  16.  前記雑音抑圧部は、
     周波数領域の信号に変換された前記第1の音響信号と、前記雑音抑圧係数算出部で算出された前記雑音抑圧係数との乗算を行い、前記雑音を抑圧した前記目的方向の目的音響信号のみを抽出する乗算器と、
     前記乗算器で抽出された前記目的音響信号を時間領域の信号に変換することで、前記出力音響信号を生成する逆フーリエ変換部と、を有する、
     請求項6、13~15のいずれか1項に記載の指向性マイクロホン装置。
  17.  前記雑音抑圧部は、
     周波数領域の係数である前記雑音抑圧係数を時間領域のFIRフィルタの係数に変換する第2の変換部と、
     前記第2の変換部で変換された1単位時間前のFIRフィルタの係数を、前記第2の変換部で変換された現単位時間のFIRフィルタの係数を用いて更新し、前記第1の指向性合成部で生成された前記第1の音響信号にフィルタ処理を行うことにより、前記出力音響信号を生成する時変係数FIRフィルタ部と、を有する、
     請求項6、13~15のいずれか1項に記載の指向性マイクロホン装置。
  18.  目的方向に感度を有する第1の音響信号を生成する第1の指向性合成ステップと、
     前記目的方向に感度死角を有する第2の音響信号を生成する第2の指向性合成ステップと、
     前記第2の指向性合成ステップにおいて生成された前記第2の音響信号に対して、前記第1の指向性合成ステップにおいて生成された前記第1の音響信号をN回(N>0)周波数領域で乗算することによって、前記目的方向の感度死角の角度範囲を前記第2の音響信号より狭くした第3の音響信号を生成する補正ステップと、
     前記第1の指向性合成ステップにおいて生成された前記第1の音響信号を主信号とし、前記補正ステップにおいて生成された前記第3の音響信号を参照信号として雑音抑圧を行うことで、前記第1の音響信号の前記目的方向の指向性を狭角化した出力音響信号を生成する抑圧ステップとを含む、
     音響信号処理方法。
  19.  音響信号処理方法を行うためのプログラムであって、
     目的方向に感度を有する第1の音響信号を生成する第1の指向性合成ステップと、
     前記目的方向に感度死角を有する第2の音響信号を生成する第2の指向性合成ステップと、
     前記第2の指向性合成ステップにおいて生成された前記第2の音響信号に対して、前記第1の指向性合成ステップにおいて生成された前記第1の音響信号をN回(N>0)周波数領域で乗算することによって、前記目的方向の感度死角の角度範囲を前記第2の音響信号より狭くした第3の音響信号を生成する補正ステップと、
     前記第1の指向性合成ステップにおいて生成された前記第1の音響信号を主信号とし、前記補正ステップにおいて生成された前記第3の音響信号を参照信号として雑音抑圧を行うことで、前記第1の音響信号の前記目的方向の指向性を狭角化した出力音響信号を生成する抑圧ステップとを、
     コンピュータに実行させるためのプログラム。
PCT/JP2013/007474 2012-12-21 2013-12-19 指向性マイクロホン装置、音響信号処理方法およびプログラム WO2014097637A1 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
EP13865796.0A EP2938098B1 (en) 2012-12-21 2013-12-19 Directional microphone device, audio signal processing method and program
JP2014523122A JP6226301B2 (ja) 2012-12-21 2013-12-19 指向性マイクロホン装置、音響信号処理方法およびプログラム
US14/379,323 US9264797B2 (en) 2012-12-21 2013-12-19 Directional microphone device, acoustic signal processing method, and program

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2012-280246 2012-12-21
JP2012280246 2012-12-21
JP2012-283319 2012-12-26
JP2012283319 2012-12-26

Publications (1)

Publication Number Publication Date
WO2014097637A1 true WO2014097637A1 (ja) 2014-06-26

Family

ID=50977996

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2013/007474 WO2014097637A1 (ja) 2012-12-21 2013-12-19 指向性マイクロホン装置、音響信号処理方法およびプログラム

Country Status (4)

Country Link
US (1) US9264797B2 (ja)
EP (1) EP2938098B1 (ja)
JP (1) JP6226301B2 (ja)
WO (1) WO2014097637A1 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016163135A (ja) * 2015-02-27 2016-09-05 沖電気工業株式会社 収音装置、プログラム及び方法
CN113055803A (zh) * 2015-07-16 2021-06-29 索尼公司 信息处理装置、信息处理方法及计算机可读介质

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6809936B2 (ja) * 2017-02-28 2021-01-06 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 雑音抽出装置およびマイクロホン装置
US10708702B2 (en) * 2018-08-29 2020-07-07 Panasonic Intellectual Property Corporation Of America Signal processing method and signal processing device
WO2020089745A1 (en) 2018-10-31 2020-05-07 Cochlear Limited Combinatory directional processing of sound signals
EP3926976B1 (en) * 2019-02-15 2024-05-08 Panasonic Intellectual Property Corporation of America Information processing device, information processing method, and program
EP3764358B1 (en) 2019-07-10 2024-05-22 Analog Devices International Unlimited Company Signal processing methods and systems for beam forming with wind buffeting protection
EP3764660B1 (en) * 2019-07-10 2023-08-30 Analog Devices International Unlimited Company Signal processing methods and systems for adaptive beam forming
EP3764359B1 (en) 2019-07-10 2024-08-28 Analog Devices International Unlimited Company Signal processing methods and systems for multi-focus beam-forming
EP3764664A1 (en) 2019-07-10 2021-01-13 Analog Devices International Unlimited Company Signal processing methods and systems for beam forming with microphone tolerance compensation

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004187283A (ja) 2002-11-18 2004-07-02 Matsushita Electric Ind Co Ltd マイクロホン装置および再生装置
WO2012014451A1 (ja) 2010-07-26 2012-02-02 パナソニック株式会社 多入力雑音抑圧装置、多入力雑音抑圧方法、プログラムおよび集積回路

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7577262B2 (en) * 2002-11-18 2009-08-18 Panasonic Corporation Microphone device and audio player
JP4247037B2 (ja) 2003-01-29 2009-04-02 株式会社東芝 音声信号処理方法と装置及びプログラム
JP4919955B2 (ja) * 2005-11-01 2012-04-18 パナソニック株式会社 収音装置
EP1994788B1 (en) * 2006-03-10 2014-05-07 MH Acoustics, LLC Noise-reducing directional microphone array
JP5156260B2 (ja) 2007-04-27 2013-03-06 ニュアンス コミュニケーションズ,インコーポレイテッド 雑音を除去して目的音を抽出する方法、前処理部、音声認識システムおよびプログラム
KR101409169B1 (ko) * 2007-09-05 2014-06-19 삼성전자주식회사 억제 폭 조절을 통한 사운드 줌 방법 및 장치

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004187283A (ja) 2002-11-18 2004-07-02 Matsushita Electric Ind Co Ltd マイクロホン装置および再生装置
JP4286637B2 (ja) 2002-11-18 2009-07-01 パナソニック株式会社 マイクロホン装置および再生装置
WO2012014451A1 (ja) 2010-07-26 2012-02-02 パナソニック株式会社 多入力雑音抑圧装置、多入力雑音抑圧方法、プログラムおよび集積回路

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
See also references of EP2938098A4

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016163135A (ja) * 2015-02-27 2016-09-05 沖電気工業株式会社 収音装置、プログラム及び方法
CN113055803A (zh) * 2015-07-16 2021-06-29 索尼公司 信息处理装置、信息处理方法及计算机可读介质
CN113055803B (zh) * 2015-07-16 2022-10-28 索尼公司 信息处理装置、信息处理方法及计算机可读介质

Also Published As

Publication number Publication date
EP2938098B1 (en) 2019-04-03
JP6226301B2 (ja) 2017-11-08
EP2938098A1 (en) 2015-10-28
JPWO2014097637A1 (ja) 2017-01-12
US9264797B2 (en) 2016-02-16
EP2938098A4 (en) 2015-11-11
US20150016629A1 (en) 2015-01-15

Similar Documents

Publication Publication Date Title
JP6226301B2 (ja) 指向性マイクロホン装置、音響信号処理方法およびプログラム
JP5805365B2 (ja) ノイズ推定装置及び方法とそれを利用したノイズ減少装置
JP5493850B2 (ja) 信号処理装置、マイクロホン・アレイ装置、信号処理方法、および信号処理プログラム
JP4286637B2 (ja) マイクロホン装置および再生装置
JP5272920B2 (ja) 信号処理装置、信号処理方法、および信号処理プログラム
JP6216553B2 (ja) 伝搬遅延補正装置及び伝搬遅延補正方法
JP6371167B2 (ja) 残響抑制装置
WO2009104252A1 (ja) 音処理装置、音処理方法及び音処理プログラム
JP6204312B2 (ja) 収音装置
WO2015078501A1 (en) Method of operating a hearing aid system and a hearing aid system
JP2010124370A (ja) 信号処理装置、信号処理方法、および信号処理プログラム
JP4928382B2 (ja) 特定方向収音装置、特定方向収音方法、特定方向収音プログラム、記録媒体
JP6411780B2 (ja) オーディオ信号処理回路、その方法、それを用いた電子機器
WO2018229821A1 (ja) 信号処理装置、遠隔会議装置、および信号処理方法
JP6226885B2 (ja) 音源分離方法、装置、及びプログラム
JP4368917B2 (ja) 音響再生装置
JP2006237816A (ja) 演算装置、収音装置、及び、信号処理プログラム
WO2018042773A1 (ja) 収音装置、記録媒体及び方法
KR101903874B1 (ko) 듀얼 마이크 기반의 잡음 제거 방법 및 장치
JP6707914B2 (ja) ゲイン処理装置及びプログラム、並びに、音響信号処理装置及びプログラム
WO2013111348A1 (ja) 指向性制御方法及び装置
JP6263890B2 (ja) 音声信号処理装置及びプログラム
JP6295650B2 (ja) 音声信号処理装置及びプログラム
Huy et al. A New Approach for Enhancing MVDR Beamformer’s Performance
JP6221463B2 (ja) 音声信号処理装置及びプログラム

Legal Events

Date Code Title Description
ENP Entry into the national phase

Ref document number: 2014523122

Country of ref document: JP

Kind code of ref document: A

121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 13865796

Country of ref document: EP

Kind code of ref document: A1

WWE Wipo information: entry into national phase

Ref document number: 14379323

Country of ref document: US

WWE Wipo information: entry into national phase

Ref document number: 2013865796

Country of ref document: EP

NENP Non-entry into the national phase

Ref country code: DE