WO2022102311A1 - 収音装置 - Google Patents

収音装置 Download PDF

Info

Publication number
WO2022102311A1
WO2022102311A1 PCT/JP2021/037473 JP2021037473W WO2022102311A1 WO 2022102311 A1 WO2022102311 A1 WO 2022102311A1 JP 2021037473 W JP2021037473 W JP 2021037473W WO 2022102311 A1 WO2022102311 A1 WO 2022102311A1
Authority
WO
WIPO (PCT)
Prior art keywords
microphone
microphone elements
signal
dimensional arrangement
arrangement example
Prior art date
Application number
PCT/JP2021/037473
Other languages
English (en)
French (fr)
Inventor
成悟 榎本
良文 廣瀬
慎一 杠
Original Assignee
パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ filed Critical パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ
Priority to JP2022561339A priority Critical patent/JPWO2022102311A1/ja
Priority to CN202180073637.1A priority patent/CN116472720A/zh
Publication of WO2022102311A1 publication Critical patent/WO2022102311A1/ja
Priority to US18/137,789 priority patent/US20230262374A1/en

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/20Arrangements for obtaining desired frequency or directional characteristics
    • H04R1/32Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
    • H04R1/40Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
    • H04R1/406Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/08Mouthpieces; Microphones; Attachments therefor
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0272Voice signal separating
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/005Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2201/00Details of transducers, loudspeakers or microphones covered by H04R1/00 but not provided for in any of its subgroups
    • H04R2201/40Details of arrangements for obtaining desired directional characteristic by combining a number of identical transducers covered by H04R1/40 but not provided for in any of its subgroups
    • H04R2201/4012D or 3D arrays of transducers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2201/00Details of transducers, loudspeakers or microphones covered by H04R1/00 but not provided for in any of its subgroups
    • H04R2201/40Details of arrangements for obtaining desired directional characteristic by combining a number of identical transducers covered by H04R1/40 but not provided for in any of its subgroups
    • H04R2201/405Non-uniform arrays of transducers or a plurality of uniform arrays with different transducer spacing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2430/00Signal processing covered by H04R, not provided for in its groups
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2430/00Signal processing covered by H04R, not provided for in its groups
    • H04R2430/03Synergistic effects of band splitting and sub-band processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2430/00Signal processing covered by H04R, not provided for in its groups
    • H04R2430/20Processing of the output signals of the acoustic transducers of an array for obtaining a desired directivity characteristic
    • H04R2430/21Direction finding using differential microphone array [DMA]

Definitions

  • This disclosure relates to a sound collecting device for performing beamforming.
  • Non-Patent Document 1 discloses a generalized sidelobes canceller (GSC) as an example of a beam former using an adaptive filter.
  • GSC generalized sidelobes canceller
  • the present disclosure provides a sound collecting device capable of effectively suppressing sounds other than the target sound.
  • the sound collecting device includes a plurality of microphone elements three-dimensionally distributed, and two of a microphone pair composed of any two microphone elements included in the plurality of microphone elements.
  • the total number of effective microphone pairs in which the distance between the microphone elements is less than the distance D is larger than the total number of the plurality of microphone elements, and the distance D sets the frequency of the target sound obtained from the plurality of microphone elements to f and the sound velocity.
  • D c / 2f
  • the straight line connecting the two microphone elements constituting the effective microphone pair is not parallel to any of the straight lines connecting the two microphone elements constituting the other effective microphone pair.
  • the sound collecting device can effectively suppress sounds other than the target sound.
  • FIG. 1 is an external perspective view of the sound collecting device according to the embodiment.
  • FIG. 2 is a block diagram showing a functional configuration of the sound collecting device according to the embodiment.
  • FIG. 3 is a diagram schematically showing a calculation formula of an output signal based on the sensitivity characteristics of the main signal, the reference signal, and the output signal.
  • FIG. 4 is a diagram showing a three-dimensional arrangement example 1 of a plurality of microphone elements.
  • FIG. 5 is a diagram showing an example of planar arrangement of a plurality of microphone elements.
  • FIG. 6 is a diagram showing the sensitivity characteristics of the reference signal generated by the sound collecting device in which the three-dimensional arrangement example 1 is adopted in the direction along the XZ plane.
  • FIG. 1 is an external perspective view of the sound collecting device according to the embodiment.
  • FIG. 2 is a block diagram showing a functional configuration of the sound collecting device according to the embodiment.
  • FIG. 3 is a diagram schematically showing a calculation formula of an output signal based on the sensitivity characteristics of
  • FIG. 7 is a diagram showing the sensitivity characteristics of the reference signal generated by the sound collecting device in which the planar arrangement example is adopted in the direction along the XZ plane.
  • FIG. 8 is a diagram for explaining a method of calculating the sensitivity characteristics of FIGS. 6 and 7.
  • FIG. 9 is a diagram showing the frequency characteristics of the main signal having the 90-degree direction along the XZ plane as the target sound direction, which is generated by the sound collecting device in which the three-dimensional arrangement example 1 is adopted.
  • FIG. 10 is a diagram showing a three-dimensional arrangement example 2 of a plurality of microphone elements.
  • FIG. 11 is a diagram showing the frequency characteristics of the main signal having the 90-degree direction along the XZ plane as the target sound direction, which is generated by the sound collecting device in which the three-dimensional arrangement example 2 is adopted.
  • FIG. 12 is a diagram showing a three-dimensional arrangement example 3 of a plurality of microphone elements.
  • FIG. 13 is a diagram showing the frequency characteristics of the main signal having the 90-degree direction along the XZ plane as the target sound direction, which is generated by the sound collecting device in which the three-dimensional arrangement example 3 is adopted.
  • FIG. 14 is a diagram showing the sensitivity characteristics of the reference signal generated by the sound collecting device in which the three-dimensional arrangement example 1 is adopted in the direction along the XY plane.
  • FIG. 15 is a diagram showing the sensitivity characteristics of the reference signal generated by the sound collecting device in which the planar arrangement example is adopted in the direction along the XY plane.
  • FIG. 16 is a diagram for explaining a method of calculating the sensitivity characteristics of FIGS. 14 and 15.
  • FIG. 17 is a diagram showing a three-dimensional arrangement example 4 of a plurality of microphone elements.
  • FIG. 18 is a diagram showing the sensitivity characteristics of the reference signal generated by the sound collecting device in which the three-dimensional arrangement example 4 is adopted in the direction along the XY plane.
  • FIG. 19 is a diagram showing a three-dimensional arrangement example 5 of a plurality of microphone elements.
  • FIG. 20 is a diagram showing the sensitivity characteristics of the reference signal generated by the sound collecting device in which the three-dimensional arrangement example 5 is adopted in the direction along the XY plane.
  • FIG. 21 is a diagram showing the frequency characteristics of the main signal having the 90-degree direction along the XY plane as the target sound direction, which is generated by the sound collecting device in which the plane arrangement example is adopted.
  • FIG. 22 is a diagram showing the frequency characteristics of the main signal having the 90-degree direction along the XY plane as the target sound direction, which is generated by the sound collecting device in which the three-dimensional arrangement example 1 is adopted.
  • FIG. 23 is a diagram showing the frequency characteristics of the main signal having the 90-degree direction along the XY plane as the target sound direction, which is generated by the sound collecting device in which the three-dimensional arrangement example 4 is adopted.
  • FIG. 24 is a diagram showing the frequency characteristics of the main signal having the 90-degree direction along the XY plane as the target sound direction, which is generated by the sound collecting device in which the three-dimensional arrangement example 5 is adopted.
  • FIG. 25 is a diagram showing an example in which a plurality of microphone elements are arranged at the positions of the vertices of a quadrangular pyramid.
  • FIG. 26 is a diagram showing an example in which a plurality of microphone elements are arranged on the circumference of the bottom surface of the cone and at the apex.
  • each figure is a schematic diagram and is not necessarily exactly illustrated. Further, in each figure, the same reference numerals may be given to substantially the same configurations, and duplicate explanations may be omitted or simplified.
  • the direction is expressed as the target sound direction
  • the sound is expressed as the target sound.
  • sounds other than the target sound may be expressed as noise.
  • FIG. 1 is an external perspective view of the sound collecting device according to the embodiment.
  • FIG. 2 is a block diagram showing a functional configuration of the sound collecting device according to the embodiment.
  • the sound collecting device 10 is a substantially disk-shaped device.
  • the sound collecting device 10 is installed on a desk, for example, and is used for acquiring voice in a telephone conference or the like.
  • the shape of the sound collecting device 10 is not limited to a substantially disk shape.
  • the sound collecting device 10 includes a plurality of microphone elements 20a to 20d and a signal processing unit 30 inside the main body as shown in FIG.
  • the plurality of microphone elements 20a to 20d constitute a microphone array 20. It is not essential that the sound collecting device 10 includes the signal processing unit 30, and the signal processing unit 30 may be realized as a device different from the sound collecting device 10.
  • the plurality of microphone elements 20a to 20d are microphone arrays 20 for generating main signals Xm and reference signals Xr1 to Xr6 used for beamforming.
  • the plurality of microphone elements 20a to 20d are used by the signal processing unit 30, which is a beamformer, to acquire an audio signal.
  • the plurality of microphone elements 20a to 20d are arranged on the same plane.
  • the sound collecting device 10 includes four microphone elements 20a to 20d, but the total number of microphone elements is not particularly limited. The total number of microphone elements may be an even number or an odd number.
  • the sound collecting device 10 may include, for example, four or more microphone elements.
  • the signal processing unit 30 is a beamformer that performs beamforming using audio signals obtained from each of the plurality of microphone elements 20a to 20d.
  • Beamforming of the signal processing unit 30 is signal processing that forms directivity so that noise becomes a blind spot while ensuring sensitivity in the direction of the target sound. That is, according to the beamforming of the signal processing unit 30, noise coming from a direction other than the target sound direction is suppressed.
  • Each of the plurality of microphone elements 20a to 20d is an omnidirectional microphone element, but the sound collecting device 10 has high sensitivity in the target sound direction due to the beamforming of the signal processing unit 30.
  • the signal processing unit 30 has the same configuration as the generalized sidelobes canceller.
  • the signal processing unit 30 is realized by a processor such as a DSP (Digital Signal Processor), for example, but may be realized by a microcomputer or a circuit. Further, the signal processing unit 30 may be realized by a combination of two or more of a processor, a microcomputer, and a circuit.
  • the signal processing unit 30 includes delay devices 31a to 31d, a main signal generation unit 31, reference signal generation units 32a to 32f, adaptive filter units 33a to 33f, a subtraction unit 34, and a coefficient updating unit 35.
  • the delay devices 31a to 31d have a one-to-one correspondence with the audio signals obtained from each of the plurality of microphone elements 20a to 20d.
  • the delay devices 31a to 31d give a delay according to the target sound direction to the audio signals obtained from the plurality of microphone elements 20a to 20d, and output them as output signals.
  • the main signal generation unit 31 is an example of the first signal generation unit, and is an audio signal obtained from each of the plurality of microphone elements 20a to 20d, and the delay devices 31a to 31d delay according to the target sound direction.
  • the main signal X m is generated by adding the given audio signals.
  • the main signal X m is an example of the first signal.
  • Each of the reference signal generation units 32a to 32f is an example of the second signal generation unit.
  • the reference signal generation units 32a to 32f correspond one-to-one to six sets of microphone pairs composed of any two microphone elements included in the plurality of microphone elements 20a to 20d.
  • One reference signal generation unit is an audio signal obtained from each of the microphone elements constituting one set of microphone pairs, and subtracts an audio signal to which a delay corresponding to a target sound direction is given by delayers 31a to 31d. By doing so, a reference signal is generated.
  • Each of the reference signals X r1 to X r6 is an example of the second signal.
  • the adaptive filter units 33a to 33f correspond to the reference signal generation units 32a to 32f on a one-to-one basis.
  • the adaptive filter units 33a to 33f apply the filter coefficients ⁇ 1 to ⁇ 6 to the corresponding reference signal generation units 32a to 32f.
  • the reference signal generation unit 32a is a voice signal (output signal of the delayers 31a and 31b) in which the voice signals obtained from the microphone elements 20a and 20b are delayed according to the target sound direction by the delayers 31a and 31b. ) Is subtracted to generate the reference signal X r1 .
  • the adaptive filter unit 33a applies the filter coefficient ⁇ 1 to the reference signal X r1 .
  • the reference signal generation unit 32b is an audio signal (output of the delay devices 31a and 31c) in which the audio signals obtained from the microphone elements 20a and 20c are delayed according to the target sound direction by the delay devices 31a and 31c, respectively.
  • the reference signal Xr2 is generated by subtracting the signal).
  • the adaptive filter unit 33b applies the filter coefficient ⁇ 2 to the reference signal X r2 .
  • the reference signal generation unit 32c provides an audio signal (output signals of the delayers 31a and 31d) obtained by the delayers 31a and 31d to delay the audio signals obtained from the microphone elements 20a and 20d, respectively, according to the target sound direction.
  • the reference signal X r3 is generated by subtraction.
  • the adaptive filter unit 33c applies the filter coefficient ⁇ 3 to the reference signal X r3 .
  • the reference signal generation unit 32d outputs an audio signal (output signal of the delayers 31b and 31c) to which the audio signals obtained from the microphone elements 20b and 20c are delayed according to the target sound direction by the delayers 31b and 31c.
  • the reference signal Xr4 is generated by subtraction.
  • the adaptive filter unit 33d applies the filter coefficient ⁇ 4 to the reference signal X r4 .
  • the reference signal generation unit 32e outputs an audio signal (output signal of the delayers 31b and 31d) to which the audio signals obtained from the microphone elements 20b and 20d are delayed according to the target sound direction by the delayers 31b and 31d.
  • the reference signal X r5 is generated by subtraction.
  • the adaptive filter unit 33e applies the filter coefficient ⁇ 5 to the reference signal X r5 .
  • the reference signal generation unit 32f outputs an audio signal (output signal of the delay devices 31c and 31d) obtained by giving a delay according to the target sound direction by the delay devices 31c and 31d to the audio signals obtained from the microphone elements 20c and 20d, respectively.
  • the reference signal Xr6 is generated by subtraction.
  • the adaptive filter unit 33f applies a filter coefficient ⁇ 6 to the reference signal X r6 .
  • the subtracting unit 34 subtracts the reference signals X r1 to X r6 to which the filter coefficients ⁇ 1 to ⁇ 6 are applied from the generated main signal X m .
  • the output signal Y obtained as a result of the subtraction is expressed by the following equation 1.
  • the output signal Y is an example of the third signal.
  • the coefficient updating unit 35 updates the filter coefficients ⁇ 1 to ⁇ 6 based on the output signal Y obtained by the subtraction of the subtracting unit.
  • FIG. 3 is a diagram schematically showing Equation 1 according to the sensitivity characteristics of the main signal X m , the reference signal X r , and the output signal Y.
  • the reference signal X r is the sum of the reference signals X r1 to X r6 to which the filter coefficients ⁇ 1 to ⁇ 6 are applied ( ⁇ 1 X r1 + ⁇ 2 X r2 + ⁇ 3 X r3 + ⁇ 4 X r4 + ⁇ 5 X r5 + ⁇ . It means 6 X r6 ).
  • the sensitivity characteristic is, in other words, directivity.
  • the main signal X m has high sensitivity in all directions.
  • the reference signal Xr has low sensitivity in the target sound direction due to the adaptive filter units 33a to 33f and the coefficient updating unit 35. Therefore, the output signal Y obtained by subtracting the reference signal Xr from the main signal Xm has high sensitivity in the target sound direction.
  • the target sound direction is the beam direction.
  • the signal processing unit 30 can change the beam direction in the output signal Y.
  • the sound collecting device 10 includes a user interface such as a touch panel or an operation button, and the signal processing unit 30 changes the beam direction based on the operation of the user received through the user interface.
  • the signal processing unit 30 detects the volume and the like and automatically changes the beam direction.
  • the signal processing unit 30 performs beamforming with variable beam direction, it is necessary to reduce the sensitivity of the output signal Y in any direction other than the beam direction as much as possible. .. Therefore, in the sound collecting device 10, the arrangement of a plurality of microphone elements 20a to 20d is defined in order to secure such performance.
  • the total number of effective microphone pairs is larger than the total number of the plurality of microphone elements 20a to 20d.
  • the effective microphone pair is a microphone pair in which the distance between the two microphone elements is less than the distance D among the microphone pairs composed of any two microphone elements included in the plurality of microphone elements 20a to 20d.
  • the total number of effective microphone pairs is 6, and the total number of the plurality of microphone elements is 4.
  • the reference signal calculated from the ineffective microphone pair in which the distance between the two microphone elements is equal to or greater than the distance D has the sensitivity assumed from the arrangement of the ineffective microphone pair due to the fact that a folding component is generated in the signal processing. May not have characteristics. That is, the reference signal calculated from the ineffective microphone pair may have an unexpected sensitivity characteristic, which hinders the generation of a highly accurate output signal Y.
  • the total number of effective microphone pairs is larger than the total number of the plurality of microphone elements 20a to 20d, so that highly accurate output signal Y can be generated.
  • the microphone pairs obtained from the plurality of microphone elements 20a to 20d are all effective microphone pairs. That is, the total number of microphone pairs obtained from the plurality of microphone elements 20a to 20d is equal to the total number of effective microphone pairs. However. A part of the microphone pair obtained from the plurality of microphone elements 20a to 20d may be an effective microphone pair.
  • FIG. 4 is a diagram showing a three-dimensional arrangement example 1 of a plurality of microphone elements 20a to 20d.
  • the unit of the numerical value described on the X-axis, the Y-axis, and the Z-axis is meters.
  • the plurality of microphone elements 20a to 20d are arranged at the positions of the vertices of a regular tetrahedron having a side of about 2.1 cm (0.021 in the coordinates of FIG. 4).
  • the length of one side of the regular tetrahedron is 2.1 cm, which is determined by assuming a half wavelength of a frequency of 8 kHz.
  • any straight line connecting the two microphone elements constituting the effective microphone pair is not parallel to any of the straight lines connecting the two microphone elements constituting the other effective microphone pair.
  • the straight line (line segment) L1 shown by the broken line in FIG. 4 is not parallel to any of the other straight lines L2 to L6.
  • FIG. 5 is a diagram showing an example of planar arrangement of a plurality of microphone elements 20a to 20c.
  • the unit of the numerical value described on the X-axis, the Y-axis, and the Z-axis is meters.
  • the arrangement of the microphone element 20a, the microphone element 20b, and the microphone element 20c is the same as that of the three-dimensional arrangement example 1, but the coordinates of the microphone element 20d are (0, 0, 0).
  • the plurality of microphone elements 20a to 20d are arranged on the same plane.
  • FIG. 6 is a diagram showing the sensitivity characteristics of the reference signal generated by the sound collecting device 10 in which the three-dimensional arrangement example 1 is adopted in the direction along the XZ plane.
  • FIG. 7 is a diagram showing the sensitivity characteristics of the reference signal generated by the sound collecting device 10 in which the planar arrangement example is adopted in the direction along the XZ plane.
  • FIG. 8 is a diagram for explaining a method of calculating the sensitivity characteristics of FIGS. 6 and 7.
  • the unit of the numerical value described on the X-axis, the Y-axis, and the Z-axis is meters.
  • Each of the six columns in FIGS. 6 and 7 shows the sensitivity characteristics of the reference signal generated using the microphone pair.
  • the sensitivity characteristic is, in other words, a directivity pattern.
  • the leftmost column of the six columns in FIGS. 6 and 7 corresponds to a reference signal (corresponding to the reference signal Xr3 in FIG. 2) generated by using a microphone pair composed of the microphone element 20d and the microphone element 20a. ) Shows the sensitivity characteristics.
  • the second column from the left shows the sensitivity characteristics of the reference signal (corresponding to the reference signal Xr5 in FIG. 2) generated by using the microphone pair composed of the microphone element 20d and the microphone element 20b.
  • the third column from the left shows the sensitivity characteristics of the reference signal (corresponding to the reference signal Xr6 in FIG. 2) generated by using the microphone pair composed of the microphone element 20d and the microphone element 20c.
  • the fourth column from the left shows the sensitivity characteristics of the reference signal (corresponding to the reference signal Xr1 in FIG. 2) generated by using the microphone pair composed of the microphone element 20a and the microphone element 20b.
  • the fifth column from the left shows the sensitivity characteristics of the reference signal (corresponding to the reference signal Xr2 in FIG. 2) generated by using the microphone pair composed of the microphone element 20a and the microphone element 20c.
  • the sixth column from the left shows the sensitivity characteristics of the reference signal (corresponding to the reference signal Xr4 in FIG. 2) generated by using the microphone pair composed of the microphone element 20b and the microphone element 20c.
  • the three sensitivity characteristics include the sensitivity characteristic of the reference signal having a blind spot in the 90-degree direction, the sensitivity characteristic of the reference signal having a blind spot in the 60-degree direction, and the sensitivity characteristic of the reference signal having a blind spot in the 30-degree direction. ..
  • the 90-degree direction means the Z-axis plus direction
  • the 60-degree direction is the direction in which the angle is shifted by 30 degrees along the XZ plane from the Z-axis plus direction.
  • the 30-degree direction is a direction in which the angle is shifted by 60 degrees along the XZ plane from the Z-axis plus direction.
  • the sensitivity characteristics shown in FIGS. 6 and 7 are located at a radius of 1.5 m around the microphone array 20 (aggregate of a plurality of microphone elements 20a to 20d) (FIG. 8). It is a sensitivity characteristic in (shown by a broken line in 8).
  • the sensitivity characteristics of the microphone pair including the microphone element 20d are higher in the three-dimensional arrangement example 1 (FIG. 6) than in the plane arrangement example (FIG. 7). It is diverse. That is, if the plurality of microphone elements 20a to 20d are three-dimensionally distributed, the variation in the sensitivity characteristics of the reference signal can be increased as compared with the case where the plurality of microphone elements 20a to 20d are arranged on the same plane. Can be done. The increased variation in sensitivity characteristics is very advantageous for the noise suppression algorithm based on the generalized sidelobes canceller executed by the signal processing unit 30. If the variation in the sensitivity characteristics of the reference signal is increased, the sound collecting device 10 can reduce noise in various directions. That is, the sound collecting device 10 can effectively suppress sounds other than the target sound.
  • FIG. 9 is a diagram showing the frequency characteristics of the main signal whose target sound direction is the 90-degree direction along the XZ plane.
  • FIG. 9 shows the frequency characteristics in the 90-degree direction, the frequency characteristics in the 30-degree direction, and the frequency characteristics in the 0-degree direction of the main signal whose target sound direction is the 90-degree direction.
  • the vertical axis indicates the sound pressure level (SPL: Sound Pressure Level), and the horizontal axis indicates the frequency.
  • the sound pressure level is generally flat in the frequency band of 0 to 8 kHz.
  • the sound pressure level is attenuated in the high frequency range.
  • the sound pressure level is further attenuated in the high frequency range than in the 30 degree direction.
  • the sound collecting device 10 in which the three-dimensional arrangement example 1 is adopted can generate a main signal having directivity in the target sound direction (90 degree direction).
  • the inventors tried to improve the directivity of the main signal by adjusting the position of the microphone element 20d in the three-dimensional arrangement example 1. Specifically, the inventors calculated the frequency characteristics of the main signals in the three-dimensional arrangement example 2 and the three-dimensional arrangement example 3.
  • FIG. 10 is a diagram showing a three-dimensional arrangement example 2 of a plurality of microphone elements 20a to 20d.
  • FIG. 11 is a diagram showing the frequency characteristics of the main signal having the 90-degree direction along the XZ plane as the target sound direction, which is generated by the sound collecting device 10 in which the three-dimensional arrangement example 2 is adopted.
  • FIG. 11 shows the frequency characteristics in the 90-degree direction, the frequency characteristics in the 30-degree direction, and the frequency characteristics in the 0-degree direction of the main signal whose target sound direction is the 90-degree direction.
  • the vertical axis indicates the sound pressure level
  • the horizontal axis indicates the frequency.
  • the arrangement of the microphone element 20a, the microphone element 20b, and the microphone element 20c is the same as that of the three-dimensional arrangement example 1.
  • the microphone element 20d is located on the plus side in the Z-axis direction with respect to the three-dimensional arrangement example 1, and the coordinates of the microphone element 20d are (0, 0, 1.5 ⁇ Z1). That is, in the three-dimensional arrangement example 2, the position (height) of the microphone element 20d with respect to the XY plane is 1.5 times that of the three-dimensional arrangement example 1.
  • the distance from the microphone element 20d to each of the microphone elements 20a to 20c is about 2.9 cm (0.029 in the coordinates of FIG. 10).
  • the frequency characteristic in the 90-degree direction of the main signal having the 90-degree direction as the target sound direction generated by the sound collecting device 10 in which the three-dimensional arrangement example 2 is adopted is 0 to 8 kHz.
  • the sound pressure level is generally flat in the frequency band.
  • the frequency characteristic of the main signal in the 30-degree direction when the three-dimensional arrangement example 2 is adopted the sound pressure level is attenuated in the high frequency range, but the frequency at which the sound pressure level begins to be attenuated is the three-dimensional arrangement example 1. Lower than if.
  • the sound pressure level is attenuated in the high frequency range, but the frequency at which the sound pressure level begins to be attenuated is the three-dimensional arrangement example 1. Is lower than if was adopted. That is, the sound collecting device 10 in which the three-dimensional arrangement example 2 is adopted can generate a main signal in which the frequency at which the sound pressure level starts to be attenuated is lower than that in the case of the three-dimensional arrangement example 1 in a direction other than the target sound direction. .. That is, the sound collecting device 10 in which the three-dimensional arrangement example 2 is adopted can generate a main signal having a sharper directivity in a high frequency range.
  • FIG. 12 is a diagram showing a three-dimensional arrangement example 3 of a plurality of microphone elements 20a to 20d.
  • FIG. 13 is a diagram showing the frequency characteristics of the main signal having the 90-degree direction along the XZ plane as the target sound direction, which is generated by the sound collecting device 10 in which the three-dimensional arrangement example 3 is adopted.
  • FIG. 13 shows the frequency characteristics in the 90-degree direction, the frequency characteristics in the 30-degree direction, and the frequency characteristics in the 0-degree direction of the main signal whose target sound direction is the 90-degree direction.
  • the vertical axis indicates the sound pressure level
  • the horizontal axis indicates the frequency.
  • the arrangement of the microphone element 20a, the microphone element 20b, and the microphone element 20c is the same as that of the three-dimensional arrangement example 1.
  • the microphone element 20d is located on the plus side in the Y-axis direction with respect to the three-dimensional arrangement example 1, and the coordinates of the microphone element 20d are (0, Y1, Z1).
  • the distance from the microphone element 20d to the microphone element 20a is about 1.9 cm (0.019 in the coordinates of FIG. 12).
  • the distance from the microphone element 20d to each of the microphone element 20b and the microphone element 20c is about 2.3 cm (0.023 in the coordinates of FIG. 12).
  • the frequency characteristics of the main signal having the 90-degree direction as the target sound direction generated by the sound collecting device 10 in which the three-dimensional arrangement example 3 is adopted are the 90-degree direction, the 30-degree direction, and the frequency characteristics. It is about the same as the three-dimensional arrangement example 1 in each of the 0 degree directions. That is, the sound collecting device 10 in which the three-dimensional arrangement example 3 is adopted can generate a main signal having directivity in the target sound direction (90 degree direction).
  • FIG. 14 is a diagram showing the sensitivity characteristics of the reference signal generated by the sound collecting device 10 in which the three-dimensional arrangement example 1 is adopted in the direction along the XY plane.
  • FIG. 15 is a diagram showing the sensitivity characteristics of the reference signal generated by the sound collecting device 10 in which the planar arrangement example is adopted in the direction along the XY plane.
  • FIG. 16 is a diagram for explaining a method of calculating the sensitivity characteristics of FIGS. 14 and 15. In FIG. 16, the unit of the numerical value described on the X-axis, the Y-axis, and the Z-axis is meters.
  • the sensitivity characteristics shown in FIGS. 14 and 15 show the sensitivity characteristics of the reference signal in the same format as in FIGS. 6 and 7.
  • the 90-degree direction means the Y-axis plus direction
  • the 60-degree direction is the direction in which the angle is shifted by 30 degrees along the XY plane from the Y-axis plus direction. Is.
  • the 30-degree direction is a direction in which the angle is shifted by 60 degrees along the XY plane from the Y-axis plus direction.
  • the sensitivity characteristics shown in FIGS. 14 and 15 are located at a radius of 1.5 m around the microphone array 20 (aggregate of a plurality of microphone elements 20a to 20d) (FIG. 16). 16 is the sensitivity characteristic in (shown by a broken line).
  • the sensitivity characteristics of the microphone pair including the microphone element 20d are almost the same in the three-dimensional arrangement example 1 and the two-dimensional arrangement example. That is, even if the plurality of microphone elements 20a to 20d are three-dimensionally distributed, the variation in the sensitivity characteristics of the reference signal is not reduced as compared with the case where the plurality of microphone elements 20a to 20d are arranged on the same plane. It can be said that there is no such thing. That is, it can be said that by sterically distributing and arranging the plurality of microphone elements 20a to 20d, the performance does not deteriorate as compared with the case where the plurality of microphone elements 20a to 20d are arranged on the same plane.
  • the inventors confirmed how the sensitivity characteristic of the reference signal changes by adjusting the position of the microphone element 20d in the three-dimensional arrangement example 1. Specifically, the inventors calculated the sensitivity characteristics in the following three-dimensional arrangement example 4 and three-dimensional arrangement example 5.
  • FIG. 17 is a diagram showing a three-dimensional arrangement example 4 of a plurality of microphone elements 20a to 20d.
  • FIG. 18 is a diagram showing the sensitivity characteristics of the reference signal generated by the sound collecting device 10 in which the three-dimensional arrangement example 4 is adopted in the direction along the XY plane.
  • the arrangement of the microphone element 20a, the microphone element 20b, and the microphone element 20c is the same as that of the three-dimensional arrangement example 1.
  • the microphone element 20d is shifted from the position in the three-dimensional arrangement example 1 in each of the Y-axis direction and the Z-axis direction. When viewed from the Z-axis direction, the position of the microphone element 20d does not overlap with any of the positions of the microphone element 20a, the microphone element 20b, and the microphone element 20c. That is, the microphone element 20d is not located directly above the microphone element 20a, the microphone element 20b, and the microphone element 20c.
  • the sensitivity characteristics of the microphone pair including the microphone element 20d are significantly different between the three-dimensional arrangement example 1 and the three-dimensional arrangement example 4. That is, by changing the position of the microphone element 20d, the variation of the sensitivity characteristic of the reference signal can be made different.
  • FIG. 19 is a diagram showing a three-dimensional arrangement example 5 of a plurality of microphone elements 20a to 20d.
  • FIG. 20 is a diagram showing the sensitivity characteristics of the reference signal generated by the sound collecting device 10 in which the three-dimensional arrangement example 5 is adopted in the direction along the XY plane.
  • the arrangement of the microphone element 20a and the microphone element 20d is the same as that of the three-dimensional arrangement example 1.
  • the distance between the microphone element 20b and the microphone element 20c is wider than that of the three-dimensional arrangement example 1.
  • the microphone element 20b is located on the minus side in the X-axis direction with respect to the three-dimensional arrangement example 1
  • the microphone element 20c is located on the plus side in the X-axis direction with respect to the three-dimensional arrangement example 1.
  • the positions of the microphone elements 20b and 20c are different between the three-dimensional arrangement example 1 and the three-dimensional arrangement example 5. Therefore, the sensitivity characteristics obtained from the microphone pair in which the microphone element 20a and the microphone element 20d are combined in the leftmost column of FIGS. 14 and 20 are not different between the three-dimensional arrangement example 1 and the three-dimensional arrangement example 5. ..
  • the sensitivity characteristics of the microphone pair including the microphone element 20b and the microphone element 20c are different between the three-dimensional arrangement example 1 and the three-dimensional arrangement example 5. That is, by changing the positions of the microphone element 20b and the microphone element 20c, the variation of the sensitivity characteristic of the reference signal can be made different.
  • FIG. 21 is a diagram showing the frequency characteristics of the main signal having the 90-degree direction along the XY plane as the target sound direction, which is generated by the sound collecting device 10 in which the plane arrangement example is adopted.
  • FIG. 22 is a diagram showing the frequency characteristics of the main signal having the 90-degree direction along the XY plane as the target sound direction, which is generated by the sound collecting device 10 in which the three-dimensional arrangement example 1 is adopted.
  • FIG. 23 is a diagram showing the frequency characteristics of the main signal having the 90-degree direction along the XY plane as the target sound direction, which is generated by the sound collecting device 10 in which the three-dimensional arrangement example 4 is adopted.
  • FIG. 24 is a diagram showing the frequency characteristics of the main signal having the 90-degree direction along the XY plane as the target sound direction, which is generated by the sound collecting device 10 in which the three-dimensional arrangement example 5 is adopted.
  • FIGS. 21 to 24 show the frequency characteristics in the 90-degree direction, the frequency characteristics in the 30-degree direction, and the frequency characteristics in the 0-degree direction of the main signal whose target sound direction is the 90-degree direction.
  • the vertical axis indicates the sound pressure level
  • the horizontal axis indicates the frequency.
  • the frequency characteristics of the main signal when the three-dimensional arrangement example 1 is adopted are in the 90-degree direction, the 30-degree direction, and the 0-degree direction. In each of the above, it can be said that it is about the same as the case where the plane arrangement example is adopted.
  • the frequency characteristics of the main signal when the three-dimensional arrangement example 4 is adopted are the three-dimensional arrangement example in the 90-degree direction and the 30-degree direction. It can be said that it is about the same as the case where 1 is adopted.
  • the amount of suppression of the sound pressure level in the frequency band of 7 kHz or higher when the three-dimensional arrangement example 4 is adopted is smaller than that when the three-dimensional arrangement example 1 is adopted.
  • the frequency characteristic of the main signal when the three-dimensional arrangement example 5 is adopted is that the three-dimensional arrangement example 1 is adopted in the 90-degree direction. It can be said that it is about the same as the case.
  • the amount of suppression of the sound pressure level in the frequency band of 4 kHz or higher when the three-dimensional arrangement example 5 is adopted is larger than that when the three-dimensional arrangement example 1 is adopted.
  • the amount of suppression of the sound pressure level in the frequency band of 4 kHz to 5 kHz when the three-dimensional arrangement example 5 is adopted is larger than that when the three-dimensional arrangement example 1 is adopted.
  • the amount of suppression of the sound pressure level in the frequency band of 7 kHz or higher is smaller than that in the case where the three-dimensional arrangement example 1 is adopted.
  • the sound collecting device 10 in which the three-dimensional arrangement example 1, the three-dimensional arrangement example 4, and the three-dimensional arrangement example 5 are adopted can generate a main signal having directivity in the target sound direction (90 degree direction). can.
  • the positions of the plurality of microphone elements 20a to 20d correspond to the positions of the vertices of the tetrahedron (triangular pyramid), and a straight line (line) connecting any two microphone elements.
  • the six sides of the tetrahedron corresponding to the minute) are not parallel to each other.
  • variations in the sensitivity characteristics of the reference signal are increased.
  • the plurality of microphone elements 20a to 20d include three microphone elements 20a to 20c located on the same plane and one microphone element 20d not located on the plane. Including, the three microphone elements 20a to 20c are arranged so as to form a triangle in the plane.
  • the distance between the two microphone elements constituting the effective microphone pair is different from any of the distances between the two microphone elements constituting the other effective microphone pair. That is, in the three-dimensional arrangement examples 2 to 5, irregular points are provided in the distance between the microphone elements. This makes it possible to sharpen the directivity of the main signal. According to the study by the inventors, by increasing the distance between the microphone elements, the directivity can be sharpened in the region where the frequency of the main signal is low, and by increasing the distance between the microphone elements, the directivity can be sharpened. The directivity can be sharpened in the region where the frequency of the main signal is high.
  • the three-dimensional arrangement adopted in the sound collecting device 10 is not limited to the three-dimensional arrangement examples 1 to 5.
  • the four or more microphone elements included in the sound collecting device 10 include n (n is a natural number of 3 or more) microphone elements located on the same plane and one or more microphone elements not located on the plane. May include.
  • the bottom surface may be arranged at the position of the apex of an n-sided polygonal pyramid.
  • the bottom surface may be a regular n-sided polygon (n is an odd number), and the bottom surface may be a polygon whose n sides are not parallel to each other.
  • FIG. 25 is a diagram showing an example in which a plurality of microphone elements are arranged at the positions of the vertices of a quadrangular pyramid having a quadrangular bottom surface whose four sides are not parallel to each other. In FIG. 25, the positions of the plurality of microphone elements are indicated by black circles.
  • the plurality of microphone elements may be arranged on the circumference of the bottom surface of the cone and at the apex.
  • FIG. 26 is a diagram showing an example in which a plurality of microphone elements are arranged on the circumference of the bottom surface of the cone and at the apex. In FIG. 26, the positions of the plurality of microphone elements are indicated by black circles.
  • the bottom surface of the cone may be either a perfect circle or an ellipse.
  • the plurality of microphone elements may be arranged in a spiral shape. How the plurality of microphone elements are arranged so as to satisfy the condition that the straight line connecting the two microphone elements constituting the effective microphone pair is not parallel to any of the straight lines connecting the two microphone elements constituting the other effective microphone pair. May be done.
  • the sound collecting device 10 includes a plurality of microphone elements 20a to 20d three-dimensionally distributed.
  • the total number of effective microphone pairs in which the distance between the two microphone elements is less than the distance D is the plurality of microphone elements 20a to 20d. More than the total number of.
  • the straight line connecting the two microphone elements constituting the effective microphone pair is not parallel to any of the straight lines connecting the two microphone elements constituting the other effective microphone pair.
  • the variation in the sensitivity characteristics of the reference signal is increased, so that the sound collecting device 10 can reduce noise in various directions. That is, the sound collecting device 10 can effectively suppress sounds other than the target sound.
  • the plurality of microphone elements 20a to 20d include n microphone elements (n is a natural number of 3 or more) located on the same plane and one or more microphone elements not located on the plane.
  • n-sided pyramid n-sided polygonal pyramid
  • the n microphone elements are arranged so as to form a regular n-sided polygon on a plane.
  • the distance between the two microphone elements constituting the effective microphone pair is different from any of the distances between the two microphone elements constituting the other effective microphone pair.
  • the total number of microphone pairs obtained from the plurality of microphone elements 20a to 20d is equal to the total number of effective microphone pairs.
  • all the microphone pairs function as effective microphone pairs, so that the sound collecting device 10 can effectively suppress sounds other than the target sound.
  • the sound collecting device 10 further adds the delay devices 31a to 31d that give a delay to the audio signals obtained from each of the plurality of microphone elements 20a to 20d, and the output signals of the delay devices 31a to 31d.
  • the reference signal Xr1 A filter coefficient is applied from the reference signal generation units 32a to 32f that generate ⁇ X r6 , the adaptive filter units 33a to 33f that apply the filter coefficient to the reference signals X r1 to X r6 , and the generated main signal X m .
  • the delay devices 31a to 31d are examples of the delay unit.
  • the main signal X m is an example of the first signal, and is an audio signal in which the audio signals obtained from each of the plurality of microphone elements 20a to 20d are delayed according to the target sound direction by the delay devices 31a to 31d ( It is a signal to which the delay devices 31a to 31d output signals) are added.
  • the reference signals X r1 to X r6 are examples of the second signal, and the audio signals obtained from each of the two microphone elements constituting the effective microphone pair are delayed according to the target sound direction by the delayers 31a to 31d. It is a signal obtained by subtracting the generated audio signal (output signal of delayers 31a to 31d).
  • the main signal generation unit 31 is an example of the first signal generation unit
  • each of the reference signal generation units 32a to 32f is an example of the second signal generation unit
  • the output signal Y is an example of the third signal. ..
  • the sound collecting device 10 can perform beamforming based on the audio signals obtained from the plurality of microphone elements 20a to 20d.
  • the shape of the sound collecting device described in the above embodiment is an example, and the sound collecting device may have another shape such as a rectangular parallelepiped shape.
  • the configuration of the signal processing unit according to the above embodiment is an example.
  • the signal processing unit may include components such as a D / A converter, a low-pass filter (LPF), a high-pass filter (HPF), a power amplifier, or an A / D converter.
  • the signal processing executed by the signal processing unit is, for example, digital signal processing, but a part of the signal processing may be analog signal processing.
  • the signal processing unit may be realized by being configured with dedicated hardware or by executing a software program suitable for the signal processing unit.
  • the signal processing unit may be realized by a program execution unit such as a CPU or a processor reading and executing a software program recorded on a recording medium such as a hard disk or a semiconductor memory.
  • the signal processing unit may be a circuit (or an integrated circuit). These circuits may form one circuit as a whole, or may be separate circuits from each other. Further, each of these circuits may be a general-purpose circuit or a dedicated circuit.
  • the signal processing unit is realized by hardware (circuit), but a part or all of the signal processing unit is realized by executing a software program suitable for the signal processing unit. May be good.
  • the signal processing unit may be realized by a program execution unit such as a CPU or a processor reading and executing a software program recorded on a recording medium such as a hard disk or a semiconductor memory.
  • the sound collecting device of the present disclosure is useful as a sound collecting device used in a telephone conference system or the like.

Landscapes

  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Otolaryngology (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Quality & Reliability (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)

Abstract

収音装置(10)は、立体的に分散配置された複数のマイクロホン素子(20a~20d)を備える。2つのマイクロホン素子間の距離が距離D未満となる有効マイクペアの総数は、複数のマイクロホン素子(20a~20d)の総数よりも多い。距離Dは、複数のマイクロホン素子(20a~20d)のそれぞれから得られる目的音の周波数をf、音速をcとすると、D=c/2fで表される。有効マイクペアを構成する2つのマイクロホン素子を結ぶ直線(L1)は、他の有効マイクペアを構成する2つのマイクロホン素子を結ぶ直線(L2~L6)のいずれとも平行でない。

Description

収音装置
 本開示は、ビームフォーミングを行うための収音装置に関する。
 ビームフォーミングは、複数のマイクロホン素子から取得した音声信号を用いて目的音方向の音を強調した信号を生成する技術である。非特許文献1には、適応フィルタを用いたビームフォーマの一例として、一般化サイドローブキャンセラ(GSC:Genralized Sidelobe Canceller)が開示されている。
L. Griffiths and C. W. Jim, "An alternative approach to linearly constrained adaptive beamforming", IEEE Trans. Antennas Propagation, vol.AP-30, pp27-34, Jan. 1982.
 本開示は、目的音以外の音を効果的に抑圧できる収音装置を提供する。
 本開示の一態様に係る収音装置は、立体的に分散配置された複数のマイクロホン素子を備え、前記複数のマイクロホン素子に含まれる任意の2つのマイクロホン素子によって構成されるマイクペアのうち、2つのマイクロホン素子間の距離が距離D未満となる有効マイクペアの総数は、前記複数のマイクロホン素子の総数よりも多く、前記距離Dは、前記複数のマイクロホン素子から得られる目的音の周波数をf、音速をcとすると、D=c/2fで表され、前記有効マイクペアを構成する2つのマイクロホン素子を結ぶ直線は、他の前記有効マイクペアを構成する2つのマイクロホン素子を結ぶ直線のいずれとも平行でない。
 本開示の一態様に係る収音装置は、目的音以外の音を効果的に抑圧できる。
図1は、実施の形態に係る収音装置の外観斜視図である。 図2は、実施の形態に係る収音装置の機能構成を示すブロック図である。 図3は、主信号、参照信号、及び、出力信号の感度特性によって出力信号の算出式を模式的に示す図である。 図4は、複数のマイクロホン素子の立体配置例1を示す図である。 図5は、複数のマイクロホン素子の平面配置例を示す図である。 図6は、立体配置例1が採用された収音装置によって生成される参照信号の、XZ平面に沿う方向における感度特性を示す図である。 図7は、平面配置例が採用された収音装置によって生成される参照信号の、XZ平面に沿う方向における感度特性を示す図である。 図8は、図6及び図7の感度特性の計算方法を説明するための図である。 図9は、立体配置例1が採用された収音装置によって生成される、XZ平面に沿う90度方向を目的音方向とする主信号の周波数特性を示す図である。 図10は、複数のマイクロホン素子の立体配置例2を示す図である。 図11は、立体配置例2が採用された収音装置によって生成される、XZ平面に沿う90度方向を目的音方向とする主信号の周波数特性を示す図である。 図12は、複数のマイクロホン素子の立体配置例3を示す図である。 図13は、立体配置例3が採用された収音装置によって生成される、XZ平面に沿う90度方向を目的音方向とする主信号の周波数特性を示す図である。 図14は、立体配置例1が採用された収音装置によって生成される参照信号の、XY平面に沿う方向における感度特性を示す図である。 図15は、平面配置例が採用された収音装置によって生成される参照信号の、XY平面に沿う方向における感度特性を示す図である。 図16は、図14及び図15の感度特性の計算方法を説明するための図である。 図17は、複数のマイクロホン素子の立体配置例4を示す図である。 図18は、立体配置例4が採用された収音装置によって生成される参照信号の、XY平面に沿う方向における感度特性を示す図である。 図19は、複数のマイクロホン素子の立体配置例5を示す図である。 図20は、立体配置例5が採用された収音装置によって生成される参照信号の、XY平面に沿う方向における感度特性を示す図である。 図21は、平面配置例が採用された収音装置によって生成される、XY平面に沿う90度方向を目的音方向とする主信号の周波数特性を示す図である。 図22は、立体配置例1が採用された収音装置によって生成される、XY平面に沿う90度方向を目的音方向とする主信号の周波数特性を示す図である。 図23は、立体配置例4が採用された収音装置によって生成される、XY平面に沿う90度方向を目的音方向とする主信号の周波数特性を示す図である。 図24は、立体配置例5が採用された収音装置によって生成される、XY平面に沿う90度方向を目的音方向とする主信号の周波数特性を示す図である。 図25は、四角錐の頂点の位置に複数のマイクロホン素子が配置される例を示す図である。 図26は、円錐の底面の円周上、及び、頂点に複数のマイクロホン素子が配置される例を示す図である。
 以下、実施の形態について、図面を参照しながら説明する。以下で説明する実施の形態は、いずれも包括的または具体的な例を示すものである。以下の実施の形態で示される数値、形状、材料、構成要素、構成要素の配置位置及び接続形態などは、一例であり、本開示を限定する主旨ではない。また、以下の実施の形態における構成要素のうち、最上位概念を示す独立請求項に記載されていない構成要素については、任意の構成要素として説明される。
 また、各図は模式図であり、必ずしも厳密に図示されたものではない。また、各図において、実質的に同一の構成に対しては同一の符号を付し、重複する説明は省略または簡略化される場合がある。
 また、以下の実施の形態では、収音装置がある方向から到来する音を主たる出力対象とする場合、当該方向が目的音方向と表現され、当該音を目的音と表現される。また、目的音以外の音は雑音と表現される場合がある。
 (実施の形態)
 [収音装置の構成]
 以下、実施の形態に係る収音装置の構成について、図1及び図2を用いて説明する。図1は、実施の形態に係る収音装置の外観斜視図である。図2は、実施の形態に係る収音装置の機能構成を示すブロック図である。
 図1に示されるように、実施の形態に係る収音装置10は、略円盤状の装置である。収音装置10は、例えば、机の上に設置され、電話会議などにおける音声の取得に用いられる。なお、収音装置10の形状は、略円盤状に限定されない。図2に示されるように、収音装置10は、図1に示されるような本体の内部に、複数のマイクロホン素子20a~20dと、信号処理部30とを備える。複数のマイクロホン素子20a~20dは、マイクロホンアレイ20を構成する。なお、収音装置10が信号処理部30を備えることは必須ではなく、信号処理部30は、収音装置10とは別の装置として実現されてもよい。
 複数のマイクロホン素子20a~20dは、ビームフォーミングに用いられる主信号X及び参照信号Xr1~Xr6を生成するためのマイクロホンアレイ20である。言い換えれば、複数のマイクロホン素子20a~20dは、ビームフォーマである信号処理部30が音声信号を取得するために用いられる。複数のマイクロホン素子20a~20dは、同一平面上に配置される。実施の形態では、収音装置10は、4つのマイクロホン素子20a~20dを備えるが、マイクロホン素子の総数は特に限定されない。マイクロホン素子の総数は、偶数であってもよいし奇数であってもよい。収音装置10は、例えば、4つ以上のマイクロホン素子を備えてもよい。
 信号処理部30は、複数のマイクロホン素子20a~20dのそれぞれから得られる音声信号を用いてビームフォーミングを行うビームフォーマである。信号処理部30のビームフォーミングは、目的音方向の感度を確保した上で雑音が死角になるよう指向性を形成する信号処理である。つまり、信号処理部30のビームフォーミングによれば、目的音方向以外の方向から到来する雑音が抑制される。複数のマイクロホン素子20a~20dのそれぞれは無指向性のマイクロホン素子であるが、信号処理部30のビームフォーミングにより、収音装置10は目的音方向において高い感度を有する。
 信号処理部30は、より具体的には、一般化サイドローブキャンセラと同様の構成を有する。信号処理部30は、例えば、DSP(Digital Signal Processor)等のプロセッサによって実現されるが、マイクロコンピュータまたは回路によって実現されてもよい。また、信号処理部30は、プロセッサ、マイクロコンピュータ、及び、回路のうちの2つ以上の組み合わせによって実現されてもよい。信号処理部30は、遅延器31a~31dと、主信号生成部31と、参照信号生成部32a~32fと、適応フィルタ部33a~33fと、減算部34と、係数更新部35とを備える。
 遅延器31a~31dは、複数のマイクロホン素子20a~20dのそれぞれから得られる音声信号に1対1で対応する。遅延器31a~31dは、複数のマイクロホン素子20a~20dから得られる音声信号に目的音方向に応じた遅延を与え、出力信号として出力する。
 主信号生成部31は、第一信号生成部の一例であって、複数のマイクロホン素子20a~20dのそれぞれから得られる音声信号であって、遅延器31a~31dによって目的音方向に応じた遅延が与えられた音声信号を加算することにより主信号Xを生成する。主信号Xは、第一信号の一例である。
 参照信号生成部32a~32fのそれぞれは、第二信号生成部の一例である。参照信号生成部32a~32fは、複数のマイクロホン素子20a~20dに含まれる任意の2つのマイクロホン素子によって構成される6組のマイクペアに1対1で対応する。1つの参照信号生成部は、1組のマイクペアを構成するマイクロホン素子のそれぞれから得られる音声信号であって、遅延器31a~31dによって目的音方向に応じた遅延が与えられた音声信号を減算することにより参照信号を生成する。参照信号Xr1~Xr6のそれぞれは、第二信号の一例である。
 また、適応フィルタ部33a~33fは、参照信号生成部32a~32fに1対1で対応する。適応フィルタ部33a~33fは、対応する参照信号生成部32a~32fにフィルタ係数α~αを適用する。
 例えば、参照信号生成部32aは、マイクロホン素子20a及び20bのそれぞれから得られる音声信号に遅延器31a及び31bによって目的音方向に応じた遅延が与えられた音声信号(遅延器31a及び31bの出力信号)を減算することにより参照信号Xr1を生成する。適応フィルタ部33aは、参照信号Xr1にフィルタ係数αを適用する。
 同様に、参照信号生成部32bは、マイクロホン素子20a及び20cのそれぞれから得られる音声信号に遅延器31a及び31cによって目的音方向に応じた遅延が与えられた音声信号(遅延器31a及び31cの出力信号)を減算することにより参照信号Xr2を生成する。適応フィルタ部33bは、参照信号Xr2にフィルタ係数αを適用する。
 参照信号生成部32cは、マイクロホン素子20a及び20dのそれぞれから得られる音声信号に遅延器31a及び31dによって目的音方向に応じた遅延が与えられた音声信号(遅延器31a及び31dの出力信号)を減算することにより参照信号Xr3を生成する。適応フィルタ部33cは、参照信号Xr3にフィルタ係数αを適用する。
 参照信号生成部32dは、マイクロホン素子20b及び20cのそれぞれから得られる音声信号に遅延器31b及び31cによって目的音方向に応じた遅延が与えられた音声信号(遅延器31b及び31cの出力信号)を減算することにより参照信号Xr4を生成する。適応フィルタ部33dは、参照信号Xr4にフィルタ係数αを適用する。
 参照信号生成部32eは、マイクロホン素子20b及び20dのそれぞれから得られる音声信号に遅延器31b及び31dによって目的音方向に応じた遅延が与えられた音声信号(遅延器31b及び31dの出力信号)を減算することにより参照信号Xr5を生成する。適応フィルタ部33eは、参照信号Xr5にフィルタ係数αを適用する。
 参照信号生成部32fは、マイクロホン素子20c及び20dのそれぞれから得られる音声信号に遅延器31c及び31dによって目的音方向に応じた遅延が与えられた音声信号(遅延器31c及び31dの出力信号)を減算することにより参照信号Xr6を生成する。適応フィルタ部33fは、参照信号Xr6にフィルタ係数αを適用する。
 減算部34は、生成された主信号Xから、フィルタ係数α~αが適用された参照信号Xr1~Xr6を減算する。減算した結果得られる出力信号Yは、下記の式1で表される。出力信号Yは、第三信号の一例である。式1において、nはマイクペアの数である。つまり、nは自然数であり、収音装置10においてはn=6である。
Figure JPOXMLDOC01-appb-M000001
 係数更新部35は、減算部の減算によって得られる出力信号Yに基づいてフィルタ係数α~αを更新する。
 図3は、主信号X、参照信号X、及び、出力信号Yの感度特性によって式1を模式的に示す図である。なお、参照信号Xは、フィルタ係数α~αが適用された参照信号Xr1~Xr6の合計(αr1+αr2+αr3+αr4+αr5+αr6)を意味する。感度特性は、言い換えれば、指向性である。
 図3に示されるように、主信号Xは、全方向に高い感度を有する。これに対し、参照信号Xは、適応フィルタ部33a~33f、及び、係数更新部35によって、目的音方向において低い感度を有している。したがって、主信号Xmから参照信号Xを減算することによって得られる出力信号Yは、目的音方向に高い感度を有する。なお、目的音方向は、言い換えれば、ビーム方向である。
 [複数のマイクロホン素子の配置]
 収音装置10において、信号処理部30は、出力信号Yにおけるビーム方向を変更することができる。例えば、収音装置10は、タッチパネルまたは操作ボタンなどのユーザインターフェースを備え、信号処理部30は、当該ユーザインターフェースを通じて受け付けたユーザの操作に基づいてビーム方向を変更する。あるいは、信号処理部30は、音量などを検知して自動的にビーム方向を変更する。
 このように、信号処理部30がビーム方向可変のビームフォーミングを行う場合、出力信号Yにおいて、ビーム方向がどのような方向であってもビーム方向以外の方向の感度が極力低減される必要がある。そこで、収音装置10においては、このような性能を確保するために複数のマイクロホン素子20a~20dの配置が定められている。
 まず、収音装置10においては、有効マイクペアの総数が複数のマイクロホン素子20a~20dの総数よりも多い。ここで、有効マイクペアは、複数のマイクロホン素子20a~20dに含まれる任意の2つのマイクロホン素子によって構成されるマイクペアのうち、2つのマイクロホン素子間の距離が距離D未満となるマイクペアである。距離Dは、複数のマイクロホン素子20a~20dから得られる目的音の周波数をf、音速をcとすると、D=c/2fで表される。収音装置10において、有効マイクペアの総数は6個であり、複数のマイクロホン素子の総数は4個である。
 なお、距離Dは、目的音の周波数に応じて異なる。例えば、目的音の周波数が8kHzである場合、音速c=34000cm/sであれば、距離Dは2.125cmである。また、目的音の周波数が4kHzである場合、音速c=34000cm/sであれば、距離Dは4.25cmである。
 2つのマイクロホン素子間の距離が距離D以上となる非有効マイクペアから算出される参照信号は、信号処理において折り返し成分が発生してしまう等の理由により、当該非有効マイクペアの配置から想定される感度特性を有しない場合がある。つまり、非有効マイクペアから算出される参照信号は、想定外の感度特性を有する場合があり、精度の高い出力信号Yを生成することの妨げとなる。収音装置10においては、有効マイクペアの総数が複数のマイクロホン素子20a~20dの総数よりも多いことにより、精度の高い出力信号Yの生成が実現されている。
 なお、収音装置10においては、複数のマイクロホン素子20a~20dから得られるマイクペアは、全て有効マイクペアである。つまり、複数のマイクロホン素子20a~20dから得られるマイクペアの総数は、有効マイクペアの総数に等しい。しかしながら。複数のマイクロホン素子20a~20dから得られるマイクペアの一部が有効マイクペアであってもよい。
 また、複数のマイクロホン素子20a~20dは、立体的に分散配置されている。図4は、複数のマイクロホン素子20a~20dの立体配置例1を示す図である。図4において、X軸、Y軸、及び、Z軸に記載された数値の単位は、メートルである。
 図4の立体配置例1においては、複数のマイクロホン素子20a~20dは、1辺が約2.1cm(図4の座標における0.021)の正四面体の頂点の位置に配置されている。具体的には、マイクロホン素子20a、マイクロホン素子20b、及び、マイクロホン素子20cは、Z=0のXY平面上に位置する。マイクロホン素子20dの座標は、(0、0、Z1)(Z1=約0.0171)であり、マイクロホン素子20dは、Z=0のXY平面よりもZ軸方向プラス側に位置している。なお、正四面体の1辺の長さ2.1cmは、8kHzの周波数の半波長を想定して定められている。
 立体配置例1において、有効マイクペアを構成する2つのマイクロホン素子を結ぶ任意の直線は、他の有効マイクペアを構成する2つのマイクロホン素子を結ぶ直線のいずれとも平行でない。具体的には、図4において破線により示される直線(線分)L1は、他の直線L2~L6のいずれとも平行でない。直線L2~L6についても同様である。つまり、有効マイクペアを構成する2つのマイクロホン素子を結ぶ直線の全ては、互いに平行でない。
 [参照信号の感度特性1]
 図4のように、複数のマイクロホン素子20a~20dが立体的に分散配置されれば、複数のマイクロホン素子20a~20dが同一平面上に配置される場合に比べて、参照信号の感度特性のバリエーションが増加する。以下、このような立体配置例1によって得られる参照信号の感度特性について説明する。まず、立体配置例1の比較対象となる平面配置例について説明する。図5は、複数のマイクロホン素子20a~20cの平面配置例を示す図である。図5において、X軸、Y軸、及び、Z軸に記載された数値の単位は、メートルである。
 図5の平面配置例においては、複数のマイクロホン素子20a~20dは、Z=0のXY平面上に位置する。具体的には、マイクロホン素子20a、マイクロホン素子20b、及び、マイクロホン素子20cの配置は、立体配置例1と同様であるが、マイクロホン素子20dの座標は、(0、0、0)である。このように平面配置例においては、複数のマイクロホン素子20a~20dが同一平面上に配置されている。
 図6は、立体配置例1が採用された収音装置10によって生成される参照信号の、XZ平面に沿う方向における感度特性を示す図である。図7は、平面配置例が採用された収音装置10によって生成される参照信号の、XZ平面に沿う方向における感度特性を示す図である。図8は、図6及び図7の感度特性の計算方法を説明するための図である。図8において、X軸、Y軸、Z軸に記載された数値の単位は、メートルである。
 図6及び図7における6つの列のそれぞれは、マイクペアを用いて生成される参照信号の感度特性を示している。なお、感度特性は、言い換えれば、指向性パターンである。
 例えば、図6及び図7における6つの列のうち一番左の列は、マイクロホン素子20d及びマイクロホン素子20aによって構成されるマイクペアを用いて生成される参照信号(図2の参照信号Xr3に相当)の感度特性を示している。左から2番目の列は、マイクロホン素子20d及びマイクロホン素子20bによって構成されるマイクペアを用いて生成される参照信号(図2の参照信号Xr5に相当)感度特性を示している。左から3番目の列は、マイクロホン素子20d及びマイクロホン素子20cによって構成されるマイクペアを用いて生成される参照信号(図2の参照信号Xr6に相当)の感度特性を示している。
 左から4番目の列は、マイクロホン素子20a及びマイクロホン素子20bによって構成されるマイクペアを用いて生成される参照信号(図2の参照信号Xr1に相当)の感度特性を示している。左から5番目の列は、マイクロホン素子20a及びマイクロホン素子20cによって構成されるマイクペアを用いて生成される参照信号(図2の参照信号Xr2に相当)の感度特性を示している。左から6番目の列は、マイクロホン素子20b及びマイクロホン素子20cによって構成されるマイクペアを用いて生成される参照信号(図2の参照信号Xr4に相当)の感度特性を示している。
 6つの列のそれぞれには、3つの感度特性が図示されている。3つの感度特性には、90度方向に死角を有する参照信号の感度特性、60度方向に死角を有する参照信号の感度特性、及び、30度方向に死角を有する参照信号の感度特性が含まれる。ここで、図8に白い丸印によって示されるように、90度方向は、Z軸プラス方向を意味し、60度方向は、Z軸プラス方向からXZ平面に沿って角度を30度ずらした方向である。30度方向は、Z軸プラス方向からXZ平面に沿って角度を60度ずらした方向である。なお、図8に破線で示されるように、図6及び図7に示される感度特性は、マイクロホンアレイ20(複数のマイクロホン素子20a~20dの集合体)を中心として半径1.5mの位置(図8において破線で図示)における感度特性である。
 上記図4及び図5を用いて説明したように、立体配置例1と平面配置例とは、マイクロホン素子20dの位置のみが異なる。したがって、図6及び図7の右側半分の3列に示されるように、マイクロホン素子20a~20cを組み合わせたマイクロホンペアから得られる感度特性は、立体配置例1と平面配置例との間で差はない。
 一方で、図6及び図7の左側半分の3列に示されるように、マイクロホン素子20dを含むマイクペアの感度特性は、立体配置例1(図6)のほうが平面配置例(図7)よりも多様である。つまり、複数のマイクロホン素子20a~20dが立体的に分散配置されれば、複数のマイクロホン素子20a~20dが同一平面上に配置される場合に比べて、参照信号の感度特性のバリエーションを増加させることができる。感度特性のバリエーションが増えることは、信号処理部30が実行する、一般化サイドローブキャンセラに基づく雑音抑圧アルゴリズムにとって非常に有利である。参照信号の感度特性のバリエーションが増加されれば、収音装置10は、様々な方向の雑音を低減できる。つまり、収音装置10は、目的音以外の音を効果的に抑圧できる。
 [主信号の周波数特性1]
 次に、立体配置例1が採用された収音装置10によって生成される主信号の、XZ平面に沿う方向における周波数特性について説明する。図9は、XZ平面に沿う90度方向を目的音方向とする主信号の周波数特性を示す図である。図9では、90度方向を目的音方向とする主信号の、90度方向の周波数特性、30度方向の周波数特性、及び、0度方向の周波数特性が図示されている。図9では、縦軸は、音圧レベル(SPL:Sound Pressure Level)を示し、横軸は、周波数を示している。
 図9に示されるように、90度方向を目的音方向とする主信号の、90度方向の周波数特性においては、0~8kHzの周波数帯域で音圧レベルがおおむねフラットである。これに対し、上記主信号の30度方向の周波数特性においては、音圧レベルが高域で減衰する。また、上記主信号の0度方向の周波数特性においては、音圧レベルが高域で30度方向よりもさらに減衰する。
 このように立体配置例1が採用された収音装置10は、目的音方向(90度方向)に指向性を有する主信号を生成することができる。
 ここで、発明者らは、立体配置例1においてマイクロホン素子20dの位置を調整することにより、主信号の指向性の向上を試みた。発明者らは、具体的には、立体配置例2及び立体配置例3における主信号の周波数特性を計算した。
 まず、立体配置例2について説明する。図10は、複数のマイクロホン素子20a~20dの立体配置例2を示す図である。図11は、立体配置例2が採用された収音装置10によって生成される、XZ平面に沿う90度方向を目的音方向とする主信号の周波数特性を示す図である。図11では、90度方向を目的音方向とする主信号の、90度方向の周波数特性、30度方向の周波数特性、及び、0度方向の周波数特性が図示されている。図11では、縦軸は、音圧レベルを示し、横軸は、周波数を示している。
 図10の立体配置例2において、マイクロホン素子20a、マイクロホン素子20b、及び、マイクロホン素子20cの配置は、立体配置例1と同様である。マイクロホン素子20dは、立体配置例1よりもZ軸方向プラス側に位置し、マイクロホン素子20dの座標は、(0、0、1.5×Z1)である。つまり、立体配置例2においては、XY平面を基準としたマイクロホン素子20dの位置(高さ)が、立体配置例1の1.5倍となっている。なお、立体配置例2においては、マイクロホン素子20dからマイクロホン素子20a~20cのそれぞれまでの距離は、約2.9cm(図10の座標における0.029)である。
 図11に示されるように、立体配置例2が採用された収音装置10によって生成される90度方向を目的音方向とする主信号の、90度方向の周波数特性においては、0~8kHzの周波数帯域で音圧レベルがおおむねフラットである。立体配置例2が採用された場合の主信号の30度方向の周波数特性においては、音圧レベルが高域で減衰するが、音圧レベルが減衰し始める周波数が、立体配置例1が採用された場合よりも低い。同様に、立体配置例2が採用された場合の主信号の0度方向の周波数特性においては、音圧レベルが高域で減衰するが、音圧レベルが減衰し始める周波数が、立体配置例1が採用された場合よりも低い。つまり、立体配置例2が採用された収音装置10は、目的音方向以外の方向において、音圧レベルが減衰し始める周波数が立体配置例1の場合よりも低い主信号を生成することができる。つまり、立体配置例2が採用された収音装置10は、高域における指向性がより鋭い主信号を生成することができる。
 次に、立体配置例3について説明する。図12は、複数のマイクロホン素子20a~20dの立体配置例3を示す図である。図13は、立体配置例3が採用された収音装置10によって生成される、XZ平面に沿う90度方向を目的音方向とする主信号の周波数特性を示す図である。図13では、90度方向を目的音方向とする主信号の、90度方向の周波数特性、30度方向の周波数特性、及び、0度方向の周波数特性が図示されている。図13では、縦軸は、音圧レベルを示し、横軸は、周波数を示している。
 図12の立体配置例3において、マイクロホン素子20a、マイクロホン素子20b、及び、マイクロホン素子20cの配置は、立体配置例1と同様である。マイクロホン素子20dは、立体配置例1よりもY軸方向プラス側に位置しており、マイクロホン素子20dの座標は、(0、Y1、Z1)である。立体配置例3において、マイクロホン素子20dからマイクロホン素子20aまでの距離は、約1.9cm(図12の座標における0.019)である。立体配置例3において、マイクロホン素子20dからマイクロホン素子20b及びマイクロホン素子20cのそれぞれまでの距離は、約2.3cm(図12の座標における0.023)である。
 図13に示されるように、立体配置例3が採用された収音装置10によって生成される90度方向を目的音方向とする主信号の周波数特性は、90度方向、30度方向、及び、0度方向のそれぞれにおいて、立体配置例1と同程度である。つまり、立体配置例3が採用された収音装置10は、目的音方向(90度方向)に指向性を有する主信号を生成することができる。
 [参照信号の感度特性2]
 上記図6及び図7では、XZ平面に沿う方向における感度特性について説明したが、以下では、XY平面に沿う方向における感度特性について説明する。図14は、立体配置例1が採用された収音装置10によって生成される参照信号の、XY平面に沿う方向における感度特性を示す図である。図15は、平面配置例が採用された収音装置10によって生成される参照信号の、XY平面に沿う方向における感度特性を示す図である。図16は、図14及び図15の感度特性の計算方法を説明するための図である。図16において、X軸、Y軸、Z軸に記載された数値の単位は、メートルである。
 図14及び図15は、図6及び図7と同様の書式で参照信号の感度特性を示している。ここで、図16に白い丸印で示されるように、90度方向は、Y軸プラス方向を意味し、60度方向は、Y軸プラス方向からXY平面に沿って角度を30度ずらした方向である。30度方向は、Y軸プラス方向からXY平面に沿って角度を60度ずらした方向である。なお、図16に破線で示されるように、図14及び図15に示される感度特性は、マイクロホンアレイ20(複数のマイクロホン素子20a~20dの集合体)を中心として半径1.5mの位置(図16において破線で図示)における感度特性である。
 上記図4及び図5を用いて説明したように、立体配置例1と平面配置例とは、マイクロホン素子20dの位置のみが異なる。したがって、図14及び図15の右側半分の3列に示されるように、マイクロホン素子20a~20cを組み合わせたマイクロホンペアから得られる感度特性は、立体配置例1と平面配置例との間で差はない。
 一方で、図14及び図15の左側半分の3列に示されるように、マイクロホン素子20dを含むマイクペアの感度特性は、立体配置例1と平面配置例とでほぼ同様である。つまり、複数のマイクロホン素子20a~20dが立体的に分散配置されても、複数のマイクロホン素子20a~20dが同一平面上に配置される場合よりも、参照信号の感度特性のバリエーションが減少するわけではないといえる。つまり、複数のマイクロホン素子20a~20dを立体的に分散配置することで、複数のマイクロホン素子20a~20dを同一平面上に配置する場合よりも性能が劣化することはないといえる。
 ここで、発明者らは、立体配置例1においてマイクロホン素子20dの位置を調整することにより、参照信号の感度特性がどのように変化するかを確認した。発明者らは、具体的には、以下の立体配置例4及び立体配置例5における感度特性を計算した。
 まず、立体配置例4について説明する。図17は、複数のマイクロホン素子20a~20dの立体配置例4を示す図である。図18は、立体配置例4が採用された収音装置10によって生成される参照信号の、XY平面に沿う方向における感度特性を示す図である。
 図17の立体配置例4において、マイクロホン素子20a、マイクロホン素子20b、及び、マイクロホン素子20cの配置は、立体配置例1と同様である。マイクロホン素子20dは、立体配置例1における位置からY軸方向及びZ軸方向のそれぞれにおいてシフトされている。なお、Z軸方向から見た場合に、マイクロホン素子20dの位置は、マイクロホン素子20a、マイクロホン素子20b、及び、マイクロホン素子20cのいずれの位置とも重ならない。つまり、マイクロホン素子20dは、マイクロホン素子20a、マイクロホン素子20b、及び、マイクロホン素子20cの直上には位置していない。
 立体配置例1と立体配置例4とは、マイクロホン素子20dの位置のみが異なる。したがって、図14及び図18の右側半分の3列に示されるように、マイクロホン素子20a~20cを組み合わせたマイクロホンペアから得られる感度特性は、立体配置例1と立体配置例4との間で差はない。
 一方で、図14及び図18の左側半分の3列に示されるように、マイクロホン素子20dを含むマイクペアの感度特性は、立体配置例1と立体配置例4とで大きく異なる。つまり、マイクロホン素子20dの位置を変更することで、参照信号の感度特性のバリエーションを異ならせることができる。
 次に、立体配置例5について説明する。図19は、複数のマイクロホン素子20a~20dの立体配置例5を示す図である。図20は、立体配置例5が採用された収音装置10によって生成される参照信号の、XY平面に沿う方向における感度特性を示す図である。
 図19の立体配置例5において、マイクロホン素子20a、及び、マイクロホン素子20dの配置は、立体配置例1と同様である。立体配置例5では、マイクロホン素子20b及びマイクロホン素子20cの間隔が、立体配置例1よりも広げられている。具体的には、マイクロホン素子20bは、立体配置例1よりもX軸方向マイナス側に位置し、マイクロホン素子20cは、立体配置例1よりもX軸方向プラス側に位置している。
 立体配置例1と立体配置例5とは、マイクロホン素子20b及び20cの位置が異なる。したがって、図14及び図20の一番左側の列における、マイクロホン素子20a及びマイクロホン素子20dを組み合わせたマイクロホンペアから得られる感度特性は、立体配置例1と立体配置例5との間で差はない。
 一方で、図14及び図20の一番左側以外の5列に示されるように、マイクロホン素子20b及びマイクロホン素子20cを含むマイクペアの感度特性は、立体配置例1と立体配置例5とで異なる。つまり、マイクロホン素子20b及びマイクロホン素子20cの位置を変更することで、参照信号の感度特性のバリエーションを異ならせることができる。
 [主信号の周波数特性2]
 次に、平面配置例、立体配置例1、立体配置例4、及び、立体配置例5が採用された収音装置10によって生成される主信号の、XY平面に沿う方向における周波数特性について説明する。図21は、平面配置例が採用された収音装置10によって生成される、XY平面に沿う90度方向を目的音方向とする主信号の周波数特性を示す図である。図22は、立体配置例1が採用された収音装置10によって生成される、XY平面に沿う90度方向を目的音方向とする主信号の周波数特性を示す図である。図23は、立体配置例4が採用された収音装置10によって生成される、XY平面に沿う90度方向を目的音方向とする主信号の周波数特性を示す図である。図24は、立体配置例5が採用された収音装置10によって生成される、XY平面に沿う90度方向を目的音方向とする主信号の周波数特性を示す図である。
 図21~図24では、90度方向を目的音方向とする主信号の、90度方向の周波数特性、30度方向の周波数特性、及び、0度方向の周波数特性が図示されている。図21~図24では、縦軸は、音圧レベルを示し、横軸は、周波数を示している。
 図21(平面配置例)及び図22(立体配置例1)を比較すると、立体配置例1が採用された場合の主信号の周波数特性は、90度方向、30度方向、及び、0度方向のそれぞれにおいて、平面配置例が採用された場合と同程度であるといえる。
 図22(立体配置例1)及び図23(立体配置例4)を比較すると、立体配置例4が採用された場合の主信号の周波数特性は、90度方向及び30度方向において、立体配置例1が採用された場合と同程度であるといえる。一方、0度方向においては、立体配置例4が採用された場合の7kHz以上の周波数帯域での音圧レベルの抑圧量は、立体配置例1が採用された場合よりも減少している。
 図22(立体配置例1)及び図24(立体配置例5)を比較すると、立体配置例5が採用された場合の主信号の周波数特性は、90度方向において、立体配置例1が採用された場合と同程度であるといえる。
 一方、30度方向においては、立体配置例5が採用された場合の4kHz以上の周波数帯域での音圧レベルの抑圧量は、立体配置例1が採用された場合よりも増加している。一方、0度方向においては、立体配置例5が採用された場合の4kHz~5kHzの周波数帯域での音圧レベルの抑圧量は、立体配置例1が採用された場合よりも増加しているが、7kHz以上の周波数帯域での音圧レベルの抑圧量は、立体配置例1が採用された場合よりも減少している。
 このように、立体配置例1、立体配置例4、及び、立体配置例5が採用された収音装置10は、目的音方向(90度方向)に指向性を有する主信号を生成することができる。
 [立体配置のまとめ]
 立体配置例1~5においては、有効マイクペアを構成する2つのマイクロホン素子を結ぶ直線は、他の有効マイクペアを構成する2つのマイクロホン素子を結ぶ直線のいずれとも平行でない。ベクトルで表現すると、有効マイクペアを構成する2つのマイクロホン素子を結ぶ直線のベクトルの任意の2つをvi、vj(i、jは自然数)としたときに、vi=t・vj(tは実数)とならない。
 具体的には、立体配置例1~5においては、複数のマイクロホン素子20a~20dの位置は、四面体(三角錐)の頂点の位置に相当し、任意の2つのマイクロホン素子を結ぶ直線(線分)に相当する四面体の6つの辺(立体配置例1における直線L1~L6)は、互いに平行でない。このような立体配置例1~5が採用された収音装置10においては、参照信号の感度特性のバリエーションが増加される。
 なお、立体配置例1~5においては、複数のマイクロホン素子20a~20dは、同一の平面に位置する3個のマイクロホン素子20a~20cと、当該平面上に位置しない1個のマイクロホン素子20dとを含み、3個のマイクロホン素子20a~20cは、上記平面において三角形を構成するように配置される。
 また、立体配置例2~5においては、有効マイクペアを構成する2つのマイクロホン素子間の距離は、他の有効マイクペアを構成する2つのマイクロホン素子間の距離のいずれかと異なる。つまり、立体配置例2~5においては、マイクロホン素子の間の距離にイレギュラーな箇所が設けられている。これにより、主信号の指向性の鋭角化を図ることができる。発明者らの検討によれば、マイクロホン素子の間の距離を長くすることで、主信号の周波数が低い領域における指向性を鋭くすることができ、マイクロホン素子の間の距離を長くすることで、主信号の周波数が高い領域における指向性を鋭くすることができる。
 [立体配置の変形例]
 ここで、収音装置10に採用される立体配置は、立体配置例1~5に限定されない。例えば、収音装置10が備える4つ以上のマイクロホン素子は、同一の平面に位置するn個(nは3以上の自然数)のマイクロホン素子と、上記平面上に位置しない1個以上のマイクロホン素子とを含んでもよい。例えば、底面がn角形の角錐の頂点の位置に配置されてもよい。
 この場合、底面は正n角形(nは奇数)であってもよいし、底面は、n本の辺が互いに平行でない多角形であってもよい。図25は、4本の辺が互いに平行でない四角形の底面を有する四角錐の頂点の位置に複数のマイクロホン素子が配置される例を示す図である。図25において、複数のマイクロホン素子の位置は黒丸で示されている。
 また、複数のマイクロホン素子は、円錐の底面の円周上、及び、頂点に配置されてもよい。図26は、円錐の底面の円周上、及び、頂点に複数のマイクロホン素子が配置される例を示す図である。図26において、複数のマイクロホン素子の位置は黒丸で示されている。なお、円錐の底面は、真円及び楕円のいずれであってもよい。
 また、複数のマイクロホン素子は、螺旋状に配置されてもよい。複数のマイクロホン素子は、有効マイクペアを構成する2つのマイクロホン素子を結ぶ直線が他の有効マイクペアを構成する2つのマイクロホン素子を結ぶ直線のいずれとも平行とならないという条件を満たす範囲で、どのように配置されてもよい。
 [効果等]
 以上説明したように、収音装置10は、立体的に分散配置された複数のマイクロホン素子20a~20dを備える。複数のマイクロホン素子20a~20dに含まれる任意の2つのマイクロホン素子によって構成されるマイクペアのうち、2つのマイクロホン素子間の距離が距離D未満となる有効マイクペアの総数は、複数のマイクロホン素子20a~20dの総数よりも多い。
 距離Dは、複数のマイクロホン素子20a~20dから得られる目的音の周波数をf、音速をcとすると、D=c/2fで表される。有効マイクペアを構成する2つのマイクロホン素子を結ぶ直線は、他の有効マイクペアを構成する2つのマイクロホン素子を結ぶ直線のいずれとも平行でない。
 これにより、参照信号の感度特性のバリエーションが増加されるので、収音装置10は、様々な方向の雑音を低減できる。つまり、収音装置10は、目的音以外の音を効果的に抑圧できる。
 また、例えば、複数のマイクロホン素子20a~20dは、同一の平面に位置するn個(nは3以上の自然数)のマイクロホン素子と、上記平面に位置しない1個以上のマイクロホン素子とを含む。
 これにより、複数のマイクロホン素子の20a~20dの配置にn角錐(底面がn角形の角錐)状の配置を採用することで、参照信号の感度特性のバリエーションを増加させることができる。
 また、例えば、上記n個のマイクロホン素子は、平面において正n角形を構成するように配置される。
 これにより、複数のマイクロホン素子の20a~20dの配置に底面が正n角形の角錐状の配置を採用することで、参照信号の感度特性のバリエーションを増加させることができる。
 また、例えば、有効マイクペアを構成する2つのマイクロホン素子間の距離は、他の前記有効マイクペアを構成する2つのマイクロホン素子間の距離のいずれかと異なる。
 これにより、主信号の指向性の鋭角化を図ることができる。
 また、例えば、複数のマイクロホン素子20a~20dから得られるマイクペアの総数は、有効マイクペアの総数に等しい。
 これにより、全てのマイクペアが有効マイクペアとして機能するため、収音装置10は、目的音以外の音を効果的に抑圧できる。
 また、例えば、収音装置10は、さらに、複数のマイクロホン素子20a~20dのそれぞれから得られる音声信号に対して遅延を与える遅延器31a~31dと、遅延器31a~31dの出力信号を加算することにより主信号Xを生成する主信号生成部31と、遅延器31a~31dの出力信号のうち、有効マイクペアを構成する2つのマイクロホン素子に対応する出力信号を減算することにより参照信号Xr1~Xr6を生成する参照信号生成部32a~32fと、参照信号Xr1~Xr6にフィルタ係数を適用する適応フィルタ部33a~33fと、生成された主信号Xから、フィルタ係数が適用された参照信号Xr1~Xr6を減算する減算部34と、減算部34の減算によって得られる出力信号Yに基づいてフィルタ係数を更新する係数更新部35とを備える。
 遅延器31a~31dは、遅延部の一例である。主信号Xは、第一信号の一例であり、複数のマイクロホン素子20a~20dのそれぞれから得られる音声信号に、遅延器31a~31dによって目的音方向に応じた遅延が与えられた音声信号(遅延器31a~31dの出力信号)が加算された信号である。参照信号Xr1~Xr6は、第二信号の一例であり、有効マイクペアを構成する2つのマイクロホン素子のそれぞれから得られる音声信号に、遅延器31a~31dによって目的音方向に応じた遅延が与えられた音声信号(遅延器31a~31dの出力信号)が減算された信号である。主信号生成部31は、第一信号生成部の一例であり、参照信号生成部32a~32fのそれぞれは、第二信号生成部の一例であり、出力信号Yは、第三信号の一例である。
 これにより、収音装置10は、複数のマイクロホン素子20a~20dから得られる音声信号に基づいてビームフォーミングを行うことができる。
 (その他の実施の形態)
 以上、実施の形態について説明したが、本開示は、このような実施の形態に限定されるものではない。
 例えば、上記実施の形態で説明された収音装置の形状等は一例であり、収音装置は、直方体状などのその他の形状であってもよい。
 また、上記実施の形態に係る信号処理部の構成は、一例である。信号処理部は、例えば、D/A変換器、ローパスフィルタ(LPF)、ハイパスフィルタ(HPF)、電力増幅器、または、A/D変換器などの構成要素を含んでもよい。また、信号処理部が実行する信号処理は、例えば、デジタル信号処理であるが、一部がアナログ信号処理であってもよい。
 また、上記実施の形態において、信号処理部は、専用のハードウェアで構成されるか、信号処理部に適したソフトウェアプログラムを実行することによって実現されてもよい。信号処理部は、CPUまたはプロセッサなどのプログラム実行部が、ハードディスクまたは半導体メモリなどの記録媒体に記録されたソフトウェアプログラムを読み出して実行することによって実現されてもよい。
 また、信号処理部は、回路(または集積回路)でもよい。これらの回路は、全体として1つの回路を構成してもよいし、それぞれ別々の回路でもよい。また、これらの回路は、それぞれ、汎用的な回路でもよいし、専用の回路でもよい。
 また、上記実施の形態において、信号処理部は、ハードウェア(回路)によって実現されたが、信号処理部の一部または全部は、信号処理部に適したソフトウェアプログラムを実行することによって実現されてもよい。信号処理部は、CPU又はプロセッサなどのプログラム実行部が、ハードディスク又は半導体メモリなどの記録媒体に記録されたソフトウェアプログラムを読み出して実行することによって実現されてもよい。
 その他、上記実施の形態に対して当業者が思いつく各種変形を施して得られる形態、及び、本開示の趣旨を逸脱しない範囲で上記実施の形態で説明された構成要素及び機能を任意に組み合わせることで実現される形態も本開示に含まれる。例えば、本開示は、上記実施の形態の収音装置を含むシステムとして実現されてもよい。
 本開示の収音装置は、電話会議システム等に用いられる収音装置として有用である。
 10 収音装置
 20 マイクロホンアレイ
 20a、20b、20c、20d マイクロホン素子
 30 信号処理部
 31 主信号生成部
 31a、31b、31c、31d 遅延器
 32a、32b、32c、32d、32e、32f 参照信号生成部
 33a、33b、33c、33d、33e、33f 適応フィルタ部
 34 減算部
 35 係数更新部
 X 主信号(第一信号)
 X 参照信号
 Xr1、Xr2、Xr3、Xr4、Xr5、Xr6 参照信号(第二信号)
 Y 出力信号(第三信号)
 L1~L6 直線

Claims (6)

  1.  立体的に分散配置された複数のマイクロホン素子を備え、
     前記複数のマイクロホン素子に含まれる任意の2つのマイクロホン素子によって構成されるマイクペアのうち、2つのマイクロホン素子間の距離が距離D未満となる有効マイクペアの総数は、前記複数のマイクロホン素子の総数よりも多く、
     前記距離Dは、前記複数のマイクロホン素子から得られる目的音の周波数をf、音速をcとすると、D=c/2fで表され、
     前記有効マイクペアを構成する2つのマイクロホン素子を結ぶ直線は、他の前記有効マイクペアを構成する2つのマイクロホン素子を結ぶ直線のいずれとも平行でない
     収音装置。
  2.  前記複数のマイクロホン素子は、同一の平面に位置するn個(nは3以上の自然数)のマイクロホン素子と、前記平面に位置しない1個以上のマイクロホン素子とを含む
     請求項1に記載の収音装置。
  3.  前記n個のマイクロホン素子は、前記平面において正n角形を構成するように配置される
     請求項2に記載の収音装置。
  4.  前記有効マイクペアを構成する2つのマイクロホン素子間の距離は、他の前記有効マイクペアを構成する2つのマイクロホン素子間の距離のいずれかと異なる
     請求項1~3のいずれか1項に記載の収音装置。
  5.  前記複数のマイクロホン素子から得られるマイクペアの総数は、前記有効マイクペアの総数に等しい
     請求項1~4のいずれか1項に記載の収音装置。
  6.  さらに、
     前記複数のマイクロホン素子のそれぞれから得られる音声信号に対して遅延を与える遅延部と、
     前記遅延部の出力信号を加算することにより第一信号を生成する第一信号生成部と、
     前記遅延部の出力信号のうち、前記有効マイクペアを構成する2つのマイクロホン素子に対応する前記出力信号を減算することにより第二信号を生成する第二信号生成部と、
     前記第二信号にフィルタ係数を適用する適応フィルタ部と、
     生成された前記第一信号から、前記フィルタ係数が適用された前記第二信号を減算する減算部と、
     前記減算部の減算によって得られる第三信号に基づいて前記フィルタ係数を更新する係数更新部とを備える
     請求項1~5のいずれか1項に記載の収音装置。
PCT/JP2021/037473 2020-11-10 2021-10-08 収音装置 WO2022102311A1 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2022561339A JPWO2022102311A1 (ja) 2020-11-10 2021-10-08
CN202180073637.1A CN116472720A (zh) 2020-11-10 2021-10-08 拾音装置
US18/137,789 US20230262374A1 (en) 2020-11-10 2023-04-21 Sound pickup device

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2020-187537 2020-11-10
JP2020187537 2020-11-10

Related Child Applications (1)

Application Number Title Priority Date Filing Date
US18/137,789 Continuation US20230262374A1 (en) 2020-11-10 2023-04-21 Sound pickup device

Publications (1)

Publication Number Publication Date
WO2022102311A1 true WO2022102311A1 (ja) 2022-05-19

Family

ID=81601148

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2021/037473 WO2022102311A1 (ja) 2020-11-10 2021-10-08 収音装置

Country Status (4)

Country Link
US (1) US20230262374A1 (ja)
JP (1) JPWO2022102311A1 (ja)
CN (1) CN116472720A (ja)
WO (1) WO2022102311A1 (ja)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0286397A (ja) * 1988-09-22 1990-03-27 Nippon Telegr & Teleph Corp <Ntt> マイクロホンアレー
JP2019009667A (ja) * 2017-06-27 2019-01-17 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 集音装置
JP2019161400A (ja) * 2018-03-12 2019-09-19 沖電気工業株式会社 収音装置、プログラム及び方法
WO2020166634A1 (ja) * 2019-02-14 2020-08-20 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ マイクロホン装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0286397A (ja) * 1988-09-22 1990-03-27 Nippon Telegr & Teleph Corp <Ntt> マイクロホンアレー
JP2019009667A (ja) * 2017-06-27 2019-01-17 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 集音装置
JP2019161400A (ja) * 2018-03-12 2019-09-19 沖電気工業株式会社 収音装置、プログラム及び方法
WO2020166634A1 (ja) * 2019-02-14 2020-08-20 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ マイクロホン装置

Also Published As

Publication number Publication date
US20230262374A1 (en) 2023-08-17
CN116472720A (zh) 2023-07-21
JPWO2022102311A1 (ja) 2022-05-19

Similar Documents

Publication Publication Date Title
JP3522529B2 (ja) 操縦可能で可変な一次差動マイクロホン配列
Rafaely Analysis and design of spherical microphone arrays
US8204247B2 (en) Position-independent microphone system
KR101566649B1 (ko) 근거리 널 및 빔 형성
CN103888862B (zh) 声音捕获系统
US10659873B2 (en) Spatial encoding directional microphone array
Poletti et al. An approach to generating two zones of silence with application to personal sound systems
CN109151670B (zh) 声音收集装置
US20140270245A1 (en) Polyhedral audio system based on at least second-order eigenbeams
JP5679304B2 (ja) 多重極スピーカ群とその配置方法と、音響信号出力装置とその方法と、その方法を用いたアクティブノイズコントロール装置と音場再生装置と、それらの方法とプログラム
JP4787727B2 (ja) 音声収音装置、その方法、そのプログラム、およびその記録媒体
WO2022102311A1 (ja) 収音装置
Zhang et al. Selective frequency invariant uniform circular broadband beamformer
US8275160B2 (en) Delay time calculation apparatus, delay time calculation method, and storage medium storing program therefor
EP3001697A1 (en) Sound capture system
JPH0562515B2 (ja)
JP2005536113A (ja) 調和的ネスティングを有する遅延ネットワークマイクロフォン
TWI831335B (zh) 沉浸式空間音訊消音系統
JP6879848B2 (ja) 収音装置
JP2018042040A (ja) 端末装置、その制御方法および制御プログラム

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 21891558

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2022561339

Country of ref document: JP

Kind code of ref document: A

WWE Wipo information: entry into national phase

Ref document number: 202180073637.1

Country of ref document: CN

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 21891558

Country of ref document: EP

Kind code of ref document: A1