WO2019030898A1 - 雑音除去装置および雑音除去方法 - Google Patents

雑音除去装置および雑音除去方法 Download PDF

Info

Publication number
WO2019030898A1
WO2019030898A1 PCT/JP2017/029091 JP2017029091W WO2019030898A1 WO 2019030898 A1 WO2019030898 A1 WO 2019030898A1 JP 2017029091 W JP2017029091 W JP 2017029091W WO 2019030898 A1 WO2019030898 A1 WO 2019030898A1
Authority
WO
WIPO (PCT)
Prior art keywords
noise
target sound
line segment
sound
source
Prior art date
Application number
PCT/JP2017/029091
Other languages
English (en)
French (fr)
Inventor
信秋 田中
Original Assignee
三菱電機株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 三菱電機株式会社 filed Critical 三菱電機株式会社
Priority to JP2019535541A priority Critical patent/JP6639747B2/ja
Priority to DE112017007733.8T priority patent/DE112017007733T5/de
Priority to PCT/JP2017/029091 priority patent/WO2019030898A1/ja
Priority to CN201780093677.6A priority patent/CN110999317A/zh
Priority to US16/624,065 priority patent/US11212608B2/en
Publication of WO2019030898A1 publication Critical patent/WO2019030898A1/ja

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/10Earpieces; Attachments therefor ; Earphones; Monophonic headphones
    • H04R1/1083Reduction of ambient noise
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/20Arrangements for obtaining desired frequency or directional characteristics
    • H04R1/32Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
    • H04R1/40Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
    • H04R1/406Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/005Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/20Arrangements for obtaining desired frequency or directional characteristics
    • H04R1/32Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
    • H04R1/40Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2410/00Microphones
    • H04R2410/05Noise reduction with a separate noise microphone
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2430/00Signal processing covered by H04R, not provided for in its groups
    • H04R2430/20Processing of the output signals of the acoustic transducers of an array for obtaining a desired directivity characteristic
    • H04R2430/25Array processing for suppression of unwanted side-lobes in directivity characteristics, e.g. a blocking matrix
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2499/00Aspects covered by H04R or H04S not otherwise provided for in their subgroups
    • H04R2499/10General applications
    • H04R2499/13Acoustic transducers and sound field adaptation in vehicles
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/02Circuits for transducers, loudspeakers or microphones for preventing acoustic reaction, i.e. acoustic oscillatory feedback

Definitions

  • the present invention relates to a technology for removing noise other than a target sound from sounds coming from a plurality of sound sources.
  • the noise removal technology is a technology for making it easier to hear a target sound (hereinafter referred to as a target sound) by removing noise from sound data recorded using an acoustic sensor such as a microphone.
  • a target sound a target sound
  • the noise removal technology can also improve the robustness to noise in a speech recognition system or the like.
  • noise removal technology for example, in equipment monitoring system that automatically detects whether abnormal noise is included in the operation sound of the equipment, to be used for applications that prevent the deterioration of detection accuracy due to ambient noise You can also.
  • a method of removing noise from sound data there is a method of forming an acoustic sensor array by a plurality of acoustic sensors, performing signal processing by software on observation signals obtained from each acoustic sensor, and forming directivity to a target sound source. is there.
  • steep directivity can be formed while using an inexpensive acoustic sensor such as a nondirectional microphone, and the cost of hardware can be suppressed.
  • the formed directivity can be dynamically changed by software, and noise can be removed from sound data even when the sound source moves.
  • Patent Document 1 discloses a multi-beam acoustic system using a technology for arranging an acoustic sensor array at a predetermined position to correspond to any two seats installed in a vehicle. ing.
  • the predetermined position is located on a line perpendicular to any two seat directions at a specific position between any two seats.
  • Patent Document 1 In the multi-beam acoustic system described in Patent Document 1 mentioned above, the positional relationship between the acoustic sensor array and the plurality of sound sources for obtaining high noise removal performance is considered. However, even if the positional relationship between the acoustic sensor array and the plurality of sound sources is described in Patent Document 1, distortion of the output signal may be generated depending on the positional relationship between each of the acoustic sensors constituting the acoustic sensor array and the plurality of sound sources. May reduce the noise removal performance. Patent Document 1 does not disclose how to position the acoustic sensors constituting the acoustic sensor array with a plurality of sound sources in order to obtain high noise elimination performance, and the conventional noise elimination is not disclosed. The device still had the problem that distortion of the output signal may reduce the noise rejection performance.
  • the present invention has been made to solve the above-described problems, and its object is to suppress distortion of an output signal and improve noise removal performance in a noise removal device provided with an acoustic sensor array.
  • a noise removing apparatus includes an acoustic sensor array having a plurality of acoustic sensors for observing a sound signal, and a noise removing processing unit for removing noise from a sound signal observed by the plurality of acoustic sensors and acquiring a target sound.
  • the two acoustic sensors adjacent to each other among the plurality of acoustic sensors include the two acoustic sensors, a target sound source generating the target sound, and a noise source generating the noise.
  • a second line segment in which a perpendicular bisector of a first line segment connecting the two acoustic sensors connects the target sound source and a middle point of the first segment, and the noise source And a bisector of an angle formed by the third line segment connecting the second line segment and the middle point of the first line segment with the same arrangement relationship.
  • the acoustic sensor and the sound source can be disposed at a position at which distortion of the output signal is suppressed, and noise removal performance can be improved.
  • FIG. 1 is a diagram showing a configuration of a noise removal device in a first embodiment.
  • FIG. 2 is a diagram showing an example of arrangement of microphones of the noise removal device in the first embodiment.
  • FIG. 7 is a diagram showing the relationship between the time of arrival and the time difference of the sound observed by the microphone pair of the noise reduction device in Embodiment 1.
  • FIG. 7 is a diagram in which the direction of arrival of sound is plotted on the circumference centered on the microphone array of the noise eliminator according to Embodiment 1.
  • FIGS. 5A, 5B and 5C are histograms showing observation values of the direction of arrival of sound observed by the microphone pair of the noise removal apparatus in the first embodiment.
  • FIG. 2 is a block diagram of a noise removal processing unit of the noise removal apparatus in the first embodiment.
  • FIGS. 7A and 7B are diagrams showing an example of a hardware configuration of the noise removal processing unit of the noise removal apparatus according to the first embodiment.
  • 5 is a flowchart showing the operation of the noise removal device in the first embodiment.
  • FIG. 7 is a diagram showing a configuration of a noise removal device in a second embodiment. 7 is a flowchart showing the operation of the noise removal apparatus in the second embodiment.
  • FIG. 7 is a diagram showing a configuration of a noise removal device in a third embodiment.
  • FIG. 16 is a flowchart showing the operation of the noise removal device in the fourth embodiment.
  • 13A, 13B, and 13C are diagrams showing the positional relationship between the microphone of the noise removal apparatus in the fourth embodiment and the target sound source and the noise source.
  • FIG. 1 is a diagram showing the configuration of the noise removal device 1 according to the first embodiment of the present invention.
  • a microphone will be described, and an acoustic sensor pair will be described as a microphone pair and an acoustic sensor array will be described as a microphone array.
  • the acoustic sensor in the present invention is not limited to the microphone, and may be, for example, an ultrasonic sensor.
  • the noise removal device 1 includes a microphone array 3 including two or more microphones 2 (microphones 2a, 2b, 2c, 2d, 2e,...), An AD converter 4, and a noise removal processing unit 5. ing.
  • a sound signal (observation signal) observed by the microphone 2 of the noise reduction device 1 is input to the AD converter 4.
  • the AD converter 4 converts the input observation signal into a digital signal and outputs the digital signal to the noise removal processing unit 5.
  • the noise removal processing unit 5 removes the noise signal from the observation signal converted into the digital signal.
  • the noise removal processing unit 5 outputs, as an output signal, the observation signal from which the noise signal has been removed to the speaker 6 connected to the noise removal device 1.
  • a plurality of microphones 2a, 2b, 2c, 2d, 2e,... A plurality of microphones are collectively referred to as a microphone 2 are shown.
  • a set of two microphones 2 a and 2 b adjacent to each other among the plurality of microphones 2 is referred to as a microphone pair 21.
  • the microphone pair 21 may be formed by at least one set of mutually adjacent microphones 2 out of the plurality of microphones 2.
  • the arrangement position of at least one microphone pair 21 is determined according to the position of the target sound source A generating the target sound and the noise source B generating the noise.
  • the positional relationship between the target sound source A, the noise source B, and the microphone pair 21 will be described below as being known.
  • the arrangement positions of the microphones 2c, 2d, 2e,... Other than the microphones 2a, 2b constituting the microphone pair 21 can be set arbitrarily.
  • FIG. 2 is a view showing an arrangement example of the microphones 2 of the noise removal device 1 according to the first embodiment of the present invention.
  • a line segment connecting the microphone 2 a constituting the microphone pair 21 and the microphone 2 b is referred to as a first line segment 10. More specifically, for example, a line segment connecting the centers of the microphone 2 a and the microphone 2 b is taken as a first line segment 10. The middle point of the first line segment 10 is taken as the middle point 11.
  • the center of the microphone 2a and the center of the microphone 2b do not have to be a strict center.
  • a plane including the microphone 2a, the microphone 2b, the target sound source A, and the noise source B is referred to as a plane 12. More specifically, for example, the center of each of the microphones 2a and 2b, a point arbitrarily set for the target sound source A (hereinafter referred to as a set point for the target sound source A), and the noise source B A plane including a point set arbitrarily (hereinafter, described as a set point of the noise source B) is referred to as a plane 12.
  • the perpendicular bisector 13 of the first line segment 10 connects the second line segment 14 connecting the target sound source A and the middle point 11, the third line connecting the noise source B and the middle point 11,
  • the line segment 15 coincides with the bisector of the angle ⁇ . More specifically, for example, the second line segment 14 connecting the set point of the target sound source A and the midpoint 11 and the third line segment 15 connecting the set point of the noise source B and the midpoint 11 are It coincides with the bisector of the angle ⁇ .
  • the angle ⁇ 1 formed by the vertical bisector 13 and the second line segment 14 is a direction in which the target sound generated by the target sound source A arrives toward the microphone pair 21 with the vertical bisector 13 as a reference. It shows.
  • the target sound arrival direction theta 1 the angle theta 1.
  • an angle ⁇ 2 formed by the vertical bisector 13 and the third line segment 15 is a direction in which noise generated by the noise source B arrives toward the microphone pair 21 with reference to the vertical bisector 13 Is shown.
  • the angle theta 2 the noise arrival direction theta 2.
  • the target sound arrival direction theta 1 and the noise arrival direction theta 2 shows a case where the angle of the same value.
  • the arrangement of the microphone 2a and the microphone 2b that maximizes the noise removal performance of the noise removal processing unit 5 is that the microphone 2a, the microphone 2b, the target sound source A, and the noise source B are all on the same plane 12.
  • the target sound arrival direction ⁇ 1 and the noise arrival direction ⁇ 2 are the same.
  • the lengths of the second line segment 14 and the third line segment 15 are equal, and the midpoint 11, the setting point of the target sound source A, and the setting point of the noise source B are respectively isosceles It shows the case of being at the vertex of a triangle.
  • the present invention is not limited to the example shown in FIG. 2, and the second line segment 14 and the third line segment 15 may have different lengths. That is, the distance from the midpoint 11 to the set point of the target sound source A may be different from the distance from the midpoint 11 to the set point of the noise source B.
  • FIG. 3 is a diagram showing the relationship between the arrival direction and the time difference of the sound observed by the microphone pair 21 of the noise removal device 1 according to the first embodiment of the present invention.
  • scale lines are described at equal intervals on the vertical axis representing time difference, and a point is drawn in the direction of arrival of sound corresponding to the value of time difference on the scale line.
  • the arrival directions at the positions of the points are not equal.
  • the value of the angle is expressed by an arc degree method.
  • FIG. 4 is a diagram in which the directions of arrival of the sounds shown in FIG. 3 are plotted on the circumference centered on the microphone array 3 of the noise eliminator 1 according to the first embodiment of the present invention.
  • the distribution of points is dense when the direction of arrival of sound is near 0 or ⁇ ⁇ , and the distribution of points is sparse when the direction of arrival of sound is around ⁇ ⁇ / 2.
  • One of the points next to each other is calculated as the observation value of the arrival direction of the sound. In this case, in FIG.
  • FIG. 5 is a histogram showing observation values of the direction of arrival of sound observed by the microphone pair 21 of the noise eliminator 1 according to Embodiment 1 of the present invention.
  • 5A to 5C show that sound waves coming from the target sound source A and the noise source B are microphones when the microphone pair 21 is directed to a predetermined direction relative to the target sound source A and the noise source B. The distribution (uncertainty) of observed values in the direction of arrival of the sound observed by the pair 21 is shown.
  • a target sound arrival direction theta 1 since the noise arrival direction theta 2 are the same, the histogram of the arrival direction of the observed value of the target sound comes, the histogram of the observed value of DOA of the incoming noise, the same Distribution Da, Db of the shape of.
  • the distribution Da of the histogram of the observation values of the arrival direction of the target sound that arrives and the distribution Db of the histogram of the observation values of the arrival direction of the arrival noise overlap in the region Dc.
  • the histogram of the observation value of the arrival direction of the target sound to arrive has the distribution of FIG. As shown by Ea, the distribution is gentle.
  • the noise arrival direction theta 2 is 0, the histogram of the observed value of DOA of the incoming noise, a steep distribution as indicated by the distribution Eb in Figure 5C.
  • the distribution Ea of the histogram of the observation values of the arrival direction of the target sound that arrives and the distribution Eb of the histogram of the observation values of the arrival direction of the coming noise overlap in the region Ec.
  • the area of the region Dc shown in FIG. 5B is minimized. That is, as shown in FIG. 5B, when the microphone pair 21 is disposed facing the middle direction between the target sound source A and the noise source B, distortion included in the output signal output from the noise reduction device 1 is minimum. It becomes. Note that, in the case where the microphone pair 21 is disposed facing the middle direction between the target sound source A and the noise source B, in detail, in the plane 12 shown in FIG.
  • the binary angle ⁇ between the second line segment 14 connecting the target sound source A and the middle point 11 and the third line segment 15 connecting the noise source B and the middle point 11 by the perpendicular bisector 13 It is a case where it corresponds to a division line.
  • the target sound arrival direction theta 1 and the noise arrival direction theta 2 is illustrates the case where the same value is the exact same values as the target sound arrival direction theta 1 and the noise arrival direction theta 2 There is no need, and some angular variation is acceptable.
  • the perpendicular bisector 13 of the line connecting the centers of the adjacent microphones 2a and 2b is the second line 14 connecting the target sound source A and the middle point 11, and the noise source
  • the microphones 2a and 2b constituting the microphone pair 21 so as to coincide with the bisector of the angle ⁇ formed by the third line segment 15 connecting B and the middle point 11, the noise removing device 1 Noise removal performance can be maximized.
  • the microphone pair 21 is arranged as follows. First, the seating position of the driver serving as the target sound source A is known, the position of the engine sound source of the vehicle serving as the noise source B is known, and the noise removing device 1 removes the engine sound of the vehicle. Do.
  • the microphone pair 21 is a vertical bisector 13 of the first line segment 10 connecting the adjacent microphones 2a and 2b in the plane 12 including the microphones 2a and 2b adjacent to each other, the target sound source A, and the noise source B. Is a second line segment 14 connecting the target sound source A and the middle point 11 of the first line segment 10, and a third line segment 15 connecting the noise source B and the middle point 11 of the first line segment 10. It is arranged to coincide with the bisector of the angle ⁇ formed by Thereby, the noise removal device 1 can remove the engine sound of the vehicle by maximizing the noise removal performance while minimizing distortion of the output signal.
  • the noise removal apparatus 1 when observing a driver
  • the noise removal processing unit 5 outputs an output signal obtained by removing noise from the observation signal input from the microphone 2 to the speaker 6.
  • the noise removal processing unit 5 observes the arrival direction of sound for each time-frequency component based on the time difference of the observation signals obtained from the plurality of microphones 2.
  • the noise removal processing unit 5 applies, to the observation signal, a filter for removing a time-frequency component constituting a sound coming from a direction other than the target direction from the observed signal of the observed sound.
  • FIG. 6 is a block diagram of the noise removal processing unit 5 of the noise removal apparatus 1 according to the first embodiment of the present invention.
  • the noise removal processing unit 5 includes DFT (Discrete Fourier Transform) units 51 and 52, a band selection unit 53, an integrating unit 54, and an IDFT (Inverse Discrete Fourier Transform) unit 55.
  • DFT Discrete Fourier Transform
  • IDFT Inverse Discrete Fourier Transform
  • the microphone array 3 is configured by two microphones 2
  • the extension to the configuration in which the number of microphones 2 is three or more is easy, and the case where the configuration is configured by three or more microphones 2 is also included in the present invention.
  • the microphone 2a and the microphone 2b constitute a microphone array 3, and the microphone pair 21 is constituted by the two microphones 2a and 2b.
  • the DFT units 51 and 52 perform short-time discrete Fourier transform on the observation signals in the time domain input from the AD converter 4 to obtain observation signal spectra X 1 ( ⁇ , ⁇ ) and X 2 ( ⁇ ) in the frequency domain. , ⁇ ).
  • the DFT units 51 and 52 output the acquired observation signal spectra X 1 ( ⁇ , ⁇ ) and X 2 ( ⁇ , ⁇ ) in the frequency domain to the band selection unit 53.
  • represents a discrete frequency
  • represents a short time frame.
  • the band selection unit 53 determines the arrival direction ⁇ ( ⁇ , ⁇ ) of the sound for each discrete frequency based on the observed signal spectra X 1 ( ⁇ , ⁇ ) and X 2 ( ⁇ , ⁇ ) input from the DFT units 51 and 52. Calculate to The band selection unit 53 determines the filter b ( ⁇ , ⁇ ) that leaves only the time-frequency component of the sound that has arrived from the direction of the target sound, based on the calculated sound arrival direction ⁇ ( ⁇ , ⁇ ) for each discrete frequency.
  • the integration unit 54 multiplies the observed signal spectrum X 1 ( ⁇ , ⁇ ) of the microphone 2 a by the generated filter b ( ⁇ , ⁇ ) to generate an output signal spectrum Y ( ⁇ , ⁇ ) from which noise is removed.
  • the integration unit 54 outputs the generated output signal spectrum Y ( ⁇ , ⁇ ) to the IDFT unit 55.
  • the IDFT unit 55 converts the output signal spectrum Y ( ⁇ , ⁇ ) input from the integration unit 54 into an output signal y (t) in the time domain by discrete inverse Fourier transform, and outputs the output signal y (t) to the speaker 6.
  • FIGS. 7A and 7B are diagrams showing an example of a hardware configuration of the noise removal processing unit 5 of the noise removal apparatus 1 according to the first embodiment of the present invention.
  • Each function of the DFT units 51 and 52, the band selection unit 53, the integration unit 54, and the IDFT unit 55 in the noise removal processing unit 5 of the noise removal apparatus 1 is realized by a processing circuit. That is, the noise removal processing unit 5 of the noise removal apparatus 1 includes a processing circuit for realizing the respective functions.
  • the processing circuit may be the processing circuit 1a which is dedicated hardware as shown in FIG. 7A, or may be the processor 1b which executes a program stored in the memory 1c as shown in FIG. 7B. Good.
  • the processing circuit 1a may be, for example, a single circuit.
  • a compound circuit, a programmed processor, a parallel programmed processor, an application specific integrated circuit (ASIC), a field-programmable gate array (FPGA), or a combination thereof can be used.
  • the respective functions of the DFT units 51 and 52, the band selection unit 53, the integration unit 54, and the IDFT unit 55 of the noise removal processing unit 5 may be realized by processing circuits, or the functions of the respective units are integrated into one processing circuit. It may be realized by
  • the DFT units 51 and 52, the band selection unit 53, the integration unit 54 and the IDFT unit 55 of the noise removal processing unit 5 are the processor 1b
  • the function of each unit is software, firmware or software and It is realized by the combination with the firmware.
  • the software or firmware is described as a program and stored in the memory 1c.
  • the processor 1b implements the functions of the DFT units 51 and 52, the band selection unit 53, the integration unit 54, and the IDFT unit 55 of the noise removal processing unit 5 by reading and executing the program stored in the memory 1c. That is, when the DFT units 51 and 52, the band selection unit 53, the integration unit 54, and the IDFT unit 55 of the noise removal processing unit 5 are executed by the processor 1b, the respective steps shown in FIG.
  • a memory 1c for storing a program to be executed.
  • these programs cause a computer to execute the procedure or method of the DFT units 51 and 52, the band selection unit 53, the integration unit 54, and the IDFT unit 55 of the noise removal processing unit 5.
  • the processor 1 b is, for example, a central processing unit (CPU), a processing device, an arithmetic device, a processor, a microprocessor, a microcomputer, or a digital signal processor (DSP).
  • the memory 1c may be, for example, a nonvolatile or volatile semiconductor memory such as a random access memory (RAM), a read only memory (ROM), a flash memory, an erasable programmable ROM (EPROM), or an electrically EPROM (EEPROM). It may be a hard disk, a magnetic disk such as a flexible disk, or an optical disk such as a mini disk, a CD (Compact Disc), a DVD (Digital Versatile Disc), or the like.
  • RAM random access memory
  • ROM read only memory
  • EPROM erasable programmable ROM
  • EEPROM electrically EPROM
  • It may be a hard disk, a magnetic disk such as a flexible disk, or an optical disk such as a mini disk, a CD (Compac
  • DFT units 51 and 52, band selection unit 53, integration unit 54 and IDFT unit 55 of noise removal processing unit 5 are partially realized by dedicated hardware and partially realized by software or firmware. You may do it.
  • the processing circuit 1a in the noise removal processing unit 5 can realize the above-described functions by hardware, software, firmware, or a combination thereof.
  • FIG. 8 is a flowchart showing the operation of the noise removal device 1 in the first embodiment of the present invention.
  • the microphone pair 21 is disposed so as to coincide with the bisector of the angle ⁇ formed by the third line segment 15 connecting the noise source B and the midpoint 11.
  • the sound collected by the microphones 2a and 2b constituting the microphone pair 21 is converted to a digital signal by the AD converter 4 and input to the DFT units 51 and 52 as observation signals in the time domain (step ST1).
  • the DFT units 51 and 52 accumulate the observation signal input in step ST1 in a buffer or the like for a predetermined time (for example, 0.1 sec) (step ST2).
  • the observation signals in the time domain obtained by the DFT units 51 and 52 from the microphones 2a and 2b at time t are represented as x 1 (t) and x 2 (t), respectively.
  • the DFT units 51 and 52 perform short-term discrete Fourier transform on the observation signals x 1 (t) and x 2 (t) accumulated in step ST 2 to obtain an observation signal spectrum X 1 ( ⁇ , ⁇ ) in the frequency domain. , X 2 ( ⁇ , ⁇ ) (step ST3).
  • the DFT units 51 and 52 output the observed signal spectrum in the frequency domain obtained in step ST3 to the band selection unit 53.
  • the band selection unit 53 calculates the arrival direction of sound for each discrete frequency based on the observation signal spectrums X 1 ( ⁇ , ⁇ ) and X 2 ( ⁇ , ⁇ ) in the frequency domain input from the DFT units 51 and 52. (Step ST4). Assuming that the sound source exists at a position sufficiently away from the microphone array 3, the arrival direction ⁇ ( ⁇ , ⁇ ) of the sound is the observation signal spectrum X 1 ( ⁇ , ⁇ ) in the frequency domain as shown in the following equation (1). It can be calculated based on the phase difference between ⁇ ) and X 2 ( ⁇ , ⁇ ). In equation (1), c represents the speed of sound, d represents the distance between the microphones, and arg represents the argument of a complex number.
  • the arrival direction ⁇ ( ⁇ , ⁇ ) of the sound calculated by the equation (1) is, as shown in FIG. 2, the vertical two of the first line segment 10 connecting the microphones 2a and 2b constituting the microphone pair 21.
  • the angle (arc degree method) when the direction of the dividing line 13 is 0 is obtained.
  • the band selection unit 53 calculates the time of the sound arriving from the direction of the target sound as shown by the following equation (2) A filter b ( ⁇ , ⁇ ) that leaves only frequency components is generated (step ST5).
  • the band selection unit 53 outputs the generated filter to the integration unit 54.
  • is a set of arrival directions of the target sound. Equation (2) generates a filter in which the time-frequency component of the sound coming from the desired direction is multiplied by 1 as a coefficient, and the other sound components are multiplied by 0.
  • the filter extracts only the time-frequency component of the target sound included in the observation signal.
  • the integration unit 54 multiplies the observed signal spectrum X 1 ( ⁇ , ⁇ ) of the microphone 2 a converted in step ST 3 by the filter b ( ⁇ , ⁇ ) generated in step ST 5 to remove noise from the output signal spectrum Y ( ⁇ , ⁇ ) is generated (step ST6).
  • the integration unit 54 outputs the generated output signal spectrum Y ( ⁇ , ⁇ ) to the IDFT unit 55.
  • step ST6 although the case where the filter b ( ⁇ , ⁇ ) is multiplied to the observed signal spectrum X 1 ( ⁇ , ⁇ ) of the microphone 2a has been described as an example, the observed signal spectrum X 2 ( ⁇ , ⁇ of the microphone 2b
  • the filter signal ⁇ may be multiplied by the filter b ( ⁇ , ⁇ ), or the observed signal spectrum of an arbitrary microphone 2 may be multiplied by the filter b ( ⁇ , ⁇ ).
  • the IDFT unit 55 converts the output signal spectrum Y ( ⁇ , ⁇ ) generated in step ST6 into an output signal y (t) in the time domain by discrete inverse Fourier transform (step ST7).
  • the IDFT unit 55 outputs the output signal y (t) converted in step ST7 to the speaker 6 (step ST8).
  • the flowchart returns to the process of step ST1 and repeats the above-mentioned process.
  • the output destination of the IDFT unit 55 may be an earphone, a memory, a hard disk or the like.
  • the output destination is a storage medium such as a memory or a hard disk, digital data of sound from which noise is removed is stored in the storage medium.
  • the band selection unit 53 When the microphone array 3 is configured by three or more microphones 2, for example, the band selection unit 53 generates a filter using an average value of the arrival directions of sounds observed by the plurality of microphone pairs 21. It is also good. This enables more accurate noise removal.
  • the noise removing device 1 removes noise from the sound signals observed by the microphone array 3 having the plurality of microphones 2 for observing the sound signal and the plurality of microphones 2.
  • the two microphones 2 adjacent to each other are the two microphones 2, and the target sound source A for generating the target sound.
  • the perpendicular bisector 13 of the first line segment 10 connecting the two microphones 2 is the middle point of the target sound source A and the first line segment 10
  • An arrangement that coincides with the bisector of the angle ⁇ between the second line segment 14 connecting the second line segment 11 and the third line segment 15 connecting the noise source B and the middle point 11 of the first line segment 10 It was configured to have a relationship. Therefore, the noise removal device 1 of the first embodiment can suppress distortion of the output signal, and can realize high noise removal performance. This improves the clarity of the target sound.
  • FIG. 9 is a diagram showing the configuration of the noise eliminator 1A according to the second embodiment of the present invention.
  • the noise removal device 1A is configured by adding an echo canceling unit 8 to the noise removal device 1 of the first embodiment shown in FIG.
  • parts identical or corresponding to the constituent elements of the noise removal device 1 in the first embodiment are given the same reference numerals as the reference numerals used in the first embodiment, and the description will be omitted or simplified.
  • the reproduction device 7 is connected to the noise removal device 1A.
  • the reproduction device 7 receives the voice of the other party (hereinafter referred to as a call voice), and performs a process of reproducing the received call voice by the reproduction speaker 101.
  • a call voice the voice of the other party
  • the reproduced call speech is mixed in the speech microphone (microphone array 3) of the speaker 102, and the speaker speech is repeatedly reproduced like echo and output from the speaker 6 Be done.
  • the echo canceling unit 8 performs processing for avoiding a situation where the speaker voice is repeatedly reproduced like echo.
  • the noise eliminator 1A a plurality of microphones 2 observe the speech of the call output from the reproduction speaker 101 and the speech of the speaker 102. Further, the noise removal apparatus 1A performs the same process as that of the first embodiment to remove the call voice output from the reproduction speaker 101 as noise from the observation signal, and the target voice of the utterance voice of the speaker 102. Get an output signal. Furthermore, the noise removal device 1A performs an echo canceling process on the output signal of the uttered voice based on the reference signal of the reproduction device 7.
  • the microphones 2a and 2b constituting the microphone pair 21 have the perpendicular bisector 13 of the first line segment 10, Bisection of the angle ⁇ between the second line segment 14 connecting the target sound source A and the middle point 11 of the first line segment 10 and the third line segment 15 connecting the noise source B and the middle point 11 It is arranged to match the line.
  • the noise removal processing unit 5 removes noise (echo component) output from the reproduction speaker 101 that is the noise source B from the observation signal input from the microphone 2.
  • the noise removal processing unit 5 outputs the output signal from which the noise has been removed to the echo canceling unit 8.
  • the echo canceling unit 8 removes the residual echo component from the output signal of the noise removal processing unit 5.
  • the echo canceling unit 8 removes the residual echo component from the output signal input from the noise removal processing unit 5 based on the reference signal of the reproduction device 7.
  • the LMS algorithm and the affine projection algorithm are known as methods by which the echo canceling unit 8 removes the residual echo component based on the reference signal of the reproduction device 7.
  • the echo canceling unit 8 outputs an output signal from which the residual echo component has been removed to the speaker 6.
  • the output signal of the speaker 102 from which the residual echo component has been removed is output from the speaker 6.
  • the noise removing processing unit 5 removes noise from the observation signal of the speaker 102 outputted from the microphone pair 21 arranged in the positional relationship shown in FIG. By doing this, the performance of removing the residual echo component in the echo canceling unit 8 can be improved.
  • the clarity of the voice of the speaker 102 as the target sound is improved.
  • FIG. 10 is a flowchart showing the operation of the noise removal device 1A in the second embodiment of the present invention.
  • the same steps as those of the noise removal device 1 in the first embodiment are given the same reference numerals as the reference numerals shown in FIG. 8, and the explanation will be omitted or simplified.
  • step ST7 when the IDFT unit 55 converts the output signal spectrum Y ( ⁇ , ⁇ ) into an output signal y (t) in the time domain by discrete inverse Fourier transform, the IDFT unit 55 converts the output signal y (t) after conversion Are output to the echo canceling unit 8.
  • the echo canceling unit 8 removes the residual echo component from the output signal y (t) converted at step ST7 based on the reference signal of the reproduction device 7, and generates the output signal z (t) (step ST11). .
  • the echo canceling unit 8 outputs the output signal z (t) generated in step ST11 to the speaker 6 (step ST12). After that, the flowchart returns to the process of step ST1 and repeats the above-mentioned process.
  • the noise removal apparatus 1A of the second embodiment can improve the echo component removal performance and improve the clarity of the voice of the speaker who is the target sound.
  • FIG. 11 is a diagram showing the configuration of the noise removal device 1B in the third embodiment of the present invention.
  • the noise removal device 1B is configured by adding the abnormal noise detection unit 9 to the noise removal device 1 of the first embodiment shown in FIG.
  • parts identical or corresponding to the constituent elements of the noise removal device 1 in the first embodiment are given the same reference numerals as the reference numerals used in the first embodiment, and the description will be omitted or simplified.
  • the noise removal apparatus 1B the plurality of microphones 2 observe the operation sound output from the monitoring target device 103 and the noise generated by the noise source B. Further, the noise removal apparatus 1B performs the same processing as that of the first embodiment to remove noise from the observation signal, and obtains an output signal of the operation sound of the monitoring target device 103 which is the target sound. Furthermore, the noise removal device 1B performs processing to detect abnormal noise from the operation sound of the monitoring target device 103.
  • the noise removal device 1B according to the third embodiment is applicable to, for example, a device monitoring system that constantly monitors the operation noise of a device and detects abnormal noise associated with a failure or failure of the device.
  • At least one set of microphone pairs 21 constituting the microphone array 3 is disposed in the positional relationship shown in FIG. 2 of the first embodiment. That is, in the plane 12 including the microphones 2a and 2b, the target sound source A, and the noise source B, the microphones 2a and 2b constituting the microphone pair 21 have the perpendicular bisector 13 of the first line segment 10, Bisection of the angle ⁇ between the second line segment 14 connecting the target sound source A and the middle point 11 of the first line segment 10 and the third line segment 15 connecting the noise source B and the middle point 11 It is arranged to match the line.
  • the noise removal processing unit 5 removes a signal obtained by removing noise from the observation signal input from the microphone 2 and obtains a sound signal of the operation sound of the monitoring target device 103 which is the target sound.
  • the noise removal processing unit 5 outputs the sound signal of the operation sound of the monitoring target device 103 from which noise has been removed to the abnormal sound detection unit 9 as an output signal.
  • the abnormal noise detection unit 9 detects abnormal noise generated in the monitoring target device 103 from the output signal input from the noise removal processing unit 5. For example, the detection method described in Reference 1 or Reference 2 can be applied to the processing in which the abnormal sound detection unit 9 detects abnormal sound. The abnormal noise detection unit 9 outputs a detection result indicating whether or not abnormal noise is detected.
  • noise removal processing is performed on the sound signal of the operation sound of the monitoring target device 103 output from the microphone pair 21 arranged in the positional relationship shown in FIG. 2 By removing noise from the unit 5, it is possible to improve the accuracy of detecting abnormal noise generated in the monitoring target device 103 in a wide variety of environments.
  • FIG. 12 is a flow chart showing the operation of the noise removal device 1B in the third embodiment of the present invention.
  • the same steps as those of the noise removal device 1 in the first embodiment are given the same reference numerals as the reference numerals shown in FIG. 8, and the explanation will be omitted or simplified.
  • step ST7 when the IDFT unit 55 converts the output signal spectrum Y ( ⁇ , ⁇ ) into an output signal y (t) in the time domain by discrete inverse Fourier transform, the output signal y (t) is an abnormal sound detector Output to 9
  • the abnormal sound detection unit 9 compares the frequency of the output signal y (t) converted in step ST7 with a preset threshold value to determine whether or not the noise is abnormal (step ST21).
  • the abnormal noise detection unit 9 outputs the determination result as to whether or not the abnormal noise is generated to a device control apparatus (not shown) or the like as a detection result (step ST22). After that, the flowchart returns to the process of step ST1 and repeats the above-mentioned process.
  • the process of the abnormal sound detection part 9 of step ST21 mentioned above is an example, and it is possible to apply the other abnormal sound detection process.
  • the microphone 2 observes the sound signal of the operation sound of the monitoring target device 103, and the noise removing processing unit 5 refers to the target sound acquired.
  • the apparatus is configured to include the abnormal noise detection unit 9 that detects abnormal noise generated in the monitoring target device 103. Therefore, the noise removal device 1B according to the third embodiment can improve the detection accuracy of abnormal noise in various environments.
  • the abnormal sound detection unit 9 detects abnormal noise, for example, the control to automatically stop the monitoring target device 103 is performed, or control to notify the worker of the problem of the monitoring target device 103 by alarm or mail. It can be carried out. As a result, it is possible to prevent the monitoring target device 103 from operating for a long time in an unstable state.
  • FIG. 13 is a diagram showing the positional relationship between the microphone 2 of the noise eliminator 1 according to Embodiment 4 of the present invention and the target sound source A and the noise sources B 1 and B 2 .
  • FIG. 13A is a diagram showing the positional relationship between the microphone array 3 and the range in which the target sound source A and the noise sources B 1 and B 2 may exist.
  • FIG. 13B is a diagram showing the positional relationship between the three microphones 2a, 2b and 2c that constitute the microphone array 3.
  • 13C is a diagram illustrating a microphone 2a, 2b, and 2c, and the target sound source A, the positional relationship between the noise source B 1, B 2.
  • a range in which the target sound source A may exist (hereinafter referred to as a target sound source direction range) F around the microphone array 3 and a range in which the noise sources B 1 and B 2 may exist (hereinafter to as the noise source direction range) G 1, G 2 are formed.
  • the boundary between the target sound source direction range F and the noise source direction range G 1 is indicated by an interface H 1 passing through the center of the microphone array 3.
  • the boundary between the target sound source direction range F and the noise source direction range G 2 is indicated by an interface H 2 passing through the center of the microphone array 3.
  • a plurality of target sound sources A may exist.
  • the noise source B 1 within the noise source direction range G 1 may be plurality of noise sources B 2 within the noise source direction range G 2 is there may be a plurality.
  • intersection K of the boundary line H 3 and border H 4 intersect, the center of the microphone 2a, a triangle formed by connecting the center of the microphone 2b is of a line connecting the center of the intersection K and the microphone 2a length And the length of a line segment connecting the intersection point K and the center of the microphone 2b is an equal isosceles triangle.
  • a triangle formed by connecting the intersection point K, the center of the microphone 2a, and the center of the microphone 2c is the length of a line connecting the intersection point K and the center of the microphone 2a, the intersection point K, and the center of the microphone 2c It becomes an isosceles triangle with the length of the line segment which connects and.
  • perpendicular bisector 13 of the first segment 10 is perpendicularly bisects is medium and the target sound source A
  • a second line segment 14 connecting the points 11 coincides with the noise source B 1, the midpoint 11 and the third segment 15 and the angle theta 5 bisector connecting.
  • a middle point of a first line segment 10 connecting the center of the microphone 2a and the center of the microphone 2c is taken as a middle point 11.
  • Microphone 2a Noto in a plane 12 that includes a microphone 2c, a target sound source A, and a noise source B 2, perpendicular bisector 13 of the first segment 10, connecting the target sound source A and the midpoint 11 It coincides with the bisector of the angle ⁇ 6 formed by the second line segment 14 and the third line segment 15 connecting the noise source B 2 and the midpoint 11.
  • the distance between the microphone array 3 and the target sound source A or the distance between the microphone array 3 and the noise sources B 1 and B 2 is sufficiently longer than the distance between the microphones 2 a, 2 b and 2 c.
  • the microphone array 3 has been described as being configured by the three microphones 2 arranged as described above, the microphone array 3 may include at least the three microphones 2 arranged as described above.
  • the AD converter 4 converts the observation signal of the sound observed by the microphone array 3 including the microphones 2 arranged as described above into a digital signal as in the first embodiment, and the noise removal processing unit 5 converts noise. Remove to obtain an output signal.
  • the configuration of the second embodiment may be applied, and the echo canceling unit 8 may be configured to remove the residual echo component with respect to the output signal obtained by the noise removing processing unit 5 removing noise.
  • the configuration of the third embodiment is applied, and the abnormal noise detection unit 9 performs an abnormal noise detection process on an output signal obtained by the noise removal processing unit 5 removing noise. It is also good.
  • the noise removing device removes noise from the sound signal observed by the microphone 2 and the microphone array 3 having three or more microphones 2 that observe the sound signal.
  • a target sound source direction range that includes a noise removal processing unit 5 for acquiring a target sound, and is a range in which a target sound source for generating a target sound can exist in a plane I where three adjacent microphones 2 of the microphones 2 are located.
  • the microphone 2a is disposed on the line J
  • the microphones 2b and 2c are disposed on the two boundary lines H 3 and H 4 respectively
  • two of the boundary lines H 3 and H 4 form an angle ⁇ 4
  • Target sound source A is on the equal division line
  • microphones 2a, 2b, 2c includes two microphones 2 adjacent to each other, the target sound source A
  • the perpendicular bisector 13 of the first line segment 10 connecting the two microphones connects the target sound source A and the midpoint 11 of the first line segment 10
  • the noise eliminator according to the fourth embodiment is located on the boundary between the target sound source direction range and the noise source direction range where the target sound is most difficult to be clarified, that is, the position where the noise source is closest to the target sound source. In the case where the noise source is located, the noise removal performance can be maximized. Therefore, according to the noise removal apparatus of the fourth embodiment, stable noise removal performance can be realized regardless of the position where the noise source is within the noise source direction range. become.
  • the noise removal apparatus provided with the microphone array 3 comprised by the three microphones 2 shown in Embodiment 4 is applied to a gun microphone, a conference system, etc., for example.
  • the present invention allows free combination of each embodiment, modification of any component of each embodiment, or omission of any component of each embodiment. It is.
  • the noise removal apparatus is applicable to an apparatus for separating noise and the like from sounds including ambient noise and the like in addition to the sound coming from a desired direction.
  • 1, 1A, 1B noise removal device 2, 2a, 2b, 2c, 2d, 2f microphone, 3 microphone array, 4 AD converter, 5 noise removal processing unit, 8 echo canceling unit, 9 abnormal noise detection unit , 21 microphone pairs, 51, 52 DFT units, 53 band selection units, 54 integration units, 55 IDFT units.

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Otolaryngology (AREA)
  • General Health & Medical Sciences (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)

Abstract

音信号を観測する複数のマイクロホン(2)を有するマイクロホンレイ(3)と、複数のマイクロホン(2)が観測した音信号から、雑音を除去して目的音を取得する雑音除去処理部(5)とを備え、複数のマイクロホン(2)のうち、互いに隣接する2個のマイクロホン(2)は、当該2個のマイクロホン(2)と、目的音を発生する目的音源(A)と、雑音を発生する雑音源(B)とを含む平面(12)において、2個のマイクロホン(2)を結ぶ第1の線分(10)の垂直二等分線(13)が、目的音源(A)と第1の線分(10)の中点(11)とを結ぶ第2の線分(14)と、雑音源(B)と第1の線分(10)の中点(11)とを結ぶ第3の線分(15)とのなす角θの二等分線に、一致する配置関係を有する。

Description

雑音除去装置および雑音除去方法
 この発明は、複数の音源から到来する音から目的の音以外の雑音を除去する技術に関するものである。
 雑音除去技術は、マイクロホンなどの音響センサを使用して録音された音データから雑音を除去することによって、目的の音(以下、目的音と記載する)を聞き取り易くする技術である。当該技術によって、例えば、エアコン等の機器から発生する騒音により聞き取りにくくなった音声を明瞭化すること、または複数の話者が同時に発話しているときに目的とする話者の発話のみ抽出することが可能となる。
 また、雑音除去技術は、音声認識システム等における雑音に対する頑健性を向上させることもできる。また、雑音除去技術は、例えば、機器の作動音に異常な音が含まれていないかを自動的に検出する機器監視システムにおいて、周囲の騒音による検出精度の劣化を防止する用途に利用することもできる。
 音データから雑音を除去する方法として、複数の音響センサにより音響センサアレイを構成し、各音響センサから得られる観測信号に対してソフトウェアによる信号処理を行い、目的音源に対する指向性を形成する方法がある。当該方法では、無指向性マイクロホン等の安価な音響センサを利用しながら急峻な指向性を形成することができ、ハードウェアのコストを抑制することができるという利点がある。また、形成された指向性をソフトウェアによって動的に変化させることができ、音源が移動する場合にも音データから雑音を除去することができる。
 複数の音響センサによって雑音を除去する方法では、音響センサアレイを構成する音響センサの配置方法によって、雑音除去性能が変化することが知られている。例えば、特許文献1には、音響センサアレイを、車両に設置されている座席の中で任意の2つの座席に対応するように所定の位置に配置させる技術を用いたマルチビーム音響システムが開示されている。ここで、所定の位置は、任意の2つの座席の間の特定位置で任意の2つの座席方向と垂直方向の線上に位置する。
特表2013-546247号公報
 上述した特許文献1に記載されたマルチビーム音響システムでは、高い雑音除去性能を得るための音響センサアレイと複数の音源との位置関係については考慮されている。しかし、音響センサアレイと複数の音源との位置関係を特許文献1に記載された関係としても、当該音響センサアレイを構成する各音響センサと複数の音源との位置関係によっては、出力信号の歪みによって雑音除去性能が低下する場合がある。特許文献1には、高い雑音除去性能を得るために、音響センサアレイを構成する各音響センサと複数の音源との位置関係をどのようにすべきかについては開示されておらず、従来の雑音除去装置には、依然として、出力信号の歪みによって雑音除去性能が低下する場合があるという課題があった。
 この発明は、上記のような課題を解決するためになされたもので、音響センサレイを備えた雑音除去装置において、出力信号の歪みを抑制し、雑音除去性能を向上させることを目的とする。
 この発明に係る雑音除去装置は、音信号を観測する複数の音響センサを有する音響センサアレイと、複数の音響センサが観測した音信号から、雑音を除去して目的音を取得する雑音除去処理部とを備え、複数の音響センサのうち、互いに隣接する2個の前記音響センサは、当該2個の音響センサと、前記目的音を発生する目的音源と、前記雑音を発生する雑音源とを含む平面において、前記2個の音響センサを結ぶ第1の線分の垂直二等分線が、前記目的音源と前記第1の線分の中点とを結ぶ第2の線分と、前記雑音源と前記第1の線分の中点とを結ぶ第3の線分とのなす角の二等分線に、一致する配置関係を有するものである。
 この発明によれば、出力信号の歪みを抑制する位置に音響センサと音源とを配置することができ、雑音除去性能を向上させることができる。
実施の形態1における雑音除去装置の構成を示す図である。 実施の形態1における雑音除去装置のマイクロホンの配置例を示す図である。 実施の形態1における雑音除去装置のマイクロホンペアで観測される音の到来方向と時間差との関係を示す図である。 実施の形態1における雑音除去装置のマイクロホンアレイを中心とする円周上に音の到来方向をプロットした図である。 図5A、図5Bおよび図5Cは、実施の形態1における雑音除去装置のマイクロホンペアで観測される音の到来方向の観測値を示すヒストグラムである。 実施の形態1における雑音除去装置の雑音除去処理部の構成図である。 図7Aおよび図7Bは、実施の形態1における雑音除去装置の雑音除去処理部のハードウェア構成例を示す図である。 実施の形態1における雑音除去装置の動作を示すフローチャートである。 実施の形態2における雑音除去装置の構成を示す図である。 実施の形態2における雑音除去装置の動作を示すフローチャートである。 実施の形態3における雑音除去装置の構成を示す図である。 実施の形態4における雑音除去装置の動作を示すフローチャートである。 図13A、図13Bおよび図13Cは、実施の形態4における雑音除去装置のマイクロホンと、目的音源および雑音源との位置関係を示す図である。
 以下、この発明をより詳細に説明するために、この発明を実施するための形態について、添付の図面に従って説明する。
実施の形態1.
 図1は、この発明の実施の形態1における雑音除去装置1の構成を示す図である。
 本実施の形態では、音響センサの具体例として、マイクロホンを用いて説明し、音響センサペアをマイクロホンペア、音響センサアレイをマイクロホンアレイとして説明する。ただし、本発明における音響センサはマイクロホンに限定されるものではなく、例えば超音波センサであってもよい。
 雑音除去装置1は、2個以上のマイクロホン2(マイクロホン2a,2b,2c,2d,2e,・・・)を含むマイクロホンアレイ3と、AD変換器4と、雑音除去処理部5とから構成されている。雑音除去装置1のマイクロホン2で観測された音の信号(観測信号)は、AD変換器4に入力される。AD変換器4は、入力された観測信号をデジタル信号に変換し、雑音除去処理部5に出力する。雑音除去処理部5は、デジタル信号に変換された観測信号から雑音の信号を除去する。雑音除去処理部5は、雑音の信号が除去された観測信号を、出力信号として、雑音除去装置1に接続されたスピーカ6に出力する。
 次に、マイクロホン2の構成について説明する。
 図1の例では、複数のマイクロホン2a,2b,2c,2d,2e,・・・(複数のマイクロホンを総じて示す場合、マイクロホン2と記載する)を示している。複数のマイクロホン2のうち、互いに隣接する2個のマイクロホン2a,2bの組をマイクロホンペア21とする。マイクロホンペア21は、複数のマイクロホン2の中から少なくとも1組の互いに隣接するマイクロホン2で形成されればよい。少なくとも1組のマイクロホンペア21の配置位置は、目的音を発生する目的音源Aと雑音を発生する雑音源Bとの位置に応じて決定される。なお、目的音源Aと、雑音源Bと、マイクロホンペア21との位置関係は既知であるものとして、以下説明する。なお、マイクロホンペア21を構成するマイクロホン2a,2b以外の、他のマイクロホン2c,2d,2e,・・・の配置位置は任意に設定可能である。
 雑音除去装置1の雑音除去処理部5が、1組のマイクロホンペア21を用いて雑音除去を実施する場合に、雑音除去性能が最大となる、マイクロホン2aと、マイクロホン2bと、目的音源Aと、雑音源Bとの位置関係について、図2を参照しながら説明する。
 図2は、この発明の実施の形態1における雑音除去装置1のマイクロホン2の配置例を示す図である。
 マイクロホンペア21を構成するマイクロホン2aと、マイクロホン2bとを結ぶ線分を第1の線分10とする。より具体的には、例えば、マイクロホン2aとマイクロホン2bのそれぞれの中心を結ぶ線分を第1の線分10とする。第1の線分10の中点を中点11とする。なお、マイクロホン2aの中心と、マイクロホン2bの中心とは、厳密な中心である必要はない。
 また、マイクロホン2aと、マイクロホン2bと、目的音源Aと、雑音源Bとを含む平面を平面12とする。より具体的には、例えば、マイクロホン2aとマイクロホン2bのそれぞれの中心と、目的音源Aに対して任意に設定された点(以下、目的音源Aの設定点と記載する)と、雑音源Bに対して任意に設定された点(以下、雑音源Bの設定点と記載する)とを含む平面を平面12とする。
 当該平面12において、第1の線分10の垂直二等分線13が、目的音源Aと中点11とを結ぶ第2の線分14と、雑音源Bと中点11とを結ぶ第3の線分15とがなす角θの二等分線に一致する。より具体的には、例えば、目的音源Aの設定点と中点11とを結ぶ第2の線分14と、雑音源Bの設定点と中点11とを結ぶ第3の線分15とがなす角θの二等分線に一致する。
 垂直二等分線13と第2の線分14とがなす角θは、垂直二等分線13を基準として、目的音源Aで発生する目的音がマイクロホンペア21に向かって到来する方向を示している。以下、当該角θを目的音到来方向θとする。
 また、垂直二等分線13と第3の線分15とがなす角θは、垂直二等分線13を基準として、雑音源Bで発生する雑音がマイクロホンペア21に向かって到来する方向を示している。以下、当該角θを、雑音到来方向θとする。図2では、目的音到来方向θと雑音到来方向θとが、同一の値の角度となる場合を示している。
 雑音除去処理部5の雑音除去性能が最大となるマイクロホン2aおよびマイクロホン2bの配置は、マイクロホン2aと、マイクロホン2bと、目的音源Aと、雑音源Bとが、いずれも同一の平面12上にあり、また、目的音到来方向θと雑音到来方向θとが同一の場合である。
 なお、図2では、第2の線分14と第3の線分15の長さが等しく、中点11と、目的音源Aの設定点と、雑音源Bの設定点とが、それぞれ二等辺三角形の頂点にある場合を示している。しかし、図2で示した例に限定されるものではなく、第2の線分14と第3の線分15とは、長さが異なっていてもよい。即ち、中点11から目的音源Aの設定点までの距離と、中点11から雑音源Bの設定点までの距離とは、異なっていてもよい。
 次に、マイクロホンペア21で観測される音の到来方向と時間差との関係について、図3および図4を参照しながら説明する。
 図3は、この発明の実施の形態1における雑音除去装置1のマイクロホンペア21で観測される音の到来方向と時間差との関係を示す図である。
 図3では、時間差を表す縦軸に等間隔に目盛線を記載し、当該目盛線における時間差の値に対応する音の到来方向に点を打っている。図3に示す通り、当該点の位置における到来方向は不等間隔となる。ここで、音の到来方向とは、目的音到来方向θと雑音到来方向θである。以下、角度の値は弧度法で表す。
 図4は、この発明の実施の形態1における雑音除去装置1のマイクロホンアレイ3を中心とする円周上に、図3で示した音の到来方向をプロットした図である。
 図4に示す通り、音の到来方向が0または±π付近では点の分布が密に、音の到来方向が±π/2付近では、点の分布が疎になる。例えば、ノイズの影響により、観測された音声信号の時間差が、図3における1目盛分だけ実際の時間差からずれる場合、図4における実際の音の到来方向に対応する点に対して、当該点の両隣にある点のうちのいずれかが音の到来方向の観測値として算出される。
 この場合、図4において、点の分布が密な、0または±π方向の範囲では、時間差にずれが生じたとしても、音の到来方向の観測値が大きく変動することはない。一方、図4において、点の分布が疎な、±π/2方向の範囲では、少しの時間差のずれによって音の到来方向の観測値が大きく変動する。つまり、ある一定の時間差のずれが生じる状況では、音源の位置が0または±π方向に近いとき音の到来方向の観測値には小さな誤差しか生じない(観測値のばらつきが小さい)が、音源の位置が±π/2方向に近いときは音の到来方向の観測値には大きな誤差が生じる(観測値のばらつきが大きい)。これは、マイクロホンペア21によって観測される音の到来方向の観測値のヒストグラムの形状が、実際の音の到来方向がどの範囲に存在するかに依存することを意味している。
 図5は、この発明の実施の形態1における雑音除去装置1のマイクロホンペア21で観測される音の到来方向の観測値を示すヒストグラムである。
 図5Aから図5Cは、マイクロホンペア21が目的音源Aおよび雑音源Bに対して、相対的にある定められた方向を向いている場合に、目的音源Aおよび雑音源Bから到来する音波がマイクロホンペア21によって観測される音の到来方向の観測値の分布(不確実性)を示している。
 図5Aは、マイクロホンペア21が目的音源Aの方向を向いている場合、即ち目的音到来方向θ=0の場合を示している。
 図5Aの場合、目的音到来方向θが0であることから、到来する目的音の到来方向の観測値のヒストグラムは、図5Aの分布Caで示すように、急峻な分布となる。
 一方、雑音到来方向θは0よりも-π/2方向に位置している(図4参照)ことから、到来する雑音の到来方向の観測値のヒストグラムは、図5Aの分布Cbで示すように、なだらかな分布となる。
 到来する目的音の到来方向の観測値のヒストグラムの分布Caと、到来する雑音の到来方向の観測値のヒストグラムの分布Cbとは、領域Ccにおいて重複する。領域Ccの面積は、雑音除去装置1が出力する出力信号に含まれる歪みの量に比例する。
 図5Bは、マイクロホンペア21が、目的音源Aと雑音源Bとの中間の方向を向いている場合、即ち、目的音到来方向θ=雑音到来方向θの場合を示している。
 目的音到来方向θと、雑音到来方向θとが同一であることから、到来する目的音の到来方向の観測値のヒストグラムと、到来する雑音の到来方向の観測値のヒストグラムとは、同一の形状の分布Da,Dbとなる。到来する目的音の到来方向の観測値のヒストグラムの分布Daと、到来する雑音の到来方向の観測値のヒストグラムの分布Dbとは、領域Dcにおいて重複する。
 図5Cは、マイクロホンペア21が雑音源Bの方向を向いている場合、即ち、雑音到来方向θ=0の場合を示している。
 図5Cの場合、目的音到来方向θが0よりもπ/2方向に位置している(図4参照)ことから、到来する目的音の到来方向の観測値のヒストグラムは、図5Cの分布Eaで示すように、なだらかな分布となる。
 一方、雑音到来方向θは0であることから、到来する雑音の到来方向の観測値のヒストグラムは、図5Cの分布Ebで示すように急峻な分布となる。
 到来する目的音の到来方向の観測値のヒストグラムの分布Eaと、到来する雑音の到来方向の観測値のヒストグラムの分布Ebとは、領域Ecにおいて重複する。
 図5Aから図5Cで示した、3つの領域Cc,Dc,Ecの面積を比較すると、図5Bで示した領域Dcの面積が最小となる。即ち、図5Bで示したように、マイクロホンペア21が目的音源Aと雑音源Bとの中間の方向を向いて配置されている場合、雑音除去装置1が出力する出力信号に含まれる歪みが最小となる。
 なお、マイクロホンペア21が、目的音源Aと雑音源Bとの中間の方向を向いて配置されている場合とは、詳細には、図2で示した平面12において、第1の線分10の垂直二等分線13が、目的音源Aと中点11とを結ぶ第2の線分14と、雑音源Bと中点11とを結ぶ第3の線分15とがなす角θの二等分線に一致する場合である。
 なお、図5Bでは、目的音到来方向θと雑音到来方向θとが同一値である場合を示したが、目的音到来方向θと雑音到来方向θとは厳密な同一値である必要はなく、若干の角度変動が許容されるものである。
 以上のように、平面12において、隣接するマイクロホン2a,2bの中心を結ぶ線分の垂直二等分線13が、目的音源Aと中点11とを結ぶ第2の線分14と、雑音源Bと中点11とを結ぶ第3の線分15とがなす角θの二等分線に一致するように、マイクロホンペア21を構成するマイクロホン2a,2bを配置することにより、雑音除去装置1の雑音除去性能を最大化することができる。
 例えば、車両に搭載するマイクロホン2で運転者の音声を観測する場合、マイクロホンペア21は以下のように配置される。まず、目的音源Aとなる運転者の着座位置が既知であり、雑音源Bとなる車両のエンジン音の発生源の位置が既知であり、雑音除去装置1が車両のエンジン音を除去するものとする。マイクロホンペア21は、互いに隣接するマイクロホン2a,2bと、目的音源Aと、雑音源Bとを含む平面12において、隣接するマイクロホン2a,2bを結ぶ第1の線分10の垂直二等分線13が、目的音源Aと第1の線分10の中点11とを結ぶ第2の線分14と、雑音源Bと第1の線分10の中点11とを結ぶ第3の線分15とがなす角θの二等分線に一致するように配置される。これにより、雑音除去装置1は、出力信号の歪みを最小化しながら、雑音除去性能を最大にして車両のエンジン音を除去することができる。
 上記では、運転者の音声を観測する際に、雑音除去装置1が車両のエンジン音を雑音として除去する場合を例に示した。これに替えて、雑音除去装置1が、助手席に着座する同乗者の音声を雑音として除去する、または車両に搭載されたスピーカから出力される音声を雑音として除去する構成としてもよい。
 また、雑音除去装置1は、車載に限定されるものではなく、機器の監視システム等に適用可能である。その場合、雑音除去装置1は、監視対象の機器の作動音を目的音として取得し、その他の機器の作動音を雑音として除去し、監視対象の機器の作動音のみを監視処理に提供することができる。
 次に、図1の構成の説明に戻り、雑音除去処理部5について説明する。
 雑音除去処理部5は、マイクロホン2から入力された観測信号から雑音を除去した出力信号を、スピーカ6に出力する。一般的に、マイクロホンアレイ3を用いて雑音を除去する場合、雑音除去処理部5は複数のマイクロホン2から得られる観測信号の時間差に基づいて音の到来方向を時間-周波数成分ごとに観測する。次に、雑音除去処理部5は、観測した音の観測信号から目的とする方向以外の方向から到来している音を構成する時間-周波数成分を除去するフィルタを観測信号に掛ける。
 図6は、この発明の実施の形態1における雑音除去装置1の雑音除去処理部5の構成図である。
 雑音除去処理部5は、DFT(Discrete Fourier Transform)部51,52、帯域選択部53、積算部54、およびIDFT(Inverse Discrete Fourier Transform)部55を備える。ここで、図6に示す構成を用いて説明するが、雑音除去処理部5の構成は、図6に示した構成に限定されるものではなく、他の構成を適用してもよい。
 また、説明を単純化するために、以降ではマイクロホンアレイ3が2個のマイクロホン2で構成されている場合を例に説明する。マイクロホン2の数を3個以上とする構成への拡張は容易であり、3個以上のマイクロホン2により構成される場合も、本発明に含まれるものとする。マイクロホン2aおよびマイクロホン2bがマイクロホンアレイ3を構成し、当該2個のマイクロホン2a,2bによってマイクロホンペア21が構成されているものとする。
 DFT部51,52は、AD変換器4から入力された時間領域の観測信号に対して、短時間離散フーリエ変換を施し、周波数領域の観測信号スペクトルX(ω,τ)、X(ω,τ)を得る。DFT部51,52は、取得した周波数領域の観測信号スペクトルX(ω,τ)、X(ω,τ)を帯域選択部53に出力する。ここで、ωは離散周波数、τは短時間フレームを表す。帯域選択部53は、DFT部51,52から入力された観測信号スペクトルX(ω,τ)、X(ω,τ)に基づいて音の到来方向θ(ω,τ)を離散周波数毎に計算する。帯域選択部53は、計算した離散周波数ごとの音の到来方向θ(ω,τ)に基づいて、目的音の方向から到来した音の時間-周波数成分のみを残すフィルタb(ω,τ)を生成する。
 積算部54は、マイクロホン2aの観測信号スペクトルX(ω,τ)に、生成したフィルタb(ω,τ)を掛け、雑音が除去された出力信号スペクトルY(ω,τ)を生成する。積算部54は、生成した出力信号スペクトルY(ω,τ)をIDFT部55に出力する。IDFT部55は、積算部54から入力された出力信号スペクトルY(ω,τ)を離散逆フーリエ変換によって時間領域の出力信号y(t)に変換し、スピーカ6に出力する。
 次に、雑音除去処理部5のハードウェア構成例を説明する。
 図7Aおよび図7Bは、この発明の実施の形態1における雑音除去装置1の雑音除去処理部5のハードウェア構成例を示す図である。
 雑音除去装置1の雑音除去処理部5におけるDFT部51,52、帯域選択部53、積算部54およびIDFT部55の各機能は、処理回路により実現される。即ち、雑音除去装置1の雑音除去処理部5は、上記各機能を実現するための処理回路を備える。当該処理回路は、図7Aに示すように専用のハードウェアである処理回路1aであってもよいし、図7Bに示すようにメモリ1cに格納されているプログラムを実行するプロセッサ1bであってもよい。
 図7Aに示すように、雑音除去処理部5のDFT部51,52、帯域選択部53、積算部54およびIDFT部55が専用のハードウェアである場合、処理回路1aは、例えば、単一回路、複合回路、プログラム化したプロセッサ、並列プログラム化したプロセッサ、ASIC(Application Specific Integrated Circuit)、FPGA(Field-programmable Gate Array)、またはこれらを組み合わせたものが該当する。雑音除去処理部5のDFT部51,52、帯域選択部53、積算部54およびIDFT部55の各部の機能それぞれを処理回路で実現してもよいし、各部の機能をまとめて1つの処理回路で実現してもよい。
 図7Bに示すように、雑音除去処理部5のDFT部51,52、帯域選択部53、積算部54およびIDFT部55がプロセッサ1bである場合、各部の機能は、ソフトウェア、ファームウェア、またはソフトウェアとファームウェアとの組み合わせにより実現される。ソフトウェアまたはファームウェアはプログラムとして記述され、メモリ1cに格納される。プロセッサ1bは、メモリ1cに記憶されたプログラムを読み出して実行することにより、雑音除去処理部5のDFT部51,52、帯域選択部53、積算部54およびIDFT部55の各機能を実現する。即ち、雑音除去処理部5のDFT部51,52、帯域選択部53、積算部54およびIDFT部55は、プロセッサ1bにより実行されるときに、後述する図8に示す各ステップが結果的に実行されることになるプログラムを格納するためのメモリ1cを備える。また、これらのプログラムは、雑音除去処理部5のDFT部51,52、帯域選択部53、積算部54およびIDFT部55の手順または方法をコンピュータに実行させるものであるともいえる。
 ここで、プロセッサ1bとは、例えば、CPU(Central Processing Unit)、処理装置、演算装置、プロセッサ、マイクロプロセッサ、マイクロコンピュータ、またはDSP(Digital Signal Processor)などのことである。
 メモリ1cは、例えば、RAM(Random Access Memory)、ROM(Read Only Memory)、フラッシュメモリ、EPROM(Erasable Programmable ROM)、EEPROM(Electrically EPROM)等の不揮発性または揮発性の半導体メモリであってもよいし、ハードディスク、フレキシブルディスク等の磁気ディスクであってもよいし、ミニディスク、CD(Compact Disc)、DVD(Digital Versatile Disc)等の光ディスクであってもよい。
 なお、雑音除去処理部5のDFT部51,52、帯域選択部53、積算部54およびIDFT部55の各機能について、一部を専用のハードウェアで実現し、一部をソフトウェアまたはファームウェアで実現するようにしてもよい。このように、雑音除去処理部5における処理回路1aは、ハードウェア、ソフトウェア、ファームウェア、またはこれらの組み合わせによって、上述の各機能を実現することができる。
 次に、雑音除去装置1の動作について、図8のフローチャートを参照しながら説明する。
 図8は、この発明の実施の形態1における雑音除去装置1の動作を示すフローチャートである。
 図8に示す動作が行われる前提として、図2で示した平面12において、第1の線分10の垂直二等分線13が、目的音源Aと中点11とを結ぶ第2の線分14と、雑音源Bと中点11とを結ぶ第3の線分15とがなす角θの二等分線に一致するように、マイクロホンペア21が配置されているものとする。
 マイクロホンペア21を構成するマイクロホン2a,2bで集音された音は、AD変換器4でデジタル信号に変換され、時間領域の観測信号としてそれぞれDFT部51,52に入力される(ステップST1)。DFT部51,52は、ステップST1で入力された観測信号を、バッファ等に一定時間(例えば、0.1sec)蓄積する(ステップST2)。DFT部51,52が、時刻tにおいてマイクロホン2a,2bから得る時間領域の観測信号をそれぞれx(t)、x(t)と表す。DFT部51,52は、ステップST2で蓄積された観測信号x(t)、x(t)に対して短時間離散フーリエ変換を施し、周波数領域の観測信号スペクトルX(ω,τ)、X(ω,τ)を得る(ステップST3)。DFT部51,52は、ステップST3で得た周波数領域の観測信号スペクトルを帯域選択部53に出力する。
 帯域選択部53は、DFT部51,52から入力された周波数領域の観測信号スペクトルX(ω,τ)、X(ω,τ)に基づき、音の到来方向を離散周波数ごとに計算する(ステップST4)。音源がマイクロホンアレイ3から十分離れた位置に存在するとすれば、音の到来方向θ(ω,τ)は、以下の式(1)に示すように、周波数領域の観測信号スペクトルX(ω,τ)、X(ω,τ)の位相差に基づいて計算することができる。
Figure JPOXMLDOC01-appb-I000001
 式(1)において、cは音速、dはマイクロホン間の距離、argは複素数の偏角を表す。
 また、式(1)によって計算される音の到来方向θ(ω,τ)は、図2に示すように、マイクロホンペア21を構成するマイクロホン2a,2bを結ぶ第1の線分10の垂直二等分線13の方向を0とするときの角度(弧度法)となる。
 帯域選択部53は、ステップST4で計算した離散周波数ごとの音の到来方向θ(ω,τ)に基づき、以下の式(2)で示すような、目的音の方向から到来した音の時間-周波数成分のみを残すフィルタb(ω,τ)を生成する(ステップST5)。帯域選択部53は、生成したフィルタを積算部54に出力する。
Figure JPOXMLDOC01-appb-I000002
 式(2)において、Θは目的音の到来方向の集合である。式(2)は、所望の方向から到来した音の時間-周波数成分には係数として1を掛け、それ以外の音の成分には0を掛けるようなフィルタを生成する。当該フィルタにより、観測信号に含まれる目的音の時間-周波数成分のみが抽出される。
 積算部54は、ステップST3で変換されたマイクロホン2aの観測信号スペクトルX(ω,τ)に、ステップST5で生成されたフィルタb(ω,τ)を掛け、雑音が除去された出力信号スペクトルY(ω,τ)を生成する(ステップST6)。積算部54は、生成した出力信号スペクトルY(ω,τ)をIDFT部55に出力する。
 なお、ステップST6の処理では、マイクロホン2aの観測信号スペクトルX(ω,τ)にフィルタb(ω,τ)を掛ける場合を例に説明したが、マイクロホン2bの観測信号スペクトルX(ω,τ)にフィルタb(ω,τ)を掛けてもよいし、任意のマイクロホン2の観測信号スペクトルにフィルタb(ω,τ)を掛けるように構成してもよい。
 IDFT部55は、ステップST6で生成された出力信号スペクトルY(ω,τ)を離散逆フーリエ変換によって時間領域の出力信号y(t)に変換する(ステップST7)。IDFT部55は、ステップST7で変換した出力信号y(t)をスピーカ6に出力する(ステップST8)。その後、フローチャートはステップST1の処理に戻り、上述した処理を繰り返す。
 上述した処理により、スピーカ6からは、雑音が除去され、歪みが抑制された音が出力される。なお、スピーカ6を例に説明したが、IDFT部55の出力先は、イヤホン、メモリ、ハードディスク等であってもよい。出力先がメモリやハードディスクなどの記憶媒体の場合には、当該記憶媒体に雑音が除去された音のデジタルデータが保存される。
 マイクロホンアレイ3が3個以上のマイクロホン2によって構成されている場合、帯域選択部53は、例えば、複数のマイクロホンペア21によって観測された音の到来方向の平均値を利用してフィルタを生成してもよい。これにより、より精度の高い雑音除去が可能になる。
 以上のように、この実施の形態1によれば、雑音除去装置1を、音信号を観測する複数のマイクロホン2を有するマイクロホンアレイ3と、複数のマイクロホン2が観測した音信号から、雑音を除去して目的音を取得する雑音除去処理部5とを備え、複数のマイクロホン2のうち、互いに隣接する2個のマイクロホン2は、当該2個のマイクロホン2と、目的音を発生する目的音源Aと、雑音を発生する雑音源Bとを含む平面12において、2個のマイクロホン2を結ぶ第1の線分10の垂直二等分線13が、目的音源Aと第1の線分10の中点11とを結ぶ第2の線分14と、雑音源Bと第1の線分10の中点11とを結ぶ第3の線分15とのなす角θの二等分線に、一致する配置関係を有するように構成した。したがって、実施の形態1の雑音除去装置1は、出力信号の歪みを抑制することができ、高い雑音除去性能を実現することができる。これにより、目的音の明瞭性が向上する。
実施の形態2.
 この実施の形態2では、エコーキャンセリング処理を行う構成を備えた雑音除去装置について説明する。
 図9は、この発明の実施の形態2における雑音除去装置1Aの構成を示す図である。
 雑音除去装置1Aは、図1に示した実施の形態1の雑音除去装置1にエコーキャンセリング部8を追加して構成している。以下では、実施の形態1における雑音除去装置1の構成要素と同一または相当する部分には、実施の形態1で使用した符号と同一の符号を付して説明を省略または簡略化する。
 図9に示すように、雑音除去装置1Aには、スピーカ6に加えて再生装置7が接続されている。再生装置7は、例えば、ハンズフリー通話システムにおいて、通話相手の音声(以下、通話音声と記載する)を受信し、受信した通話音声を再生スピーカ101で再生する処理を行う。再生スピーカ101で通話音声が再生されると、再生された通話音声が話者102の通話用マイクロホン(マイクロホンアレイ3)に混入し、話者音声がエコーのように繰り返し再生されてスピーカ6から出力される。エコーキャンセリング部8は、話者音声がエコーのように繰り返し再生される状況を回避するための処理を行う。
 雑音除去装置1Aにおいては、複数のマイクロホン2が、再生スピーカ101から出力された通話音声と、話者102の発話音声とを観測する。また、雑音除去装置1Aは、実施の形態1と同様の処理を行って、観測信号から、再生スピーカ101から出力された通話音声を雑音として除去し、目的音である話者102の発話音声の出力信号を得る。さらに、雑音除去装置1Aは、発話音声の出力信号に対して、再生装置7の参照信号に基づいてエコーキャンセリングの処理を行う。
 マイクロホンアレイ3を構成する少なくとも一組のマイクロホンペア21は、実施の形態1の図2で示した位置関係で配置されているものとする。即ち、マイクロホンペア21を構成するマイクロホン2a,2bは、マイクロホン2a,2bと、目的音源Aと、雑音源Bとを含む平面12において、第1の線分10の垂直二等分線13が、目的音源Aと第1の線分10の中点11とを結ぶ第2の線分14と、雑音源Bと中点11とを結ぶ第3の線分15とがなす角θの二等分線に一致するように配置されている。
 雑音除去処理部5は、実施の形態1と同様に、マイクロホン2から入力された観測信号から、雑音源Bである再生スピーカ101から出力される雑音(エコー成分)を除去する。雑音除去処理部5は、雑音を除去した出力信号をエコーキャンセリング部8に出力する。雑音除去処理部5による雑音の除去では、一般的に、残響または他の外乱要因によってエコー成分を完全に除去することが困難である。そこで、エコーキャンセリング部8において、雑音除去処理部5の出力信号から残留エコー成分を除去する。
 エコーキャンセリング部8は、雑音除去処理部5から入力された出力信号から、再生装置7の参照信号に基づいて残留エコー成分を除去する。エコーキャンセリング部8が、再生装置7の参照信号に基づいて残留エコー成分を除去する方法としては、LMSアルゴリズム、およびアフィン射影アルゴリズムが知られている。エコーキャンセリング部8は、残留エコー成分を除去した出力信号をスピーカ6に出力する。これにより、残留エコー成分が除去された話者102の出力信号がスピーカ6から出力される。
 エコーキャンセリング部8が残留エコー成分を除去する前に、図2で示した位置関係で配置されたマイクロホンペア21から出力された話者102の観測信号から、雑音除去処理部5が雑音を除去することにより、エコーキャンセリング部8における残留エコー成分の除去性能を向上させることができる。これにより、スピーカ6から出力された出力信号において、目的音である話者102の音声の明瞭性が向上する。
 次に、雑音除去装置1Aの動作について説明する。
 図10は、この発明の実施の形態2における雑音除去装置1Aの動作を示すフローチャートである。
 以下では、実施の形態1における雑音除去装置1と同一のステップには、図8で示した符号と同一の符号を付し、説明を省略または簡略化する。
 ステップST7において、IDFT部55が、出力信号スペクトルY(ω,τ)を離散逆フーリエ変換によって時間領域の出力信号y(t)に変換すると、IDFT部55は変換後の出力信号y(t)を、エコーキャンセリング部8に出力する。エコーキャンセリング部8は、再生装置7の参照信号に基づいて、ステップST7で変換された出力信号y(t)から残留エコー成分を除去し、出力信号z(t)を生成する(ステップST11)。エコーキャンセリング部8は、ステップST11で生成した出力信号z(t)をスピーカ6に出力する(ステップST12)。その後、フローチャートはステップST1の処理に戻り、上述した処理を繰り返す。
 以上のように、この実施の形態2によれば、雑音除去装置1Aを、マイクロホン2が、話者の通話音声の音信号を観測し、雑音除去処理部5が取得した目的音から、通話音声の残留エコー成分を除去するエコーキャンセリング部8を備えるように構成した。したがって、実施の形態2の雑音除去装置1Aは、エコー成分の除去性能を向上させ、目的音である発話者の音声の明瞭性を向上させることができる。
実施の形態3.
 この実施の形態3では、異音検出処理を行う構成を備えた雑音除去装置について説明する。
 図11は、この発明の実施の形態3における雑音除去装置1Bの構成を示す図である。
 雑音除去装置1Bは、図1に示した実施の形態1の雑音除去装置1に異音検出部9を追加して構成している。以下では、実施の形態1における雑音除去装置1の構成要素と同一または相当する部分には、実施の形態1で使用した符号と同一の符号を付して説明を省略または簡略化する。
 図11に示すように、雑音除去装置1Bは、複数のマイクロホン2が、監視対象機器103から出力される動作音と、雑音源Bで発生した雑音を観測する。また、雑音除去装置1Bは、実施の形態1と同様の処理を行って、観測信号から雑音を除去し、目的音である監視対象機器103の動作音の出力信号を得る。さらに、雑音除去装置1Bは、監視対象機器103の動作音から異音を検出する処理を行う。実施の形態3の雑音除去装置1Bは、例えば、機器の動作音を常時監視し、当該機器の不具合または故障に伴う異音を検出する機器監視システム等に適用可能である。
 マイクロホンアレイ3を構成する少なくとも一組のマイクロホンペア21は、実施の形態1の図2で示した位置関係で配置されているものとする。即ち、マイクロホンペア21を構成するマイクロホン2a,2bは、マイクロホン2a,2bと、目的音源Aと、雑音源Bとを含む平面12において、第1の線分10の垂直二等分線13が、目的音源Aと第1の線分10の中点11とを結ぶ第2の線分14と、雑音源Bと中点11とを結ぶ第3の線分15とがなす角θの二等分線に一致するように配置されている。
 雑音除去処理部5は、実施の形態1と同様に、マイクロホン2から入力された観測信号から雑音を除去した信号を除去し、目的音である監視対象機器103の動作音の音信号を得る。雑音除去処理部5は、雑音を除去した監視対象機器103の動作音の音信号を、出力信号として異音検出部9に出力する。
 異音検出部9は、雑音除去処理部5から入力された出力信号から、監視対象機器103で発生する異音を検出する。異音検出部9が異音を検出する処理は、例えば、参考文献1または参考文献2に記載された検出方法が適用可能である。異音検出部9は、異音を検出したか否かを示す検出結果を出力する。
・参考文献1
特開2010-271073号公報
・参考文献2
特開2008-76246号公報
 異音検出部9が異音を検出する処理を行う前に、図2で示した位置関係で配置されたマイクロホンペア21から出力された監視対象機器103の動作音の音信号から、雑音除去処理部5が雑音を除去することにより、多種多様な環境において監視対象機器103で発生する異音を検出する精度を向上させることができる。
 次に、雑音除去装置1Bの動作について説明する。
 図12は、この発明の実施の形態3における雑音除去装置1Bの動作を示すフローチャートである。
 以下では、実施の形態1における雑音除去装置1と同一のステップには、図8で示した符号と同一の符号を付し、説明を省略または簡略化する。
 ステップST7において、IDFT部55が、出力信号スペクトルY(ω,τ)を離散逆フーリエ変換によって時間領域の出力信号y(t)に変換すると、当該出力信号y(t)を、異音検出部9に出力する。異音検出部9は、ステップST7で変換された出力信号y(t)の周波数を予め設定された閾値と比較して異音であるか否かの判定を行う(ステップST21)。異音検出部9は、異音であるか否かの判定結果を、検出結果として機器制御装置(図示しない)等に出力する(ステップST22)。その後、フローチャートはステップST1の処理に戻り、上述した処理を繰り返す。
 なお、上述したステップST21の異音検出部9の処理は一例であり、その他の異音検出処理を適用することが可能である。
 以上のように、この実施の形態3によれば、雑音除去装置1Bを、マイクロホン2が監視対象機器103の動作音の音信号を観測し、雑音除去処理部5が取得した目的音を参照し、監視対象機器103で発生する異音を検出する異音検出部9を備えするように構成した。したがって、実施の形態3の雑音除去装置1Bは、多種多様な環境において異音の検出精度を向上させることができる。
 また、異音検出部9が異音を検出した場合に、例えば監視対象機器103を自動的に停止させる制御を行う、警報またはメール等により作業者に監視対象機器103の不具合を通知する制御を行うことができる。これにより、監視対象機器103が動作に不安定な状態で長時間稼動することを防止することができる。
実施の形態4.
 この実施の形態4では、目的音源と雑音源の存在する範囲が移動し得る状況において、精度よく雑音除去するためのマイクロホン2の配置について説明する。
 図13は、この発明の実施の形態4における雑音除去装置1のマイクロホン2と、目的音源Aと雑音源B,Bとの位置関係を示す図である。図13Aは、目的音源Aと雑音源B,Bが存在し得る範囲とマイクロホンアレイ3の位置関係を示す図である。図13Bは、マイクロホンアレイ3を構成する3個のマイクロホン2a,2b,2cの位置関係を示す図である。図13Cは、マイクロホン2a,2b,2cと、目的音源Aと、雑音源B,Bとの位置関係を示す図である。
 図13Aに示すように、マイクロホンアレイ3を中心に、目的音源Aが存在し得る範囲(以下、目的音源方向範囲と記載する)Fと、雑音源B,Bが存在し得る範囲(以下、雑音源方向範囲と記載する)G,Gが形成される。目的音源方向範囲Fと、雑音源方向範囲Gとの境界は、マイクロホンアレイ3の中心を通る境界面Hで示される。目的音源方向範囲Fと、雑音源方向範囲Gとの境界は、マイクロホンアレイ3の中心を通る境界面Hで示される。目的音源方向範囲Fの範囲内において、目的音源Aは複数存在してもよい。同様に、雑音源方向範囲Gの範囲内で雑音源Bは複数存在してもよく、雑音源方向範囲Gの範囲内で雑音源Bは複数存在してもよい。
 次に、マイクロホンアレイ3を構成する各マイクロホン2の配置について、図13Bを参照しながら説明する。マイクロホンアレイ3を構成する3個のマイクロホン2が平面I上に位置しているものとする。また、平面Iと境界面Hとの交線を境界線Hとし、平面Iと境界面Hとの交線を境界線Hとする。平面Iにおいて、3個のマイクロホン2のうち、中央に位置するマイクロホン2a(第1の音響センサ)は、境界線Hと境界線Hとがなす角θの二等分線J上に配置される。マイクロホン2aの隣に位置するマイクロホン2b(第2の音響センサ)は、境界線H上に配置される。マイクロホン2aのもう一方の隣に位置するマイクロホン2c(第3の音響センサ)は、境界線H上に配置される。
 境界線Hと境界線Hとが交わる交点Kと、マイクロホン2aの中心と、マイクロホン2bの中心とを結んで形成される三角形は、交点Kとマイクロホン2aの中心とを結ぶ線分の長さと、交点Kとマイクロホン2bの中心とを結ぶ線分の長さとが等しい二等辺三角形となる。
 同様に、交点Kと、マイクロホン2aの中心と、マイクロホン2cの中心とを結んで形成される三角形は、交点Kとマイクロホン2aの中心とを結ぶ線分の長さと、交点Kとマイクロホン2cの中心とを結ぶ線分の長さとが等しい二等辺三角形となる。
 また、図13Cに示すように、二等分線J上に目的音源Aが位置し、境界線H上に雑音源Bが位置した場合に、目的音源A、雑音源B、およびマイクロホン2a,2bは、実施の形態1で示した関係を満たす。
 図13Cで示すように、マイクロホン2aと、マイクロホン2bとを結ぶ第1の線分10の中点を、中点11とする。マイクロホン2aと、マイクロホン2bと、目的音源Aと、雑音源Bとを通る平面12において、第1の線分10を垂直に二等分する垂直二等分線13が、目的音源Aと中点11とを結ぶ第2の線分14と、雑音源Bと中点11とを結ぶ第3の線分15とがなす角θの二等分線に一致する。
 また、図13Cに示すように、マイクロホン2aの中心と、マイクロホン2cの中心とを結ぶ第1の線分10の中点を、中点11とする。マイクロホン2aのと、マイクロホン2cと、目的音源Aと、雑音源Bとを含む平面12において、第1の線分10の垂直二等分線13が、目的音源Aと中点11とを結ぶ第2の線分14と、雑音源Bと中点11とを結ぶ第3の線分15とがなす角θの二等分線に一致する。
 なお、マイクロホンアレイ3と目的音源Aとの距離、またはマイクロホンアレイ3と雑音源B,Bとの距離は、各マイクロホン2a,2b,2c間の距離に比べて十分長いものとする。また、マイクロホンアレイ3は、上記のように配置した3個のマイクロホン2により構成されるものとして説明したが、少なくとも上記のように配置した3個のマイクロホン2を含む構成であってもよい。
 以上のように配置したマイクロホン2を備えるマイクロホンアレイ3で観測した音の観測信号に対して、実施の形態1と同様にAD変換器4がデジタル信号に変換し、雑音除去処理部5が雑音を除去して出力信号を得る。また、実施の形態2の構成を適用して、雑音除去処理部5が雑音を除去して得られた出力信号に対して、エコーキャンセリング部8が残留エコー成分を除去する構成としてもよい。また、実施の形態3の構成を適用し、雑音除去処理部5が雑音を除去して得られた出力信号に対して、異音検出部9が異音の検出処理を行うように構成してもよい。
 以上のように、この実施の形態4によれば、雑音除去装置を、音信号を観測する3以上のマイクロホン2を有するマイクロホンアレイ3と、マイクロホン2が観測した音信号から、雑音を除去して目的音を取得する雑音除去処理部5とを備え、マイクロホン2のうち、隣接する3個のマイクロホン2が位置する平面Iにおいて目的音を発生する目的音源が存在し得る範囲である目的音源方向範囲Fと、雑音を発生させる雑音源B1,B2が存在し得る範囲である雑音源方向範囲G,Gとの境界を示す2本の境界線H,Hがなす角の二等分線J上にマイクロホン2aを配置し、2本の境界線H,Hのそれぞれの線上にマイクロホン2b,2cを配置し、2本の境界線H,Hがなす角θの二等分線上に目的音源Aが位置し、2本の境界線H,H上のそれぞれに雑音源B,Bが位置した場合に、マイクロホン2a,2b,2cは、互いに隣接する2個のマイクロホン2と、目的音源Aと、雑音源Bとを含む平面12において、2個のマイクロホンを結ぶ第1の線分10の垂直二等分線13が、目的音源Aと第1の線分10の中点11とを結ぶ第2の線分14と、雑音源Bと第1の線分10の中点11とを結ぶ第3の線分15とのなす角θ,θの二等分線に一致する配置関係を有するように構成した。
 したがって、実施の形態4の雑音除去装置は、目的音の明瞭化が最も困難な状況、つまり雑音源が目的音源に最も近づく位置である、目的音源方向範囲と雑音源方向範囲との境界線上に雑音源が位置する場合において、雑音除去性能を最大化させることができる。このため、実施の形態4の雑音除去装置によれば、雑音源が雑音源方向範囲内であれば、どのような位置に存在していたとしても、安定した雑音除去性能を実現することが可能になる。
 実施の形態4で示した、3個のマイクロホン2により構成されるマイクロホンアレイ3を備えた雑音除去装置は、例えばガンマイク、または会議システム等に適用することが想定される。
 上記以外にも、本発明はその発明の範囲内において、各実施の形態の自由な組み合わせ、各実施の形態の任意の構成要素の変形、または各実施の形態の任意の構成要素の省略が可能である。
 この発明に係る雑音除去装置は、所望の方向から到来した音以外に、周囲の雑音等を含んだ音から、当該雑音等を分離するための機器に適用可能である。
 1,1A,1B 雑音除去装置、2,2a,2b,2c,2d,2e,2f マイクロホン、3 マイクロホンアレイ、4 AD変換器、5 雑音除去処理部、8 エコーキャンセリング部、9 異音検出部、21 マイクロホンペア、51,52 DFT部、53 帯域選択部、54 積算部、55 IDFT部。

Claims (5)

  1.  音信号を観測する複数の音響センサを有する音響センサアレイと、
     前記複数の音響センサが観測した音信号から、雑音を除去して目的音を取得する雑音除去処理部とを備え、
     前記複数の音響センサのうち、互いに隣接する2個の前記音響センサは、当該2個の音響センサと、前記目的音を発生する目的音源と、前記雑音を発生する雑音源とを含む平面において、前記2個の音響センサを結ぶ第1の線分の垂直二等分線が、前記目的音源と前記第1の線分の中点とを結ぶ第2の線分と、前記雑音源と前記第1の線分の中点とを結ぶ第3の線分とのなす角の二等分線に、一致する配置関係を有する雑音除去装置。
  2.  前記音響センサは、話者の通話音声の音信号を観測し、
     前記雑音除去処理部が取得した前記目的音から、前記通話音声の残留エコー成分を除去するエコーキャンセリング部を備えたことを特徴とする請求項1記載の雑音除去装置。
  3.  前記音響センサは、監視対象機器の動作音の音信号を観測し、
     前記雑音除去処理部が取得した前記目的音を参照し、前記監視対象機器で発生する異音を検出する異音検出部を備えたことを特徴とする請求項1記載の雑音除去装置。
  4.  音信号を観測する3以上の音響センサを有する音響センサアレイと、
     前記音響センサが観測した音信号から、雑音を除去して目的音を取得する雑音除去処理部とを備え、
     前記音響センサのうち、隣接する3個の前記音響センサが位置する平面において前記目的音を発生する目的音源が存在し得る範囲である目的音源方向範囲と、前記雑音を発生させる雑音源が存在し得る範囲である雑音源方向範囲との境界を示す2本の境界線がなす角の二等分線上に第1の音響センサを配置し、前記2本の境界線のそれぞれの線上に第2の音響センサおよび第3の音響センサを配置し、
     前記2本の境界線がなす角の二等分線上に前記目的音源が位置し、前記2本の境界線上のそれぞれに前記雑音源が位置した場合に、
     前記第1の音響センサ、前記第2の音響センサおよび前記第3の音響センサは、互いに隣接する2個の音響センサと、前記目的音源と、前記雑音源とを含む平面において、前記2個の音響センサを結ぶ第1の線分の垂直二等分線が、前記目的音源と前記第1の線分の中点とを結ぶ第2の線分と、前記雑音源と前記第1の線分の中点とを結ぶ第3の線分とのなす角の二等分線に一致する配置関係を有する雑音除去装置。
  5.  音響センサアレイを構成する互いに隣接する2個の音響センサと、目的音を発生する目的音源と、雑音を発生する雑音源とを含む平面において、前記2個の音響センサを結ぶ第1の線分の垂直二等分線が、前記目的音源と前記第1の線分の中点とを結ぶ第2の線分と、前記雑音源と前記第1の線分の中点とを結ぶ第3の線分とのなす角の二等分線と一致する配置関係で、前記2個の音響センサを配置するステップと、
     前記2個の音響センサが音信号を観測するステップと、
     雑音除去処理部が、前記観測された音信号から、前記雑音を除去して前記目的音を取得するステップとを備えた雑音除去方法。
PCT/JP2017/029091 2017-08-10 2017-08-10 雑音除去装置および雑音除去方法 WO2019030898A1 (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP2019535541A JP6639747B2 (ja) 2017-08-10 2017-08-10 雑音除去装置および雑音除去方法
DE112017007733.8T DE112017007733T5 (de) 2017-08-10 2017-08-10 Störgeräuscheliminierungseinrichtung und Störgeräuscheliminierungsverfahren
PCT/JP2017/029091 WO2019030898A1 (ja) 2017-08-10 2017-08-10 雑音除去装置および雑音除去方法
CN201780093677.6A CN110999317A (zh) 2017-08-10 2017-08-10 杂音去除装置以及杂音去除方法
US16/624,065 US11212608B2 (en) 2017-08-10 2017-08-10 Noise elimination device and noise elimination method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2017/029091 WO2019030898A1 (ja) 2017-08-10 2017-08-10 雑音除去装置および雑音除去方法

Publications (1)

Publication Number Publication Date
WO2019030898A1 true WO2019030898A1 (ja) 2019-02-14

Family

ID=65272601

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2017/029091 WO2019030898A1 (ja) 2017-08-10 2017-08-10 雑音除去装置および雑音除去方法

Country Status (5)

Country Link
US (1) US11212608B2 (ja)
JP (1) JP6639747B2 (ja)
CN (1) CN110999317A (ja)
DE (1) DE112017007733T5 (ja)
WO (1) WO2019030898A1 (ja)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001309483A (ja) * 2000-04-19 2001-11-02 Nippon Telegr & Teleph Corp <Ntt> 収音方法および収音装置
JP2005522078A (ja) * 2002-03-27 2005-07-21 アリフコム 通信システムと共に用いるためのマイクロフォンおよび発声活動検出(vad)構成
WO2007018293A1 (ja) * 2005-08-11 2007-02-15 Asahi Kasei Kabushiki Kaisha 音源分離装置、音声認識装置、携帯電話機、音源分離方法、及び、プログラム
JP2012093641A (ja) * 2010-10-28 2012-05-17 Toshiba Corp 携帯型電子機器

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3484112B2 (ja) * 1999-09-27 2004-01-06 株式会社東芝 雑音成分抑圧処理装置および雑音成分抑圧処理方法
EP1415505A1 (en) * 2001-05-30 2004-05-06 Aliphcom Detecting voiced and unvoiced speech using both acoustic and nonacoustic sensors
JP4348706B2 (ja) * 2002-10-08 2009-10-21 日本電気株式会社 アレイ装置および携帯端末
US20100226210A1 (en) * 2005-12-13 2010-09-09 Kordis Thomas F Vigilante acoustic detection, location and response system
JP2008076246A (ja) 2006-09-21 2008-04-03 Toshiba Denpa Components Kk 異音検知装置及び異音検知方法
JP2010271073A (ja) 2009-05-19 2010-12-02 Nissin Electric Co Ltd 機器の異常診断装置
TW201208335A (en) * 2010-08-10 2012-02-16 Hon Hai Prec Ind Co Ltd Electronic device
JP2012049715A (ja) * 2010-08-25 2012-03-08 Asahi Kasei Corp 音源分離装置、音源分離方法、及び、プログラム
KR101103794B1 (ko) 2010-10-29 2012-01-06 주식회사 마이티웍스 멀티 빔 음향시스템
JP6392656B2 (ja) * 2014-12-12 2018-09-19 株式会社熊谷組 音源方向推定方法
JP6065030B2 (ja) * 2015-01-05 2017-01-25 沖電気工業株式会社 収音装置、プログラム及び方法
JP6520276B2 (ja) * 2015-03-24 2019-05-29 富士通株式会社 雑音抑圧装置、雑音抑圧方法、及び、プログラム

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001309483A (ja) * 2000-04-19 2001-11-02 Nippon Telegr & Teleph Corp <Ntt> 収音方法および収音装置
JP2005522078A (ja) * 2002-03-27 2005-07-21 アリフコム 通信システムと共に用いるためのマイクロフォンおよび発声活動検出(vad)構成
WO2007018293A1 (ja) * 2005-08-11 2007-02-15 Asahi Kasei Kabushiki Kaisha 音源分離装置、音声認識装置、携帯電話機、音源分離方法、及び、プログラム
JP2012093641A (ja) * 2010-10-28 2012-05-17 Toshiba Corp 携帯型電子機器

Also Published As

Publication number Publication date
CN110999317A (zh) 2020-04-10
JP6639747B2 (ja) 2020-02-05
US11212608B2 (en) 2021-12-28
US20210168490A1 (en) 2021-06-03
JPWO2019030898A1 (ja) 2019-12-26
DE112017007733T5 (de) 2020-04-16

Similar Documents

Publication Publication Date Title
JP4286637B2 (ja) マイクロホン装置および再生装置
KR101275442B1 (ko) 멀티채널 신호의 위상 기반 프로세싱을 위한 시스템들, 방법들, 장치들, 및 컴퓨터 판독가능한 매체
EP2755204B1 (en) Noise suppression device and method
JPWO2019049276A1 (ja) 雑音除去装置および雑音除去方法
BR112015014380B1 (pt) Filtro e método para filtragem espacial informada utilizando múltiplas estimativas da direção de chegada instantânea
WO2008157421A1 (en) Dual omnidirectional microphone array
JPWO2007018293A1 (ja) 音源分離装置、音声認識装置、携帯電話機、音源分離方法、及び、プログラム
US10524049B2 (en) Method for accurately calculating the direction of arrival of sound at a microphone array
JP2008054071A (ja) 紙擦れ音除去装置
KR20170063618A (ko) 전자 장치 및 이의 잔향 제거 방법
JP2007180896A (ja) 音声信号処理装置および音声信号処理方法
JP3435686B2 (ja) 収音装置
JP2010124370A (ja) 信号処理装置、信号処理方法、および信号処理プログラム
JP6433630B2 (ja) 雑音除去装置、エコーキャンセリング装置、異音検出装置および雑音除去方法
JP4256400B2 (ja) 信号処理装置
US11070907B2 (en) Signal matching method and device
JP6639747B2 (ja) 雑音除去装置および雑音除去方法
JP5105336B2 (ja) 音源分離装置、プログラム及び方法
JP3341815B2 (ja) 受話状態検出方法およびその装置
TWI586183B (zh) An audio signal processing device, a sound processing method, a monitoring device, and a monitoring method
WO2020237576A1 (en) Method and system for room calibration in a speaker system
WO2021070278A1 (ja) 雑音抑圧装置、雑音抑圧方法、及び雑音抑圧プログラム
JP2012049715A (ja) 音源分離装置、音源分離方法、及び、プログラム
JP2010152107A (ja) 目的音抽出装置及び目的音抽出プログラム
US10419851B2 (en) Retaining binaural cues when mixing microphone signals

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 17921415

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2019535541

Country of ref document: JP

Kind code of ref document: A

122 Ep: pct application non-entry in european phase

Ref document number: 17921415

Country of ref document: EP

Kind code of ref document: A1