WO2005125273A1 - ハウリング検出装置およびその方法 - Google Patents

ハウリング検出装置およびその方法 Download PDF

Info

Publication number
WO2005125273A1
WO2005125273A1 PCT/JP2005/010959 JP2005010959W WO2005125273A1 WO 2005125273 A1 WO2005125273 A1 WO 2005125273A1 JP 2005010959 W JP2005010959 W JP 2005010959W WO 2005125273 A1 WO2005125273 A1 WO 2005125273A1
Authority
WO
WIPO (PCT)
Prior art keywords
howling
signal
unit
level
sound
Prior art date
Application number
PCT/JP2005/010959
Other languages
English (en)
French (fr)
Inventor
Takashi Kawamura
Takeo Kanamori
Original Assignee
Matsushita Electric Industrial Co., Ltd.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co., Ltd. filed Critical Matsushita Electric Industrial Co., Ltd.
Priority to JP2006514765A priority Critical patent/JP4675888B2/ja
Priority to US11/579,133 priority patent/US7912230B2/en
Priority to CN2005800138788A priority patent/CN1951147B/zh
Publication of WO2005125273A1 publication Critical patent/WO2005125273A1/ja

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/005Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/02Circuits for transducers, loudspeakers or microphones for preventing acoustic reaction, i.e. acoustic oscillatory feedback

Definitions

  • the present invention relates to a howling detection device and a method thereof, and more particularly, to a howling system that mixes a plurality of audio signals and loudspeaks to generate howling for each of the plurality of audio signals.
  • TECHNICAL FIELD The present invention relates to a howling detection device and a method for detecting a degree of danger to be caused.
  • a howling suppression device that detects the occurrence of howling and suppresses the howling has been developed.
  • a knocking suppression device using an applied filter, a notch filter, or the like is known (for example, see Patent Documents 1 and 2).
  • FIG. 10 is a diagram showing a configuration example in which a howling suppression device disclosed in Patent Document 1 and Patent Document 2 is adopted in a loudspeaker system 9 that mixes a plurality of audio signals to loudspeak.
  • FIG. 10 shows a configuration example in which howling that occurs when a speaker and a plurality of microphones are in the same sound field is suppressed.
  • two audio signals are input from two microphones as a plurality of audio signals.
  • the loudspeaker system 9 includes a first microphone 91a, a second microphone 9 lb, a sound characteristic adjustment unit 92, a sound mixing unit 93, a howling suppression unit 94, and a speaker 95.
  • the sound characteristic adjustment unit 92 receives a sound signal generated and collected by the first microphone 91a as an input, and adjusts the frequency and gain characteristics of the sound signal.
  • an audio signal generated and collected by the second microphone 91b is adjusted in frequency and gain characteristics in the sound characteristic adjustment unit 92.
  • the adjusted audio signals are mixed in the sound mixing unit 93.
  • the sound characteristic adjustment unit 92 and the sound mixing unit 93 are, for example, as shown in FIG. It corresponds to such a commercially available mixer. FIG.
  • the sound characteristic adjustment unit 92 includes, for example, an equalizer 921a, an equalizer 921b, an amplifier 922a, and an amplifier 922b.
  • the equalizer 921a adjusts the frequency characteristic of the audio signal generated by collecting the sound with the first microphone 91a.
  • the amplifier 922a adjusts the gain of the audio signal adjusted by the equalizer 921a.
  • the equalizer 921b and the amplifying unit 922b adjust the frequency and gain characteristics of the audio signal generated and collected by the second microphone 91b.
  • the sound characteristic adjustment unit 92 independently adjusts the frequency and gain characteristics of each audio signal collected by the first and second microphones 91a and 92b, similarly to a normal mixer.
  • the audio signal mixed in the sound mixing unit 93 is input to the howling suppression unit 94.
  • the howling suppression unit 94 performs signal processing for suppressing howling on the audio signal mixed in the sound mixing unit 93. Then, the signal-processed audio signal is appropriately amplified and amplified by the speaker 95.
  • the howling suppression unit 94 corresponds to a howling suppression device that suppresses howling.
  • the loudspeaker system is an example in which the howling suppression system disclosed in Patent Document 1 or Patent Document 2 is employed, and thus an adaptive filter or a notch filter is used as the howling suppression unit 94. You.
  • FIG. 12 is a block diagram showing a configuration example of howling suppression section 94 using adaptive filter 941.
  • the howling suppression unit 94 estimates a transfer characteristic such as a spatial transfer characteristic only when the sound signal is output, based on the sound signal (the sound signal to be loudspeaked) output from the howling suppression unit 94. I do.
  • the applied filter 941 multiplies the estimated transmission characteristic by the audio signal to be loudspeaked, and subtracts it from the audio signal output from the sound mixing unit 93. Thereby, generation of howling can be suppressed.
  • FIG. 13 is a diagram illustrating a change in power spectrum ⁇ ( ⁇ ) of the audio signal output from the sound mixing unit 93 when howling occurs.
  • power spectrum
  • FIG. 13 changes so that the power sharply increases at the specific frequency f. Therefore, always observe the difference in power between adjacent bands As a result, it is detected that the power in the band including the specific frequency f has sharply increased. That is, the frequency at which howling occurs can be detected.
  • the frequency at which the notch filter attenuates is set to the specific frequency f.
  • the power of the specific frequency f is attenuated by passing the audio signal output from the sound mixing unit 93 through a notch filter attenuating at the specific frequency f. As a result, the occurrence of howling is suppressed.
  • Patent Document 1 Japanese Patent No. 2039846
  • Patent Document 2 Japanese Patent No. 2560923
  • FIG. 14 is a diagram schematically showing characteristics of each component related to a transfer characteristic in the loudspeaker system 9 at the time of one input.
  • the sound to be picked up by the microphone 91 is S ( ⁇ )
  • the sound signal generated by picking up the sound by the microphone 91 is ⁇ ( ⁇ )
  • the sound signal is adjusted by the sound characteristic adjusting unit 92.
  • the frequency and gain characteristics are expressed by ⁇ ( ⁇ ), the ideal transfer characteristic to be estimated by the howling suppression unit 94 is Hhat ( ⁇ ), the audio signal output by the howling suppression unit 94 is also expressed by ⁇ ( ⁇ ), and the speaker 95
  • R (co) be the spatial transfer characteristic from to the microphone 91.
  • an audio signal X ( ⁇ ) generated by collecting sound by the microphone 91 is expressed by Expression (1).
  • R (co) includes the characteristics of the microphone 91 itself, the characteristics of the speaker 95 itself, and the case where the signal is appropriately amplified between the output of the noise suppression unit 94 and the speaker 95, in addition to the transfer characteristics of the space described above. And its amplification characteristics may be included.
  • the audio signal ⁇ ( ⁇ ) * ⁇ ( ⁇ ) adjusted by the sound characteristic adjustment unit 92 multiplies the output audio signal ⁇ ( ⁇ ) of the howling suppression unit 94 by the transfer characteristic Hhat ( ⁇ ). The subtraction is performed using the result, and the equation (2) is established.
  • Equation (3) is obtained.
  • the ideal transfer characteristic Hhat ( ⁇ ) is a transfer characteristic that satisfies Equation (4).
  • FIG. 15 is a diagram schematically showing the characteristics of each component related to the transfer characteristics in the loudspeaker system 9 at the time of multiple inputs.
  • the sound to be picked up by the first microphone 91a is S 1 ( ⁇ )
  • the frequency and gain characteristics adjusted by the sound characteristic adjustment unit 92 are Ml ( ⁇ )
  • the sound is Let Rl (co) be the spatial transfer characteristic up to the first microphone 91a.
  • the sound to be picked up by the nth microphone is Sn (co)
  • the frequency and gain characteristics adjusted by the sound characteristic adjustment unit 92 are ⁇ ( ⁇ )
  • the speaker 95 outputs the nth microphone.
  • the spatial transfer characteristic up to ON 92c is Rn (co).
  • Equation (3) is expressed as Equation (5). Note that n is a natural number and indicates the number of microphones.
  • the ideal transfer characteristic Hhat ( ⁇ ) to be estimated is a transfer characteristic that satisfies Equation (6).
  • the spatial transfer characteristics R ( ⁇ ) of a plurality of audio signals are unique values.
  • the space transfer characteristic R (co) is a value that changes depending on the position of the microphone. That is, in order to appropriately estimate the ideal transfer characteristics, it is necessary to consider the spatial transfer characteristics R (co) of each of the plurality of audio signals.
  • the transfer characteristic is estimated based on the output signal of the howling suppression unit 94.
  • the output signal of the howling suppression unit 94 is a signal based on an audio signal in which a plurality of audio signals are mixed, and is not a signal in which the spatial transfer characteristics R ( ⁇ ) of each of the plurality of microphones are considered. Therefore, conventionally, the estimated speed of the transfer characteristic cannot keep up with the change in the space transfer characteristic R (co), and the occurrence of howling cannot be appropriately suppressed. .
  • the ideal transfer characteristic Hhat (t) to be estimated is a value determined by M ( ⁇ ) and R ( ⁇ ) of each of the plurality of microphones.
  • the ideal transfer characteristic Hhat ( ⁇ ) is a value that changes as M ( ⁇ ) changes.
  • the applied filter 941 estimates the transfer characteristic while converging based on the output signal of the howling suppression unit 94. Therefore, if ⁇ ( ⁇ ) changes abruptly and the ideal transfer characteristic Hhat ( ⁇ ) also changes abruptly, the estimated speed of the above transfer characteristics cannot keep up, and the occurrence of no and It was difficult to control.
  • an object of the present invention is to detect a risk of howling occurrence for each of the plurality of audio signals in a loudspeaker system in which a plurality of audio signals are mixed and loudspeaked. Further, in the present invention, it is an object to estimate an appropriate transfer characteristic based on the information on the degree of risk and to suppress occurrence of a howling that is audible to a sudden change in the transfer characteristic by the sound characteristic adjustment unit. And Another object of the present invention is to provide a method for specifying and warning which audio signal of a plurality of input audio signals has generated howling or is in danger of generating it. . Means for solving the problem
  • the first aspect of the present invention relates to howling generated when a mixed signal obtained by mixing a plurality of sound signals collected by a plurality of microphones in a sound mixing unit and loudspeaking the mixed signal by a speaker is used.
  • a howling detection device for detecting a dominant ratio indicating a degree of danger of howling occurring for each signal, a level detection unit for detecting a level of each of the plurality of audio signals, and a signal related to sound amplified by the speaker Is used as a noise reference signal, the noise reference signal is compared with the mixed signal in a time-series manner, and an end time period in which the mixed signal is input after the noise reference signal is dropped is detected as an end section.
  • a level of a plurality of audio signals detected by the level detection unit Only the level corresponding to the ending section is extracted, and the plurality of audio signals are extracted.
  • a dominance ratio calculating unit that calculates a ratio of the level of each audio signal to the sum of the levels as the control ratio of each of the audio signals.
  • the howling detection device is configured to control a signal included in the ending section based on a transfer characteristic calculated using the dominance rate. And a signal suppression unit that subtracts the signal having the same component as that of the mixed signal and outputs the signal to the speaker.
  • the howling suppressing section estimates the mixed signal excluding a signal having the same component as a signal included in the ending section. And updating the sum according to the dominant rate, and multiplying the function by a change rate of the sum before and after the update to calculate the transfer characteristic.
  • a fourth aspect of the present invention is characterized in that, in the third aspect, the howling suppression unit updates only the level of an audio signal indicating a relatively high dominance rate to update the sum.
  • a fifth aspect of the present invention is characterized in that, in the third aspect, the howling suppression unit updates the sum by updating only the level of the audio signal exhibiting the highest dominance rate. I do.
  • the howling detection device specifies an audio signal having a relatively high control rate calculated by the control rate calculation section, Is further provided.
  • a seventh aspect of the present invention is the howling detection device according to the first aspect, wherein the howling detection device outputs the audio signal having the highest dominance ratio calculated by the dominance ratio calculation unit. It further includes a howling warning unit that specifies and notifies the user.
  • the level detection section detects a plurality of the audio signal levels using a power spectrum.
  • a ninth aspect of the present invention is to provide a loudspeaker for a howling generated when a mixed signal obtained by mixing a plurality of sound signals collected by a plurality of microphones in a sound mixing unit is amplified by a speaker.
  • a howling detection device for detecting a dominant ratio indicating a degree of danger of howling occurring for each signal, a level detection unit for detecting a level of each of the plurality of audio signals, and calculating a power spectrum of the mixed signal.
  • a howling occurrence detection unit that detects the occurrence of howling based on the change in the power spectrum; and a level when the occurrence of the howling is detected from the levels of the plurality of audio signals detected by the level detection unit.
  • the howling detection device uses the signal related to the sound loudspeaked by the speaker as a noise reference signal, and uses the noise reference signal and the mixed signal as a noise reference signal. Based on a transfer characteristic calculated using the dominant ratio, and performing a sequential comparison and detecting the time at which the mixed signal is input after the noise reference signal has fallen as an end period.
  • a howling suppression unit for subtracting the mixed signal power from a signal having the same component as the signal included in the ending section and outputting the signal to the speaker.
  • the howling suppression unit estimates the mixed signal excluding a signal having the same component as a signal included in the ending section. Is set when the ending section is detected, the sum is updated in accordance with the dominance rate, and the transfer characteristic is multiplied by the rate of change of the sum before and after the update to change the transfer characteristic. Is calculated when is detected.
  • the howling suppression section updates the sum by updating only the level of the audio signal indicating a relatively high dominance rate. It is characterized by.
  • a thirteenth aspect of the present invention is characterized in that, in the eleventh aspect, the howling suppression unit updates the sum by updating only the level of the audio signal exhibiting the highest dominance rate.
  • the howling detection device specifies an audio signal having a relatively high control rate calculated by the control rate calculation unit.
  • the howling detection device specifies an audio signal having the highest dominance rate calculated by the dominance rate calculation unit, and notifies the user. It further includes a howling warning unit for notifying.
  • the level detecting section detects a plurality of the audio signal levels using a power spectrum.
  • a seventeenth aspect of the present invention is a method according to the present invention, wherein a plurality of microphones are mixed in a sound mixing step for each of the collected voice signals, and howling occurs when a mixed signal is amplified by a speaker.
  • a howling detection method for detecting a dominant ratio indicating a degree of risk of generating howling for each of the audio signals wherein a level detection step for detecting the levels of the plurality of audio signals, respectively. Comparing the noise reference signal and the mixed signal in time series with a signal related to the sound amplified by the speaker as a noise reference signal, and calculating the time when the mixed signal is input after the noise reference signal has dropped.
  • Ending detection step for detecting the ending as a ending section, and extracting only the level corresponding to the ending section from each of the plurality of level signals of the plurality of audio signals detected by the level detecting step. Calculating a ratio of the level of each audio signal to the sum of the levels of the audio signals as the dominant ratio of each of the audio signals.
  • the eighteenth aspect of the present invention relates to a howling that occurs when a mixed signal obtained by mixing a plurality of microphone signals in a sound mixing step is amplified by a speaker.
  • a howling detection method for detecting a dominance rate indicating a degree of danger of howling generation for each of the audio signals wherein a level detection step for detecting levels of a plurality of the audio signals, respectively,
  • a howling occurrence detecting step of calculating a power spectrum and detecting the occurrence of howling based on a change in the power spectrum; and the levelers of the plurality of audio signals detected by the level detecting step also generate the howling. Is extracted, and the level of each audio signal level with respect to the sum of the levels of the plurality of audio signals is extracted.
  • the ending section includes only a signal component that causes howling, and the dominance rate is calculated using a level corresponding to the ending section.
  • the dominance is calculated based on the level of the audio signal before being mixed in the sound mixing unit.
  • the risk level corresponding to the change is changed. Can be detected.
  • the transfer characteristic is calculated using the dominant rate, so that a plurality of sounds can be obtained. It is possible to suppress howling according to the degree of danger of which voice signal generates howling among voice signals.
  • the transfer characteristics are calculated using the dominant ratio, before being mixed by the sound mixing unit, for example, the frequency and Z or gain characteristics of a plurality of audio signals are respectively changed, and the transfer characteristics suddenly change. Even if it changes, robust howling can be suppressed in response to the change.
  • the transfer characteristic is calculated based on the rate of change of the sum according to the dominant rate, robust howling considering the risk of causing howling of a plurality of audio signals is performed. Suppression can be achieved.
  • a transfer characteristic corresponding to an audio signal having a relatively high risk of causing howling among a plurality of audio signals is calculated, so that highly efficient howling suppression can be achieved. Can be realized.
  • a transfer characteristic corresponding to an audio signal having the highest risk of causing howling among a plurality of audio signals is calculated, thereby achieving highly efficient howling suppression. be able to. For example, it is rare for a user to change all the levels of multiple audio signals at the same time as a mixer operation, so even if the user follows only the one with the highest dominant ratio, robust howling can be suppressed. It can be carried out.
  • the sixth aspect by specifying an audio signal having a relatively high dominance rate, which audio signal among a plurality of audio signals causes howling to the user. Can be notified if the risk is relatively high. Further, even if the user has a plurality of audio signals collected in an operation such as a mixer, the user can perform an operation while preventing howling from occurring by referring to the risk level.
  • the user is less likely to risk howling of which audio signal among a plurality of audio signals. You can tell which is the highest. Further, even if there are a plurality of audio signals collected in the operation of the mixer or the like, the user can perform the operation while preventing howling from occurring by referring to the above-mentioned danger level.
  • the level of a plurality of audio signals is calculated based on the power spectrum, so that the risk of generating howling can be detected for each frequency band.
  • the ninth aspect when a howling occurs, it is possible to detect the degree of danger of which audio signal of the plurality of audio signals causes the howling.
  • the control ratio is calculated based on the level of the audio signal before being mixed by the sound mixing unit.
  • the transfer characteristic is calculated using the dominant rate, so that the ringing corresponding to the degree of danger of which audio signal among the plurality of audio signals causes howling is performed. Suppression can be performed.
  • the transfer characteristics are calculated using the dominant ratio, before mixing in the sound mixing unit, for example, the frequency and Z or gain characteristics of a plurality of audio signals are respectively changed, and the transfer characteristics suddenly change. , Robust howling can be suppressed in accordance with the change.
  • the transfer characteristic is calculated based on the change rate of the sum according to the dominance rate, so that a plurality of audio signals can be obtained before the ending section arrives.
  • a transfer characteristic corresponding to an audio signal having a relatively high risk of causing howling among a plurality of audio signals is calculated, so that highly efficient howling suppression is achieved. Can be realized.
  • a transfer characteristic corresponding to an audio signal having the highest risk of causing howling among a plurality of audio signals is calculated, thereby achieving highly efficient howling suppression. be able to. For example, it is rare for a user to change all the levels of multiple audio signals at the same time as a mixer operation, so even if the user follows only the one with the highest dominant ratio, robust howling can be suppressed. It can be carried out.
  • the fourteenth aspect when a howling occurs, the user is notified of which of the plurality of audio signals the risk of causing the howling is relatively high. Can be. Further, even if the user has a plurality of audio signals picked up by operating a mixer or the like, the user can perform the operation while preventing howling from occurring by referring to the above-mentioned danger level. [0048] According to the fifteenth aspect, when a howling occurs, it is possible to notify the user which of the plurality of audio signals has the highest risk of causing the howling. . Further, even if there are a plurality of audio signals collected by the user in the operation of, for example, a mixer, the user can perform the operation while preventing howling from occurring by referring to the risk level.
  • the level of a plurality of audio signals is calculated from the power spectrum, so that the risk of generating howling can be detected for each frequency band.
  • FIG. 1 is a block diagram showing a configuration example of a loudspeaker system 1.
  • FIG. 2 is a block diagram showing a configuration example of a sound characteristic adjustment unit 12 and a sound mixing unit 13
  • FIG. 3 is a diagram showing waveforms of a noise reference signal Y (t) and a speech signal Xm (t).
  • FIG. 4 is a diagram showing an example of a spectrum of loop gains G1 ( ⁇ ), G2 ( ⁇ ), and the sum of loop gains (G1 ( ⁇ ) + G2 ( ⁇ )).
  • FIG. 5 is a block diagram showing an example of a configuration of a howling suppression section 17.
  • FIG. 6 is a block diagram showing a configuration example of a loudspeaker system 2.
  • FIG. 7 is a block diagram illustrating an example of a configuration of a howling suppression unit 22 according to the second embodiment.
  • FIG. 8 is a block diagram showing a configuration example of a howling warning device.
  • FIG. 9 is a block diagram showing a configuration example of a howling warning device using a howling occurrence detection unit 21.
  • FIG. 10 is a diagram showing a configuration example in which a howling suppression device disclosed in Patent Document 1 and Patent Document 2 is adopted in a loudspeaker system 9 for mixing and vocalizing a plurality of audio signals.
  • FIG. 11 is a block diagram showing a configuration example of a sound characteristic adjustment unit 92 and a sound mixing unit 93.
  • FIG. 12 is a block diagram showing an example of a configuration of a ringing suppression unit 94 using an adaptive filter 941.
  • FIG. 12 is a block diagram showing an example of a configuration of a ringing suppression unit 94 using an adaptive filter 941.
  • FIG. 13 is a diagram showing a change in power spectrum ⁇ ( ⁇ ) of the audio signal output from the sound mixing section 93 when a ringing occurs.
  • FIG. 14 is a diagram schematically showing characteristics of each component related to transfer characteristics in the loudspeaker system 9 with one input.
  • FIG. 15 is a diagram schematically showing characteristics of respective components related to transfer characteristics in the loudspeaker system 9 at the time of plural inputs.
  • FIG. 1 is a block diagram showing a configuration example of the loudspeaker system 1.
  • the loudspeaker system 1 includes a first microphone l la, a second microphone l lb, a sound characteristic adjustment unit 12, a sound mixing unit 13, a level detection unit 14, a ending detection unit 15, a dominance rate calculation unit 16, It has a howling suppression unit 17 and a speaker 18.
  • the loudspeaker system 1 may be a system for loudspeaking using three or more microphones. However, here, a description will be given assuming a case where loudspeakers are used for two microphones.
  • a first microphone 11a collects a sound to be amplified by a speaker 18 and generates a sound signal.
  • the audio signal generated by the first microphone 11a is defined as XI (t).
  • the second microphone lib also collects a sound for loudspeaking and generates a sound signal X2 (t).
  • the sound characteristic adjustment unit 12 receives the audio signals XI (t) and X2 (t) as inputs, and adjusts the frequency and gain characteristics of the audio signal, respectively.
  • the audio signal XI (t) adjusted by the audio characteristic adjustment unit 12 is defined as Xml (t).
  • the audio signal X2 (t) adjusted by the sound characteristic adjustment unit 12 is defined as Xm2 (t).
  • the audio signals Xml (t) and Xm2 (t) adjusted by the sound characteristic adjustment unit 12 are output to the level detection unit 14 and the sound mixing unit 13, respectively.
  • the audio signals Xml (t) and Xm2 (t) input to the sound mixing unit 13 are mixed in the sound mixing unit 13. Let this mixed audio signal be Xm (t).
  • the sound signal Xm (t) mixed in the sound mixing unit 13 is output to the ending detection unit 15 and the howling suppression unit 94.
  • the sound characteristic adjusting unit 12 and the sound mixing unit 13 are, for example, commercially available mixers as shown
  • FIG. 2 is a block diagram showing a configuration example of the sound characteristic adjustment unit 12 and the sound mixing unit 13.
  • the sound characteristic adjustment unit 12 includes, for example, an equalizer 121a, an equalizer 121b, an amplifier 122a, and an amplifier 122b.
  • the equalizer 121a adjusts the frequency characteristics of the audio signal XI (t) generated by collecting the sound with the first microphone 11a.
  • the amplifier 122a adjusts the gain of the audio signal adjusted by the equalizer 121a.
  • equalizer 121b The amplifying unit 122b adjusts the frequency and gain characteristics of the audio signal X2 (t) generated and collected by the second microphone lib.
  • the sound characteristic adjustment unit 12 independently adjusts the frequency and gain characteristics of each audio signal collected by the first and second microphones 11a and 12b, similarly to a normal mixer. .
  • Level detection unit 14 detects each level of audio signals Xml (t) and Xm2 (t) output from sound characteristic adjustment unit 12. As a specific detection method, for example, a power spectrum is calculated every predetermined time, and a level for each band is detected. All the information on the level for each band at each predetermined time detected by the level detection unit 14 is output to the dominance ratio calculation unit 16.
  • the ending detection unit 15 Based on the speech signal Xm (t) input from the sound mixing unit 13 and the noise reference signal Y (t), the ending detection unit 15 generates the speech signal Xm for the noise reference signal Y (t). The delay section of the voice section of (t) is detected as the ending.
  • the noise reference signal Y (t) is a signal related to the sound loudspeaked by the speaker, and is, for example, an audio signal immediately before loudspeaker 18.
  • the noise reference signal Y (t) is also input to the howling suppression unit 17 for the input force immediately before the speaker 18.
  • the sound signal may be a sound signal generated by collecting the sound loudspeaked near the speaker 18 by another microphone or the like.
  • howling suppression section 17 is connected to the other microphone, and inputs a speech signal output from the other microphone as noise reference signal Y (t).
  • FIG. 3 is a diagram showing waveforms of the noise reference signal Y (t) and the audio signal Xm (t).
  • the speech section of the speech signal Xm (t) is delayed with respect to the noise reference signal Y (t). This is because, as shown in Fig. 13 and Equation 1, in addition to the voice S ( ⁇ ) uttered by the speaker, the voice signal generated by the microphone picked up This is because speech ⁇ ( ⁇ ) * R (co) which is mixed into the microphone again is included. That is, the mixed sound ⁇ ( ⁇ ) * R (co) is delayed from the loudspeaker 18 by the amount of spatial propagation.
  • the audio signal Xm (t) is spatially propagated and mixed again with the first microphone 11a and / or the second microphone lib.
  • the delayed voice ⁇ ( ⁇ ) * R (co) contains a signal component.
  • the ending part shown in FIG. 3 contains only signal components that are spatially propagated and mixed again into the first microphone 11a and / or the second microphone 1lb.
  • the dominance rate calculating unit 16 described later transmits only the signal components that are spatially propagated and mixed again into the first microphones 11a and Z or the second microphone lib. Based on! /, You can calculate the dominance rate.
  • the ending detection unit 15 As a specific detection method of the ending detection unit 15, for example, there is a method of using a power envelope of the waveform of the audio signal Xm (t) and the noise reference signal Y (t). The end part can be detected by constantly observing the ratio using each power envelope (excluding the rising part). Further, for example, the ending detection unit 15 compares the noise reference signal Y (t) and the speech signal Xm (t) in a time-series manner. Then, the ending detection unit 15 detects the falling edge of each power envelope, and uses the difference between them as the ending part. Information on the ending (delayed portion) detected by the ending detecting unit 15 is sent to the dominant ratio calculating unit 16 and the howling suppressing unit 17.
  • the dominance rate calculation unit 16 determines a plurality of input audio signals (FIG. 1) based on the level of each audio signal output from the level detection unit 14 and the ending detected by the ending detection unit 15. Let us calculate the dominance of Xml (t) and Xm2 (t) respectively. Note that the dominant rate calculating unit 16 performs the dominant rate calculating process only in the ending section detected by the ending detecting unit 15. Hereinafter, a method of calculating the control rate will be specifically described.
  • the dominance rate indicates the degree of danger of howling for each of a plurality of audio signals.
  • the power spectrum of the ending section is defined as a loop gain G.
  • the loop gain of the audio signal Xml (t) is Gl ( ⁇ )
  • the loop gain of the audio signal Xm2 (t) is G2 ( ⁇ ).
  • the sound signal Xmn (t) is input from the ⁇ -th ( ⁇ is a natural number) microphone and the frequency and gain characteristics are adjusted by the sound characteristic adjustment unit 12.
  • the loop gain Gn (co) of the Xmn (t) can be expressed by Expression 7.
  • the dominance rate calculation unit 16 extracts the level gain G, which is the level of the ending section of the level power of each audio signal, and determines, for example, the loop rate of all audio signals as the dominance rate for each audio signal.
  • the ratio between the sum of the gains and the loop gain of each audio signal is calculated.
  • the sum of the loop gains is G1 ( ⁇ ) + G2 ( ⁇ ). Therefore, the dominance rate for the audio signal Xml (t) is expressed as a ratio between the sum (G1 ( ⁇ ) + G2 ( ⁇ )) and Gl ( ⁇ ).
  • the dominance rate for the audio signal Xm2 (t) is expressed as the ratio between the sum (G1 ( ⁇ ) + G2 ( ⁇ )) and G2 ( ⁇ ).
  • FIG. 4 is a diagram illustrating an example of the spectrum of the loop gains Gl (co), G2 ( ⁇ ), and the sum of the loop gains (G1 ( ⁇ ) + G2 ( ⁇ )).
  • the dominance of G2 (co) increases in a frequency band higher than the frequency, and it is determined that G2 (co) is dominant.
  • the dominance of G1 ( ⁇ ) increases, and it is determined that G1 ( ⁇ ) is dominant.
  • the dominant rate calculation unit 16 calculates the dominant rate of each audio signal for the ending section including only the spatially propagated signal component, so that which audio signal is dominant. Can be detected.
  • the spatially propagated signal component is a signal component that causes howling. Therefore, for example, the dominant ratio calculating unit 16 determines whether the sound transmitted through the path of R1 ( ⁇ ) shown in FIG. 13 is dominant or the sound transmitted through the path of R2 ( ⁇ ) is dominant before the howling occurs, for example. Can be detected. The more dominant the voice signal, the higher the risk of howling.
  • the sound characteristic adjusting unit 12, the sound mixing unit 13, the level detecting unit 14, the ending detecting unit 15, and the dominant ratio calculating unit 16 correspond to a howling detecting device according to the present invention. Then, the howling detection device according to the present invention can detect the risk of causing howling for each of the plurality of audio signals by calculating the dominant ratio.
  • the timing of learning the dominance rate is not limited to the timing of learning each time a ending is detected, and may be appropriately adjusted in consideration of the sequentiality and accuracy of estimation.
  • the howling suppression unit 17 applies the audio signal Xm (t) mixed in the sound mixing unit 13 to the Then, signal processing for suppressing howling is performed.
  • the signal-processed audio signal is appropriately amplified and amplified by the speaker 18.
  • FIG. 5 is a block diagram illustrating an example of the configuration of the howling suppression unit 17.
  • a two-input subtraction configuration is employed.
  • the 2-input subtraction configuration suppresses the occurrence of howling by using the audio signal to be loudspeaked as a noise reference signal, learning the transfer characteristics according to the endings contained in the audio signal to be loudspeaked, and be able to.
  • howling suppression section 17 includes first power spectrum calculation section 171, second power spectrum calculation section 172, transmission characteristic calculation section 173, inverse Fourier transform section 174, and convolution section 175.
  • first power spectrum calculating section 171 receives audio signal Xm (t) output from sound mixing section 13 as input, and calculates power spectrum ⁇ ( ⁇ ) of audio signal Xm (t). I do.
  • Second power spectrum calculation section 172 receives noise reference signal Y (t) as input, and calculates power spectrum ( ⁇ ) of noise reference signal Y (t).
  • the voice signal to be loudspeaked as the noise reference signal Y (t) is, for example, a voice signal immediately before being loudspeaked by the speaker 18.
  • the sound signal may be a sound signal generated by collecting a sound amplified in the vicinity of the speaker 18 with a microphone or the like.
  • the transfer characteristic calculating section 173 firstly outputs the power spectrum ratio Hr ( ⁇ ) to the ending detection section 15 based on the voice signal Xm (co) and the noise reference signal ⁇ ( ⁇ ). Estimate only between detected endings.
  • the power spectrum ratio Hr ( ⁇ ) is expressed by Expression (8).
  • transfer characteristic calculating section 173 calculates transfer characteristic Hsup ( ⁇ ) shown in Expression (9) based on the power vector ratio Hr ( ⁇ ) estimated by Expression (8).
  • Hsup ( ⁇ ) is the same as the signal included in the ending section. This is a function for estimating the speech signal Xm (t) by removing the signal having the minute component.
  • the transfer characteristic calculating section 173 calculates the loop gain of each audio signal calculated by the dominant rate calculating section 16 and the loop gain obtained based on the dominant rate by adding Hsup (co) calculated by Expression 9 to Hsup (co). Multiply the rate of change of the sum to calculate Hsup (co).
  • Hsup (co) a method of calculating Hsup (co) will be described.
  • the user changes the frequency and gain characteristics of the audio signals XI (t) and X2 (t) by performing a mixer operation in the sound characteristic adjustment unit 12 and the sound mixing unit 13, respectively.
  • the frequency and gain characteristics Ml ( ⁇ ) of the audio signal Xml (t) and the frequency and gain characteristics M2 ( ⁇ ) of the audio signal Xm2 (t) change.
  • the loop gains Gl (co) and G2 (co) also change.
  • the dominant rate of the loop gain G1 ( ⁇ ) calculated by the dominant rate calculating unit 16 before the mixer operation is higher than the loop gain G2 (co).
  • the loop gain G1 ( ⁇ ) calculated by the control ratio calculation unit 16 after the mixer operation is set as the loop gain Glnew ( ⁇ ), and the loop gain G1 ( ⁇ ) calculated by the control ratio calculation unit 16 before the mixer operation is looped.
  • the gain is assumed to be Glold ( ⁇ ).
  • the loop gain G2 ( ⁇ ) calculated by the control ratio calculation unit 16 after the mixer operation is set as a loop gain G 2 ew ( ⁇ ), and the loop gain G2 ( ⁇ ) calculated by the control ratio calculation unit 16 before the mixer operation is set. ) Is the loop gain G2old ( ⁇ ).
  • the sum of the loop gains calculated by the dominance ratio calculation unit 16 before the operation of the mixer is Glold (co) + G2old (co).
  • the sum of the loop gains calculated by the dominance ratio calculation unit 16 after the mixer operation is a sum considering only the loop gain with the highest dominance ratio among the dominance ratios calculated before the mixer operation. That is, in the above description, since the dominant rate of the loop gain G1 ( ⁇ ) is higher than the loop gain G2 ( ⁇ ), the sum of the loop gains calculated by the dominant rate calculating unit 16 after the mixing operation is Glnew (co) + G2old (co). At this time, the rate of change Lr (co) of the sum of the loop gains is represented by Expression 10.
  • the loop gain and the dominance of each audio signal calculated by the dominance rate calculating unit 16 are calculated. Based on the rate, the change rate Lr (co) of the sum of the loop gains is obtained.
  • the rate of change Lr ( ⁇ ) of the sum of the loop gains the dominant rate is the highest, and the sum of the norape gains (G1 ( ⁇ ) old + G2 ( ⁇ ) old) according to the change in the loop gain G1 ( ⁇ ) Can be expected to have changed to a sum (Gl ( ⁇ ) new + G2 ( ⁇ ) old).
  • the loop gain with the highest dominance ratio is reflected in the sum of the loop gains.
  • the transfer characteristic calculation unit 173 multiplies the transfer characteristic Hsup (co) calculated by Expression (9) by the change rate of the sum of the loop gains shown by Expression (10), and obtains the transfer characteristic according to the change rate of the sum. Hsup—ne w ( ⁇ ) is calculated. Note that the transfer characteristic Hsup ( ⁇ ) is Hsup_old ( ⁇ ), and the transfer characteristic according to the rate of change of the sum is Hsup-new (co). At this time, the transfer characteristic Hsup_new (co) according to the change rate of the sum is expressed by Expression (11).
  • H sup — new (w) L r ( ⁇ ) * H sup . ld ( ⁇ ) ⁇ ⁇ (1 1)
  • the transfer characteristic Hsup-new (co) according to the change rate of the sum is a transfer characteristic obtained by multiplying the estimated function Hsup ( ⁇ ) -old by the change rate of the sum. is there.
  • the Hsup-new (co) updated by Expression (11) is transformed on the time axis by the inverse Fourier transform unit 174.
  • the Hsup-new ( ⁇ ) converted on the time axis is referred to as a filter coefficient Hsup-new (t).
  • the convolution unit 175 convolves the filter coefficient Hsup—new (t) into the audio signal Xm (t) input from the sound mixing unit 13 to obtain a signal only in the ending section detected by the ending detection unit 15.
  • the signal containing only the same component as is subtracted from the audio signal Xm (t).
  • the calculation (Equation 9) and the update (Equation 11) of Hsup (co) are performed when the ending detection unit 15 detects the ending.
  • calculation of Hsup (co) The learning of the equations (9) and (11)) may be performed, for example, by a predetermined method every time the ending is detected.
  • the dominant ratio calculating unit 16 calculates the loop gain and the dominant ratio of each audio signal, and based on the dominant ratio, changes the sum of the! Calculate the transfer characteristics using the conversion rate. Further, the dominance rate is calculated based on the output signal of the sound characteristic adjustment unit 12, and is a value linked to the frequency-gain characteristic adjusted by the sound characteristic adjustment unit 12.
  • a transfer characteristic used for suppressing howling is calculated based on the dominant ratio, whereby the transfer characteristic of the sound characteristic adjustment unit 12 is calculated. Robust howling can be suppressed against sudden changes in the temperature. That is, robust howling can be suppressed against a rapid change in ⁇ ( ⁇ ) due to the user's mixer operation.
  • the sum of the time-varying component loop gain of only the loop gain having the highest dominant rate is estimated. It is not limited to this. For example, a plurality of loop gains having a relatively high dominance ratio may be reflected in the sum of the loop gains. For example, suppose there are three microphones, and their loop gains are G1 ( ⁇ ), G2 ( ⁇ ), and G3 ( ⁇ ). Then, it is assumed that the relationship between the dominant rates before the mixer operation is such that the loop gains G1 ( ⁇ ) and G2 ( ⁇ ) are higher than the loop gain G3 ( ⁇ ).
  • the loop gains G1 ( ⁇ ) and G2 ( ⁇ ) may be reflected in the sum of the loop gains (G1 ( ⁇ ) + G2 ( ⁇ ) + G3 ( ⁇ )).
  • the change rate Lr (co) of the sum of the loop gains is represented by Expression 12.
  • the transfer characteristic calculating section 173 calculates the change rate of the sum of the loop gains by using the dominant rate calculated by the dominant rate calculating section 16 and reflecting the dominant rate on each loop gain of each audio signal. May be. Further, for example, the transfer characteristic calculating unit 173 may calculate the transfer characteristic used for suppressing the noise by a method other than the change rate of the sum of the loop gains, based on the dominant ratio.
  • the present invention is not limited to this.
  • the specific configuration of the subtraction is not limited to the force shown in FIG.
  • a number of subtraction methods other than the convolution filter method are also known, and a configuration using these methods may be used.
  • the level detection unit 14 performs frequency analysis on each audio signal, and calculates the level as a power spectrum.
  • the power is not limited to this.
  • the level detection unit 14 may calculate the power of each audio signal every predetermined time as a scalar value.
  • the dominant ratio calculating unit 16 calculates the dominant ratio of each audio signal as a scalar value.
  • the rate of change Lr (co) of the sum of the loop gains is also represented by a scalar value.
  • FIG. 6 is a block diagram illustrating a configuration example of the loudspeaker system 2.
  • the loudspeaker system 2 includes a first microphone l la, a second microphone l lb, a sound characteristic adjustment unit 12, a sound mixing unit 13, a level detection unit 14, a howling occurrence detection unit 21, a dominance ratio calculation unit 16 , A howling suppressing unit 22 and a speaker 18.
  • the dominance rate of each audio signal is calculated only in the ending section. However, this embodiment is different in that it is calculated when howling is detected.
  • the loudspeaker system 2 may be a system that loudspeakers using three or more microphones! /, But here, the description will be made assuming that loudspeakers are used using two microphones. I do.
  • the first microphone 11a collects a sound to be loudspeaked by the speaker 18, and generates a sound signal.
  • the audio signal generated by the first microphone 11a be XI (t).
  • the second microphone l ib also collects a sound for loudspeaking and generates a sound signal X2 (t).
  • the sound characteristic adjustment unit 12 receives the audio signal XI (and X2 (t) as an input, and adjusts the frequency and gain characteristics of the audio signal, respectively. Then, the audio signal Xml ( t) and Xm2 (t) are mixed in the sound mixing unit 13.
  • the level detection unit 14 includes a sound characteristic adjustment unit 12 Detects the levels of the output audio signals Xml (t) and Xm2 (t). Then, all the level information for each band detected by the level detection unit 14 for each predetermined time is output to the control ratio calculation unit 16. The processing up to this point is the same as in the above-described first embodiment.
  • Howling occurrence detecting section 21 calculates the power spectrum Xm (co) of audio signal Xm (t) mixed by sound mixing section 13, and detects howling occurrence. For example, assuming that howling occurs at a specific frequency f, the power spectrum ⁇ ( ⁇ ) of the audio signal Xm (t) changes so that the power rapidly increases at the specific frequency f as shown in Fig. 13. . Therefore, by constantly observing the difference in power between adjacent bands, it is detected that the power of the band including the specific frequency f has rapidly increased. In other words, the power spectrum ⁇ ( ⁇ ) of the audio signal Xm (t) is observed, and the initial generation of howling (a state in which noling occurs or is being applied) is detected. Then, the information at the time of the initial occurrence of the howling detected by the howling occurrence detecting section 21 is output to the dominant rate calculating section 16.
  • the dominance rate calculation unit 16 is configured to input a plurality of input audio signals (see FIG. 10) based on the level of each audio signal output from the level detection unit 14 and the information detected by the howling occurrence detection unit 21.
  • step 6 the control rates of Xml (t) and Xm2 (t) are calculated.
  • the dominant rate calculating section 16 performs a dominant rate calculating process when the howling occurrence detecting section 21 detects the initial occurrence of howling. Then, of the levels calculated by the level detection unit 14, the power spectrum when the initial occurrence of howling is detected becomes the loop gain G.
  • a specific calculation method of the dominant ratio is the same as that of the first embodiment, and thus the description thereof is omitted.
  • the dominant ratio of each audio signal is calculated by the dominant ratio calculating section 16, so that it is possible to detect which audio signal is dominant at the initial occurrence of howling.
  • the dominance rate in the present embodiment indicates the degree of risk of causing howling for each of a plurality of audio signals, as in the first embodiment.
  • the sound characteristic adjustment unit 12, the sound mixing unit 13, the level detection unit 14, the howling occurrence detection unit 21, and the dominant ratio calculation unit 16 correspond to a sampling detection device in the present invention. That is, the howling detection device according to the present invention generates howling for each of the plurality of audio signals by calculating the dominant ratio. The degree of danger to be generated can be detected.
  • FIG. 7 is a block diagram illustrating an example of the configuration of the howling suppression unit 22 according to the second embodiment.
  • howling suppressing section 22 includes first power spectrum calculating section 171, second power spectrum calculating section 172, transfer characteristic calculating section 173, inverse Fourier transform section 174, convolution section 175, and ending detection section 176. Yes.
  • the power howling suppression section 22 that has referred to the ending information from the ending detection section 15 has a new ending detection section 176, and the ending detection section 176 refers to the ending information.
  • the ending detection section 176 refers to the ending information.
  • first power spectrum calculating section 171 receives audio signal Xm (t) output from sound mixing section 13 as input, and calculates power spectrum ⁇ ( ⁇ ) of audio signal Xm (t). I do.
  • Second power spectrum calculation section 172 receives noise reference signal Y (t) as input, and calculates power spectrum Y ( ⁇ ) of noise reference signal Y (t).
  • the end detection unit 176 has the same function as the end detection unit 15 described above.
  • the ending detection unit 176 generates a speech signal Xm (t) corresponding to the noise reference signal Y (t) based on the speech signal Xm (t) input from the sound mixing unit 13 and the noise reference signal Y (t).
  • the delay section of the voice section is detected as the ending.
  • the noise reference signal Y (t) is, for example, an audio signal immediately before being loudspeaked by the speaker 18 as in the first embodiment described above.
  • the ending detection unit 176 may be provided inside the howling suppression unit 17 and may be provided outside the force howling suppression unit 17. Also, the howling suppression unit 17 and the ending detection unit 176 may be separately provided so that the howling suppression unit 17 inputs information detected by the ending detection unit 176.
  • the transfer characteristic calculating section 173 first calculates the power spectrum ratio Hr ( ⁇ ) shown in Expression 8 based on the voice signal Xm (co) and the noise reference signal ⁇ ( ⁇ ) based on the V and the ending detection section 176. Then, the estimation is performed only in the section of the ending detected. Then, the transfer characteristic calculation unit 173 estimates Based on the power spectrum ratio Hr ( ⁇ ), the transfer characteristic Hsup ( ⁇ ) shown in Expression (9) is calculated. Next, the transfer characteristic calculating section 173 obtains the transfer characteristic Hsup (co) calculated by the equation (9) using V based on the loop gain and the dominant rate of each audio signal calculated by the dominant rate calculating section 16.
  • the transfer characteristic Hsu p ( ⁇ ) —new is calculated according to the change rate by multiplying the change rate of the sum of the obtained loop gains. Then, the transfer characteristic Hs up_new (co) according to the change rate calculated by Expression 11 is transformed on the time axis by the inverse Fourier transform unit 174.
  • the convolution unit 175 convolves the filter coefficient Hsup—new (t) converted on the time axis with the speech signal Xm (t) input from the sound mixing unit 13, The signal containing only the same component as the signal of only the ending section is subtracted from the voice signal Xm (t).
  • the transfer characteristic Hsup ( ⁇ ) —new according to the rate of change is based on the rate of change of the sum of the loop gains obtained using the loop gain at the initial occurrence of howling. Therefore, it is possible to suppress howling in consideration of an audio signal in which initial occurrence of howling occurs and its frequency component.
  • the calculation of Hsup ( ⁇ ) (Equation (9)) is performed when the ending is detected by the ending detecting unit 176. Updating of Hsup ( ⁇ ) based on the change rate of the sum of the loop gains based on the dominant rate (Equation (11)) is performed when the howling occurrence detection unit 21 detects the initial occurrence of howling. Further, the learning of Hsup ( ⁇ ) calculated by Expression 9 may be performed by a predetermined method every time the ending is detected, for example. Further, learning of Hsup (co) calculated by Expression 11 may be performed by a predetermined method every time an initial occurrence of howling is detected, for example.
  • the dominant ratio calculating unit 16 calculates the loop gain and the dominant ratio of each audio signal at the time of the initial occurrence of howling. Then, the transfer characteristic is calculated based on the change rate of the sum of the loop gains based on the dominant rate. Further, since the dominant ratio is calculated based on the output signal of the sound characteristic adjustment unit 12, it is a value linked to the frequency and gain characteristics adjusted in the sound characteristic adjustment unit 12. In this way, in a loudspeaker system in which a plurality of audio signals are mixed and loudspeaked, the transfer characteristic used for howling suppression is calculated based on the above dominant ratio, whereby the sound characteristic adjustment unit 12 Robust howling can be suppressed against howling caused by a sudden change in transfer characteristics.
  • M ( ⁇ ) caused by the user's operation of the mixer
  • FIG. 8 is a block diagram showing a configuration example of the howling warning device.
  • the howling warning device includes a first microphone lla, a second microphone llb, a sound characteristic adjustment unit 12, a sound mixing unit 13, a level detection unit 14, a ending detection unit 15, and a dominance ratio calculation unit. 16, a speaker 18, and a howling warning section 31 are provided.
  • FIG. 9 is a block diagram illustrating a configuration example of a howling warning device using the howling occurrence detection unit 21.
  • the howling warning device includes a first microphone l la, a second microphone l lb, a sound characteristic adjustment unit 12, a sound mixing unit 13, a level detection unit 14, a howling occurrence detection unit 21, a dominant ratio calculation unit. 16, a speaker 18, and a noise warning unit 31.
  • the present embodiment is different from the first and second embodiments in that a howling warning unit 31 is provided instead of the howling suppression units 17 and 22 in the first and second embodiments.
  • the above-described howling detection apparatus according to the present invention includes the howling warning unit 31.
  • the speed 18 is the same as in the first and second embodiments described above.
  • howling warning section 31 warns the user of a power at which howling is likely to occur due to which audio signal, according to the dominant rate based on the ending section calculated by dominant rate calculating section 16.
  • a display means for giving a warning for example, means for setting a lamp on each channel of a mixer for adjusting the frequency and gain characteristics of an audio signal and blinking a channel which may cause howling, etc. There is. Then, for example, the audio signal with the highest dominance (high risk of howling) Blink the channel lamp. Further, for example, the lamps of a plurality of channels having a high dominance ratio may be blinked.
  • a lamp for each frequency band may be provided for each channel, and the lamp may blink for each band.
  • the display means is not limited to the above-mentioned lamp, and may be a means for displaying on a display or other display means.
  • the sound characteristics may be automatically changed by the sound characteristics adjustment unit 12 (for example, the gain is reduced) in response to the warning which is not merely a warning, and howling may be prevented beforehand.
  • a warning may be given to the user as to which audio signal is likely to cause howling due to the dominant rate based on the initial occurrence of howling.
  • the howling warning unit 31 refers to the dominant ratio based on the initial occurrence of the ringing and the ringing calculated by the dominant ratio calculating unit 16 to inform the user which audio signal is causing the initial occurrence of howling. Can warn.
  • howling warning section 31 has a power at which howling is likely to be caused by howling signal depending on the dominant rate calculated by dominant rate calculating section 16 or The user is warned which audio signal causes the initial occurrence of howling.
  • the user can perform a mixer operation or the like on each audio signal while preventing howling from occurring.
  • the level detection unit 14, the ending detection unit 15, the dominance ratio calculation unit 16, and the howling suppression unit 17 described in the first embodiment are, for example, a sound signal output from the sound characteristic adjustment unit 12 (see FIG. In FIG. 1, Xml (t) and Xm2 (t)), the audio signal output from the sound mixing unit 13 (Xm (t) in FIG. 1), and the noise reference signal (Y (t) in FIG.
  • the level detection unit 14, the howling occurrence detection unit 21, the dominant ratio calculation unit 16, and the howling suppression unit 17 described in the second embodiment described above include, for example, audio output from the sound characteristic adjustment unit 12.
  • the audio signal (Xm (t) in Fig. 6) and the noise reference signal (Y (t) in Fig. 6) are also input, and the audio signal processing result is amplified by an amplifying unit as appropriate.
  • An integrated circuit that outputs to 18 is also feasible.
  • the level detection unit 14, the ending detection unit 15, and the dominance ratio calculation unit 16 described in FIG. 8 of the third embodiment described above are, for example, audio signals (FIG. 8) output from the sound characteristic adjustment unit 12.
  • FIG. 8 Xml (t) and Xm2 (t)) and the audio signal (Xm (t) in FIG. 8) output from the sound mixing unit 13 are input, and the result of the audio signal processing is indicated by the howling warning unit.
  • An integrated circuit outputting to 31 can also be realized.
  • the level detection unit 14, the howling occurrence detection unit 21, and the dominant ratio calculation unit 16 described with reference to FIG. 9 of the third embodiment described above include, for example, an audio signal output from the sound characteristic adjustment unit 12 (see FIG.
  • the electric circuits that perform the above-described functions are integrated in one small package to form, for example, an audio signal processing circuit DSP (Digital Signal Processor). Thereby, the present invention can be realized.
  • DSP Digital Signal Processor
  • the howling detection apparatus and method according to the present invention mixes a plurality of audio signals capable of detecting the degree of danger of howling occurrence for each of the plurality of audio signals by calculating a dominant ratio. It is also useful for loudspeaker systems and PA equipment with a sound mixer function.

Landscapes

  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Otolaryngology (AREA)
  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Telephonic Communication Services (AREA)
  • Reverberation, Karaoke And Other Acoustics (AREA)

Abstract

 ハウリング検出装置は、複数のマイクロフォンから収音されたそれぞれの音声信号を音混合部で混合した混合信号をスピーカで拡声するときに発生するハウリングに対して、当該音声信号それぞれに対してハウリングを発生させる危険度を示す支配率を検出する。ハウリング検出装置は、複数の音声信号のレベルをそれぞれ検出するレベル検出部と、スピーカで拡声される音響に関する信号を雑音参照信号として当該雑音参照信号と混合信号とを時系列的に比較し、当該雑音参照信号がたち下がった後に当該混合信号が入力される時間を語尾の区間として検出する語尾検出部と、レベル検出部が検出した複数の音声信号のレベルからそれぞれ語尾の区間に応じたレベルのみを抽出し、当該複数の音声信号のレベルの総和に対する各音声信号のレベルの比率を音声信号それぞれの支配率として算出する支配率算出部とを備える。

Description

明 細 書
ノヽゥリング検出装置およびその方法
技術分野
[0001] 本発明は、ハウリング検出装置およびその方法に関し、より特定的には、複数の音 声信号を混合して拡声する拡声システムにお 、て、当該複数の音声信号それぞれ について、ハウリングを発生させる危険度を検出するハウリング検出装置およびその 方法に関する。
背景技術
[0002] 従来、マイクロフォンで収音した音声信号を拡声する拡声システムにお 、て、ハウリ ングの発生を検出し、当該ハウリングを抑制するハウリング抑制装置が開発されてい る。従来のハウリング抑制装置としては、適用フィルタやノッチフィルタなどを用いたノヽ ゥリング抑制装置が知られている(例えば、特許文献 1および特許文献 2参照)。
[0003] 以下、図 10を参照して、複数の音声信号を入力として当該複数の音声信号を混合 して拡声する拡声システムにおいて、従来のハウリング抑制装置を採用した場合に ついて説明する。図 10は、複数の音声信号を混合して拡声する拡声システム 9にお いて上記特許文献 1および特許文献 2に開示されたハウリング抑制装置を採用した 構成例を示す図である。なお、図 10では、スピーカと複数のマイクロフォンとが同一 の音場にあるときに発生するハウリングを抑制する場合の構成例を示している。また、 ここでは複数の音声信号として、 2つのマイクロフォンから 2つの音声信号が入力され るとする。
[0004] 図 10において、拡声システム 9は、第 1のマイクロフォン 91a、第 2のマイクロフォン 9 lb、音特性調整部 92、音混合部 93、ハウリング抑制部 94、およびスピーカ 95を有 する。音特性調整部 92は、第 1のマイクロフォン 91aで収音して生成された音声信号 を入力とし、当該音声信号の周波数やゲインの特性を調整する。同様に、第 2のマイ クロフオン 91bで収音して生成された音声信号は、音特性調整部 92において周波数 やゲインの特性が調整される。そして、調整された各音声信号は、音混合部 93にお いて混合される。なお、音特性調整部 92および音混合部 93は、例えば図 11に示す ような市販のミキサなどに相当する。図 11は、音特性調整部 92および音混合部 93の 構成例を示すブロック図である。図 11において、音特性調整部 92は、例えばィコライ ザ 921a、イコライザ 921b、増幅部 922a、および増幅部 922bを有する。イコライザ 9 21 aは、第 1のマイクロフォン 91 aで収音して生成された音声信号の周波数特性を調 整する。増幅部 922aは、イコライザ 921aで調整された音声信号のゲインを調整する 。同様に、イコライザ 921bおよび増幅部 922bは、第 2のマイクロフォン 91bで収音し て生成された音声信号の周波数やゲインの特性を調整する。このように音特性調整 部 92では、通常のミキサと同様に、第 1および第 2のマイクロフォン 91aおよび 92bで 収音された各音声信号の周波数やゲインの特性がそれぞれ独立して調整される。音 混合部 93において混合された音声信号は、ハウリング抑制部 94に入力される。
[0005] ハウリング抑制部 94は、音混合部 93において混合された音声信号に対して、ハウ リングを抑制する信号処理を行う。そして、信号処理された音声信号は、適宜増幅さ れてスピーカ 95によって拡声される。なお、ハウリング抑制部 94は、ハウリングを抑制 するハウリング抑制装置に相当する。そして、上述したように、当該拡声システムは、 上記特許文献 1または特許文献 2で開示されたハウリング抑制方式を採用している例 であるため、ハウリング抑制部 94として適応フィルタまたはノッチフィルタを用いてい る。
[0006] 図 12は、適応フィルタ 941を用いたハウリング抑制部 94の構成例を示すブロック図 である。この場合、ハウリング抑制部 94は、ハウリング抑制部 94から出力される音声 信号 (拡声対象である音声信号)に基づいて、当該音声信号が出力されたときのみ、 空間伝達特性などの伝達特性を推定する。そして、適用フィルタ 941は、推定した伝 達特性を拡声対象である音声信号に乗じて、音混合部 93から出力された音声信号 から減算する。これにより、ハウリングの発生を抑制することができる。
[0007] また、ハウリング抑制部 94としてノッチフィルタを用いる場合もある。図 13は、音混 合部 93から出力された音声信号のパワースペクトル Χ( ω )のハウリング発生時の変 化を示す図である。例えば、特定周波数 fにおいてハウリングが発生すると仮定する。 このとき、図 13に示すパワースペクトル Χ ( ω )は、特定周波数 fにおいてパワーが急 激に増加するように変化する。そこで、隣接する帯域間のパワーの差分を常に観察 することで、特定周波数 fが含まれる帯域のパワーが急激に増加したことが検出され る。つまり、ハウリングが発生する周波数を検出することができる。このとき、ノッチフィ ルタの減衰する周波数を特定周波数 fに設定する。そして、音混合部 93から出力さ れた音声信号を特定周波数 fで減衰するノッチフィルタに通過させることで、特定周 波数 fのパワーは減衰する。その結果、ハウリングの発生が抑制される。
特許文献 1:特許第 2039846号公報
特許文献 2:特許第 2560923号公報
発明の開示
発明が解決しょうとする課題
ここで、図 14を参照して、適用フィルタを用いたノ、ゥリング抑制部 94が推定するべ き理想的な伝達特性について考える。図 14は、 1入力時の拡声システム 9において、 伝達特性に関係する各構成の特性を模式的に示した図である。ここでは、まずマイク 口フォン 91が 1つの場合について考える。また、図 14において、マイクロフォン 91の 収音対象となる音声を S ( ω )、マイクロフォン 91で収音して生成された音声信号を Χ( ω )、音特性調整部 92にお 、て調整される周波数やゲインの特性を Μ ( ω )、ハウリ ング抑制部 94で推定するべき理想的な伝達特性を Hhat ( ω )、ハウリング抑制部 94 力も出力される音声信号を Υ( ω )、スピーカ 95からマイクロフォン 91までの空間伝達 特性を R ( co )とする。このとき、マイクロフォン 91で収音して生成された音声信号 X( ω )は数式(1)で表現される。
[数 1]
X (ω) = S ( ω) + R ( ω) * Υ ( ω) ■ ■ ( 1 )
なお、 R( co )には、上記空間の伝達特性だけでなぐマイクロフォン 91自体の特性、 スピーカ 95自体の特性、およびノヽゥリング抑制部 94の出力とスピーカ 95との間で適 宜増幅された場合のその増幅特性などが含まれてもよい。また、ハウリング抑制部 94 では、音特性調整部 92において調整された音声信号 Μ ( ω ) *Χ( ω )がハウリング 抑制部 94の出力音声信号 Υ ( ω )に伝達特性 Hhat ( ω )を乗じたもので減算する処 理が行われ、数式(2)が成立する。
[数 2] Y (ω) = Μ (ω) * X (ω) - Hhat(w) * Υ (ω) ■ ■ (2)
数式( 1)および数式 (2)を変形すると、数式 (3)が得られる。
[数 3]
Υ (ω) = Μ (ω) * S (ω)
+ ( Μ (ω) * R (ω) 一 Hhat( j) ) Υ (ω) ■ ■ (3)
数式(3)において、第 2項がハウリングに起因する項である。したがって、理想的な伝 達特性 Hhat ( ω )は、数式 (4)を満たす伝達特性となる。
Hhat(ai) « M (ω) * R (ω) ■ ■ (4)
伝達特性 Hhat ( ω )が数式 (4)の関係を満たすことによって、数式(3)の第 2項がほ ぼゼロとなる。これにより、ハウリング抑制部 94は、ハウリングの発生を抑制することが できる。
次に、図 15を参照して、複数の音声信号を混合する場合について考える。図 15は 、複数入力時の拡声システム 9において、伝達特性と関係する各構成の特性を模式 的に示した図である。図 15において、第 1のマイクロフォン 91aの収音対象となる音 声を S 1 ( ω )、音特性調整部 92にお 、て調整される周波数やゲインの特性を Ml ( ω )、スピーカ 95から第 1のマイクロフォン 91aまでの空間伝達特性を Rl(co)とする。同 様に、第 nのマイクロフォンの収音対象となる音声を Sn(co)、音特性調整部 92にお いて調整される周波数やゲインの特性を Μη(ω)、スピーカ 95から第 nのマイクロフ オン 92cまでの空間伝達特性を Rn(co)とする。このとき、数式(3)は数式(5)と表現 される。なお、 nは自然数であり、マイクロフォンの本数を示す。
[数 5]
Figure imgf000006_0001
+ ( M k(w) * R ^ω) - Hhat(w) ) Y (ω) ■ ■ (5)
k=1
数式(5)において、第 2項がハウリングに起因する項である。したがって、推定される べき理想的な伝達特性 Hhat ( ω )は、数式 (6)を満たす伝達特性となる。
[数 6]
Hhat(w) » . M k(w) * R k(w) ■ ■ (6) [0010] 数式 (6)に示すように、複数の音声信号がもつ空間伝達特性 R ( ω )は、それぞれ 固有の値である。また、空間伝達特性 R ( co )は、マイクロフォンの位置によって変化 する値である。つまり、理想的な伝達特性を適切に推定するためには、複数の音声 信号それぞれの空間伝達特性 R ( co )を考慮する必要がある。し力しながら、従来に おいては、伝達特性はハウリング抑制部 94の出力信号に基づいて推定される。つま り、ハウリング抑制部 94の出力信号は、複数の音声信号が混合された音声信号に基 づく信号であり、複数のマイクロフォンそれぞれの空間伝達特性 R ( ω )が考慮された 信号ではない。したがって、従来においては、空間伝達特性 R ( co )の変化に対して 上記伝達特性の推定速度が追いつかず、ハウリングの発生を適切に抑制することが できな 、と!/、う問題があった。
[0011] また、数式 (6)に示すように、推定されるべき理想的な伝達特性 Hhat (t)は、複数 のマイクロフォンそれぞれの M ( ω )や R ( ω )によって決まる値である。つまり、理想的 な伝達特性 Hhat ( ω )は、 M ( ω )が変化すると、それに伴 、変化する値である。ここ で、上記適用フィルタ 941では、ハウリング抑制部 94の出力信号に基づいて、収束し ながら伝達特性が推定される。このため、 Μ ( ω )が急激に変化して理想的な伝達特 性 Hhat ( ω )も急激に変化した場合には、上記伝達特性の推定速度が追いつかず、 ノ、ゥリングの発生を適切に抑制することが困難であった。
[0012] また、複数のマイクロフォンを有する場合、上述したように Μ ( ω )および R ( co )の値 は、マイクロフォンが 1つのときと比べて変化しやすいので、ハウリングが発生する特 定周波数 fも変化しやすい。これにより、ハウリング抑制部 94として上記ノッチフィルタ を用いた場合にも、この特定周波数 fの変化にノッチフィルタの減衰する周波数の設 定が追いつかず、ハウリングの発生を適切に抑制することが困難であった。
[0013] このように、複数の音声信号を混合して拡声する拡声システムにお 、ては、複数の 音声信号それぞれについて、ハウリングの発生する危険度 (例えば、上記 Μ ( ω )や R ( ω )の変化など)を考慮しなければ、ハウリングの発生を適切に抑制することができ ないという課題があった。
[0014] また、従来においてハウリングの発生をユーザに警告する場合、入力された音声信 号のパワースペクトルにお 、て、隣接する帯域間のパワーの差分を常に観察してハ ゥリングの発生を検出し、ユーザに警告する方法が知られている。しかしながら、複数 の音声信号を混合して拡声する拡声システムにお 、ては、混合された音声信号のパ ワースベクトルに基づいてハウリングの発生を検出することとなる。したがって、従来 においては、複数入力される音声信号のうちどの音声信号がハウリングを発生させた の力、もしくは発生させる危険があるのかを特定して警告することが不可能であった。
[0015] それ故、本発明においては、複数の音声信号を混合して拡声する拡声システムに おいて、当該複数の音声信号それぞれについて、ハウリングを発生させる危険度を 検出することを目的とする。さらに、本発明においては、当該危険度の情報に基づい て適切な伝達特性を推定し、音特性調整部による伝達特性の急激な変化に対して口 バストなハウリングの発生の抑制を行うことを目的とする。また、本発明においては、 複数入力される音声信号のうちどの音声信号がハウリングを発生させたの力 もしく は発生させる危険があるのかを特定して警告する方法を提供することを目的とする。 課題を解決するための手段
[0016] 本発明の第 1の局面は、複数のマイクロフォン力 収音されたそれぞれの音声信号 を音混合部で混合した混合信号をスピーカで拡声するときに発生するハウリングに対 して、当該音声信号それぞれに対してハウリングを発生させる危険度を示す支配率 を検出するハウリング検出装置であって、複数の前記音声信号のレベルをそれぞれ 検出するレベル検出部と、前記スピーカで拡声される音響に関する信号を雑音参照 信号として当該雑音参照信号と前記混合信号とを時系列的に比較し、当該雑音参 照信号がたち下がった後に当該混合信号が入力される時間を語尾の区間として検 出する語尾検出部と、前記レベル検出部が検出した複数の前記音声信号のレベル 力 それぞれ前記語尾の区間に応じたレベルのみを抽出し、当該複数の音声信号 のレベルの総和に対する各音声信号のレベルの比率を前記音声信号それぞれの支 配率として算出する支配率算出部とを備える。
[0017] 本発明の第 2の局面は、上記第 1の局面において、前記ハウリング検出装置は、前 記支配率を用いて算出された伝達特性に基づいて、前記語尾の区間に含まれる信 号と同じ成分を有する信号を前記混合信号力 減算して前記スピーカに出力するハ ゥリング抑制部を、さらに備える。 [0018] 本発明の第 3の局面は、上記第 2の局面において、前記ハウリング抑制部は、前記 語尾の区間に含まれる信号と同じ成分を有する信号を除 ヽた前記混合信号を推定 する関数を設定し、前記支配率に応じて前記総和を更新し、当該更新前後の総和の 変化率を前記関数に乗じて前記伝達特性を算出することを特徴とする。
[0019] 本発明の第 4の局面は、上記第 3の局面において、前記ハウリング抑制部は、相対 的に高い支配率を示す音声信号のレベルのみを更新して前記総和を更新することを 特徴とする。
[0020] 本発明の第 5の局面は、上記第 3の局面において、前記ハウリング抑制部は、最も 高い支配率を示す音声信号のレベルのみを更新して前記総和を更新することを特 徴とする。
[0021] 本発明の第 6の局面は、上記第 1の局面において、前記ハウリング検出装置は、前 記支配率算出部において算出された支配率が相対的に高い音声信号を特定して、 ユーザに通知するハウリング警告部をさらに備える。
[0022] 本発明の第 7の局面は、上記第 1の局面において、ハウリング検出装置であって、 前記ハウリング検出装置は、前記支配率算出部において算出された支配率が最も高 い音声信号を特定して、ユーザに通知するハウリング警告部をさらに備える。
[0023] 本発明の第 8の局面は、上記第 1の局面において、前記レベル検出部は、複数の 前記音声信号レベルをパワースペクトルでそれぞれ検出することを特徴とする。
[0024] 本発明の第 9の局面は、複数のマイクロフォン力 収音されたそれぞれの音声信号 を音混合部で混合した混合信号をスピーカで拡声するときに発生するハウリングに対 して、当該音声信号それぞれに対してハウリングを発生させる危険度を示す支配率 を検出するハウリング検出装置であって、複数の前記音声信号のレベルをそれぞれ 検出するレベル検出部と、前記混合信号のパワースペクトルを算出して、当該パワー スペクトルの変化に基づいてハウリングの発生を検出するハウリング発生検出部と、 前記レベル検出部が検出した複数の前記音声信号のレベルからそれぞれ前記ハウ リングの発生が検出されたときのレベルのみを抽出し、当該複数の音声信号のレべ ルの総和に対する各音声信号のレベルの比率を前記音声信号それぞれの支配率と して算出する支配率算出部とを備える。 [0025] 本発明の第 10の局面は、上記第 9の局面において、前記ハウリング検出装置は、 前記スピーカで拡声される音響に関する信号を雑音参照信号として当該雑音参照 信号と前記混合信号とを時系列的に比較し、当該雑音参照信号がたち下がった後 に当該混合信号が入力される時間を語尾の区間として検出する語尾検出部と、前記 支配率を用いて算出された伝達特性に基づいて、前記語尾の区間に含まれる信号 と同じ成分を有する信号を前記混合信号力も減算して前記スピーカに出力するハウ リング抑制部とを、さらに備える。
[0026] 本発明の第 11の局面は、上記第 10の局面において、前記ハウリング抑制部は、前 記語尾の区間に含まれる信号と同じ成分を有する信号を除 ヽた前記混合信号を推 定する関数を前記語尾の区間が検出されたときに設定し、前記支配率に応じて前記 総和を更新し、当該更新前後の総和の変化率を前記関数に乗じて前記伝達特性を 前記ハウリングの発生が検出されたときに算出することを特徴とする。
[0027] 本発明の第 12の局面は、上記第 11の局面において、前記ハウリング抑制部は、相 対的に高い支配率を示す音声信号のレベルのみを更新して前記総和を更新するこ とを特徴とする。
[0028] 本発明の第 13の局面は、上記第 11の局面において、前記ハウリング抑制部は、最 も高い支配率を示す音声信号のレベルのみを更新して前記総和を更新することを特 徴とする。
[0029] 本発明の第 14の局面は、上記第 9の局面において、前記ハウリング検出装置は、 前記支配率算出部において算出された支配率が相対的に高い音声信号を特定して
、ユーザに通知するハウリング警告部をさらに備える。
[0030] 本発明の第 15の局面は、上記第 9の局面において、前記ハウリング検出装置は、 前記支配率算出部において算出された支配率が最も高い音声信号を特定して、ュ 一ザに通知するハウリング警告部をさらに備える。
[0031] 本発明の第 16の局面は、上記第 9の局面において、前記レベル検出部は、複数の 前記音声信号レベルをパワースペクトルでそれぞれ検出することを特徴とする。
[0032] 本発明の第 17の局面は、複数のマイクロフォンカも収音されたそれぞれの音声信 号を音混合ステップで混合した混合信号をスピーカで拡声するときに発生するハウリ ングに対して、当該音声信号それぞれに対してハウリングを発生させる危険度を示す 支配率を検出するハウリング検出方法であって、複数の前記音声信号のレベルをそ れぞれ検出するレベル検出ステップと、前記スピーカで拡声される音響に関する信 号を雑音参照信号として当該雑音参照信号と前記混合信号とを時系列的に比較し、 当該雑音参照信号がたち下がった後に当該混合信号が入力される時間を語尾の区 間として検出する語尾検出ステップと、前記レベル検出ステップが検出した複数の前 記音声信号のレベルカゝらそれぞれ前記語尾の区間に応じたレベルのみを抽出し、当 該複数の音声信号のレベルの総和に対する各音声信号のレベルの比率を前記音 声信号それぞれの支配率として算出する支配率算出ステップとを含む。
[0033] 本発明の第 18の局面は、複数のマイクロフォンカも収音されたそれぞれの音声信 号を音混合ステップで混合した混合信号をスピーカで拡声するときに発生するハウリ ングに対して、当該音声信号それぞれに対してハウリングを発生させる危険度を示す 支配率を検出するハウリング検出方法であって、複数の前記音声信号のレベルをそ れぞれ検出するレベル検出ステップと、前記混合信号のパワースペクトルを算出して 、当該パワースペクトルの変化に基づいてハウリングの発生を検出するハウリング発 生検出ステップと、前記レベル検出ステップが検出した複数の前記音声信号のレべ ルカもそれぞれ前記ハウリングの発生が検出されたときのレベルのみを抽出し、当該 複数の音声信号のレベルの総和に対する各音声信号のレベルの比率を前記音声 信号それぞれの支配率として算出する支配率算出ステップとを含む。
発明の効果
[0034] 上記第 1の局面によれば、語尾の区間にはハウリングの発生原因となる信号成分の みが含まれおり、支配率が当該語尾の区間に応じたレベルを用いて算出されること で、複数の音声信号のうちどの音声信号がハウリングを発生させるのかという危険度 を検出することができる。また、支配率は音混合部で混合される前の音声信号のレべ ルに基づいて算出される。これにより、本局面によれば、音混合部で混合される前に ぉ 、て、例えば複数の音声信号の周波数および Zまたはゲインの特性がそれぞれ 変更されても、その変更に対応した上記危険度を検出することができる。
[0035] 上記第 2の局面によれば、伝達特性が支配率を用いて算出されることで、複数の音 声信号のうちどの音声信号がハウリングを発生させるのかという危険度に応じたハウリ ングの抑制を行うことができる。また、伝達特性が支配率を用いて算出されることで、 音混合部で混合される前において、例えば複数の音声信号の周波数および Zまた はゲインの特性がそれぞれ変更され、伝達特性が急激に変化しても、その変化に対 応したロバストなハウリングの抑制を行うことができる。
[0036] 上記第 3の局面によれば、伝達特性が支配率に応じた総和の変化率に基づいて算 出されることで、複数の音声信号のハウリングを発生させる危険度を考慮したロバスト なハウリング抑制を実現することができる。
[0037] 上記第 4の局面によれば、複数の音声信号のうち、ハウリングを発生させる危険度 が相対的に高い音声信号に対応した伝達特性が算出されるので、高効率なハウリン グ抑制を実現することができる。
[0038] 上記第 5の局面によれば、複数の音声信号のうち、ハウリングを発生させる危険度 が最も高い音声信号に対応した伝達特性が算出されるので、高効率なハウリング抑 制を実現することができる。例えばユーザのミキサ操作として、複数の音声信号のレ ベルを全て同時に変更したりする操作は稀であるため、支配率の最も高いものだけ に追随するものであっても、ロバストなハウリングの抑制を行うことができる。
[0039] 上記第 6の局面によれば、支配率が相対的に高い音声信号を特定することによつ て、ユーザに対して、複数の音声信号のうち、どの音声信号がハウリングを発生させ る危険度が相対的に高いかを通知することができる。また、ユーザが例えばミキサな どの操作において収音される音声信号が複数あっても、ユーザは上記危険度を参照 することでハウリングの発生を未然に防止しながら操作を行うことができる。
[0040] 上記第 7の局面によれば、支配率が最も高い音声信号を特定することによって、ュ 一ザに対して、複数の音声信号のうち、どの音声信号がハウリングを発生させる危険 度が最も高いかを通知することができる。また、例えばミキサなどの操作において収 音される音声信号が複数あっても、ユーザは上記危険度を参照することでハウリング の発生を未然に防止しながら操作を行うことができる。
[0041] 上記第 8の局面によれば、複数の音声信号のレベルがパワースペクトルで算出され ることで、ハウリングを発生させる危険度を周波数帯域ごとに検出することができる。 [0042] 上記第 9の局面によれば、ハウリングが発生したとき、複数の音声信号のうちどの音 声信号がハウリングを発生させるのかという危険度を検出することができる。また、支 配率は音混合部で混合される前の音声信号のレベルに基づいて算出される。これに より、本局面によれば、音混合部で混合される前において、例えば複数の音声信号 の周波数および Zまたはゲインの特性がそれぞれ変更されても、その変更に対応し た上記危険度を検出することができる。
[0043] 上記第 10の局面によれば、伝達特性が支配率を用いて算出されることで、複数の 音声信号のうちどの音声信号がハウリングを発生させるのかという危険度に応じたハ ゥリングの抑制を行うことができる。また、伝達特性が支配率を用いて算出されること で、音混合部で混合される前において、例えば複数の音声信号の周波数および Zま たはゲインの特性がそれぞれ変更され、伝達特性が急激に変化しても、その変化に 対応したロバストなハウリングの抑制を行うことができる。
[0044] 上記第 11の局面によれば、伝達特性が支配率に応じた総和の変化率に基づ!/、て 算出されることで、語尾の区間が到来する前に、複数の音声信号のハウリングを発生 させる危険度を考慮したロバストなハウリング抑制を実現することができる。
[0045] 上記第 12の局面によれば、複数の音声信号のうち、ハウリングを発生させる危険度 が相対的に高い音声信号に対応した伝達特性が算出されるので、高効率なハウリン グ抑制を実現することができる。
[0046] 上記第 13の局面によれば、複数の音声信号のうち、ハウリングを発生させる危険度 が最も高い音声信号に対応した伝達特性が算出されるので、高効率なハウリング抑 制を実現することができる。例えばユーザのミキサ操作として、複数の音声信号のレ ベルを全て同時に変更したりする操作は稀であるため、支配率の最も高いものだけ に追随するものであっても、ロバストなハウリングの抑制を行うことができる。
[0047] 上記第 14の局面によれば、ハウリングが発生した場合において、ユーザに対して、 複数の音声信号のうちどの音声信号がハウリングを発生させる危険度が相対的に高 いかを通知することができる。また、ユーザが例えばミキサなどの操作において収音 される音声信号が複数あっても、ユーザは上記危険度を参照することでハウリングの 発生を未然に防止しながら操作を行うことができる。 [0048] 上記第 15の局面によれば、ハウリングが発生した場合において、ユーザに対して、 複数の音声信号のうちどの音声信号がハウリングを発生させる危険度が最も高いか を通知することができる。また、ユーザが例えばミキサなどの操作において収音される 音声信号が複数あっても、ユーザは上記危険度を参照することでハウリングの発生を 未然に防止しながら操作を行うことができる。
[0049] 上記第 16の局面によれば、複数の音声信号のレベルがパワースペクトルで算出さ れることで、ハウリングを発生させる危険度を周波数帯域ごとに検出することができる
図面の簡単な説明
[0050] [図 1]図 1は、拡声システム 1の構成例を示すブロック図である。
[図 2]図 2は、音特性調整部 12および音混合部 13の構成例を示すブロック図である
[図 3]図 3は、雑音参照信号 Y(t)および音声信号 Xm (t)の波形を示す図である。
[図 4]図 4は、ループゲイン G1 ( ω )、 G2 ( ω )、およびループゲインの和(G1 ( ω ) + G2 ( ω ) )のスペクトラムの一例を示す図である。
[図 5]図 5は、ハウリング抑制部 17の構成の一例を示すブロック図である。
[図 6]図 6は、拡声システム 2の構成例を示すブロック図である。
[図 7]図 7は、第 2の実施形態におけるハウリング抑制部 22の構成の一例を示すプロ ック図である。
[図 8]図 8は、ハウリング警告装置の構成例を示すブロック図である。
[図 9]図 9は、ハウリング発生検出部 21を用いたハウリング警告装置の構成例を示す ブロック図である。
[図 10]図 10は、複数の音声信号を混合して拡声する拡声システム 9において上記特 許文献 1および特許文献 2に開示されたハウリング抑制装置を採用した構成例を示 す図である。
[図 11]図 11は、音特性調整部 92および音混合部 93の構成例を示すブロック図であ る。
[図 12]図 12は、適応フィルタ 941を用いたノ、ゥリング抑制部 94の構成例を示すブロ ック図である。
[図 13]図 13は、音混合部 93から出力された音声信号のパワースペクトル Χ( ω )のハ ゥリング発生時の変化を示す図である。
[図 14]図 14は、 1入力時の拡声システム 9において、伝達特性に関係する各構成の 特性を模式的に示した図である。
[図 15]図 15は、複数入力時の拡声システム 9において、伝達特性と関係する各構成 の特性を模式的に示した図である。
符号の説明
1、 2 拡声システム
3 ハウリング警告装置
11a 第 1のマイクロフォン
l ib 第 2のマイクロフォン
12 音特性調整部
13 音混合部
14 レベル検出部
15、 176 語尾検出部
16 支配率算出部
17、 22 ハウリング抑制部
18 スピーカ
21 ハウリング発生検出部
31 ハウリング警告部
121 イコライザ
122 増幅部
171 第 1のパワースペクトル算出部
172 第 2のパワースペクトル算出部
173 伝達特性算出部
174 逆フーリエ変換部
175 畳み込み部 発明を実施するための最良の形態
[0052] (第 1の実施形態)
図 1を参照して、本発明の第 1の実施形態に係るハウリング検出方法および抑制方 法を採用した拡声システム 1について説明する。図 1は、拡声システム 1の構成例を 示すブロック図である。図 1において、拡声システム 1は、第 1のマイクロフォン l la、 第 2のマイクロフォン l lb、音特性調整部 12、音混合部 13、レベル検出部 14、語尾 検出部 15、支配率算出部 16、ハウリング抑制部 17、およびスピーカ 18を有する。な お、拡声システム 1は 3つ以上のマイクロフォンを用いて拡声するシステムでもよいが 、ここでは 2つのマイクロフォンを用いて拡声する場合を想定して説明する。図 1にお いて、第 1のマイクロフォン 11aは、スピーカ 18において拡声するための音声を収音 して音声信号を生成する。この第 1のマイクロフォン 11aで生成された音声信号を XI (t)とする。また、第 2のマイクロフォン l ibでも同様に、拡声するための音声を収音し て音声信号 X2 (t)を生成する。
[0053] 音特性調整部 12は、音声信号 XI (t)および X2 (t)を入力とし、当該音声信号の周 波数やゲインの特性をそれぞれ調整する。なお、音特性調整部 12で調整された音 声信号 XI (t)を Xml (t)とする。同様に音特性調整部 12で調整された音声信号 X2 (t)を Xm2 (t)とする。音特性調整部 12で調整された音声信号 Xml (t)および Xm2 (t)は、レベル検出部 14と音混合部 13とにそれぞれ出力される。音混合部 13に入力 された音声信号 Xml (t)および Xm2 (t)は、当該音混合部 13において混合される。 この混合された音声信号を Xm (t)とする。そして、音混合部 13において混合された 音声信号 Xm (t)は、語尾検出部 15およびハウリング抑制部 94に出力される。なお、 音特性調整部 12および音混合部 13は、例えば図 2に示すような市販のミキサなどで ある。
[0054] 図 2は、音特性調整部 12および音混合部 13の構成例を示すブロック図である。図 2において、音特性調整部 12は、例えばイコライザ 121a、イコライザ 121b、増幅部 1 22a、および増幅部 122bを有する。イコライザ 121aは、第 1のマイクロフォン 11aで 収音して生成された音声信号 XI (t)の周波数特性を調整する。増幅部 122aは、ィコ ライザ 121aで調整された音声信号のゲインを調整する。同様に、イコライザ 121bお よび増幅部 122bは、第 2のマイクロフォン l ibで収音して生成された音声信号 X2 (t )の周波数やゲインの特性を調整する。このように音特性調整部 12では、通常のミキ サと同様に、第 1および第 2のマイクロフォン 11aおよび 12bで収音された各音声信号 の周波数やゲインの特性がそれぞれ独立して調整される。
[0055] レベル検出部 14は、音特性調整部 12から出力される音声信号 Xml (t)および Xm 2 (t)の各レベルを検出する。具体的な検出方法としては、例えば所定時間毎にパヮ 一スペクトルを算出して、帯域毎のレベルを検出する。レベル検出部 14で検出され た各所定時間における帯域毎のレベルの情報は、全て支配率算出部 16に出力され る。
[0056] 語尾検出部 15は、音混合部 13から入力される音声信号 Xm (t)と、雑音参照信号 Y (t)とに基づ 、て、雑音参照信号 Y (t)に対する音声信号 Xm (t)の音声区間の遅 延区間を語尾として検出する。なお、雑音参照信号 Y(t)は、スピーカで拡声される 音響に関する信号であり、例えばスピーカ 18において拡声される直前の音声信号で ある。このとき、ハウリング抑制部 17には、スピーカ 18の直前の入力力も雑音参照信 号 Y(t)が入力される。また例えば、スピーカ 18の近傍で拡声された音声を別のマイ クロフオンなどで収音して生成される音声信号であってもよい。このとき、ハウリング抑 制部 17は、当該別のマイクロフォンと接続され、当該別のマイクロフォンから出力され る音声信号を雑音参照信号 Y(t)として入力する。
[0057] ここで、図 3を参照して、語尾部分の信号成分について説明する。図 3は、雑音参 照信号 Y(t)および音声信号 Xm (t)の波形を示す図である。図 3に示すように、音声 信号 Xm (t)の音声区間は、雑音参照信号 Y(t)に対して遅延している。これは、図 1 3および数式 1に示したように、マイクロフォンで収音して生成される音声信号には、 話者が発声する音声 S ( ω )の他に、スピーカで拡声され、空間伝播してマイクロフォ ンに再び混入する音声 Υ( ω ) *R( co )が含まれるためである。つまり、混入する音声 Υ( ω ) *R ( co )は、空間伝播する分だけスピーカ 18の拡声音より遅延しているため である。これは、第 1のマイクロフォン 11aおよび第 2のマイクロフォン l ibから音声信 号が入力される場合ついても同様である。このように、音声信号 Xm(t)には、空間伝 播して第 1のマイクロフォン 11aおよび/または第 2のマイクロフォン l ibに再び混入 される遅延した音声 Υ( ω ) *R( co )の信号成分が含まれている。つまり、図 3に示す 語尾部分には、空間伝播して第 1のマイクロフォン 11aおよび/または第 2のマイクロ フォン 1 lbに再び混入する信号成分のみが含まれて 、ること〖こなる。語尾検出部 15 が上記語尾部分を検出することで、後述する支配率算出部 16は、空間伝播して第 1 のマイクロフォン 11aおよび Zまたは第 2のマイクロフォン l ibに再び混入される信号 成分のみに基づ!/、た支配率を算出することができる。語尾検出部 15の具体的な検 出方法としては、例えば音声信号 Xm(t)および雑音参照信号 Y(t)の波形のパワー エンベロープを用いる方法がある。各パワーエンベロープ(立ち上がり部分を除く)を 用いて、その比率を常に観察することで、語尾部分を検出することができる。また例え ば、語尾検出部 15が雑音参照信号 Y(t)および音声信号 Xm (t)を時系列的に比較 する。そして、語尾検出部 15が各パワーエンベロープの立ち下がりを検出して、それ らの差分を語尾部分としてもょ ヽ。語尾検出部 15にお ヽて検出された語尾 (遅延し た部分)の情報は、支配率算出部 16およびハウリング抑制部 17に送られる。
[0058] 支配率算出部 16は、レベル検出部 14から出力された各音声信号のレベルと、語 尾検出部 15において検出された語尾とに基づいて、入力された複数の音声信号(図 1では、 Xml (t)および Xm2 (t) )の支配率をそれぞれ算出する。なお、支配率算出 部 16は、語尾検出部 15で検出された語尾の区間でのみ支配率の算出処理を行う。 以下、支配率の算出方法について具体的に説明する。なお、支配率とは、複数の音 声信号それぞれについてハウリングを発生させる危険度を示すものである。
[0059] レベル検出部 14で算出されたレベルのうち、語尾の区間のパワースペクトルをルー プゲイン Gとする。そして、音声信号 Xml (t)のループゲインを Gl ( ω )、音声信号 X m2 (t)のループゲインを G2 ( ω )とする。同様に、第 η (ηは自然数)のマイクロフォン から入力され、音特性調整部 12で周波数やゲイン特性を調整された音声信号 Xmn (t)とする。このとき、当該 Xmn (t)のループゲイン Gn ( co )は、数式 7と表現できる。
[数 7]
G n ( 6u ) = Μ η ( ω ) * Χη ( ω) ■ ■ ( 7 )
そして、支配率算出部 16は、各音声信号のレベル力 語尾の区間のレベルであるル ープゲイン Gを抽出し、各音声信号に対する支配率として例えば全音声信号のルー プゲインの和と各音声信号のループゲインとの比をそれぞれ算出する。例えば、図 1 では、ループゲインの和は G1 ( ω ) +G2 ( ω )である。したがって、音声信号 Xml (t) に対する支配率は、和(G1 ( ω ) +G2 ( ω ) )と Gl ( ω )との比として表現される。また、 音声信号 Xm2 (t)に対する支配率は、和(G1 ( ω ) +G2 ( ω ) )と G2 ( ω )との比とし て表現される。このように支配率算出部 16は、図 4に示すように、語尾の区間におい て、帯域毎にどの音声信号のループゲインが支配的であるかを、帯域毎のループゲ インの大小をもとに支配率として判定することができる。図 4は、ループゲイン Gl ( co ) 、 G2 ( ω )、およびループゲインの和(G1 ( ω ) +G2 ( ω ) )のスペクトラムの一例を示 す図である。図 4の一例では、周波数 り大きい周波数帯域で G2 ( co )の支配率が 高くなり、 G2 ( co )が支配的であることが判定される。また、周波数 f未満の周波数帯 域では G1 ( ω )の支配率が高くなり、 G1 ( ω )が支配的であることが判定される。
[0060] このように、空間伝播される信号成分のみが含まれる語尾の区間に対して、支配率 算出部 16は、各音声信号の支配率が算出することによってどの音声信号が支配的 であるかを検出することができる。ここで、空間伝播される信号成分は、ハウリングの 発生原因となる信号成分である。したがって、支配率算出部 16は、例えば図 13に示 す R1 ( ω )の経路で伝わる音が支配的なの力、あるいは R2 ( ω )の経路で伝わる音が 支配的なのかをハウリング発生前に検出することができる。そして、支配的である音 声信号ほどハウリングを発生させる危険度が高い。なお、音特性調整部 12、音混合 部 13、レベル検出部 14、語尾検出部 15、および支配率算出部 16は、本発明にお けるハウリング検出装置に相当するものである。そして、本発明におけるハウリング検 出装置は、上記支配率を算出することで、複数の音声信号それぞれについてハウリ ングを発生させる危険度を検出することができる。
[0061] なお、算出された支配率が語尾を検出するたびに所定の方式によって学習し更新 される仕組みにすれば、マイクロフォンの位置変化などによる支配率の逐次変化にも 対応できるようになる。また、支配率を学習するタイミングとしては、語尾が検出される たびに行うことに限定されず、推定の逐次性および正確性を考慮して適宜調整され てもよい。
[0062] ハウリング抑制部 17は、音混合部 13において混合された音声信号 Xm (t)に対し て、ハウリングを抑制する信号処理を行う。信号処理された音声信号は、適宜増幅さ れてスピーカ 18によって拡声される。以下、図 5を参照して、ハウリング抑制部 17の 処理方法について具体的に説明する。図 5は、ハウリング抑制部 17の構成の一例を 示すブロック図である。ここでは、図 5に示すように、 2入力型サブトラクシヨン構成を 採用している。 2入力型サブトラクシヨン構成は、雑音参照信号として拡声対象の音 声信号を用いることで、拡声対象の音声信号に含まれる語尾に応じて伝達特性を学 習しながら、ハウリングの発生を抑圧することができる。図 5において、ハウリング抑制 部 17は、第 1のパワースペクトル算出部 171、第 2のパワースペクトル算出部 172、伝 達特性算出部 173、逆フーリエ変換部 174、および畳み込み部 175を有する。
[0063] 図 5において、第 1のパワースペクトル算出部 171は、音混合部 13から出力された 音声信号 Xm (t)を入力とし、音声信号 Xm (t)のパワースペクトル Χ( ω )を算出する。 第 2のパワースペクトル算出部 172は、雑音参照信号 Y(t)を入力とし、雑音参照信 号 Y(t)のパワースぺ外ル Υ( ω )を算出する。なお、雑音参照信号 Y(t)とする拡声 対象の音声信号は、例えばスピーカ 18において拡声される直前の音声信号である。 また例えば、スピーカ 18の近傍で拡声された音声をマイクロフォンなどで収音して生 成される音声信号であってもよ 、。
[0064] 伝達特性算出部 173は、まず、音声信号 Xm ( co )と雑音参照信号 Υ( ω )とに基づ V、て、パワースペクトル比率 Hr ( ω )を語尾検出部 15にお 、て検出された語尾の区 間でのみ推定する。パワースペクトル比率 Hr ( ω )は数式(8)で表現される。
[数 8]
Figure imgf000020_0001
なお、 εは平均を意味する。そして、伝達特性算出部 173は、数式 (8)で推定したパ ワースベクトル比率 Hr ( ω )に基づ!/、て、数式(9)に示す伝達特性 Hsup ( ω )を算出 する。
[数 9]
このように、本発明において、 Hsup ( ω )は、語尾の区間に含まれる信号と同じ成 分を有する信号を除 、た音声信号 Xm (t)を推定する関数である。
[0065] 次に、伝達特性算出部 173は、数式 9で算出した Hsup(co)に、支配率算出部 16 で算出された各音声信号のループゲインおよび支配率に基づいて得られるループ ゲインの和の変化率を乗算して、 Hsup(co)を算出する。以下、 Hsup(co)の算出方 法について説明する。
[0066] 例えば、ユーザが音特性調整部 12および音混合部 13にお 、てミキサ操作を行つ て、音声信号 XI (t)および X2 (t)の周波数やゲインの特性をそれぞれ変更したとす る。この操作に応じて、音声信号 Xml (t)における周波数やゲインの特性 Ml ( ω )と 、音声信号 Xm2 (t)における周波数やゲインの特性 M2 ( ω )とが変化する。このとき 、数式 7に示すように、ループゲイン Gl(co)および G2(co)も変化する。ここで、ミキ サ操作前に支配率算出部 16で算出されたループゲイン G1 ( ω )の支配率がループ ゲイン G2(co)よりも高いとする。また、ミキサ操作後に支配率算出部 16で算出された ループゲイン G1 ( ω )をループゲイン Glnew( ω )とし、ミキサ操作前に支配率算出 部 16で算出されたループゲイン G1 ( ω )をループゲイン Glold ( ω )とする。また、ミ キサ操作後に支配率算出部 16で算出されたループゲイン G2 ( ω )をループゲイン G 2 ew(ω )とし、ミキサ操作前に支配率算出部 16で算出されたループゲイン G2 ( ω ) をループゲイン G2old ( ω )とする。
[0067] このとき、ミキサ操作前に支配率算出部 16で算出されたループゲインの和は、 Glo ld(co) + G2old(co)となる。これに対し、ミキサ操作後に支配率算出部 16で算出さ れるループゲインの和は、ミキサ操作前に算出された支配率のうち、最も高い支配率 のループゲインのみを考慮した和とする。つまり上述では、ループゲイン G1 ( ω )の 支配率がループゲイン G2 ( ω )より高 、としたので、ミキシング操作後に支配率算出 部 16で算出されたループゲインの和は Glnew(co) +G2old(co)となる。このとき、 ループゲインの和の変化率 Lr(co)は、数式 10となる。
[数 10]
. , 、 G1neWi. j) +G2oid (ω) . .
L r (ω) = ■ ■ ( 1 0)
G1o|d (ω) +G 2olcl ( W )
[0068] このように、支配率算出部 16で算出された各音声信号のループゲインおよび支配 率に基づいて、ループゲインの和の変化率 Lr(co)が求まる。つまり、ループゲインの 和の変化率 Lr ( ω )としては、支配率が最も高 、ループゲイン G1 ( ω )の変化に応じ て、ノレープゲインの和(G1 ( ω ) old+G2 ( ω ) old)が和(Gl ( ω ) new+G2 ( ω ) old) に変化したことが予想できる。なお、上述では支配率が最も高いループゲインのみ、 ループゲインの和に反映させるとした。これは、ユーザのミキサ操作として、 2つ以上 の音声信号のゲインを同時に変更したりする操作は稀であるため、ループゲインの和 の変化率 Lr(co)が支配率の高いものだけに追随するものであっても、ロバストなハウ リングの抑制を行うことができることに基づいている。このように、支配率が最も高いル ープゲインを、ループゲインの和に反映させることで、複数の音声信号が入力される 場合であっても、ハウリングを発生させる危険度が高 、音声信号のみを考慮した効率 的、かつロバストなハウリング抑制を実現することができる。
[0069] 伝達特性算出部 173は、数式(10)に示すループゲインの和の変化率を数式(9) で算出した伝達特性 Hsup(co)に乗じて、和の変化率に応じた伝達特性 Hsup— ne w ( ω )を算出する。なお、伝達特性 Hsup ( ω )を Hsup_old ( ω )とし、和の変化率 に応じた伝達特性を Hsup— new(co)とする。このとき、和の変化率に応じた伝達特 性 Hsup_new(co)は、数式(11)で表現される。
[数 11]
Hsupnew(w) = L r (ω) * H supld (ω) ■ ■ ( 1 1 )
このように、本発明においては、和の変化率に応じた伝達特性 Hsup— new(co)は 、推定された関数である Hsup ( ω )— oldに和の変化率が乗算された伝達特性であ る。
[0070] 数式(11)で更新された Hsup— new(co)は、逆フーリエ変換部 174において、時 間軸上に変換される。この Hsup— new ( ω )の時間軸上に変換されたものをフィルタ 係数 Hsup— new(t)とする。畳み込み部 175は、フィルタ係数 Hsup— new (t)を音 混合部 13から入力される音声信号 Xm(t)に畳み込みこむことで、上記語尾検出部 1 5において検出された語尾の区間のみの信号と同じ成分のみを含む信号を音声信 号 Xm(t)から減算する。なお、 Hsup(co)の算出(数式 9)および更新 (数式 11)は、 語尾検出部 15において語尾が検出されたときに行われる。また、 Hsup(co)の算出( 数式(9)および数式(11) )の学習は、例えば語尾を検出するたびに所定の方式によ つて行うようにしてもよい。
[0071] 以上のように、本実施形態によれば、支配率算出部 16において各音声信号のル ープゲインおよび支配率を算出して、当該支配率に基づ!、たループゲインの和の変 化率を用いた伝達特性を算出する。また、当該支配率は、音特性調整部 12の出力 信号に基づいて算出されるので、音特性調整部 12において調整される周波数ゃゲ インの特性に連動した値である。これにより、複数の音声信号を混合して拡声する拡 声システムにお 、て、上記支配率に基づ 、てハウリング抑制に用いる伝達特性を算 出することで、音特性調整部 12よる伝達特性の急激な変化に対してロバストなハウリ ングの抑制を行うことができる。つまり、ユーザのミキサ操作による Μ ( ω )の急激な変 化に対して、ロバストなハウリングの抑制を実現することができる。
[0072] なお、上述では、ミキサ操作前に支配率算出部 16で算出した支配率のうち、最も高 い支配率であるループゲインのみの時間変化分力 ループゲインの和を推定すると したが、これに限定されない。例えば、支配率が相対的に高い複数のループゲインを ループゲインの和に反映させてもよい。例えば、マイクロフォンが 3つあるとし、それぞ れのループゲインを G1 ( ω )、 G2 ( ω )、および G3 ( ω )とする。そして、ミキサ操作前 の支配率の関係が、ループゲイン G1 ( ω )および G2 ( ω )がループゲイン G3 ( ω )より 高 、とする。そして、ループゲイン G1 ( ω )および G2 ( ω )をループゲインの和(G1 ( ω ) + G2 ( ω ) + G3 ( ω ) )に反映させてもょ 、。このとき、ループゲインの和の変化率 Lr ( co )は、数式 12となる。
[数 12]
■ 、 1 nevA tu) +G 2new( w +G3old ( ω )
L r ( ύϋ ) =— : ~ , . ^ ~~ Γ-— ; ~ - ■ ■ ( 1 2 )
Gidd ( ω) +G 2old ( w ) +G3o|d ( ω )
また、伝達特性算出部 173は、支配率算出部 16で算出された支配率を用いて、当 該支配率を各音声信号のループゲインそれぞれに反映させて、ループゲインの和の 変化率を求めてもよい。また例えば、伝達特性算出部 173は、支配率に基づいて、 ループゲインの和の変化率以外の他の方法でノヽゥリング抑制に用いる伝達特性を算 出してもよい。
[0073] なお、上述した拡声システム 1においては、 2つの音声信号が入力された場合につ いて説明したが、これに限定されない。例えば、 3つ以上のマイクロフォンを有して 3 つ以上の音声信号が入力される場合であってもよい。また、上述したハウリング抑制 部 17において、サブトラクシヨンの具体的構成を図 5に示した力 これに限定されな い。畳み込みによるフィルタ方式以外のサブトラクシヨン手法も数多く知られており、こ れらの手法を用いる構成であってもよ 、。
[0074] また、上述では、レベル検出部 14では、各音声信号についてそれぞれ周波数分析 を行って、レベルをパワースペクトルとして算出した力 これに限定されない。例えば 、レベル検出部 14では、所定時間毎の各音声信号のパワーをスカラー値として算出 されてもよい。この場合、支配率算出部 16では、各音声信号の支配率はスカラー値 で算出される。また、ループゲインの和の変化率 Lr( co )もスカラー値で表現される。
[0075] (第 2の実施形態)
図 6を参照して、本発明における第 2の実施形態に係るハウリング検出方法および 抑制方法を採用した拡声システム 2について説明する。図 6は、拡声システム 2の構 成例を示すブロック図である。図 6において、拡声システム 2は、第 1のマイクロフォン l la、第 2のマイクロフォン l lb、音特性調整部 12、音混合部 13、レベル検出部 14、 ハウリング発生検出部 21、支配率算出部 16、ハウリング抑制部 22、およびスピーカ 1 8を有する。なお、第 1の実施形態においては、各音声信号の支配率を語尾区間で のみ算出するとしたが、本実施形態ではハウリングが検出されたときに算出する点で 異なる。以下、異なる点を中心に説明する。また、第 1の実施形態と同様に、拡声シ ステム 2は 3つ以上のマイクロフォンを用いて拡声するシステムでもよ!/、が、ここでは 2 つのマイクロフォンを用いて拡声する場合を想定して説明する。
[0076] 図 6において、第 1のマイクロフォン 11aは、スピーカ 18において拡声するための音 声を収音して音声信号を生成する。この第 1のマイクロフォン 11aで生成された音声 信号を XI (t)とする。また、第 2のマイクロフォン l ibでも同様に、拡声するための音 声を収音して音声信号 X2 (t)を生成する。音特性調整部 12は、音声信号 XI ( お よび X2 (t)を入力とし、当該音声信号の周波数やゲインの特性をそれぞれ調整する 。そして、周波数やゲインの特性を調整された音声信号 Xml (t)および Xm2 (t)は、 当該音混合部 13において混合される。また、レベル検出部 14は、音特性調整部 12 力 出力される音声信号 Xml (t)および Xm2 (t)の各レベルを検出する。そして、レ ベル検出部 14で検出された各所定時間における帯域毎のレベルの情報は、全て支 配率算出部 16に出力される。ここまでの処理は、上述した第 1の実施形態と同様で ある。
[0077] ハウリング発生検出部 21は、音混合部 13で混合された音声信号 Xm (t)のパワー スペクトル Xm ( co )を算出して、ハウリングの発生を検出する。例えば特定周波数 fに おいてハウリングが発生すると仮定すると、音声信号 Xm(t)のパワースペクトル Χ( ω )は、図 13で示したように特定周波数 fにおいてパワーが急激に増加するように変化 する。そこで、隣接する帯域間のパワーの差分を常に観察することで、特定周波数 f が含まれる帯域のパワーが急激に増カロしたことが検出される。つまり、音声信号 Xm( t)のパワースペクトル Χ( ω )を観察して、ハウリングの初期発生 (ノヽゥリングが起こりか 力つている状態)を検出する。そして、ハウリング発生検出部 21で検出されたハウリン グの初期発生時の情報は、支配率算出部 16に出力される。
[0078] 支配率算出部 16は、レベル検出部 14から出力された各音声信号のレベルと、ハウ リング発生検出部 21において検出された情報とに基づいて、入力された複数の音声 信号(図 6では、 Xml (t)および Xm2 (t) )の支配率をそれぞれ算出する。なお、支配 率算出部 16は、ハウリング発生検出部 21においてハウリングの初期発生が検出され たときの支配率の算出処理を行う。そして、レベル検出部 14で算出されたレベルのう ち、ハウリングの初期発生が検出されたときのパワースペクトルがループゲイン Gとな る。以下、支配率の具体的な算出方法は、第 1の実施形態と同様であるので説明を 省略する。また、本実施形態においては、支配率算出部 16において各音声信号の 支配率が算出されることで、ハウリングの初期発生時において、どの音声信号が支配 的であるかを検出することができる。また、本実施形態における支配率とは、上述した 第 1の実施形態と同様に、複数の音声信号それぞれについてハウリングを発生させ る危険度を示すものである。このように、音特性調整部 12、音混合部 13、レベル検 出部 14、ハウリング発生検出部 21、および支配率算出部 16は、本発明におけるハ ゥリング検出装置に相当するものである。つまり、本発明におけるハウリング検出装置 は、上記支配率を算出することで、複数の音声信号それぞれについてハウリングを発 生させる危険度を検出することができる。
[0079] ハウリング抑制部 22は、音混合部 13において混合された音声信号 Xm (t)に対し て、ハウリングを抑制する信号処理を行う。そして、信号処理された音声信号は、適 宜増幅されてスピーカ 18によって拡声される。以下、図 7を参照して、ハウリング抑制 部 22の処理方法について説明する。図 7は、第 2の実施形態におけるハウリング抑 制部 22の構成の一例を示すブロック図である。図 7において、ハウリング抑制部 22は 、第 1のパワースペクトル算出部 171、第 2のパワースペクトル算出部 172、伝達特性 算出部 173、逆フーリエ変換部 174、畳み込み部 175、および語尾検出部 176を有 する。なお、上述したハウリング抑制部 17においては語尾検出部 15から語尾情報を 参照していた力 ハウリング抑制部 22は、語尾検出部 176を新たに備え、当該語尾 検出部 176から語尾情報を参照する点で異なる。以下、異なる点を中心に説明する
[0080] 図 7において、第 1のパワースペクトル算出部 171は、音混合部 13から出力された 音声信号 Xm (t)を入力とし、音声信号 Xm (t)のパワースペクトル Χ( ω )を算出する。 第 2のパワースペクトル算出部 172は、雑音参照信号 Y(t)を入力とし、雑音参照信 号 Y (t)のパワースペクトル Y ( ω )を算出する。
[0081] 語尾検出部 176は、上述した語尾検出部 15と同様の機能を有する。語尾検出部 1 76は、音混合部 13から入力される音声信号 Xm (t)と、雑音参照信号 Y(t)とに基づ いて、雑音参照信号 Y(t)に対する音声信号 Xm (t)の音声区間の遅延区間を語尾と して検出する。なお、雑音参照信号 Y(t)としては、上述した第 1の実施形態と同様に 、例えばスピーカ 18において拡声される直前の音声信号などである。また、図 7にお いて、語尾検出部 176は、ハウリング抑制部 17の内部に構成するものとした力 ハウ リング抑制部 17の外部にあってもよい。また、ハウリング抑制部 17と語尾検出部 176 は別体として、ハウリング抑制部 17が語尾検出部 176で検出される情報を入力する ようにしてもよい。
[0082] 伝達特性算出部 173は、まず、音声信号 Xm ( co )と雑音参照信号 Υ( ω )とに基づ V、て、数式 8で示すパワースペクトル比率 Hr ( ω )を語尾検出部 176にお 、て検出さ れた語尾の区間でのみ推定する。そして、伝達特性算出部 173は、数式 8で推定し たパワースペクトル比率 Hr ( ω )に基づ!/、て、数式(9)に示す伝達特性 Hsup ( ω )を 算出する。次に、伝達特性算出部 173は、数式 (9)で算出した伝達特性 Hsup ( co ) に、支配率算出部 16で算出された各音声信号のループゲインおよび支配率に基づ V、て得られるループゲインの和の変化率を乗算して、変化率に応じた伝達特性 Hsu p ( ω )— newを算出する。そして、数式 11で算出された変化率に応じた伝達特性 Hs up_new( co )は、逆フーリエ変換部 174において、時間軸上に変換される。畳み込 み部 175は、この時間軸上に変換されたフィルタ係数 Hsup— new (t)を音混合部 1 3から入力される音声信号 Xm (t)に畳み込み、上記語尾検出部 15において検出さ れた語尾の区間のみの信号と同じ成分のみを含む信号を音声信号 Xm (t)カゝら減算 する。この場合、変化率に応じた伝達特性 Hsup ( ω )— newは、ハウリングの初期発 生時のループゲインを用いて求められるループゲインの和の変化率に基づ 、て 、る 。このため、ハウリングの初期発生が起こっている音声信号およびその周波数成分を 考慮したハウリング抑制を行うことができる。
[0083] なお、本実施形態においては、 Hsup ( ω )の算出(数式(9) )は、語尾検出部 176 にお 、て語尾が検出されたときに行われる。支配率に基づ 、たループゲインの和の 変化率による Hsup ( ω )の更新 (数式(11) )は、ハウリング発生検出部 21でハウリン グの初期発生が検出されたときに行われる。また、数式 9で算出された Hsup ( ω )の 学習は、例えば語尾が検出されるたびに所定の方式によって行うようにしてもよい。ま た、数式 11で算出される Hsup ( co )の学習は、例えばハウリングの初期発生を検出 するたびに所定の方式によって行うようにしてもょ 、。
[0084] 以上のように、本実施形態によれば、支配率算出部 16においてハウリングの初期 発生時の各音声信号のループゲインおよび支配率を算出する。そして、当該支配率 に基づいたループゲインの和の変化率で伝達特性を算出する。また、当該支配率は 、音特性調整部 12の出力信号に基づいて算出されるので、音特性調整部 12におい て調整される周波数やゲインの特性に連動した値である。これにより、複数の音声信 号を混合して拡声する拡声システムにお 、て、上記支配率に基づ 、てハウリング抑 制に用 ヽる伝達特性を算出することで、音特性調整部 12よる伝達特性の急激な変 化で発生するハウリングに対して、ロバストなハウリングの抑制を行うことができる。つ まり、ユーザのミキサ操作による M ( ω )の急激な変化によってハウリングが発生しか 力つても、ロバストなハウリングの抑制を実現することで、結果的にハウリングの発生を 防止することができる。
[0085] (第 3の実施形態)
図 8および図 9を参照して、本発明における第 3の実施形態に係るハウリング検出 方法を採用したハウリング警告装置について説明する。図 8は、ハウリング警告装置 の構成例を示すブロック図である。図 8において、ハウリング警告装置は、第 1のマイ クロフオン l la、第 2のマイクロフォン l lb、音特性調整部 12、音混合部 13、レベル検 出部 14、語尾検出部 15、支配率算出部 16、スピーカ 18、およびハウリング警告部 3 1を有する。
[0086] 図 9は、ハウリング発生検出部 21を用いたハウリング警告装置の構成例を示すプロ ック図である。図 9において、ハウリング警告装置は、第 1のマイクロフォン l la、第 2の マイクロフォン l lb、音特性調整部 12、音混合部 13、レベル検出部 14、ハウリング発 生検出部 21、支配率算出部 16、スピーカ 18、およびノヽゥリング警告部 31を有する。 図 8および図 9に示すように、本実施形態では、上述した第 1および第 2の実施形態 におけるハウリング抑制部 17および 22に代わって、ハウリング警告部 31を備える点 で異なる。換言すれば、上述した本発明におけるハウリング検出装置にハウリング警 告部 31を備えたものである。以下、異なる点を中心に説明する。また、第 1のマイクロ フォン l la、第 2のマイクロフォン l lb、音特性調整部 12、音混合部 13、レベル検出 部 14、語尾検出部 15、支配率算出部 16、ハウリング発生検出部 21、およびスピー 力 18は、上述した第 1および第 2の実施形態と同様であるので、同一の符号を付して 説明を省略する。
[0087] 図 8において、ハウリング警告部 31は、支配率算出部 16において算出された語尾 区間に基づく支配率に応じて、どの音声信号が原因でハウリングが発生する危険が ある力をユーザに警告する。警告するための表示手段としては、例えば音声信号の 周波数やゲインの特性を調整するミキサの各チャンネルにランプを設置して、ハウリ ングが発生する可能性があるチャンネルに対して点滅などさせる手段などがある。そ して、例えば支配率が最も高い (ハウリングを発生させる危険度が高い)音声信号の チャンネルのランプを点滅させる。また、例えば支配率が高い複数のチャンネルのラ ンプを点滅させてもよい。また、支配率が周波数帯域毎に算出される場合には、各チ ヤンネルに対して周波数帯域ごとのランプを設け、帯域毎にランプを点滅させてもよ い。また、表示手段としては、上記ランプに限らず、ディスプレイ上に表示するもので あってもよいし、その他の表示手段であってもよい。また、警告するだけではなぐ警 告に応じて自動的に音特性調整部 12で音特性を変更し (例えば、ゲインが下げ)、 ハウリングを未然に防止するようにしてもょ 、。
[0088] また、図 9に示すように、ハウリングの初期発生に基づく支配率に応じて、どの音声 信号が原因でハウリングが発生する危険があるかをユーザに警告するものであっても よい。図 9において、ハウリング警告部 31は、支配率算出部 16において算出された ノ、ゥリングの初期発生に基づく支配率を参照することで、どの音声信号でハウリング の初期発生が起きているかをユーザに警告することができる。
[0089] 以上のように、本実施形態では、ハウリング警告部 31において、支配率算出部 16 において算出された支配率に応じて、どの音声信号が原因でハウリングが発生する 危険がある力、またはどの音声信号でハウリングの初期発生が起きて 、るかをユーザ に警告する。これにより、ユーザは、入力される音声信号が複数あっても、ハウリング の発生を未然に防止しながら、ミキサ操作などを各音声信号に対して行うことができ る。
[0090] また、上述した第 1〜第 3の実施形態で説明した各構成部のうち少なくとも一部の 構成は、集積回路でも実現可能である。以下、各実施形態について具体例を説明す る。上述した第 1の実施形態で説明したレベル検出部 14、語尾検出部 15、支配率算 出部 16、およびハウリング抑制部 17は、例えば、音特性調整部 12から出力される音 声信号(図 1では、 Xml (t)および Xm2 (t) )、音混合部 13から出力される音声信号( 図 1では、 Xm(t) )、および雑音参照信号 (図 1では、 Y(t) )を入力とし、音声信号処 理結果を適宜増幅部などで増幅して、スピーカ 18へ出力する集積回路でも実現可 能である。また、上述した第 2の実施形態で説明したレベル検出部 14、ハウリング発 生検出部 21、支配率算出部 16、およびハウリング抑制部 17は、例えば、音特性調 整部 12から出力される音声信号(図 6では、 1111 (1 ぉょび 1112 ( )、音混合部13 力も出力される音声信号(図 6では、 Xm (t) )、および雑音参照信号(図 6では、 Y(t) )を入力とし、音声信号処理結果を適宜増幅部などで増幅して、スピーカ 18へ出力 する集積回路でも実現可能である。また、上述した第 3の実施形態の図 8において説 明したレベル検出部 14、語尾検出部 15、および支配率算出部 16は、例えば、音特 性調整部 12から出力される音声信号(図 8では、 Xml (t)および Xm2 (t) )と、音混 合部 13から出力される音声信号(図 8では、 Xm (t) )とを入力とし、音声信号処理結 果をハウリング警告部 31へ出力する集積回路でも実現可能である。また、上述した 第 3の実施形態の図 9において説明したレベル検出部 14、ハウリング発生検出部 21 、および支配率算出部 16は、例えば、音特性調整部 12から出力される音声信号 (図 9では、 Xml (t)および Xm2 (t) )と、音混合部 13から出力される音声信号(図 9では 、 Xm (t) )とを入力とし、音声信号処理結果をハウリング警告部 31へ出力する集積回 路でも実現可能である。このように上述した第 1〜第 3の実施形態では、上述した各 機能を果たす電気回路を 1つの小型パッケージに集積して、例えば音声信号処理回 路 DSP (Digital Signal Processor)等を構成することによって、本発明の実現が 可能となる。
産業上の利用可能性
本発明にかかるハウリング検出装置およびその方法は、支配率を算出することで、 複数の音声信号それぞれについて、ハウリングを発生させる危険度を検出することが 可能な複数の音声信号を混合して拡声する拡声システムや、音声ミキサ機能つき P A装置等にも有用である。

Claims

請求の範囲
[1] 複数のマイクロフォン力 収音されたそれぞれの音声信号を音混合部で混合した 混合信号をスピーカで拡声するときに発生するハウリングに対して、当該音声信号そ れぞれに対してハウリングを発生させる危険度を示す支配率を検出するハウリング検 出装置であって、
複数の前記音声信号のレベルをそれぞれ検出するレベル検出部と、
前記スピーカで拡声される音響に関する信号を雑音参照信号として当該雑音参照 信号と前記混合信号とを時系列的に比較し、当該雑音参照信号がたち下がった後 に当該混合信号が入力される時間を語尾の区間として検出する語尾検出部と、 前記レベル検出部が検出した複数の前記音声信号のレベルからそれぞれ前記語 尾の区間に応じたレベルのみを抽出し、当該複数の音声信号のレベルの総和に対 する各音声信号のレベルの比率を前記音声信号それぞれの支配率として算出する 支配率算出部とを備える、ハウリング検出装置。
[2] 前記ハウリング検出装置は、前記支配率を用いて算出された伝達特性に基づいて 、前記語尾の区間に含まれる信号と同じ成分を有する信号を前記混合信号カゝら減算 して前記スピーカに出力するハウリング抑制部を、さらに備える、請求項 1に記載のハ ゥリング検出装置。
[3] 前記ハウリング抑制部は、前記語尾の区間に含まれる信号と同じ成分を有する信 号を除いた前記混合信号を推定する関数を設定し、前記支配率に応じて前記総和 を更新し、当該更新前後の総和の変化率を前記関数に乗じて前記伝達特性を算出 することを特徴とする、請求項 2に記載のハウリング検出装置。
[4] 前記ハウリング抑制部は、相対的に高い支配率を示す音声信号のレベルのみを更 新して前記総和を更新することを特徴とする、請求項 3に記載のハウリング検出装置
[5] 前記ハウリング抑制部は、最も高い支配率を示す音声信号のレベルのみを更新し て前記総和を更新することを特徴とする、請求項 3に記載のハウリング検出装置。
[6] 前記ハウリング検出装置は、前記支配率算出部において算出された支配率が相対 的に高い音声信号を特定して、ユーザに通知するハウリング警告部をさらに備える、 請求項 1に記載のハウリング検出装置。
[7] 前記ハウリング検出装置は、前記支配率算出部において算出された支配率が最も 高い音声信号を特定して、ユーザに通知するハウリング警告部をさらに備える、請求 項 1に記載のハウリング検出装置。
[8] 前記レベル検出部は、複数の前記音声信号レベルをパワースペクトルでそれぞれ 検出することを特徴とする、請求項 1に記載のハウリング検出装置。
[9] 複数のマイクロフォン力 収音されたそれぞれの音声信号を音混合部で混合した 混合信号をスピーカで拡声するときに発生するハウリングに対して、当該音声信号そ れぞれに対してハウリングを発生させる危険度を示す支配率を検出するハウリング検 出装置であって、
複数の前記音声信号のレベルをそれぞれ検出するレベル検出部と、
前記混合信号のパワースペクトルを算出して、当該パワースペクトルの変化に基づ いてハウリングの発生を検出するハウリング発生検出部と、
前記レベル検出部が検出した複数の前記音声信号のレベルからそれぞれ前記ハ ゥリングの発生が検出されたときのレベルのみを抽出し、当該複数の音声信号のレべ ルの総和に対する各音声信号のレベルの比率を前記音声信号それぞれの支配率と して算出する支配率算出部とを備える、ハウリング検出装置。
[10] 前記ハウリング検出装置は、
前記スピーカで拡声される音響に関する信号を雑音参照信号として当該雑音参 照信号と前記混合信号とを時系列的に比較し、当該雑音参照信号がたち下がった 後に当該混合信号が入力される時間を語尾の区間として検出する語尾検出部と、 前記支配率を用いて算出された伝達特性に基づ!、て、前記語尾の区間に含まれ る信号と同じ成分を有する信号を前記混合信号力 減算して前記スピーカに出力す るハウリング抑制部とを、さらに備える、請求項 9に記載のハウリング検出装置。
[11] 前記ハウリング抑制部は、前記語尾の区間に含まれる信号と同じ成分を有する信 号を除いた前記混合信号を推定する関数を前記語尾の区間が検出されたときに設 定し、前記支配率に応じて前記総和を更新し、当該更新前後の総和の変化率を前 記関数に乗じて前記伝達特性を前記ハウリングの発生が検出されたときに算出する ことを特徴とする、請求項 10に記載のハウリング検出装置。
[12] 前記ハウリング抑制部は、相対的に高い支配率を示す音声信号のレベルのみを更 新して前記総和を更新することを特徴とする、請求項 11に記載のハウリング検出装 置。
[13] 前記ハウリング抑制部は、最も高い支配率を示す音声信号のレベルのみを更新し て前記総和を更新することを特徴とする、請求項 11に記載のハウリング検出装置。
[14] 前記ハウリング検出装置は、前記支配率算出部において算出された支配率が相対 的に高い音声信号を特定して、ユーザに通知するハウリング警告部をさらに備える、 請求項 9に記載のハウリング検出装置。
[15] 前記ハウリング検出装置は、前記支配率算出部において算出された支配率が最も 高い音声信号を特定して、ユーザに通知するハウリング警告部をさらに備える、請求 項 9に記載のハウリング検出装置。
[16] 前記レベル検出部は、複数の前記音声信号レベルをパワースペクトルでそれぞれ 検出することを特徴とする、請求項 9に記載のハウリング検出装置。
[17] 複数のマイクロフォン力 収音されたそれぞれの音声信号を音混合ステップで混合 した混合信号をスピーカで拡声するときに発生するハウリングに対して、当該音声信 号それぞれに対してハウリングを発生させる危険度を示す支配率を検出するハウリン グ検出方法であって、
複数の前記音声信号のレベルをそれぞれ検出するレベル検出ステップと、 前記スピーカで拡声される音響に関する信号を雑音参照信号として当該雑音参照 信号と前記混合信号とを時系列的に比較し、当該雑音参照信号がたち下がった後 に当該混合信号が入力される時間を語尾の区間として検出する語尾検出ステップと 前記レベル検出ステップが検出した複数の前記音声信号のレベル力 それぞれ前 記語尾の区間に応じたレベルのみを抽出し、当該複数の音声信号のレベルの総和 に対する各音声信号のレベルの比率を前記音声信号それぞれの支配率として算出 する支配率算出ステップとを含む、ハウリング検出方法。
[18] 複数のマイクロフォン力 収音されたそれぞれの音声信号を音混合ステップで混合 した混合信号をスピーカで拡声するときに発生するハウリングに対して、当該音声信 号それぞれに対してハウリングを発生させる危険度を示す支配率を検出するハウリン グ検出方法であって、
複数の前記音声信号のレベルをそれぞれ検出するレベル検出ステップと、 前記混合信号のパワースペクトルを算出して、当該パワースペクトルの変化に基づ いてハウリングの発生を検出するハウリング発生検出ステップと、
前記レベル検出ステップが検出した複数の前記音声信号のレベル力 それぞれ前 記ハウリングの発生が検出されたときのレベルのみを抽出し、当該複数の音声信号 のレベルの総和に対する各音声信号のレベルの比率を前記音声信号それぞれの支 配率として算出する支配率算出ステップとを含む、ハウリング検出方法。
PCT/JP2005/010959 2004-06-16 2005-06-15 ハウリング検出装置およびその方法 WO2005125273A1 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2006514765A JP4675888B2 (ja) 2004-06-16 2005-06-15 ハウリング検出装置およびその方法
US11/579,133 US7912230B2 (en) 2004-06-16 2005-06-15 Howling detection device and method
CN2005800138788A CN1951147B (zh) 2004-06-16 2005-06-15 啸声检测设备和方法

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2004-177859 2004-06-16
JP2004177859 2004-06-16

Publications (1)

Publication Number Publication Date
WO2005125273A1 true WO2005125273A1 (ja) 2005-12-29

Family

ID=35510156

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2005/010959 WO2005125273A1 (ja) 2004-06-16 2005-06-15 ハウリング検出装置およびその方法

Country Status (4)

Country Link
US (1) US7912230B2 (ja)
JP (1) JP4675888B2 (ja)
CN (1) CN1951147B (ja)
WO (1) WO2005125273A1 (ja)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007274641A (ja) * 2006-03-31 2007-10-18 Yamaha Corp 音響処理装置
JP2007274640A (ja) * 2006-03-31 2007-10-18 Yamaha Corp 音響処理装置
JP2009188442A (ja) * 2008-02-01 2009-08-20 Iwate Univ ハウリング抑制装置、ハウリング抑制方法及びハウリング抑制プログラム
WO2010035760A1 (ja) * 2008-09-24 2010-04-01 ヤマハ株式会社 ループゲイン推定装置およびハウリング防止装置
JP2010081085A (ja) * 2008-09-24 2010-04-08 Yamaha Corp ハウリング防止装置、マイクロフォン、ミキサ、およびアダプタ
JP2010130070A (ja) * 2008-11-25 2010-06-10 Yamaha Corp ループゲイン推定装置
JP2010157806A (ja) * 2008-12-26 2010-07-15 Yamaha Corp ハウリング防止装置
JP2010245992A (ja) * 2009-04-09 2010-10-28 Yamaha Corp ハウリング防止装置
JP2010263600A (ja) * 2009-04-09 2010-11-18 Yamaha Corp ハウリング防止装置
WO2011007812A1 (ja) * 2009-07-17 2011-01-20 ヤマハ株式会社 ハウリングキャンセラ
US9002029B2 (en) 2009-07-17 2015-04-07 Yamaha Corporation Howling canceller
WO2019160006A1 (ja) * 2018-02-16 2019-08-22 日本電信電話株式会社 ハウリング抑圧装置、その方法、およびプログラム
CN118016042A (zh) * 2024-04-09 2024-05-10 成都启英泰伦科技有限公司 一种啸叫抑制方法及装置

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101199233B (zh) * 2005-05-18 2012-01-18 松下电器产业株式会社 颤噪控制装置和音响装置
EP1923866B1 (en) * 2005-08-11 2014-01-01 Asahi Kasei Kabushiki Kaisha Sound source separating device, speech recognizing device, portable telephone, sound source separating method, and program
US8478587B2 (en) * 2007-03-16 2013-07-02 Panasonic Corporation Voice analysis device, voice analysis method, voice analysis program, and system integration circuit
CN101897199B (zh) * 2007-12-10 2013-08-14 松下电器产业株式会社 拾音装置、拾音方法
JP5157778B2 (ja) * 2008-09-18 2013-03-06 富士通株式会社 監視装置、監視方法及びコンピュータプログラム
US8996365B2 (en) * 2009-03-19 2015-03-31 Yugengaisya Cepstrum Howling canceller
JP2011103505A (ja) * 2009-11-10 2011-05-26 Seiko Epson Corp 画像表示装置および制御方法
US8891786B1 (en) * 2010-05-17 2014-11-18 Marvell International Ltd. Selective notch filtering for howling suppression
US8781821B2 (en) * 2012-04-30 2014-07-15 Zanavox Voiced interval command interpretation
WO2014094242A1 (en) 2012-12-18 2014-06-26 Motorola Solutions, Inc. Method and apparatus for mitigating feedback in a digital radio receiver
US20140272883A1 (en) * 2013-03-14 2014-09-18 Northwestern University Systems, methods, and apparatus for equalization preference learning
TWI508576B (zh) * 2013-05-15 2015-11-11 Lite On Opto Technology Changzhou Co Ltd 揚聲器異音檢測方法及裝置
US9984675B2 (en) 2013-05-24 2018-05-29 Google Technology Holdings LLC Voice controlled audio recording system with adjustable beamforming
US9269350B2 (en) * 2013-05-24 2016-02-23 Google Technology Holdings LLC Voice controlled audio recording or transmission apparatus with keyword filtering
CN103391496B (zh) * 2013-07-16 2016-08-10 歌尔声学股份有限公司 应用于主动噪声消除anr耳机的啸叫抑制方法和装置
US9812150B2 (en) 2013-08-28 2017-11-07 Accusonus, Inc. Methods and systems for improved signal decomposition
US10468036B2 (en) * 2014-04-30 2019-11-05 Accusonus, Inc. Methods and systems for processing and mixing signals using signal decomposition
EP3163903B1 (en) * 2015-10-26 2019-06-19 Nxp B.V. Accoustic processor for a mobile device
JP6809936B2 (ja) * 2017-02-28 2021-01-06 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 雑音抽出装置およびマイクロホン装置
US20210351952A1 (en) * 2017-06-12 2021-11-11 Audio-Technica Corporation Data transmission device and data transmission system

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0833091A (ja) * 1994-07-18 1996-02-02 Roland Corp ハウリング予知装置
JPH08223274A (ja) * 1995-02-15 1996-08-30 Matsushita Electric Works Ltd ハンズフリー通話装置
JP2002223182A (ja) * 2000-11-22 2002-08-09 Nippon Telegr & Teleph Corp <Ntt> 反響消去方法、その装置、そのプログラム及びその記録媒体
JP2002237769A (ja) * 2001-02-08 2002-08-23 Nippon Telegr & Teleph Corp <Ntt> 多チャネル反響抑圧方法、その装置、そのプログラム及びその記録媒体
JP2003250193A (ja) * 2002-02-25 2003-09-05 Nippon Telegr & Teleph Corp <Ntt> 反響消去方法、この方法を実施する装置、プログラムおよびその記録媒体
JP2003284183A (ja) * 2002-03-20 2003-10-03 Nippon Telegr & Teleph Corp <Ntt> 反響抑圧装置、反響抑圧方法及びプログラム

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03237899A (ja) * 1990-02-15 1991-10-23 Yamaha Corp ハウリング抑制装置
JPH0771139B2 (ja) 1991-02-28 1995-07-31 松下電器産業株式会社 拡声通話装置
JP2560923B2 (ja) 1991-03-05 1996-12-04 ヤマハ株式会社 ハウリングキャンセル装置
JP3516227B2 (ja) * 1997-11-10 2004-04-05 ヤマハ株式会社 ハウリング抑止装置
JP4681163B2 (ja) * 2001-07-16 2011-05-11 パナソニック株式会社 ハウリング検出抑圧装置、これを備えた音響装置、及び、ハウリング検出抑圧方法
JP3984842B2 (ja) * 2002-03-12 2007-10-03 松下電器産業株式会社 ハウリング制御装置
WO2005125272A1 (ja) * 2004-06-16 2005-12-29 Matsushita Electric Industrial Co., Ltd. ハウリング抑圧装置、プログラム、集積回路、およびハウリング抑圧方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0833091A (ja) * 1994-07-18 1996-02-02 Roland Corp ハウリング予知装置
JPH08223274A (ja) * 1995-02-15 1996-08-30 Matsushita Electric Works Ltd ハンズフリー通話装置
JP2002223182A (ja) * 2000-11-22 2002-08-09 Nippon Telegr & Teleph Corp <Ntt> 反響消去方法、その装置、そのプログラム及びその記録媒体
JP2002237769A (ja) * 2001-02-08 2002-08-23 Nippon Telegr & Teleph Corp <Ntt> 多チャネル反響抑圧方法、その装置、そのプログラム及びその記録媒体
JP2003250193A (ja) * 2002-02-25 2003-09-05 Nippon Telegr & Teleph Corp <Ntt> 反響消去方法、この方法を実施する装置、プログラムおよびその記録媒体
JP2003284183A (ja) * 2002-03-20 2003-10-03 Nippon Telegr & Teleph Corp <Ntt> 反響抑圧装置、反響抑圧方法及びプログラム

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007274641A (ja) * 2006-03-31 2007-10-18 Yamaha Corp 音響処理装置
JP2007274640A (ja) * 2006-03-31 2007-10-18 Yamaha Corp 音響処理装置
JP2009188442A (ja) * 2008-02-01 2009-08-20 Iwate Univ ハウリング抑制装置、ハウリング抑制方法及びハウリング抑制プログラム
WO2010035760A1 (ja) * 2008-09-24 2010-04-01 ヤマハ株式会社 ループゲイン推定装置およびハウリング防止装置
JP2010081085A (ja) * 2008-09-24 2010-04-08 Yamaha Corp ハウリング防止装置、マイクロフォン、ミキサ、およびアダプタ
US8917885B2 (en) 2008-09-24 2014-12-23 Yamaha Corporation Loop gain estimating apparatus and howling preventing apparatus
JP2010130070A (ja) * 2008-11-25 2010-06-10 Yamaha Corp ループゲイン推定装置
JP2010157806A (ja) * 2008-12-26 2010-07-15 Yamaha Corp ハウリング防止装置
JP2010263600A (ja) * 2009-04-09 2010-11-18 Yamaha Corp ハウリング防止装置
JP2010245992A (ja) * 2009-04-09 2010-10-28 Yamaha Corp ハウリング防止装置
WO2011007812A1 (ja) * 2009-07-17 2011-01-20 ヤマハ株式会社 ハウリングキャンセラ
US8995682B2 (en) 2009-07-17 2015-03-31 Yamaha Corporation Howling canceller
US9002029B2 (en) 2009-07-17 2015-04-07 Yamaha Corporation Howling canceller
WO2019160006A1 (ja) * 2018-02-16 2019-08-22 日本電信電話株式会社 ハウリング抑圧装置、その方法、およびプログラム
JPWO2019160006A1 (ja) * 2018-02-16 2021-02-04 日本電信電話株式会社 ハウリング抑圧装置、その方法、およびプログラム
JP7028307B2 (ja) 2018-02-16 2022-03-02 日本電信電話株式会社 ハウリング抑圧装置、その方法、およびプログラム
CN118016042A (zh) * 2024-04-09 2024-05-10 成都启英泰伦科技有限公司 一种啸叫抑制方法及装置
CN118016042B (zh) * 2024-04-09 2024-05-31 成都启英泰伦科技有限公司 一种啸叫抑制方法及装置

Also Published As

Publication number Publication date
US7912230B2 (en) 2011-03-22
CN1951147A (zh) 2007-04-18
CN1951147B (zh) 2011-08-17
US20080021703A1 (en) 2008-01-24
JPWO2005125273A1 (ja) 2008-04-17
JP4675888B2 (ja) 2011-04-27

Similar Documents

Publication Publication Date Title
WO2005125273A1 (ja) ハウリング検出装置およびその方法
US10332502B2 (en) Noise reducing device, noise reducing method, noise reducing program, and noise reducing audio outputting device
CN106664473B (zh) 信息处理装置、信息处理方法和程序
US8428274B2 (en) Apparatus and method for detecting acoustic feedback
US8831238B2 (en) Noise cancellation system
JP4681163B2 (ja) ハウリング検出抑圧装置、これを備えた音響装置、及び、ハウリング検出抑圧方法
US9269343B2 (en) Method of controlling an update algorithm of an adaptive feedback estimation system and a decorrelation unit
EP2700161B1 (en) Processing audio signals
CN105794228B (zh) 自适应残余反馈抑制
EP3669780B1 (en) Methods, devices and system for a compensated hearing test
WO2015184499A1 (en) Reducing instantaneous wind noise
JP2009118391A (ja) 音処理装置およびプログラム
EP2663979B1 (en) Processing audio signals
WO2006123495A1 (ja) ハウリング制御装置および音響装置
TW202133631A (zh) 揚聲器偏移預測及保護
JP4888163B2 (ja) カラオケ装置
JP2004032387A (ja) ハウリング制御装置及び補聴器
JP2008227681A (ja) 音響特性補正システム
JP4974713B2 (ja) カラオケ装置
JP2010178224A (ja) 補聴装置
JP4600105B2 (ja) ハウリングキャンセラ
JP2013005106A (ja) 場内拡声装置、場内拡声方法、及びそのプログラム
CN109905811A (zh) 一种经济型声反馈控制的方法及装置
JP2010056805A (ja) 拡声装置

Legal Events

Date Code Title Description
AK Designated states

Kind code of ref document: A1

Designated state(s): AE AG AL AM AT AU AZ BA BB BG BR BW BY BZ CA CH CN CO CR CU CZ DE DK DM DZ EC EE EG ES FI GB GD GE GH GM HR HU ID IL IN IS JP KE KG KM KP KR KZ LC LK LR LS LT LU LV MA MD MG MK MN MW MX MZ NA NG NI NO NZ OM PG PH PL PT RO RU SC SD SE SG SK SL SM SY TJ TM TN TR TT TZ UA UG US UZ VC VN YU ZA ZM ZW

AL Designated countries for regional patents

Kind code of ref document: A1

Designated state(s): BW GH GM KE LS MW MZ NA SD SL SZ TZ UG ZM ZW AM AZ BY KG KZ MD RU TJ TM AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HU IE IS IT LT LU MC NL PL PT RO SE SI SK TR BF BJ CF CG CI CM GA GN GQ GW ML MR NE SN TD TG

121 Ep: the epo has been informed by wipo that ep was designated in this application
WWE Wipo information: entry into national phase

Ref document number: 2006514765

Country of ref document: JP

WWE Wipo information: entry into national phase

Ref document number: 200580013878.8

Country of ref document: CN

WWE Wipo information: entry into national phase

Ref document number: 11579133

Country of ref document: US

NENP Non-entry into the national phase

Ref country code: DE

WWW Wipo information: withdrawn in national office

Country of ref document: DE

122 Ep: pct application non-entry in european phase
WWP Wipo information: published in national office

Ref document number: 11579133

Country of ref document: US