WO2002095975A1 - Appareil de traitement d'echos - Google Patents

Appareil de traitement d'echos Download PDF

Info

Publication number
WO2002095975A1
WO2002095975A1 PCT/JP2002/004860 JP0204860W WO02095975A1 WO 2002095975 A1 WO2002095975 A1 WO 2002095975A1 JP 0204860 W JP0204860 W JP 0204860W WO 02095975 A1 WO02095975 A1 WO 02095975A1
Authority
WO
WIPO (PCT)
Prior art keywords
echo
signal
frequency
low
digital signal
Prior art date
Application number
PCT/JP2002/004860
Other languages
English (en)
French (fr)
Inventor
Shinya Takahashi
Bunkei Matsuoka
Ikuo Kajiyama
Original Assignee
Mitsubishi Denki Kabushiki Kaisha
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Denki Kabushiki Kaisha filed Critical Mitsubishi Denki Kabushiki Kaisha
Priority to EP02771733A priority Critical patent/EP1300963A4/en
Priority to JP2002592318A priority patent/JPWO2002095975A1/ja
Priority to US10/333,224 priority patent/US6868158B2/en
Publication of WO2002095975A1 publication Critical patent/WO2002095975A1/ja

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/02Circuits for transducers, loudspeakers or microphones for preventing acoustic reaction, i.e. acoustic oscillatory feedback
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M19/00Current supply arrangements for telephone systems
    • H04M19/08Current supply arrangements for telephone systems with current supply sources at the substations
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M9/00Arrangements for interconnection not involving centralised switching
    • H04M9/08Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic
    • H04M9/082Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic using echo cancellers
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L2021/02082Noise filtering the noise being echo, reverberation of the speech
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/60Substation equipment, e.g. for use by subscribers including speech amplifiers
    • H04M1/6033Substation equipment, e.g. for use by subscribers including speech amplifiers for providing handsfree use or a loudspeaker mode in telephone sets
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/725Cordless telephones

Definitions

  • the present invention relates to an echo processing device that reduces acoustic echo output from sub power and input to a microphone via a reverberation path in voice communication of a vehicle-mounted phone, a mobile phone, or the like.
  • FIG. 1 is a block circuit diagram showing a configuration of a conventional echo processing apparatus.
  • 1 is a DZA converter for converting a digital received signal into an analog audio signal
  • 2 is an amplifier for amplifying an audio signal
  • 3 Is a speaker that outputs sound according to the amplified audio signal.
  • Reference numeral 4 denotes a microphone that converts the input sound into an audio signal
  • 5 denotes an amplifier that amplifies the audio signal
  • 6 denotes an A / D converter that converts the amplified audio signal into a digital signal.
  • is an echo canceller means for generating a pseudo echo signal based on the received signal and subtracting the pseudo echo signal from the output digital signal converted by the AZD converter 6 to remove one echo component.
  • the echo canceller means 7, 8 is an adaptive filter means for generating a pseudo echo signal based on the received signal, the output digital signal and the determination signal, and 9 is an addition for adding the output digital signal and the pseudo echo signal. It is a vessel.
  • Numeral 10 denotes a double talk detecting means for outputting a silent or double talk determination signal of the received signal to the echo canceller means 7 based on the received signal, the output digital signal and the transmission signal.
  • the digital signal sent from the far-end talker is used as the received signal, and the audio signal input from the near-end talker is amplified by the amplifier 5 and the output digital signal converted by the A / D converter 6.
  • a signal in which the echo component is suppressed by the echo canceller means 7 is defined as a transmission signal.
  • the received signal from the far-end speaker is input to the echo canceller means 7 and the double talk detection means 10, and is also converted into an analog signal, that is, a voice signal by the D / A converter 1, and is amplified by the amplifier 2.
  • the sound is output from speaker 3 as sound.
  • a part of the output from the speaker 3 is input to the microphone 4 through an echo path, and is mixed with an audio signal to be transmitted as an echo signal.
  • the adaptive filter means 8 calculates an adaptive filter coefficient using the received signal and the transmission signal to be fed back, and generates a pseudo echo signal.
  • the adder 9 subtracts the pseudo echo signal from the output digital signal, suppresses an echo component included in the output digital signal, and generates a transmission signal.
  • the adaptive filter coefficient is sequentially obtained and updated in order to cope with fluctuations in the echo path.
  • the double talk detecting means 10 determines whether or not the output digital signal is in a double talk state in which the echo signal and the voice signal of the near-end speaker are simultaneously included, and whether or not the received signal is silent. To the adaptive filter means 8 as a judgment signal. The adaptive filter means 8 stops updating the adaptive filter coefficient during double talk or when the received signal is silent, thereby preventing the calculation accuracy of the filter coefficient from deteriorating due to the double talk.
  • the method of double-talk detection in the double-talk detecting means 10 is disclosed, for example, in Japanese Patent Application Laid-Open No. H10-242,911, and is performed as follows. .
  • the double talk detecting means 10 is configured to output the average power S of the output digital signal, The average power X of the transmission signal and the average power E of the transmission signal are obtained, and double talk is detected by a combination of the following equations (1) to (3).
  • P i to p 3 in each equation are predetermined constants, which are determined according to the use environment.
  • equation (1) is not satisfied and equation (2) is satisfied, it is determined that a double torque is obtained.
  • Equation (3) it is determined that double talk is caused by a small amount of echo suppression and a large amount of input sound other than echo signals.
  • the conventional echo processing apparatus is configured as described above, the conventional echo processing apparatus shown in FIG.
  • the conventional echo processing apparatus shown in FIG. In a device, when low-frequency components that cannot be reproduced as sound are input to a speaker, vibration of high-frequency sound input at the same time may be disturbed, resulting in non-linear distortion. In this case, non-linear distortion occurs in the echo signal input from the microphone, the accuracy of calculating the adaptive filter coefficient in the adaptive filter means 8 deteriorates, and the generated pseudo echo signal and the echo signal are reduced. There was a problem that the difference became large and the amount of echo suppression was reduced. ,
  • Japanese Patent Application Laid-Open No. Hei 6-22069 discloses a high-pass filter before a spin force.
  • a method has been proposed in which a low frequency region component that cannot be reproduced by the beeker is inserted in advance. Applying this method to the conventional echo processor shown in Fig. 1 and introducing a high-pass filter between the DZA converter 1 and the amplifier 2 can be considered.
  • the characteristics of the received signal input to 8 and the echo signal output from loudspeaker 3 and input to microphone 4 in the low frequency band greatly differ. This is because the received signal has low frequency region components but the echo signal does not.
  • the calculation accuracy of the adaptive filter coefficient in the adaptive filter means 8 deteriorates, the difference between the generated pseudo echo signal and the echo signal increases, and the echo suppression amount decreases.
  • the double talk detecting means 10 of the conventional echo processor shown in FIG. 1 determines whether S and X in equation (2) have close values, or that S and E in equation (3) are close. If you do, you may make a mistake in determining double talk. For example, if the value of p 2 in equation (2) is set low so that it is easy to judge a double-talk in order to prevent the adaptive filter coefficient from being erroneously updated, the single talk (only the received signal) (X is large), but when the distance between the speaker 3 and the microphone 4 is short, or when the amplification values of the amplifiers 2 and 5 are large, the power of the echo signal mixed into the output digital signal increases. S is large), it may be erroneously determined as double talk.
  • the conventional echo processing device it is difficult to clearly determine the single talk and the double talk, and the determination may be erroneous. As a result, the stop and start times of the update of the adaptive filter coefficient may be incorrectly adapted. There was a problem that the calculation accuracy of the fill coefficient was degraded and the echo suppression amount was reduced.
  • the present invention has been made to solve the above problems, and reduces a non-linear distortion of a sound output from a spurious force, prevents a deterioration in calculation accuracy of an adaptive filter coefficient, and generates a pseudo echo signal and an acoustic echo. It is an object of the present invention to obtain an echo processing device that reduces the difference between the two and reduces the amount of echo suppression. Also, the present invention provides an echo processing that accurately determines double talk, correctly stops and starts updating of the adaptive filter coefficient, prevents deterioration in the calculation accuracy of the adaptive filter coefficient, and prevents a decrease in the amount of echo suppression. The purpose is to obtain the device. Disclosure of the invention
  • An echo processing device includes: a high-pass filter that suppresses a low-frequency component of a received signal formed of a digital signal; a DZA converter that converts a low-band suppressed received signal that has passed through the high-pass filter into an audio signal.
  • a speaker that outputs sound based on the audio signal, a microphone to which an echo of the sound output from the speaker may be input, and a conversion of the audio signal output from the microphone into a digital signal.
  • a pseudo echo signal is generated based on the AZD converter and the low-frequency-suppressed received signal obtained through the high-pass filter, and the pseudo echo signal is subtracted from the digital signal output by the AZD converter.
  • an echo canceller means for generating a transmission signal.
  • the nonlinear distortion of the sound output from the speaker can be reduced, and the acoustic echo mixed into the digital signal output by the A / D converter and the low-frequency suppressed reception signal input to the echo canceller means can be reduced.
  • the accuracy of calculating the adaptive filter coefficient by the echo canceller is prevented from deteriorating, and the difference between the pseudo echo signal and the acoustic echo is reduced. This has the effect of preventing a reduction in the amount of echo suppression.
  • An echo processing device comprises: a high-pass filter for suppressing a low frequency domain component of a reception signal formed of a digital signal; and a D / A conversion for converting a low-frequency suppression reception signal having passed through the high-pass filter into an audio signal.
  • a high-pass filter for suppressing a low frequency domain component of a reception signal formed of a digital signal
  • a D / A conversion for converting a low-frequency suppression reception signal having passed through the high-pass filter into an audio signal.
  • a speech force for outputting sound based on the audio signal
  • a microphone to which an echo of the sound output from the speaker may be input
  • an AZD for converting the audio signal output from the microphone into a digital signal
  • a pseudo-echo signal based on the low-pass suppressed reception signal obtained by passing through the high-pass filter, and subtracting the pseudo-echo signal from the digital signal output by the A / D converter.
  • An echo canceller means for generating a transmission signal by extracting a low frequency domain component of the digital signal output by the AZD converter, performing a double talk determination based on the low frequency domain component, and performing a double talk determination based on the double talk determination.
  • a double-talk detecting means for controlling the stop and start of the updating of the filter coefficient of the echo canceller means.
  • the nonlinear distortion of the sound output from the loudspeaker can be reduced, and the acoustic echo mixed into the digital signal output from the A / D converter and the low-frequency-suppressed reception signal input to the echo canceller means can be reduced.
  • the accuracy of calculating the adaptive filter coefficient in the echo canceller is prevented from deteriorating, the difference between the pseudo echo signal and the acoustic echo is reduced, and the amount of echo suppression is reduced. Can be prevented from decreasing.
  • the low-frequency domain component of the digital signal output by the A / D converter is extracted, and double-talk determination is performed based on the low-frequency domain component. Stopping and starting the update of the filter coefficient correctly and preventing the accuracy of the adaptive filter coefficient from deteriorating further reduces the difference between the pseudo echo signal and the acoustic echo, and has the effect of preventing a decrease in the amount of echo suppression. .
  • the double talk detecting means when the double talk detecting means has a small low frequency region component of the digital signal output by the AZD converter, The more difficult it is to determine double talk.
  • the double talk detecting means makes it easier to determine that the digital signal output from the AZD converter has double talk as the low frequency region component of the digital signal is larger.
  • the double talk detecting means calculates an amount of a background noise component included in the digital signal output from the A / D converter, and when the background noise component is small, The greater the low-frequency component of the signal, the easier it is to determine that double talk is occurring.
  • the echo processing apparatus includes a noise canceller that suppresses a background noise component of the digital signal output by the A / D converter, and the double talk detecting means includes a background noise output from the noise sublesser.
  • the digital signal in which is suppressed is input.
  • the double talk detecting means converts a low-frequency component of the digital signal output from the A / D converter by a low-pass filter having a cutoff frequency corresponding to a cutoff frequency of the high-pass filter. It is to extract.
  • An echo processing device includes: a storage unit that stores a set frequency; a control CPU that reads a set frequency from the storage unit and outputs the read frequency to a high-pass filter and a double talk detection unit; A plurality of high-pass filters having different cut-off frequencies in advance, and selecting a high-pass filter having a cut-off frequency corresponding to a set frequency output from the control CPU to suppress a low frequency region component of a received signal;
  • the talk detecting means is for extracting a low frequency region component equal to or lower than a set frequency output from the control CPU when extracting a low frequency region component of the digital signal output by the A / D converter. is there.
  • the double talk detecting means includes a double toe of a low frequency region component of the digital signal output by the A / D converter.
  • the degree of contribution to the judgment is changed by the set frequency.
  • the double talk detecting means includes a plurality of low-pass filters having different cut-off frequencies in advance, and selects a low-bass filter having a cut-off frequency corresponding to the set frequency output from the control CPU. Then, it suppresses the high frequency region component of the digital signal output by the A / D converter and extracts the low frequency region component.
  • FIG. 1 is a block diagram showing a configuration of a conventional echo processor.
  • FIG. 2 is a block diagram showing a configuration of an echo processor according to Embodiment 1 of the present invention.
  • FIG. 3 is an explanatory diagram showing an operation of a high-pass fill according to the first embodiment of the present invention.
  • FIG. 4 is a block diagram showing a configuration of an echo processing apparatus according to Embodiment 3 of the present invention.
  • FIG. 5 shows a configuration of an echo processing apparatus according to Embodiment 4 of the present invention.
  • FIG. 3 is a block circuit diagram.
  • FIG. 6 is an explanatory diagram showing an operation of a high-pass fill according to Embodiment 4 of the present invention.
  • FIG. 2 is a block circuit diagram showing a configuration of the echo processing device according to the first embodiment of the present invention.
  • 11 is a high-pass filter that suppresses low-frequency components of a received signal composed of a digital signal
  • 1 is a high-pass filter that converts a low-band suppressed received signal that has passed through 1 into an analog audio signal.
  • An A / A converter 2 is an amplifier for amplifying an audio signal
  • 3 is a speaker for outputting sound according to the amplified audio signal.
  • Reference numeral 4 denotes a microphone for inputting sound and converting the sound signal into an audio signal
  • 5 an amplifier for amplifying the audio signal
  • 6 an A / D converter for converting the amplified analog audio signal into a digital signal.
  • the echo canceller means 7, 8 is an adaptive filter means for generating a pseudo echo signal based on the low-frequency-suppressed reception signal, the transmission signal and the judgment signal, and 9 is a digital signal from the A / D converter 6. And a pseudo echo signal.
  • Reference numeral 12 denotes double talk detecting means for judging silence or double talk of the received signal based on the low-frequency suppressed reception signal, output digital signal and transmission signal, and outputting the judgment signal to the echo canceller means 7. Next, the operation will be described.
  • the high-pass filter 11 When the received signal is input to the high-pass filter 11, the high-pass filter 11 suppresses signal components below the cut-off frequency of the filter and outputs a low-band suppressed received signal.
  • the low-band suppression received signal is supplied to the adaptive filter means 8 and the D / A converter 1 and also to the double talk detection means 12.
  • the high-pass filter 11 is composed of, for example, an 8th-order IR type digital filter.
  • the cut-off frequency of the high-pass filter 11 is determined in advance by checking the lower limit frequency of the reproducible low frequency of the speaker 3, and is set in accordance with this value. If the lower limit of the reproducible frequency of the speaker 3 is 400 Hz, the coefficient of the digital filter is designed so that the cutoff frequency is 400 Hz.
  • FIG. 3 is an explanatory diagram showing the operation of the filter according to the first embodiment of the present invention.
  • (a) to (c) show an operation example of the high-pass filter 11.
  • (A) is the frequency characteristic when the received signal is a sound
  • (b) is the response characteristic of the high-pass filter 11
  • (c) is the frequency characteristic of the low-band suppression received signal output from the high-pass filter 11. It is.
  • fc is the cutoff frequency of the high-pass filter 11.
  • the low-frequency-suppressed reception signal input to the D / A converter 1 is converted into an analog signal, that is, an audio signal, amplified by the amplifier 2, and output from the speaker 3 as sound.
  • an analog signal that is, an audio signal, amplified by the amplifier 2, and output from the speaker 3 as sound.
  • low-frequency components that cannot be reproduced by the speaker 3 are suppressed by the high-pass filter 11, so that non-linear distortion does not occur in the sound output from the speaker 3. Therefore, non-linear distortion does not occur in the acoustic echo input from the microphone 4.
  • the adaptive filter means 8 calculates an adaptive filter coefficient based on the low-frequency suppressed reception signal and the transmission signal to generate a pseudo echo signal, and the adder 9 subtracts the pseudo echo signal from the output digital signal.
  • non-linear distortion does not occur in the acoustic echo, and the acoustic echo mixed into the audio signal and the low-frequency-suppressed received signal input to the adaptive filter means 8 are converted to the low-frequency
  • the adaptive filter means 8 can accurately calculate the adaptive filter coefficient and generate a pseudo echo signal close to the actual echo signal.
  • the double talk detecting means 12 determines double talk based on the low-frequency suppressed reception signal, the output digital signal, and the transmission signal. Hereinafter, the operation of the double talk detecting means 12 will be described in detail.
  • the double talk detecting means 1 2 samples the average power Xh of the low-frequency-suppressed reception signal, the average power S of the output digital signal, and the average power E of the transmission signal, for example, by sampling the level of each signal within the period at regular intervals Then, the sum of squares of each value is calculated by averaging the number of samples.
  • the high-frequency components hereinafter referred to as high-frequency components
  • the mouth-to-pass filter is composed of, for example, an 8th-order IIR digital filter.
  • the cut-off frequency of the low-pass fill is set to the same value as the cut-off frequency of the no-pass fill.
  • the output digital signal The low-frequency power and the low-frequency power of the low-frequency suppression received signal
  • S l and XI are defined as S l and XI, for example, by averaging the sum of squares of the sample values with the number of samples.
  • the double talk detecting means 12 calculates the minimum value of the average power S of the output digital signal obtained in a predetermined period (for example, one second) as a periodicity in the output digital signal in the period in which the minimum value is obtained. Only when there is no background noise Extract as one N s value.
  • the presence or absence of the periodicity can be obtained by, for example, determining the maximum value of the autocorrelation coefficient of the output digital signal using a threshold. If the maximum value of the self-correlation number exceeds the threshold value, it is determined that there is periodicity, and if not, there is no value.
  • the section of the output digital signal in which the value of the average power S is larger than the preset threshold value from N s and has periodicity is detected as a sound section, and for example, the sound section in the past 1 second is detected.
  • the average power of the section is obtained as V s, and the ratio of V s to N s (V s / N s) is obtained as R s.
  • double talk is determined using, for example, the following equations (4) to (7).
  • Equations (4) and (5) are not satisfied and Equations (6) and (7) are satisfied, the echo suppression is small, and the double talk due to the large amount of input sound other than the echo signal is considered. judge.
  • p 4 is the variable value that changes depending on the value of the previous obtained R s, large R s, for example if it exceeds 3 6 2, i.e. when the amount of background noise 1.0, does not exceed That is, if the amount of background noise is large, set to 1.5.
  • whether or not the received signal is silent is determined using the average power Xh of the low-band suppressed received signal, but the average power X of the received signal before passing through the high-pass filter 11 is determined. May be applied to equation (4).
  • (a) is an example of the frequency characteristic when the received signal is a sound
  • (b) is the response characteristic of the high-pass filter 11
  • (c) is the low-band suppressed received signal as described above. It is a frequency characteristic.
  • (D) is the same low-frequency-suppressed received signal as in (c)
  • (e) is the response characteristic of the low-pass filter in the double talk detecting means 12
  • the cut-off frequency fc is the same as that of the high-pass filter 11 Is the same.
  • (F) is a single-pass filter output obtained from the signal (d) through this low-pass filter.
  • the average power of the low-pass filter output (f) is equivalent to XI in equation (7), but the value of XI is small because of the low-pass suppression effect of the high-pass filter 11.
  • (g) shows the frequency characteristic when the low-band suppression received signal having the frequency characteristic of (c) is converted from speech 3 into voice, and only the echo signal component obtained by inputting to the microphone 4 through the echo path is shown. It is.
  • (H) is the response characteristic of the mouth-to-pass fill in the same double talk detecting means 12 as (e), and (i) is the output of this mouth-to-pass fill.
  • the average power of this low-pass fill output (i) is equivalent to S1 in equation (7).
  • S 1 is as small as X 1.
  • (j) is the frequency characteristic when the output digital signal is composed of the echo signal and the voice signal of the near-end speaker
  • (k) is the one-pass filter in the double talk detecting means 12 same as (e).
  • (1) is the output of the low-pass filter.
  • the average power of the mouth-to-passfill evening output (1) is the formula This corresponds to S1 in (7), but in this case, the output digital signal includes the voice of the near-end speaker, so that the low-frequency component is included.
  • the low-pass filter output (i) This is a large value compared to S 1 of FIG.
  • the double-talk detecting means 12 is used when the value of S 1 is small and close to X 1, that is, the equation (7) If does not hold, it is determined that the output digital signal is single talk with only echo.
  • the double talk detecting means 12 uses the double digital signal composed of the echo signal and the near-end talker's voice signal in the output digital signal. Judge as talk.
  • S1 is the power of the low-frequency component of the output digital signal, and S can be regarded as the power of the entire band of the output digital signal.
  • the double-talk determination means 12 uses the equations (5), (6) ) Holds, but if equation (7) using S 1 does not hold, it is not determined that the signal is a double-talk. Therefore, the single-talk echo only is doubled compared to the conventional echo processor that does not use equation (7). There is little misjudgment as a talk, and accurate double talk judgment can be performed. However, when the amount of background noise is small, the background noise included in S1 is small, and the reliability of the value of S1 is determined to be high, and p4 is set to a small value. It's getting easier.
  • the double talk detecting means 12 determines whether the received signal is silent or in a double talk state based on the above conditions, and transmits the result to the adaptive filter means 8 as a determination signal.
  • the adaptive filter means 8 stops updating the adaptive filter coefficient during double talk or when the received signal is silent, thereby preventing the calculation accuracy of the filter coefficient from deteriorating due to double talk. Also, the adaptive filter means 8 starts updating the adaptive filter coefficient when double talk is not performed and the received signal is not silent.
  • low-frequency components of a received signal that cannot be reproduced by speaker 3 are suppressed by high-pass filter 11, and the output of high-pass filter 11 is adaptively filtered. Since the signal is also input to the means 8, the nonlinear distortion of the echo signal output from the speaker 3 can be reduced. The difference between echo signals can be reduced to prevent a reduction in the amount of echo suppression.
  • the fact that the low frequency is suppressed by the high-pass filter 11 of the echo signal included in the output digital signal is used to determine the double talk, so that the double talk can be determined with high accuracy and the adaptive filter can be determined. It correctly stops and starts updating the evening coefficient, prevents the accuracy of the adaptive fill coefficient from deteriorating, reduces the difference between the pseudo echo signal and the echo signal, and prevents a reduction in the amount of echo suppression.
  • the low-frequency components of the output digital signal and the low-frequency suppression received signal are extracted by low-pass filtering, the low-frequency components of the output digital signal and the low-frequency suppression reception signal can be obtained by relatively simple processing. it can. Embodiment 2.
  • double-talk detection is performed when Expression (4) is not satisfied and Expressions (5) and (7) are satisfied, or when Expressions (4) and (7) are satisfied. If (5) is not satisfied and Eqs. (6) and (7) are satisfied, double talk is determined. However, again with R s is large, for example 3 when more than 6 2, i.e. smaller if the amount of background noise equation (4) is Equation (7) is established not satisfied. Based on this fact, double talk may be determined regardless of whether Expressions (5) and (6) hold. Therefore, when the amount of background noise is small, even if the value of S or E is small, In this case, it is possible to accurately detect the talk, and to prevent false determination of double talk when the amount of background noise is large.
  • the background noise component included in the output digital signal is utilized by utilizing the fact that the low frequency band of the echo signal included in the output digital signal is suppressed by the high-pass filter 11.
  • the double talk is determined mainly by using the low frequency region component of the output digital signal, so that the double talk can be determined with high accuracy, and the stop and start of the update of the adaptive filter coefficient can be performed. It is possible to reduce the difference between the pseudo echo signal and the echo signal by preventing the deterioration of the precision of the adaptive filter coefficient by performing the correction correctly, thereby preventing the reduction of the echo suppression amount.
  • FIG. 4 is a block circuit diagram showing a configuration of an echo processing apparatus according to Embodiment 3 of the present invention.
  • reference numeral 17 denotes a noise suppressor.
  • Other configurations are the same as those in FIG. 2, and the operation of the double talk detecting means 12 is the same as that of the second embodiment.
  • the noise sub-laser 17 inputs the output digital signal from the AZD converter 6, suppresses the background noise component included in the output digital signal, and outputs the signal to the double talk detecting means 12.
  • Bol 1 “S uppression of A cousticnoiseinseechus ingspectrals ub traction”, IEEETrans. ASSP. Vol. ASSP-27, No. 2, A This is performed by the spectral subtraction method disclosed in pri 1 19 79 (Reference 4).
  • Double talk detection means Since the amount of the background noise component included in the output digital signal is reduced by the noise sub-lesser 17, the calculated value of R s increases, and the case where R s exceeds 36 2 increases.
  • Equation (5) and (6) can be satisfied, if (4) is not satisfied and Equation (7) is satisfied, the number of cases where double talk is determined increases, and the values of S and E increase. Even if is small, the possibility of accurately detecting a double torque increases.
  • the noise sub-lesser 17 is arranged at a position bypassing the echo canceller means 7, and the output signal which has been transformed by the noise sub-lesser 17 with its background noise suppressed is input to the double-talk detecting means 12.
  • the pseudo echo signal generated by the adaptive filter means 8 does not deteriorate due to the introduction of the noise sub-sensor 17.
  • the noise sublesser 17 suppresses the background noise component included in the output digital signal, so that even when the output digital signal contains background noise, Double talk can be determined with high accuracy, the update of the adaptive filter coefficient is correctly stopped and started, the accuracy of the adaptive filter coefficient is prevented from deteriorating, the difference between the pseudo echo signal and the echo signal is reduced, and the echo suppression amount is reduced. Reduction can be prevented.
  • FIG. 5 is a block circuit diagram showing a configuration of an echo processing apparatus according to Embodiment 4 of the present invention.
  • reference numeral 13 denotes storage means for storing a set frequency
  • 14 denotes a set frequency of the storage means 13.
  • This is a control CPU for reading and outputting to the high-pass filter 15 and the double talk detecting means 16.
  • the high-pass filter 15 is composed of a plurality of filter elements having different cut-off frequencies in advance, and a high-pass filter for selecting and setting a cut-off frequency corresponding to the set frequency output from the control CPU 14.
  • the lower limit of the low-frequency range that the beeker 3 can reproduce depends on the performance of the speaker.
  • a filter element with a plurality of cutoff frequencies corresponding to the lower limit frequency of reproducible low frequency assumed by the speaker 3 is prepared in the high pass filter 15. For example, if the lower reproducible lower-limit frequency expected from speaker 3 is 300 Hz to 600 Hz, then 300 Hz, 400 Hz, 500 Hz every 100 Hz Prepare filter elements with four types of cutoff frequencies, Hz and 600 Hz.
  • the mouth-to-pass filter inside the double talk detecting means 16 also holds filter elements having four kinds of cutoff frequencies at intervals of 100 Hz from 300 Hz to 600 Hz.
  • the storage means 13 is composed of, for example, a ROM, and measures a lower reproducible lower frequency limit of the speaker 3 at the time of design, determines a set frequency corresponding to the lower limit frequency, and stores it at the time of manufacture.
  • the control CPU 14 reads out the value of the set frequency stored in the storage means 13 and outputs it to the high-pass filter 15 and the double talk detection means 16.
  • the high-pass filter 15 selects a cutoff frequency corresponding to this set frequency value, for example, when the set frequency is 400 Hz, selects a filter element having a cutoff frequency of 400 Hz to select a low-frequency component of the received signal. Suppress the component and output the low-band suppression received signal.
  • the double talk detecting means 16 selects a filter element having a cutoff frequency corresponding to the set frequency value and suppresses the high frequency components of the output digital signal and the low frequency suppression received signal. Then, the double toe described in FIG. Xh, XI, S, Sl, and E are respectively obtained by the same processing as that of the detection means 12 and the double talk is determined using, for example, Equations (8) to (10).
  • Equation (10) it is determined that double talk is caused by a small amount of echo suppression and a large amount of input sound other than echo signals. I do. '
  • the value in equation (9) is a parameter representing the contribution of the output digital signal and the low-band suppressed received signal to the low-band power S 1 and X 1 in equation (9).
  • FIG. 6 is an explanatory diagram showing an operation of a filter according to Embodiment 4 of the present invention, and shows a frequency characteristic of an output digital signal that has passed through a mouth-to-pass filter of a double talk detecting means 16. It is.
  • (a) shows the case where the output digital signal is an echo signal only and the low-pass lower limit frequency is low
  • (C) is the case where the output digital signal is composed of the echo signal and the voice signal of the near-end speaker, and the low-pass lower limit frequency of the one-pass filter is low.
  • (D) is the case where the lower limit frequency of the low frequency band is high with the same signal configuration.
  • the power difference between (b) and (d) is larger than the power difference between (a) and (c), and the reliability of S1 is higher when the lower-limit frequency in the mouth-to-pass filter is higher.
  • a plurality of filters having different cutoff frequencies are provided in a high-pass filter 15 composed of a plurality of filter elements, and similarly, a plurality of filters having different cutoff frequencies are prepared.
  • a low-pass filter consisting of an element is prepared in the double-talk detecting means 16 and the cut-off frequency of the high-pass filter and the one-pass filter is switched in accordance with the set frequency stored in the storage device 13.
  • Embodiment 5 depending on the cutoff frequency of the high-pass fill and low-pass fill, Since the contribution of the low-frequency power of the output digital signal in the Bull Talk condition formula is changed, it is possible to determine the double talk with high accuracy, stop and start updating the adaptive filter coefficient correctly, and By preventing the coefficient from deteriorating in accuracy, it is possible to reduce the difference between the pseudo echo signal and the echo signal, thereby preventing a reduction in echo suppression.
  • the low-frequency power is obtained by suppressing the high-frequency component of the output digital signal with a low-pass filter. Instead, the output digital signal is converted to a power spectrum using a fast Fourier transform (FFT), and low-frequency power is obtained by adding components below the cut-off frequency on the power spectrum. good.
  • FFT fast Fourier transform
  • the low-pass power is obtained on the frequency axis using the FFT, and thus the mouth-to-pass filter characteristic shown in (h) of FIG.
  • the slope can be cut out steeply without a slope, and the power can be determined, and the accurate low-frequency power can be determined.
  • the echo processing device is suitable for reducing the acoustic echo output from the speaker and input to the microphone via the echo path. .

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Otolaryngology (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Telephone Function (AREA)
  • Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)

Description

明 細 書 エコー処理装置 技術分野
この発明は、 車載電話および携帯電話等の音声通信において、 スビー 力から出力されて反響路を経てマイクに入力される音響エコーを低減す るエコー処理装置に関するものである。 背景技術
第 1図は従来のエコー処理装置の構成を示すプロック回路図であり、 図において、 1はデジタルの受信信号をアナログの音声信号に変換する D Z A変換器、 2は音声信号を増幅する増幅器、 3は増幅された音声信 号に応じた音響を出力するスピーカである。 4は入力される音響を音声 信号にするマイク、 5はその音声信号を増幅する増幅器、 6は増幅され た音声信号をデジタル信号に変換する A / D変換器である。 Ίは受信信 号に基づいて擬似エコー信号を生成し、 その擬似エコー信号を A Z D変 換器 6により変換された出力デジタル信号から差し引く ことによりェコ 一成分を除去するエコーキヤンセラ手段である。 エコーキャンセラ手段 7において、 8は受信信号、 前記出力デジタル信号および判定信号に基 づいて、 擬似エコー信号を生成する適応フィル夕手段、 9は出力デジ夕 ル信号と擬似エコー信号とを加算する加算器である。 1 0は受信信号、 出力デジタル信号および送信信号に基づいて、 受信信号の無音またはダ ブルトークの判定信号をエコーキャンセラ手段 7に出力するダブル トー ク検出手段である。
次に動作について説明する。 今、 遠端話者側から送られてくるデジタル信号を受信信号とし、 近端 話者側から入力された音声信号を増幅器 5で増幅し、 A / D変換器 6で 変換された出力デジタル信号からエコー成分をエコーキヤンセラ手段 7 によって抑圧した信号を送信信号とする。
遠端話者からの受信信号はエコーキャンセラ手段 7 とダブルトーク検 出手段 1 0に入力されると共に、 D / A変換器 1によつてアナログ信号 すなわち音声信号に変換され、 増幅器 2で増幅されてスピーカ 3から音 響として出力される。 このスピーカ 3からの出力の一部は反響路を絰て マイク 4に入力され、 エコー信号として送信するための音声信号に混入 する。
適応フィル夕手段 8は、 受信信号とフィ一ドバックされる送信信号と を用いて適応フィル夕係数を求め、 擬似エコー信号を生成する。 加算器 9で出力デジタル信号からこの擬似エコー信号が差し引かれ、 出力デジ タル信号に含まれるエコー成分が抑圧され送信信号が生成される。 なお 、 適応フィル夕手段 8では反響路の変動に対応するため適応フィル夕係 数が逐次求められ更新される。
ダブルトーク検出手段 1 0は、 出力デジタル信号にエコー信号と近端 話者の音声信号が同時に含まれるダブルトークの状態であるか否か、 お よび受信信号が無音であるか否かを判定して適応フィル夕手段 8に判定 信号として伝達する。 適応フ ィル夕手段 8は、 ダブルトーク時か受信信 号が無音である場合には適応フィル夕係数の更新を停止し、 ダブルトー クによるフ ィル夕係数の算出精度劣化を防止する。
ダブルトーク検出手段 1 0におけるダブルト一ク検知の方法は、 例え ば特開平 1 0— 2 4 2 8 9 1号公報 (文献 1 とする) に開示されたもの で、 次のようにして行われる。
ダブルトーク検出手段 1 0は、 出力デジタル信号の平均パワー S、 受 信信号の平均パワー X、 送信信号の平均パワー Eを求め、 以下の式 ( 1 ) から式 ( 3 ) の組み合わせでダブルトークを検知する。
X< 1 · · · ( 1 )
S >p 2 xX (但し p 2≤ 0. 5 ) · · · ( 2 )
E > p 3 x S · · · ( 3 )
各式中の p iから p 3は所定の定数であり、 使用環境に応じて決定さ れる。
これら条件式により、 式 ( 1 ) が成立した場合は、 受信信号が無音で あると判定する。
また、 式 ( 1 ) が不成立でかつ式 ( 2 ) が成立した場合は、 ダブルト —クであると判定する。
さらに、 式 ( 1 ) と式 ( 2 ) が不成立でかつ式 ( 3 ) が成立した場合 は、 エコー抑圧量が小さく、 エコー信号以外の入力音が多いことによる ダブル トークと判定する。 ,
また、 従来のエコー処理装置には特開平 9— 2 0 5 3 8 8号公報 (文 献 2とする) に示されるものがある。 このエコー処理装置では、 マイク から入力される背景騒音の低周波数領域成分 (以降、 低域成分と呼ぶ) を抑圧するようにしている。 そのため、 送信信号側の AZD変換器 6の 直後にハイパスフィル夕を挿入し、 さらに、 このハイパスフィル夕と同 じ遮断周波数のハイパスフィル夕を適応フィル夕手段の受信信号入力側 の直前にも挿入している。 このことにより、 出力デジタル信号と適応フ ィル夕手段 8に入力される受信信号との周波数特性を一致させて、 適応 フィル夕手段 8での適応フィル夕係数の算出精度が維持される構成とし ている。
従来のエコー処理装置は以上のように構成されているので、 第 1図に 示した従来のエコー処理装置および文献 2に示された従来のエコー処理 装置においては、 音として再生できない低周波数領域成分がスピーカに 入力された場合、 同時に入力された高い周波数の音の振動が妨げられて 非線形の歪みが生じることがある。 この場合、 マイクから入力されるェ コ一信号に非線形な歪みが生じることになり、 適応フィル夕手段 8にお ける適応フィル夕係数の算出精度が劣化し、 生成する擬似エコー信号と エコー信号の差異が大きくなってエコー抑圧量が減少してしまう という 課題があった。 ,
このようなスビーカで生じる非線形の歪みを解消して効果的に消音を 行うため、 特開平 6— 2 0 2 6 6 9号公報 (文献 3 とする) では、 スピ —力の前にハイパスフィル夕を挿入し、 スビーカが再生できない低周波 数領域成分を予め抑圧する方法が提案されている。 この方法を第 1図に 示した従来のエコー処理装置に適用し、 D Z A変換器 1 と増幅器 2 との 間にハイパスフィル夕を揷入することが考えられるが、 その場合適応フ ィル夕手段 8 に入力される受信信号と、 スピーカ 3から出力されマイ ク 4に入力されるエコー信号の低周波数帯域 (以降、 低域と呼ぶ) の特性 が大き く異なってしまう。 これは、 受信信号には低周波数領域成分があ るがエコー信号には無いためである。 結果として、 適応フィル夕手段 8 での適応フィル夕係数の算出精度が劣化し、 生成する擬似エコー信号と エコー信号の差異が大きくなってエコー抑圧量が減少してしまう という 課題がある。
また、 文献 3のハイパスフィル夕をスピーカの前に揷入する方法を文 献 2 に示されたエコー処理装置に適応した場合について考える。 受信信 号側の D / A変換器と増幅器との間にハイパスフィル夕を挿入した場合 、 このハイパスフィル夕と適応フィル夕の直前おょぴ加算器の直前に揷 入されている 2つのハイパスフィル夕とでは低域を抑圧する目的が異な り、 遮断周波数を統一することができない。 結局、 このことが原因で適 応フィルダ手段に入力される受信信号の低域の特性とスピーカから出力 されマイクに入力されるエコー信号の低域の特性とが大き く異なること になり、 適応フィルタ係数の算出精度が劣化し、 擬似エコー信号とェコ 一信号の差異が大きくなってエコー抑圧量が減少してしまうという課題 がある。
また、 第 1図に示した従来のエコー処理装置のダブル トーク検出手段 1 0は、 式 ( 2 ) の S と Xが近い値を持つ場合や、 式 ( 3 ) の S と Eが 近い値を持つような場合、 ダブル トークの判定を誤ることがある。 例え ば、 適応フィル夕係数が誤って更新されることを避けるため、 ダブル ト —クと判定し易いように式 ( 2 ) の p 2の値を低く設定すると、 受信信 号のみのシングル トーク ( Xが大) であってもスピーカ 3 とマイ ク 4の 距離が近い場合や、 増幅器 2 , 5の増幅値が大きい場合は、 出力デジ夕 ル信号に混入するエコー信号のパワーが大き くなり ( Sが大) 、 ダブル トークと誤判定されることがある。 また、 同様の目的で式 ( 3 ) の p 3 の値を低く設定すると、 受信信号のみのシングルトーク (Xが大) であ つても適応フィル夕手段 8でのフィル夕係数の算出精度が悪くなり、 ェ コ一キャンセラ手段 7によるエコー抑圧量が少なくなつて Eが大となり Sに近づいて、 ダブル トークと誤判定されることがある。
このように従来のエコー処理装置では、 明確にシングル トークとダブ ルトークを判定することが困難で判定を誤る場合があり、 その結果、 適 応フィル夕係数の更新の停止および開始時期を誤って適応フィル夕係数 の算出精度が劣化し、 エコー抑圧量が減少するという課題があった。
この発明は上記のような課題を解決するためになされたもので、 スピ 一力が出力する音の非線形歪みを低減し、 適応フィル夕係数の算出精度 の劣化を防いで擬似エコー信号と音響エコーの差異を小さ く し、 エコー 抑圧量の減少を防止するエコー処理装置を得ることを目的とする。 また、 この発明は、 精度良く ダブルトークを判定し、 適応フィル夕係 数の更新の停止および開始を正しく行い、 適応フィル夕係数の算出精度 劣化を防いでエコー抑圧量の減少を防止するエコー処理装置を得ること を目的とする。 発明の開示
この発明に係るエコー処理装置は、 デジタル信号からなる受信信号の 低周波数領域成分を抑圧するハイパスフィル夕と、 前記ハイパスフィル 夕を通過した低域抑圧受信信号を音声信号に変換する D Z A変換器と、 前記音声信号に基づいた音響を出力するスピー力と、 このスピーカから 出力される音響のエコーが入力される可能性のあるマイクと、 このマイ クよ り出力される音声信号をデジタル信号に変換する A Z D変換器と、 前記ハイパスフィル夕を通過して得られる低域抑圧受信信号に基づいて 擬似エコー信号を生成し、 その擬似エコー信号を前記 A Z D変換器によ り出力されたデジタル信号から差し引いて送信信号を生成するエコーキ ヤンセラ手段とを備えたものである。
このことによって、 スピーカから出力される音響の非線形歪を低減で き、 A / D変換器によ り出力されたデジタル信号に混入する音響エコー とエコーキャンセラ手段に入力される低域抑圧受信信号はハイパスフィ ル夕により低周波数領域成分の抑圧を同様に受けることによ り、 エコー キャンセラ手段での適応フィル夕係数の算出精度の劣化を防いで、 擬似 エコー信号と音響エコーとの差異を小さく し、 エコー抑圧量の減少を防 止する効果がある。
この発明に係るエコー処理装置は、 デジタル信号からなる受信信号の 低周波数領域成分を抑圧するハイパスフィル夕と、 前記ハイパスフィル 夕を通過した低域抑圧受信信号を音声信号に変換する D / A変換器と、 前記音声信号に基づいた音響を出力するスピー力と、 このスピーカから 出力される音響のエコーが入力される可能性のあるマイクと、 このマイ クより出力される音声信号をデジタル信号に変換する A Z D変換器と、 前記ハイパスフィル夕を通過して得られる低域抑圧受信信号に基づいて 擬似エコー信号を生成し、 その擬似エコー信号を前記 A / D変換器によ り出力されたデジタル信号から差し引いて送信信号を生成するエコーキ ヤンセラ手段と、 前記 A Z D変換器により出力されたデジタル信号の低 周波数領域成分を抽出し、 その低周波数領域成分に基づいてダブルトー ク判定を行い、 そのダブル トーク判定に基づいて前記エコーキヤンセラ 手段のフィル夕係数更新の停止.および開始を制御するダブルトーク検出 手段とを備えたものである。
このことによって、 スピーカから出力される音響の非線形歪を低減で き、 A / D変換器により出力されたデジタル信号に混入する音響エコー とエコーキヤンセラ手段に入力される低域抑圧受信信号はハイパスフィ ル夕により低周波数領域成分の抑圧を同様に受けることにより、 エコー キャンセラ手段での適応フィル夕係数の算出精度の劣化を防いで、 擬似 エコー信号と音響エコーとの差異を小さく し、 エコー抑圧量の減少を防 止することができる。
また、 A / D変換器により出力されたデジタル信号の低周波数領域成 分を抽出し、 その低周波数領域成分に基づいてダブルトーク判定を行う ようにしたので、 精度良くダブルトークを判定でき、 適応フィル夕係数 の更新の停止および開始を正しく行い適応フィルタ係数の精度劣化を防 いで擬似エコー信号と音響エコーとの差異をさらに小さく し、 エコー抑 圧量の減少を防止することができる効果がある。
この発明に係るエコー処理装置は、 ダブルトーク検出手段が、 A Z D 変換器により出力されたデジタル信号の低周波数領域成分が小さい場合 ほどダブル トークであると判定しにく く したものである。
このことによって、 精度良くダブル トークを判定して適応フィル夕係 数の更新の停止および開始を正しく実行でき、 適応フィル夕係数の算出 精度の劣化を防いで擬似エコー信号と音響エコーとの差異を小さく し、 エコー抑圧量の減少を防止することができる効果がある。
この発明に係るエコー処理装置は、 ダブル トーク検出手段が、 A Z D 変換器によ り出力されたデジタル信号の低周波数領域成分が大きい場合 ほどダブル トークであると判定し易く したものである。
このことによって、 精度良くダブル トークを判定して適応フィル夕係 数の更新の停止および開始を正しく実行でき、 適応フィル夕係数の算出 精度の劣化を防いで擬似エコー信号と音響エコーとの差異を小さ く し、 エコー抑圧量の減少を防止することができる効果がある。
この発明に係るエコー処理装置は、 ダブル トーク検出手段が、 A / D 変換器によ り出力されたデジタル信号に含まれる背景雑音成分の量を計 算し、 背景雑音成分が小さい場合、 前記デジタル信号の低周波数領域成 分が大きいほどダブル トークであると判定し易く したものである。
このことによって、 背景雑音による誤判定が無く、 精度良くダブル ト ークを判定して適応フィル夕係数の更新の停止および開始を正しく実行 でき、 適応フィル夕係数の算出精度の劣化を防いで擬似エコー信号と音 響エコーとの差異を小さ く し、 ェコ Γ "抑圧量の減少を防止することがで きる効果がある。
この発明に係るエコー処理装置は、 A / D変換器により出力されたデ ジ夕ル信号の背景雑音成分を抑圧するノィズサブレッサを備え、 ダブル トーク検出手段が、 このノイズサブレッサから出力された背景雑音を抑 圧された前記デジ夕ル信号を入力するものである。
このことによって、 出力デジタル信号に背景雑音が含まれる場合でも 精度良くダブル トークを判定して適応フィル夕係数の更新の停止および 開始を正しく実行でき、 適応フィル夕係数の算出精度の劣化を防いで擬 似エコー信号と音響エコーとの差異を小さ く し、 エコー抑圧量の減少を 防止することができる効果がある。
この発明に係るエコー処理装置は、 ダブル トーク検出手段が、 ハイパ スフィル夕の遮断周波数に対応した遮断周波数を有するローパスフィル 夕により、 A / D変換器により出力されたデジタル信号の低周波数領域 成分を抽出するものである。
このことによって、 比較的簡易な構成によ り前記デジタル信号の低周 波数領域成分を抽出することができる効果がある。
この発明に係るエコー処理装置は、 設定周波数を記憶する記憶手段と 、 前記記憶手段の設定周波数を読み出し、 ハイパスフィル夕およびダブ ル トーク検出手段に出力する制御 C P Uとを備え、 前記ハイパスフィル 夕は、 予め異なる遮断周波数を有する複数のハイパスフィル夕からなり 、 前記制御 C P Uから出力された設定周波数に対応した遮断周波数のハ ィパスフィル夕を選択して受信信号の低周波数領域成分を抑圧し、 前記 ダブル トーク検出手段は、 A / D変換器によ り出力されたデジタル信号 の低周波数領域成分を抽出する際に、 前記制御 C P Uから出力された設 定周波数以下の低周波数領域成分を抽出するものである。
このことによって、 スビーカの種類が変わって遮断周波数が変更され る場合でも、 ハイパスフィル夕を新たに入れ換える必要が無く、 記憶装 置の設定周波数を書き換えるだけで簡易に対応することができる。 また 、 ダブルトーク検出手段においても、 その書き換えられた設定周波数に 応じて遮断周波数を簡易に対応することができる効果がある。
この発明に係るェコ一処理装置は、 ダブル トーク検出手段が、 A / D 変換器により出力されたデジタル信号の低周波数領域成分のダブル トー ク判定に対する寄与度を、 設定周波数によって変更するものである。 このことによって、 精度良く ダブル トークを判定でき、 適応フィル夕 係数の更新の停止および開始を正しく行い適応フィル夕係数の精度.劣化 を防いで擬似エコー信号と音響エコーとの差異を小さ く し、 エコー抑圧 量の減少を防止することができる効果がある。
この発明に係るエコー処理装置は、 ダブルトーク検出手段が、 予め異 なる遮断周波数を有する複数のローパスフィル夕からなり、 制御 C P U から出力された設定周波数に対応した遮断周波数のローバスフィル夕を 選択して、 A / D変換器によ り出力されたデジタル信号の高周波数領域 成分を抑圧し、 低周波数.領域成分を抽出するものである。
このことによって、 比較的簡易な構成で前記デジタル信号の低周波数 領域成分を抽出することができる と共に、 スピー力の種類が変わって遮 断周波数が変更される場合でもダブル トーク検出手段内のローパスフィ ル夕を新たに入れ換える必要が無く、 記憶装置の設定周波数を書き換え るだけで簡易に対応することができる効果がある。 図面の簡単な説明
第 1図は、 従来のエコー処理装置の構成を示すプロ ック回路図である 第 2図は、 この発明の実施の形態 1 によるエコー処理装置の構成を示 すプロ ック回路図である。
第 3図は、 この発明の実施の形態 1 によるハイパスフィル夕の動作を 示す説明図である。
第 4図は、 この発明の実施の形態 3によるエコー処理装置の構成を示 すプロ ック回路図である。
第 5図は、 この発明の実施の形態 4によるエコー処理装置の構成を示 すブロック回路図である。
第 6図は、 この発明の実施の形態 4に係るハイパスフィル夕の動作を 示す説明図である。 発明を実施するための最良の形態
以下、 この発明をより詳細に説明するために、 この発明を実施するた めの最良の形態について、 添付の図面にしたがって説明する。
実施の形態 1 .
第 2図はこの発明の実施の形態 1によるエコー処理装置の構成を示す プロック回路図である。 図において、 1 1はデジタル信号からなる受信 信号の低周波数領域成分を抑圧するハイパスフィル夕、 1はハイパスフ ィル夕 1 1を通過した低域抑圧受信信号をアナログの音声信号に変換す る D / A変換器、 2は音声信号を増幅する増幅器、 3は増幅された音声 信号に応じた音響を出力するスピーカである。 4は音響が入力され音声 信号に変換するマイク、 5はその音声信号を増幅する増幅器、 6は増幅 されたアナログの音声信号をデジタル信号に変換する A / D変換器であ る。 7はハイパスフィル夕 1 1を通過した低域抑圧受信信号に基づいて 擬似エコー信号を生成し、 その擬似ェコ一信号を A / D変換器からのデ ジ夕ル信号から差し引いて、 エコー成分を除去した送信信号を出力する ェコ一キャンセラ手段である。 ェコ一キャンセラ手段 7において、 8は 低域抑圧受信信号、 送信信号および判定信号に基づいて、 擬似エコー信 号を生成する適応フィル夕手段、 9は A / D変換器 6からのデジタル信 号と擬似エコー信号とを加算する加算器である。 1 2は低域抑圧受信信 号、 出力デジタル信号および送信信号に基づいて受信信号の無音または ダブル トークを判定し、 判定信号をエコーキヤンセラ手段 7に出力する ダブル トーク検出手段である。 次に動作について説明する。
受信信号がハイパスフ ィ ル夕 1 1 に入力されると、 ハイパスフ ィル夕 1 1は、 そのフィル夕の持つ遮断周波数以下の信号成分を抑圧し、 低域 抑圧受信信号を出力する。 低域抑圧受信信号は、 適応フィル夕手段 8 と D / A変換器 1 に与えられるとともにダブル トーク検出手段 1 2 にも与 えられる。 ここで、 ハイパスフィル夕 1 1 は、 例えば 8次の I I R型デ ジ夕ルフィル夕で構成されている。 なお、 ハイパスフィル夕 1 1の遮断 周波数は、 スピーカ 3の再生可能な低域の下限周波数を予め調べ、 この 値に合わせて設定される。 スピーカ 3の再生可能な周波数の下限が 4 0 0 H zであれば、 4 0 0 H zを遮断周波数とするようにデジタルフ ィル 夕の係数を設計しておく。
第 3図はこの発明の実施の形態 1 によるフ ィ ル夕の動作を示す説明図 であ り、 図において、 ( a ) 〜 ( c ) にハイパスフィル夕 1 1の動作例 を示す。 ( a ) は受信信号が有音の場合の周波数特性、 ( b ) はハイパ スフィルタ 1 1の応答特性、 ( c ) はハイパスフィル夕 1 1から出力さ れた低域抑圧受信信号の周波数特性である。 こ こで、 f cはハイパスフ ィル夕 1 1の遮断周波数である。
次に、 D / A変換器 1 に入力された低域抑圧受信信号はアナログ信号 、 すなわち音声信号に変換され、 増幅器 2で増幅されてスピーカ 3から 音響として出力される。 このときスピーカ 3で再生できない低域の周波 数成分はハイパスフィル夕 1 1で抑圧されているため、 スピーカ 3から 出力される音には非線形の歪が生じない。 したがって、 マイク 4から入 力される音響エコーにも非線形な歪みは生じない。
適応フィル夕手段 8は、 低域抑圧受信信号と送信信号に基づいて適応 フィル夕係数を算出し擬似エコー信号を生成し、 加算器 9は出力デジ夕 ル信号から擬似エコー信号を差し引く。 以上の処理動作により、 音響エコーに非線形な歪が生じないことと、 音声信号に混入する音響エコーと適応フィル夕手段 8に入力される低域 抑圧受信信号は、 ハイパスフィル夕 1 1による低域成分の抑圧を同様に 受けることより、 適応フィルタ手段 8は精度良く適応フィル夕係数を算 出して、 実際のエコー信号に近い擬似エコー信号を生成することができ ο
ダブルトーク検出手段 1 2は、 低域抑圧受信信号、 出力デジタル信号 、 および送信信号に基づいてダブルトークの判定を行う。 以下にダブル トーク検出手段 1 2の動作を詳しく説明する。
ダブルトーク検出手段 1 2は、 低域抑圧受信信号の平均パワー X h、 出力デジタル信号の平均パワー S、 送信信号の平均パワー Eを、 例えば 一定期間毎にその期間内の各信号のレベルをサンプルし、 それそれの値 の二乗和をサンプル数で平均化する方法で求める。 また、 出力デジタル 信号と低域抑圧受信信号の高周波数領域成分 (以降、 高域成分と呼ぶ) をローパスフィル夕によって抑圧し、 低域成分だけを抽出する。 口一パ スフィル夕は例えば 8次の I I R型デジタルフィル夕で構成される。
このとき、 ローパスフィル夕の遮断周波数は、 ノヽィパスフィル夕 1 1 の遮断周波数と同じ値に設定する。
そして、 ローパスフィル夕で高域成分が抑圧された出力デジ夕ル信号 と、 同様にローパスフィル夕で高域成分が抑圧された低域抑圧受信信号 の平均パワー (以降、 それそれ出力デジタル信号の低域パワー、 低域抑 圧受信信号の低域パワーと呼ぶ) を S l、 X I として、 それそれ例えば サンプル値の二乗和をサンプル数で平均化する方法で求める。
また、 ダブルトーク検出手段 1 2は、 所定期間 (例えば 1秒間) に求 めた出力デジタル信号の各平均パワー Sの内の最低値を、 この最低値を 求めた期間の出力デジタル信号に周期性が無い場合に限り背景雑音パヮ 一 N s値として抽出する。 周期性の有無は、 例えば出力デジタル信号の 自己相関係数の最大値を閾値で判定することで求められる。 自己相関係 数の最大値が閾値を超えれば周期性あり、 超えなければ無しと判定する 。 そして、 平均パワー Sの値が、 N sからあらかじめ設定しておいた閾 値より多く、 しかも周期性のある出力デジタル信号の区間を有音区間と して検出し、 例えば過去 1秒間における有音区間の平均パワーを V sと して求め、 V sと N sの比 (V s/N s ) を R sとして求める。
次に、 例えば以下の式 (4) 〜 ( 7 ) を用いてダブルトークの判定を 行ラ。
X h < p 1 · . · ( 4 )
S > p 2 X X h (但し ρ 2≤ 0 · 5 ) · · · ( 5 )
Ε > ρ 3 x S · · · ( 6 )
S l >p 4 xX l · · · ( 7 )
これら条件式により、 式 (4 ) が成立した場合は、 受信信号が無音で あると判定する。
また、 式 (4) が不成立でかつ式 ( 5 ) と式 ( 7 ) が成立した場合は 、 ダブルトークであると判定する。
さらに、 式 ( 4 ) と式 ( 5 ) が不成立でかつ式 ( 6 ) と式 ( 7 ) が成 立した場合は、 エコー抑圧量が小さく、 エコー信号以外の入力音が多い ことによるダブルトークと判定する。
ここで、 式 (4) 〜 ( 7) 中の p iから p 3は所定の定数であり、 使 用環境に応じて決定されるが、 例えば、 p l = 1 0 02、 p 2 = 0.5、 p 3 = 0. 5とする。 p 4は、 先の求めた R sの値によって変化する可 変値であり、 R sが大きく、 例えば 3 62を超える場合、 すなわち背景 雑音の量が少ない場合は 1. 0、 超えない場合、 すなわち背景雑音の量 が大きい場合は 1. 5に設定する。 また、 式 (4) では低域抑圧受信信号の平均パワー Xhを用いて受信 信号が無音であるか否かを判定したが、 ハイパスフィル夕 1 1を通る前 の受信信号の平均パワー Xを求めて式 (4) に適用しても良い。
以下、 第 3図を用い、 ダブル トーク検出手段 1 2がダブルトークを検 出する動作について詳しく説明する。
第 3図において、 先に説明したように (a) は受信信号が有音の場合 の周波数特性の例、 ( b ) はハイパスフィルタ 1 1の応答特性、 ( c ) は低域抑圧受信信号の周波数特性である。 また、 (d) は ( c) と同じ 低域抑圧受信信号、 ( e ) はダブルトーク検出手段 1 2内のローパスフ ィル夕の応答特性で、 遮断周波数 f cはハイパスフィル夕 1 1のものと 同じである。 (f ) は信号 (d) をこのローパスフィル夕を経て得られ る口一パスフィルタ出力である。 ここで、 ローパスフィル夕出力 (f ) の平均パヮ—は、 式 ( 7 ) の X Iに相当するが、 X Iの値はハイパスフ ィル夕 1 1の低域抑圧効果のため、 小さい値となる。
また、 ( g) は ( c ) の周波数特性を持つ低域抑圧受信信号がスピー 力 3から音声となり、 反響路を絰てマイク 4に入力して得られたエコー 信号成分のみの場合の周波数特性である。 (h) は ( e) と同一のダブ ルトーク検出手段 1 2内の口一パスフィル夕の応答特性、 ( i ) はこの 口一パスフィル夕の出力である。 このローパスフィル夕出力 ( i ) の平 均パワーが式 ( 7 ) の S 1に相当するが、 出力デジタル信号に近端話者 の音声が無く、 エコー信号のみであるため低域成分が少なく、 この場合 の S 1は X 1と同様の小さな値となる。
さらに、 ( j ) は出力デジタル信号がエコー信号と近端話者の音声信 号とからなる場合の周波数特性、 (k) は ( e) と同一のダブルトーク 検出手段 1 2内の口一パスフ ィル夕の応答特性、 ( 1 ) はこのローパス フィル夕の出力である。 口一パスフィル夕出力 ( 1 ) の平均パワーが式 ( 7 ) の S 1に相当するが、 この場合、 出力デジタル信号に近端話者の 音声があるので低域成分が含まれ、 ェコ一信号のみの場合のローパスフ ィル夕出力 ( i ) の S 1 と比べ大きな値となる。
第 3図に示したローパスフィル夕出力 ( i ) と ( 1 ) の特性差を利用 し、 ダブルトーク検出手段 1 2は、 S 1の値が小さく X 1に近いとき、 すなわち、 式 ( 7 ) が成り立たたないときは、 出力デジタル信号にはェ コーのみであるシングルトークと判定する。 S 1の値が X 1よりかなり 大きいとき、 すなわち、 式 ( 7 ) が成り立つときは、 ダブルトーク検出 手段 1 2は出力デジタル信号にェコ一信号と近端話者の音声信号とから なるダブルトークと判定する。
S 1は出力デジタル信号の低域成分のパワーであり、 Sは出力デジ夕 ル信号の全帯域のパワーとみなせるが、 ダブルトーク判定手段 1 2は、 Sを用いた式 ( 5 ) , ( 6 ) が成り立っても、 S 1を用いた式 ( 7 ) が 成り立たなければ、 ダブルトークと判定しないので、 式 ( 7 ) を使わな い従来のエコー処理装置よりも、 エコーのみのシングルトークをダブル トークと誤判定することが少なく、 精度の良いダブルトーク判定が行え る。 ただし、 背景雑音の量が少ない場合は S 1に含まれる背景雑音が少 なく、 S 1の値の信頼性が高いと判断して p 4を小さな値に設定するの で、 ダブルトークと判定し易くなつている。
ダブルトーク検出手段 1 2は、 受信信号が無音であるか、 またはダブ ルトークの状態であるかを上記条件により判定して適応フィル夕手段 8 に判定信号として伝達する。 適応フィル夕手段 8は、 ダブルトーク時か 受信信号が無音である場合には適応フィル夕係数の更新を停止し、 ダブ ルトークによるフィル夕係数の算出精度劣化を防止する。 また、 適応フ ィル夕手段 8は、 ダブルトーク時でなく、 かつ受信信号が無音でもない 場合に適応フ ィル夕係数の更新を開始する。 以上のように、 この実施の形態 1によれば、 スピーカ 3で再生できな い受信信号の低域成分をハイパスフィル夕 1 1で抑圧し、 しかもこのハ ィパスフィル夕 1 1の出力を適応フィル夕手段 8にも入力するようにし たので、 スピーカ 3から出力されるエコー信号の非線形歪を低減でき、 適応フィル夕手段 8での適応フィル夕係数の算出精度の劣化を防いで擬 似エコー信号とエコー信号の差異を小さく し、 エコー抑圧量の減少を防 止できる。
また、 出力デジタル信号に含まれるエコー信号がハイパスフィル夕 1 1で低域を抑圧されていることを利用してダブルトークの判定を行うよ うにしたので、 精度良くダブルトークを判定でき、 適応フィル夕係数の 更新の停止および開始を正しく行い、 適応フィル夕係数の精度劣化を防 いで、 擬似ェコ一信号とエコー信号の差異を小さく し、 エコー抑圧量の 減少を防止できる。
さらに、 出力デジタル信号と低域抑圧受信信号の低域成分をローパス フィル夕で抽出するようにしたので、 比較的簡易な処理で出力デジタル 信号と低域抑圧受信信号の低域成分を求めることができる。 実施の形態 2.
実施の形態 1のダブルトーク検出手段 1 2において、 ダブルトーク検 出は、 式 (4) が不成立でかつ式 ( 5 ) と式 ( 7 ) が成立した場合、 ま たは式 (4) と式 ( 5 ) が不成立でかつ式 ( 6 ) と式 ( 7 ) が成^した 場合をダブルトークと判定するようにした。 しかし、 ここでもし R sが 大きく、 例えば 3 62を超える場合、 すなわち背景雑音の量が少ない場 合は式 (4) が不成立で式 ( 7) が成立する。 このことを以つて式 ( 5 ) と式 ( 6 ) の成立の可否に係わらずダブルトークと判定しても良い。 したがって、 背景雑音の量が少ない場合は Sや Eの値が小さくてもダブ ルトークを正確に検知でき、 しかも背景雑音の量が大きい場合に誤って ダブルトークと判定することも防止される。
以上のように実施の形態 2によれば、 出力デジタル信号に含まれるェ コ一信号がハイパスフィル夕 1 1で低域を抑圧されていることを利用し 、 出力デジタル信号に含まれる背景雑音成分が少ないときに出力デジ夕 ル信号の低周波数領域成分を主に用いてダブルトークの判定を行うよう にしたので、 精度良くダブルトークを判定でき、 適応フィル夕係数の更 新の停止および開始を正しく行い、 適応フィル夕係数の精度劣化を防い で、 擬似エコー信号とエコー信号の差異を小さく し、' エコー抑圧量の減 少を防止できる。 実施の形態 3.
第 4図はこの発明の実施の形態 3によるエコー処理装置の構成を示す ブロック回路図であり、 図において、 1 7はノイズサプレッサである。 その他の構成については、 第 2図と同一であり、 ダブルトーク検出手 段 1 2の動作は実施の形態 2と同一である。
次に動作について説明する。
ノィズサブレヅサ 1 7は AZD変換器 6からの出力デジタル信号を入 力し、 出力デジタル信号に含まれる背景雑音成分を抑圧してダブルトー ク検出手段 1 2に出力する。 この場合の背景雑音成分の抑圧方法として は、 例えば S t e v e n F . B o l 1 , " S u p p r e s s i o n o f A c o u s t i c n o i s e i n s e e c h u s i n g s p e c t r a l s ub t r a c t i o n" , I E E E T r a n s . A S S P . V o l . A S S P - 2 7 , N o . 2 , A p r i 1 1 9 7 9 (文献 4とする) に開示されているスペク トルサブト ラクシヨン法によって行われる。 ダブルトーク検出手段 1 2に入力され る出力デジタル信号に含まれる背景雑音成分の量はノイズサブレッサ 1 7によって減少されているので、 算出される R sの値が大きくなり、 R sが 3 6 2を超える場合が増える。 このため式 ( 5 ) と式 ( 6 ) の成立 の可否に係わらず、 ( 4 ) が不成立で式 ( 7 ) が成立した場合にはダブ ルトークと判定される場合が増え、 Sや Eの値が小さくてもダブルト一 クを正確に検知できる可能性が大きくなる。
なお、 ノイズサブレッサ 1 7はェコ一キヤンセラ手段 7を迂回する位 置に配置され、 ノイズサブレッサ 1 7で背景雑音を抑圧され変形を受け た出力信号はダブルトーク検出手段 1 2に入力されるようにしているの で、 ノイズサブレヅサ 1 7の導入により適応フィル夕手段 8で生成する 擬似エコー信号が劣化することはない。
以上のように実施の形態 3によれば、 ノィズサブレッサ 1 7で出力デ ジ夕ル信号に含まれる背景雑音成分を抑圧するようにしたので、 出力デ ジ夕ル信号に背景雑音が含まれる場合でも精度良くダブルトークを判定 でき、 適応フィルタ係数の更新の停止および開始を正しく行い、 適応フ ィル夕係数の精度劣化を防いで、 擬似エコー信号とエコー信号の差異を 小さく し、 エコー抑圧量の減少を防止できる。 実施の形態 4 .
第 5図はこの発明の実施の形態 4によるエコー処理装置の構成を示す ブロック回路図であり、 図において、 1 3は設定周波数を記憶する記憶 手段、 1 4は記憶手段 1 3の設定周波数を読み出し、 ハイパスフィルタ 1 5およびダブルトーク検出手段 1 6に出力する制御 C P Uである。 また、 ハイパスフィル夕 1 5は予め異なる遮断周波数を有する複数の フィル夕素子からなり、 制御 C P U 1 4から出力された設定周波数に対 応した遮断周波数を選択し設定するハイパスフィルタ、 1 6は予め異な る遮断周波数を有する複数のフィル夕素子を持つローパスフィル夕から なり、 制御 C P U 14から出力された設定周波数に対応した遮断周波数 を選択し設定するダブルトーク検出手段である。
その他の構成については、 第 2図と同一である。
次に動作について説明する。
一般にスビーカ 3が再生できる低域周波数の下限は、 そのスピーカの 性能によって異なる。 予めハイパスフィル夕 1 5には、 スピーカ 3で想 定される再生可能な低域下限周波数に対応し、 複数の遮断周波数を持つ フィルタ素子を用意する。 例えば、 スピーカ 3で予想される再生可能な 低域下限周波数が 3 00 H z〜 6 00 H zであれば、 1 0 0 H zおきに 3 0 0 H z、 40 0 H z、 5 0 0 H z、 6 0 0 H zの 4種類の遮断周波 数を持つフィル夕素子を用意する。 同様に、 ダブルトーク検出手段 1 6 内の口一パスフィル夕も 3 0 0 H z〜 6 0 0 H zまで 1 0 O H z間隔で 4種類の遮断周波数を持つフィル夕素子を保持する。
記憶手段 1 3には、 例えば ROMで構成され、 設計時にスピーカ 3の 再生可能な低域下限周波数を測定し、 それに対応した設定周波数を決め 、 製造時に記憶させておく。 制御 C P U 1 4は、 記憶手段 1 3が記憶し ているこの設定周波数の値を読み出し、 ハイパスフィル夕 1 5とダブル トーク検出手段 1 6に出力する。
ハイパスフィルタ 1 5は、 この設定周波数の値に対応する遮断周波数 、 例えば、 設定周波数が 40 0 H zの場合は遮断周波数 40 0 H zのフ ィル夕素子を選択して受信信号の低域成分を抑圧し、 低域抑圧受信信号 を出力する。
同様にダブルトーク検出手段 1 6は、 この設定周波数の値に対応する 遮断周波数を持つフィル夕素子を選択して出力デジタル信号と低域抑圧 受信信号との高域成分を抑圧する。 そして、 第 2図で説明したダブルト —ク検出手段 1 2 と同様の処理で X h , X I, S , S l、 Eをそれそれ 求め、 例えば、 式 ( 8 ) 〜式 ( 1 0 ) を用いてダブル トークの判定を行
Ό o
X h < p 1 · · ( 8 )
S + a ( S l - p 4 xX l )
> p 2 XX h (但し p 2 ≤ 0 . 5 ) · ■ · ( 9 )
E > p 3 x S · ■ · ( 1 0 ) これら条件式によ り、 式 ( 8 ) が成立した場合は、 受信信号が無音で ある と判定する。
また、 式 ( 8 ) が不成立でかつ式 ( 9 ) が成立した場合は、 ダブル ト ークである と判定する。
さらに、 式 ( 8 ) と式 ( 9 ) が不成立でかつ式 ( 1 0 ) が成立した場 合は、 エコー抑圧量が小さ く、 エコー信号以外の入力音が多いことによ るダブル トークと判定する。 '
ここで、 式 ( 8 ) 〜式 ( 1 0 ) 中の p iから p 4は所定の定数であ り 、 使用環境に応じて決定されるが、 例えば、 p 1 = 1 0 02、 p 2 二 0 . 5、 p 3 = 0 . 5 s p 4 = 1 .0 とする。 また、. 式 ( 8 ) では低域抑圧受 信信号の平均パワー X hを用いて受信信号が無音であるか否かを判定し たが、 ハイパスフィル夕 1 5 を通る前の受信信号の平均パワー Xを求め て式 ( 8 ) に適用してもよい。
また、 式 ( 9 ) のひの値は、 出力デジタル信号と低域抑圧受信信号の 低域パワー S 1 , X 1の式 ( 9 ) における寄与度を表すパラメ一夕であ り、 制御 C P U 1 4から入力した設定周波数の値が高ければ大きく、 低 ければ小さ く設定されるようにする。 例えば、 設定周波数が 3 0 0 H z ならば = 1 .0、 4 0 0 H zならばひ = 1 .2、 6 0 0 H zならばひ = 1 . 5 に設定する。 これは、 設定周波数、 すなわち低域下限周波数の値 が高ければ、 出力デジタル信号がエコー信号のみの場合とエコー信号と 近端話者の音声信号とからなる場合とで S 1の差が拡大し、 S 1のダブ ル トークを判定するためのパラメ一夕と しての信頼性が向上することに よるもので、 信頼性の高い S 1の寄与度ひを増やすことでダブル トーク の判定精度が向上できる。
第 6図はこの発明の実施の形態 4に係るフ ィル夕の動作を示す説明図 であり、 ダブル トーク検出手段 1 6の口一パスフィル夕を通過した出力 デジタル信号の周波数特性を示したものである。 図において、 ( a ) は 出力デジタル信号がエコー信号のみで口一パスフィル夕の低域下限周波 数が低い場合であ り、 ( b ) は同じ信号構成で低域下限周波数が高い場 合である。 また、 ( c ) は出力デジタル信号がエコー信号と近端話者の 音声信号からなり 口一パスフィル夕の低域下限周波数が低い場合であ り
、 ( d ) は同じ信号構成で低域下限周波数が高い場.合である。 ( a ) と ( c ) のパワー差よ り ( b ) と ( d ) のパワー差の方が大き く、 口一パ スフィル夕の低域下限周波数が高い方が S 1の信頼性が高いことが分る 以上のように、 この実施の形態 4によれば、 異なる遮断周波数を持つ 複数のフィル夕素子からなるハイパスフ ィル夕 1 5内に用意し、 同様に 異なる遮断周波数を持つ複数のフィル夕素子からなるローパスフ ィル夕 をダブル トーク検出手段 1 6内に用意し、 記憶装置 1 3に記憶された設 定周波数の倩報に従ってハイパスフ ィル夕および口一パスフィル夕の遮 断周波数を切り替えるようにしたので、 スピーカ 3の種類が変わって遮 断周波数が変更される場合でもハイパスフ ィル夕およびローパスフ ィ ル 夕を新たに導入する必要が無く、 記憶手段 1 3の設定周波数を書き換え るだけで簡易に対応できる。
また、 ハイパスフィル夕とローパスフィル夕の遮断周波数に応じてダ ブル トーク条件式における出力デジタル信号の低域パワーの寄与度を変 更させるようにしたので、 精度良くダブルトークを判定でき、 適応フィ ル夕係数の更新の停止および開始を正しく行い、 適応フィル夕係数の精 度劣化を防いで、 擬似エコー信号とエコー信号の差異を小さく し、 ェコ 一抑圧量の減少を防止できる。 実施の形態 5 .
実施の形態 1〜実施の形態 4で説明したダブルトーク検出手段 1 2 , 1 6では、 出力デジタル信号の高域成分をローパスフィル夕で抑圧して 低域パワーを求めた。 これらに代わって、 出力デジタル信号を高速フー リェ変換 ( F F T ) を用いてパワースぺク トルに変換し、 パワースぺク トル上の遮断周波数以下の成分を加算することにより低域パワーを求め ても良い。
以上のように、 この実施の形態 5によれば、 F F Tを用いて周波数軸 上で低域パワーを求めるようにしたので、 第 3図の (h ) に示される口 一パスフィル夕特性、 すなわち遮断周波数以降の抑圧特性に若干の傾斜 を持つ口一パスフィル夕に比べ、 傾斜がなく急峻に低域を切り出してパ ヮ一を求めることができ、 精度の良い低域パワーを求めることができる
産業上の利用可能性
以上のように、 この発明に係るエコー処理装置は、 スピーカから出力 されて反響路を経てマイクに入力される音響エコーを低減するのに適し ている。 .

Claims

請 求 の 範 囲 1 . デジタル信号からなる受信信号の低周波数領域成分を抑圧するハ ィパスフィル夕と、 前記ハイパスフィルタを通過した低域抑圧受信信号 を音声信号に変換する D / A変換器と、 前記音声信号に基づいた音響を 出力するスピーカと、 このスピーカから出力される音響のエコーが入力 される可能性のあるマイクと、 このマイクよ り出力される音声信号をデ ジ夕ル信号に変換する A Z D変換器と、 前記ハイパスフィル夕を通過し て得られる低域抑圧受信信号に基づいて擬似エコー信号を生成し、 その 擬似エコー信号を前記 A / D変換器によ り出力されたデジタル信号から 差し引いて送信信号を生成するエコーキヤンセラ手段とを備えたエコー 処理装置。
2 . デジタル信号からなる受信信号の低周波数領域成分を抑圧するハ ィパスフィル夕と、 前記ハイパスフィル夕を通過した低域抑圧受信信号 を音声信号に変換する!)/ A変換器と、 前記音声信号に基づいた音響を 出力するスピーカと、 このスピーカから出力される音響のエコーが入力 される可能性のあるマイクと、 このマイクよ り出力される音声信号をデ ジ夕ル信号に変換する A / D変換器と、 前記ハイパスフィル夕を通過し て得られる低域抑圧受信信号に基づいて擬似エコー信号を生成し、 その 擬似エコー信号を前記 A / D変換器により出力されたデジタル信号から 差し引いて送信信号を生成するエコーキヤンセラ手段と、 前記 A / D変 換器によ り出力されたデジタル信号の低周波数領域成分を抽出し、 その 低周波数領域成分に基づいてダブル トーク判定を行い、 そのダブルト一 ク判定に基づいて前記エコーキヤンセラ手段のフィル夕係数更新の停止 および開始を制御するダブル トーク検出手段とを備えたエコー処理装置
3 . ダブルトーク検出手段は、 A / D変換器により出力されたデジ夕 ル信号の低周波数領域成分が小さい場合ほどダブルトークであると判定 しにく くすることを特徴とする請求の範囲第 2項記載のエコー処理装置
4 . ダブルト一ク検出手段は、 A Z D変換器により出力されたデジ夕 ル信号の低周波数領域成分が大きい場合ほどダブルトークであると判定 し易くすることを特徴とする請求の範囲第 2項記載のエコー処理装置。
5 . ダブルトーク検出手段は、 A Z D変換器により出力されたデジ夕 ル信号に含まれる背景雑音成分の量を計算し、 背景雑音成分が小さい場 合、.前記デジタル信号の低周波数領域成分が大きいほどダブルトークで あると判定し易くすることを特徴とする請求の範囲第 2項記載のエコー 処理装置。
6 . A Z D変換器により出力されたデジタル信号の背景雑音成分を抑 圧するノイズサブレッサを備え、 ダブルトーク検出手段は、 このノイズ サブレッサから出力された背景雑音を抑圧された前記デジタル信号を入 力することを特徴とする請求の範囲第 2項記載のエコー処理装置。
7 . ダブルトーク検出手段は、 ハイパスフィル夕の遮断周波数に対応 した遮断周波数を有する口一パスフィル夕により、 A / D変換器によ り 出力されたデジタル信号の低周波数領域成分を抽出することを特徴とす る請求の範囲第 2項記載のエコー処理装置。
8 . 設定周波数を記憶する記憶手段と、 前記記憶手段の設定周波数を 読み出し、 ハイパスフィル夕およびダブルトーク検出手段に出力する制 御 C P Uとを備え、 前記ハイパスフィル夕は、 予め異なる遮断周波数を 有する複数のハイパスフィル夕からなり、 前記制御 C P Uから出力され た設定周波数に対応した遮断周波数のハイパスフィル夕を選択して受信 信号の低周波数領域成分を抑圧し、 前記ダブルトーク検出手段は、 A Z D変換器により出力されたデジタル信号の低周波数領域成分を抽出する 際に、 前記制御 C P Uから出力された設定周波数以下の低周波数領域成 分を抽出することを特徴とする請求の範囲第 2項記載のエコー処理装置
9 . ダブルトーク検出手段は、 A Z D変換器により出力されたデジ夕 ル信号の低周波数領域成分のダブルトーク判定に対する寄与度を、 設定 周波数によって変更することを特徴とする請求の範囲第 8項記載のェコ 一処理装置。
1 0 . ダブルトーク検出手段は、 予め異なる遮断周波数を有する複数 の口一パスフィル夕からなり、 制御 C P Uから出力された設定周波数に 対応した遮断周波数のローパスフィル夕を選択して、 A / D変換器によ り出力されたデジタル信号の高周波数領域成分を抑圧し、 低周波数領域 成分を抽出することを特徴とする請求の範囲第 8項記載のエコー処理装
PCT/JP2002/004860 2001-05-22 2002-05-20 Appareil de traitement d'echos WO2002095975A1 (fr)

Priority Applications (3)

Application Number Priority Date Filing Date Title
EP02771733A EP1300963A4 (en) 2001-05-22 2002-05-20 APPARATUS FOR TREATING ECHOS
JP2002592318A JPWO2002095975A1 (ja) 2001-05-22 2002-05-20 エコー処理装置
US10/333,224 US6868158B2 (en) 2001-05-22 2002-05-20 Echo processing apparatus

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2001152888 2001-05-22
JP2001-152888 2001-05-22

Publications (1)

Publication Number Publication Date
WO2002095975A1 true WO2002095975A1 (fr) 2002-11-28

Family

ID=18997497

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2002/004860 WO2002095975A1 (fr) 2001-05-22 2002-05-20 Appareil de traitement d'echos

Country Status (5)

Country Link
US (1) US6868158B2 (ja)
EP (1) EP1300963A4 (ja)
JP (1) JPWO2002095975A1 (ja)
CN (1) CN1320782C (ja)
WO (1) WO2002095975A1 (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004064366A1 (en) * 2003-01-08 2004-07-29 Philips Intellectual Property & Standards Gmbh Non-linear acoustic echo canceller
WO2005043772A1 (ja) * 2003-11-04 2005-05-12 Oki Electric Industry Co., Ltd. エコーキャンセラ
WO2005086525A1 (ja) * 2004-03-05 2005-09-15 Rohm Co., Ltd フィルタ回路およびそれを利用した再生装置
JP2009246628A (ja) * 2008-03-31 2009-10-22 Yamaha Corp 音響エコー除去装置
JP2015170867A (ja) * 2014-03-04 2015-09-28 沖電気工業株式会社 トーク状態検出器、トーク状態検出方法、エコーキャンセラ及びエコーサプレッサ
JP2019020600A (ja) * 2017-07-18 2019-02-07 富士通株式会社 評価プログラム、評価方法および評価装置

Families Citing this family (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7046794B2 (en) * 2003-12-12 2006-05-16 Motorola, Inc. Double talk activity detector and method for an echo canceler circuit
US7099458B2 (en) 2003-12-12 2006-08-29 Motorola, Inc. Downlink activity and double talk probability detector and method for an echo canceler circuit
EP1704748B1 (en) * 2004-01-07 2008-04-30 Koninklijke Philips Electronics N.V. Audio system providing for filter coefficient copying
KR100582728B1 (ko) * 2004-01-30 2006-05-22 삼성전자주식회사 케이블 모뎀 및 그 케이블 모뎀의 주파수 대역별 필터링방법
JP4613705B2 (ja) * 2005-06-15 2011-01-19 沖電気工業株式会社 エコーキャンセラ
JP4771532B2 (ja) * 2006-02-01 2011-09-14 オンセミコンダクター・トレーディング・リミテッド エコー防止回路及びデジタル信号処理回路
US20080159551A1 (en) * 2006-12-28 2008-07-03 Texas Instruments Incorporated System and Method for Acoustic Echo Removal (AER)
US8077857B1 (en) * 2007-03-14 2011-12-13 Clearone Communications, Inc. Portable speakerphone device with selective mixing
US7912211B1 (en) 2007-03-14 2011-03-22 Clearone Communications, Inc. Portable speakerphone device and subsystem
US8654955B1 (en) 2007-03-14 2014-02-18 Clearone Communications, Inc. Portable conferencing device with videoconferencing option
US8406415B1 (en) 2007-03-14 2013-03-26 Clearone Communications, Inc. Privacy modes in an open-air multi-port conferencing device
GB0725111D0 (en) * 2007-12-21 2008-01-30 Wolfson Microelectronics Plc Lower rate emulation
PL216396B1 (pl) * 2008-03-06 2014-03-31 Politechnika Gdańska Sposób i układ tłumienia echa akustycznego w terminalu VoIP
US20120195423A1 (en) * 2011-01-31 2012-08-02 Empire Technology Development Llc Speech quality enhancement in telecommunication system
WO2012122698A1 (zh) * 2011-03-14 2012-09-20 苏州全波通信技术有限公司 用于覆盖补点的同频转发器的回波消除系统及其方法
JP5175948B2 (ja) * 2011-03-22 2013-04-03 株式会社東芝 映像表示装置、ノイズ除去方法および映像表示システム
CN103428607A (zh) * 2012-05-25 2013-12-04 华为技术有限公司 一种音频信号播放系统及电子设备
JPWO2015128960A1 (ja) * 2014-02-26 2017-03-30 三菱電機株式会社 車載制御装置および車載制御方法
US10373608B2 (en) 2015-10-22 2019-08-06 Texas Instruments Incorporated Time-based frequency tuning of analog-to-information feature extraction
CN111345048A (zh) * 2017-11-14 2020-06-26 日本电信电话株式会社 语音通信装置、语音通信方法、程序
TWI672690B (zh) * 2018-03-21 2019-09-21 塞席爾商元鼎音訊股份有限公司 人工智慧語音互動之方法、電腦程式產品及其近端電子裝置
JP7195344B2 (ja) 2018-07-27 2022-12-23 ドルビー ラボラトリーズ ライセンシング コーポレイション パーベイシブ・リステニングのための強制ギャップ挿入
US10636435B1 (en) * 2018-12-22 2020-04-28 Microsemi Semiconductor (U.S.) Inc. Acoustic echo cancellation using low-frequency double talk detection
CN113035219B (zh) * 2019-12-09 2023-10-31 北京君正集成电路股份有限公司 一种消除回音提高音频质量的方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01198155A (ja) * 1988-02-03 1989-08-09 Hitachi Ltd 拡声電話機
JPH0766756A (ja) * 1993-08-30 1995-03-10 Kyocera Corp 音響エコーキャンセラ
JPH08256089A (ja) * 1995-03-17 1996-10-01 Toshiba Corp エコー打消装置
JPH11289283A (ja) * 1998-03-31 1999-10-19 Sanyo Electric Co Ltd エコー除去方法およびエコーキャンセラ
JP2000101484A (ja) * 1998-09-18 2000-04-07 Fujitsu Ltd エコーキャンセラ

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06202669A (ja) 1992-12-28 1994-07-22 Toshiba Corp 能動消音装置
JP2907091B2 (ja) 1996-01-26 1999-06-21 日本電気株式会社 適応型雑音除去自動車電話装置
JP3139405B2 (ja) 1997-02-28 2001-02-26 日本電気株式会社 エコーキャンセラ

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01198155A (ja) * 1988-02-03 1989-08-09 Hitachi Ltd 拡声電話機
JPH0766756A (ja) * 1993-08-30 1995-03-10 Kyocera Corp 音響エコーキャンセラ
JPH08256089A (ja) * 1995-03-17 1996-10-01 Toshiba Corp エコー打消装置
JPH11289283A (ja) * 1998-03-31 1999-10-19 Sanyo Electric Co Ltd エコー除去方法およびエコーキャンセラ
JP2000101484A (ja) * 1998-09-18 2000-04-07 Fujitsu Ltd エコーキャンセラ

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
HIROSHI RIKIMARU: "Chokakukei ni okeru joho shori no kozo", SURI KAGAKU, vol. 36, no. 1, 1 January 1998 (1998-01-01), pages 22 - 33, XP002955036 *
See also references of EP1300963A4 *
YURIKO TSUKAHARA, SHIGENOBU MINAMI: "Echo canceller-noise canceller heiyo no okeru kadai to taisaku", 5 September 1994, 1994-NEN THE INSTITUTE OF ELECTRONICS, INFORMATION AND COMMUNICATION ENGINEERS SHUKI TAIKAI KOEN RONBUNSHU, B-331, XP002955037 *

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006513627A (ja) * 2003-01-08 2006-04-20 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 非線形音響エコーキャンセラ
WO2004064366A1 (en) * 2003-01-08 2004-07-29 Philips Intellectual Property & Standards Gmbh Non-linear acoustic echo canceller
GB2422280B (en) * 2003-11-04 2008-06-25 Oki Electric Ind Co Ltd Echo canceler
GB2422280A (en) * 2003-11-04 2006-07-19 Oki Electric Ind Co Ltd Echo canceler
WO2005043772A1 (ja) * 2003-11-04 2005-05-12 Oki Electric Industry Co., Ltd. エコーキャンセラ
US7564964B2 (en) 2003-11-04 2009-07-21 Oki Electric Industry Co., Ltd. Echo canceller
WO2005086525A1 (ja) * 2004-03-05 2005-09-15 Rohm Co., Ltd フィルタ回路およびそれを利用した再生装置
JPWO2005086525A1 (ja) * 2004-03-05 2008-01-24 ローム株式会社 フィルタ回路およびそれを利用した再生装置
JP4658924B2 (ja) * 2004-03-05 2011-03-23 ローム株式会社 フィルタ回路およびそれを利用した再生装置
JP2009246628A (ja) * 2008-03-31 2009-10-22 Yamaha Corp 音響エコー除去装置
JP2015170867A (ja) * 2014-03-04 2015-09-28 沖電気工業株式会社 トーク状態検出器、トーク状態検出方法、エコーキャンセラ及びエコーサプレッサ
JP2019020600A (ja) * 2017-07-18 2019-02-07 富士通株式会社 評価プログラム、評価方法および評価装置
JP7143574B2 (ja) 2017-07-18 2022-09-29 富士通株式会社 評価プログラム、評価方法および評価装置

Also Published As

Publication number Publication date
CN1320782C (zh) 2007-06-06
JPWO2002095975A1 (ja) 2004-09-09
US6868158B2 (en) 2005-03-15
CN1463507A (zh) 2003-12-24
US20030156711A1 (en) 2003-08-21
EP1300963A4 (en) 2009-03-04
EP1300963A1 (en) 2003-04-09

Similar Documents

Publication Publication Date Title
WO2002095975A1 (fr) Appareil de traitement d&#39;echos
US7856097B2 (en) Echo canceling apparatus, telephone set using the same, and echo canceling method
JP5036874B2 (ja) エコー消去装置
US8644496B2 (en) Echo suppressor, echo suppressing method, and computer readable storage medium
US8472616B1 (en) Self calibration of envelope-based acoustic echo cancellation
US7826799B2 (en) System for calibrating a hands-free system
US20090238373A1 (en) System and method for envelope-based acoustic echo cancellation
JP4678349B2 (ja) 通話判定装置
JP3406590B2 (ja) 音声通信装置、およびエコー処理プロセッサ
US20090103743A1 (en) Echo canceller
US6377679B1 (en) Speakerphone
JP2004165888A (ja) ハウリング処理装置
US8208623B2 (en) Echo processing method and device
WO2020203258A1 (ja) エコー抑圧装置、エコー抑圧方法及びエコー抑圧プログラム
JP4887181B2 (ja) エコー防止装置及びプログラム
JP2006279191A (ja) エコーキャンセラ
JP5183506B2 (ja) ハウリング防止装置
WO2021210473A1 (ja) エコー抑圧装置、エコー抑圧方法及びエコー抑圧プログラム
JP5346350B2 (ja) 反響消去装置とその方法とプログラム
JP3404236B2 (ja) 拡声通話装置
JP4534529B2 (ja) ハウリング抑圧方法及び装置
JP2004228939A (ja) エコー処理装置及び音声処理装置
JP3357284B2 (ja) ダブルトーク検出制御装置およびダブルトーク検出制御方法
JPS6053490B2 (ja) 適応型反響打消装置
JP2004040161A (ja) ハンズフリー携帯電話端末装置

Legal Events

Date Code Title Description
AK Designated states

Kind code of ref document: A1

Designated state(s): CN JP US

AL Designated countries for regional patents

Kind code of ref document: A1

Designated state(s): AT BE CH CY DE DK ES FI FR GB GR IE IT LU MC NL PT SE TR

ENP Entry into the national phase

Ref country code: JP

Ref document number: 2002 592318

Kind code of ref document: A

Format of ref document f/p: F

WWE Wipo information: entry into national phase

Ref document number: 2002771733

Country of ref document: EP

WWE Wipo information: entry into national phase

Ref document number: 10333224

Country of ref document: US

Ref document number: 028017870

Country of ref document: CN

121 Ep: the epo has been informed by wipo that ep was designated in this application
WWP Wipo information: published in national office

Ref document number: 2002771733

Country of ref document: EP