WO2009150776A1 - エコーキャンセラ - Google Patents

エコーキャンセラ Download PDF

Info

Publication number
WO2009150776A1
WO2009150776A1 PCT/JP2009/001668 JP2009001668W WO2009150776A1 WO 2009150776 A1 WO2009150776 A1 WO 2009150776A1 JP 2009001668 W JP2009001668 W JP 2009001668W WO 2009150776 A1 WO2009150776 A1 WO 2009150776A1
Authority
WO
WIPO (PCT)
Prior art keywords
echo
sound source
taps
echo canceller
adaptive filter
Prior art date
Application number
PCT/JP2009/001668
Other languages
English (en)
French (fr)
Inventor
谷口琢也
加藤真
小城戸智能
Original Assignee
三菱電機株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 三菱電機株式会社 filed Critical 三菱電機株式会社
Priority to DE112009001303.1T priority Critical patent/DE112009001303B4/de
Priority to JP2010516728A priority patent/JP4889810B2/ja
Priority to US12/991,607 priority patent/US8130941B2/en
Priority to CN2009801222054A priority patent/CN102057428B/zh
Publication of WO2009150776A1 publication Critical patent/WO2009150776A1/ja
Priority to US13/341,034 priority patent/US8644495B2/en
Priority to US13/340,949 priority patent/US8644494B2/en

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M9/00Arrangements for interconnection not involving centralised switching
    • H04M9/08Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic
    • H04M9/082Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic using echo cancellers

Definitions

  • the present invention relates to an echo canceller particularly suitable for use in a vehicle voice recognition device and a hands-free telephone.
  • the reference signal input from the echo sound source is processed by an adaptive filter to generate an echo removal signal that is transmitted from the echo sound source through the speaker to the microphone.
  • the echo canceller needs to execute echo cancellation processing for each sound source (hereinafter referred to as an echo sound source) that becomes an echo. For this reason, for example, when the maximum number of expected echo sound sources such as 6 to 8 channels is taken into consideration, it is required to mount a processor having high processing capability. Furthermore, in situations where there are fewer echo sources than the maximum number of expected echo sources, there is no need to perform some processing of the adaptive filter, resulting in wasted echo cancellation processing and wasted processor resources. Allocation occurs.
  • the required number of taps differs depending on the environment in which the voice recognition device and the hands-free phone are used.
  • the number of taps is determined assuming the worst environment, the larger the number of taps, the higher the echo cancellation effect.
  • a processor with a very high processing capability is required.
  • Patent Document 3 a technique for reducing the processing of the processor by constantly converting the reference signal of the echo sound source to monaural is known (see, for example, Patent Document 3).
  • Patent Document 3 when only a reference signal is monaural and an echo sound source is used as stereo, the amount of echo cancellation by the adaptive filter may be deteriorated. The more (channels), the higher the possibility.
  • both the reference signal and the sound source to be echoed are made monaural, echo cancellation processing can be performed without causing deterioration in the amount of echo cancellation, but CD (Compact Disc) and DVD (Digital Versatile) are used as echo sound sources.
  • CD Compact Disc
  • DVD Digital Versatile
  • an audio sound source such as Disc
  • TV Television
  • the sense of reality due to stereo or surround is always greatly lost due to monauralization, and there is a problem of having a fatal defect as an AV device.
  • the method of monophonicization is also conceivable only at the time of utterance, but due to the nature of the adaptive filter, learning of filter coefficients is required, so that it is necessary to take sufficient learning time of the adaptive filter before utterance There is also.
  • the present invention has been made to solve the above-described problems, and an object of the present invention is to provide an echo canceller that can obtain more echo canceling effects without depending on the number of echo sound sources.
  • an echo canceller of the present invention is an echo canceller that generates an echo removal signal by filtering a reference signal input from each of sound sources to be echoed by an adaptive filter, wherein the reference signal
  • a sound source number detection unit that detects the number of sound sources that are echoes from the sound source, and a control unit that varies the number of taps of the adaptive filter according to the number of sound sources detected by the sound source number detection unit It is.
  • the echo canceller of the present invention is an echo canceller having a processor that performs echo cancellation processing by filtering a reference signal input from each sound source to be echoed by one or more adaptive filters to generate an echo cancellation signal.
  • a signal power measurement unit that monitors signal power before and after echo cancellation processing of the adaptive filter by the processor;
  • a control unit that determines the effective number or the number of taps of the adaptive filter according to a trade-off between the processing capability of the processor and the echo cancellation effect of the one or more adaptive filters, which is determined by the output of the signal power measurement unit And.
  • An echo canceller of the present invention is an echo canceller having a processor that generates an echo cancellation signal by filtering a reference signal input from each of sound sources to be echoed by one or more adaptive filters, Based on the number of sound sources, the number of sound sources is variable, and the signal power before and after the echo cancellation processing of the adaptive filter is monitored.
  • the processing capability of the processor has as many adaptive filters as the number of sound sources that are echoes.
  • a control unit that controls the sound source number conversion unit to reduce the effective number of echo sound sources when it is determined that the sound source number cannot be processed.
  • echo canceller of the present invention more echo cancellation effects can be obtained without depending on the number of echo sound sources.
  • FIG. 1 is a block diagram showing a configuration of a speech recognition apparatus including an echo canceller according to Embodiment 1 of the present invention and a change in configuration of the echo canceller when the sound source is changed from stereo to monaural.
  • the speech recognition apparatus includes an echo canceller 10, a speech recognition unit 11, a speaker 12 (12L, 12R), a volume adjustment unit 13 (13L, 13R), and a microphone 14. Is done.
  • the echo canceller 10 includes adaptive filters 101 and 102, a sound source number detection unit 103, a storage unit 104, and a control unit 105.
  • the adaptive filters 101 and 102 are filters that self-adapt their transfer functions according to an optimization algorithm such as LMS (Least Mean Square), and are specifically implemented as a DSP as a digital filter that performs digital signal processing.
  • LMS Least Mean Square
  • the sound source number detection unit 103 detects the number of sound sources that are echoes and transfers them to the control unit 105. Here, a change from stereo to monaural is detected and notified to the control unit 105.
  • the storage unit 104 stores filter coefficients (learning data) for the number of taps of the adaptive filters 101 and 102 under the control of the control unit 105.
  • the control unit 105 variably controls the number of taps of the adaptive filters 101 and 102 according to the procedure described later according to the number of sound sources that are echoes detected by the sound source number detection unit 103.
  • control unit 105 saves and stores the filter coefficients of the previous adaptive filters 101 and 102 in the storage unit 104, and processes the same number of taps next time.
  • the filter coefficient is restored from the storage unit 104 and reused.
  • the speech recognition unit 11 obtains the output of the echo canceller 10 as an input signal, and recognizes speech content of a speaker (displayed with a face mark in FIG. 1) collected by the microphone 14.
  • the speech recognition unit 11 converts the input speech into a feature value by a mathematical signal processing method such as Fourier analysis, for example, and an acoustic that indicates the correspondence between the acoustic of the obtained feature and the probability of a phonetic symbol or the like
  • a mathematical signal processing method such as Fourier analysis, for example, and an acoustic that indicates the correspondence between the acoustic of the obtained feature and the probability of a phonetic symbol or the like
  • a basic speech recognition mechanism that indexes models, a dictionary that contains words to be recognized, and a language model that indicates the utterance probability for each application of words in the dictionary, and outputs text based on a probability statistical method Shall be used.
  • the echo canceller 10 takes in, for example, a reproduction sound output from the speakers 12L and 12R by the in-vehicle AV device as a reference signal via the communication lines 15 and 16. Then, the echo canceller 10 uses the microphone 14 to remove the output sounds of the speakers 12L and 12R mixed in the voice uttered by the speaker using the adaptive filters 101 and 102, and delivers the output to the voice recognition unit 11.
  • the echo canceller 10 includes a sound source number detection unit 103, and the control unit 105 switches the adaptive filters 101 and 102 to the tap number “100” while stereo is detected by the sound source number detection unit 103.
  • control is performed to increase (+100) the number of taps of either one of the adaptive filters (here, the adaptive filter 102), and the other adaptive filter (here, the adaptive filter). 101) The echo cancellation process according to 101) is stopped.
  • control unit 105 dynamically changes the number of taps of the adaptive filters 101 and 102 according to the dynamic change in the number of sound sources, for example, for a sound source such as a radio broadcast that switches between stereo and monaural.
  • the echo cancellation process is always realized with an appropriate number of filter taps.
  • by immediately changing the number of taps of the adaptive filters 101 and 102 in accordance with the change in the number of sound sources even when the number of sound sources increases, it is possible to immediately prepare for the main amount of echo cancellation. Become.
  • the output of the echo canceller 10 controlled and generated as described above is transferred to the speech recognition unit 11, and the speech recognition unit 11 recognizes the speech content of the speaker collected by the microphone 14.
  • the voice recognition unit 11 extracts a feature amount from the utterance content, outputs a recognized text by referring to an acoustic model, a dictionary, a language model, and the like (not shown), and transfers the text to a navigation device (not shown). For example, navigation such as destination setting and guidance can be performed by voice input.
  • the control unit 105 performs control so that the number of taps of the adaptive filters 101 and 102 is not changed during and immediately before voice recognition by the voice recognition unit 11. This is a measure for avoiding misrecognition of speech recognition due to disturbance of the filter coefficients of the adaptive filters 101 and 102 during speech recognition.
  • control unit 105 saves (saves) the immediately preceding filter coefficient in the storage unit 104 before executing control to increase the number of taps, and next time the sound source number detection unit 103 detects that the sound source is stereo.
  • the filter coefficient saved immediately before is restored (returned) and used.
  • the learning time of the adaptive filters 101 and 102 can be shortened and the calculation amount required for learning can be reduced.
  • the control unit 105 controls the volume adjustment unit 13 (13L and 13R) to thereby control the speaker.
  • the volume of 12 (12L, 12R) can be limited to an arbitrary level, and this prevents the audio playback sound from the speaker 12 (12L, 12R) from being mixed into the input sound.
  • the echo canceller according to Embodiment 1 of the present invention when the number of echo sound sources is small by changing the number of taps of the adaptive filters 101 and 102 in accordance with the change in the number of sound sources that are echoes. Can further improve the echo cancellation processing capability by using the surplus processing capability of the echo canceller 10 in which the DSP is mounted.
  • the number of taps set in the adaptive filter 102 is set to a number inversely proportional to the number of sound sources to be echoed, so that it is consumed by the increased or decreased number of sound sources, or flexible control according to the excess DSP performance. Is possible.
  • the number of taps of the adaptive filters 101 and 102 is small, and the echo cancellation processing capability is low. Even in this case, mixing of echoes from the microphone 14 can be avoided.
  • FIG. FIG. 2 is a block diagram showing a configuration of a speech recognition apparatus including an echo canceller according to Embodiment 2 of the present invention and a change in the configuration of the echo canceller when the sound source is changed from stereo to monaural.
  • blocks with the same numbers as those in FIG. 1 have the same names and functions as the blocks shown in FIG. 1 unless otherwise specified.
  • the echo canceller according to the second embodiment of the present invention is different from the first embodiment shown in FIG. 1 in that a delay block 106 is included.
  • the number of taps of the adaptive filter 102 is made equivalently variable. That is, here, the number of taps of the adaptive filter 102 is equivalently changed depending on the number of sound sources.
  • Other configurations are the same as those in the first embodiment.
  • the echo canceller 10 refers to, for example, the reproduced sound from the in-vehicle AV device that is output from the speaker 12 (12L, 12R) serving as an echo sound source via the communication lines 15 and 16 as in the first embodiment. Capture as a signal. Then, the echo canceller 10 removes the output sound of the speakers 12 (12L, 12R) mixed in the voice uttered by the speaker using the microphone 14 by the adaptive filters 101, 102, and delivers the output to the voice recognition unit 11. .
  • the echo canceller 10 further includes a delay block 106 in the configuration of the first embodiment. Therefore, the control unit 105 detects the number of sound sources from a reference signal propagating through the communication lines 15 and 16. While stereo is detected in 103, the delay in the delay block 106 is set to 0 samples, and the adaptive filters 101 and 102 are controlled to execute normal echo cancellation processing in stereo. On the other hand, when monaural is detected by the sound source number detection unit 103, the control unit 105 causes the delay block 106 to delay the number of samples corresponding to the number of taps (100) of the adaptive filter 101 by two adaptive filters 101 and 102. By executing the echo canceling process in (5), it is possible to increase the number of taps of the adaptive filters 101 and 102 equivalently, thereby improving the echo canceling performance.
  • the echo canceller 10 includes a storage unit 104, and the control unit 105 filters the learned adaptive filters 101 and 102 before changing the number of delay samples in the delay block 106.
  • the coefficient is saved (saved) in the storage unit 104, and the filter coefficient previously saved in the storage unit 104 is restored (returned) when the sound source number detecting unit 103 detects that the coefficient is stereo next time.
  • the number of delay samples in the delay block 106 is returned to the same value as before the change, and this is used.
  • the learning time of the adaptive filters 101 and 102 can be further shortened, and the calculation amount required for learning can be reduced.
  • the control unit 105 controls the volume adjustment unit 13 (13L and 13R) to thereby control the speaker.
  • the volume of 12 (12L, 12R) can be limited to an arbitrary level, and this prevents the audio playback sound from the speaker 12 (12L, 12R) from being mixed into the input sound.
  • FIG. 3 is a block diagram showing the configuration of a speech recognition apparatus including an echo canceller according to Embodiment 3 of the present invention.
  • the voice recognition device includes an echo canceller 30, a voice recognition unit 31, a speaker 32 serving as an echo sound source, and a microphone 33.
  • the echo canceller 30 optimizes the effective number of the adaptive filters 301 to 304 so as to obtain the maximum echo cancellation effect with the minimum processor resources.
  • the echo canceller 30 includes a processor (DSP), and includes adaptive filters 301 to 304, delay blocks 305 to 307, signal power measuring units 308 to 312 and a control unit 313.
  • the signal power measurement units 308 to 312 monitor the signal power before and after each echo cancellation processing of the adaptive filters 301 to 304 by the DSP and pass it to the control unit 313.
  • the control unit 313 monitors the signal power before and after the echo cancellation processing of the adaptive filters 301 to 304 by the DSP, and determines the effective number of the adaptive filters 301 to 304 based on the outputs of the signal power measuring units 308 to 312. Variable control is performed by a trade-off between the processing capability and the echo cancellation effect by the adaptive filters 301 to 304.
  • the echo canceller 30 takes in, for example, a reproduction sound output from the speaker 32 by the in-vehicle AV device as a reference signal via the communication line 34. Then, the echo canceller 30 uses the microphone 33 to remove the output sound of the speaker 32 mixed in the voice uttered by the speaker using the adaptive filters 301 to 304, and delivers the removed voice to the voice recognition unit 31.
  • the echo canceller 30 has a plurality of adaptive filters 301 to 304 connected in cascade, and the signal power before and after the echo cancellation process, which is the input / output of each adaptive filter 301 to 304, is a signal power measuring unit. Measurement is performed at 308 to 312, and the result is transferred to the control unit 313.
  • the control unit 313 compares the signal power immediately after the input of the microphone 33 with the signal power when passing through each of the adaptive filters 301 to 304, and the adaptive filter 301 The change in signal power is compared with a threshold before and after passing through 304. Then, if the change is lower than the threshold value, the control unit 313 stops the operation of the corresponding adaptive filter (any of 301 to 304), passes the sound through, and releases the processor resources.
  • the echo canceling process is not performed on the useless adaptive filter, and the reproduced sound from the speaker 32 is removed from the speaker input voice with an optimum effective number. Echo cancellation processing can be executed. That is, according to the echo canceller according to the third embodiment, the effective number of adaptive filters 301 to 304 can be optimized so as to obtain the maximum echo cancellation effect with the minimum processor resources.
  • FIG. 4 is a block diagram showing the configuration of a speech recognition apparatus including an echo canceller according to Embodiment 4 of the present invention.
  • the voice recognition apparatus includes an echo canceller 40, a voice recognition unit 41, a speaker 42 serving as an echo sound source, and a microphone 43.
  • the echo canceller 40 here optimizes the number of taps so as to obtain the maximum echo cancellation effect with the minimum number of processor resources.
  • the echo canceller 40 includes a processor (DSP) and includes an adaptive filter 401, signal power measurement units 402 and 403, and a control unit 404.
  • the signal power measuring units 402 and 403 monitor the signal power before and after the echo cancellation processing of the adaptive filter 401 by the DSP and pass it to the control unit 404.
  • the control unit 404 monitors the signal power before and after the echo cancellation processing of the adaptive filter 401 by the DSP, and determines the number of taps of the adaptive filter 401 based on the output of the signal power measuring units 402 and 403 and the adaptive processing capability and adaptation by the DSP. Variable control is performed by a trade-off with the echo cancellation effect by the filter 401.
  • control unit 313 controls to stop the operation of the adaptive filter (any of 301 to 304) that is unnecessary for the echo cancellation processing so as to release the processor resources and to pass the sound through.
  • the signal power measurement units 402 and 403 monitor the signal power before and after the echo cancellation processing of the adaptive filter 401, and sequentially increase or decrease the number of taps, after the echo cancellation processing. Is controlled so that the echo canceling process is executed with the number of taps lowering or increasing by an arbitrary value than the signal power before the echo canceling process.
  • the echo canceller 40 captures, for example, a reproduction sound output from the speaker 42 by an in-vehicle AV device as a reference signal via the communication line 44. Then, the echo canceller 40 uses the microphone 43 to remove the output sound of the speaker 42 mixed in the voice uttered by the speaker using the adaptive filter 401 whose number of taps can be changed by the control unit 404, and after the removal. The voice is delivered to the voice recognition unit 41.
  • the number of taps of the adaptive filter 401 is determined by measuring the signal power before and after the echo cancellation processing by the adaptive filter 401 with the signal power measuring units 402 and 403, and the control unit 404 takes the measured value and compares the magnitude of the signal power. To determine the optimum number of taps. In determining the optimum number of taps, the control unit 404 sequentially increases the number of taps of the adaptive filter 401, and the signal power measured by the signal power measurement unit 402 is greater than the power measured by the signal power measurement unit 403. Also, the number of taps that decreases by an arbitrary value (threshold) is used.
  • the number of taps of the adaptive filter 401 is sequentially decreased, and the signal power measured by the signal power measuring unit 402 is a threshold value that is higher than the signal power measured by the signal power measuring unit 403. It is assumed that the number of taps that rises only.
  • the timing for determining the number of taps is the same as in the first to third embodiments described above, in a state where there is an output sound from the sound source (speaker 42) that is an echo, and the speaker is not speaking toward the microphone 43. That is, the condition is that the voice recognition process is not in progress. As described above, during the voice recognition by the voice recognition unit 41 and immediately before it, the number of taps by the adaptive filter 401 is not changed, so that the erroneous recognition by the voice recognition unit 41 can be avoided.
  • the reproduction sound from the speaker 42 is removed from the input voice of the speaker with the optimum number of taps without performing unnecessary echo cancellation processing by the adaptive filter 401.
  • Echo cancellation processing can be executed. That is, according to the echo canceller according to Embodiment 4 of the present invention, the number of taps of the adaptive filter 401 can be optimized so as to obtain the maximum echo cancellation effect with the minimum processor resources.
  • the control unit 404 determines that the output of the signal power measurement units 402 and 403 does not have a sufficient echo cancellation effect due to insufficient DSP processing capacity and a sufficient number of taps of the adaptive filter 401 cannot be secured.
  • the maximum volume of the speaker 42 serving as an echo sound source may be limited.
  • the controller 404 temporarily limits the volume of the speaker 42 that is an echo sound source when the speaker speaks, the volume of the echo sound source installed at a position close to the microphone 43 that collects the speaker's voice. Only to the limit value. Also, depending on the installation location of the echo sound source, the distance between the microphone 43 that picks up the voice of the speaker and the echo sound source, the sound propagation distance, or a limit value corresponding to the sound propagation attenuation amount is lowered.
  • the control unit 404 stores the filter coefficient of the adaptive filter 401 immediately before the storage unit (not shown). In the case of saving and saving, and processing with the same number of taps next time, the filter coefficient saved earlier from the storage unit is restored and reused.
  • FIG. FIG. 5 is a block diagram showing the configuration of a speech recognition apparatus including an echo canceller according to Embodiment 5 of the present invention.
  • the speech recognition apparatus includes an echo canceller 50, a speech recognition unit 51, an N-channel echo sound source 52, an echo sound source number conversion unit 53, a speaker 54 (541 to 546), and a microphone. 55.
  • the echo canceller 50 can automatically change the number of channels of the echo sound source 52 in accordance with the required number of taps of the adaptive filters 501 to 506.
  • the echo sound source number conversion unit 53 has a function of reducing the number of channels of the echo sound source 52 based on a predetermined condition.
  • downmix refers to a process in which the playback intended by the producer is converted to a smaller number of channels than the original, for example, stereo, when the surround software cannot be played back in the original format.
  • the echo canceller 50 includes, for example, six adaptive filters 501 to 506 having a variable number of taps in order to remove the sound of the echo sound source 52 of 6 channels mixed in the voice of the speaker collected by the microphone 55. Have.
  • the echo canceller 50 further includes signal power measuring units 507 and 508 for measuring signal power before and after the echo cancellation processing by the cascaded adaptive filters 501 to 506, and echoes of the adaptive filters 501 to 506 as will be described later.
  • the signal power before and after the canceling process is monitored, and if it is determined that the processing capability of the DSP cannot process the adaptive filters 501 to 506 by the number of echo sound sources, the echo sound source number conversion unit 53 is controlled to enable the echo sound source 52.
  • a control unit 509 for reducing the number.
  • the echo canceller 50 takes in, for example, a reproduction sound output from the speaker 54 by an in-vehicle AV device as a reference signal to each of the adaptive filters 501 to 506 via the communication lines 56 to 61.
  • the echo canceller 50 uses the microphone 55 to remove the output sound of the speaker 54 (541 to 546) mixed in the voice uttered by the speaker using the adaptive filters 501 to 506 by the control unit 509, and after the removal Is delivered to the speech recognition unit 51.
  • the control unit 509 compares the output values of the signal power measurement units 507 and 508 and the change values before and after passing through the adaptive filters 501 to 506 measured by the signal power measurement units 507 and 508 with threshold values.
  • the echo sound source number conversion unit 53 is controlled via the communication line 62, and processing for reducing the number of channels of the echo sound source 52 by downmix processing is executed.
  • the control unit 509 stops the operation of the adaptive filter (any one of 501 to 506) corresponding to the reduced channel, and the processing capacity of the DSP remaining due to the stop is changed to any one of the remaining adaptive filters (501 to 506). Assigned to the increase in the number of taps.
  • control unit 509 compares the output of the signal power measurement units 507 and 508 and the change value measured by the signal power measurement units 507 and 508 with a threshold value, and the echo cancellation amount is excessive. If it is determined that there is, control is performed so as not to reduce the number of channels of the echo sound source 52 by controlling the echo sound source number conversion unit 53 via the communication line 62, or the number of channels of the echo sound source 52 is less than 6 channels. If there is, the echo sound source number conversion unit 53 is controlled to increase the number of channels up to six by surround processing and output to the speakers 54 (541 to 546). At this time, the control unit 509 performs echo cancellation processing by operating all of the six adaptive filters 501 to 506 connected in cascade.
  • the adaptive filters 501 to 506 In an environment where the number of taps is not so large, it is possible to provide an echo canceller capable of performing echo cancellation with a multi-channel sound source. That is, according to the echo canceller according to the fifth embodiment, the number of channels of the echo sound source 52 can be automatically changed according to the required number of taps of the adaptive filters 501 to 506.
  • the echo cancellation processing by the adaptive filters 501 to 506 prepared for the number of echo sound sources 52 cannot be performed. Further, by performing the downmix processing of the echo sound source 52 and reducing the sound reduction number, the echo cancellation processing can be performed according to the processing capability of the DSP. Further, the number of taps of the adaptive filters 501 to 506 is temporarily increased by decreasing the echo sound source 52 by downmixing, so that the echo cancellation effect cannot be obtained temporarily. Even under circumstances, it is possible to reduce the number of echo sound sources 52 and increase the number of taps of the adaptive filters 501 to 506 to obtain a sufficient echo cancellation effect.
  • the adaptive filter 501 performs processing by canceling downmixing of the echo sound source 52 or performing stereo / surround conversion to increase the number of sound sources.
  • surplus DSP processing capability can be utilized to increase the presence of music or the like that will be the echo sound source 52.
  • downmix processing is performed to reduce the number of echo sound sources 52 and increase the number of taps of the adaptive filters 501 to 506. It is possible to increase the upper limit of the volume of the sound source that is an echo that can be recognized.
  • the functions of the constituent blocks included in the echo canceller 10 (30, 40, 50) according to the first to fifth embodiments of the present invention described above may be realized by hardware, or at least A part may be realized by software.
  • the control unit 105 (Embodiments 1 and 2) that changes the number of taps of the adaptive filters 101 and 102 according to the number of sound sources detected by the sound source number detection unit 103, the effective number of the adaptive filters 301 to 304,
  • the number of taps of the adaptive filter 401 is determined by the output of the signal power measuring units 308 to 312 or the signal power measuring units 402 and 403, and the processing capability by the processor and one or more adaptive filters (301 to 304 or 401)
  • the control unit 313 or 404 (Embodiments 3 and 4) that can be made variable by a trade-off with the echo cancellation effect by the above) and the signal power before and after the echo cancellation processing of the adaptive filters 501 to 506 are monitored, and the processing the processor has The ability cannot process the adaptive filters 501 to 506
  • the data processing in the control unit 509 (the fifth embodiment) that controls the echo sound source number converting unit 53 to reduce the effective number of echo sound sources 52 may be realized by hardware.
  • at least a part of the program may be realized on a computer by one or more programs.
  • the echo canceller according to the present invention is input from each of the sound sources that are echoes in order to obtain more echo cancellation effects without depending on the number of echo sound sources.
  • An echo canceller for generating an echo removal signal by filtering a reference signal using an adaptive filter, the number of sound sources detecting the number of sound sources that become the echo from the reference signal, and detected by the number of sound sources Since it is configured to include a control unit that varies the number of taps of the adaptive filter according to the number of sound sources, a vehicle-mounted speaker is conventionally used for voice recognition in a vehicle-mounted navigation device or a voice input to a microphone in a hands-free phone. Remove the music, voice, etc. output by, and recognize only the voice of the speaker, or call the other party It is suitable for use such as an echo canceller which can be transmitted to.

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Telephone Function (AREA)
  • Fittings On The Vehicle Exterior For Carrying Loads, And Devices For Holding Or Mounting Articles (AREA)

Abstract

 エコーとなる音源のそれぞれから入力される参照信号を適応フィルタ101、102により濾波してエコー除去信号を生成するエコーキャンセラ10であって、参照信号からエコーとなる音源の数を検知する音源数検知部103と、音源数検知部103で検知された音源の数に応じて適応フィルタ101、102のタップ数を可変とする制御部105と、により構成される。

Description

エコーキャンセラ
 この発明は、特に、車載用の音声認識装置やハンズフリー電話に用いて好適な、エコーキャンセラに関するものである。
 車載ナビゲーション装置における音声認識、あるいは、ハンズフリー電話において、従来、マイクロフォンに入力される音声から車載スピーカにより出力される音楽、音声等を除去し、話者の音声だけを音声認識し、あるいは電話で相手方へ伝えることのできるエコーキャンセラが知られている(例えば、特許文献1、2参照)。
 上記した特許文献1、2に開示されるように、エコー音源から入力される参照信号を適応フィルタで処理することにより、エコー音源からスピーカを伝ってマイクロフォンに混入するエコー除去信号を生成するタイプのエコーキャンセラは、エコーとなる音源(以下、エコー音源という)の各々に対して、エコーキャンセル処理を実行する必要がある。
 このため、例えば、6チャンネル~8チャンネル等、想定される最大のエコー音源数を考慮した場合、高い処理能力を持ったプロセッサの搭載が求められる。さらに、想定される最大のエコー音源数よりも少ないエコー音源数しかない状況においては、適応フィルタのいくつかの処理を行う必要がなくなるため、エコーキャンセル処理に無駄が発生し、プロセッサリソースの無駄な割当が生じる。
 また、適応フィルタにおいて、必要なタップ数は、音声認識装置、ハンズフリー電話が用いられる環境によって異なり、最悪の環境を想定してタップ数を決定した場合、タップ数が多いほどエコーキャンセル効果が高い仕組みになっているため、非常に処理能力の高いプロセッサを求められる。
 このため、従来、AV機器用音声認識装置において、エコー音源の参照信号を常にモノラル化することにより、プロセッサの処理を軽減する技術が知られている(例えば、特許文献3参照)。この技術を採用することによりエコー音源の数は常に一つとなるため、エコー音源数の減少により、エコーキャンセルの処理に無駄が出ることは無い。
特開2000-231399号公報 特開2003-99100号公報 特開2001-100785号公報
 しかしながら、特許文献3に開示された技術によれば、参照信号のみモノラル化し、エコーとなる音源をステレオとして用いた場合、適応フィルタによるエコーキャンセル量に劣化が生じる可能性があり、エコー音源の数(チャンネル)が多ければ多いほどその可能性が高くなる。
 なお、参照信号とエコーとなる音源の両方をモノラル化すれば、エコーキャンセル量に劣化を生じさせること無くエコーキャンセル処理を行うことができるが、エコー音源としてCD(Compact Disc)、DVD(Digital Versatile Disc)、TV(Television)等のオーディオ音源を選択した場合、モノラル化により常にステレオやサラウンドによる音の臨場感が大幅に失われてしまい、AV機器としては致命的な欠陥を有する問題がある。
 また、発話時のみ、モノラル化するという方法も考えられるが、適応フィルタの性質上、フィルタ係数の学習を必要とするため、発話するまでに十分な適応フィルタの学習時間をとらなければならないという問題もある。
 この発明は上記した課題を解決するためになされたものであり、エコー音源の数の大小に依存することなく、より多くのエコーキャンセル効果が得られる、エコーキャンセラを提供することを目的とする。
 上記した課題を解決するために、この発明のエコーキャンセラは、エコーとなる音源のそれぞれから入力される参照信号を適応フィルタにより濾波してエコー除去信号を生成するエコーキャンセラであって、前記参照信号から前記エコーとなる音源の数を検知する音源数検知部と、前記音源数検知部で検知された音源の数に応じて前記適応フィルタのタップ数を可変とする制御部と、を備えたものである。
 また、この発明のエコーキャンセラは、エコーとなる音源のそれぞれから入力される参照信号を1以上の適応フィルタにより濾波してエコー除去信号を生成し、エコーキャンセル処理を行うプロセッサを備えたエコーキャンセラであって、前記プロセッサによる前記適応フィルタのエコーキャンセル処理前後における信号電力を監視する信号電力計測部と、
前記適応フィルタの有効数、もしくはタップ数を、前記信号電力計測部の出力により判定される、前記プロセッサによる処理能力と前記1以上の適応フィルタによるエコーキャンセル効果とのトレードオフにより可変とする制御部と、を備えたものである。
 また、この発明のエコーキャンセラは、エコーとなる音源のそれぞれから入力される参照信号を1以上の適応フィルタにより濾波してエコー除去信号を生成するプロセッサを有するエコーキャンセラであって、所定の条件に基づき前記エコー音源の数を可変とする音源数変換部と、前記適応フィルタのエコーキャンセル処理前後における信号電力を監視し、前記プロセッサが有する処理能力では前記エコーとなる音源の数だけ前記適応フィルタを処理できないと判定された場合、前記音源数変換部を制御して前記エコー音源の有効数を減少させる処理を行う制御部と、を備えたものである。
 この発明のエコーキャンセラによれば、エコー音源の数の大小に依存することなく、より多くのエコーキャンセル効果を得ることができる。
この発明の実施の形態1に係るエコーキャンセラを含む音声認識装置の構成と、音源がステレオからモノラルに変化した場合のエコーキャンセラの構成の変化を示すブロック図である。 この発明の実施の形態2に係るエコーキャンセラを含む音声認識装置の構成と、音源がステレオからモノラルに変化した場合のエコーキャンセラの構成の変化を示すブロック図である。 この発明の実施の形態3に係るエコーキャンセラを含む音声認識装置の構成を示すブロック図である。 この発明の実施の形態4に係るエコーキャンセラを含む音声認識装置の構成を示すブロック図である。 この発明の実施の形態5に係るエコーキャンセラを含む音声認識装置の構成を示すブロック図である。
 以下、この発明をより詳細に説明するために、この発明を実施するための形態について、添付の図面に従って説明する。
実施の形態1.
 図1は、この発明の実施の形態1に係るエコーキャンセラを含む音声認識装置の構成と、音源がステレオからモノラルに変化した場合のエコーキャンセラの構成の変化を示すブロック図である。
 図1に示されるように、音声認識装置は、エコーキャンセラ10と、音声認識部11と、スピーカ12(12L、12R)と、音量調整部13(13L、13R)と、マイクロフォン14と、により構成される。
 エコーキャンセラ10は、適応フィルタ101、102と、音源数検知部103と、記憶部104と、制御部105と、を有する。
 適応フィルタ101、102は、例えば、LMS(Least Mean Square)等の最適化アルゴリズムにしたがいその伝達関数を自己適応させるフィルタであり、具体的にはデジタル信号処理を行うデジタルフィルタとしてDSP実装される。
 音源数検知部103は、エコーとなる音源の数を検知して制御部105へ転送する。ここでは、ステレオからモノラルに変化したことを検知して制御部105へ通知する。記憶部104には、制御部105による制御の下で、適応フィルタ101、102のタップ数分のフィルタ係数(学習データ)が記憶されている。
 制御部105は、音源数検知部103で検知されたエコーとなる音源の数に応じて後述する手順にしたがい適応フィルタ101、102のタップ数を可変制御する。制御部105はまた、適応フィルタ101、102のタップ数を変化させる際に、直前における適応フィルタ101、102のフィルタ係数を記憶部104にセーブして保存し、次回、同じタップ数で処理する場合に、記憶部104からそのフィルタ係数をリストアして再利用する。
 音声認識部11は、エコーキャンセラ10の出力を入力信号として得、マイクロフォン14により集音された話者(図1中、顔マークで表示)の発話内容を音声認識する。
 音声認識部11は、入力された音声を、例えばフーリエ解析等の数学的信号処理手法により特徴量に変換し、ここで得られる特徴量の音響と発音記号等の確率との対応付けを示す音響モデル、認識対象の単語をデータベース化した辞書、ならびに辞書にある単語のアプリケーション毎の発話確率を示す言語モデル等を索引し、確率統計的な手法に基づきテキストを出力する基本的な音声認識の仕組みを利用するものとする。
 上記構成において、エコーキャンセラ10は、スピーカ12L、12Rから出力される、例えば、車載AV機器による再生音を、通信ライン15、16を介して参照信号として取り込む。そして、エコーキャンセラ10は、マイクロフォン14を用いて話者が発する音声に混入するスピーカ12L、12Rの出力音を適応フィルタ101、102により除去してその出力を音声認識部11に引き渡す。
 ここで、エコーキャンセラ10は、音源数検知部103を備えており、制御部105は、音源数検知部103でステレオが検知されている間は、適応フィルタ101、102を、タップ数「100」でそれぞれ動作させるが、モノラルが検知された場合は、いずれか一方の適応フィルタ(ここでは適応フィルタ102)のタップ数を増加(+100)させるように制御し、他方の適応フィルタ(ここでは適応フィルタ101)によるエコーキャンセル処理を停止制御する。
 すなわち、制御部105は、音源の数の動的変化に応じて、動的に適応フィルタ101、102のタップ数を変化させることにより、例えば、ステレオとモノラルが切り替わるラジオ放送のような音源に対しても、常に適切なフィルタタップ数でエコーキャンセル処理を実現する。また、音源数の変化に応じて適応フィルタ101、102のタップ数を即時に変化させることにより、音源の数が増加した場合にも、即時に適切なエコーキャンセル量を主とする準備が可能になる。
 上記のように制御され生成されるエコーキャンセラ10の出力は、音声認識部11へ転送され、音声認識部11で、マイクロフォン14により集音された話者の発話内容を音声認識する。音声認識部11は、発話内容から特徴量を抽出し、不図示の音響モデル、辞書、ならびに言語モデル等を参照することにより認識されたテキストを出力して不図示のナビゲーション装置等へ転送し、音声入力による、例えば、目的地設定、誘導等のナビゲーションを行なうことができる。
 なお、制御部105は、音声認識部11による音声認識中、およびその直前では適応フィルタ101、102のタップ数を変化させないように制御する。これは、音声認識中に適応フィルタ101、102のフィルタ係数が乱れることによる音声認識の誤認識を回避するための措置である。
 また、制御部105は、タップ数を増やす制御を実行する前に、直前のフィルタ係数を記憶部104にセーブ(退避)させておき、次回、音源数検知部103においてステレオであることが検知された場合に、直前にセーブしたフィルタ係数をリストア(復帰)し、これを用いる。このことにより、適応フィルタ101、102の学習時間を短縮するとともに、学習に要する演算量の削減にも貢献できる。これにより、この発明の実施の形態1に係るエコーキャンセラによれば、適応フィルタ101、102のタップ数が頻繁に変化するような利用環境にあっても、最小のフィルタ係数での適応処理時間で即座にエコーキャンセル効果を得ることかできる。
 なお、適応フィルタ101、102で、スピーカ12(12L、12R)からの再生音を十分に除去しきれない場合、制御部105は、音量調整部13(13L、13R)を制御することにより、スピーカ12(12L、12R)の音量を任意のレベルに制限することができ、このことにより、入力音声へのスピーカ12(12L、12R)からのAV再生音等の混入を防止することができる。
 上記したこの発明の実施の形態1に係るエコーキャンセラによれば、エコーとなる音源の数の変化に応じて、適応フィルタ101、102のタップ数を変化させることにより、エコー音源の数が少ない場合にはDSPが実装されたエコーキャンセラ10の余剰の処理能力を利用して、さらにエコーキャンセル処理能力を向上させることができる。
 なお、このとき、適応フィルタ102に設定されるタップ数は、エコーとなる音源の数に反比例する数とすることで、増減した音源数によって消費され、あるいは余剰のDSP性能に応じた柔軟な制御が可能になる。
 また、適応フィルタ101、102のタップ数に応じて、エコーとなる音源(スピーカ12L、12R)の最大音量を制限することにより、適応フィルタ101、102のタップ数が少なく、エコーキャンセル処理能力が低い場合でも、マイクロフォン14からのエコーの混入を回避することができる。
実施の形態2.
 図2は、この発明の実施の形態2に係るエコーキャンセラを含む音声認識装置の構成と、音源がステレオからモノラルに変化した場合のエコーキャンセラの構成の変化を示すブロック図である。図2において、図1と同じ番号が付されたブロックは、特に断りがないかぎり図1に示すブロックと同じ名称、機能を有するブロックとする。
 図2に示されるように、この発明の実施の形態2に係るエコーキャンセラにおいて、図1に示す実施の形態1との差異は、遅延ブロック106を有し、遅延ブロック106により、適応フィルタ101のタップ数相当分のサンプルを遅延させることにより、適応フィルタ102のタップ数を等価的に可変としたことにある。すなわち、ここでは、音源の数によって適応フィルタ102のタップ数を等価的に変化させている。他の構成は、実施の形態1と同様である。
 上記構成において、エコーキャンセラ10は、実施の形態1同様、エコー音源となるスピーカ12(12L、12R)から出力される、例えば、車載AV機器による再生音を、通信ライン15、16を介して参照信号として取り込む。そして、エコーキャンセラ10は、マイクロフォン14を用いて話者が発する音声に混入するスピーカ12(12L、12R)の出力音を、適応フィルタ101、102により除去してその出力を音声認識部11に引き渡す。
 ここで、エコーキャンセラ10は、実施の形態1が有する構成に、更に遅延ブロック106を有しており、このため、制御部105は、通信ライン15、16を伝播する参照信号から音源数検知部103でステレオが検知されている間は、遅延ブロック106での遅延を0サンプルとし、適応フィルタ101、102を制御して通常のステレオでのエコーキャンセル処理を実行する。
 一方、制御部105は、音源数検知部103でモノラルが検知された場合には、遅延ブロック106により適応フィルタ101のタップ数分(100)のサンプル数だけ遅延させ、2つの適応フィルタ101、102でエコーキャンセル処理を実行させることにより、等価的に適応フィルタ101、102のタップ数を増加させることができ、このことにより、エコーキャンセルの性能を向上させている。
 なお、先に説明した実施の形態1では、適応フィルタ101、102のタップ切り替えを実行するため、適応化のための学習をやり直す必要があるが、上記した実施の形態2では、適応フィルタ102については既に学習を終えてあり、したがって、他方の適応フィルタ101についてのみ学習処理を実行すれば良いため、実施の形態1に比して学習処理に要する時間、およびこのための演算量を削減できる効果が得られる。
 また、実施の形態1同様、エコーキャンセラ10は、記憶部104を有しており、制御部105は、遅延ブロック106の遅延サンプル数を変化させる前に、学習済みの適応フィルタ101、102のフィルタ係数を記憶部104にセーブ(退避)して保存し、次回、音源数検知部103においてステレオであることが検知された場合に、先に記憶部104にセーブしたフィルタ係数をリストア(復帰)して遅延ブロック106の遅延サンプル数を変更前と同じ値に戻し、これを用いることとする。このことにより、適応フィルタ101、102の学習時間を更に短縮するとともに、学習に要する演算量の削減にも貢献できる。
 なお、適応フィルタ101、102で、スピーカ12(12L、12R)からの再生音を十分に除去しきれない場合、制御部105は、音量調整部13(13L、13R)を制御することにより、スピーカ12(12L、12R)の音量を任意のレベルに制限することができ、このことにより、入力音声へのスピーカ12(12L、12R)からのAV再生音等の混入を防止することができる。
実施の形態3.
 図3は、この発明の実施の形態3に係るエコーキャンセラを含む音声認識装置の構成を示すブロック図である。
 図3に示されるように、音声認識装置は、エコーキャンセラ30と、音声認識部31と、エコー音源となるスピーカ32と、マイクロフォン33と、により構成される。以下に説明するように、ここでは、エコーキャンセラ30は、最小限度のプロセッサリソースで最大のエコーキャンセル効果を得るように、適応フィルタ301~304の有効数を最適化する。
 エコーキャンセラ30にはプロセッサ(DSP)が実装されており、適応フィルタ301~304と、遅延ブロック305~307と、信号電力計測部308~312と、制御部313と、を有する。
 信号電力計測部308~312は、DSPによる適応フィルタ301~304の各エコーキャンセル処理前後における信号電力を監視して制御部313へ引き渡す。制御部313は、DSPによる適応フィルタ301~304のエコーキャンセル処理前後における信号電力を監視し、適応フィルタ301~304の有効数を、信号電力計測部308~312の出力により判定される、DSPによる処理能力と適応フィルタ301~304によるエコーキャンセル効果とのトレードオフにより可変制御する。
 上記構成において、エコーキャンセラ30は、スピーカ32から出力される、例えば、車載AV機器による再生音を、通信ライン34を介して参照信号として取り込む。そして、エコーキャンセラ30は、マイクロフォン33を用いて話者が発する音声に混入するスピーカ32の出力音を適応フィルタ301~304を使用して除去し、除去後の音声を音声認識部31に引き渡す。
 図3に示されるように、エコーキャンセラ30は、複数の適応フィルタ301~304を縦続接続しており、各適応フィルタ301~304の入出力であるエコーキャンセル処理前後における信号電力を信号電力計測部308~312でそれぞれ計測し、結果を制御部313に引き渡す構成になっている。
 制御部313は、音声認識処理中でないとき(話者が話していない時)、マイクロフォン33の入力直後の信号電力と、各適応フィルタ301~304通過時の信号電力とを比較し、適応フィルタ301~304の通過前と通過後で信号電力の変化を閾値と比較する。そして、制御部313は、変化が閾値より低ければ、該当する適応フィルタ(301~304のいずれか)の動作を停止制御して音を素通りさせ、それにかかるプロセッサリソースを解放する。
 上記したこの発明の実施の形態3に係るエコーキャンセラによれば、無駄な適応フィルタについてはエコーキャンセル処理を行わず、最適な有効数でスピーカ32からの再生音を話者の入力音声から除去するエコーキャンセル処理を実行することができる。すなわち、実施の形態3に係るエコーキャンセラによれば、最小限度のプロセッサリソースで最大のエコーキャンセル効果を得るように適応フィルタ301~304の有効数を最適化することができる。
実施の形態4.
 図4は、この発明の実施の形態4に係るエコーキャンセラを含む音声認識装置の構成を示すブロック図である。
 図4に示されるように、音声認識装置は、エコーキャンセラ40と、音声認識部41と、エコー音源となるスピーカ42と、マイクロフォン43と、により構成される。以下に説明するように、エコーキャンセラ40は、ここでは、最小限度のプロセッサリソースで最大のエコーキャンセル効果を得るようにタップ数を最適化する。
 エコーキャンセラ40にはプロセッサ(DSP)が実装されており、適応フィルタ401と、信号電力計測部402、403と、制御部404と、を有する。
 信号電力計測部402、403は、DSPによる適応フィルタ401のエコーキャンセル処理前後における信号電力を監視して制御部404へ引き渡す。制御部404は、DSPによる適応フィルタ401のエコーキャンセル処理前後における信号電力を監視し、適応フィルタ401のタップ数を、信号電力計測部402、403の出力により判定される、DSPによる処理能力と適応フィルタ401によるエコーキャンセル効果とのトレードオフにより可変制御する。
 上記した実施の形態3では、制御部313は、プロセッサリソースを解放するためにエコーキャンセル処理に不要な適応フィルタ(301~304のいずれか)の動作を停止制御して音を素通りさせることとしたが、以下に説明する実施の形態4では、信号電力計測部402、403により適応フィルタ401のエコーキャンセル処理前後における信号電力を監視し、タップ数を、順次、増加もしくは減少させ、エコーキャンセル処理後の信号電力がエコーキャンセル処理前の信号電力よりも任意の値だけ低下する、もしくは上昇するタップ数でエコーキャンセル処理を実行させるように制御するものである。
 具体的に、エコーキャンセラ40は、スピーカ42から出力される、例えば、車載AV機器による再生音を、通信ライン44を介して参照信号として取り込む。そして、エコーキャンセラ40は、マイクロフォン43を用いて話者が発する音声に混入するスピーカ42の出力音を、制御部404によりタップ数を変更可能な適応フィルタ401を使用して除去し、除去後の音声を音声認識部41に引き渡す。
 このとき、適応フィルタ401のタップ数は、適応フィルタ401によるエコーキャンセル処理前後における信号電力を信号電力計測部402、403で計測し、制御部404がその計測値を取込み、信号電力の大小を比較することにより最適タップ数として決定される。
 制御部404は、上記した最適タップ数を決定するにあたり、適応フィルタ401のタップ数を順次増加させて行き、信号電力計測部402で計測した信号電力が、信号電力計測部403で計測した電力よりも任意の値(閾値)だけ低下するタップ数を用いることとする。あるいは、十分にエコーが消去されている環境下では、適応フィルタ401のタップ数を順次減少させ、信号電力計測部402で計測した信号電力が、信号電力測定部403で測定した信号電力よりも閾値だけ上昇するタップ数を用いることとする。
 なお、タップ数を決定するタイミングは、上記した実施の形態1~3同様、エコーとなる音源(スピーカ42)からの出力音がある状態で、話者がマイクロフォン43に向かって発話していない、すなわち、音声認識処理中でない状態であることを条件とする。このように、音声認識部41による音声認識中とその直前は、適応フィルタ401によるタップ数の変更を行なわないことにより、音声認識部41による誤認識を回避することができる。
 上記したこの発明の実施の形態4に係るエコーキャンセラによれば、適応フィルタ401による無駄なエコーキャンセル処理を行わず、最適なタップ数でスピーカ42からの再生音を話者の入力音声から除去するエコーキャンセル処理を実行することができる。すなわち、この発明の実施の形態4に係るエコーキャンセラによれば、最小限度のプロセッサリソースで最大のエコーキャンセル効果を得るように適応フィルタ401のタップ数を最適化することができる。
 なお、制御部404は、信号電力計測部402、403の出力により、DSPの処理能力が足りず、必要な適応フィルタ401のタップ数を確保できないことにより十分なエコーキャンセル効果が得られないと判定した場合には、エコー音源となるスピーカ42の最大音量を制限してもよい。また、制御部404は、話者の発話時にエコー音源となるスピーカ42の音量を一時的に制限する場合、話者の音声を集音するマイクロフォン43に近い位置に設置されているエコー音源の音量のみ制限値まで下げることとする。また、エコー音源の設置場所により、話者の音声を拾うマイクロフォン43と、エコー音源との間の距離または音声伝搬距離または音声伝搬減衰量に応じた制限値まで下げることとする。
 また、上記したように、話者の発話時にエコー音源(スピーカ42)の音量を一時的に制限する場合、話者に対してエコー音源が制限されて低下するものであることを、例えば、音声認識装置に周辺装置として接続されるLCDモニタ(不図示)に表示し、もしくは音声合成器(不図示)を介して音声出力により報知するものとする。
 また、上記した実施の形態4においても、実施の形態1~3同様、制御部404は、適応フィルタ401のタップ数を変化させる際に、直前における適応フィルタ401のフィルタ係数を不図示の記憶部にセーブして保存、次回、同じタップ数で処理する場合に、記憶部から先にセーブしたフィルタ係数をリストアして再利用することとする。
実施の形態5.
 図5は、この発明の実施の形態5に係るエコーキャンセラを含む音声認識装置の構成を示すブロック図である。
 図5に示されるように、音声認識装置は、エコーキャンセラ50と、音声認識部51と、Nチャンネルのエコー音源52と、エコー音源数変換部53と、スピーカ54(541~546)と、マイクロフォン55と、により構成される。エコーキャンセラ50は、以下に説明するように、必要な適応フィルタ501~506のタップ数に応じて自動的にエコー音源52のチャンネル数を変化させることができる。
 なお、エコー音源数変換部53は、後述するように、所定の条件に基づきエコー音源52のチャンネル数を減少させる機能を有し、ここでは、ダウンミックス/サラウンド変換を行なうこととする。
 ここで、ダウンミックスとは、サラウンドソフトをオリジナルフォーマットで再生できない場合に、製作者の意図した再生をオリジナルより少ないチャンネル数、例えば、ステレオに変換して行なう処理をいう。
 エコーキャンセラ50は、マイクロフォン55で集音した話者の音声に混入される、例えば、6チャンネルのエコー音源52の音を除去するために、タップ数を可変とする6つの適応フィルタ501~506を有している。
 エコーキャンセラ50は、更に、縦続接続された適応フィルタ501~506によるエコーキャンセル処理前後のそれぞれにおける信号電力を測定する信号電力計測部507、508と、後述するように、適応フィルタ501~506のエコーキャンセル処理前後における信号電力を監視し、DSPが有する処理能力ではエコー音源の数だけ適応フィルタ501~506を処理できないと判定された場合、エコー音源数変換部53を制御してエコー音源52の有効数を減少させる制御部509と、を有する。
 上記構成において、エコーキャンセラ50は、スピーカ54から出力される、例えば、車載AV機器による再生音を、通信ライン56~61を介し、適応フィルタ501~506のそれぞれに参照信号として取り込む。そして、エコーキャンセラ50は、マイクロフォン55を用いて話者が発する音声に混入するスピーカ54(541~546)の出力音を、制御部509により適応フィルタ501~506を使用して除去し、除去後の音声を音声認識部51に引き渡す。
 エコーキャンセラ50において、制御部509は、信号電力計測部507、508の出力ならびに、信号電力計測部507、508により計測される適応フィルタ501~506通過前後における変化値と閾値との比較により、エコーキャンセル量が十分でないと判定された場合、通信ライン62を介してエコー音源数変換部53を制御し、ダウンミックス処理によりエコー音源52のチャンネル数を減らす処理を実行する。同時に、制御部509は、減らしたチャンネルに該当する適応フィルタ(501~506のいずれか)の動作を停止させ、停止により余剰したDSPの処理能力を、残りの各適応フィルタ(501~506のいずれか)のタップ数の増加分に割り当てる。
 一方、これとは逆に、制御部509は、信号電力計測部507、508の出力ならびに、信号電力計測部507、508により計測される変化値と閾値との比較により、エコーキャンセル量が過剰であると判定された場合、通信ライン62を介してエコー音源数変換部53を制御してエコー音源52のチャンネル数を減らさない制御を行うか、あるいは、エコー音源52のチャンネル数が6チャンネル未満であればエコー音源数変換部53を制御してサラウンド処理によりチャンネル数を最大6チャンネルまで増やしてスピーカ54(541~546)に出力させる。このとき、制御部509は、縦続接続された6個の適応フィルタ501~506の全てを動作させることにより、エコーキャンセル処理を実行する。
 上記の処理により、スピーカ54(541~546)の音量が大きい等、適応フィルタ501~506のタップ数が必要な環境であっても十分なエコーキャンセル効果が得られ、同時に、適応フィルタ501~506のタップ数がそれほど必要の無い環境では多チャンネル音源によるエコーキャンセルが可能なエコーキャンセラを提供することができる。すなわち、実施の形態5に係るエコーキャンセラによれば、必要な適応フィルタ501~506のタップ数に応じて自動的にエコー音源52のチャンネル数を変化させることができる。
 上記したこの発明の実施の形態5に係るエコーキャンセラによれば、一時的に利用可能なDSP処理能力が少なく、エコー音源52の数だけ用意された適応フィルタ501~506によるエコーキャンセル処理ができない場合に、エコー音源52のダウンミックス処理を行い、音減数を減らすことにより、DSPの処理能力に応じてエコーキャンセル処理が可能になる。
 また、エコー音源52をダウンミックスして減らした分、適応フィルタ501~506のタップ数を増やすことにより、一時的に適応フィルタ501~506のタップ数が少なく、エコーキャンセル効果が得られないような状況下にあってもエコー音源52の数を減らし、適応フィルタ501~506のタップ数を増やして、十分なエコーキャンセル効果を得ることができる。
 さらに、エコーキャンセル量が十分あり、DSPの処理能力に余剰がある場合は、エコー音源52のダウンミックスを取りやめるか、ステレオ/サラウンド変換する処理を行なって音源数を増やし、処理を行う適応フィルタ501~506の数を増やすことにより、余剰のDSP処理能力を活用して、エコー音源52となる音楽等の臨場感を増やすことができる。また、エコー音源52の設定音量が大きくなるほど、ダウンミックス処理を行ってエコー音源52の数を減らし、適応フィルタ501~506のタップ数を増やすことにより、これを音声認識に用いた場合に、音声認識が可能なエコーとなる音源の音量の上限値を上げることができる。
 なお、上記したこの発明の実施の形態1~実施の形態5に係るエコーキャンセラ10(30、40、50)が有する各構成ブロックの機能は、全てをハードウェアによって実現しても、あるいはその少なくとも一部をソフトウェアで実現してもよい。
 例えば、音源数検知部103で検知された音源の数に応じて適応フィルタ101、102のタップ数を可変とする制御部105(実施の形態1、2)、適応フィルタ301~304の有効数、もしくは適応フィルタ401のタップ数を、信号電力計測部308~312、あるいは信号電力計測部402、403の出力により判定される、プロセッサによる処理能力と、1以上の適応フィルタ(301~304、または401)によるエコーキャンセル効果とのトレードオフにより可変とする制御部313あるいは404(実施の形態3、4)、そして、適応フィルタ501~506のエコーキャンセル処理前後における信号電力を監視し、プロセッサが有する処理能力ではエコーとなる音源の数だけ適応フィルタ501~506を処理できないと判定された場合、エコー音源数変換部53を制御してエコー音源52の有効数を減少させる処理を行う制御部509(実施の形態5)におけるデータ処理は、ハードウェアで実現してもよく、また、その少なくとも一部を、1または複数のプログラムによりコンピュータ上で実現してもよい。
 以上のように、この発明に係るエコーキャンセラは、エコー音源の数の大小に依存することなく、より多くのエコーキャンセル効果が得られるようにするために、エコーとなる音源のそれぞれから入力される参照信号を適応フィルタにより濾波してエコー除去信号を生成するエコーキャンセラであって、前記参照信号から前記エコーとなる音源の数を検知する音源数検知部と、前記音源数検知部で検知された音源の数に応じて前記適応フィルタのタップ数を可変とする制御部を備えるよう構成したので、車載ナビゲーション装置における音声認識、あるいは、ハンズフリー電話において、従来、マイクロフォンに入力される音声から車載スピーカにより出力される音楽、音声等を除去し、話者の音声だけを音声認識し、あるいは電話で相手方へ伝えることのできるエコーキャンセラなどに用いるのに適している。

Claims (24)

  1.  エコーとなる音源のそれぞれから入力される参照信号を適応フィルタにより濾波してエコー除去信号を生成するエコーキャンセラであって、
     前記参照信号から前記エコーとなる音源の数を検知する音源数検知部と、
     前記音源数検知部で検知された音源の数に応じて前記適応フィルタのタップ数を可変とする制御部と、
     を備えたことを特徴とするエコーキャンセラ。
  2.  前記制御部は、
     前記適応フィルタのタップ数を、前記エコーとなる音源の数に反比例した数とすることを特徴とする請求項1記載のエコーキャンセラ。
  3.  遅延ブロックを備え、
     前記制御部は、
     前記遅延ブロックを制御して前記適応フィルタのタップ数相当分のサンプルを遅延させ、等価的に前記適応フィルタのタップ数を可変とすることを特徴とする請求項1記載のエコーキャンセラ。
  4.  前記制御部は、
     前記適応フィルタのタップ数に応じて、前記エコーとなる音源の最大音量の抑制量を変化させることを特徴とする請求項1記載のエコーキャンセラ。
  5.  前記制御部は、
     前記エコーとなる音源の数の動的変化に応じて、前記適応フィルタのタップ数を動的に変化させることを特徴とする請求項1記載のエコーキャンセラ。
  6.  前記制御部は、
     前記適応フィルタのタップ数を、前記エコーとなる音源の数に応じて即時に変更することを特徴とする請求項5記載のエコーキャンセラ。
  7.  エコーとなる音源のそれぞれから入力される参照信号を1以上の適応フィルタにより濾波してエコー除去信号を生成し、エコーキャンセル処理を行うプロセッサを備えたエコーキャンセラであって、
     前記プロセッサによる前記適応フィルタのエコーキャンセル処理前後における信号電力を監視する信号電力計測部と、
     前記適応フィルタの有効数、もしくはタップ数を、前記信号電力計測部の出力により判定される、前記プロセッサによる処理能力と前記1以上の適応フィルタによるエコーキャンセル効果とのトレードオフにより可変とする制御部と、
     を備えたことを特徴とするエコーキャンセラ。
  8.  前記制御部は、
     前記信号電力計測部により各適応フィルタのエコーキャンセル処理前後における信号電力を監視し、前記信号電力の変化が閾値より少ない適応フィルタについては前記エコーキャンセル処理を省略することを特徴とする請求項7記載のエコーキャンセラ。
  9.  前記制御部は、
     前記信号電力計測部により前記適応フィルタのエコーキャンセル処理前後における信号電力を監視し、前記タップ数を、順次、増加もしくは減少させ、前記エコーキャンセル処理後の信号電力がエコーキャンセル処理前の信号電力よりも任意の値だけ低下する、もしくは上昇するタップ数により前記エコーキャンセル処理を実行させることを特徴とする請求項7記載のエコーキャンセラ。
  10.  前記制御部は、
     前記信号電力計測部の出力により、前記プロセッサの処理能力が足りず、必要な適応フィルタのタップ数を確保できないことにより十分なエコーキャンセル効果が得られないと判定された場合には、前記エコー音源の最大音量を一時制限することを特徴とする請求項7記載のエコーキャンセラ。
  11.  前記制御部は、
     話者の発話時に前記エコー音源の音量を一時的に制限する場合、話者の音声を拾うマイクロフォンに近い位置に設置されている前記エコー音源の音量のみ、制限値まで下げることを特徴とする請求項4記載のエコーキャンセラ。
  12.  前記制御部は、
     話者の発話時に前記エコー音源の音量を一時的に制限する場合、話者の音声を拾うマイクロフォンに近い位置に設置されている前記エコー音源の音量のみ、制限値まで下げることを特徴とする請求項10記載のエコーキャンセラ。
  13.  前記制御部は、
     話者の発話時に前記エコー音源の音量を一時的に制限する場合、前記エコー音源の音量を、前記エコー音源の設置場所により、話者の音声を拾うマイクロフォンと、前記エコー音源との間の距離または音声伝搬距離または音声伝搬減衰量に応じた制限値まで下げることを特徴とする請求項4記載のエコーキャンセラ。
  14.  前記制御部は、
     話者の発話時に前記エコー音源の音量を一時的に制限する場合、前記エコー音源の音量を、前記エコー音源の設置場所により、話者の音声を拾うマイクロフォンと、前記エコー音源との間の距離または音声伝搬距離または音声伝搬減衰量に応じた制限値まで下げることを特徴とする請求項10記載のエコーキャンセラ。
  15.  前記制御部は、
     話者の発話時に前記エコー音源の音量を一時的に制限する場合、話者に対し、エコー音源が制限されて低下するものであることを報知することを特徴とする請求項4記載のエコーキャンセラ。
  16.  前記制御部は、
     話者の発話時に前記エコー音源の音量を一時的に制限する場合、話者に対し、エコー音源が制限されて低下するものであることを報知することを特徴とする請求項10記載のエコーキャンセラ。
  17.  音声認識部を備え、
     前記制御部は、
     前記音声認識部による音声認識中とその直前に、前記適応フィルタによるタップ数を変化させないことを特徴とする請求項5記載のエコーキャンセラ。
  18.  音声認識部を備え、
     前記制御部は、
     前記音声認識部による音声認識中とその直前に、前記適応フィルタによるタップ数を変化させないことを特徴とする請求項7記載のエコーキャンセラ。
  19.  記憶部を備え、
     前記制御部は、
     前記適応フィルタのタップ数を変化させる際に、直前における前記適応フィルタのフィルタ係数を前記記憶部にセーブし、次回、同じタップ数で処理する場合に、前記記憶部から前記フィルタ係数をリストアして再利用することを特徴とする請求項5記載のエコーキャンセラ。
  20.  記憶部を備え、
     前記制御部は、
     前記適応フィルタのタップ数を変化させる際に、直前における前記適応フィルタのフィルタ係数を前記記憶部にセーブし、次回、同じタップ数で処理する場合に、前記記憶部から前記フィルタ係数をリストアして再利用することを特徴とする請求項7記載のエコーキャンセラ。
  21.  エコーとなる音源のそれぞれから入力される参照信号を1以上の適応フィルタにより濾波してエコー除去信号を生成するプロセッサを有するエコーキャンセラであって、
     所定の条件に基づき前記エコー音源の数を可変とする音源数変換部と、
     前記適応フィルタのエコーキャンセル処理前後における信号電力を監視し、前記プロセッサが有する処理能力では前記エコーとなる音源の数だけ前記適応フィルタを処理できないと判定された場合、前記音源数変換部を制御して前記エコー音源の有効数を減少させる処理を行う制御部と、
     を備えたことを特徴とするエコーキャンセラ。
  22.  前記制御部は、
     前記エコー音源の数を前記音源数変換部により減少させた分だけ、前記適応フィルタのタップ数を増加させることを特徴とする請求項21記載のエコーキャンセラ。
  23.  前記制御部は、
     前記適応フィルタのエコーキャンセル処理前後における信号電力を監視して前記プロセッサの処理能力に余剰があると判定された場合、前記音源数変換部を制御して前記エコーとなる音源を減少させる処理を停止するか、前記エコーとなる音源の数を増やして前記適応フィルタの有効数を増加させることを特徴とする請求項21記載のエコーキャンセラ。
  24.  前記制御部は、
     前記エコー音源の設定音量を監視し、前記設定音量が大きくなるほど前記音源数変換部を制御して前記エコー音源の有効数を減らし、前記適応フィルタのタップ数を増加させることを特徴とする請求項21記載のエコーキャンセラ。
PCT/JP2009/001668 2008-06-11 2009-04-10 エコーキャンセラ WO2009150776A1 (ja)

Priority Applications (6)

Application Number Priority Date Filing Date Title
DE112009001303.1T DE112009001303B4 (de) 2008-06-11 2009-04-10 Echokompensator
JP2010516728A JP4889810B2 (ja) 2008-06-11 2009-04-10 エコーキャンセラ
US12/991,607 US8130941B2 (en) 2008-06-11 2009-04-10 Echo canceler
CN2009801222054A CN102057428B (zh) 2008-06-11 2009-04-10 回声消除器
US13/341,034 US8644495B2 (en) 2008-06-11 2011-12-30 Echo canceler
US13/340,949 US8644494B2 (en) 2008-06-11 2011-12-30 Echo canceler

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2008-153071 2008-06-11
JP2008153071 2008-06-11

Related Child Applications (3)

Application Number Title Priority Date Filing Date
US12/991,607 A-371-Of-International US8130941B2 (en) 2008-06-11 2009-04-10 Echo canceler
US13/341,034 Division US8644495B2 (en) 2008-06-11 2011-12-30 Echo canceler
US13/340,949 Division US8644494B2 (en) 2008-06-11 2011-12-30 Echo canceler

Publications (1)

Publication Number Publication Date
WO2009150776A1 true WO2009150776A1 (ja) 2009-12-17

Family

ID=41416491

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2009/001668 WO2009150776A1 (ja) 2008-06-11 2009-04-10 エコーキャンセラ

Country Status (5)

Country Link
US (3) US8130941B2 (ja)
JP (2) JP4889810B2 (ja)
CN (3) CN103152499B (ja)
DE (1) DE112009001303B4 (ja)
WO (1) WO2009150776A1 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011114695A (ja) * 2009-11-27 2011-06-09 Nippon Telegr & Teleph Corp <Ntt> エコーキャンセル方法、エコーキャンセル装置、エコーキャンセルプログラム
JP2011114696A (ja) * 2009-11-27 2011-06-09 Nippon Telegr & Teleph Corp <Ntt> エコーキャンセル方法、エコーキャンセル装置、エコーキャンセルプログラム
JP2012181374A (ja) * 2011-03-01 2012-09-20 Toshiba Corp テレビジョン装置及び遠隔操作装置
JP2012216998A (ja) * 2011-03-31 2012-11-08 Toshiba Corp 信号処理装置及び信号処理方法

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102780511B (zh) * 2012-07-30 2014-10-08 华为技术有限公司 回声抵消器、数据传输系统和回声抵消的方法
US9232072B2 (en) 2013-03-13 2016-01-05 Google Inc. Participant controlled spatial AEC
US9251806B2 (en) 2013-09-05 2016-02-02 Intel Corporation Mobile phone with variable energy consuming speech recognition module
WO2016013667A1 (ja) * 2014-07-24 2016-01-28 株式会社エー・アール・アイ エコーキャンセラ装置
JP2016201631A (ja) * 2015-04-08 2016-12-01 ホシデン株式会社 ハンズフリー通話装置
US9712866B2 (en) 2015-04-16 2017-07-18 Comigo Ltd. Cancelling TV audio disturbance by set-top boxes in conferences
CN104954942A (zh) * 2015-06-10 2015-09-30 百度在线网络技术(北京)有限公司 用于回音消除的信号输入装置和方法
CN105261363A (zh) * 2015-09-18 2016-01-20 深圳前海达闼科技有限公司 一种语音识别的方法、装置及终端
US10177810B2 (en) * 2016-09-02 2019-01-08 Marvell World Trade Ltd. Systems and methods for echo or interference cancellation power-saving management in a communication system
DE102017212980B4 (de) * 2017-07-27 2023-01-19 Volkswagen Aktiengesellschaft Verfahren zur Kompensation von Störgeräuschen bei einer Freisprecheinrichtung in einem Kraftfahrzeug und Freisprecheinrichtung
US10200540B1 (en) * 2017-08-03 2019-02-05 Bose Corporation Efficient reutilization of acoustic echo canceler channels
CN111201712B (zh) * 2017-09-25 2023-04-21 全球硅片有限公司 自适应滤波器
CN109831733B (zh) * 2019-02-26 2020-11-24 北京百度网讯科技有限公司 音频播放性能的测试方法、装置、设备和存储介质
JP7270140B2 (ja) 2019-09-30 2023-05-10 パナソニックIpマネジメント株式会社 音声処理システム及び音声処理装置
US10811029B1 (en) * 2019-10-31 2020-10-20 Amazon Technologies, Inc. Cascade echo cancellation for asymmetric references
JP7365642B2 (ja) 2020-03-18 2023-10-20 パナソニックIpマネジメント株式会社 音声処理システム、音声処理装置及び音声処理方法
CN112992171B (zh) * 2021-02-09 2022-08-02 海信视像科技股份有限公司 一种显示设备及消除麦克风接收回声的控制方法

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04119713A (ja) * 1990-09-10 1992-04-21 Fujitsu Ltd 適応フィルタ係数推定時に使用する修正定数の設定方法
JPH09130306A (ja) * 1995-10-31 1997-05-16 Toshiba Corp 拡声通話装置およびエコーキャンセラ
JP2001077728A (ja) * 1999-09-07 2001-03-23 Oki Electric Ind Co Ltd エコーキャンセラ、及びその動作方法
JP2001100785A (ja) * 1999-07-28 2001-04-13 Matsushita Electric Ind Co Ltd Av機器用音声認識装置
JP2002237770A (ja) * 2001-02-09 2002-08-23 Nippon Telegr & Teleph Corp <Ntt> 多チャネルエコー消去方法、その装置及びプログラム記録媒体
JP2006148375A (ja) * 2004-11-18 2006-06-08 Oki Electric Ind Co Ltd エコー除去方法、エコーキャンセラ及び電話中継装置
JP2006314051A (ja) * 2005-05-09 2006-11-16 Mitsubishi Electric Corp エコー消去装置
JP2007515911A (ja) * 2003-12-23 2007-06-14 タンドベルク・テレコム・エイ・エス ステレオ音声を向上させるためのシステム及び方法

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0762804B1 (en) * 1995-09-08 2008-11-05 Fujitsu Limited Three-dimensional acoustic processor which uses linear predictive coefficients
US5909384A (en) * 1996-10-04 1999-06-01 Conexant Systems, Inc. System for dynamically adapting the length of a filter
JP3396393B2 (ja) * 1997-04-30 2003-04-14 沖電気工業株式会社 エコー・雑音成分除去装置
JP3236242B2 (ja) * 1997-05-12 2001-12-10 沖電気工業株式会社 エコーキャンセラ装置
JP3361724B2 (ja) * 1997-06-11 2003-01-07 沖電気工業株式会社 エコーキャンセラ装置
JP4068182B2 (ja) * 1997-06-30 2008-03-26 株式会社東芝 適応フィルタ
JP2000231399A (ja) 1999-02-10 2000-08-22 Oki Electric Ind Co Ltd 騒音低減装置
US6665645B1 (en) * 1999-07-28 2003-12-16 Matsushita Electric Industrial Co., Ltd. Speech recognition apparatus for AV equipment
US7920697B2 (en) * 1999-12-09 2011-04-05 Broadcom Corp. Interaction between echo canceller and packet voice processing
DE60129955D1 (de) * 2000-05-26 2007-09-27 Koninkl Philips Electronics Nv Verfahren und gerät zur akustischen echounterdrückung mit adaptiver strahlbildung
CN101674512A (zh) * 2001-03-27 2010-03-17 1...有限公司 产生声场的方法和装置
JP4396053B2 (ja) * 2001-03-28 2010-01-13 パナソニック電工株式会社 エコー抑圧装置
US7113491B2 (en) * 2001-07-31 2006-09-26 Conexant, Inc. Method and system for varying an echo canceller filter length based on data rate
US20030099285A1 (en) * 2001-07-31 2003-05-29 Graziano Michael J. Method and system for determining data rate using sub-band capacity
JP2003099100A (ja) 2001-09-21 2003-04-04 Matsushita Electric Ind Co Ltd 音声認識装置およびその方法
KR100806769B1 (ko) * 2003-09-02 2008-03-06 닛본 덴끼 가부시끼가이샤 신호 처리 방법 및 장치
EP1633121B1 (en) * 2004-09-03 2008-11-05 Harman Becker Automotive Systems GmbH Speech signal processing with combined adaptive noise reduction and adaptive echo compensation
JP2008042889A (ja) * 2006-06-16 2008-02-21 Ericsson Ab インテリジェント音声制限方法、システム及びノード
JP2008005293A (ja) * 2006-06-23 2008-01-10 Matsushita Electric Ind Co Ltd エコー抑圧装置
CN101179294B (zh) * 2006-11-09 2012-07-04 黄山好视达通信技术有限公司 自适应回声消除器及其回声消除方法
JP2009017029A (ja) * 2007-07-02 2009-01-22 Sony Corp 音声信号処理装置、音声信号処理方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04119713A (ja) * 1990-09-10 1992-04-21 Fujitsu Ltd 適応フィルタ係数推定時に使用する修正定数の設定方法
JPH09130306A (ja) * 1995-10-31 1997-05-16 Toshiba Corp 拡声通話装置およびエコーキャンセラ
JP2001100785A (ja) * 1999-07-28 2001-04-13 Matsushita Electric Ind Co Ltd Av機器用音声認識装置
JP2001077728A (ja) * 1999-09-07 2001-03-23 Oki Electric Ind Co Ltd エコーキャンセラ、及びその動作方法
JP2002237770A (ja) * 2001-02-09 2002-08-23 Nippon Telegr & Teleph Corp <Ntt> 多チャネルエコー消去方法、その装置及びプログラム記録媒体
JP2007515911A (ja) * 2003-12-23 2007-06-14 タンドベルク・テレコム・エイ・エス ステレオ音声を向上させるためのシステム及び方法
JP2006148375A (ja) * 2004-11-18 2006-06-08 Oki Electric Ind Co Ltd エコー除去方法、エコーキャンセラ及び電話中継装置
JP2006314051A (ja) * 2005-05-09 2006-11-16 Mitsubishi Electric Corp エコー消去装置

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011114695A (ja) * 2009-11-27 2011-06-09 Nippon Telegr & Teleph Corp <Ntt> エコーキャンセル方法、エコーキャンセル装置、エコーキャンセルプログラム
JP2011114696A (ja) * 2009-11-27 2011-06-09 Nippon Telegr & Teleph Corp <Ntt> エコーキャンセル方法、エコーキャンセル装置、エコーキャンセルプログラム
JP2012181374A (ja) * 2011-03-01 2012-09-20 Toshiba Corp テレビジョン装置及び遠隔操作装置
US9154848B2 (en) 2011-03-01 2015-10-06 Kabushiki Kaisha Toshiba Television apparatus and a remote operation apparatus
JP2012216998A (ja) * 2011-03-31 2012-11-08 Toshiba Corp 信号処理装置及び信号処理方法

Also Published As

Publication number Publication date
US20110091031A1 (en) 2011-04-21
US8644495B2 (en) 2014-02-04
JP4889810B2 (ja) 2012-03-07
DE112009001303B4 (de) 2016-02-18
JP5562309B2 (ja) 2014-07-30
CN103152498B (zh) 2014-12-31
CN102057428B (zh) 2013-08-14
DE112009001303T5 (de) 2011-05-12
US8130941B2 (en) 2012-03-06
US8644494B2 (en) 2014-02-04
CN102057428A (zh) 2011-05-11
JPWO2009150776A1 (ja) 2011-11-10
CN103152499A (zh) 2013-06-12
US20120099722A1 (en) 2012-04-26
US20120099723A1 (en) 2012-04-26
CN103152499B (zh) 2014-12-10
JP2012070385A (ja) 2012-04-05
CN103152498A (zh) 2013-06-12

Similar Documents

Publication Publication Date Title
JP5562309B2 (ja) エコーキャンセラ
JP4954334B2 (ja) エコー抑制のためのフィルタ係数を演算する装置および方法
US7698133B2 (en) Noise reduction device
EP3791565B1 (en) Method and apparatus utilizing residual echo estimate information to derive secondary echo reduction parameters
US20090046866A1 (en) Apparatus capable of performing acoustic echo cancellation and a method thereof
CN110447069B (zh) 自适应噪声环境的语音信号处理的方法和装置
CN108630219B (zh) 回声抑制音频信号特征跟踪的处理系统、方法及装置
WO2011105006A1 (ja) 通信端末及び通信方法
KR20070015374A (ko) 멀티미디어 훈련 신호를 구비한 음향 반향 제거기
WO2019239977A1 (ja) エコー抑圧装置、エコー抑圧方法およびエコー抑圧プログラム
JP2009094802A (ja) 通信装置
US11323804B2 (en) Methods, systems and apparatus for improved feedback control
KR100754558B1 (ko) 주기 신호 향상 시스템
US11967304B2 (en) Sound pick-up device, sound pick-up method and non-transitory computer-readable recording medium recording sound pick-up program
US11259117B1 (en) Dereverberation and noise reduction
JP4478045B2 (ja) エコー消去装置、エコー消去方法、エコー消去プログラムおよびその記録媒体
WO2020225851A1 (ja) データ補正装置、データ補正方法、およびプログラム
US20140376732A1 (en) Device echo cancellation
JPH09116471A (ja) 音響エコーキャンセラ
CN113347527A (zh) 声学路径的确定方法、装置、可读存储介质及电子设备

Legal Events

Date Code Title Description
WWE Wipo information: entry into national phase

Ref document number: 200980122205.4

Country of ref document: CN

121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 09762208

Country of ref document: EP

Kind code of ref document: A1

WWE Wipo information: entry into national phase

Ref document number: 2010516728

Country of ref document: JP

WWE Wipo information: entry into national phase

Ref document number: 12991607

Country of ref document: US

RET De translation (de og part 6b)

Ref document number: 112009001303

Country of ref document: DE

Date of ref document: 20110512

Kind code of ref document: P

122 Ep: pct application non-entry in european phase

Ref document number: 09762208

Country of ref document: EP

Kind code of ref document: A1