WO2005008910A1 - 通話装置 - Google Patents

通話装置 Download PDF

Info

Publication number
WO2005008910A1
WO2005008910A1 PCT/JP2004/009697 JP2004009697W WO2005008910A1 WO 2005008910 A1 WO2005008910 A1 WO 2005008910A1 JP 2004009697 W JP2004009697 W JP 2004009697W WO 2005008910 A1 WO2005008910 A1 WO 2005008910A1
Authority
WO
WIPO (PCT)
Prior art keywords
signal
unit
end signal
audio
echo
Prior art date
Application number
PCT/JP2004/009697
Other languages
English (en)
French (fr)
Inventor
Koichiro Mizushima
Minoru Matsui
Original Assignee
Matsushita Electric Industrial Co., Ltd.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co., Ltd. filed Critical Matsushita Electric Industrial Co., Ltd.
Priority to US10/545,587 priority Critical patent/US20060245583A1/en
Priority to EP04747166A priority patent/EP1655856A1/en
Publication of WO2005008910A1 publication Critical patent/WO2005008910A1/ja

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M9/00Arrangements for interconnection not involving centralised switching
    • H04M9/08Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic
    • H04M9/082Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic using echo cancellers

Definitions

  • the present invention relates to a communication device, and more particularly to a communication device capable of reliably suppressing echo even when the relative position between a microphone and a speaker changes.
  • a conventional communication device has a single microphone, a speaker and a microphone
  • the conventional communication device disclosed in Japanese Patent Application Laid-Open No. 2000-244600 is located on the near end side of a voice switch 51 that performs simultaneous call processing.
  • a first echo canceller 52 is provided, and a second echo canceller 53 is provided on the opposite side of the first echo canceler 52 with the voice switch 51 interposed therebetween.
  • the first echo canceler 52 generates a pseudo echo based on the transfer function of the sound propagation path from the speech power 54 set to the first echo canceller 52 to the microphone 55, and a subtracter 58 By subtracting the pseudo echo from the near-end signal output from the microphone 55, the echo output due to the sound output from the speaker 54 being collected by the microphone 55 is suppressed. .
  • the second echo canceller 53 is for suppressing the echo generated when the sound collected by the microphone goes around to the speed side when performing “2-4 wire conversion”. In the “4-wire communication device”, the second echo canceller 53 and the voice switch 51 are unnecessary.
  • the coefficients of the transfer function set in the first echo canceller 52 and the second echo canceller 53 are sequentially updated according to the temporal change of the propagation path.
  • a first microphone having a different distance from a speaker.
  • a well-known type that includes a microphone and a second microphone, and effectively suppresses echo contained in the output of the other microphone based on the output of one microphone and microphone.
  • the output of the speaker 54 is detected by the first microphone 55 and the second microphone 56. It has become.
  • the echo suppression characteristics of the echo canceller 57 installed after the first microphone 55 indicate the sound propagation from the speaker 54 to the first microphone 55 and the second microphone 56. Based on the transfer function of the path, the difference between the output of the first microphone 55 and the output of the second microphone 56, which is the output of the subtractor 58, is set to be minimized.
  • JP-A-2000-244670 and JP-A-8-223275 disclose that the echo suppression characteristic of the echo canceller is determined based on the sound propagation path from the speaker to the microphone. Have been.
  • the echo canceller disclosed in JP-A-2000-244670 and JP-A-8-223275 described above is applied to a communication device capable of changing the It can be seen that it is necessary to change according to the relative position between the force and the microphone.
  • JP-A-2000-244670 and JP-A-8-223275 do not disclose or suggest changing the echo suppression characteristic according to the relative position between the speaker and the microphone.
  • the echo cancellers disclosed in JP-A-2000-244670 and JP-A-8-223275 are applied to a communication device capable of changing a relative position between a speaker and a microphone, the speaker and the microphone become incompatible.
  • the relative position of is changed, the echo suppression characteristics of the echo canceller It does not match the propagation path of the voice after the relative position between the speech force and the microphone is changed, and the echo suppression performance is degraded and the communication quality is degraded.
  • the present invention has been made to solve the above-mentioned problem, and an object of the present invention is to provide a communication device capable of maintaining high echo suppression performance even when the relative position between a speaker and a microphone is changed and enabling high-quality communication.
  • the purpose is to provide. Disclosure of the invention
  • the communication device includes a housing having a reference point, a voice output means for outputting a near-end signal as far-end voice, a voice input means for receiving near-end voice, and a voice output means for outputting the voice.
  • Echo suppression means for suppressing the echo generated when the input far-end voice is input to the voice input means, wherein the voice output means comprises a first distance predetermined from the reference point.
  • a far-end signal conversion unit that converts the far-end signal into the far-end voice.
  • the voice input unit is installed at a predetermined second distance from the reference point.
  • a first near-end voice conversion unit that converts the input near-end voice to a first near-end signal, and is installed at a predetermined position based on the first near-end voice conversion unit, Converting the input near-end voice into a second near-end signal
  • a second near-end voice conversion unit wherein the echo suppression means includes: the far-end signal conversion unit and one of the first near-end voice conversion unit or the second near-end voice conversion unit.
  • a current value detection unit that detects a current value of a parameter that defines a relative position between: the far-end voice converted by the far-end signal conversion unit; The present value detection is performed based on a first function having a propagation time propagating to a conversion section as a dependent variable and a second function having a propagation time propagating to the second near-end speech conversion section as a dependent variable.
  • a first propagation time calculating unit that calculates the first propagation time and the second propagation time corresponding to the current value detected by the unit, and a first propagation time calculating unit that calculates the first propagation time and the second propagation time.
  • D that is changed according to the first propagation time and the second propagation time Echo has a configuration including a first suppression after the near-end signal output unit for outputting a first near-end signal after suppression which is suppressed by over suppression characteristics.
  • the first post-suppression near-end signal output unit calculates the first near-end signal converted by the first near-end voice conversion unit into the first propagation time.
  • a first near-end signal delay unit that delays based on the first propagation time calculated by the unit; and a second near-end signal converted by the second near-end voice conversion unit.
  • a second near-end signal delay unit that delays based on the second propagation time calculated by the propagation time calculation unit, and a first delayed near-end signal delayed by the first near-end signal delay unit And a first output unit for outputting a difference between the second delayed near-end signal delayed by the second near-end signal delay unit.
  • the echo suppression unit may further include: a frequency distribution of the first post-suppression near-end signal output from the first post-suppression near-end signal output unit; It has a configuration provided with a first equalizer that equalizes to an equalization characteristic corresponding to the detected current value.
  • the echo suppression unit may be configured to convert the first near-end signal converted by the first near-end voice conversion unit and the second near-end voice conversion unit by the second near-end voice conversion unit.
  • a first near-end position that is a position of the near-end relative to one of the first near-end sound conversion unit or the second near-end sound conversion unit
  • a first near-end person position detecting unit that detects a near-end person position
  • Second equalization for equalizing characteristics corresponding to the current value detected by the value detection unit and the first near-end person position detected by the first near-end person position detection unit And a part.
  • the echo suppression means may include a current position of the near end based on the far end signal conversion unit based on the current value detected by the current value detection unit.
  • a second near-end person position detecting unit that detects a second near-end position that is a position, and a frequency of the first post-suppression near-end signal output from the first post-suppression near-end signal output unit.
  • a third equalizer is a third equalizer.
  • the communication device includes: a housing having a reference point; audio output means for outputting a far-end signal as far-end audio; audio input means for receiving near-end audio; And echo suppression means for suppressing echo generated when the far-end voice output from the voice input means is input to the voice input means, wherein the voice output means includes a first predetermined voice signal from the reference point.
  • a far-end signal converter for converting the far-end signal into the far-end voice, the voice input means being disposed at a second predetermined distance from the reference point;
  • a first near-end speech converter for converting the input near-end speech into a first near-end signal, and a first near-end speech converter provided at a predetermined position based on the first near-end speech converter.
  • the input near-end voice is converted to a second near-end signal
  • a second near-end audio converter for converting, the echo suppressing means is any one of the far-end signal converter and the first near-end audio converter or the second near-end audio converter.
  • a current value detection unit that detects a current value of a parameter that defines a relative position between the first and the second near-end voice conversion units, wherein the parameter is an independent variable, and the near-end voice propagates to the first near-end voice conversion unit.
  • a third function having a third propagation time as a dependent variable and a fourth function having a fourth propagation time at which the near-end speech propagates to the second near-end speech converter as a dependent variable.
  • a second propagation time calculator that calculates the third propagation time and the fourth propagation time corresponding to the current value detected by the current value detector. Is changed according to the third propagation time and the fourth propagation time calculated in A residual voice signal extraction unit for extracting a residual voice signal according to the residual voice signal extraction characteristic, the first near-end signal converted by the first near-end voice conversion unit, and the second near-end The residual audio signal extracted by the residual audio signal extraction unit is subtracted from one of the second near-end signals converted by the audio conversion unit to obtain a second suppressed near-end signal. And a second post-suppression near-end signal output unit.
  • the residual voice signal extraction unit calculates the first near-end signal converted by the first near-end voice conversion unit by the second propagation time calculation unit.
  • a third near-end signal delay unit that delays based on the third propagation time, and the second near-end signal converted by the second near-end speech conversion unit is converted to the second propagation time.
  • a fourth near-end signal delay unit that delays based on the fourth propagation time calculated by the calculation unit; a third delayed near-end signal delayed by the third near-end signal delay unit; A residual audio signal output unit that outputs a difference between the fourth delayed near-end signal delayed by the fourth near-end signal delay unit as a residual audio signal, and the second post-suppression near-end signal output unit Is based on the residual audio signal output from the residual audio signal output unit, Signals other than the signal corresponding to the near-end audio included in either the converted first near-end signal or the second near-end signal converted by the second near-end audio converter A disturbing sound signal estimating unit for estimating the disturbing sound signal, and the first near-end signal converted by the first near-end sound converting unit or converted by the second near-end sound converting unit.
  • a fifth near-end signal delay unit that delays one of the second near-end signals by a time required for estimating the interfering sound signal in the interfering sound signal estimating unit; and a fifth near-end signal delaying unit.
  • An output unit, and the disturbing sound signal estimation characteristic of the disturbing sound signal estimating unit is changed to the second suppressed near-end signal.
  • Square time average has a structure comprising an update unit which sequentially updates the optimum disturbing sound signal estimation properties that make minimum.
  • the echo suppression means may include an initial characteristic for setting an initial interference sound signal estimation characteristic of the updating unit in accordance with the current value detected by the current value detection unit. It has a configuration including a setting unit.
  • the disturbing sound signal estimation characteristics of the disturbing sound signal estimating unit quickly converge to the optimum disturbing sound signal estimation characteristics for minimizing the mean squared value of the near-end signal after suppression. Be suppressed.
  • the echo suppression unit may be configured to convert the first near-end signal converted by the first near-end voice conversion unit and the second near-end voice conversion unit by the second near-end voice conversion unit. From the cross-correlation function with the second near-end signal, the first near-end voice conversion unit or the second near-end voice conversion unit is the position of the near-end person with respect to one of the first near-end voice conversion unit A first near-end person position detecting unit for detecting the near-end position of the second end, and a frequency distribution of the second post-suppression near-end signal output from the second post-suppression near-end signal output unit. A second equalization that equalizes to an equalization characteristic corresponding to the current value detected by the current value detection unit and the first near end position detected by the first near end person position detection unit. Part.
  • the echo suppression means is based on the current value detected by the current value detection unit, and is a position of the near end relative to the far end signal conversion unit.
  • a second near-end position detecting unit that detects a second near-end position, and a frequency distribution of the second post-suppression near-end signal output from the second post-suppression near-end signal output unit,
  • a third equalization for equalizing to an equalization characteristic corresponding to the current value detected by the current value detection unit and the second near-end person position detected by the second near-end position detection unit Part.
  • the second near-end position detection unit Is simpler than the configuration of the first near end position detection unit.
  • the communication device includes: a housing having a reference point; audio output means for outputting a far-end signal as far-end audio; audio input means for receiving near-end audio; And echo suppression means for suppressing echo generated when the far-end voice output from the voice input means is input to the voice input means, wherein the voice output means includes a first predetermined voice signal from the reference point.
  • a far-end signal converter that is installed at a distance and converts the far-end signal into the far-end voice
  • the voice input means is a second predetermined from the reference point
  • a first near-end audio converter that is installed at a distance and converts the input near-end audio to a first near-end signal
  • a predetermined near-end audio converter that is based on the first near-end audio converter.
  • a second near-end audio converter that is installed at a position where the input is near-end and converts the input near-end audio into a second near-end signal
  • the echo suppression unit includes a first near-end audio converter.
  • the first near-end signal and the second near-end signal based on the first near-end signal converted by the second near-end signal conversion unit and the second near-end signal converted by the second near-end voice conversion unit.
  • An echo component detection unit that detects an echo component signal that is a signal other than the signal corresponding to the genuine near-end voice included in common with the near-end signal; and the first near-end voice converter converted by the first near-end voice conversion unit From one of the near-end signal and the second near-end signal converted by the second near-end voice converter,
  • a third post-suppression near-end signal output unit that subtracts the echo component signal detected by the echo one-component detection unit and outputs a third post-suppression near-end signal.
  • the echo component signal means a signal other than the signal corresponding to the near-end voice, and includes not only the echo in the near-end signal but also a signal corresponding to any noise such as background noise.
  • the echo component detection unit may be configured to convert the first near-end signal converted by the first near-end voice conversion unit and the second near-end voice conversion unit
  • a true near-end speech estimating unit for estimating a true near-end signal corresponding to a true near-end speech commonly included in the second near-end signal; Either a first near-end signal or the second near-end signal converted by the second near-end speech converter is used for the true near-end signal estimation in the true near-end speech estimator.
  • a sixth near-end signal delay unit that delays by time, a sixth delayed near-end signal that is the near-end signal delayed by the sixth near-end signal delay unit, and an estimation by the true near-end speech estimation unit.
  • the difference between the genuine near-end signals thus obtained is defined as a first echo component signal that is a signal other than the genuine near-end signal.
  • An echo component signal output unit that outputs the first near-end voice based on the echo component signal output from the echo component signal output unit.
  • the first near-end signal converted by the conversion unit or the second near-end signal converted by the second near-end voice conversion unit And a first near-end speech conversion unit for estimating a second echo one-component signal that is a signal other than the signal corresponding to the near-end speech included in one of the signals.
  • the echo signal in the echo component estimation unit Either the first near-end signal or the second near-end signal converted by the second near-end voice conversion unit, the echo signal in the echo component estimation unit A seventh near-end signal delay unit that delays by a time required for estimating the component, and a signal from the seventh delayed near-end signal that is the near-end signal delayed by the seventh near-end signal delay unit.
  • a third output unit that subtracts the second echo component signal estimated by the component estimation unit and outputs a third post-suppression near-end signal.
  • an echo component signal that is a signal other than the signal corresponding to the near-end voice is extracted, and the extracted echo component signal is subtracted from the near-end signal. Even when the relative position with respect to the voice converter changes, echo and background noise in the near-end signal are suppressed, and a communication device capable of high-quality communication can be realized.
  • the communication device of the present invention may further include: a first near-end signal converted by the first near-end voice conversion unit and a second near-end signal converted by the second near-end voice conversion unit.
  • a first adaptive filter that performs adaptive filter processing so as to minimize the absolute value of the signal output from the echo component output unit for any one of the echo component output units;
  • a second adaptive filter that performs adaptive filter processing on the echo component signal output from the first component signal output unit so as to minimize the absolute value of the signal output from the third output unit.
  • the echo suppression means may include a parameter for defining a relative position between the far-end signal converter and one of the first near-end audio converter or the second near-end audio converter.
  • a current value detection unit for detecting a value and the current value detection unit A first initial value determining unit that determines an initial value of a first filter coefficient, which is a parameter of the adaptive filter processing performed by the first adaptive filter, according to the current value of the output parameter; And a second initial value determining unit that determines an initial value of a second filter coefficient which is a parameter of the adaptive filter processing performed by the second adaptive filter according to the current value of the parameter detected by the second adaptive filter. are doing.
  • the first initial value determining unit and the second initial value determining unit perform the first filter counting and the second filter counting according to the current position of the parameter detected by the current detecting unit.
  • the far-end sound becomes the near-end sound in a short time.
  • the echo and background noise in the near-end signal generated by the mixing are suppressed, and a communication device capable of high-quality communication can be realized.
  • the echo suppression unit may be configured such that when a predetermined near-end signal of the first near-end signal or the second near-end signal is more prominent than the far-end signal. And instructing the first adaptive filter to update the first filter coefficient, and wherein the far-end signal is a predetermined near-end signal of the first near-end signal or the second near-end signal.
  • the second adaptive filter includes an adaptive control unit that instructs the second adaptive filter to update the second filter coefficient when the second adaptive filter is superior to the end signal. With this configuration, the adaptive control unit instructs the first adaptive filter and the second adaptive filter to update the first filter count and the second filter coefficient based on the far-end signal and the near-end signal.
  • FIG. 1 is a functional configuration diagram of a communication device according to a first embodiment of the present invention.
  • FIG. 2 is a hardware configuration diagram of the communication device according to the first embodiment of the present invention.
  • FIG. 3 is a configuration diagram when the communication device according to the present invention is applied to a mobile phone.
  • FIG. 4 is a flowchart illustrating the operation of the communication device according to the first embodiment of the present invention.
  • FIG. 5 is a functional configuration diagram of the communication device according to the first embodiment including a first equalization unit.
  • FIG. 6 is a flowchart illustrating the operation of the communication apparatus according to the first embodiment including the first equalizing unit.
  • FIG. 7 is a flowchart illustrating the operation of the first equalizer of the communication device according to the first embodiment.
  • FIG. 8 is a graph showing the equalization characteristics of the first equalizer of the communication device according to the first embodiment.
  • FIG. 9 is a functional configuration diagram of the communication device according to the first embodiment including a second equalizer.
  • FIG. 10 is a flowchart for explaining the operation of the communication apparatus according to the first embodiment including the second equalizer.
  • FIG. 11 is a flowchart for explaining the operation of the second equalizer of the communication device according to the first embodiment.
  • FIG. 12 is a functional configuration diagram of the communication device of the first embodiment including the third equalizer of the communication device of the first embodiment.
  • FIG. 13 is a graph showing the equalization characteristics of the third equalization unit of the communication device according to the first embodiment.
  • FIG. 14 is a functional configuration diagram of the communication device according to the second embodiment of the present invention.
  • FIG. 15 is a flowchart illustrating the operation of the communication device according to the second embodiment of the present invention.
  • FIG. 16 is a flowchart for explaining the operation of the echo suppressing means of the communication device according to the second embodiment of the present invention.
  • FIG. 17 is a functional configuration diagram of the communication device of the second embodiment including an initial characteristic setting unit.
  • FIG. 18 is a flowchart for explaining the operation of the communication apparatus according to the second embodiment including an initial characteristic setting unit.
  • FIG. 19 is a functional configuration diagram of the communication device of the second embodiment including the second equalizer.
  • FIG. 21 is a functional configuration diagram of a communication device of a second embodiment including a third equalizer.
  • FIG. 21 is a block diagram of a communication device of a third embodiment according to the present invention. It is a figure
  • FIG. 23 is a flowchart illustrating the operation of the communication device according to the third embodiment of the present invention.
  • FIG. 24 is a diagram illustrating an effect obtained by the communication device according to the third embodiment of the present invention.
  • FIG. 25 is a configuration diagram of a conventional telephone device.
  • FIG. 26 is a configuration diagram of a conventional telephone device. BEST MODE FOR CARRYING OUT THE INVENTION
  • the “reference point” is a reference that defines a relative position between the far-end signal conversion unit and one of the first near-end sound conversion unit and the second near-end sound conversion unit.
  • a hinge connecting the two partial housings is a reference point.
  • the “reference position” is a position of a near-end person with reference to one of the far-end signal conversion unit, the first near-end sound conversion unit, and the second near-end sound conversion unit. It is determined at the design stage, assuming normal use conditions.
  • a reference position based on one of the first near-end voice converter and the second near-end voice converter is the first reference position
  • a reference position based on the far-end signal converter is the second reference position. This is the second reference position.
  • the communication device includes a voice output unit 11 that outputs a far-end signal as far-end voice, and a voice input unit that receives near-end voice. 12 and an echo suppressing means 13 for suppressing an echo generated when the far-end voice output from the voice output means 11 is input to the voice input means 12.
  • the audio output unit 11 includes a far-end signal conversion unit 112 that is installed at a predetermined first distance from the reference point and converts a far-end signal into far-end audio.
  • the voice input means 12 is provided at a second predetermined distance from the reference point, and converts the input near-end voice into a first near-end signal.
  • 2 1 and 1 A second near-end audio converter 1 2 2 which is installed at a predetermined position based on the near-end audio converter 1 2 1 and converts the input near-end audio to a second near-end signal. including.
  • the echo suppression means 13 is a relative position between the far-end signal converter 112 and either the first near-end voice converter 121 or the second near-end voice converter 122.
  • Current value detector 131 which detects the current value of the parameter defining the distance, far-end signal converter 1 12, and first near-end audio converter 1 2 1 or second near-end audio converter 1 2
  • the parameter that defines the relative position with either one of the two is set as an independent variable, and the far-end speech converted by the far-end signal converter 1 1 2 propagates to the 1st near-end voice converter 1 2 1
  • the first function having the dependent propagation time (hereinafter referred to as the “first propagation time”) as the dependent variable and the propagation time (hereinafter referred to as the “second propagation time”) to the second near-end speech converter 1 2 2
  • the first propagation time and the second propagation time corresponding to the current value detected by the current value detection unit 13 1 based on the second function with
  • the first propagation time calculating section 132 for calculating the
  • the first post-suppression near-end signal output unit 130 converts the first near-end signal converted by the first near-end voice conversion unit 121 into a first propagation time calculation unit 133
  • the first near-end signal delay unit 133 that delays based on the first propagation time calculated in and the second near-end signal converted by the second near-end voice converter 122 Delayed by the second near-end signal delay unit 13 4 which is delayed based on the second propagation time calculated by one propagation time calculation unit 13 2, and by the first near-end signal delay unit 13 3
  • a first output section 135 for outputting a difference signal between the first delayed near-end signal obtained and the second delayed near-end signal delayed by the second near-end signal delay section 134.
  • FIG. 1 shows a functional configuration of a communication device according to the first embodiment of the present invention, which includes a first near-end signal delay section 133 and a second near-end signal delay section 134.
  • the propagation time of the voice from the far-end signal converter 1 1 2 to the first near-end voice converter 1 2 1 or the second near-end voice converter 1 2 2 is negligible.
  • the corresponding first near-end signal delay section 133 or second near-end signal delay section 134 may be omitted.
  • the signal is delayed by the first near-end signal delay unit 1333.
  • First delay The difference between the extended near-end signal and the second near-end signal converted by the second near-end voice conversion unit 122 is output from the first output unit 135.
  • the communication device includes the first near-end signal delay unit 133 and the second near-end signal delay unit 134
  • the difference between the first delayed near-end signal delayed by the end signal delay section 133 and the second delayed near-end signal delayed by the second near-end signal delay section 134 is It is output from the output unit 135.
  • the far-end signal converter 1 1 2 of the audio output unit 11 is composed of a far-end signal amplifier 2 11 and a speaker 2 12.
  • the first near-end audio converter 1 2 1 of the audio input means 1 is a first microphone 2 2 1 and a first near-end signal amplifier 2 2 3
  • the second near-end audio converter 1 2 Reference numeral 22 denotes a second microphone 222 and a second near-end signal amplifier 222, respectively.
  • the echo current value detecting unit 1 3 1 suppression means 1 3, the far-end signal converting unit 1 1 2 and the first near-end voice converting portion 1 2 1 or the second near-end voice conversion unit 1 2 2 Any detector can be used as long as it can detect a parameter that defines a relative position with respect to any one of them and convert it into an electric signal, and a mouthpiece encoder, a potentiometer, or the like can be applied.
  • a parameter that defines the relative position between the far-end signal conversion unit 112 and either the first near-end audio conversion unit 121 or the second near-end audio conversion unit 122 is not necessarily required. It is not necessary to detect at least one specific relative position, and a switch in which the open / close state is reversed when at least one specific relative position is reached may be applied.
  • the echo suppression means 13 detects the near-end signals output from the first near-end signal amplifier 22 3 and the second near-end signal amplifier 22 4 and the current value detection section 13 1
  • An analog-to-digital converter (hereinafter simply referred to as AZD converter) that converts parameters into digital values, and a digital-to-analog converter (hereinafter simply D / A) that converts near-end signals after echo suppression to analog signals 2 3 4).
  • Memory 2 3 1, CPU 2 3 2, A / D converter 2 3 3, and D / A converter 2 3 4 are connected to bus 2 3 5 It is more electrically coupled to each other.
  • the current value detection unit 13 1 is configured by a switch, a digital input interface may be provided, and the current value may be read via the digital input interface.
  • the first propagation time in the echo suppression means 13 when the communication device according to the present invention is applied to a mobile phone having a housing composed of two partial housings It defines the relative position between the far-end signal converter 1 1 2 used in the calculator 1 3 2 and the first near-end audio converter 1 2 1 or the second near-end audio converter 1 2 2
  • the parameters are set as independent variables, and the sound output from at least one far-end signal converter 1 1 2 is converted into the first near-end sound converter 1 2 1 and the second near-end sound converter 1 2 2 respectively.
  • a specific example of a function whose propagation time is a dependent variable will be described.
  • a mobile phone 30 composed of a casing composed of two partial casings has a first partial casing 32 and a second partial casing 3 connected by a hinge 31 which is a substantially central reference point.
  • the first partial housing 3 2 is provided with the speed force 2 12 included in the far-end signal converter 1 1 2, and the second partial housing 3 3 is provided with the first near-end audio
  • the first microphone 221 included in the converter 122 and the second microphone 222 included in the second near-end voice converter 122 are stored.
  • the angle 0 is equal to the speaker 2 1 2 and the first microphone 2 2 1 and This is a parameter that defines a relative position between the second microphone 222 and one of the second microphones.
  • Time T 1 required for sound to propagate from speaker 2 1 2 to first microphone 2 2 1, and sound propagates from speaker 2 1 2 to second microphone 2 2 2 The time T2 required to determine the relative position between the speaker 21 and one of the microphones 22 1 and 22 2 is defined by the equations (1) and (2), respectively.
  • equation 1 As a function of the angle 6 [Equation 1]
  • T, ia + b z + 2ab- cos0 / v (1)
  • step S401 it is determined whether a call termination condition is satisfied, such as an on-hook state, etc. (step S401). If it is determined that the call termination condition is satisfied, the echo suppression means 13 is determined. Ends the operation. Conversely, if it is determined that the call termination condition is not satisfied, it is determined that the call is in progress, and the call is started based on whether or not the level of the near-end signal is equal to or higher than a predetermined level. It is determined whether or not the operation has been performed (step S402). Next, if it is determined in step S402 that the call has not been started, the process returns to the determination (step S401) of whether or not the call termination condition is satisfied.
  • a call termination condition such as an on-hook state, etc.
  • step S402 when it is determined in step S402 that the call has started, the far-end signal conversion unit 112 and the first near-end voice conversion unit 1 detected by the current value detection unit 13 1 2
  • the current value of the parameter defining the relative position to either the 1 or 2nd near-end voice converter 1 2 2 is sent from the current value detector 1 3 1 via the AZD converter 2 3 3. Is read (step S403).
  • a parameter defining a relative position between the far-end signal conversion unit 112 and either the first near-end voice conversion unit 121 or the second near-end voice conversion unit 122 is calculated.
  • the first propagation time and the second propagation time corresponding to the current value are calculated by substituting the current value read in step (step S404). This processing corresponds to the operation of the first propagation time calculation unit 132.
  • the near-end signal is divided into a first near-end sound converter 2 2 3 and a second near-end sound converter 2 2 4 is read via the AZD converter 233 (step S405), and the near-end signal is delayed by the propagation time (step S406).
  • the delay section may be configured with a FIR (finite impulse response) filter.
  • This processing corresponds to the operation of the first near-end signal delay unit 133 and the second near-end signal delay unit 134.
  • step S407 This processing corresponds to the operation of the first output unit 135.
  • step S406 to step S408 corresponds to the operation of the first post-suppression near-end signal output unit 130.
  • the suppressed near-end signal is converted into an analog signal by the D / A converter 234 and output (step S408).
  • step S409 it is determined whether or not the call is terminated based on whether or not the level of the near-end signal is lower than a predetermined level (step S409), and the level of the near-end signal is determined in advance. If it is determined that the call has not ended at the level higher than or equal to the specified level, the process returns to the reading of the near-end signal (step S405). Conversely, when it is determined that the call is terminated when the level of the near-end signal is lower than or equal to the predetermined level, whether the call termination condition is satisfied is determined by whether the terminal is in an on-hook state or the like. The process returns to the determination (step S401).
  • the first propagation time calculated by the first propagation time calculation unit 132 is defined as the delay time of the first near-end signal delay unit 133, and the first propagation time calculation unit 1
  • the second propagation time calculated in 32 is set as the delay time of the second near-end signal delay unit 134.
  • one of the far-end signal conversion unit 112 and the first near-end voice conversion unit 121 or the second near-end voice conversion unit 122 (for example, the first near-end voice conversion unit)
  • the transmission time of the voice to the section 1 2 1) is fixed delay time, and the far-end signal conversion section 1 1 2 It is desirable to separately set the difference between the propagation time of the sound to the second unit (for example, the second near-end sound conversion unit 122) and the fixed delay time as a variable delay time.
  • the relative position of the far-end signal converter 112 and one of the first near-end voice converter 122 or the second near-end voice converter 122 during a call can be assumed in advance. Not only can the delay time be fixed to a predetermined time, but also the case where the positional relationship between the audio output means 11 and the audio input means 12 is changed and the variable delay time becomes negative This is because it is easy.
  • the communication device includes a current value detection unit 131, a first propagation time calculation unit 132 in the echo suppression unit 13, Since one near-end signal delay section 13 3 and second near-end signal delay section 13 4 and first output section 13 5 are provided, the current far-end signal conversion section 1 1 2 Even if the relative position between either the first near-end speech converter 122 or the second near-end speech converter 122 is changed, the echo is reliably suppressed. It is possible to do.
  • the communication apparatus includes an echo suppression unit 13 that includes a first post-suppression near-end signal output unit 130,
  • the frequency distribution of the first post-suppression near-end signal output from the first post-suppression near-end signal output unit 130 is changed to an equalization characteristic corresponding to the current value detected by the current value detection unit 1331.
  • a first equalization unit 13 6 for equalization may be provided.
  • FIG. 6 is a flowchart for explaining the operation of the echo suppression means 13 including the first equalization section 1336.
  • the frequency distribution of the near-end signal after suppression is equalized.
  • the operation of the first equalizer 1336 (step S4100) to be performed is added.
  • the operation of the first equalizing unit 1336 is realized by executing a program stored in the memory 231.
  • step S401 to step S407 the processing from step S401 to step S407, and the processing after step S408 are the same as those in FIG. 4, and a description thereof will be omitted.
  • the operation of the first equalizer 1336 will be described with reference to the flowchart of FIG. 7.
  • the current value The equalization characteristic corresponding to the current value detected by the detection unit 13 1 is stored in the memory 2 31 in advance.
  • the calculation is performed using the equalization characteristics (step S411), and the frequency distribution of the near-end signal is equalized (step S412).
  • the above processing corresponds to the operation of the first equalizing unit 1336.
  • FIG. 8 the operation of the first equalizer 1336 when the communication device according to the present invention is applied to a mobile phone having a housing composed of two partial housings will be described. explain. FIG.
  • the solid line, the dashed line, and the broken line show the case where the angle 0 formed by the first partial housing 32 with respect to the second partial housing 33 is 0 degrees, 30 degrees, and 60 degrees, respectively.
  • the data of this graph is stored in the memory 231 in advance.
  • the current value detection unit 13 1 detects that the angle 0 formed by the first partial housing 32 with respect to the second partial housing 33 is 30 degrees, Is selected, and using this equalization characteristic, the frequency distribution of the first post-suppression near-end signal output from the first output section 135 is equalized.
  • the angle detected by the current value detection unit 13 1 is an angle that is not stored in the memory in advance such as 0 force, for example, 45 degrees, it corresponds to the stored angle close to that angle.
  • the equalization characteristic is calculated from the equalization characteristic by an interpolation method or the like.
  • the equalization characteristic changes in the subsequent stage of the first post-suppression near-end signal output unit 130 according to the current value detected by the current value detection unit 1331 Since the first equalizer 1336 is provided, the communication quality deteriorates even if the relative position between the audio output means 11 and the audio input means 12 changes and the frequency distribution of the near-end signal after suppression deteriorates. Can be prevented.
  • the echo suppressing means 13 includes a first near-end voice conversion section 122 and a second near-end voice conversion section.
  • a first near-end position detecting unit 13 that detects the position of the near end from a cross-correlation function between the first near-end signal and the second near-end signal output from the unit 122 7, the frequency distribution of the first post-suppression near-end signal output from the first post-suppression near-end signal output unit 130 is the current value detected by the current value detection unit 131, and
  • a second near-equalizer 1 38 for equalizing to an equalization characteristic corresponding to the first near-end position detected by the first near-end position detector 13 7; .
  • FIG. 10 is a flowchart for explaining the operation of the echo suppressor 13 including the second equalizer 1338.
  • a second equalization process (step S420) for equalizing the frequency distribution of the suppressed near-end signal is added to the flowchart of FIG. Note that the processing from step S401 to step S407, and the processing after step S408 are the same as those in FIG. 4, and a description thereof will be omitted.
  • a non-signal section in which the far end does not speak is detected. This detection is generally made based on whether or not the level of the far-end signal is equal to or less than a fixed threshold.However, when noise is superimposed on the far-end signal, the threshold is determined. The average value of the far-end signal at a predetermined time may be used.
  • the whitening cross-correlation function It is advantageous to determine whether the maximum value is equal to or greater than the reference value (0.5 to 0.7).
  • the whitening cross-correlation function is defined as the first near-end signal converted by the first near-end audio converter 121 and the second near-end signal converted by the second near-end audio converter 122.
  • the cross vector between the near-end signal of the first near-end signal and the power of the first near-end signal converted by the first near-end sound conversion unit 121 and the second near-end sound conversion unit 1 2 2 This is a function that has been normalized by the product of the power of the second near-end signal converted by and inverse Fourier transformed.
  • the first near end signal and the second near end already read from the first near end speech converter 121 are read.
  • the first near-end audio converter 1 2 1 or the second near-end audio converter 1 2 2 is obtained by the whitening cross-correlation function between the second near-end signals read from the audio converter 1 2 2.
  • the first near end position which is the position of the near end based on either one of the above, is calculated (step S 4 21). This processing corresponds to the operation of the first near-end person position detection unit 1337.
  • the first near-end person position detected by the first near-end position detection unit 1337 and the equalization characteristic corresponding to the current value detected by the current value detection unit 13 1 are stored in the memory 2 in advance.
  • 31 is calculated using the equalization characteristics stored in step 1 (step S422), and the frequency distribution of the near-end signal after suppression is equalized using this equalization characteristic (step S42). 3).
  • the above processing is This corresponds to the operation of the second equalizing section 1338.
  • the first near end position detecting section 1337 and the second equalizing section 1338 are provided in the echo suppression means 13, so that the first Even if the near end position of the near end deviates from the first reference position, the communication quality is prevented from deteriorating by equalizing the frequency distribution of the near end signal after suppression with the equalization characteristics according to the deviation. It is possible to do.
  • the communication device based on the current value detected by the current value detection unit 131, the far-end signal conversion unit 112 A second near-end position detection unit 13 9 that detects a second near-end position, which is the current position of the near end, based on the first near-end signal output unit 13 0
  • a third equalizing section 140 for equalizing to an equalizing characteristic corresponding to the near end position of the third person.
  • the near-end person is assumed to be located at the second reference position based on the far-end signal conversion unit 112 opposite to the far-end signal conversion unit 112, and the equalization is performed.
  • the characteristics are calculated.
  • the near end receives an angle ⁇ (see FIGS. 3 and 1) with respect to the second partial housing 33. (See 2).
  • the angle ⁇ and the near-end audio Propagation time that propagates to the first near-end voice conversion unit 1 2 1 and the 'second near-end voice conversion unit 1 2 2 It is a function of the angle ⁇ formed. Therefore, from the current value detected by the current value detection unit 131, the angle near-end speech is propagated to the first near-end speech conversion unit 1 2 1 and the second near-end speech conversion unit 1 2 2. Can be calculated.
  • the dashed line, the broken line and the solid line in each graph represent the case where the angles formed by the near end with respect to the second partial housing 33 are 90 degrees, 120 degrees and 150 degrees, respectively.
  • the frequency distribution of the near-end signal after suppression is shown.
  • the angle 0 formed by the first partial housing 32 with respect to the second partial housing 33 which is the current value detected by the current value detection unit 13 1 is 30 degrees
  • the frequency distribution of the suppressed near-end signal is equalized using this equalization characteristic.
  • the equalization characteristics are not stored in the memory 231 in advance, the equalization characteristics are stored using the stored equalization characteristics by interpolation or the like. Can be calculated.
  • the second near end position detecting section 13 9 and the third equalizing section 140 are provided in the echo suppressing means 13, the near end Even if the user position deviates from the second reference position, it is possible not only to prevent the call quality from deteriorating but also to simplify the configuration of the second near-end position detection section 1339. Become.
  • the communication device comprises: a voice output unit 11 for outputting a far-end signal as far-end voice; a voice input unit 12 for receiving near-end voice; and a voice output unit. And echo suppression means for suppressing echo generated when the far-end voice output from the voice input means is input to the voice input means.
  • the audio output unit 11 includes a far-end signal conversion unit 112 that is installed at a predetermined first distance from the reference point and converts a far-end signal into far-end audio.
  • the voice input means 12 is provided at a second predetermined distance from the reference point, and converts the input near-end voice into a first near-end signal.
  • 21 and a second near-end audio converter that is installed at a predetermined position based on the first near-end audio converter 1 21 and converts the input near-end audio to a second near-end signal Parts 1 and 2 are included.
  • the echo suppression means 13 comprises a far-end signal converter 1 1 2 and a first near-end voice converter 1 2 1 or Is a current value detector 131, which detects the current value of a parameter that defines a relative position with respect to one of the second near-end voice converters 122, Is a third function with the third propagation time propagating to the first near-end speech converter 122 as the dependent variable, and the fourth function where the near-end speech is propagated to the second near-end speech converter 122.
  • a second propagation time that calculates a third propagation time and a fourth propagation time corresponding to the current value detected by the current value detection unit 131 based on a fourth function that uses the propagation time of The residual audio signal is extracted from the residual audio signal extraction characteristics that are changed according to the third propagation time and the fourth propagation time calculated by the calculation unit 141 and the second propagation time calculation unit 141.
  • the first near-end signal converted by the first near-end sound converter 121 and the second near-end signal The near-end speech converter in which the residual speech signal extracted by the residual speech signal extraction unit 150 is subtracted from one of the second near-end signals converted by the speech conversion unit 122 to suppress the residual speech And a second post-suppression near-end signal output unit 151 that outputs the second post-suppression near-end signal. Then, the residual audio signal extracting unit 150 converts the first near-end signal converted by the first near-end audio converting unit 121 into the third near-end signal calculated by the second propagation time calculating unit 141.
  • a third near-end signal delay unit that delays based on the propagation time of the second near-end signal, and a second propagation time calculation unit that converts the second near-end signal converted by the second near-end voice conversion unit 122 into a second near-end signal
  • the fourth near-end signal delay section 1443 that is delayed based on the fourth propagation time calculated in 141, and the third near-end signal delay section 144 that is delayed by the third near-end signal delay section 142
  • a residual audio signal output section 144 for outputting a difference between the delayed near-end signal and the fourth delayed near-end signal delayed by the fourth near-end signal delay section 144 as a residual audio signal.
  • the second post-suppression near-end signal output section 151 is converted by the first near-end audio conversion section 121 based on the residual audio signal output from the residual audio signal output section 144.
  • the signal is a signal other than the signal corresponding to the near-end audio included in either the converted first near-end signal or the second near-end signal converted by the second near-end audio converter 122.
  • a disturbing sound signal estimating unit for estimating a disturbing sound signal, a first near-end signal or a second near-end sound converting unit converted by the first near-end sound converting unit.
  • a fifth near-end signal delay unit 144 that delays one of the second near-end signals converted in step by the time required for estimating the interfering sound signal in the interfering sound signal estimating unit Subtracting the disturbing sound signal estimated by the disturbing sound signal estimating unit 145 from the fifth delayed near-end signal, which is the near-end signal delayed by the near-end signal delaying unit 146 of FIG.
  • the second output section 1 4 7 for outputting a near-end signal after suppression, interference sound signal estimation unit 1 4 5 interference sound
  • An updating unit 148 for sequentially updating the signal estimation characteristic to an optimal interference sound signal estimation characteristic that minimizes the squared time average value of the second suppressed near-end signal.
  • the propagation time required for the near-end speech to propagate to the first near-end speech converter 1 2 1 and the second near-end speech converter 1 2 2 Is calculated (step S430). This is because if the near-end person is located at the second reference position, which is a position separated by a predetermined distance in front of the far-end signal conversion unit 112, the near-end sound will The propagation time propagating to one near-end voice converter 1 2 1 and the second near-end voice converter 1 2 2 is calculated by the first near-end voice converter 1 2 1 or the second near-end voice converter. This is because the angle can be expressed as a function of the angle 0 formed by the sound output means 11 with respect to either one of 1 and 2. This processing corresponds to the operation of the second propagation time calculation unit 141.
  • the propagation time for the near-end voice to propagate to the first near-end voice conversion unit 122 and the second near-end voice conversion unit 122 is the first near-end person position in the first embodiment. It may be calculated by the whitening cross-correlation function already described as the operation of the detector 1337, but immediately after the near-end starts to speak, the propagation time is not sufficiently estimated and the communication quality may be degraded. There is.
  • the propagation time is calculated assuming that the near end is located at the second reference position, if the near end is located at a position shifted from the second reference position, the call quality will be degraded. Therefore, when the near end is not speaking, the near end calculates the propagation time as being located at the second reference position, and otherwise calculates the propagation time based on the whitening cross-correlation function. It may be issued.
  • the near-end signals are read from the first near-end signal amplifier 222 and the second near-end signal amplifier 222 through the AZD converter 233 (step S405), and the echo and Background noise is suppressed (step S440).
  • step S408 is the same as the operation of the echo suppression unit of the first embodiment, and a description thereof will be omitted.
  • step S440 of the second embodiment will be described with reference to FIG. 16.
  • the near-end person's voice is converted to the first near-end voice conversion unit 122 and the second
  • the near-end signal is delayed according to the propagation time before the signal propagates to the near-end voice conversion unit 122 (step S444).
  • This processing corresponds to the operation of the third near-end signal delay section 142 and the fourth near-end signal delay section 144.
  • step S4442 by taking the difference between the first delayed near-end signal, which is the near-end signal delayed by the third near-end signal delay section 1442 and the fourth near-end signal delay section 144, The voice of the near-end person included in the near-end signal is deleted, and the residual voice signal is output (step S4442). Note that this processing corresponds to the operation of the residual audio signal output unit 144.
  • a well-known adaptive filter responds to the interfering sound in which the far-end voice and the background noise included in the first near-end signal or the second near-end signal are mixed.
  • a disturbance sound signal which is a signal to be changed, is estimated (step S444). This processing corresponds to the operation of the disturbance sound signal estimation unit 144.
  • one of the first near-end signal and the second near-end signal for example, the first near-end signal converted by the first near-end voice conversion unit 121 is converted into an interference sound signal estimation unit 1
  • the processing is delayed by a time corresponding to the processing time required for estimating the disturbing sound signal (step S444). This processing corresponds to the operation of the fifth near-end signal delay unit 146.
  • step S445 the interfering sound signal is subtracted from the delayed near-end signal, and a suppressed near-end signal in which echo and background noise are suppressed is output (step S445).
  • This processing corresponds to the operation of the second output unit 147.
  • Step S444 This processing corresponds to the operation of the disturbance sound signal estimation characteristic updating unit 148.
  • FRLS Fast Recursive Least Squares
  • the communication apparatus includes a current value detection unit 131, a second propagation time calculation unit 141, an echo suppression unit 13, Third near end signal delay Extension section 14 2 and fourth near-end signal delay section 14 3, residual audio signal output section 1 4 4, disturbing sound signal estimation section 1 4 5, and fifth near-end signal delay section 1 4 6, a second output unit 147, and an update unit 148, so that the current far-end signal conversion unit 112, the first near-end voice conversion unit 121, and the second
  • the echo and background noise generated by mixing the near-end speech contained in the near-end signal with the far-end speech in accordance with the relative position between the two near-end speech converters 122 can be reliably suppressed. It becomes possible.
  • the echo suppression means 13 updates the echo in accordance with the current value detected by the current value detection section 13 1.
  • An initial characteristic setting section 149 for setting the initial disturbance sound signal estimation characteristic of the section 148 may be included.
  • step S401 to step S430 the operation of the echo suppression means 13 including the initial characteristic setting section 149 will be described.
  • the processing from step S401 to step S430 is performed in the second embodiment. Since it is the same as the echo suppression means 13 of FIG.
  • the current value is detected by the current value detection unit 131 based on the initial disturbance sound signal estimation characteristics stored in the memory 231 in advance.
  • the initial disturbing sound signal estimation characteristic corresponding to the current value is calculated and set as the initial value of the disturbing sound signal estimating characteristic of the updating section 148 (step S431). This processing corresponds to the operation of the initial characteristic setting unit 149. If the initial disturbing sound signal estimation characteristic corresponding to the present value detected by the present value detecting unit 13 1 is not stored in the memory 231, the initial disturbing sound previously stored in the memory 23 1 is used. Based on the signal estimation characteristics, the initial disturbing sound signal estimation characteristics are calculated by interpolation or the like.
  • step S405 is the same as that in the flowchart of FIG.
  • the interference sound estimation characteristic of the interference sound signal estimation section 144 is quickly suppressed, and the near-end signal of the near-end signal is suppressed. It is possible to converge to the optimum disturbing sound signal estimation characteristic that minimizes the mean square time value, and it is possible to more reliably suppress echo and background noise.
  • the echo suppression means 13 includes a first near-end voice conversion section 122 From the cross-correlation function between the one near-end signal and the second near-end signal converted by the second near-end voice converter 122, the first A first near end that detects a first near end position that is a position of the near end based on one of the near end speech conversion unit 1 2 1 and the second near end speech conversion unit 1 2 2
  • the current value detector 1331 detects the frequency distribution of the second post-suppression near-end signal output from the user position detector 1337 and the second post-suppression near-end signal output unit 151.
  • a second equalizer 138 that equalizes the current value and the equalized characteristic corresponding to the first near-end position detected by the first near-end position detector 1337. May be provided.
  • step S420 the flow rate between the step S440 and the step S408 is A second equalization process (step S420) is executed.
  • the operation of the second equalization process (step S420) will be described with reference to the flowchart of Fig. 11.
  • the speech input means based on the peak interval of the whitening cross-correlation function between the near-end signals read from the first near-end speech conversion section 122 and the second near-end speech conversion section 122, the speech input means
  • the first near end position which is the position of the near end based on 1 2, is calculated (step S 4 21). This process corresponds to the operation of the first near-end person position detection unit 1337.
  • the equalization characteristics corresponding to the first near-end position detected by the first near-end position detection unit 13 and the current value detected by the current value detection unit 13 1 are stored in the memory 23 in advance. Is calculated using the equalization characteristics stored in step 1 (step S 4 22), and the equalization process of the near-end signal after suppression is executed using this equalization characteristics (step S 4 2 3 ). The above two processings correspond to the operation of the second equalizing unit 138.
  • the first near-end person position detecting section 13 7 and the second equalizing section 13 8 are provided in the echo suppressing means 13, so that the near-end Even if the caller position deviates from the first reference position, it is possible to prevent the call quality from deteriorating.
  • the echo suppression means 13 is distant based on the current value detected by the current value detector 13 1.
  • a second near-end position detection unit 13 9 for detecting a second near-end position which is a position of the near end based on the end signal conversion unit 112, and a second post-suppression near end
  • the frequency distribution of the near-end signal is equalized according to the current value detected by the current value detection unit 131, and the second near-end position detected by the second near-end position detection unit 1339.
  • a third equalization unit 140 for equalizing the characteristics may be provided.
  • the near end is located at the second reference position directly opposite to the far end signal conversion unit 112, and the equalization characteristic is determined based on the current value detected by the current value detection unit 131. Is determined.
  • the near-end person uses the sound output means 11 opposed to the sound output means 11 as a reference. It is calculated as being located at the second reference position.
  • the second near end position detecting section 13 9 and the third equalizing section 140 are provided in the echo suppressing means 13, the near end Even if the user position deviates from the second reference position, the frequency distribution of the near-end voice can be maintained at the reference frequency distribution that is the frequency distribution of the near-end voice when the near-end is at the second reference position.
  • the configuration of the second near-end person position detection unit 1339 can be simplified than the configuration of the first near-end position detection unit 1337.
  • variable delay time set in the first propagation time calculation unit or the second propagation time calculation unit is referred to as the far-end signal conversion unit and the first near-end audio signal.
  • the calculation has been described as being calculated from the geometrical positional relationship with one of the conversion unit and the second near-end voice conversion unit, the variable delay time is calculated based on the fact that the impulse signal is output from the far-end signal conversion unit. It is also possible to calculate based on the cross-correlation function of the impulse response output from the one near-end speech converter and the second near-end speech converter.
  • the description of the specific configuration of the first equalizer, the second equalizer, and the third equalizer is omitted, but a well-known FIR (finite impulse response) is used.
  • a filter or an IIR (infinite impulse response) filter can be applied.
  • the use of the FIR filter makes it possible to set the equalization characteristics precisely, and the use of the IIR filter makes it possible to reduce the amount of calculation.
  • Equalization characteristics can be determined for each frequency band using a well-known puncture filter. Furthermore, it is clear that the processing of the echo suppression means of the first and second embodiments can be executed in the time domain or in the frequency domain.
  • the amount of computation can be reduced as compared with processing in the time domain, but since the audio signal is converted into the frequency domain for each frame of a predetermined time length, the frame processing is performed. A time delay corresponding to the length occurs.
  • one speaker is used as the far-end signal converter, but if it can be regarded as equivalently one far-end signal converter, a plurality of speakers may be used. It is clear that the invention can be applied.
  • the communication device includes a voice output unit 11 for outputting a far-end signal as far-end voice, a voice input unit 12 for receiving near-end voice, and a voice output.
  • An echo suppression means 13 for suppressing an echo generated when the far-end voice output from the means 11 is input to the voice input means 12.
  • the audio output unit 11 includes a far-end signal conversion unit 112 that is installed at a predetermined first distance from the reference point and converts a far-end signal into far-end audio.
  • the voice input means 12 is provided at a second predetermined distance from the reference point, and converts the input near-end voice into a first near-end signal. 21 and a second near-end voice that is installed at a predetermined position based on the first near-end voice converter 121 and converts the input near-end voice into a second near-end signal And a conversion unit 122.
  • the echo suppressor 13 includes a first near-end signal converted by the first near-end voice converter 12 1 and a second near-end signal converted by the second near-end voice converter 12 2. And an echo component detector 160 that detects an echo component signal other than the signal corresponding to the genuine near-end voice, which is commonly included in the first near-end signal and the second near-end signal, based on From one of the first near-end signal converted by the first near-end voice conversion unit 122 and the second near-end signal converted by the second near-end voice conversion unit 122, The echo detected by the echo component detector 160 A third post-suppression near-end signal output unit 170 that subtracts one component signal and outputs a third post-suppression near-end signal is included.
  • the echo component signal means a signal other than the signal corresponding to the near-end voice, and is not limited to the echo included in the narrow-end signal in a narrow sense, but includes a signal corresponding to any noise such as background noise.
  • the communication device of the present embodiment When the communication device of the present embodiment is applied to a mobile phone having a housing composed of two partial housings, as shown in FIG. 3, the communication device has a hinge 31 and a hinge 3 as shown in FIG. 1 has two partial housings 3 2 and 3 3 joined together by a hinge 31, and the opening angle ⁇ ⁇ , which is an angle formed by the two partial housings 3 2 and 3 3, can be variably changed by a hinge 31. ing .
  • a display 341 may be provided in the housing.
  • the direction indicated by reference numeral 352 indicates the direction of the speaker as viewed from the communication device.
  • the echo component detecting section 160 is configured to convert the first near-end signal converted by the first near-end sound converting section 121 and the second near-end signal converted by the second near-end sound converting section 122.
  • a true near-end speech estimator for estimating a genuine near-end signal corresponding to a genuine near-end speech commonly included in the end signal, and a first near-end converted by the first near-end speech converter 122 A sixth signal that delays one of the signal and the second near-end signal converted by the second near-end speech converter 122 by the time required for estimating the true near-end signal in the true near-end speech estimator.
  • An echo component signal output unit 165 that outputs a difference between the near-end signals as a first echo component signal that is a signal other than the true near-end signal.
  • the genuine near-end speech estimating unit includes a first near-end signal converted by the first near-end speech conversion unit 121 and a second near-end converted by the second near-end speech conversion unit 122.
  • a first adaptive filter 163 that performs adaptive filter processing on any of the signals, and a first filter count that stores a first filter count that is a parameter of the adaptive filter processing performed by the first adaptive filter 163.
  • the first adaptive filter 163 performs adaptive filter processing such that the absolute value of the differential signal output from the echo component signal output unit 165 is minimized. I do.
  • the third post-suppression near-end signal output unit 170 outputs the first near-end voice conversion unit 1221 based on the echo component signal output from the echo component signal output unit 165.
  • a second echo which is a signal other than the signal corresponding to the near-end voice included in one of the one near-end signal and the second near-end signal converted by the second near-end voice converter 122
  • Estimate component signal An echo component estimator, and a first near-end signal converted by the first near-end voice converter 121 or a second near-end signal converted by the second near-end voice converter 122 Is delayed by a seventh near-end signal delay unit 176 that delays the time required for estimating the signal component of the echo in the echo component estimation unit, and a seventh near-end signal delay unit 176 Subtracting the second echo one-component signal estimated by the echo one-component estimator from the seventh delayed near-end signal, which is the obtained near-end signal, and outputting a third suppressed near-end signal And an output unit 1 75 of the system
  • the echo component estimator includes a second adaptive filter 173 that performs adaptive filtering on the echo component signal output from the echo component signal output unit 165, and an adaptive filter that is performed by the second adaptive filter 173.
  • a second coefficient storage unit 174 that stores a second filter coefficient that is a parameter of the filter processing, and the second adaptive filter 173 is output from a third output unit 175.
  • the adaptive filter processing is performed so that the absolute value of the difference signal is minimized.
  • the echo suppression means 13 further includes a far-end signal conversion unit 112 and a first near-end speech conversion unit 121 or a second near-end speech conversion unit.
  • the current value detector 131 which detects the current value of the parameter that defines the relative position to either one of the end voice converters 1 2 2, and the current value of the parameter detected by the current value detector 131, The value of the adaptive filter processing performed by the first adaptive filter 163 according to the value
  • 3 includes a second initial value determining unit 171, which determines an initial value of a second filter coefficient which is a parameter of the adaptive filter processing performed by the third unit 3.
  • the echo suppression means 13 further updates the first filter coefficient when a predetermined near-end signal of the first near-end signal or the second near-end signal is superior to the far-end signal.
  • the second An adaptive control unit 181 for instructing the second adaptive filter 173 to update the filter coefficient is included.
  • the output signal from the second near-end voice converter 122 is input to the first adaptive filter 163.
  • a first coefficient storage unit 164 is connected to the first adaptive filter 163.
  • Output signal from sixth near-end signal delay section 16 6 and first adaptation The output signal from the filter 163 is input to the echo component signal output unit 165.
  • the output signal from the echo component signal output unit 165 is input to the first adaptive filter 163 and the second adaptive filter 173.
  • a second coefficient storage unit 174 is connected to the second adaptive filter 173 to read out the filter coefficients.
  • the output signal from the seventh near-end signal delay unit 176 and the output signal from the second adaptive filter 173 are input to the third output unit 175.
  • the output signal from the third output unit 175 is input to the second adaptive filter 173 and sent to the far end as an echo suppression signal.
  • the hinge 31 is connected to a current value detection unit 1331 as state detection means, and the current value detection unit 131 detects a current value of a parameter such as the opening angle ⁇ ⁇ ⁇ of the hinge 31.
  • the output signal of the current value detector 13 1 is input to the first initial value determiner 16 1 and the second initial value determiner 17 1.
  • the output signal of the first initial value determining unit 16 1 is input to the first adaptive filter 16 3, and the output signal of the second initial value determining unit 17 1 is input to the second adaptive filter 17 3 Is done.
  • the far-end signal from the far-end signal conversion unit 112 is input to the adaptive control unit 181.
  • the second near-end signal from the second near-end voice converter 122 is also input to the adaptive controller 181, and the output signal of the adaptive controller 181 is supplied to the first adaptive
  • the signals are output to the filter 16 3 and the second adaptive filter 17 3, respectively.
  • the echo suppression means 13 determines whether or not a force that satisfies the call termination condition for terminating the operation by turning off the power of the communication device (S501) is satisfied. If it is determined, the operation is terminated. If it is determined that the condition is not satisfied, the operation is continued, and the process proceeds to step S502.
  • step S501 If it is determined in step S501 that the call termination condition is not satisfied, it is determined whether or not the call has been started based on whether or not the level of the near-end signal is equal to or higher than a predetermined level. The determination is made by the echo suppression means 13 (S502). When it is determined in S502 that the call has started, the process proceeds to S503, and when it is determined that the call has not started, the process returns to step S501.
  • the current shape of the housing is detected by the current value detection unit 1331 (S503).
  • the shape of the current housing The shape detection is performed by detecting and calculating the opening angle 0 of the housing using the current value detection unit 13 1 connected to the hinge 31.
  • the current value detection unit 13 1 may be any device that can convert the magnitude of the opening angle 0 into an electric signal, and can be realized using, for example, a rotary encoder, a variable resistor, or the like.
  • the current value detection unit 13 1 is not necessarily connected to one of the far-end signal conversion unit 112 and the first near-end sound conversion unit 121 or the second near-end sound conversion unit 122. It is not necessary to continuously calculate the parameter that defines the relative position of, but the angle may be calculated discretely.
  • the current value detection unit 1331 may detect only two states, such as an open state and a closed state, using a switch or the like.
  • the initial value of the first filter coefficient and the initial value of the second filter coefficient are respectively determined by the first initial value determination unit 16 It is determined by the first and second initial value determining unit 171 and is set in the first adaptive filter 163 and the second adaptive filter 173 (S504).
  • the first initial value determination unit 161 outputs a signal corresponding to the opening angle of the housing (hereinafter, referred to as an opening angle signal) to the first adaptive filter 1663,
  • One adaptive filter 163 reads out a filter coefficient corresponding to the above-mentioned opening angle signal from the filter coefficients stored in the first coefficient storage section 164.
  • the first coefficient storage unit 164 stores in advance filter coefficients corresponding to a predetermined number of opening angles, and the first adaptive filter 163 is specified by the input opening angle signal Based on the opening angle, the filter coefficient at the closest angle may be read out by the internal interpolation method or the like.
  • the second initial value determination unit 171 outputs an opening angle signal corresponding to the opening angle of the housing to the second adaptive filter 173, and the second adaptive filter 173 outputs The filter coefficient corresponding to the opening angle signal is read from the filter coefficients stored in the second coefficient storage unit 174.
  • the second coefficient storage unit 174 stores in advance filter coefficients corresponding to a predetermined number of opening angles, and the second adaptive filter 173 is specified by the input opening angle signal Based on the opening angle, the filter coefficient at the closest angle may be read out by interpolation or the like.
  • step S506 When the initial value of the filter coefficient is determined in step S504, the near-end speech is collected by the first near-end speech converter 1 2 1 and the second near-end speech converter 1 2 2, A first near-end signal and a second near-end signal are generated (S505).
  • the processing after step S506 can be performed by analog signal processing, but is generally performed by digital signal processing. . Therefore, in the following, it is assumed that the first near-end signal and the second near-end signal are converted from analog signals into digital signals by AD conversion means (not shown).
  • processing after step S506 is performed by digital signal processing
  • a configuration in which the communication device includes an element such as a microcomputer or a digital signal processor (DSP) is generally used.
  • DSP digital signal processor
  • the processing after step S506 shall be described in the program mounted on the microcomputer or the DSP.
  • the first near-end signal and the second near-end signal that have been converted to digital signals are converted to the time domain or temporarily to the frequency domain, and the subsequent processing is performed.
  • sample processing is performed for each sampling cycle in the AD conversion means.
  • frame processing is performed to collectively process input signals in frames having a fixed time width.
  • the first near-end signal and the second near-end signal of the digital signal are generated in step S505
  • the first near-end signal is generated by the sixth near-end signal delay unit 1666 for a predetermined time.
  • the delay is added, and the second near-end signal is subjected to adaptive filter processing by the first adaptive filter 163 (S506).
  • the amount of delay added by the sixth near-end signal delay unit 166 it is appropriate to set the amount of delay added by the sixth near-end signal delay unit 166 to be equal to the coefficient length of the first adaptive filter 163.
  • the tap length of the first adaptive filter 16 3 is set to about half of the tap length.
  • the filtering processing is performed by a method of convolving the output signal of the second near-end voice converter 122 with the coefficient of the first filter.
  • step S506 a delay is added to the first near-end signal, and the adaptive filter processing is performed on the second near-end signal, the signal after the delay addition and the signal after the adaptive filter processing are echo-formed.
  • the difference signal between these signals is input to the minute signal output section 16 5 and the echo component signal output section 16 5 (S507).
  • the difference calculated by the echo component signal output unit 165 is fed back to the first adaptive filter 163, and the second adaptive filter 163 controls the second adaptive filter 163 to minimize the absolute value of the difference signal.
  • adaptive filter processing is performed on the near-end signal.
  • the first near-end signal is added with a predetermined time delay by a seventh near-end signal delay unit 176, and is output from the echo component signal output unit 165.
  • the delay amount added by the seventh near-end signal delay unit 176 is set to be equal to the coefficient length of the second adaptive filter 173. Specifically, it is preferable to set the length to about half the tap length of the second adaptive filter 173.
  • the filter / lettering processing is performed by a method of convoluting the coefficient of the second filter with the output signal from the echo component signal output unit 165.
  • step S508 a delay is added to the first near-end signal, and the output signal from the echo component signal output unit 165 is subjected to adaptive filter processing.
  • the difference calculated by the third output unit 175 is fed back to the second adaptive filter 173, and the second adaptive filter 173 sets the echo component signal so as to minimize the absolute value of the difference signal.
  • the output signal from the output section 165 is subjected to adaptive filter processing.
  • step S509 The signal generated in step S509 is output to the far end as an echo suppression signal (S510).
  • the first filter coefficient and the second filter coefficient are updated (S511).
  • the update of the filter coefficient is performed when the adaptive control section 181 determines whether or not to update the filter coefficient of each of the adaptive filters 163 and 173 and determines that the update is to be performed.
  • the adaptive control unit 18 1 determines that the near-end signal is superior to the far-end signal input from the far end, the adaptive control unit 18 1 reduces the output power of the echo component signal output unit 16 5 to the minimum.
  • the output power of the third output unit 1 75 becomes minimum.
  • the adaptive control unit 181 which updates the filter coefficients of the second adaptive filter 17 3, simply makes a decision that the power of the near-end signal exceeds a predetermined first threshold and the far-end If the correlation between the signal and the output signal of the second near-end voice converter 122 is high, it is determined that the far-end signal is dominant, and the power of the far-end signal is equal to the predetermined second power. If the threshold value is not exceeded and the power of the output signal of the second near-end speech converter 122 exceeds a predetermined third threshold value, it is preferable to determine that the near-end speaker speech is dominant. It is.
  • the whitening between the far-end signal and the output signal of the second near-end audio converter 122 is described. The determination can be made based on whether or not the maximum value of the cross-correlation function is equal to or greater than a predetermined value.
  • the adaptive control unit 18 1 determines that the power of the output signal of the second near-end voice conversion unit 122 exceeds a predetermined first threshold, and that the power of the far-end signal is a predetermined second threshold. If the signal exceeds the threshold, it is determined that the far-end signal is more dominant than the near-end signal, the power of the far-end signal does not exceed the third predetermined threshold, and the second near-end voice converter 1 2 2 If the power of the output signal exceeds a predetermined fourth threshold, it may be determined that the near-end signal is superior to the far-end signal. By performing control in this manner, the filter coefficients of the first adaptive filter 163 are updated when the near end speaker is dominant.
  • the echo component signal output unit 165 converts the far-end signal by the far-end signal conversion unit 112 and outputs the far-end voice to the second near-end voice conversion unit 122.
  • the signal corresponding to the embedded sound is included, the signal corresponding to the near-end speaker's voice will output a suppressed signal. Therefore, a signal having a strong echo component is output from the echo component signal output unit 165.
  • the filter coefficients of the second adaptive filter 1 73 will be updated if the far-end signal is dominant.
  • the output signal of the seventh near-end signal delay unit 176 includes the far-end voice output from the far-end signal conversion unit 112 in the second near-end signal.
  • the echo wrapped around the voice conversion unit 122 and the near-end signal which is the signal of the near-end speaker voice are included, the echo component included in the input signal of the second adaptive filter 173 is canceled. Is done.
  • the output of the third output unit 175 is output with the near-end speaker's voice emphasized. Will be done.
  • a method of updating the filter coefficients of the first adaptive filter 163 and the second adaptive filter 173 a method based on known adaptive signal processing is appropriate. For example, a learning identification method, a FRLS method, or the like is used. Can be used.
  • step S511 it is determined whether the voice call has ended based on the level of the near-end signal or the like (S512), and it is determined that the voice call has ended. In this case, the process proceeds to step S513, and if it is determined that the process has not been completed, the process returns to step S503 to repeat the above process.
  • the processing in steps S503 and S504 may be omitted.
  • step S512 the filter coefficient of the first adaptive filter 163 is stored in the first coefficient storage 164 in association with the opening angle detected by the current value detector 131. Then, the filter coefficient of the second adaptive filter 173 is stored in the second coefficient storage unit 174 in association with the opening angle detected by the current value detection unit 131, and the process returns to step S501. Repeat the above process.
  • FIG. 24 is a diagram illustrating an example of an output waveform of an audio signal output from the far-end signal conversion unit 112 when an audio signal is included in the far-end signal.
  • FIGS. 24 (a) to (c) show the case where the audio signal output from the far-end signal conversion unit 112 has no distortion, that is, the far-end signal is linearly converted to far-end audio.
  • the example of the output waveform in the case is shown.
  • FIG. 24 (a) is a diagram showing a signal waveform of a signal output to the far end when the echo suppression processing is not performed.
  • the voice output from the far-end signal converter 112 is sent to the first near-end voice converter 121 and the second near-end voice converter 122. Therefore, as shown in Fig. 24 (a), the voice signal resulting from the wraparound voice is superimposed as an echo on the signal output to the far end.
  • FIG. 24 (b) is a diagram showing a signal waveform of a signal output to the far end when an echo canceller based on a conventional learning identification method is used. It can be seen that the echo can be sufficiently suppressed even when the conventional echo canceller is used.
  • FIG. 24 (c) is a diagram illustrating a signal waveform of a signal output to the far end when the communication device according to the third embodiment of the present invention is used. Call according to the third embodiment of the present invention It can be seen that the echo can be sufficiently suppressed even when the device is used.
  • FIG. 24 (d) is a diagram showing a signal waveform of a signal output to the far end when the echo suppression processing is not performed. It can be seen that there is a large amplitude echo when the echo suppression processing is not performed.
  • FIG. 24 (e) shows a signal waveform of a signal output to the far end when a conventional echo canceller is used. It can be seen that when the conventional echo canceller is used, some echoes can be suppressed, but unerased parts remain. Since the conventional echo canceller performs linear echo suppression processing, it is necessary to appropriately perform echo prediction for a non-linear system such as one in which the output signal of the far-end signal converter 112 has distortion. Cannot be done in principle. Since the estimated echo deviates from the true echo due to the non-linearity and remains without being suppressed, when the conventional echo canceller is used, the echo remains unerased.
  • FIG. 24 (f) is a diagram showing a signal waveform of a signal output to the far end when the communication device according to the third embodiment of the present invention is used.
  • the communication apparatus according to the third embodiment of the present invention it can be seen that although the echo has not been completely eliminated, the echo cancellation remains less than the conventional echo canceller.
  • the communication apparatus provides an adaptive filter such that the first adaptive filter is configured to minimize the absolute value of the difference signal output from the echo component signal output unit.
  • the first echo component corresponding to the current relative position between the far-end signal conversion unit and the near-end voice conversion unit is detected, and the second adaptive filter is included in the near-end signal. Since the second output component generates the second echo component and the third output portion removes the echo component, even if the current relative position between the far-end signal conversion unit and the near-end speech conversion unit is changed, Ko One suppression performance is maintained, and high-quality calls can be made.
  • the first initial value determining unit and the second initial value determining unit determine the initial values of the first filter coefficient and the second filter coefficient according to the current value of the parameter detected by the current value detecting unit. Therefore, even if the current relative position between the far-end signal converter and the near-end voice converter is changed, echo suppression performance is maintained shortly after the call starts, and high-quality calls can be made. Further, the adaptive control unit instructs the first adaptive filter and the second adaptive filter to update the first filter coefficient and the second filter coefficient based on the far-end signal and the near-end signal. Therefore, even if the current relative position between the far-end signal converter and the near-end voice converter is changed, the echo suppression performance can be improved in a short time. Maintained and high quality calls can be made.
  • the first near-end audio converter 1 2 1 is arranged at a position closer to the far-end signal converter than the second near-short audio converter 1 2 2.
  • the present invention is not limited to this.
  • the second near-short sound converter 122 may be arranged at a position closer to the far-end signal converter than the first near-end sound converter 122.
  • the communication device according to the present invention can be applied to applications such as a communication device capable of performing high-quality communication without deteriorating echo suppression performance even when the relative position of a speaker and a microphone is changed.

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Telephone Function (AREA)
  • Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

 【課題】 スピーカとマイクロホンの相対位置が変更された場合にもエコー抑圧性能が低下しないだけでなく、近端者とマイクロホンの位置関係に関わらず高品質な通話ができる通話装置を提供する。 【解決手段】 遠端信号変換部112と第一の近端音声変換部121または第二の近端音声変換部122の何れか一方との相対位置を規定するパラメータの現在値を検出する現在値検出部131を設け、現在値検出部131で検出された現在値に応じて第一の近端信号遅延部133および第二の近端信号遅延部134で近端信号を遅延し、遅延後の近端信号間の差をエコー抑制後の近端信号として第一の出力部135から出力する。

Description

通話装置 技術分野
本発明は、 通話装置に係り、 特にマイクロホンとスピーカの相対位置が変化した場 合にも確実にエコーを抑圧することができる通話装置に関する。
明 背景技術 糸 1
従来の通話装置としては、 一つのマイクロホンを具備し、 スピーカとマイクロホン 書
との間の音響伝達特性を模擬する適応フィルタによってエコーを抑圧するものがよく 知られている。
例えば、 特開 2 0 0 0— 2 4 4 6 7 0号公報に開示された従来の通話装置は、 図 2 5に示すように、 同時通話処理を行う音声スィツチ 5 1の近端者側に第一のエコーキ ヤンセラ 5 2と、 音声スィツチ 5 1を挟んで第一のエコーキャンセラ 5 2の反対側に 第二のエコーキャンセラ 5 3とを備えている。
第一のエコーキャンセラ 5 2は、 第一のエコーキャンセラ 5 2に設定されたスピー 力 5 4からマイクロホン 5 5までの音声の伝播経路の伝達関数に基づいて擬似エコー を生成し、 減算器 5 8でマイクロホン 5 5から出力される近端信号から擬似エコーを 減算することにより、 スピーカ 5 4から出力された音声がマイクロホン 5 5で集音さ れることに起因するエコーを抑圧するようになっている。
第二のエコーキャンセラ 5 3は、 「2— 4線変換」 を行う場合にマイクロホンで集音 された音声がスピー力側に廻り込んで発生するエコーを抑圧するためのものである。 なお、 「4線式通話装置」 では、 第二のエコーキャンセラ 5 3および音声スィッチ 5 1 は不要である。
そして、 第一のエコーキャンセラ 5 2および第二のエコーキャンセラ 5 3に設定さ れた伝達関数の係数は、 伝播経路の経時的変化に応じて逐次更新されるようになって レ、る。
さらに、 別の従来の通話装置として、 スピーカからの距離が相違する第一のマイク 口ホンおよび第二のマイクロホンを具備し、 一方のマイク口ホンの出力に基づいて他 方のマイクロホンの出力に含まれるエコーを効果的に抑圧するものも、 よく知られて レ、る。
例えば、 特開平 8— 223275号公報に開示された従来の通話装置は、 図 26に 示すように、 第一のマイクロホン 55および第二のマイクロホン 56によって、 スピ 一力 54の出力が検出されるようになっている。
使用開始前の学習過程において、 第一のマイクロホン 55の後段に設置されるェコ 一キャンセラ 57のエコー抑圧特性は、 スピーカ 54から第一のマイクロホン 55お よび第二のマイクロホン 56までの音声の伝播経路の伝達関数に基づいて減算器 58 の出力である第一のマイクロホン 55の出力と第二のマイクロホン 56の出力との差 のパヮ一が最小となるように設定されるようになつている。
従って、 使用状態においては、 スピーカ 54の出力が第一のマイクロホン 55およ び第二のマイクロホン 56で集音されたとしても、 減算器 58の出力からエコーを抑 圧することが可能となる。
上記のように、 特開 2000— 244670号公報および特開平 8— 223275 号公報には、 エコーキャンセラのエコー抑圧特性がスピーカからマイクロホンへの音 声の伝播経路に基づいて決定されていることが開示されている。
従って、 ヒンジで連結された二つの筐体を有し、 一方の筐体にスピーカが、 他方の 筐体にマイク口ホンが格納される携帯電話のように、 スピー力とマイクロホンとの相 対位置を変更することが可能な通話装置に、 上記の特開 2000— 244670号公 報おょぴ特開平 8— 223275号公報に開示されたエコーキャンセラを適用する場 合には、 エコー抑圧特性をスピー力とマイクロホンとの相対位置に応じて変更する必 要があることが判る。
しかしながら、 上記の特開 2000-244670号公報おょぴ特開平 8— 223 275号公報には、 スピーカとマイクロホンとの相対位置に応じてエコー抑圧特性を 変更することは開示■示唆されておらず、 スピーカとマイクロホンとの相対位置を変 更することが可能な通話装置に、 特開 2000— 244670号公報および特開平 8 -223275号公報に開示されたエコーキャンセラを適用すると、 スピーカとマイ クロホンとの相対位置を変化させた場合には、 エコーキャンセラのェコ一抑圧特性が スピー力とマイクロホンとの相対位置変化後の音声の伝播経路に適合せず、 エコー抑 圧性能が悪化し、 通話品質が劣化するという課題が生じる。
本発明は、 上記課題を解決するためになされたものであって、 スピーカとマイクロ ホンとの相対位置が変更された場合にも、 エコー抑圧性能が維持され、 高品質の通話 ができる通話装置を提供することを目的とする。 発明の開示
本努明の通話装置は、 基準点を有する筐体と、 近端信号が遠端音声として出力され る音声出力手段と、 近端音声が入力される音声入力手段と、 前記音声出力手段から出 力された前記遠端音声が前記音声入力手段に入力されることにより発生するエコーを 抑圧するエコー抑圧手段とを備え、 前記音声出力手段は、 前記基準点から予め定めら れた第一の距離を隔てて設置され、 前記遠端信号を前記遠端音声に変換する遠端信号 変換部を含み、 前記音声入力手段は、 前記基準点から予め定められた第二の距離を隔 てて設置され、 入力された前記近端音声を第一の近端信号に変換する第一の近端音声 変換部と、 前記第一の近端音声変換部を基準とする予め定められた位置に設置され、 入力された前記近端音声を第二の近端信号に変換する第二の近端音声変換部とを含み 、 前記エコー抑圧手段は、 前記遠端信号変換部と前記第一の近端音声変換部または前 記第二の近端音声変換部の何れか一方との間の相対位置を規定するパラメータの現在 値を検出する現在値検出部と、 前記パラメータを独立変数とし、 前記遠端信号変換部 で変換された前記遠端音声が前記第一の近端音声変換部に伝播する伝播時間を従属変 数とする第一の関数およぴ前記第二の近端音声変換部に伝播する伝播時間を従属変数 とする第二の関数に基づいて前記現在値検出部で検出された前記現在値に対応する前 記第一の伝播時間および前記第二の伝播時間を算出する第一の伝播時間算出部と、 前 記第一の伝播時間算出部で算出された前記第一の伝播時間および前記第二の伝播時間 に応じて変更されるエコー抑圧特性によりエコーが抑圧された第一の抑圧後近端信号 を出力する第一の抑圧後近端信号出力部とを含む構成を有している。
この構成により、 現在の遠端信号変換部と近端音声変換部との間の相対位置が変更 された場合であつても、 遠端音声が近端信号中に混入することによつて発生するェコ 一が確実に抑圧されることとなる。 また、 本発明の通話装置は、 前記第一の抑圧後近端信号出力部は、 前記第一の近端 音声変換部で変換された前記第一の近端信号を前記第一の伝播時間算出部で算出され た前記第一の伝播時間に基づいて遅延する第一の近端信号遅延部と、 前記第二の近端 音声変換部で変換された前記第二の近端信号を前記第一の伝播時間算出部で算出され た前記第二の伝播時間に基づいて遅延する第二の近端信号遅延部と、 前記第一の近端 信号遅延部で遅延された第一の遅延近端信号と前記第二の近端信号遅延部で遅延され た第二の遅延近端信号との差を出力する第一の出力部とを含む構成を有している。 この構成により、 遠端信号変換部で変換された遠端音声が第一の近端音声変換部お よび第二の近端音声変換部に伝播する時間に応じて近端信号を遅延させることにより 、 エコーを抑圧できることとなる。
さらに、 本発明の通話装置は、 前記エコー抑圧手段は、 前記第一の抑圧後近端信号 出力部から出力される前記第一の抑圧後近端信号の周波数分布を、 前記現在値検出部 で検出された前記現在値に対応した等化特性に等化する第一の等化部を備える構成を 有している。
この構成により、 遠端信号変換部と近端音声変換部との相対位置の変化により抑制 後近端信号の周波数分布が悪化しても、 通話品質の悪化が防止されることとなる。 さらに、 本発明の通話装置は、 前記エコー抑圧手段は、 前記第一の近端音声変換部 で変換された前記第一の近端信号と前記第二の近端音声変換部で変換された前記第二 の近端信号との相互相関関数から、 前記第一の近端音声変換部または前記第二の近端 音声変換部の何れか一方を基準とする近端者の位置である第一の近端者位置を検出す る第一の近端者位置検出部と、 前記第一の抑圧後近端信号出力部から出力される前記 第一の抑圧後近端信号の周波数分布を、 前記現在値検出部で検出された前記現在値と 前記第一の近端者位置検出部で検出された前記第一の近端者位置とに対応する等化特 性に等化する第二の等化部とを備える構成を有している。
この構成により、 近端者位置が第一の近端音声変換部および第二の近端音声変換部 の何れか一方を基準とする近端者位置からずれた場合でも、 通話品質の悪化が防止さ れることとなる。
さらに、 本発明の通話装置は、 前記エコー抑圧手段は、 前記現在値検出部で検出さ れた前記現在値に基づいて、 前記遠端信号変換部を基準とする前記近端者の現在の位 置である第二の近端者位置を検出する第二の近端者位置検出部と、 前記第一の抑圧後 近端信号出力部から出力される前記第一の抑圧後近端信号の周波数分布を、 前記現在 値検出部で検出された前記現在値と前記第二の近端者位置検出部で検出された前記第 二の近端者位置とに対応する等化特性に等化する第三の等化部とを備える構成を有し ている。
この構成により、 近端者位置が遠端信号変換部を基準とする近端者位置からずれて も、 通話品質の悪化が防止されるだけでなく、 第二の近端者位置検出部の構成が第一 の近端者位置検出部の構成より簡略化されることとなる。
さらに、 本発明の通話装置は、 基準点を有する筐体と、 遠端信号が遠端音声として 出力される音声出力手段と、 近端音声が入力される音声入力手段と、 前記音声出力手 段から出力された前記遠端音声が前記音声入力手段に入力されることにより発生する エコーを抑圧するエコー抑圧手段とを備え、 前記音声出力手段は、 前記基準点から予 め定められた第一の距離を隔てて設置され、 前記遠端信号を前記遠端音声に変換する 遠端信号変換部を含み、 前記音声入力手段は、 前記基準点から予め定められた第二の 距離を隔てて設置され、 入力された前記近端音声を第一の近端信号に変換する第一の 近端音声変換部と、 前記第一の近端音声変換部を基準とする予め定められた位置に設 置され、 入力された前記近端音声を第二の近端信号に変換する第二の近端音声変換部 とを含み、 前記エコー抑圧手段は、 前記遠端信号変換部と前記第一の近端音声変換部 または前記第二の近端音声変換部の何れか一方との間の相対位置を規定するパラメ一 タの現在値を検出する現在値検出部と、 前記パラメータを独立変数とし、 前記近端音 声が前記第一の近端音声変換部に伝播する第三の伝播時間を従属変数とする第三の関 数およぴ前記近端音声が前記第二の近端音声変換部に伝播する第四の伝播時間を従属 変数とする第四の関数に基づいて前記現在値検出部で検出された前記現在値に対応す る前記第三の伝播時間および前記第四の伝播時間を算出する第二の伝播時間算出部と 、 前記第二の伝播時間算出部で算出された前記第三の伝播時間および前記第四の伝播 時間に応じて変更される残留音声信号抽出特性により残留音声信号を抽出する残留音 声信号抽出部と、 前記第一の近端音声変換部で変換された前記第一の近端信号およぴ 前記第二の近端音声変換部で変換された前記第二の近端信号の何れか一方から前記残 留音声信号抽出部で抽出された前記残留音声信号を減算して第二の抑圧後近端信号を 出力する第二の抑圧後近端信号出力部とを含む構成を有している。
この構成により、 遠端信号変換部と近端音声変換部との間の相対位置に応じて近端 信号中に含まれる近端音声に遠端音声が混合して発生するエコーおよび背景雑音が確 実に抑圧されることとなる。
さらに、 本発明の通話装置は、 前記残留音声信号抽出部は、 前記第一の近端音声変 換部で変換された前記第一の近端信号を前記第二の伝播時間算出部で算出された前記 第三の伝播時間に基づいて遅延する第三の近端信号遅延部と、 前記第二の近端音声変 換部で変換された前記第二の近端信号を前記第二の伝播時間算出部で算出された前記 第四の伝播時間に基づいて遅延する第四の近端信号遅延部と、 前記第三の近端信号遅 延部で遅延された第三の遅延近端信号と前記第四の近端信号遅延部で遅延された第四 の遅延近端信号の間の差を残留音声信号として出力する残留音声信号出力部とを含み 、 前記第二の抑圧後近端信号出力部は、 前記残留音声信号出力部から出力される前記 残留音声信号に基づいて、 前記第一の近端音声変換部で変換された前記第一の近端信 号または前記第二の近端音声変換部で変換された前記第二の近端信号の何れか一方に 含まれる前記近端音声に対応する信号以外の信号である妨害音信号を推定する妨害音 信号推定部と、 前記第一の近端音声変換部で変換された前記第一の近端信号または前 記第二の近端音声変換部で変換された前記第二の近端信号の何れか一方を、 前記妨害 音信号推定部における妨害音信号推定に要する時間だけ遅延する第五の近端信号遅延 部と、 前記第五の近端信号遅延部で遅延された前記近端信号である第五の遅延近端信 号から、 前記妨害音信号推定部で推定された前記妨害音信号を減算して第二の抑圧後 近端信号を出力する第二の出力部と、 前記妨害音信号推定部の妨害音信号推定特性を 前記第二の抑圧後近端信号の自乗時間平均値が最小となる最適妨害音信号推定特性に 逐次更新する更新部とを含む構成を有している。
この構成により、 近端信号から残留音声信号が抽出され、 抽出された残留音声信号 を近端信号から減算することにより、 現在の遠端信号変換部と近端音声変換部との間 の相対的位置が変化された場合であっても、 近端信号中のェコーおよぴ背景雑音が抑 圧されることとなる。
さらに、 本発明の通話装置は、 前記エコー抑圧手段は、 前記現在値検出部で検出さ れた前記現在値に応じて、 前記更新部の初期妨害音信号推定特性を設定する初期特性 設定部を含む構成を有している。
この構成により、 妨害音信号推定部の妨害音信号推定特性が迅速に抑制後近端信号 の自乗時間平均値を最小とする最適妨害音信号推定特性に収斂し、 エコーおよび背景 雑音が一層確実に抑制される。
さらに、 本発明の通話装置は、 前記エコー抑圧手段は、 前記第一の近端音声変換部 で変換された前記第一の近端信号と前記第二の近端音声変換部で変換された前記第二 の近端信号との相互相関関数から、 前記第一の近端音声変換部または前記第二の近端 音声変換部の何れか一方を基準とする前記近端者の位置である第一の近端者位置を検 出する第一の近端者位置検出部と、 前記第二の抑圧後近端信号出力部から出力される 前記第二の抑圧後近端信号の周波数分布を、 前記現在値検出部で検出された前記現在 値と前記第一の近端者位置検出部で検出された前記第一の近端者位置とに対応する等 化特性に等化する第二の等化部とを含む構成を有している。
この構成により、 近端者位置が第一の基準位置からずれても、 通話品質の悪化が防 止されることとなる。
さらに、 本発明の通話装置は、 前記エコー抑圧手段は、 前記現在値検出部で検出さ れた前記現在値に基づき、 前記遠端信号変換部を基準とする前記近端者の位置である 第二の近端者位置を検出する第二の近端者位置検出部と、 前記第二の抑圧後近端信号 出力部から出力される前記第二の抑圧後近端信号の周波数分布を、 前記現在値検出部 で検出された前記現在値と前記第二の近端者位置検出部で検出された前記第二の近端 者位置とに対応する等化特性に等化する第三の等化部とを含む構成を有している。 この構成により、 近端者位置が第二の基準位置からずれても、 近端音声の周波数分 布が等化され、 通話品質が維持されるだけでなく、 第二の近端者位置検出部の構成が 第一の近端者位置検出部の構成より簡略化されることとなる。
さらに、 本発明の通話装置は、 基準点を有する筐体と、 遠端信号が遠端音声として 出力される音声出力手段と、 近端音声が入力される音声入力手段と、 前記音声出力手 段から出力された前記遠端音声が前記音声入力手段に入力されることにより発生する エコーを抑圧するエコー抑圧手段とを備え、 前記音声出力手段は、 前記基準点から予 め定められた第一の距離を隔てて設置され、 前記遠端信号を前記遠端音声に変換する 遠端信号変換部を含み、 前記音声入力手段は、 前記基準点から予め定められた第二の 距離を隔てて設置され、 入力された前記近端音声を第一の近端信号に変換する第一の 近端音声変換部と、 前記第一の近端音声変換部を基準とする予め定められた位置に設 置され、 入力された前記近端音声を第二の近端信号に変換する第二の近端音声変換部 とを含み、 前記エコー抑圧手段は、 第一の近端音声変換部で変換された前記第一の近 端信号およぴ前記第二の近端音声変換部で変換された前記第二の近端信号に基づいて 、 前記第一の近端信号および前記第二の近端信号に共通して含まれる真正近端音声に 対応する信号以外の信号であるエコー成分信号を検出するエコー成分検出部と、 第一 の近端音声変換部で変換された前記第一の近端信号および前記第二の近端音声変換部 で変換された前記第二の近端信号の何れか一方から、 前記ェコ一成分検出部で検出さ れた前記エコー成分信号を減算して第三の抑圧後近端信号を出力する第三の抑圧後近 端信号出力部を含む構成を有している。
ここでいうエコー成分信号とは、 近端音声に対応する信号以外の信号を意味し、 近 端信号中のエコーに限らず、 背景雑音などあらゆる雑音に対応する信号を含む。 この構成により、 エコー成分信号を近端信号から減算することにより、 現在の遠端 信号変換部と近端音声変換部との間の相対的位置が変化された場合であっても、 遠端 音声が近端音声に混入することによつて発生する近端信号中のェコーおよぴ背景雑音 が抑圧され、 高品質な通話が可能な通話装置を実現できる。
さらに、 本発明の通話装置は、 前記エコー成分検出部は、 第一の近端音声変換部で 変換された前記第一の近端信号およぴ前記第二の近端音声変換部で変換された前記第 二の近端信号に共通して含まれる真正近端音声に対応する真正近端信号を推定する真 正近端音声推定部と、 第一の近端音声変換部で変換された前記第一の近端信号または 前記第二の近端音声変換部で変換された前記第二の近端信号の何れか一方を、 前記真 正近端音声推定部における前記真正近端信号推定に要する時間だけ遅延する第六の近 端信号遅延部と、 前記第六の近端信号遅延部で遅延された前記近端信号である第六の 遅延近端信号と前記真正近端音声推定部で推定された前記真正近端信号の差を前記真 正近端信号以外の信号である第一のエコー成分信号として出力するエコー成分信号出 力部とを含み、 前記第三の抑圧後近端信号出力部は、 前記エコー成分信号出力部から 出力される前記エコー成分信号に基づいて、 前記第一の近端音声変換部で変換された 前記第一の近端信号または前記第二の近端音声変換部で変換された前記第二の近端信 号の何れか一方に含まれる前記近端音声に対応する信号以外の信号である第二のェコ 一成分信号を推定するェコ一成分推定部と、 第一の近端音声変換部で変換された前記 第一の近端信号または前記第二の近端音声変換部で変換された前記第二の近端信号の 何れか一方を、 前記ェコ一成分推定部における前記ェコ一の信号成分の推定に要する 時間だけ遅延する第七の近端信号遅延部と、 前記第七の近端信号遅延部で遅延された 前記近端信号である第七の遅延近端信号から前記ェコ一成分推定部で推定された前記 第二のエコー成分信号を減算して第三の抑圧後近端信号を出力する第三の出力部とを 含む構成を有している。
この構成により、 前記近端音声に対応する信号以外の信号であるエコー成分信号が 抽出され、 抽出されたエコー成分信号を近端信号から減算することにより、 現在の遠 端信号変換部と近端音声変換部との間の相対的位置が変化された場合であつても、 近 端信号中のエコーおよび背景雑音が抑圧され、 高品質な通話が可能な通話装置を実現 できる。
さらに、 本発明の通話装置は、 第一の近端音声変換部で変換された前記第一の近端 信号および前記第二の近端音声変換部で変換された前記第二の近端信号の何れかに対 して前記エコー成分出力部から出力される信号の絶対値を最小にするように適応フィ ルタ処理を行う第一の適応フィルタを有し、 前記ェコ一成分推定部は前記ェコ一成分 信号出力部から出力される前記エコー成分信号に対して前記第三の出力部から出力さ れる信号の絶対値を最小にするように適応フィルタ処理を行う第二の適応フィルタを 有し、 前記エコー抑圧手段は、 前記遠端信号変換部と前記第一の近端音声変換部また は前記第二の近端音声変換部の何れか一方との間の相対位置を規定するパラメータの 現在値を検出する現在値検出部と、 前記現在値検出部が検出したパラメータの現在値 に応じて、 前記第一の適応フィルタが行う適応フィルタ処理のパラメータである第一 のフィルタ係数の初期値を決定する第一の初期値決定部と、 前記現在値検出部が検出 したパラメータの現在値に応じて前記第二の適応フィルタが行う適応フィルタ処理の パラメータである第二のフィルタ係数の初期値を決定する第二の初期値決定部とを含 む構成を有している。
この構成により、 現在検出部が検出したパラメータの現在地に応じて、 第一の初期 値決定部および第二の初期値決定部が、 第一のフィルタ計数およぴ第二のフィルタ計 数の初期値を決定するため、 現在の遠端信号変換部と近端音声変換部との間の相対的 位置が変化された場合であっても、 短時間に遠端音声が近端音声に混入することによ つて発生する近端信号中のエコーおよび背景雑音が抑圧され、 高品質な通話が可能な 通話装置を実現できる。
さらに、 本発明の通話装置は、 前記エコー抑圧手段は、 前記第一の近端信号または 前記第二の近端信号のうちの予め決められた近端信号が前記遠端信号より卓越したと きに、 前記第一のフィルタ係数の更新を前記第一の適応フィルタに指示すると共に、 前記遠端信号が前記第一の近端信号または前記第二の近端信号のうちの予め決められ た近端信号より卓越したときに、 前記第二の適応フィルタに前記第二のフィルタ係数 の更新を前記第二の適応フィルタに指示する適応制御部を含む構成を有している。 この構成により、 適応制御部が遠端信号と近端信号とに基づいて、 第一のフィルタ 計数および第二のフィルタ係数の更新を、 第一の適応フィルタおよび第二の適応フィ ルタに指示するため、 通信環境の変化に好適に追随でき、 現在の遠端信号変換部と近 端音声変換部との間の相対的位置が変化された場合であっても、 短時間に遠端音声が 近端音声に混入することによって発生する近端信号中のエコーおよび背景雑音が抑圧 され、 高品質な通話が可能な通話装置を実現できる。 図面の簡単な説明
本発明に係る通話装置の特徴および長所は、 以下の図面と共に、 後述される記載か ら明らかになる。
第 1図は、 本発明に係る第一の実施の形態の通話装置の機能構成図である。
第 2図は、 本発明に係る第一の実施の形態の通話装置のハードウエア構成図である 第 3図は、 本発明に係る通話装置を携帯電話に適用した場合の構成図である。 第 4図は、 本発明に係る第一の実施の形態の通話装置の動作を説明するフローチヤ 一トである。
第 5図は、 第一の等化部を含む第一の実施の形態の通話装置の機能構成図である。 第 6図は、 第一の等化部を含む第一の実施の形態の通話装置の動作を説明するフ口 一チヤ一トである。 第 7図は、 第一の実施の形態の通話装置の第一の等化部の動作を説明するフローチ ヤートである。
第 8図は、 第一の実施の形態の通話装置の第一の等化部の等化特性を示すグラフで める。
第 9図は、 第二の等化部を含む第一の実施の形態の通話装置の機能構成図である。 第 1 0図は、 第二の等化部を含む第一の実施の形態の通話装置の動作を説明するフ ローチャートである。 第 1 1図は、 第一の実施の形態の通話装置の第二の等化部の動作を説明するフロー チヤ一トである。
第 1 2図は、 第一の実施の形態の通話装置の第三の等化部を含む第一の実施の形態 の通話装置の機能構成図である。
第 1 3図は、 第一の実施の形態の通話装置の第三の等化部の等化特性を示すグラフ である。
第 1 4図は、 本発明に係る第二の実施の形態の通話装置の機能構成図である。 第 1 5図は、 本発明に係る第二の実施の形態の通話装置の動作を説明するフローチ ヤートである。
第 1 6図は、 本発明に係る第二の実施の形態の通話装置のエコー抑圧手段の動作を 説明するフローチャートである。
第 1 7図は、 初期特性設定部を含む第二の実施の形態の通話装置の機能構成図であ る。
第 1 8図は、 初期特性設定部を含む第二の実施の形態の通話装置の動作を説明する フローチヤ一トである。
第 1 9図は、 第二の等化部を含む第二の実施の形態の通話装置の機能構成図である 第 2 0図は、 第二の等化部を含む第二の実施の形態の通話装置の動作を説明するフ ローチャートである。
第 2 1図は、 第三の等化部を含む第二の実施の形態の通話装置の機能構成図である 第 2 2図は、 本発明に係る第三の実施の形態の通話装置のブロック図である 第 2 3図は、 本発明に係る第三の実施の形態の通話装置の動作を説明するブローチ ヤートである。
第 2 4図は、 本発明に係る第三の実施の形態の通話装置によって得られる効果を説 明する図である。
第 2 5図は、 従来の通話装置の構成図である。
第 2 6図は、 従来の通話装置の構成図である。 発明を実施するための最良の形態
以下、 本発明に係る通話装置の実施の形態について、 図面を参照して説明する。
(第一の実施の形態)
なお、 本明細書において、 「基準点」 は、 遠端信号変換部と第一の近端音声変換部お よび第二の近端音声変換部の何れか一方との相対位置を規定する基準となる点であり 、 本発明を二つの部分筐体により構成される筐体からなる携帯電話に適用した場合に は、 二つの部分筐体を結合するヒンジが基準点となる。
また、 本明細書において、 「基準位置」 は、 遠端信号変換部または第一の近端音声変 換部および第二の近端音声変換部の何れか一方を基準とする近端者の位置であり、 通 常の使用状態を想定して設計段階で定められる。 第一の近端音声変換部および第二の 近端音声変換部の何れか一方を基準とする基準位置が第一の基準位置であり、 遠端信 号変換部を基準とする基準位置が第二の基準位置である。
まず、 図 1を参照して、 本発明に係る第一の実施の形態の通話装置の構成を説明す る。
本発明に係る第一の実施の形態の通話装置は、 図 1に示すように、 遠端信号が遠端 音声として出力される音声出力手段 1 1と、 近端音声が入力される音声入力手段 1 2 と、 音声出力手段 1 1から出力された遠端音声が音声入力手段 1 2に入力されること により発生するエコーを抑圧するエコー抑圧手段 1 3とを備える。
音声出力手段 1 1は、 基準点から予め定められた第一の距離を隔てて設置され、 遠 端信号を遠端音声に変換する遠端信号変換部 1 1 2を含む。
音声入力手段 1 2は、 基準点から予め定められた第二の距離を隔てて設置され、 入 力された近端音声を第一の近端信号に変換する第一の近端音声変換部 1 2 1と、 第一 の近端音声変換部 1 2 1を基準とする予め定められた位置に設置され、 入力された近 端音声を第二の近端信号に変換する第二の近端音声変換部 1 2 2とを含む。
エコー抑圧手段 1 3は、 遠端信号変換部 1 1 2と第一の近端音声変換部 1 2 1また は第二の近端音声変換部 1 2 2の何れか一方との間の相対位置を規定するパラメータ の現在値を検出する現在値検出部 1 3 1と、 遠端信号変換部 1 1 2と第一の近端音声 変換部 1 2 1または第二の近端音声変換部 1 2 2の何れか一方との間の相対位置を規 定するパラメータを独立変数とし、 遠端信号変換部 1 1 2で変換された遠端音声が第 —の近端音声変換部 1 2 1に伝播する伝播時間 (以後、 「第一の伝播時間」 と呼ぶ) を 従属変数とする第一の関数および第二の近端音声変換部 1 2 2に伝播する伝播時間 ( 以後、 「第二の伝播時間」 と呼ぶ) を従属変数とする第二の関数に基づいて現在値検出 部 1 3 1で検出された現在値に対応する第一の伝播時間および第二の伝播時間を算出 する第一の伝播時間算出部 1 3 2と、 第一の伝播時間算出部 1 3 2で算出された第一 の伝播時間およぴ第二の伝播時間に応じて変更されるェコ一抑圧特性によりエコーを 抑圧し、 エコー抑圧後の第一の近端信号を出力する第一の抑圧後近端信号出力部 1 3 0とを含む。
そして、 第一の抑圧後近端信号出力部 1 3 0は、 第一の近端音声変換部 1 2 1で変 換された第一の近端信号を第一の伝播時間算出部 1 3 2で算出された第一の伝播時間 に基づいて遅延する第一の近端信号遅延部 1 3 3と、 第二の近端音声変換部 1 2 2で 変換された第二の近端信号を第一の伝播時間算出部 1 3 2で算出された第二の伝播時 間に基づいて遅延する第二の近端信号遅延部 1 3 4と、 第一の近端信号遅延部 1 3 3 で遅延された第一の遅延近端信号と第二の近端信号遅延部 1 3 4で遅延された第二の 遅延近端信号との差信号を出力する第一の出力部 1 3 5とを含む。
なお、 図 1には、 本発明の第一の実施の形態の通話装置において、 第一の近端信号 遅延部 1 3 3および第二の近端信号遅延部 1 3 4を含む構成の機能構成図が示されて いるが、 遠端信号変換部 1 1 2から第一の近端音声変換部 1 2 1または第二の近端音 声変換部 1 2 2への音声の伝播時間が無視できる場合には、 対応する第一の近端信号 遅延部 1 3 3または第二の近端信号遅延部 1 3 4を省略してもよい。
従って、 本発明の第一の実施の形態の通話装置において、 例えば第二の近端信号遅 延部 1 3 4が省略された場合は、 第一の近端信号遅延部 1 3 3で遅延された第一の遅 延近端信号と第二の近端音声変換部 1 2 2で変換された第二の近端信号との差が、 第 —の出力部 1 3 5から出力されることとなる。
なお、 本発明の第一の実施の形態の通話装置が、 第一の近端信号遅延部 1 3 3およ ぴ第二の近端信号遅延部 1 3 4を含む場合は、 第一の近端信号遅延部 1 3 3で遅延さ れた第一の遅延近端信号と第二の近端信号遅延部 1 3 4で遅延された第二の遅延近端 信号との差が、 第一の出力部 1 3 5から出力されることとなる。
次に、 図 2を参照して、 本発明に係る通話装置の第一の実施の形態のハードウェア 構成を説明する。
音声出力手段 1 1の遠端信号変換部 1 1 2は遠端信号増幅器 2 1 1およびスピーカ 2 1 2で構成されている。 また、 音声入力手段 1 2の第一の近端音声変換部 1 2 1は 第一のマイクロホン 2 2 1および第一の近端信号増幅器 2 2 3で、 第二の近端音声変 換部 1 2 2は第二のマイクロホン 2 2 2および第二の近端信号増幅器 2 2 4で、 それ ぞれ構成されている。
さらに、 エコー抑圧手段 1 3の現在値検出部 1 3 1は、 遠端信号変換部 1 1 2と第 一の近端音声変換部 1 2 1または第二の近端音声変換部 1 2 2の何れか一方との相対 位置を規定するパラメータを検出して電気信号に変換できる検出器であればよく、 口 一タリエンコーダ、 ポテンショメータ等を適用することができる。 また、 必ずしも遠 端信号変換部 1 1 2と第一の近端音声変換部 1 2 1または第二の近端音声変換部 1 2 2の何れか一方との相対位置を規定するパラメータを連続的に検出する必要はなく、 少なくとも一つの特定相対位置になったときに開閉状態が反転するスィッチを適用し てもよい。
これに対して、 エコー抑圧手段 1 3の現在値検出部 1 3 1以外の動作は、 メモリ 2 3 1に記憶されたプログラムを C P U 2 3 2で実行することによって実現される。 従って、 エコー抑圧手段 1 3は、 第一の近端信号増幅器 2 2 3および第二の近端信 号増幅器 2 2 4から出力される近端信号、 ならびに現在値検出部 1 3 1で検出された パラメータをデジタル値に変換するアナログ ·デジタル変換器 (以下単に AZD変換 器という) 2 3 3と、 エコー抑圧後近端信号をアナログ信号に変換するデジタル'ァ ナログ変換器 (以下単に D/A変換器という) 2 3 4とを含んでいる。 メモリ 2 3 1 、 C P U 2 3 2、 A/D変換器 2 3 3、 および D/A変換器 2 3 4は、 バス 2 3 5に より相互に電気的に結合されている。 なお、 現在値検出部 1 3 1がスィッチで構成さ れる場合は、 デジタル入力インターフェイスを設け、 デジタル入力インターフェイス を介して現在値を読み込むこともできる。
なお、 以後の実施の形態においても、 ハードウェア構成は同一であるので、 各実施 の形態におけるハードウエア構成の説明は省略する。
次に、 図 3を参照して、 本発明に係る通話装置を、 二つの部分筐体で構成される筐 体からなる携帯電話に適用した場合のエコー抑圧手段 1 3内の第一の伝播時間算出部 1 3 2で使用される遠端信号変換部 1 1 2と第一の近端音声変換部 1 2 1または第二 の近端音声変換部 1 2 2との間の相対位置を規定するパラメータを独立変数とし、 少 なくとも一つの遠端信号変換部 1 1 2から出力された音声が第一の近端音声変換部 1 2 1および第二の近端音声変換部 1 2 2のそれぞれに伝播する伝播時間が従属変数で ある関数の具体例を説明する。
二つの部分筐体で構成される筐体からなる携帯電話 3 0は、 ほぼ中央の基準点であ るヒンジ 3 1によって結合された第一の部分筐体 3 2および第二の部分筐体 3 3を有 し、 第一の部分筐体 3 2に遠端信号変換部 1 1 2に含まれるスピー力 2 1 2が設置さ れ、 第二の部分筐体 3 3に第一の近端音声変換部 1 2 1に含まれる第一のマイクロホ ン 2 2 1および第二の近端音声変換部 1 2 2に含まれる第二のマイクロホン 2 2 2が 格納されている。
そして、 ヒンジ 3 1と第一のマイクロホン 2 2 1および第二のマイクロホン 2 2 2 の間の距離 aおよび (a + x )、 ヒンジ 3 1とスピー力 2 1 2の間の距離は bで不変で める。
第一の部分筐体 3 2に対して第二の部分筐体 3 3が成す角度を 0 (図 3参照) とす れば、 角度 0はスピーカ 2 1 2と第一のマイクロホン 2 2 1および第二のマイクロホ ン 2 2 2の何れか一方との間の相対位置を規定するパラメータである。
スピーカ 2 1 2から第一のマイクロホン 2 2 1までの距離を音声が伝播するのに要 する時間 T 1、 およびスピーカ 2 1 2から第二のマイクロホン 2 2 2までの距離を音 声が伝播するのに要する時間 T2は、 それぞれ ( 1 ) 式および (2 ) 式で表されるよう に、 スピーカ 2 1 2とマイクロホン 2 2 1および 2 2 2の何れか一方との間の相対位 置を規定するパラメータである角度 6の関数として表される。 【数 1】
T, = ia +bz +2ab- cos0/v (1) 【数 2】
= 2 +b2 + lab · cos/ + 2x(b · cos +a) +x2 /v (2) ただし、 vは音速である。
次に、 図 4のフローチャートを参照して、 本発明に係る第一の実施の形態の通話装 置のエコー抑圧手段 1 3の動作を説明する。
最初に、 オンフック状態である等、 通話終了条件が成立しているか否かが判定され (ステップ S 4 0 1 )、 通話終了条件が成立していると判定されたときは、 エコー抑圧 手段 1 3は動作を終了する。 逆に、 通話終了条件が成立していないと判定されたとき は、 通話中であるものとして、 近端信号のレベルが予め定められたレベル以上である か否か等に基づいて、 通話が開始されたか否かが判定される (ステップ S 4 0 2 )。 次に、 ステップ S 4 0 2において通話が開始されていないと判定されれば、 通話終 了条件が成立しているか否かの判定 (ステップ S 4 0 1 ) に戻る。 逆に、 ステップ S 4 0 2において通話が開始されたと判定されたときは、 現在値検出部 1 3 1で検出さ れた遠端信号変換部 1 1 2と第一の近端音声変換部 1 2 1または第二の近端音声変換 部 1 2 2の何れか一方との間の相対位置を規定するパラメータの現在値が、 現在値検 出部 1 3 1から AZD変換器 2 3 3を介して読み込まれる (ステップ S 4 0 3 )。 そして、 遠端信号変換部 1 1 2と第一の近端音声変換部 1 2 1または第二の近端音 声変換部 1 2 2の何れか一方との間の相対位置を規定するパラメータを独立変数とし 、 遠端信号変換部 1 1 2で変換された遠端音声が第一の近端音声変換部 1 2 1に伝播 する第一の伝播時間を従属変数とする第一の関数および第二の近端音声変換部 1 2 2 に伝播する第二の伝播時間を従属変数とする第二の関数の独立変数に、 現在値検出部 1 3 1から A/D変換器 2 3 3を介して読み込まれた現在値を代入して、 現在値に対 応する第一の伝播時間および第二の伝播時間が算出される (ステップ S 4 0 4 )。 なお 、 この処理が、 第一の伝播時間算出部 1 3 2の動作に相当する。
次に、 近端信号が、 第一の近端音声変換器 2 2 3および第二の近端音声変換器 2 2 4から AZD変換器 2 3 3を介して読み込まれ (ステップ S 4 0 5 )、 近端信号を伝播 時間だけ遅延される (ステップ S 4 0 6 )。
近端信号を遅延する方法としては、 遅延時間をサンプリング時間の整数倍に近似し 、 シフトレジスタにより近端信号を遅延させる方法がある。 また、 より精密に近端信 号を遅延させるには、 遅延部を F I R (有限インパルス応答) フィルタで構成すれば よい。
なお、 この処理が第一の近端信号遅延部 1 3 3および第二の近端信号遅延部 1 3 4 の動作に相当する。
そして、 第一の近端信号遅延部 1 3 3で遅延された第一の遅延近端信号と第二の近 端信号遅延部 1 3 4で遅延された第二の遅延近端信号とを減算することにより、 ェコ 一が抑圧される (ステップ S 4 0 7 )。 そして、 この処理が第一の出力部 1 3 5の動作 に相当する。
また、 ステップ S 4 0 6からステップ S 4 0 8までの処理が、 第一の抑圧後近端信 号出力部 1 3 0の動作に相当する。
次に、 抑圧後近端信号を D/A変換器 2 3 4でアナログ信号に変換して出力する ( ステップ S 4 0 8 )。
最後に、 近端信号のレベルが予め定められたレベル以下となったか否か等に基づい て通話が終了したか否かを判定し (ステップ S 4 0 9 )、 近端信号のレベルが予め定め られたレベル以上で通話が終了していないと判定されたときは、 近端信号の読み込み (ステップ S 4 0 5 ) に戻る。 逆に、 近端信号のレベルが予め定められたレベル以下 となつて通話が終了していると判定されたときは、 オンフック状態であるか否か等に より通話終了条件が成立しているか否かの判定 (ステップ S 4 0 1 ) に戻る。
なお、 上記においては、 第一の伝播時間算出部 1 3 2で算出された第一の伝播時間 を第一の近端信号遅延部 1 3 3の遅延時間として、 第一の伝播時間算出部 1 3 2で算 出された第二の伝播時間を第二の近端信号遅延部 1 3 4の遅延時間として設定してい る。
しかし、 実際には、 遠端信号変換部 1 1 2から第一の近端音声変換部 1 2 1または 第二の近端音声変換部 1 2 2の一方 (例えば、 第一の近端音声変換部 1 2 1 ) への音 声の伝播時間を固定遅延時間として、 遠端信号変換部 1 1 2から他方の近端音声変換 部 (例えば、 第二の近端音声変換部 1 2 2 ) への音声の伝播時間と固定遅延時間との 差を可変遅延時間として、 別個に設定することが望ましい。
これは、 通話中における遠端信号変換部 1 1 2と第一の近端音声変換部 1 2 1また は第二の近端音声変換部 1 2 2の一方との相対位置が予め想定できる場合には、 遅延 時間を予め定められた固定時間とできるだけでなく、 音声出力手段 1 1と音声入力手 段 1 2との位置関係が変更されて、 可変遅延時間が負となった場合にも対応が容易で あるからである。
以上説明したように、 本発明に係る第一の実施の形態の通話装置は、 エコー抑圧手 段 1 3に現在値検出部 1 3 1と、 第一の伝播時間算出部 1 3 2と、 第一の近端信号遅 延部 1 3 3および第二の近端信号遅延部 1 3 4と、 第一の出力部 1 3 5とを設けてい るので、 現在の遠端信号変換部 1 1 2と第一の近端音声変換部 1 2 1または第二の近 端音声変換部 1 2 2の何れか一方との間の相対位置が変更された場合であっても、 ェ コーを確実に抑圧することが可能となる。
また、 本努明に係る第一の実施の形態の通話装置は、 図 5に示すように、 エコー抑 圧手段 1 3が、 第一の抑圧後近端信号出力部 1 3 0の後段に、 第一の抑圧後近端信号 出力部 1 3 0から出力される第一の抑圧後近端信号の周波数分布を、 現在値検出部 1 3 1で検出された現在値に対応した等化特性に等化する第一の等化部 1 3 6を備えて あよい。
図 6は、 第一の等化部 1 3 6を含むエコー抑圧手段 1 3の動作を説明するフローチ ヤートであって、 図 4のフローチャートに対して、 抑圧後近端信号の周波数分布を等 化する第一の等化部 1 3 6の動作 (ステップ S 4 1 0 ) が追加される。
なお、 この場合、 第一の等化部 1 3 6の動作は、 メモリ 2 3 1に記憶されているプ ログラムを実行することにより実現される。
従って、 ステップ S 4 0 1からステップ S 4 0 7までの処理、 およびステップ S 4 0 8以後の処理は、 図 4と同一であるので、 その説明を省略する。
ここで、 図 7のフローチャートを参照して、 第一の等化部 1 3 6の動作を説明する まず、 近端信号に含まれるエコーが抑圧 (ステップ S 4 0 7 ) された後、 現在値検 出部 1 3 1で検出された現在値に対応した等化特性を予めメモリ 2 3 1に記憶されて いる等化特性を使用して算出 (ステップ S 4 1 1 ) し、 近端信号の周波数分布を等化 する (ステップ S 4 1 2 )。 以上の処理が、 第一の等化部 1 3 6の動作に対応する。 次に、 図 8を参照して、 本発明に係る通話装置を二つの部分筐体により構成される 筐体を有する携帯電話に適用した場合の、 第一の等化部 1 3 6の動作を説明する。 図 8において、 近端者が遠端信号変換部 1 1 2を基準とする第二の規準位置にいる ときの抑制後近端信号の周波数に対するレベルの変化を示している。 なお、 実線、 一 点鎖線、 および破線は、 第一の部分筐体 3 2が第二の部分筐体 3 3に対して成す角度 0がそれぞれ 0度、 3 0度および 6 0度の場合を示し、 このグラフのデータが、 予め メモリ 2 3 1内に記憶されている。
例えば、 現在値検出部 1 3 1によつて第一の部分筐体 3 2が第二の部分筐体 3 3に 対して成す角度 0が 3 0度であることが検出されると、 一点鎖線で示される等化特性 が選択され、 この等化特性を使用して、 第一の出力部 1 3 5から出力される第一の抑 圧後近端信号の周波数分布が等化される。
なお、 現在値検出部 1 3 1によって検出された角度 0力 例えば 4 5度のように、 予めメモリに記憶されていない角度である場合には、 その角度に近い記憶されている 角度に対応する等化特性から内挿法等により等化特性を算出する。
以上説明したように、 上記の通話装置は、 第一の抑圧後近端信号出力部 1 3 0の後 段に、 現在値検出部 1 3 1で検出された現在値により等化特性が変化する第一の等化 部 1 3 6を設けたので、 音声出力手段 1 1と音声入力手段 1 2の相対位置が変化して 抑制後近端信号の周波数分布が悪化しても、 通話品質の悪化を防止することが可能と なる。
さらに、 本発明に係る第一の実施の形態の通話装置は、 図 9に示すように、 エコー 抑圧手段 1 3が、 第一の近端音声変換部 1 2 1および第二の近端音声変換部 1 2 2か ら出力される第一の近端信号と第二の近端信号との間の相互相関関数から近端者の位 置を検出する第一の近端者位置検出部 1 3 7と、 第一の抑圧後近端信号出力部 1 3 0 から出力される第一の抑圧後近端信号の周波数分布を、 現在値検出部 1 3 1で検出さ れた現在値、 および、 第一の近端者位置検出部 1 3 7で検出された第一の近端者位置 に対応した等化特性に等化する第二の等化部 1 3 8とを備えてもよレ、。
図 1 0は、 第二の等化部 1 3 8を備えるエコー抑圧手段 1 3の動作を説明するフロ 一チャートであって、 図 4のフローチャートに対して、 抑圧後近端信号の周波数分布 を等化する第二の等化処理(ステップ S 4 2 0 ) が追加される。 なお、 ステップ S 4 0 1からステップ S 4 0 7までの処理、 およびステップ S 4 0 8以後の処理は図 4と同 じであるので、 その説明を省略する。
次に、 図 1 1を参照して、 第二の等化処理を説明する。
まず、 遠端者が発言していない無信号区間が検出される。 この検出は遠端信号のレ ベルが固定しきい値以下であるか否かにより判定することが一般的であるが、 遠端信 号に雑音が重畳している場合には、 しきい値として所定の時間の遠端信号の平均値を 使用してもよい。
無信号区間が検出されると、 近端者が発言しているか否かを判定する。 この判定は
、 近端信号のレベルが、 固定しきい値、 または、 近端信号の所定の時間の平均値以上 であるか否かにより行うことができるが、 背景雑音環境下では、 白色化相互相関関数 の最大値が基準値 (0 . 5〜0 . 7 ) 以上であるか否かにより判定することが有利で ある。
ここで、 白色化相互相関関数とは、 第一の近端音声変換部 1 2 1で変換された第一 の近端信号と第二の近端音声変換部 1 2 2で変換された第二の近端信号との間のクロ ススぺク トルを、 第一の近端音声変換部 1 2 1で変換された第一の近端信号のパワー と第二の近端音声変換部 1 2 2で変換された第二の近端信号のパワーの積で正規化し て逆フーリエ変換した関数である。
そして、 無信号区間内において近端者が発言していると判定されると、 既に第一の 近端音声変換部 1 2 1から読み込まれている第一の近端信号と第二の近端音声変換部 1 2 2から読み込まれている第二の近端信号の間の白色化相互相関関数により、 第一 の近端音声変換部 1 2 1または第二の近端音声変換部 1 2 2の何れか一方を基準とす る近端者の位置である第一の近端者位置を計算する (ステップ S 4 2 1 )。 そして、 こ の処理が第一の近端者位置検出部 1 3 7の動作に相当する。
次に、 第一の近端者位置検出部 1 3 7で検出された第一の近端者位置および現在値 検出部 1 3 1で検出された現在値に対応した等化特性が予めメモリ 2 3 1に記憶され ている等化特性を使用して算出 (ステップ S 4 2 2 ) され、 この等化特性を用いて抑 制後近端信号の周波数分布が等化される (ステップ S 4 2 3 )。 そして、 以上の処理が 、 第二の等化部 1 3 8の動作に相当する。
以上説明したように、 上記の通話装置は、 エコー抑圧手段 1 3中に第一の近端者位 置検出部 1 3 7と第二の等化部 1 3 8とを設けたので、 第一の近端者位置が第一の基 準位置からずれた場合にも、 抑制後近端信号の周波数分布をずれに応じた等化特性で 等化することにより、 通話品質が悪化することを防止することが可能となる。
さらに、 本発明に係る第一の実施の形態の通話装置は、 図 1 2に示すように、 現在 値検出部 1 3 1で検出された現在値に基づいて、 遠端信号変換部 1 1 2を基準とする 近端者の現在の位置である第二の近端者位置を検出する第二の近端者位置検出部 1 3 9と、 第一の抑圧後近端信号出力部 1 3 0から出力される第一の抑圧後近端信号の周 波数分布を、 現在値検出部 1 3 1で検出された現在値と第二の近端者位置検出部 1 3 9で検出された第二の近端者位置とに対応する等化特性に等化する第三の等化部 1 4 0とを備えてもよい。
従って、 上記の通話装置では、 近端者は遠端信号変換部 1 1 2と正対する遠端信号 変換部 1 1 2を基準とする第二の基準位置に位置しているものとして、 等化特性が算 出される。
上記の通話装置を二つの部分筐体から構成される筐体を有する携帯電話に適用した 場合、 近端者は第二の部分筐体 3 3に対して角度 α (図 3およぴ図 1 2を参照) をな す位置にいることとなる。 しかし、 近端者は遠端信号変換部 1 1 2と正対する遠端信 号変換部 1 1 2を基準とする第二の基準位置に位置しているとしているので、 角度 α および近端音声が第一の近端音声変換部 1 2 1および'第二の近端音声変換部 1 2 2に 伝播する伝播時間は、 第一の部分筐体 3 2が第二の部分筐体 3 3に対して成す角度 Θ の関数となる。 従って、 現在値検出部 1 3 1で検出される現在値から、 角度 おょぴ 近端音声が第一の近端音声変換部 1 2 1および第二の近端音声変換部 1 2 2に伝播す る伝播時間を算出することができる。
ここで、 図 1 3を参照して、 上記の通話装置を二つの部分筐体から構成される筐体 を有する携帯電話に適用した場合の第三の等化部 1 4 0の動作を説明する。
図 1 3の (ィ)、 (口) および (ハ) は、 第一の部分筐体 3 2が第二の部分筐体 3 3 に対して成す角度 0が、 それぞれ 0度、 3 0度および 6 0度である場合の抑圧後近端 信号の周波数分布を示している。 そして、 この三つのグラフに対応するデータが予め メモリ 2 3 1内に記憶されている。
なお、 各グラフの一点鎖線、 破線および実線は、 第二の部分筐体 3 3に対して近端 者が成す角度 が、 それぞれ 9 0度、 1 2 0度および 1 5 0度である場合の抑圧後近 端信号の周波数分布を示している。
そして、 現在値検出部 1 3 1で検出された現在値である第二の部分筐体 3 3に対し て第一の部分筐体 3 2が成す角度 0が 3 0度であり、 第二の近端者位置検出部 1 3 9 で検出された近端者位置が第二の部分筐体 3 3に対して成す角度 が 1 2 0度であれ ば、 グラフ (口) の破線が等化特性として選択され、 この等化特性を使用して抑制後 近端信号の周波数分布が等化される。 なお、 本実施の形態においても、 等化特性が予 めメモリ 2 3 1に記憶されていない場合は、 記憶されている等化特性を使用して内挿 法等を使用して等化特性を算出することができる。
以上説明したように、 上記の通話装置は、 エコー抑圧手段 1 3中に第二の近端者位 置検出部 1 3 9と第三の等化部 1 4 0とを設けたので、 近端者位置が第二の基準位置 からずれても、 通話品質の悪化を防止できる可能となるだけでなく、 第二の近端者位 置検出部 1 3 9の構成を簡略化することが可能となる。
(第二の実施の形態)
次に、 図 1 4を参照して、 本発明に係る第二の実施の形態の通話装置の構成につい て説明する。
本発明に係る第二の実施の形態の通話装置は、 遠端信号が遠端音声として出力され る音声出力手段 1 1と、 近端音声が入力される音声入力手段 1 2と、 音声出力手段 1 1から出力された遠端音声が音声入力手段 1 2に入力されることにより発生するェコ 一を抑圧するエコー抑圧手段 1 3とを備える。
音声出力手段 1 1は、 基準点から予め定められた第一の距離を隔てて設置され、 遠 端信号を遠端音声に変換する遠端信号変換部 1 1 2を含む。
音声入力手段 1 2は、 基準点から予め定められた第二の距離を隔てて設置され、 入 力された近端音声を第一の近端信号に変換する第一の近端音声変換部 1 2 1と、 第一 の近端音声変換部 1 2 1を基準とする予め定められた位置に設置され、 入力した近端 音声を第二の近端信号に変換する第二の近端音声変換部 1 2 2とを含む。
エコー抑圧手段 1 3は、 遠端信号変換部 1 1 2と第一の近端音声変換部 1 2 1また は第二の近端音声変換部 1 2 2の何れか一方との間の相対位置を規定するパラメータ の現在値を検出する現在値検出部 1 3 1と、 パラメータを独立変数とし、 近端音声が 第一の近端音声変換部 1 2 1に伝播する第三の伝播時間を従属変数とする第三の関数 および近端音声が第二の近端音声変換部 1 2 2に伝播する第四の伝播時間を従属変数 とする第四の関数に基づいて現在値検出部 1 3 1で検出された現在値に対応する第三 の伝播時間および第四の伝播時間を算出する第二の伝播時間算出部 1 4 1と、 第二の 伝播時間算出部 1 4 1で算出された第三の伝播時間および第四の伝播時間に応じて変 更される残留音声信号抽出特性により残留音声信号を抽出する残留音声信号抽出部 1 5 0と、 第一の近端音声変換部 1 2 1で変換された第一の近端信号および第二の近端 音声変換部 1 2 2で変換された第二の近端信号の何れか一方から残留音声信号抽出部 1 5 0で抽出された残留音声信号を減算して残留音声が抑圧された第二の抑圧後近端 信号を出力する第二の抑圧後近端信号出力部 1 5 1とを含む構成を有している。 そして、 残留音声信号抽出部 1 5 0は、 第一の近端音声変換部 1 2 1で変換された 第一の近端信号を第二の伝播時間算出部 1 4 1で算出された第三の伝播時間に基づい て遅延する第三の近端信号遅延部 1 4 2と、 第二の近端音声変換部 1 2 2で変換され た第二の近端信号を第二の伝播時間算出部 1 4 1で算出された第四の伝播時間に基づ いて遅延する第四の近端信号遅延部 1 4 3と、 第三の近端信号遅延部 1 4 2で遅延さ れた第三の遅延近端信号と第四の近端信号遅延部 1 4 3で遅延された第四の遅延近端 信号の間の差を残留音声信号として出力する残留音声信号出力部 1 4 4とを含む。 さらに、 第二の抑圧後近端信号出力部 1 5 1は、 残留音声信号出力部 1 4 4から出 力される残留音声信号に基づいて、 第一の近端音声変換部 1 2 1で変換された第一の 近端信号または第二の近端音声変換部 1 2 2で変換された第二の近端信号の何れか一 方に含まれる近端音声に対応する信号以外の信号である妨害音信号を推定する妨害音 信号推定部 1 4 5と、 第一の近端音声変換部 1 2 1で変換された第一の近端信号また は第二の近端音声変換部 1 2 2で変換された第二の近端信号の何れか一方を、 妨害音 信号推定部 1 4 5における妨害音信号推定に要する時間だけ遅延する第五の近端信号 遅延部 1 4 6と、 第五の近端信号遅延部 1 4 6で遅延された近端信号である第五の遅 延近端信号から、 妨害音信号推定部 1 4 5で推定された妨害音信号を減算して第二の 抑圧後近端信号を出力する第二の出力部 1 4 7と、 妨害音信号推定部 1 4 5の妨害音 信号推定特性を第二の抑圧後近端信号の自乗時間平均値が最小となる最適妨害音信号 推定特性に逐次更新する更新部 1 4 8とを含む。
次に、 図 1 5のフローチャートを参照して、 本発明に係る第二の実施の形態の通話 装置のエコー抑圧手段 1 3の動作を説明するが、 ステップ S 4 0 1から 4 0 3の処理 は第一の実施の形態と同じであるので説明を省略する。
ステップ S 4 0 3で読み込まれた現在値に基づき、 近端者の音声が第一の近端音声 変換部 1 2 1および第二の近端音声変換部 1 2 2に伝播するまでの伝播時間である第 二の伝播時間が算出される (ステップ S 4 3 0 )。 これは、 近端者が、 遠端信号変換部 1 1 2の正面の予め定められた所定距離離れた位置である第二の基準位置に位置して いるものとすれば、 近端音声が第一の近端音声変換部 1 2 1および第二の近端音声変 換部 1 2 2まで伝播する伝播時間を、 第一の近端音声変換部 1 2 1または第二の近端 音声変換部 1 2 2の何れか一方に対して音声出力手段 1 1が成す角度 0の関数として 表すことができるからである。 この処理が第二の伝播時間算出部 1 4 1の動作に相当 する。
なお、 近端音声が第一の近端音声変換部 1 2 1および第二の近端音声変換部 1 2 2 まで伝播する伝播時間は、 第一の実施の形態の第一の近端者位置検出部 1 3 7の動作 として既に説明した白色化相互相関関数により算出してもよいが、 近端者が発言を開 始した直後は、 伝播時間の推定が十分でないので通話品質が悪化するおそれがある。 一方、 近端者が、 第二の基準位置に位置するとして伝播時間を算出すると、 近端者 が第二の基準位置からずれて位置している場合には、 通話品質が悪化することとなる そこで、 近端者が発言していないときは、 近端者は第二の基準位置に位置するとし て伝播時間を算出し、 それ以外の場合は白色化相互相関関数に基づいて伝播時間を算 出することとしてもよい。
次に、 第一の近端信号増幅器 2 2 3および第二の近端信号増幅器 2 2 4から AZD 変換器 2 3 3を介して近端信号が読み込まれ (ステップ S 4 0 5 )、 エコーおよび背景 雑音が抑圧される (ステップ S 4 4 0 )。
なお、 ステップ S 4 0 8以後の処理は第一の実施の形態のエコー抑圧部の動作と同 じであるので説明を省略する。 次に、 図 1 6を参照して、 第二の実施の形態のステップ S 4 4 0の処理を説明する まず、 近端者の音声が第一の近端音声変換部 1 2 1および第二の近端音声変換部 1 2 2に伝播するまでに伝播時間に応じて、 近端信号が遅延される (ステップ S 4 4 1 )。 なお、 この処理が第三の近端信号遅延部 1 4 2およぴ第四の近端信号遅延部 1 4 3 の動作に相当する。
次に、 第三の近端信号遅延部 1 4 2および第四の近端信号遅延部 1 4 3で遅延され た近端信号である第一の遅延近端信号間の差をとることにより、 近端信号に含まれる 近端者の音声を消去され、 残留音声信号が出力される (ステップ S 4 4 2 )。 なお、 こ の処理が残留音声信号出力部 1 4 4の動作に相当する。
そして、 公知の適応フィルタにより、 この残留音声信号に基づいて、 第一の近端信 号または第二の近端信号に含まれている遠端音声と背景雑音とが混合した妨害音に対 応する信号である妨害音信号を推定する (ステップ S 4 4 3 )。 なお、 この処理が妨害 音信号推定部 1 4 5の動作に相当する。
さらに、 第一の近端信号および第二の近端信号の一方、 例えば、 第一の近端音声変 換部 1 2 1で変換された第一の近端信号を、 妨害音信号推定部 1 4 5において妨害音 信号を推定するのに必要な処理時間に相当する時間だけ遅延する (ステップ S 4 4 4 )。 なお、 この処理が、 第五の近端信号遅延部 1 4 6の動作に相当する。
そして、 この遅延された近端信号から、 妨害音信号が減算され、 エコーおよび背景 雑音が抑圧された抑圧後近端信号が出力ざれる (ステップ S 4 4 5 )。 なお、 この処理 が第二の出力部 1 4 7の動作に相当する。
さらに、 この抑圧後近端信号、 即ち、 近端音声がないときの妨害音の自乗時間平均 値が、 最小となるように妨害音信号推定部 1 4 5の妨害音信号推定特性を逐次更新す る (ステップ S 4 4 6 )。 この処理が妨害音信号推定特性更新部 1 4 8の動作に相当す る。
なお、妨害音信号推定特性の更新には、周知の学習同定法、 F R L S (Fast Recursive Least Squares) 法等を使用することができる。
以上説明したように、 本発明に係る第二の実施の形態の通話装置は、 エコー抑圧手 段 1 3に現在値検出部 1 3 1と、 第二の伝播時間算出部 1 4 1と、 第三の近端信号遅 延部 1 4 2および第四の近端信号遅延部 1 4 3と、 残留音声信号出力部 1 4 4と、 妨 害音信号推定部 1 4 5と、 第五の近端信号遅延部 1 4 6と、 第二の出力部 1 4 7と、 更新部 1 4 8とを設けているので、 現在の遠端信号変換部 1 1 2と第一の近端音声変 換部 1 2 1および第二の近端音声変換部 1 2 2との間の相対位置に応じて近端信号中 に含まれる近端音声に遠端音声が混合して発生するエコーおよび背景雑音を確実に抑 圧することが可能となる。
また、 本発明に係る第二の実施の形態の通話装置は、 図 1 7に示すように、 エコー 抑圧手段 1 3は、 現在値検出部 1 3 1で検出された現在値に応じて、 更新部 1 4 8の 初期妨害音信号推定特性を設定する初期特性設定部 1 4 9を含んでもよい。
図 1 8を参照して、 初期特性設定部 1 4 9を含むエコー抑圧手段 1 3の動作を説明 するが、 ステップ S 4 0 1からステップ S 4 3 0までの処理は第二の実施の形態のェ コー抑圧手段 1 3と同一であるので、 その説明を省略する。
第二の伝播時間が算出 (ステップ S 4 3 0 ) された後、 予めメモリ 2 3 1に記憶さ れている初期妨害音信号推定特性に基づいて、 現在値検出部 1 3 1で検出された現在 値に対応した初期妨害音信号推定特性を算出して、 更新部 1 4 8の妨害音信号推定特 性の初期値として設定する (ステップ S 4 3 1 )。 なお、 この処理が初期特性設定部 1 4 9の動作に相当する。 現在値検出部 1 3 1で検出された現在値に対応する初期妨害 音信号推定特性がメモリ 2 3 1に記憶されていない場合には、 予めメモリ 2 3 1に記 憶されている初期妨害音信号推定特性に基づき、 内挿法等により初期妨害音信号推定 特性を算出する。
ステップ S 4 0 5以後の処理は、 図 1 5のフローチャートと同一であるので、 説明 を省略する。
以上説明したように、 上記の通話装置にあっては、 初期特性設定部 1 4 9を設けて いるので、 妨害音信号推定部 1 4 5の妨害音推定特性を迅速に抑制後近端信号の自乗 時間平均値を最小とする最適妨害音信号推定特性に収斂させることができ、 エコーお ょぴ背景雑音を一層確実に抑制することが可能となる。
さらに、 本発明に係る第二の実施の形態の通話装置は、 図 1 9に示すように、 ェコ 一抑圧手段 1 3は、 第一の近端音声変換部 1 2 1で変換された第一の近端信号と第二 の近端音声変換部 1 2 2で変換された第二の近端信号との相互相関関数から、 第一の 近端音声変換部 1 2 1または第二の近端音声変換部 1 2 2の何れか一方を基準とする 近端者の位置である第一の近端者位置を検出する第一の近端者位置検出部 1 3 7と、 第二の抑圧後近端信号出力部 1 5 1から出力される第二の抑圧後近端信号の周波数分 布を、 現在値検出部 1 3 1で検出された現在値と第一の近端者位置検出部 1 3 7で検 出された第一の近端者位置とに対応する等化特性に等化する第二の等化部 1 3 8とを 備えてもよい。
ここで、 第二等化部 1 3 8を備える通話装置のエコー抑圧手段 1 3の動作を説明す る図 2 0のフローチャートを参照すると、 ステップ S 4 4 0とステップ S 4 0 8の間 で第二の等化処理 (ステップ S 4 2 0 ) が実行される。 なお、 ステップ S 4 0 1から ステップ S 4 4 0までの処理、 およびステップ S 4 0 8以後の処理は第二の実施の形 態のエコー抑圧手段 1 3の動作と同一であるので、 その動作の説明を省略する。 図 1 1のフローチャートを参照して第二の等化処理 (ステップ S 4 2 0 ) の動作を 説明する。
まず、 第一の近端音声変換部 1 2 1および第二の近端音声変換部 1 2 2から読み込 まれた近端信号間の白色化相互相関関数のピーク間隔に基づいて、 音声入力手段 1 2 を基準とする近端者の位置である第一の近端者位置を計算する (ステップ S 4 2 1 )。 なお、 この処理が第一の近端者位置検出部 1 3 7の動作に相当する。
そして、 第一の近端者位置検出部 1 3 7で検出された第一の近端者位置および現在 値検出部 1 3 1で検出された現在値に対応した等化特性が予めメモリ 2 3 1に記憶さ れている等化特性を使用して算出 (ステップ S 4 2 2 ) され、 この等化特性を用いて 抑制後近端信号の等化処理が実行される (ステップ S 4 2 3 )。 上記二つの処理が、 第 二の等化部 1 3 8の動作に相当する。
以上説明したように、 上記の通話装置によれば、 エコー抑圧手段 1 3中に第一の近 端者位置検出部 1 3 7および第二の等化部 1 3 8を設けたので、 近端者位置が第一の 基準位置からずれても、 通話品質の悪化を防止することが可能となる。
さらに、 本発明に係る第二の実施の形態の通話装置は、 図 2 1に示すように、 ェコ 一抑圧手段 1 3は、 現在値検出部 1 3 1で検出された現在値に基づき遠端信号変換部 1 1 2を規準とする近端者の位置である第二の近端者位置を検出する第二の近端者位 置検出部 1 3 9と、 第二の抑圧後近端信号出力部 1 5 1から出力される第二の抑圧後 近端信号の周波数分布を、 現在値検出部 1 3 1で検出された現在値および第二の近端 者位置検出部 1 3 9で検出された第二の近端者位置に対応する等化特性に等化する第 三の等化部 1 4 0を備えてもよい。
この場合、 近端者が遠端信号変換部 1 1 2と正対する第二の基準位置に位置してい るものとして、 現在値検出部 1 3 1で検出された現在値に基づいて等化特性が決定さ れる。
そして、 第二の近端者位置検出部 1 3 9では、 既に第一の実施の形態で説明したよ うに、 近端者は音声出力手段 1 1と正対する音声出力手段 1 1を基準とする第二の基 準位置に位置しているものとして算出される。
以上説明したように、 上記の通話装置によれば、 エコー抑圧手段 1 3中に第二の近 端者位置検出部 1 3 9および第三の等化部 1 4 0を設けたので、 近端者位置が第二の 基準位置からずれても、 近端音声の周波数分布を近端者が第二の基準位置にいるとき の近端音声の周波数分布である基準周波数分布に維持することが可能となるだけでな く、 第二の近端者位置検出部 1 3 9の構成を第一の近端者位置検出部 1 3 7の構成よ り簡略化することができる。
なお、 第一と第二の実施の形態の説明において、 第一の伝播時間算出部または第二 の伝播時間算出部に設定される可変遅延時間を遠端信号変換部と第一の近端音声変換 部および第二の近端音声変換部の何れか一方との幾何学的位置関係から算出するもの として説明したが、 可変遅延時間を遠端信号変換部からィンパルス信号を出力したと きの第一の近端音声変換部および第二の近端音声変換部から出力されるィンパルス応 答の相互相関関数に基づいて算出することも可能である。
また、 上記の説明においては、 第一の等化部、 第二の等化部、 および第三の等化部 の具体的構成の説明を省略しているが、 周知の F I R (有限インパルス応答) フィル タまたは I I R (無限インパルス応答) フィルタを適用することができる。
そして F I Rフィルタを使用すれば精密に等化特性を設定することができ、 I I R フィルタを使用すれば演算量を低減することができる。
周知のパンクフィルタにより、 周波数帯域ごとに等化特性を定めることもできる。 さらに、 上記の第一および第二の実施の形態のエコー抑圧手段の処理は、 時間領域 で実行することも、 周波数領域で実行することも可能であることは明らかである。 た だし、 周波数領域で処理する場合は、 時間領域での処理と比較して演算量は低減でき るものの、 音声信号を所定の時間長のフレームごとに周波数領域に変換するフレーム 処理となるため、 フレーム長に相当する時間遅れが生じる。
従って、 時間領域で処理するか、 周波数領域で処理するかは、 本発明の用途に応じ て適宜に選択することが望ましい。
なお、 上記の説明においては、 遠端信号変換器であるスピーカは一台であるとして いるが、 等価的に一つの遠端信号変換器とみなすことができれば複数台のスピーカが 使用されていても本発明を適用できることは明らかである。
(第三の実施の形態)
図 2 2を参照して、 本発明に係る第三の実施の形態の通話装置の構成を説明する。 本発明に係る第三の実施の形態の通話装置を構成する各構成部のうち、 本発明の第一 の実施の形態に係る通話装置または第二の実施の形態に係る通話装置の構成要素と同 様の構成要素には同一の符号を付し、 その詳細な説明を省略する。 本発明の第三の実 施の形態に係る通話装置は、 遠端信号が遠端音声として出力される音声出力手段 1 1 と、 近端音声が入力される音声入力手段 1 2と、 音声出力手段 1 1から出力された遠 端音声が音声入力手段 1 2に入力されることにより発生するエコーを抑圧するエコー 抑圧手段 1 3とを備える。
音声出力手段 1 1は、 基準点から予め定められた第一の距離を隔てて設置され、 遠 端信号を遠端音声に変換する遠端信号変換部 1 1 2を含む。
音声入力手段 1 2は、 基準点から予め定められた第二の距離を隔てて設置され、 入 力された近端音声を第一の近端信号に変換する第一の近端音声変換部 1 2 1と、 第一 の近端音声変換部 1 2 1を基準とする予め定められた位置に設置され、 入力された近 端音声を第二の近端信号に変換する第二の近端音声変換部 1 2 2とを含む。
エコー抑圧手段 1 3は、 第一の近端音声変換部 1 2 1で変換された第一の近端信号 および第二の近端音声変換部 1 2 2で変換された第二の近端信号に基づいて、 第一の 近端信号および第二の近端信号に共通して含まれる真正近端音声に対応する信号以外 の信号であるエコー成分信号を検出するエコー成分検出部 1 6 0と、 第一の近端音声 変換部 1 2 1で変換された第一の近端信号および第二の近端音声変換部 1 2 2で変換 された第二の近端信号の何れか一方から、 エコー成分検出部 1 6 0で検出されたェコ 一成分信号を減算して第三の抑圧後近端信号を出力する第三の抑圧後近端信号出力部 1 7 0を含む。 ここでいうエコー成分信号とは、 近端音声に対応する信号以外の信号 を意味し、 狭義の近端信号中に含まれるエコーに限定されず、 背景雑音などあらゆる 雑音に対応する信号を含む。
本実施の形態の通話装置を二つの部分筐体から構成される筐体を有する携帯電話に 適用した場合、 通話装置は、 図 3に示すように、 筐体が、 ヒンジ 3 1と、 ヒンジ 3 1 によって結合された 2つの部分筐体 3 2、 3 3とを有し、 ヒンジ 3 1によって 2つの 部分筐体 3 2、 3 3がなす角度である開き角 Θを可変に変更できる構成となっている 。 また、 図 2 2に示すように、 筐体にディスプ.レイ 3 4 1を設けてもよい。 ここで、 符号 3 5 2で示す方向は、 通話装置からみた話者の方向を示している。
エコー成分検出部 1 6 0は、 第一の近端音声変換部 1 2 1で変換された第一の近端 信号および第二の近端音声変換部 1 2 2で変換された第二の近端信号に共通して含ま れる真正近端音声に対応する真正近端信号を推定する真正近端音声推定部と、 第一の 近端音声変換部 1 2 1で変換された第一の近端信号または第二の近端音声変換部 1 2 2で変換された第二の近端信号の何れか一方を、 真正近端音声推定部における真正近 端信号推定に要する時間だけ遅延する第六の近端信号遅延部 1 6 6と、 第六の近端信 号遅延部 1 6 6で遅延された近端信号である第六の遅延近端信号と真正近端音声推定 部で推定された真正近端信号の差を真正近端信号以外の信号である第一のエコー成分 信号として出力するエコー成分信号出力部 1 6 5とを含む。 真正近端音声推定部は、 第一の近端音声変換部 1 2 1で変換された第一の近端信号および第二の近端音声変換 部 1 2 2で変換された第二の近端信号の何れかに対して適応フィルタ処理を行う第一 の適応フィルタ 1 6 3と、 第一の適応フィルタ 1 6 3が行う適応フィルタ処理のパラ メータである第一のフィルタ計数を記憶する第一の係数記憶部 1 6 4とから構成され おり、 第一の適応フィルタ 1 6 3は、 エコー成分信号出力部 1 6 5から出力される差 分信号の絶対値が最小になるように適応フィルタ処理を行う。
第三の抑圧後近端信号出力部 1 7 0は、 エコー成分信号出力部 1 6 5から出力され るエコー成分信号に基づいて、 第一の近端音声変換部 1 2 1で変換された第一の近端 信号または第二の近端音声変換部 1 2 2で変換された第二の近端信号の何れか一方に 含まれる近端音声に対応する信号以外の信号である第二のエコー成分信号を推定する エコー成分推定部と、 第一の近端音声変換部 1 2 1で変換された第一の近端信号また は第二の近端音声変換部 1 2 2で変換された第二の近端信号の何れか一方を、 エコー 成分推定部におけるエコーの信号成分の推定に要する時間だけ遅延する第七の近端信 号遅延部 1 7 6と、 第七の近端信号遅延部 1 7 6で遅延された近端信号である第七の 遅延近端信号からェコ一成分推定部で推定された第二のェコ一成分信号を減算して第 三の抑圧後近端信号を出力する第三の出力部 1 7 5とを含む。
エコー成分推定部は、 エコー成分信号出力部 1 6 5から出力されるエコー成分信号 に対して適応フィルタ処理を行う第二の適応フィルタ 1 7 3と、 第二の適応フィルタ 1 7 3が行う適応フィルタ処理のパラメータである第二のフィルタ係数を記憶する第 二の係数記憶部 1 7 4とから構成されおり、 第二の適応フィルタ 1 7 3は第三の出力 部 1 7 5から出力される差分信号の絶対値が最小になるように適応フィルタ処理を行 エコー抑圧手段 1 3は、 さらに、 遠端信号変換部 1 1 2と第一の近端音声変換部 1 2 1または第二の近端音声変換部 1 2 2の何れか一方との間の相対位置を規定するパ ラメータの現在値を検出する現在値検出部 1 3 1と、 現在値検出部 1 3 1が検出した パラメータの現在値に応じて、 第一の適応フィルタ 1 6 3が行う適応フィルタ処理の パラメータである第一のフィルタ係数の初期値を決定する第一の初期値決定部 1 6 1 と、 現在値検出部 1 3 1が検出したパラメータの現在値に応じて第二の適応フィルタ 1 7 3が行う適応フィルタ処理のパラメータである第二のフィルタ係数の初期値を決 定する第二の初期値決定部 1 7 1とを含む。
エコー抑圧手段 1 3は、 さらに、 第一の近端信号または第二の近端信号のうちの予 め決められた近端信号が遠端信号より卓越したときに、 第一のフィルタ係数の更新を 第一の適応フィルタ 1 6 3に指示すると共に、 遠端信号が第一の近端信号または第二 の近端信号のうちの予め決められた近端信号より卓越したときに、 第二のフィルタ係 数の更新を第二の適応フィルタ 1 7 3に指示する適応制御部 1 8 1を含む。
以下、 本発明に係る第三の実施の形態の通話装置における信号の流れについて説明 する。 まず、 第二の近端音声変換部 1 2 2からの出力信号は、 第一の適応フィルタ 1 6 3に入力される。 ここで、 第一の適応フィルタ 1 6 3には、 第一の係数記憶部 1 6 4が接続されている。 第六の近端信号遅延部 1 6 6からの出力信号および第一の適応 フィルタ 1 6 3からの出力信号は、 エコー成分信号出力部 1 6 5に入力される。 エコー成分信号出力部 1 6 5からの出力信号は、 第一の適応フィルタ 1 6 3および 第二の適応フィルタ 1 7 3に入力される。 ここで、 第二の適応フィルタ 1 7 3には、 第二の係数記憶部 1 7 4が接続され、 フィルタ係数の読み出しが行われる。 第七の近 端信号遅延部 1 7 6からの出力信号おょぴ第二の適応フィルタ 1 7 3からの出力信号 は、 第三の出力部 1 7 5に入力される。
第三の出力部 1 7 5からの出力信号は、 第二の適応フィルタ 1 7 3に入力されると 共に、 遠端側へエコー抑制信号として送られる。 ヒンジ 3 1は、 状態検出手段として の現在値検出部 1 3 1に接続されており、 現在値検出部 1 3 1はヒンジ 3 1の開き角 Θ等のパラメータの現在値を検出する。 現在値検出部 1 3 1の出力信号は、 第一の初 期値決定部 1 6 1および第二の初期値決定部 1 7 1に入力される。
第一の初期値決定部 1 6 1の出力信号は第一の適応フィルタ 1 6 3に入力され、 第 二の初期値決定部 1 7 1の出力信号は第二の適応フィルタ 1 7 3に入力される。 遠端 信号変換部 1 1 2から遠端信号は適応制御部 1 8 1に入力される。 また、 適応制御部 1 8 1には、 第二の近端音声変換部 1 2 2からの第二の近端信号も入力され、 適応制 御部 1 8 1の出力信号は、 第一の適応フィルタ 1 6 3および第二の適応フィルタ 1 7 3にそれぞれ出力される。
以上のように構成された通話装置について、 図 2 3を用いてその動作を説明する。 まず、 通話装置の電源を切断する等の操作により動作を終了させる通話終了条件が成 立している力否かがエコー抑圧手段 1 3に判定され (S 5 0 1 )、 成立していると判断 された場合は、 動作を終了し、 成立していないと判断した場合、 動作を継続し、 処理 はステップ S 5 0 2に進む。
ステップ S 5 0 1で通話終了条件が成立していないと判断した場合、 近端信号のレ ベルが予め定められたレベル以上であるか否か等に基づいて、 通話が開始されたか否 かがエコー抑圧手段 1 3によって判定される (S 5 0 2 )。 S 5 0 2で通話が開始され たと判断されたとき、 処理は S 5 0 3に進み、 通話が開始していないと判断されたと きは、 ステップ S 5 0 1に戻る。
S 5 0 2で通話が開始したと判断されたとき、 現在の筐体の形状の検出が現在値検 出部 1 3 1によって行われる (S 5 0 3 )。 本実施の形態 3において、 現在の筐体の形 状の検出は、 ヒンジ 3 1に接続された現在値検出部 1 3 1を用いて筐体の開き角 0を 検出および算出することによって行われる。 ここで、 現在値検出部 1 3 1は、 開き角 0の大きさを電気信号に変換できるものであればよぐ、 例えば、 ロータリエンコーダ 、 可変抵抗器等を用いて実現できる。 また、 現在値検出部 1 3 1は、 必ずしも遠端信 号変換部 1 1 2と第一の近端音声変換部 1 2 1または第二の近端音声変換部 1 2 2の 何れか一方との相対位置を規定するパラメータを連続的に算出する必要はなく、 離散 的に角度を算出してもよい。 さらに、 現在値検出部 1 3 1は、 筐体が開いている状態 と閉じている状態等の 2つの状態のみをスィツチ等を用いて検出してもよい。
次に、 現在値検出部 1 3 1が検出したパラメータに基づいて、 第一のフィルタ係数 の初期値おょぴ第二のフィルタ係数の初期値が、 それぞれ、 第一の初期値決定部 1 6 1および第二の初期値決定部 1 7 1によって決定され、 第一の適応フィルタ 1 6 3お ょぴ第二の適応フィルタ 1 7 3に設定される (S 5 0 4 )。
具体的には、 第一の初期値決定部 1 6 1は、 筐体の開き角に応じた信号 (以下、 開 き角信号という。) を第一の適応フィルタ 1 6 3に出力し、 第一の適応フィルタ 1 6 3 は、 第一の係数記憶部 1 6 4に記憶されたフィルタ係数の中から、 上記の開き角信号 に応じたフィルタ係数を読み出す。 ここで、 第一の係数記憶部 1 6 4は、 予め所定の 数の開き角に応じたフィルタ係数を記憶し、 第一の適応フィルタ 1 6 3は、 入力され た開き角信号で特定される開き角に基づき、 内揷法などにより最も近い角度のフィル タ係数を読み出すのでもよい。
同様に、 第二の初期値決定部 1 7 1は、 筐体の開き角に応じた開き角信号を第二の 適応フィルタ 1 7 3に出力し、 第二の適応フィルタ 1 7 3は、 第二の係数記憶部 1 7 4に記憶されたフィルタ係数の中から、 開き角信号に応じたブイルタ係数を読み出す 。 ここで、 第二の係数記憶部 1 7 4は、 予め所定の数の開き角に応じたフィルタ係数 を記憶し、 第二の適応フィルタ 1 7 3は、 入力された開き角信号で特定される開き角 に基づき、 内挿法などにより最も近い角度のフィルタ係数を読み出すのでもよい。 ステップ S 5 0 4でフィルタ係数の初期値の決定が行われたら、 第一の近端音声変 換部 1 2 1および第二の近端音声変換部 1 2 2によって近端音声が収集され、 第一の 近端信号おょぴ第二の近端信号が生成される (S 5 0 5 )。 ステップ S 5 0 6以降の処 理は、 アナログ信号処理でも可能であるが、 一般的にはデジタル信号処理により行う 。 このため、 以下では、 第一の近端信号および第二の近端信号は、 不図示の AD変換 手段によりアナ口グ信号からデジタル信号に変換されるものとする。
また、 デジタル信号処理によりステップ S 5 0 6以降の処理が行われる場合には、 通話装置にマイコンや D S P (Digital Signal Processor) 等の素子が含まれる構成 が一般的である。 係る場合、 ステップ S 5 0 6以降の処理は、 マイコンまたは D S P に搭載されるプログラムに記述されるものとする。
デジタル信号に変換された第一の近端信号および第二の近端信号は、 時間領域のま ま、 または、 一旦、 周波数領域に変換してこれ以後の処理を行う。 時間領域のまま処 理を行う場合には、 AD変換手段におけるサンプリング周期毎に処理するサンプル処 理を行う。 また、 周波数領域に変換する場合には、 一定の時間幅を持つフレームにお ける入力信号を一括して処理するフレーム処理を行う。 フレーム処理の場合には、 サ ンプル処理よりも演算量が小さくなるという利点があるが、 フレーム長に相当する遅 延が生じるという欠点もある。 そのため、 用途に応じていずれかを選択するものとす る。
ステップ S 5 0 5でデジタル信号の第一の近端信号および第二の近端信号が生成さ れると、 第一の近端信号は、 第六の近端信号遅延部 1 6 6によって所定時間遅延が付 加され、 第二の近端信号は、 第一の適応フィルタ 1 6 3によって適応フィルタ処理が なされる (S 5 0 6 )。 ここで、 第六の近端信号遅延部 1 6 6によって付加される遅延 量としては、 第一の適応フィルタ 1 6 3の係数長と等しく設定するのが適当である。 具体的には、 第一の適応フィルタ 1 6 3のタップ長の半分程度にするのが好適である 遅延の付加方法としては、 ステップ S 5 0 6で AD変換手段によりデジタル信号に 変換する際のサンプリング周期の整数倍となるよう遅延時間を丸め、 簡易なバッファ を用いて遅延を付加するのが好適である。 また、 上記の適応フィルタ処理は、 第二の 近端音声変換部 1 2 2の出力信号に対し第一のフィルタの係数を畳み込む方法により フィルタリング処理を行う。
ステップ S 5 0 6で第一の近端信号に遅延が付加され、 第二の近端信号に適応フィ ルタ処理がなされると、 遅延付加後の信号と適応フィルタ処理後の信号とがエコー成 分信号出力部 1 6 5に入力され、 これらの信号の差分がエコー成分信号出力部 1 6 5 によって算出される (S 5 0 7 )。 エコー成分信号出力部 1 6 5が算出した差分は第一 の適応フィルタ 1 6 3にフィードパックされ、 差分信号の絶対値を最小とするように 、 第一の適応フィルタ 1 6 3によって第二の近端信号に適応フィルタ処理がなされる 次に、 第一の近端信号は、 第七の近端信号遅延部 1 7 6によって所定時間遅延が付 加され、 エコー成分信号出力部 1 6 5からの出力信号は、 第二の適応フィルタ 1 7 3 によって適応フィルタ処理がなされる (S 5 0 8 )。 ここで、 第七の近端信号遅延部 1 7 6によって付カ卩される遅延量としては、 第二の適応フィルタ 1 7 3の係数長と等し く設定するのが適当である。 具体的には、 第二の適応フィルタ 1 7 3のタップ長の半 分程度にするのが好適である。
遅延の付加方法としては、 ステップ S 5 0 6で AD変換手段によりデジタル信号に 変換する際のサンプリング周期の整数倍となるよう遅延時間を丸め、 簡易なバッファ を用いて遅延を付加するのが好適である。 また、 上記の適応フィルタ処理は、 エコー 成分信号出力部 1 6 5からの出力信号に対し第二のフィルタの係数を畳み込む方法に よりフィ/レタリング処理を行う。
ステップ S 5 0 8で第一の近端信号に遅延が付加され、 エコー成分信号出力部 1 6 5からの出力信号に適応フィルタ処理がなされると、 遅延付加後の信号と適応フィル タ処理後の信号とが第三の出力部 1 7 5に入力され、 これらの信号の差分がエコー成 分信号出力部 1 6 5によって算出される (S 5 0 9 )。 第三の出力部 1 7 5が算出した 差分は第二の適応フィルタ 1 7 3にフィードパックされ、 差分信号の絶対値を最小と するように、 第二の適応フィルタ 1 7 3によってエコー成分信号出力部 1 6 5からの 出力信号に適応フィルタ処理がなされる。
ステップ S 5 0 9で生成された信号は、 エコー抑制信号として遠端側に出力される ( S 5 1 0 )。
次に、 第一のフィルタ係数および第二のフィルタ係数の更新を行う (S 5 1 1 )。 フ ィルタ係数の更新は、 適応制御部 1 8 1が、 各適応フィルタ 1 6 3、 1 7 3のフィル タ係数を更新するか否かを判断し、 更新すると判新したときに行われる。 適応制御部 1 8 1は、 近端信号が遠端側から入力される遠端信号より卓越していると判断した場 合にはエコー成分信号出力部 1 6 5の出力パワーが最小になるよう第一の適応フィル タ 1 6 3のフィルタ係数を更新する。 また、 適応制御部 1 8 1は、 遠端側から入力さ れる遠端信号が近端信号より卓越していると判断した場合には第三の出力部 1 7 5の 出力パワーが最小になるよう第二の適応フィルタ 1 7 3のフィルタ係数の更新を行う 適応制御部 1 8 1が行う判断の方法は、 簡単には近端信号のパワーが所定の第一の 閾値を越え、 かつ遠端信号と第二の近端音声変換部 1 2 2の出力信号との間の相関が 高い場合には、 遠端信号が卓越していると判定し、 遠端信号のパワーが所定の第二の 閾値を越えず、 かつ第二の近端音声変換部 1 2 2の出力信号のパワーが所定の第三の 閾値を超える場合に、 近端話者音声が卓越していると判定する方法が好適である。 遠 端信号と第二の近端音声変換部 1 2 2の出力信号との間の相関については、 遠端信号 と第二の近端音声変換部 1 2 2の出力信号との間の白色化相互相関関数の最大値が所 定の値以上であるか否かにより判定することができる。
あるいは、 適応制御部 1 8 1は、 第二の近端音声変換部 1 2 2の出力信号のパワー が所定の第一の閾値を越え、 力つ遠端信号のパワーが所定の第二の閾値を越える場合 には、 遠端信号が近端信号より卓越していると判定し、 遠端信号のパワーが所定の第 三の閾値を越えず、 かつ第二の近端音声変換部 1 2 2の出力信号のパワーが所定の第 四の閾値を越える場合に、 近端信号が遠端信号より卓越していると判定してもよい。 このように制御を行うことにより、 第一の適応フィルタ 1 6 3のフィルタ係数は近 端話者が卓越している場合に更新されることとなる。 その結果、 エコー成分信号出力 部 1 6 5は、 遠端信号が遠端信号変換部 1 1 2によって変換されて出力された遠端音 声が第二の近端音声変換部 1 2 2に回り込んだ音に対応する信号を含むが、 近端話者 音声に対応する信号は抑圧された信号を出力することになる。 したがって、 エコー成 分信号出力部 1 6 5からはエコー成分の強い信号が出力される。
さらに、 第二の適応フィルタ 1 7 3のフィルタ係数は、 遠端信号が卓越している場 合に更新されることとなる。 第二のフィルタ係数が更新されると、 第七の近端信号遅 延部 1 7 6の出力信号には、 遠端信号変換部 1 1 2から出力された遠端音声が第二の 近端音声変換部 1 2 2に回り込んだエコーと近端話者音声の信号である近端信号とが 含まれるが、 第二の適応フィルタ 1 7 3の入力信号に含まれるエコー成分が、 打ち消 される。 その結果、 第三の出力部 1 7 5の出力には、 近端話者音声が強調されて出力 されることとなる。 第一の適応フィルタ 1 6 3と第二の適応フィルタ 1 7 3のフィル タ係数の更新方法としては、 公知の適応信号処理に基づく方法が適当であり、 例えば 、 学習同定法や F R L S法等を用いることができる。
ステップ S 5 1 1でフィルタ係数の更新処理が完了したら、 近端信号のレベル等に 基づいて音声通話が終了した力否かを判断し (S 5 1 2 )、 音声通話が終了したと判断 した場合、 処理はステップ S 5 1 3に進み、 終了していないと判断した場合は、 ステ ップ S 5 0 3に戻り、 上記の処理を操り返す。 ここで、 処理の繰り返しの際、 ステツ プ S 5 0 3、 S 5 0 4での処理は、 省くのでもよレヽ。
ステップ S 5 1 2で音声通話が終了したら、 第一の適応フィルタ 1 6 3のフィルタ 係数を現在値検出部 1 3 1が検出した開き角と関連付けて第一の係数記憶部 1 6 4に 記憶させ、 第二の適応フィルタ 1 7 3のフィルタ係数を現在値検出部 1 3 1が検出し た開き角と関連付けて第二の係数記憶部 1 7 4に記憶させ、 ステップ S 5 0 1に戻り 、 上記の処理を繰り返す。
以下、 本発明に係る第三の実施の形態の通話装置の効果について、 図面を用いて説 明する。 図 2 4は、 遠端信号に音声信号が含まれる場合の遠端信号変換部 1 1 2から 出力される音声信号の出力波形の例を示す図である。 ここで、 図 2 4 ( a ) 〜 (c ) は、 遠端信号変換部 1 1 2から出力される音声信号に歪みが無い場合、 すなわち、 遠 端信号が線形に遠端音声に変換される場合の出力波形の例を示す。
図 2 4 ( a ) は、 エコー抑圧処理を行わない場合に遠端側に出力される信号の信号 波形を示す図である。 エコー抑圧処理を行わない場合には、 遠端信号変換部 1 1 2か ら出力された音声が第一の近端音声変換部 1 2 1と第二の近端音声変換部 1 2 2に回 り込むため、 図 2 4 ( a ) に示すように、 回り込んだ音声に起因する音声信号が遠端 側に出力される信号にエコーとして重畳される。
図 2 4 ( a ) に示すように、 エコーが無視しえず通話の障害となる場合、 エコーの 抑圧が期待される。 図 2 4 ( b ) は、 従来の学習同定法に基づくエコーキャンセラを 用いた場合に遠端側に出力される信号の信号波形を示す図である。 従来のエコーキヤ ンセラを用いる場合であっても、 エコーが十分抑圧できることがわかる。
図 2 4 ( c ) は、 本発明に係る第三の実施の形態の通話装置を用いた場合に遠端側 に出力される信号の信号波形を示す図である。 本発明に係る第三の実施の形態の通話 装置を用いた場合にも、 エコーが十分抑圧できることがわかる。
次に、 図 2 4 ( d ) 〜 (f ) は、 遠端信号変換部 1 1 2から出力される音声信号に 歪みがある場合、 すなわち、 遠端信号が非線形に遠端音声に変換される場合の出力波 形の例を示す。 図 2 4 ( d ) は、 エコー抑圧処理を行わない場合に遠端側に出力され る信号の信号波形を示す図である。 エコー抑圧処理を行わない場合には、 大きな振幅 のエコーがあることがわかる。
図 2 4 ( e ) は、 従来のエコーキャンセラを用いた場合に遠端側に出力される信号 の信号波形を示す図である。 従来のエコーキャンセラを用いた場合には、 一部のェコ 一は抑圧できるものの、 消し残りが生ずることがわかる。 従来のエコーキャンセラは 、 線形のエコー抑圧処理を行っているため、 遠端信号変換部 1 1 2の出力信号に歪み がある等の非線形なシステムに対しては、 エコーの適切な予測を行うことは原理上で きない。 このように予測されたエコーが非線形のために真のエコーからずれる分が抑 圧されずに残るため、 従来のエコーキャンセラを用いた場合は、 エコーの消し残りが 生ずる。
図 2 4 ( f ) は、 本発明に係る第三の実施の形態の通話装置を用いた場合に遠端側 に出力される信号の信号波形を示す図である。 本発明に係る第三の実施の形態の通話 装置を用いた場合には、 完全にはエコーを消去できてはいないものの、 エコーの消し 残りは従来のエコーキャンセラより小さいことがわかる。
近年、 携帯電話等の端末では小型化が進み、 それに伴って音声出力手段 1 1を構成 するスピーカの小型化も進んでいる。 スピーカが小型化に伴いスピーカ歪みは避けら れないものとなるため、 従来のェコーキャンセラでは解決できない問題が発生してい る。 本発明の第三の実施の形態において説明したように、 このようなスピーカの歪み が存在する場合のエコーをより効果的に抑圧できる。
以上説明したように、 本発明に係る第三の実施の形態の通話装置は、 第一の適応フ イルクがエコー成分信号出力部から出力される差分信号の絶対値が最小になるように 適応フィルタ処理を行うことによって、 現在の遠端信号変換部と近端音声変換部との 間の相対位置に応じた第一のエコー成分を検出し、 第二の適応フィルタが近端信号に 含まれる第二のエコー成分を生成し、 第三の出力部がエコー成分を除去するため、 現 在の遠端信号変換部と近端音声変換部との間の相対位置が変更された場合にも、 ェコ 一抑圧性能が維持され、 高品質の通話ができる。
また、 現在値検出部が検出したパラメータの現在値に応じて第一の初期値決定部お よび第二の初期値決定部が第一のフィルタ係数おょぴ第二のフィルタ係数の初期値を 決定するため、 現在の遠端信号変換部と近端音声変換部との間の相対位置が変更され た場合にも、 通話開始後短時間にエコー抑圧性能が維持され、 高品質の通話ができる さらに、 適応制御部が遠端信号と近端信号とに基づいて、 第一のフィルタ係数およ び第二のフィルタ係数の更新を、 第一の適応フィルタおよび第二の適応フィルタに指 示するため、 通信環境の変化に好適に追随でき、.現在の遠端信号変換部と近端音声変 換部との間の相対位置が変更された場合にも、 短時間にェコ一抑圧性能が維持され、 高品質の通話ができる。
なお、 上述の実施の形態では、 いずれも第一の近端音声変換部 1 2 1は第二の近短 音声変換部 1 2 2よりも遠端信号変換部に近い位置に配置された構成としているが、 本発明はこれに限定されることはない。 例えば、 第二の近短音声変換部 1 2 2が第一 の近端音声変換部 1 2 1よりも遠端信号変換部に近い位置に配置された構成としても よいことは明かである。 産業上の利用可能性
本発明に係る通話装置は、 スピーカとマイクロホンの相対位置を変更してもエコー 抑圧性能が悪化せず高品質な通話ができる通話装置等の用途に適用できる。

Claims

請求の範囲
1 . 基準点を有する筐体と、 遠端信号が遠端音声として出力される音声出力手段と
、 近端音声が入力される音声入力手段と、 前記音声出力手段から出力された前記遠端 音声が前記音声入力手段に入力されることにより発生するエコーを抑圧するエコー抑 圧手段とを備え、
前記音声出力手段は、 前記基準点から予め定められた第一の距離を隔てて設置され 、 前記遠端信号を前記遠端音声に変換する遠端信号変換部を含み、
前記音声入力手段は、 前記基準点から予め定められた第二の距離を隔てて設置され 、 入力された前記近端音声を第一の近端信号に変換する第一の近端音声変換部と、 前 記第一の近端音声変換部を基準とする予め定められた位置に設置され、 入力された前 記近端音声を第二の近端信号に変換する第二の近端音声変換部とを含み、
前記ェコ一抑圧手段は、 前記遠端信号変換部と前記第一の近端音声変換部または前 記第二の近端音声変換部の何れか一方との間の相対位置を規定するパラメータの現在 値を検出する現在値検出部と、 前記パラメータを独立変数とし、 前記遠端信号変換部 で変換された前記遠端音声が前記第一の近端音声変換部に伝播する伝播時間を従属変 数とする第一の関数および前記第二の近端音声変換部に伝播する伝播時間を従属変数 とする第二の関数に基づいて前記現在値検出部で検出された前記現在値に対応する前 記第一の伝播時間および前記第二の伝播時間を算出する第一の伝播時間算出部と、 前 記第一の伝播時間算出部で算出された前記第一の伝播時間および前記第二の伝播時間 に応じて変更されるェコ一抑圧特性によりェコ一が抑圧された第一の抑圧後近端信号 を出力する第一の抑圧後近端信号出力部とを含むことを特徴とする通話装置。
2 . 前記第一の抑圧後近端信号出力部は、 前記第一の近端音声変換部で変換された 前記第一の近端信号を前記第一の伝播時間算出部で算出された前記第一の伝播時間に 基づいて遅延する第一の近端信号遅延部と、 前記第二の近端音声変換部で変換された 前記第二の近端信号を前記第一の伝播時間算出部で算出された前記第二の伝播時間に 基づいて遅延する第二の近端信号遅延部と、 前記第一の近端信号遅延部で遅延された 第一の遅延近端信号と前記第二の近端信号遅延部で遅延された第二の遅延近端信号と の差を出力する第一の出力部とを含むことを特徴とする請求項 1に記載の通話装置,
3 . 前記エコー抑圧手段は、 前記第一の抑圧後近端信号出力部から出力される前記 第一の抑圧後近端信号の周波数分布を、 前記現在値検出部で検出された前記現在値に 対応した等化特性に等化する第一の等化部を備えることを特徴とする請求項 1に記載 の通話装置。
4 . 前記エコー抑圧手段は、 前記第一の近端音声変換部で変換された前記第一の近 端信号と前記第二の近端音声変換部で変換された前記第二の近端信号との相互相関関 数から、 前記第一の近端音声変換部または前記第二の近端音声変換部の何れか一方を 基準とする近端者の位置である第一の近端者位置を検出する第一の近端者位置検出部 と、 前記第一の抑圧後近端信号出力部から出力される前記第一の抑圧後近端信号の周 波数分布を、 前記現在値検出部で検出された前記現在値と前記第一の近端者位置検出 部で検出された前記第一の近端者位置とに対応する等化特性に等化する第二の等化部 とを備えることを特徴とする請求項 1に記載の通話装置。
5 . 前記エコー抑圧手段は、 前記現在値検出部で検出された前記現在値に基づいて 、 前記遠端信号変換部を基準とする前記近端者の現在の位置である第二の近端者位置 を検出する第二の近端者位置検出部と、 前記第一の抑圧後近端信号出力部から出力さ れる前記第一の抑圧後近端信号の周波数分布を、 前記現在値検出部で検出された前記 現在値と前記第二の近端者位置検出部で検出された前記第二の近端者位置とに対応す る等化特性に等化する第三の等化部とを備えることを特徴とする請求項 1に記載の通 話装置。
6 . 基準点を有する筐体と、 遠端信号が遠端音声として出力される音声出力手段と 、 近端音声が入力される音声入力手段と、 前記音声出力手段から出力された前記遠端 音声が前記音声入力手段に入力されることにより発生するエコーを抑圧するエコー抑 圧手段とを備え、
前記音声出力手段は、 前記基準点から予め定められた第一の距離を隔てて設置され 、 前記遠端信号を前記遠端音声に変換する遠端信号変換部を含み、
前記音声入力手段は、 前記基準点から予め定められた第二の距離を隔てて設置され 、 入力された前記近端音声を第一の近端信号に変換する第一の近端音声変換部と、 前 記第一の近端音声変換部を基準とする予め定められた位置に設置され、 入力された前 記近端音声を第二の近端信号に変換する第二の近端音声変換部とを含み、
前記ェコ一抑圧手段は、 前記遠端信号変換部と前記第一の近端音声変換部または前 記第二の近端音声変換部の何れか一方との間の相対位置を規定するパラメータの現在 値を検出する現在値検出部と、 前記パラメータを独立変数とし、 前記近端音声が前記 第一の近端音声変換部に伝播する第三の伝播時間を従属変数とする第三の関数およぴ 前記近端音声が前記第二の近端音声変換部に伝播する第四の伝播時間を従属変数とす る第四の関数に基づいて前記現在値検出部で検出された前記現在値に対応する前記第 三の伝播時間および前記第四の伝播時間を算出する第二の伝播時間算出部と、 前記第 二の伝播時間算出部で算出された前記第三の伝播時間および前記第四の伝播時間に応 じて変更される残留音声信号抽出特性により残留音声信号を抽出する残留音声信号抽 出部と、 前記第一の近端音声変換部で変換された前記第一の近端信号および前記第二 の近端音声変換部で変換された前記第二の近端信号の何れか一方から前記残留音声信 号抽出部で抽出された前記残留音声信号を減算して第二の抑圧後近端信号を出力する 第二の抑圧後近端信号出力部とを含むことを特徴とする通話装置。
7 . 前記残留音声信号抽出部は、 前記第一の近端音声変換部で変換された前記第一 の近端信号を前記第二の伝播時間算出部で算出された前記第三の伝播時間に基づいて 遅延する第三の近端信号遅延部と、 前記第二の近端音声変換部で変換された前記第二 の近端信号を前記第二の伝播時間算出部で算出された前記第四の伝播時間に基づいて 遅延する第四の近端信号遅延部と、 前記第三の近端信号遅延部で遅延された第三の遅 延近端信号と前記第四の近端信号遅延部で遅延された第四の遅延近端信号の間の差を 残留音声信号として出力する残留音声信号出力部とを含み、
前記第二の抑圧後近端信号出力部は、 前記残留音声信号出力部から出力される前記 残留音声信号に基づいて、 前記第一の近端音声変換部で変換された前記第一の近端信 号または前記第二の近端音声変換部で変換された前記第二の近端信号の何れか一方に 含まれる前記近端音声に対応する信号以外の信号である妨害音信号を推定する妨害音 信号推定部と、 前記第一の近端音声変換部で変換された前記第一の近端信号または前 記第二の近端音声変換部で変換された前記第二の近端信号の何れか一方を、 前記妨害 音信号推定部における妨害音信号推定に要する時間だけ遅延する第五の近端信号遅延 部と、 前記第五の近端信号遅延部で遅延された前記近端信号である第五の遅延近端信 号から、 前記妨害音信号推定部で推定された前記妨害音信号を減算して第二の抑圧後 近端信号を出力する第二の出力部と、 前記妨害音信号推定部の妨害音信号推定特性を 前記第二の抑圧後近端信号の自乗時間平均値が最小となる最適妨害音信号推定特性に 逐次更新する更新部とを含むことを特徴とする請求項 6に記載の通話装置。
8 . 前記エコー抑圧手段は、 前記現在値検出部で検出された前記現在値に応じて、 前記更新部の初期妨害音信号推定特性を設定する初期特性設定部を含むことを特徴と する請求項 7に記載の通話装置。
9 . 前記エコー抑圧手段は、 前記第一の近端音声変換部で変換された前記第一の近 端信号と前記第二の近端音声変換部で変換された前記第二の近端信号との相互相関関 数から、 前記第一の近端音声変換部または前記第二の近端音声変換部の何れか一方を 基準とする前記近端者の位置である第一の近端者位置を検出する第一の近端者位置検 出部と、 前記第二の抑圧後近端信号出力部から出力される前記第二の抑圧後近端信号 の周波数分布を、 前記現在値検出部で検出された前記現在値と前記第一の近端者位置 検出部で検出された前記第一の近端者位置とに対応する等化特性に等化する第二の等. 化部とを備えることを特徴とする請求項 6または請求項 7に記載の通話装置。
1 0 . 前記エコー抑圧手段は、 前記現在値検出部で検出された前記現在値に基づき 、 前記遠端信号変換部を基準とする前記近端者の位置である第二の近端者位置を検出 する第二の近端者位置検出部と、 前記第二の抑圧後近端信号出力部から出力される前 記第二の抑圧後近端信号の周波数分布を、 前記現在値検出部で検出された前記現在値 と前記第二の近端者位置検出部で検出された前記第二の近端者位置とに対応する等化 特性に等化する第三の等化部とを含むことを特徴とする請求項 6または請求項 7に記 載の通話装置。
1 1 . 基準点を有する筐体と、 遠端信号が遠端音声として出力される音声出力手段 と、 近端音声が入力される音声入力手段と、 前記音声出力手段から出力された前記遠 端音声が前記音声入力手段に入力されることにより発生するエコーを抑圧するエコー 抑圧手段とを備え、
前記音声出力手段は、 前記基準点から予め定められた第一の距離を隔てて設置され 、 前記遠端信号を前記遠端音声に変換する遠端信号変換部を含み、
前記音声入力手段は、 前記基準点から予め定められた第二の距離を隔てて設置され 、 入力された前記近端音声を第一の近端信号に変換する第一の近端音声変換部と、 前 記第一の近端音声変換部を基準とする予め定められた位置に設置され、 入力された前 記近端音声を第二の近端信号に変換する第二の近端音声変換部とを含み、
前記ェコ一抑圧手段は、 第一の近端音声変換部で変換された前記第一の近端信号お よび前記第二の近端音声変換部で変換された前記第二の近端信号に基づいて、 前記第 一の近端信号および前記第二の近端信号に共通して含まれる真正近端音声に対応する 信号以外の信号であるェコ一成分信号を検出するェコ一成分検出部と、 第一の近端音 声変換部で変換された前記第一の近端信号および前記第二の近端音声変換部で変換さ れた前記第二の近端信号の何れか一方から、 前記ェコ一成分検出部で検出された前記 エコー成分信号を減算して第三の抑圧後近端信号を出力する第三の抑圧後近端信号出 力部を含むことを特徴とする通話装置。
1 2 . 前記エコー成分検出部は、 第一の近端音声変換部で変換された前記第一の近 端信号およぴ前記第二の近端音声変換部で変換された前記第二の近端信号に共通して 含まれる真正近端音声に対応する真正近端信号を推定する真正近端音声推定部と、 第 一の近端音声変換部で変換された前記第一の近端信号または前記第二の近端音声変換 部で変換された前記第二の近端信号の何れか一方を、 前記真正近端音声推定部におけ る前記真正近端信号推定に要する時間だけ遅延する第六の近端信号遅延部と、 前記第 六の近端信号遅延部で遅延された前記近端信号である第六の遅延近端信号と前記真正 近端音声推定部で推定された前記真正近端信号の差を前記真正近端信号以外の信号で ある第一のェコ一成分信号として出力するェコ一成分信号出力部とを含み、 前記第三の抑圧後近端信号出力部は、 前記ェコ一成分信号出力部から出力される前 記ェコ一成分信号に基づいて、 前記第一の近端音声変換部で変換された前記第一の近 端信号または前記第二の近端音声変換部で変換された前記第二の近端信号の何れか一 方に含まれる前記近端音声に対応する信号以外の信号である第二のエコー成分信号を 推定するェコ一成分推定部と、第一の近端音声変換部で変換された前記第一の近端信 号または前記第二の近端音声変換部で変換された前記第二の近端信号の何れか一方を 、 前記ェコ一成分推定部における前記ェコ一の信号成分の推定に要する時間だけ遅延 する第七の近端信号遅延部と、 前記第七の近端信号遅延部で遅延された前記近端信号 である第七の遅延近端信号から前記ェコ一成分推定部で推定された前記第二のェコ一 成分信号を減算して第三の抑圧後近端信号を出力する第三の出力部とを含むことを特 徴とする請求項 1 1に記載の通話 置。
1 3 . 前記真正近端音声推定部は、 第一の近端音声変換部で変換された前記第一の 近端信号および前記第二の近端音声変換部で変換された前記第二の近端信号の何れか に対して前記エコー成分出力部から出力される信号の絶対値を最小にするように適応 フィルタ処理を行う第一の適応フィルタを有し、 前記ェコ一成分推定部は前記ェコ一 成分信号出力部から出力される前記ェコ一成分信号に対して前記第三の出力部から出 力される信号の絶対値を最小にするように適応フィルタ処理を行う第二の適応フィル タを有し、
前記ェコ一抑圧手段は、 前記遠端信号変換部と前記第一の近端音声変換部または前 記第二の近端音声変換部の何れか一方との間の相対位置を規定するパラメータの現在 値を検出する現在値検出部と、 前記現在値検出部が検出したパラメータの現在値に応 じて、 前記第一の適応フィルタが行う適応フィルタ処理のパラメータである第一のフ ィルタ係数の初期値を決定する第一の初期値決定部と、 前記現在値検出部が検出した パラメータの現在値に応じて前記第二の適応フィルタが行う適応フィルタ処理のパラ メータである第二のフィルタ係数の初期値を決定する第二の初期値決定部とを含むこ とを特徴とする請求項 1 2に記載の通話装置。
1 . 前記エコー抑圧手段は、 前記第一の近端信号または前記第二の近端信号のう ちの予め決められた近端信号が前記遠端信号より卓越したときに、 前記第一のフィル タ係数の更新を前記第一の適応フィルタに指示し、 前記遠端信号が前記第一の近端信 号または前記第二の近端信号のうちの予め決められた近端信号より卓越したときに、 前記第二の適応フィルタに前記第二のフィルタ係数の更新を前記第二の適応フィルタ に指示する適応制御部を含むことを特徴とする請求項 1 3に記載の通話装置。
PCT/JP2004/009697 2003-07-17 2004-07-01 通話装置 WO2005008910A1 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
US10/545,587 US20060245583A1 (en) 2003-07-17 2004-07-01 Speech communication apparatus
EP04747166A EP1655856A1 (en) 2003-07-17 2004-07-01 Speech communication apparatus

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2003-276181 2003-07-17
JP2003276181 2003-07-17
JP2004-172528 2004-06-10
JP2004172528A JP2005051744A (ja) 2003-07-17 2004-06-10 通話装置

Publications (1)

Publication Number Publication Date
WO2005008910A1 true WO2005008910A1 (ja) 2005-01-27

Family

ID=34082365

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2004/009697 WO2005008910A1 (ja) 2003-07-17 2004-07-01 通話装置

Country Status (4)

Country Link
US (1) US20060245583A1 (ja)
EP (1) EP1655856A1 (ja)
JP (1) JP2005051744A (ja)
WO (1) WO2005008910A1 (ja)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8380773B2 (en) * 2005-02-18 2013-02-19 Netlogic Microsystems, Inc. System and method for adaptive nonlinear filtering
WO2007049643A1 (ja) 2005-10-26 2007-05-03 Nec Corporation エコー抑圧方法及び装置
JP5228407B2 (ja) * 2007-09-04 2013-07-03 ヤマハ株式会社 放収音装置
JP5034819B2 (ja) 2007-09-21 2012-09-26 ヤマハ株式会社 放収音装置
JP5293305B2 (ja) * 2008-03-27 2013-09-18 ヤマハ株式会社 音声処理装置
US9654609B2 (en) 2011-12-16 2017-05-16 Qualcomm Incorporated Optimizing audio processing functions by dynamically compensating for variable distances between speaker(s) and microphone(s) in an accessory device
US9300266B2 (en) * 2013-02-12 2016-03-29 Qualcomm Incorporated Speaker equalization for mobile devices
CN105991857A (zh) * 2015-02-12 2016-10-05 中兴通讯股份有限公司 一种实现参考信号调整的方法及装置
US9894439B1 (en) * 2017-01-31 2018-02-13 Dell Products L.P. Adaptive microphone signal processing for a foldable computing device
US10200540B1 (en) * 2017-08-03 2019-02-05 Bose Corporation Efficient reutilization of acoustic echo canceler channels
CN111736797B (zh) * 2020-05-21 2024-04-05 阿波罗智联(北京)科技有限公司 负延时时间的检测方法、装置、电子设备及存储介质
CN111883153B (zh) * 2020-06-28 2024-02-23 厦门亿联网络技术股份有限公司 一种基于麦克风阵列的双端讲话状态检测方法及装置

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06152724A (ja) * 1992-10-30 1994-05-31 Sony Corp 通話装置
JPH089005A (ja) * 1994-06-21 1996-01-12 Nec Corp 折りたたみ型携帯電話装置
JP2000209689A (ja) * 1999-01-12 2000-07-28 Canon Inc サウンド処理装置およびその制御方法、並びに、記録媒体
JP2001154688A (ja) * 1999-12-01 2001-06-08 Toyota Central Res & Dev Lab Inc 車両用音声入力装置
JP2002204187A (ja) * 2000-11-01 2002-07-19 Fujitsu Ltd エコー抑制システム
JP2003060530A (ja) * 2001-08-13 2003-02-28 Fujitsu Ltd エコー抑制処理システム
JP2003125070A (ja) * 2001-10-15 2003-04-25 Fujitsu Ltd 通話信号処理装置
JP2003198715A (ja) * 2001-12-27 2003-07-11 Kenwood Corp 移動体電話機

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2354858A1 (en) * 2001-08-08 2003-02-08 Dspfactory Ltd. Subband directional audio signal processing using an oversampled filterbank

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06152724A (ja) * 1992-10-30 1994-05-31 Sony Corp 通話装置
JPH089005A (ja) * 1994-06-21 1996-01-12 Nec Corp 折りたたみ型携帯電話装置
JP2000209689A (ja) * 1999-01-12 2000-07-28 Canon Inc サウンド処理装置およびその制御方法、並びに、記録媒体
JP2001154688A (ja) * 1999-12-01 2001-06-08 Toyota Central Res & Dev Lab Inc 車両用音声入力装置
JP2002204187A (ja) * 2000-11-01 2002-07-19 Fujitsu Ltd エコー抑制システム
JP2003060530A (ja) * 2001-08-13 2003-02-28 Fujitsu Ltd エコー抑制処理システム
JP2003125070A (ja) * 2001-10-15 2003-04-25 Fujitsu Ltd 通話信号処理装置
JP2003198715A (ja) * 2001-12-27 2003-07-11 Kenwood Corp 移動体電話機

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
RYU K. ET AL.: "Futatsu no microphone shutsuryokukan no cross spectrum ni yoru ongen ichi suiteiho ni okeru ido zatsuongen no eikyo", NIHON ONKYO GAKKAISHI, vol. 46, no. 7, 1 July 1990 (1990-07-01), pages 523 - 530, XP002985350 *

Also Published As

Publication number Publication date
JP2005051744A (ja) 2005-02-24
US20060245583A1 (en) 2006-11-02
EP1655856A1 (en) 2006-05-10

Similar Documents

Publication Publication Date Title
US5631900A (en) Double-Talk detector for echo canceller
JP4282260B2 (ja) エコーキャンセラ
US20050286714A1 (en) Echo canceling apparatus, telephone set using the same, and echo canceling method
EP2059014B1 (en) Echo canceller and echo cancelling program
JP4457639B2 (ja) エコーキャンセラ
WO2013166761A1 (zh) 回声消除方法及装置
EP2101480B1 (en) Echo canceller and echo cancelling method
CN110956975B (zh) 回声消除方法及装置
US8787561B2 (en) Techniques for implementing adaptation control of an echo canceller to facilitate detection of in-band signals
WO2005008910A1 (ja) 通話装置
US8693677B2 (en) Techniques for updating filter coefficients of an adaptive filter
JP4403776B2 (ja) エコーキャンセラ
US8666058B2 (en) Time domain adaptive filter bank for network echo reduction or cancellation
JP4544040B2 (ja) エコーキャンセル装置およびそれを用いた電話機、並びにエコーキャンセル方法
JP4622399B2 (ja) エコーキャンセラ付き通信端末及びそのエコーキャンセル方法
JP3220979B2 (ja) 音声スイッチ
KR20010072327A (ko) 에코 제거 시스템에서 마이크로폰의 과부하 영향을경감하기 위한 방법들 및 장치
JP2005530443A (ja) 非定常エコーキャンセラ
JPH08288894A (ja) エコー抑圧装置
WO2000072566A1 (en) Methods and apparatus for improving adaptive filter performance by signal equalization
JP4512066B2 (ja) 電話機
JP3187715B2 (ja) 反響消去装置
KR19990002334A (ko) 음향 반향 제거장치
JP3635644B2 (ja) エコーキャンセラ
JP2006128758A (ja) 適応フィルタおよびそれを用いた音響エコーキャンセラ装置並びにハンズフリー電話、および適応フィルタ方法およびそれを用いた音響エコーキャンセラ方法

Legal Events

Date Code Title Description
AK Designated states

Kind code of ref document: A1

Designated state(s): AE AG AL AM AT AU AZ BA BB BG BR BW BY BZ CA CH CN CO CR CU CZ DE DK DM DZ EC EE EG ES FI GB GD GE GH GM HR HU ID IL IN IS KE KG KP KR KZ LC LK LR LS LT LU LV MA MD MG MK MN MW MX MZ NA NI NO NZ OM PG PH PL PT RO RU SC SD SE SG SK SL SY TJ TM TN TR TT TZ UA UG US UZ VC VN YU ZA ZM ZW

AL Designated countries for regional patents

Kind code of ref document: A1

Designated state(s): BW GH GM KE LS MW MZ NA SD SL SZ TZ UG ZM ZW AM AZ BY KG KZ MD RU TJ TM AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HU IE IT LU MC NL PL PT RO SE SI SK TR BF BJ CF CG CI CM GA GN GQ GW ML MR NE SN TD TG

WWE Wipo information: entry into national phase

Ref document number: 2004747166

Country of ref document: EP

121 Ep: the epo has been informed by wipo that ep was designated in this application
WWE Wipo information: entry into national phase

Ref document number: 20048010949

Country of ref document: CN

WWE Wipo information: entry into national phase

Ref document number: 2006245583

Country of ref document: US

Ref document number: 10545587

Country of ref document: US

WWP Wipo information: published in national office

Ref document number: 2004747166

Country of ref document: EP

WWW Wipo information: withdrawn in national office

Ref document number: 2004747166

Country of ref document: EP

WWP Wipo information: published in national office

Ref document number: 10545587

Country of ref document: US