JPWO2012157783A1 - 音声処理装置、音声処理方法および音声処理プログラムを記録した記録媒体 - Google Patents

音声処理装置、音声処理方法および音声処理プログラムを記録した記録媒体 Download PDF

Info

Publication number
JPWO2012157783A1
JPWO2012157783A1 JP2013515242A JP2013515242A JPWO2012157783A1 JP WO2012157783 A1 JPWO2012157783 A1 JP WO2012157783A1 JP 2013515242 A JP2013515242 A JP 2013515242A JP 2013515242 A JP2013515242 A JP 2013515242A JP WO2012157783 A1 JPWO2012157783 A1 JP WO2012157783A1
Authority
JP
Japan
Prior art keywords
voice
echo
output
input
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2013515242A
Other languages
English (en)
Inventor
宝珠山 治
治 宝珠山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Publication of JPWO2012157783A1 publication Critical patent/JPWO2012157783A1/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/60Substation equipment, e.g. for use by subscribers including speech amplifiers
    • H04M1/6033Substation equipment, e.g. for use by subscribers including speech amplifiers for providing handsfree use or a loudspeaker mode in telephone sets
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M9/00Arrangements for interconnection not involving centralised switching
    • H04M9/08Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic
    • H04M9/082Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic using echo cancellers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/60Substation equipment, e.g. for use by subscribers including speech amplifiers
    • H04M1/6033Substation equipment, e.g. for use by subscribers including speech amplifiers for providing handsfree use or a loudspeaker mode in telephone sets
    • H04M1/6041Portable telephones adapted for handsfree use
    • H04M1/605Portable telephones adapted for handsfree use involving control of the receiver volume to provide a dual operational mode at close or far distance from the user
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/005Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/02Circuits for transducers, loudspeakers or microphones for preventing acoustic reaction, i.e. acoustic oscillatory feedback
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L2021/02082Noise filtering the noise being echo, reverberation of the speech
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B3/00Line transmission systems
    • H04B3/02Details
    • H04B3/20Reducing echo effects or singing; Opening or closing transmitting path; Conditioning for transmission in one direction or the other
    • H04B3/23Reducing echo effects or singing; Opening or closing transmitting path; Conditioning for transmission in one direction or the other using a replica of transmitted signal in the time domain, e.g. echo cancellers
    • H04B3/237Reducing echo effects or singing; Opening or closing transmitting path; Conditioning for transmission in one direction or the other using a replica of transmitted signal in the time domain, e.g. echo cancellers using two adaptive filters, e.g. for near end and for end echo cancelling
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/60Substation equipment, e.g. for use by subscribers including speech amplifiers
    • H04M1/6016Substation equipment, e.g. for use by subscribers including speech amplifiers in the receiver circuit
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2499/00Aspects covered by H04R or H04S not otherwise provided for in their subgroups
    • H04R2499/10General applications
    • H04R2499/11Transducers incorporated or for use in hand-held devices, e.g. mobile phones, PDA's, camera's

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Otolaryngology (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Telephone Function (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)

Abstract

本発明は、入力音声信号中に大きな非線形エコー成分が混在している場合でも、所望音声成分を劣化させずに非線形エコー成分を抑圧する音声処理装置を提供する。その音声処理装置は、出力音声信号に基づいて音声を出力する音声出力手段と、第1音声入力手段と、第1音声入力手段よりも音声出力手段に近接して設けられた第2音声入力手段と、第1および2音声入力手段から見て音声出力手段の方向に対して感度が低くなるような指向性を形成させるように、第1および2音声入力手段それぞれからの音声信号を合成した合成信号を出力する手段と、第1音声入力手段が入力した音声に混在するエコー成分に対応する擬似エコーを、出力音声信号から生成する手段と、その合成信号に対し、その擬似エコーを用いてエコー抑圧処理を施す手段と、を備える。

Description

本発明は、音声中のエコーを抑圧する技術に関する。
上記技術分野において、特許文献1に示されているように、エコーを抑圧する技術が知られている。この技術は、適応フィルタを用いて出力音声信号(遠端信号)から擬似線形エコー信号を生成し、入力音声信号中の線形エコー成分を抑圧した上で、さらに非線形エコー成分を抑圧する技術である。特に、この技術は、入力音声信号に混在する非線形エコーを、擬似線形エコー信号を用いて推定する。こうすることにより、この技術は、比較的クリアに入力音声信号から所望音声信号を抽出している。
国際公開WO09−051197号公報
しかしながら、特許文献1に記載の技術では、入力音声信号中に大きな非線形エコー成分が混在している場合には、所望音声成分を劣化させずに非線形エコー成分を抑圧することができなかった。
その理由は、特許文献1記載のエコー抑圧装置が、入力音声信号中に大きな非線形エコー成分が混在している場合に、その非線形エコー成分をそのまま含む信号に基づいて、漏れこみ係数を算出するからである。
本発明の目的は、上述の課題を解決する技術を提供することにある。
本発明の一態様における装置は、
出力音声信号に基づいて音声を出力する音声出力手段と、
音声を入力する第1音声入力手段と、
前記第1音声入力手段よりも前記音声出力手段に近接して設けられ、音声を入力する第2音声入力手段と、
前記第1音声入力手段および前記第2音声入力手段から見て前記音声出力手段の方向に対して感度が低くなるような指向性を形成させるように、前記第1音声入力手段から出力された第1入力音声信号に対し、前記第2音声入力手段からの第2入力音声信号を合成して合成信号を出力する指向性形成手段と、
前記音声出力手段を要因として前記第1音声入力手段が入力した音声に混在するエコー成分に対応する擬似エコーを、前記出力音声信号から生成する擬似エコー生成手段と、
前記指向性形成手段から出力された前記合成信号に対し、前記出力音声信号から導いた擬似エコーを用いて、エコー抑圧処理を施すエコー抑圧手段と、
を含む。
本発明の一態様における方法は、
音声を入力する第1音声入力手段および前記第1音声入力手段よりも、出力音声信号に基づいて音声を出力する音声出力手段に近接しても受けられた第2音声入力手段から見て当該音声出力手段の方向に対して感度が低くなるような指向性を形成させるように、前記第1音声入力手段から出力された第1入力音声信号に対し、前記第2音声入力手段からの第2入力音声信号を合成して合成信号を出力し、
前記音声出力手段を要因として前記第1音声入力手段が入力した音声に混在するエコー成分に対応する擬似エコーを、前記出力音声信号から生成し、
前記合成信号に対し、前記出力音声信号から導いた擬似エコーを用いて、エコー抑圧処理を施す。
本発明の一態様における不揮発性媒体に記録されたプログラムは、
音声を入力する第1音声入力手段および前記第1音声入力手段よりも、出力音声信号に基づいて音声を出力する音声出力手段に近接して設けられて音声を入力する第2音声入力手段から見て当該音声出力手段の方向に対して感度が低くなるような指向性を形成させるように、前記第1音声入力手段から出力された第1入力音声信号に対し、前記第2音声入力手段からの第2入力音声信号を合成して合成信号を出力する処理と、
前記音声出力手段を要因として前記第1音声入力手段が入力した音声に混在するエコー成分に対応する擬似エコーを、前記出力音声信号から生成する処理と、
前記合成信号に対し、前記出力音声信号から導いた擬似エコーを用いて、エコー抑圧処理を施す処理と、
をコンピュータに実行させる。
本発明によれば、入力音声信号中に大きな非線形エコー成分が混在している場合でも、入力音声信号中に混合された所望音声成分を劣化させずに非線形エコー成分を抑圧することができる。
図1は、本発明の第1実施形態に係る音声処理装置の構成を示すブロック図である。 図2は、本発明の第2実施形態に係る音声処理装置の効果を説明する図である。 図3は、本発明の第2実施形態に係る音声処理装置の構成を説明する図である。 図4は、本発明の第2実施形態に係る非線形エコー抑圧部の構成を説明する図である。 図5は、本発明の第3実施形態に係る音声処理装置の効果を説明する図である。 図6は、本発明の第3実施形態に係る音声処理装置の構成を説明する図である。 図7は、本発明の第4実施形態に係る音声処理装置の構成を説明する図である。 図8は、本発明の第5実施形態に係る音声処理装置の構成を説明する図である。 図9は、本発明の第6実施形態に係る音声処理装置の構成を説明する図である。 図10は、本発明の第7実施形態に係る音声処理装置の構成を説明する図である。 図11は、本発明の第8実施形態に係る音声処理装置の構成を説明する図である。 図12は、本発明の第9実施形態に係る音声処理装置の構成を説明する図である。 図13は、本発明のその他の実施形態に係る音声処理装置の構成を説明する図である。 図14は、本発明のプログラムを記録した記録媒体を示す図である。
以下に、図面を参照して、本発明の実施の形態について例示的に詳しく説明する。ただし、以下の実施の形態に記載されている構成要素はあくまで例示であり、本発明の技術範囲をそれらのみに限定する趣旨のものではない。
(第1実施形態)
本発明の第1実施形態としての音声処理装置100について、図1を用いて説明する。図1に示すように、音声処理装置100は、音声出力部101と第1音声入力部102と第2音声入力部103と指向性形成部104と擬似エコー生成部105とエコー抑圧部106とを含む。
音声出力部101は、出力音声信号に基づいて音声を出力する。第1音声入力部102は、音声を入力する。第2音声入力部103は、第1音声入力部102よりも音声出力部101に近接して設けられ、音声を入力する。指向性形成部104は、第1音声入力部102から出力された第1入力音声信号に対し、第2音声入力部103からの第2入力音声信号を合成する。それにより、指向性形成部104は、第1音声入力部102および第2音声入力部103から見て音声出力部101の方向において、感度が低くなるような指向性を形成する。
一方、擬似エコー生成部105は、第1入力音声に混在するエコー成分に対応する、擬似エコーを出力音声信号から生成する。ここで、第1入力音声は、音声出力部101を要因として第1音声入力部102が入力した音声である。さらにエコー抑圧部106は、指向性形成部104からの出力に対し、擬似エコーを用いて、エコー抑圧処理を施す。
以上の構成により、入力音声信号中に大きな非線形エコー成分が混在している場合でも、入力音声信号中に混合された所望音声成分を劣化させずに非線形エコー成分を抑圧することができる。
その理由は、音声処理装置100が以下のような構成を備えるからである。第一に、指向性形成部104は、第1音声入力部102および第2音声入力部103から見て音声出力部101の方向において感度が低くなるような指向性を形成する。第二に、擬似エコー生成部105は、第1入力音声に混在するエコー成分に対応する擬似エコーを、出力音声信号から生成する。第三に、エコー抑圧部106は、指向性形成部104からの出力に対し、擬似エコーを用いて、エコー抑圧処理を施す。
(第2実施形態)
本発明の第2実施形態に係る音声処理装置について、図2乃至図4を用いて説明する。
本実施形態に係る音声処理装置は、携帯電話210内に実装され、ハンズフリー通話用のスピーカ201が音声の出力を行い、スピーカ201から異なる距離に設置された2つのマイクロフォン202および203が、音声の入力を行う。
そして、本実施形態に係る音声処理装置は、図3以降で説明する内部的な処理により、2つのマイクロフォン202、203から見てスピーカ201の方向に対して感度が低くなるような指向性を形成する。言い換えれば、本実施形態に係る音声処理装置は、指向性のヌル点がスピーカ201に向くように指向性を形成する。
これにより、ユーザ230の話し声である近端音声240を劣化させずに、スピーカ201からマイクロフォン202、203に漏れ込むエコー成分を抑圧することが可能となる。
《全体構成》
図3は、本実施形態に係る音声処理装置300の構成図である。音声処理装置300は、スピーカ201、マイクロフォン202、203の他に、指向性形成部304、擬似エコー生成部305およびエコー抑圧部306を備えている。
このうち、指向性形成部304は、遅延部341と適応フィルタ342と減算器343とを含む。
遅延部341は、マイクロフォン202から入力した第1入力音声信号を遅延させる。
適応フィルタ342は、マイクロフォン203から入力した第2入力音声信号を入力して、第1入力音声信号中に混在しているエコー成分に対応する擬似エコー成分を生成する。
減算器343は、遅延部341の出力から適応フィルタ342の出力を減算する。
擬似エコー生成部305は、適応フィルタ351を含む。適応フィルタ351は、第1入力音声に混在すると推定される擬似線形エコーy(k)を生成する。ここで、第1入力音声は、マイクロフォン202が入力した音声である。
エコー抑圧部306は、減算器361と非線形エコー抑圧部362とを含む。減算器361は、擬似線形エコーy(k)を用いて線形エコーを抑圧する。ここで、線形エコーは、指向性形成部304からの出力に混在する線形エコーである。
非線形エコー抑圧部362は、擬似エコー生成部305が生成した擬似線形エコーy(k)を用いて擬似非線形エコーを生成する。そうした上で、非線形エコー抑圧部362は、その擬似非線形エコーを用いて、減算器361から出力された残差信号d(k)中の非線形エコー成分を抑圧する。
以上の構成によれば、2つのマイクで指向性を形成して効果的にエコーを減衰させることができ、かつ近端音声を十分に残すことができる。
《非線形エコー抑圧部の構成》
次に、図4を用いて非線形エコー抑圧部362の構成について説明する。非線形エコー抑圧部362は、高速フーリエ変換部(Fast Fourier Transform:FFT)401と、高速フーリエ変換部402と、スペクトル振幅推定部403と、スペクトルフロアリング部404と、スペクトル利得計算部405と、逆高速フーリエ変換部(Inverse Fast Fourier Transform:IFFT)406と、を備える。
高速フーリエ変換部401および高速フーリエ変換部402それぞれは、残差信号d(k)および擬似線形エコーy(k)それぞれを、周波数スペクトルに変換する。
スペクトル振幅推定部403とスペクトルフロアリング部404とスペクトル利得計算部405とは、周波数成分ごとに用意されている。
逆高速フーリエ変換部406は、周波数成分ごとに導き出された振幅スペクトルを対応する位相と統合して逆高速フーリエ変換し、時間領域の出力信号zi(k)に再合成する。尚、時間領域の出力信号zi(k)は、つまり、通話相手に送る音声波形の信号である。
線形エコー信号と非線形エコー信号とはまったく違う波形である。しかし、線形エコーおよび非線形エコーそれぞれの周波数ごとにスペクトル振幅を見ると、擬似線形エコーが大きい時は非線形エコーも大きくなる傾向がある。すなわち、線形エコーと非線形エコーとには、振幅の相関がある。つまり、擬似線形エコーに基づいて、非線形エコーの量を推定することができる。
そこで、スペクトル振幅推定部403は、推定した非線形エコーの量に基づいて、所望の音声信号のスペクトル振幅を推定する。推定された音声信号のスペクトル振幅には誤差がある。そこで、その推定誤差が、通話相手に送る音声波形において、主観的に不快なものにならないよう、スペクトルフロアリング部404は、フロアリング処理を加える。
例えば、音声信号の推定スペクトル振幅が過剰に小さく、背景雑音のスペクトル振幅を下回る場合、エコーの有無で信号レベルが変動し、通話相手に違和感を生じさせる。その対策としてスペクトルフロアリング部404は、背景雑音レベルを推定して、推定スペクトル振幅の下限とすることにより、レベル変動を低減する。
一方、推定誤差により推定スペクトル振幅にエコーが大きく残留してしまった場合、残留したエコーは断続的かつ急激に変化して、ミュージカルノイズと呼ばれる、人工的な付加音となる。その対策としてスペクトル利得計算部405は、エコーを消去するために、推定した非線形エコーを減算するのではなく、減算された程度の振幅になるように利得を乗じる。利得の急激な変化を防止する平滑化を行うことにより、残留エコーの断続的変化を抑えることができる。
以下、スペクトル振幅推定部403、スペクトルフロアリング部404、スペクトル利得計算部405の内部構成について数式を用いて説明する。
非線形エコー抑圧部362に入力される残差信号d(k)は、近端信号s(k)と残留非線形エコーq(k)との和である。
d(k)=s(k)+q(k) ・・・(1)
適応フィルタ351と減算器361とによって線形エコーがほぼ完全に除去されていると仮定して、非線形成分のみを周波数領域で考える。高速フーリエ変換部401および高速フーリエ変換部402によって、式(1)で表される残差信号は周波数領域に変換され、以下の式で表される。
D(m)=S(m)+Q(m) ・・・(2)
ここでmはフレーム番号、ベクトルD(m)、S(m)およびQ(m)それぞれは、d(k)、s(k)およびq(k)それぞれを、周波数領域に変換した表現である。各周波数を独立に考えて式(2)を変形すると、所望信号のi番目の周波数成分は、以下の式で表される。
Si(m)=Di(m)−Qi(m) ・・・(3)
適応フィルタ351および減算器361が相関除去を行うため、Di(m)とYi(m)の間にはほとんど相関はない。従って、減算器436は、式(3)の二乗平均をとることにより、
Figure 2012157783
ペクトルに変換した場合のi番目の周波数のエコーレプリカである。
Figure 2012157783
Figure 2012157783
の積として以下のようにモデル化できる。
Figure 2012157783
そこで、絶対値化回路432と平均化回路434とが、Yi(m)から平均エコーレプリカ
Figure 2012157783
は、|Qi(m)|と|Yi(m)|との相関を示す回帰係数である。このモデルは、|Qi(m)|と|Yi(m)|との間に有意な相関があるという実験結果に基づいている。
式(3)は、ノイズ抑圧において広く用いられている、加法型のモデルである。図4に示す非線形エコー抑圧部362のスペクトル整形では、ノイズ抑圧において、不快なミュージカルノイズを生じにくい、スペクトル乗算型の構成をとる。スペクトル乗算を用いて、出力信号の振幅|Zi(m)|を、スペクトルゲインGi(m)と残差信号|Di(m)|の積として得る。
Figure 2012157783
式(6)の平方根をとり、式(4)の|Qi(m)|にai・|Yi(m)|を代入するこ
Figure 2012157783
Figure 2012157783
Figure 2012157783
きない誤差がある。誤差が大きく、オーバーサブトラクションがおきると、近端信号において高域成分の減少を、あるいは通話相手に送る音声波形において変調感を生じることになる。特に、近端信号が空調音のように定常である場合、通話相手にとって、変調感は不快である。この変調感を主観的に低減するために、スペクトルフロアリング部404でスペクトル上のフロアリングを行う。
フロアリングでは、まず、平均化回路441が、近端信号Di(m)の定常成分|Ni(m)|を推定する。次に、最大値選択回路442が、定常成分|Ni(m)|を下限とするフロアリングを行う。その結果、最大値選択回路442は、よりよい近端信号の振幅推定値
Figure 2012157783
る。
最後に数式(5)に示したように、積算器453が、スペクトルゲインGi(m)と残差信号|Di(m)|の積を求める。こうすることで、積算器453は求めた積を、振幅|Zi(m)|を出力信号として出力する。逆高速フーリエ変換部406は、振幅|Zi(m)|を逆フーリエ変換し、非線形のエコーが効果的に抑圧された音声信号zi(k)を出力する。
《第2実施形態のまとめ》
本実施形態によれば、以上の構成により、非常に効果的に線形エコーおよび非線形エコーを抑圧することができる。
その理由は、音声処理装置300が以下のような構成を備えるからである。第一に、指向性形成部304の遅延部341と適応フィルタ342と減算器343とが、指向性のヌル点がスピーカ201に向くように指向性を形成する。第二に、擬似エコー生成部305の適応フィルタ351は、マイクロフォン202が入力した音声に混在すると推定される擬似線形エコーy(k)を生成する。第三に、エコー抑圧部306の減算器361と非線形エコー抑圧部362とは、擬似線形エコーy(k)を用いて、指向性形成部304からの出力に混在する線形エコーを抑圧する。
(第3実施形態)
上記第2実施形態の音声処理装置300は、図5の上段501に示すように動作した。即ち、指向性形成部304は、エコー全体をキャンセルする(511)。適応フィルタ351は、線形エコーをキャンセルする(512)。さらに、非線形エコー抑圧部362は、非線形エコーを抑圧する(513)。
これに対し、図6に示す本実施形態の音声処理装置600は、図5の下段502に示すように動作する。即ち、指向性形成部604は、主に非線形エコーをキャンセルする(521)。適応フィルタ351は、線形エコーをキャンセルする(522)。さらに、非線形エコー抑圧部362は、非線形エコーを抑圧する(523)。
具体的な構成を、図6を用いて説明する。第2実施形態との相違は、指向性形成部304の代わりに、線形エコー抑圧部644を含む指向性形成部604を備えた点にある。その他の構成および動作は、第2実施形態と同様であるため、同じ構成および動作については同じ符号を付してその詳しい説明を省略する。
指向性形成部604は、マイクロフォン203からの入力音声信号の線形エコー成分を抑圧する、線形エコー抑圧部644を含む。線形エコー抑圧部644は、遠端信号から擬似線形エコーを生成する適応フィルタ682と、マイクロフォン203からの入力音声信号から、その擬似線形エコーを減算する減算器681を備えている。即ち、指向性形成部644は、マイクロフォン203からの入力音声信号の線形エコー成分を抑圧し、こうして抽出した非線形エコー成分を抑圧済入力音声信号として出力する。
適応フィルタ342は、線形エコー抑圧部644から出力された抑圧済入力音声信号を用いて擬似エコーを生成する。
減算器343は、マイクロフォン202からの入力音声信号を遅延部341で遅延させた遅延信号からその擬似エコーを減算する。そして、減算器343は、指向性形成部604に、スピーカ201の方向に対して感度が低くなるような指向性を形成させる。言い換えれば、減算器343は、指向性のヌル点がスピーカ201に向くように、指向性形成部604に指向性を形成させる。
本実施形態によれば、以上の構成により、第2実施形態以上に効果的に線形エコーおよび非線形エコーを抑圧することができる。
その理由は、音声処理装置600が以下のような構成を備えるからである。第一に、指向性形成部304は、主に非線形エコーをキャンセルする。第二に、適応フィルタ351は、線形エコーをキャンセルする。第三に、非線形エコー抑圧部362は、非線形エコーを抑圧する。
(第4実施形態)
次に本発明の第4実施形態に係る音声処理装置700について、図7を用いて説明する。
本実施形態に係る音声処理装置700は、上記第3実施形態と比べると、指向性形成部604の代わりに、指向性形成部704を備えた点で相違する。その他の構成および動作は、第3実施形態と同様であるため、同じ構成および動作については同じ符号を付してその詳しい説明を省略する。
指向性形成部704は、指向性形成部604の構成に加えて、マイクロフォン202からの入力音声信号の線形エコー成分を抑圧する線形エコー抑圧部745を含む。
線形エコー抑圧部745は、遠端信号から擬似線形エコーを生成する適応フィルタ792と、マイクロフォン202からの入力音声信号からその擬似線形エコーを減算する減算器791とを備えている。
適応フィルタ342は、線形エコー抑圧部644から出力された抑圧済入力音声信号を用いて擬似エコーを生成する。そして、線形エコー抑圧部745は、マイクロフォン202からの入力音声信号の線形エコー成分を抑圧する。そうした後に、遅延部341は、線形エコー成分を抑圧された入力音声信号を遅延させて、遅延信号とする。
減算器343は、マイクロフォン202からの入力音声信号を遅延部341で遅延させた遅延信号からその擬似エコーを減算する。そうして、減算器343は、指向性形成部704に、スピーカ201の方向に対して感度が低くなるような指向性を形成させる。言い換えれば、減算器343は、指向性のヌル点がスピーカ201に向くように、指向性形成部704に指向性を形成させる
本実施形態によれば、以上の構成により、効果的に線形エコーおよび非線形エコーを抑圧することができる。
その理由は、音声処理装置700が、マイクロフォン202からの入力音声信号の線形エコー成分を抑圧する線形エコー抑圧部745を、さらに含むからである。
(第5実施形態)
次に本発明の第5実施形態に係る音声処理装置800について、図8を用いて説明する。
本実施形態に係る音声処理装置800は、上記第4実施形態と比べると、擬似エコー生成部305を有していない点で相違する。その他の構成および動作は、第4実施形態と同様であるため、同じ構成および動作については同じ符号を付してその詳しい説明を省略する。
エコー抑圧部806に含まれる非線形エコー抑圧部362は、図4を用いて説明したものとまったく同じ構成であるが、その入力信号としての擬似エコーy(k)として、適応フィルタ792からの出力を流用する点で異なる。
つまり、線形エコー抑圧部745は、遠端信号から導いた擬似エコーを用いて、第1入力音声信号の線形エコー成分を抑圧する。そして、エコー抑圧部806は、線形エコー抑圧部745において導かれた擬似エコーを用いて、エコー抑圧処理を施す。
本実施形態によれば、より単純な構成で、第4実施形態と同様のエコーの抑圧を達成することができる。
その理由は、非線形エコー抑圧部362が、その入力信号としての擬似エコーy(k)として、適応フィルタ792からの出力を流用するように、したからである。
(第6実施形態)
次に本発明の第6実施形態に係る音声処理装置900について、図9を用いて説明する。
本実施形態に係る音声処理装置900は、上記第5実施形態と比べると、擬似エコー生成部905を有する点で相違する。その他の構成および動作は、第5実施形態と同様であるため、同じ構成および動作については同じ符号を付してその詳しい説明を省略する。
エコー抑圧部806に含まれる非線形エコー抑圧部362は、図4を用いて説明したものとまったく同じ構成であるが、その入力信号としての、擬似エコーy(k)として、擬似エコー生成部905からの出力を用いる。
擬似エコー生成部905は、適応フィルタ792が求めた擬似線形エコーを、遅延部952で遅延させる。また、擬似エコー生成部905は、適応フィルタ682が求めた擬似線形エコーを、さらに適応フィルタ951に通す。そして、擬似エコー生成部905は、遅延部952の出力から適応フィルタ951の出力を、減算器953で減算する。擬似エコー生成部905は、これによって新たな擬似エコーを導き出す。
線形エコー抑圧部644および線形エコー抑圧部745は、遠端信号から導いた擬似エコーを用いて、マイクロフォン202からの入力音声信号およびマイクロフォン203からの入力音声信号の線形エコー成分を抑圧する。
エコー抑圧部806は、線形エコー抑圧部644、745において導かれた擬似エコーを合成した、新たな擬似エコーを用いて、エコー抑圧処理を施す。本実施形態によれば、第4実施形態と同様のエコーの抑圧を達成することができる。
その理由は、音声処理装置900が以下のような構成を備えるからである。第一に、擬似エコー生成部905は、適応フィルタ792で求めた擬似線形エコーを遅延させたものから、適応フィルタ682で求めた擬似線形エコーをさらに適応フィルタ951に通したものを、減算器953で減算する。第二に、エコー抑圧部806に含まれる非線形エコー抑圧部362は、その入力信号としての、擬似エコーy(k)として、擬似エコー生成部905からの出力を用いる。
(第7実施形態)
上記第2〜第6実施形態において、図10に示すように、指向性形成部304、604、704は、減算器343の出力および適応フィルタ342への入力によって適応フィルタ342を制御する制御部1044をさらに備えてもよい。
制御部1044は、適応フィルタ342への入力が大きく減算器343の出力が小さい場合には、適応フィルタ342の係数を更新する。また、適応フィルタ342への入力が小さい場合には、適応フィルタ342の係数を更新しない。
このように適応フィルタの係数更新を制御することにより効果的に、指向性を形成することが可能となる。
その理由は、以下のような構成を含むからである。第1に、適応フィルタ342の係数を更新する制御部1044は、適応フィルタ342の係数更新によって適切な指向性が形成される場合、すなわち適応フィルタ342への入力が大きく減算器343の出力が小さい場合を、検出する。第2に、制御部1044は、その場合のみに適応フィルタの係数更新を行うからである。
(第8実施形態)
上記第2〜第6実施形態において、図11に示すように、指向性形成部304、604、704は、減算器343の出力および擬似線形エコーによって適応フィルタ342を制御する制御部1144をさらに備えてもよい。
制御部1144は、擬似線形エコーが大きく減算器343の出力が小さい場合には、適応フィルタ342の係数を更新する。また、擬似線形エコーが小さい場合には、制御部1144は、適応フィルタ342の係数を更新しない。
このように適応フィルタの係数更新を制御することにより、より効果的に指向性を形成することが可能となる。
その理由は、以下のような構成を含むからである。第1に、適応フィルタ342の係数を更新する制御部1044は、適応フィルタの係数更新によって適切な指向性が形成される場合、すなわち擬似線形エコーが大きく減算器343の出力が小さい場合を、検出する。第2に、制御部1044は、その場合のみに適応フィルタの係数更新を行うからである。
(第9実施形態)
上記第2〜第6実施形態において、エコー抑圧部306に代えて図12に示すエコー抑圧部1206を用いてもよい。エコー抑圧部1206は、非線形エコー抑圧部362に対して、減算器361での減算後の信号ではなく、減算前の信号を入力する。
エコー抑圧部1206における減算器361は、適応フィルタ351で生成した擬似線形エコーを用いて、指向性形成部304、604、704からの出力に混在する線形エコーをキャンセルする。
また、エコー抑圧部1206における非線形エコー抑圧部362は、擬似線形エコーを用いて擬似非線形エコーを生成する。そうした上で、非線形エコー抑圧部362は、その擬似非線形エコーを用いて、指向性形成部304、604、704からの出力に混在する非線形エコーと共に線形エコーを抑圧する。
本実施形態によっても、上述の第2〜第6実施形態と同様に非線形エコーを抑圧することが可能である。
その理由は、各音声処理装置が、非線形エコー抑圧部362に対して、減算器361での減算後の信号ではなく、減算前の信号を入力するエコー抑圧部1206を、さらに備えるからである。
(他の実施形態)
以上、本発明の実施形態について詳述したが、それぞれの実施形態に含まれる別々の特徴を如何様に組み合わせたシステムまたは装置も、本発明の範疇に含まれる。
また、本発明は、複数の機器から構成されるシステムに適用されてもよいし、単体の装置に適用されてもよい。さらに、本発明は、実施形態の機能を実現する情報処理プログラムが、システムあるいは装置に直接あるいは遠隔から供給される場合にも適用可能である。
従って、本発明の機能をコンピュータで実現するために、コンピュータにインストールされるプログラム、あるいはそのプログラムを格納した媒体、そのプログラムをダウンロードさせるWWW(World Wide Web)サーバも、本発明の範疇に含まれる。
以下、一例として、第3実施形態で説明した音声処理をソフトウェアで実現する場合に、コンピュータ1300に設けられたCPU1302で実行される処理の流れを、図13を用いて説明する。
まず、CPU1302は、入力部1301を用いて、マイクロフォン202、203から音声信号を入力してそれぞれメモリ1304に格納する(S1301)。次に、マイクロフォン203の入力音声信号中の線形エコー成分を抑圧する(S1303)。
さらに、ステップS1303での処理の結果に対し、CPU1302は、マイクロフォン202の入力音声信号を遅延させて合成する(S1305)。ステップS1303、S1305の処理により2マイクでの指向性が形成される。
さらに、CPU1302は、マイクロフォン203の入力音声信号中の線形エコー成分を抑圧する(S1307)。最後に、CPU1302は、マイクロフォン203の入力音声信号中の非線形エコー成分を抑圧する(S1309)。
以上の処理により、第3実施形態と同様の効果を得ることができる。
図14は、プログラムを記録(記憶)する、記録媒体(記憶媒体)1307の例を示す図である。記録媒体1307は、情報を非一時的に記憶する不揮発性記録媒体である。尚、記録媒体1307は、情報を一時的に記憶する記録媒体であってもよい。記録媒体1307は、図13に示す動作をコンピュータ1300(CPU1302)に実行させるプログラム(ソフトウェア)を記録する。尚、記録媒体1307は、さらに、任意のプログラムやデータを記録してよい。
上述のプログラム(ソフトウェア)のコードを記録した記録媒体1307が、コンピュータ1300に供給され、CPU1302は、記録媒体1307に格納されたプログラムのコードを読み出して実行するようにしてもよい。あるいは、CPU1302は、記録媒体1307に格納されたプログラムのコードを、メモリ1304に格納するようにしてもよい。すなわち、本実施形態は、コンピュータ1300(CPU1302)が実行するプログラムを、一時的にまたは非一時的に、記憶する記録媒体1307の実施形態を含む。
以上、実施形態を参照して本願発明を説明したが、本願発明は上記実施形態に限定されるものではない。本願発明の構成や詳細には、本願発明のスコープ内で当業者が理解し得る様々な変更をすることができる。
この出願は、2011年5月19日に出願された日本出願特願2011−112076を基礎とする優先権を主張し、その開示の全てをここに取り込む。
100 音声処理装置
101 音声出力部
102 第1音声入力部
103 第2音声入力部
104 指向性形成部
105 擬似エコー生成部
106 エコー抑圧部
201 スピーカ
202 マイクロフォン
203 マイクロフォン
210 携帯電話
230 ユーザ
240 近端音声
304 指向性形成部
305 擬似エコー生成部
306 エコー抑圧部
341 遅延部
342 適応フィルタ
343 減算器
351 適応フィルタ
361 減算器
362 非線形エコー抑圧部
401 高速フーリエ変換部
402 高速フーリエ変換部
403 スペクトル振幅推定部
404 スペクトルフロアリング部
405 スペクトル利得計算部
406 逆高速フーリエ変換部
431 絶対値化回路
432 絶対値化回路
433 平均化回路
434 平均化回路
435 積算部
436 減算器
441 平均化回路
442 最大値選択回路
451 除算器
452 平均化回路
453 積算器
501 上段
502 下段
600 音声処理装置
604 指向性形成部
644 線形エコー抑圧部
681 減算器
682 適応フィルタ
700 音声処理装置
704 指向性形成部
745 線形エコー抑圧部
791 減算器
792 適応フィルタ
800 音声処理装置
806 エコー抑圧部
900 音声処理装置
905 擬似エコー生成部
951 適応フィルタ
953 減算器
1044 制御部
1144 制御部
1206 エコー抑圧部
1300 コンピュータ
1301 入力部
1302 CPU
1304 メモリ
1307 記録媒体

Claims (14)

  1. 出力音声信号に基づいて音声を出力する音声出力手段と、
    音声を入力する第1音声入力手段と、
    前記第1音声入力手段よりも前記音声出力手段に近接して設けられ、音声を入力する第2音声入力手段と、
    前記第1音声入力手段および前記第2音声入力手段から見て前記音声出力手段の方向に対して感度が低くなるような指向性を形成させるように、前記第1音声入力手段から出力された第1入力音声信号に対し、前記第2音声入力手段からの第2入力音声信号を合成して合成信号を出力する指向性形成手段と、
    前記音声出力手段を要因として前記第1音声入力手段が入力した音声に混在するエコー成分に対応する擬似エコーを、前記出力音声信号から生成する擬似エコー生成手段と、
    前記指向性形成手段から出力された合成信号に対し、前記出力音声信号から導いた擬似エコーを用いて、エコー抑圧処理を施すエコー抑圧手段と、
    を含むことを特徴とする音声処理装置。
  2. 携帯電話内に実装され、
    前記音声出力手段は、ハンズフリー通話用スピーカであって、前記第1、第2音声入力手段は、マイクロフォンであることを特徴とする請求項1に記載の音声処理装置。
  3. 前記指向性形成手段は、
    前記第1入力音声信号を遅延させる遅延部と、
    前記第2入力音声信号から、前記第1入力音声信号中に混在しているエコー成分に対応する擬似エコー成分を生成する適応フィルタと、
    前記遅延部の出力から前記適応フィルタの出力を減算する減算器と、
    を含むことを特徴とする請求項1または2に記載の音声処理装置。
  4. 前記指向性形成手段は、前記減算器の出力および前記適応フィルタへの入力によって前記適応フィルタを制御する制御手段をさらに備えたことを特徴とする請求項1乃至3のいずれか1項に記載の音声処理装置。
  5. 前記指向性形成手段は、前記減算器の出力および前記擬似エコー成分によって前記適応フィルタを制御する制御手段をさらに備えたことを特徴とする請求項1乃至3のいずれか1項に記載の音声処理装置。
  6. 前記擬似エコー生成手段は、前記第1音声入力手段が入力した音声に混在すると推定される擬似線形エコーを生成する適応フィルタを含むことを特徴とする請求項1乃至5のいずれか1項に記載の音声処理装置。
  7. 前記エコー抑圧手段は、
    前記擬似線形エコーを用いて、前記指向性形成手段からの出力に混在する線形エコーを抑圧する線形エコー抑圧手段と、
    前記擬似線形エコーを用いて擬似非線形エコーを生成した上で、その擬似非線形エコーを用いて、前記線形エコー抑圧手段からの出力に混在する非線形エコーを抑圧する非線形エコー抑圧手段と、
    を含むことを特徴とする請求項6に記載の音声処理装置。
  8. 前記エコー抑圧手段は、
    前記擬似線形エコーを用いて、前記指向性形成手段からの出力に混在する線形エコーを抑圧する線形エコー抑圧手段と、
    前記擬似線形エコーを用いて擬似非線形エコーを生成した上で、その擬似非線形エコーを用いて、前記指向性形成手段からの出力に混在する非線形エコーを抑圧する非線形エコー抑圧手段と、
    を含むことを特徴とする請求項6に記載の音声処理装置。
  9. 前記指向性形成手段は、
    前記第2入力音声信号の線形エコー成分を抑圧する第2線形エコー抑圧手段を含み、
    前記第2線形エコー抑圧手段から出力された抑圧済第2入力音声信号を、前記第1入力音声信号を遅延させた遅延信号に対して合成して、前記第1音声入力手段および前記第2音声入力手段から見て前記音声出力手段の方向に対して感度が低くなるような指向性を形成させることを特徴とする請求項1乃至8のいずれか1項に記載の音声処理装置。
  10. 前記指向性形成手段は、
    前記第1入力音声信号の線形エコー成分を抑圧する第1線形エコー抑圧手段をさらに含み、
    前記第2線形エコー抑圧手段から出力された抑圧済第2入力音声信号を、前記第1線形エコー抑圧手段から出力された抑圧済第1入力音声信号を遅延させた遅延信号に対して合成して、前記第1音声入力手段および前記第2音声入力手段から見て前記音声出力手段の方向に対して感度が低くなるような指向性を形成させることを特徴とする請求項9に記載の音声処理装置。
  11. 前記第1線形エコー抑圧手段は、前記出力音声信号から導いた擬似エコーを用いて、前記第1入力音声信号の線形エコー成分を抑圧し、
    前記エコー抑圧手段は、前記第1線形エコー抑圧手段において導かれた前記擬似エコーを用いて、エコー抑圧処理を施すことを特徴とする請求項10に記載の音声処理装置。
  12. 前記第1線形エコー抑圧手段および第2線形エコー抑圧手段は、前記出力音声信号から導いた擬似エコーを用いて、前記第1入力音声信号および前記第2入力音声信号の線形エコー成分を抑圧し、
    前記エコー抑圧手段は、前記第1、第2線形エコー抑圧手段において導かれた前記擬似エコーを用いて、エコー抑圧処理を施すことを特徴とする請求項11に記載の音声処理装置。
  13. 音声を入力する第1音声入力手段および前記第1音声入力手段よりも出力音声信号に基づいて音声を出力する音声出力手段に近接して設けられて、音声を入力する第2音声入力手段から見て当該音声出力手段の方向に対して感度が低くなるような指向性を形成させるように、前記第1音声入力手段から出力された第1入力音声信号に対し、前記第2音声入力手段からの第2入力音声信号を合成して合成信号を出力し、
    前記音声出力手段を要因として前記第1音声入力手段が入力した音声に混在するエコー成分に対応する擬似エコーを、前記出力音声信号から生成し、
    前記合成信号に対し、前記出力音声信号から導いた擬似エコーを用いて、エコー抑圧処理を施す、
    ことを特徴とする音声処理方法。
  14. 音声を入力する第1音声入力手段および前記第1音声入力手段よりも出力音声信号に基づいて音声を出力する音声出力手段に近接して設けられて、音声を入力する第2音声入力手段から見て当該音声出力手段の方向に対して感度が低くなるような指向性を形成させるように、前記第1音声入力手段から出力された第1入力音声信号に対し、前記第2音声入力手段からの第2入力音声信号を合成して合成信号を出力する処理と、
    前記音声出力手段を要因として前記第1音声入力手段が入力した音声に混在するエコー成分に対応する擬似エコーを、前記出力音声信号から生成する処理と、
    前記合成信号に対し、前記出力音声信号から導いた擬似エコーを用いて、エコー抑圧処理を施す処理と、
    をコンピュータに実行させることを特徴とする音声処理プログラムを記録した不揮発性媒体。
JP2013515242A 2011-05-19 2012-05-18 音声処理装置、音声処理方法および音声処理プログラムを記録した記録媒体 Pending JPWO2012157783A1 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2011112076 2011-05-19
JP2011112076 2011-05-19
PCT/JP2012/063399 WO2012157783A1 (ja) 2011-05-19 2012-05-18 音声処理装置、音声処理方法および音声処理プログラムを記録した記録媒体

Publications (1)

Publication Number Publication Date
JPWO2012157783A1 true JPWO2012157783A1 (ja) 2014-07-31

Family

ID=47177097

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013515242A Pending JPWO2012157783A1 (ja) 2011-05-19 2012-05-18 音声処理装置、音声処理方法および音声処理プログラムを記録した記録媒体

Country Status (5)

Country Link
US (1) US20140066134A1 (ja)
EP (1) EP2712208A4 (ja)
JP (1) JPWO2012157783A1 (ja)
CN (1) CN103548362A (ja)
WO (1) WO2012157783A1 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2545263B (en) * 2015-12-11 2019-05-15 Acano Uk Ltd Joint acoustic echo control and adaptive array processing
CN110246515B (zh) * 2019-07-19 2023-10-24 腾讯科技(深圳)有限公司 回声的消除方法、装置、存储介质及电子装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06152724A (ja) * 1992-10-30 1994-05-31 Sony Corp 通話装置
JP2006222874A (ja) * 2005-02-14 2006-08-24 Nippon Telegr & Teleph Corp <Ntt> 音響エコー消去方法、装置、プログラム、記録媒体
JP2008263441A (ja) * 2007-04-12 2008-10-30 Matsushita Electric Ind Co Ltd 非線形エコーキャンセラ装置
WO2009051197A1 (ja) * 2007-10-19 2009-04-23 Nec Corporation エコー抑圧方法及び装置

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070165871A1 (en) * 2004-01-07 2007-07-19 Koninklijke Philips Electronic, N.V. Audio system having reverberation reducing filter
EP1633121B1 (en) * 2004-09-03 2008-11-05 Harman Becker Automotive Systems GmbH Speech signal processing with combined adaptive noise reduction and adaptive echo compensation
US8111838B2 (en) * 2007-02-28 2012-02-07 Panasonic Corporation Conferencing apparatus for echo cancellation using a microphone arrangement
CN101689371B (zh) * 2007-06-21 2013-02-06 皇家飞利浦电子股份有限公司 处理音频信号的设备和方法
US8462193B1 (en) * 2010-01-08 2013-06-11 Polycom, Inc. Method and system for processing audio signals
US8447595B2 (en) * 2010-06-03 2013-05-21 Apple Inc. Echo-related decisions on automatic gain control of uplink speech signal in a communications device

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06152724A (ja) * 1992-10-30 1994-05-31 Sony Corp 通話装置
JP2006222874A (ja) * 2005-02-14 2006-08-24 Nippon Telegr & Teleph Corp <Ntt> 音響エコー消去方法、装置、プログラム、記録媒体
JP2008263441A (ja) * 2007-04-12 2008-10-30 Matsushita Electric Ind Co Ltd 非線形エコーキャンセラ装置
WO2009051197A1 (ja) * 2007-10-19 2009-04-23 Nec Corporation エコー抑圧方法及び装置

Also Published As

Publication number Publication date
US20140066134A1 (en) 2014-03-06
WO2012157783A1 (ja) 2012-11-22
CN103548362A (zh) 2014-01-29
EP2712208A1 (en) 2014-03-26
EP2712208A4 (en) 2014-11-12

Similar Documents

Publication Publication Date Title
CN107211063B (zh) 非线性回波路径检测
JP4161628B2 (ja) エコー抑圧方法及び装置
JP6243536B2 (ja) エコー打ち消し
ES2558559T3 (es) Estimación y supresión de no linealidades de altavoces armónicos
EP2987316B1 (en) Echo cancellation
CN110176244B (zh) 回声消除方法、装置、存储介质和计算机设备
JP2005249816A (ja) 信号強調装置、方法及びプログラム、並びに音声認識装置、方法及びプログラム
KR102190833B1 (ko) 에코 억제
JP6094479B2 (ja) 音声処理装置、音声処理方法および音声処理プログラムを記録した記録媒体
JPWO2012070670A1 (ja) 信号処理装置、信号処理方法、及び信号処理プログラム
KR102157276B1 (ko) 비선형 음향 에코 소거 장치 및 그 방법
EP2939405A1 (en) Method and apparatus for audio processing
US8406430B2 (en) Simulated background noise enabled echo canceller
JPWO2012157783A1 (ja) 音声処理装置、音声処理方法および音声処理プログラムを記録した記録媒体
JP5438629B2 (ja) ステレオ反響消去方法、ステレオ反響消去装置、ステレオ反響消去プログラム
CN115278465A (zh) 啸叫抑制方法、装置、音响及扩音系统
JP6707914B2 (ja) ゲイン処理装置及びプログラム、並びに、音響信号処理装置及びプログラム
CN112863532A (zh) 回音抑制装置、回音抑制方法以及存储介质
WO2013032001A1 (ja) 音声処理装置、その制御方法および制御プログラム
JP6180689B1 (ja) エコーキャンセラ装置、エコー消去方法、及びエコー消去プログラム
Guo et al. An Improved Low-Complexity Echo Suppression Algorithm Based on the Acoustic Coloration Effect
JP2013042334A (ja) 情報処理装置、情報処理方法、およびプログラム
JP4631933B2 (ja) エコー抑圧方法
JP2005057413A (ja) 反響消去装置、方法、及び反響消去プログラム、そのプログラムを記録した記録媒体
WO2012157785A1 (ja) 音声処理装置、音声処理方法及び音声処理プログラムを記録した記録媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150417

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160705

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20170606