JPH0272398A - 音声信号用前処理装置 - Google Patents

音声信号用前処理装置

Info

Publication number
JPH0272398A
JPH0272398A JP22230988A JP22230988A JPH0272398A JP H0272398 A JPH0272398 A JP H0272398A JP 22230988 A JP22230988 A JP 22230988A JP 22230988 A JP22230988 A JP 22230988A JP H0272398 A JPH0272398 A JP H0272398A
Authority
JP
Japan
Prior art keywords
learning
neural network
signal
layer
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP22230988A
Other languages
English (en)
Inventor
Hiroshi Ichikawa
市川 熹
Yoshiaki Asakawa
浅川 吉章
Akio Amano
天野 明雄
Nobuo Hataoka
畑岡 信夫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP22230988A priority Critical patent/JPH0272398A/ja
Priority to DE19893929481 priority patent/DE3929481A1/de
Publication of JPH0272398A publication Critical patent/JPH0272398A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/16Speech classification or search using artificial neural networks
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L2021/02161Number of inputs available containing the signal or the noise to be suppressed
    • G10L2021/02166Microphone arrays; Beamforming
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/005Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は音声処理装置における入力音声の信号対雑音比
(S/N)を改善するための前処理装置に関する。
〔従来の技術〕
従来、音声のS/N改善を図る方法としては、了め雑音
の周波数特性を調べ、その成分を差引く方法があったが
雑音の定常性を仮定していた。また、最近では、日本音
響学会講演論文集3−p−13、Pp253−294 
(昭63年5月)において報告されているように、ニュ
ーラルネットワークを用いた手法が論じられている。
〔発明が解決しようとする課題〕
上記従来技術は、それまでの手法に比べ勝れたS/N改
善性能を示しているが、明瞭性も低下するなどの問題点
があった。
本発明の目的は、上記技術の利点を生かしながら、明瞭
性を落すことなく、さらにS/Nを改善する方法の提供
にある。
〔課題を解決するための手段〕
上記目的を達成するために、人間が高騒音下でも二つの
耳を活用して音声の会話を容易に行なっていることに注
目し、さらにそれを拡張して複数個のマイクロフォンか
らの入力をニューラルネットワークの入力に用いるよう
にしたものである。
ここでニューラル・ネットワークとは、等測的に並列プ
ロセッシング・エレメントからなり、各プロセッシング
・エレメント間の結合は、ダイナミックな自己プログラ
ミングにより、教師の有無にかかわらず、自己学習によ
り行なわれるもの、及び、了めこの学習により結合がな
され、学習機能がなく固定化されているものの双方を含
むものとする。
〔作用〕
音声は、口という物理的に限定された器官から作り出さ
れ、かつ、言語という情報を伝えることを目的としてい
るため、物理信号としての特性に偏よりかある。一応雑
音は様々な方向からの様々な音源より発せられたもので
あり、その物理特性には特定の共通した偏りは存在しな
い。
従って、ニューラル・ネットワークは、その学習を行な
う時に、複数のマイクロフォン入力からの信号と、出力
側から与えられる音声のみからなる学習用の信号との間
の共通の物理的特性のみを通過させ、それ以外の信号を
遮断するように学習されるので、音声としての物理特性
を持つ信号のみが通過し、雑音成分は減衰し、S/Nが
大幅に改善される。
〔実施例〕
以下、本発明の一実施例を図により説明する。
第1図は本発明の中心となるニューラル・ネットワーク
によるS / N改善用のフィルタの構成を説明する図
、第2図は本発明によるフィルタ及び学習用のシステム
を説明する図である。
第2図において、入力音声信号101及び雑音102は
複数のマイクロフィン201は多重型のアナログ/デジ
タル変換器(A/D)202を経て、デジタル化され、
スイッチS/W2O3に送られる。学習モードの場合は
、スイッチ203は内部バス204を経て、μCPU2
05の制御によリー担メモリ2o6に格納され、μCP
U205中の手順によりニューラルネットを学習する。
学習された結果はニューラル・ネットの各素子間の結合
の重み係数として得られる。この重み係数は信号線20
7を経て、ニューラル・ネットワーク型のS/N改善フ
ィルタを構成するデジタル信号プロセッサ(DSP)2
08に送られる。DSP208は重みが概学習のニュー
ラルネットワーク型のS/N改善フィルタとなっている
。S/N改善用のフィルタとしてシステムを用いる場合
は入力音声101(および雑音102)はマイクロフオ
ン201、A/D変換器、S/W2O3を経て、直接D
SP208に入り、S / N改善された出力209が
出力される。なお、学習に必要な部分を取りはずし、S
/N改善フィルタ専用型の構成も当然利用形態としてあ
りうることは言うまでもない。
以下、第1図を用いて、S/N改善フィルタとしての動
作及び、学習の手順を説明する。なお学習時には、第1
図の各部はμCPU205及びメモリ206中に構成さ
れる仮想的なもので実現出来、実動作時には、第1図の
フィルタ構成部分のみの構造がDSP208中に構成さ
れる。また、マイクロフォン201やA/D 202が
デジタル回線により遠方に設置されており、装置の実態
としてはDSP208のみとなる場合も当然ありうる。
以下の説明では、説明を簡単にするために、主に入力系
を二つとするが、三つ以上でも全く同様に構成できるこ
とは言うまでもない。
第1図において、第2層の第9番目のニューロン素子の
出力をOpgqs第p−i層のr番目の素子の出力を○
p−i+r とする、又、各素子の入力Xと出力yの間
の特性を、説明を簡単にするため、背向−としく同一で
ある必要はない) y = f (x)            ・・・(
1)とすると、 Ip、q=ΣωF−1tq、r ’○P−1g r  
   ’°°(2)○p、q= f (Ip、q)  
         ・・・(3)と記述することが出来
る。(2)式が示すように、積和計算が多く、本処理は
いわゆるDSPの得意なものが主体となっていることが
わかる6本実施例のニューラル・ネットワークは、(3
)式の特性を持つニューロン素子を多数階層的に接続し
たものである。なお第1図ではニューラル・ネットワー
クの層を4として書いであるが、特に4層に限定するも
のではない。
音声101及び雑音102の混合された信号はマイクロ
フォン103及び104を経て、A/D変換器106及
び107によりデジタル信号化され、その出力はシフト
レジスタ112と113に加えられる。シフトレジスタ
112,113及び後に説明する同じく124はA/D
変換器のサンプリング周期に同期して、順次データをシ
フトして行うと共に、シフトレジスタの各段のデータを
出力する機能を有する。シフト・レジスタ112と11
3の各段の出力は、ニューラルネットワークの第1層(
入力層)114の各素子115と116等に加えられる
入力層の各素子115,116等の出力は第2層117
の各素子118に式(2) 、 (3)の関係で結合さ
れている。第2層117の各素子118と第3層119
の各素子120、第2層119の各素子120と第4層
(出力層)121の各素子122の間も同様である。各
素子の間を信号が式(2) 、 (3)の関係に従って
処理されて行くと、出力層121の出力端子123等よ
りS/Nの改善された信号128が出力される。この内
の任意の1つの端子の出力を外部出力として取り出せば
S/Nの改善された音声信号209 (第2図参照)が
得られる。
次に本発明によるフィルタを構成するニューラル・ネッ
トワークの学習手順を説明しよう。
学習には、良く知られているバック・プロパゲーション
法を用いることが出来る、バック・プロパゲーション法
については、例えば公知の文献、エム・アイ・ティ・プ
レス社出版1′パラレル・デイストリビューテッド・プ
ロセッシング第1巻″(1986)、第8章318〜3
62頁(M、 I 。
T 、 Press、 ”Parallel Dist
ributed Processing”vo Q 、
 (1986) 、 chop、8.p、p、318−
362)に詳しく記述されている。
第1図を用いて説明しよう。まず説明の簡単のために、
幾つかの記号を導入する。出力層121の各素子122
の出力値128等を0411.第3層119第j番目の
素子の出力値081J、第2層117の第に番目の素子
の出力値を02.k、また学習入力として、第4層12
1の第1番目の素子に与える目標出力値をTa2とする
。また、バック・プロパゲーションの過程で各素子毎に
求まる誤差信号値についても、第4層121の第1番目
の素子に対してδ1、第3層119の第j番目の素子に
対して63J、第2層117の第に番目の素子に対して
62に等を記すことにする。また、今、説明を簡単にす
るために、各層の各素子の特性は管間−とし、(3)式
で述べた関係で記述されるものとする。また、関係ff
1l−微分したものをf′と記すこととする。出力層1
21の第i番目の素子と第3層119のj番目の素子の
結合係数をωδIJ。
第3層119のj番目の素子と第2層117のに番目の
素子の結合係数をω2Jhと記す。
学習用の各種の音声101と各種の雑音102は、別々
ニマイクロフォン103,104,105に入力される
。マイクロフォン105より入力される信号は目標出力
値T 4 tに用いるものであり、音声信号のみである
。これらの信号は各々メモリ109.110,111 
(第2図のメモリ206中の領域として設定される)に
格納される。格納された入力用の音声と雑音は各々加算
器129と130で加算され、雑音の1乗された信号が
合成され、シフトレジスタ112と113に加えられる
。雑音の1乗の程度や組み合せは、予想される相々な条
件のものを繰り返えし作成し、学習入力として用いられ
る。この1乗の処理は実際には第2図のμCPU205
の演算機能を用いて行なわれる。目標出力値T4Iは、
学習入力と対応する音声信号であり、S/N改善の結果
、学習入力中の音声がこうありたいという音声信号であ
る。目標出力値T41用の入力マイクロフォン105と
A/D変換器108、メモリ111は結線列127が示
すように、マイクロフォン1o3(又は104)A/D
変換器106(又は107)、メモリ109(又は11
0)などのように、入力用の各々の一つと兼用しても良
い。目標出力T A を用の音声はシフト・レジスタ1
24に入力され、シフトレジスタ124の各段の出力1
25等はニューラルネットワークの出力層121の各素
子122等の各目標出力125等として与えられる。
第1層114の各素子に学習用入力(音声と雑音の1乗
されたもの)が入力されると、式(2)及び(3)の関
係により、各素子の出力が入力層から出力層に向は順次
求められて行く。各素子の出力値が求まると、出力層1
21から下の層に向けて順次誤差信号を求めて行く、第
2層と第p+1層との間の結合係数の修正は、第p+1
層における誤差信号と第2層における出力値を用いて行
なう。
ここでは簡単のため、前記結合係数ω3,1.J とω
2.a、hの修正過程についてのみ説明する。以下層数
が増しても、入力層まで同様の処理を繰り返えして行け
ば良い。
結合係数ωUltJ、eJ1にの修正において、第ω 
2 2層117の第に番目の素子の出力値Oz、* *第3
1119の第j番目の素子の出力値Oδ、1.および第
3層119の第j番目の素子の誤差信号値δ8.J、第
4層(出力層)121の第i番目の素子の誤差信号値6
番、1が必要となる。02+ b rOδ、1の値は前
記のように第1層114へ入力を与えることによってフ
ォーワードな計算で求めることが出来る。一方、6番2
8.δ31Jは次式に従って算出することが出来る。
δ3.眞=f′ (Σω2.J+に’02.k)+δ番
、1°ωδ、l、J・・・(5) 次に、(113HI HJ + ω21J1にの修正で
あるが、この修正量をそれぞれΔωg、1.J、Δωz
+ghと記すと、この修正量は次式によって算出するこ
とができる。
Δ ω8,1.J= α ・ δ番、・ 037   
        ・・・(6)Δω2.に、h=α0δ
8i°02.に°(7)ここでαは実験的に収束速度を
調べながら設定してやれば良い、 (6) (7)式を
用いれば、出力層と第3層、第3層と第2層の間の全て
の結合係数の修正が出来る。第2層と入力層の間の結合
係数に関しても、第3層と第2層の間の結合係数の場合
と同じようにすれば良い。
以上により、全ての結合係数が1回修正されたことにな
る。他の入力データと目標値(音声や雑音の異なるもの
や、相互レベル、位相関係の異なるものなど)を与えて
以上の結合係数の修正の過程を行なうということを繰り
返えす、この繰り返えし毎に次式に示す評価値 を求め、これをすべての学習サンプルについて平均する
。その値が予め与えられた閾値より小さくなった段階で
学習が完了したものとして学習を終了すれば良い。
発声者とマイクロフォンの位置が一定の範囲に限定され
る場合は、そのような条件下で学習用音声を入力したり
、また、その状況を想定したマイク間のレベルや位相差
を想定した音声信号を内部で発声すると、S/N改善の
効果は大幅に向上する。発声者の位置にある程度の範囲
を許容したい場合は学習入力音声を、その条件に合う範
囲によることが望ましい。これらの条件は内部生成によ
っても音響工学の原理から当業者にとっては容易に合成
することが出来る(発声者とマイクの距離による音声信
号の到着の遅れ及びレベルの2乗則による減衰を考慮す
れば良い)。
なお、入力信号を複索フーリエ変換等を行ない周波数空
間等の状況でニューラルネットに入力する方式も、もち
ろんありうる。この場合は、入力層は周波数と位相又は
、実数部と虚数部の二次元配列にすれば良い。出力は周
波数領域で出力し、波形領域に逆変換する方式もありう
る。しかし、これらの方式は、空間変換としてのフーリ
エ変換や逆変換の処理を入れる必要があることは言うま
でもない。
〔発明の効果〕
本発明によれば、騒音下の音声のS/Nを改善すること
が出来るので、たとえば、第3図に示すように、 (a)本発明によるフィルタ301を音声M、’Z 識
装置302の市に置くことによりL/、識結果303の
正確度が向上、 また、(b)本発明によるフィルタ:301を音声符号
化装置304の前に置くことにより、符号化音声305
とS/Nの良い聞きやすい音声に符号化が可能となり、
高騒音下での音声通信が可能となるさらに、(c)本発
明によるフィルタ301を一般の各種音声信号分析装置
306の前に置くことにより、高騒音下での音声の変形
(一般に発声者自身が騒音に対抗すべく努力して発声す
るため音声が通常とは異なった発声により作られる)の
観測などが可能となる。
【図面の簡単な説明】
第1図は本発明の一実施例として中心部となるS/N改
善用フィルタの構成と学習を説明のための図、第2図は
、本発明部分を実現する装置を説明する図、第3図は本
発明の詳細な説明するための応用システムの構成例を説
明する図である。 第 口

Claims (1)

  1. 【特許請求の範囲】 1、2以上のマイクロフオンと、前記マイクロフオンか
    らの信号を入力とするニューラルネットワーク・タイプ
    のフィルタとを有することを特徴とする音声信号用前処
    理装置。 2、2以上のマイクロフォンからの信号をデジタル信号
    化する手段が多重型のアナログ・デジタル変換器からな
    ることを特徴とする特許請求の範囲1の音声信号用前処
    理装置。 3、マイクロフオンからの入力信号を複素フーリエ変換
    する手段と、前記フーリエ変換手段の出力を入力とする
    ニューラルネットワークを有することを特徴とする特許
    請求の範囲1又は2の音声信号用前処理方式及び装置。 4、ニューラル・ネットワークをデジタル・シグナル・
    プロセッサで構成することを特徴とする特許請求の範囲
    第1、第2又は第3項の音声信号用前処理装置。 5、ニューラル・ネットワークの結合係数を学習させる
    ための学習入力を一端内部メモリに格納した後、オフラ
    インで学習を行なうことを特徴とする特許請求の範囲第
    1、第2又は第3項のニューラルネットワーク学習方法
    。 6、前記学習用入力は、音声信号と雑音信号を別別に入
    力し、内部にて両者を組み合せ、雑音付加された学習用
    信号を生成する手段を有することを特徴とする特許請求
    の範囲第5項のニューラルネットワーク学習方法。 7、前記学習用入力信号を入力するマイクロフォン及び
    又はアナログ・デジタル変換手段が、S/N改善フィル
    タとして動作する際の信号入力用マイクロフォン及び又
    はアナログ・デジタル変換手段を兼ねることを特徴とす
    る特許請求の範囲第5又は第6項のニューラルネットワ
    ーク学習方法。 8、複数個のマイクロフォンへの音声信号の到着時間及
    び又はレベルを固定または可変に制御した学習用入力信
    号を用いることを特徴とする特許請求の範囲第5項又は
    第6項のニューラルネットワーク学習方法。 9、複数個のマイクロフオンへの雑音信号の種類、到着
    時間及び又はレベルを学習用音声に対し固定又は可変に
    制御した学習用入力信号を用いることを特徴とする特許
    請求の範囲第5項又は第6項のニューラルネットワーク
    学習方法。
JP22230988A 1988-09-07 1988-09-07 音声信号用前処理装置 Pending JPH0272398A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP22230988A JPH0272398A (ja) 1988-09-07 1988-09-07 音声信号用前処理装置
DE19893929481 DE3929481A1 (de) 1988-09-07 1989-09-05 Verfahren und vorrichtung zur vorbearbeitung von sprachsignalen

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP22230988A JPH0272398A (ja) 1988-09-07 1988-09-07 音声信号用前処理装置

Publications (1)

Publication Number Publication Date
JPH0272398A true JPH0272398A (ja) 1990-03-12

Family

ID=16780341

Family Applications (1)

Application Number Title Priority Date Filing Date
JP22230988A Pending JPH0272398A (ja) 1988-09-07 1988-09-07 音声信号用前処理装置

Country Status (2)

Country Link
JP (1) JPH0272398A (ja)
DE (1) DE3929481A1 (ja)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03273722A (ja) * 1989-11-28 1991-12-04 Nec Corp 音声・モデム信号識別回路
JPH0462599A (ja) * 1990-07-02 1992-02-27 N T T Data Tsushin Kk 雑音除去装置
JPH04295894A (ja) * 1991-03-26 1992-10-20 Sanyo Electric Co Ltd 神経回路網モデルによる音声認識方法
WO1993020552A1 (en) * 1992-03-30 1993-10-14 Seiko Epson Corporation Speech recognition apparatus using neural network, and learning method therefor
US5754661A (en) * 1994-11-10 1998-05-19 Siemens Audiologische Technik Gmbh Programmable hearing aid
US5787393A (en) * 1992-03-30 1998-07-28 Seiko Epson Corporation Speech recognition apparatus using neural network, and learning method therefor
US5960391A (en) * 1995-12-13 1999-09-28 Denso Corporation Signal extraction system, system and method for speech restoration, learning method for neural network model, constructing method of neural network model, and signal processing system
US6151592A (en) * 1995-06-07 2000-11-21 Seiko Epson Corporation Recognition apparatus using neural network, and learning method therefor
JP2020527248A (ja) * 2018-05-28 2020-09-03 平安科技(深▲せん▼)有限公司Ping An Technology (Shenzhen) Co.,Ltd. 話者分離モデルの訓練方法、両話者の分離方法及び関連設備

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE4243831A1 (de) * 1992-12-23 1994-06-30 Daimler Benz Ag Verfahren zur Laufzeitschätzung an gestörten Sprachkanälen
DE19844748A1 (de) * 1998-09-29 1999-10-07 Siemens Audiologische Technik Verfahren zum Bereitstellen einer Richtmikrofoncharakteristik und Hörgerät
DE19943875A1 (de) * 1999-09-14 2001-03-15 Thomson Brandt Gmbh System zur Sprachsteuerung mit einem Mikrofonarray
US6738481B2 (en) 2001-01-10 2004-05-18 Ericsson Inc. Noise reduction apparatus and method

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ATE45831T1 (de) * 1983-05-18 1989-09-15 Speech Systems Inc Spracherkennungssystem.

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03273722A (ja) * 1989-11-28 1991-12-04 Nec Corp 音声・モデム信号識別回路
JPH0462599A (ja) * 1990-07-02 1992-02-27 N T T Data Tsushin Kk 雑音除去装置
JPH04295894A (ja) * 1991-03-26 1992-10-20 Sanyo Electric Co Ltd 神経回路網モデルによる音声認識方法
WO1993020552A1 (en) * 1992-03-30 1993-10-14 Seiko Epson Corporation Speech recognition apparatus using neural network, and learning method therefor
US5787393A (en) * 1992-03-30 1998-07-28 Seiko Epson Corporation Speech recognition apparatus using neural network, and learning method therefor
US5809461A (en) * 1992-03-30 1998-09-15 Seiko Epson Corporation Speech recognition apparatus using neural network and learning method therefor
US5754661A (en) * 1994-11-10 1998-05-19 Siemens Audiologische Technik Gmbh Programmable hearing aid
US6151592A (en) * 1995-06-07 2000-11-21 Seiko Epson Corporation Recognition apparatus using neural network, and learning method therefor
US5960391A (en) * 1995-12-13 1999-09-28 Denso Corporation Signal extraction system, system and method for speech restoration, learning method for neural network model, constructing method of neural network model, and signal processing system
JP2020527248A (ja) * 2018-05-28 2020-09-03 平安科技(深▲せん▼)有限公司Ping An Technology (Shenzhen) Co.,Ltd. 話者分離モデルの訓練方法、両話者の分離方法及び関連設備
US11158324B2 (en) 2018-05-28 2021-10-26 Ping An Technology (Shenzhen) Co., Ltd. Speaker separation model training method, two-speaker separation method and computing device

Also Published As

Publication number Publication date
DE3929481C2 (ja) 1991-07-04
DE3929481A1 (de) 1990-03-15

Similar Documents

Publication Publication Date Title
CN111292759B (zh) 一种基于神经网络的立体声回声消除方法及系统
CN111161751A (zh) 复杂场景下的分布式麦克风拾音系统及方法
JP3654470B2 (ja) サブバンド多チャネル音声通信会議用反響消去方法
CN100477704C (zh) 用于与自适应波束形成组合的回声抵消的方法和设备
US7995767B2 (en) Sound signal processing method and apparatus
US8184801B1 (en) Acoustic echo cancellation for time-varying microphone array beamsteering systems
CN100534221C (zh) 用于使用过采样滤波器组处理定向音频信号的方法和系统
JP4455614B2 (ja) 音響信号処理方法及び装置
JPH0272398A (ja) 音声信号用前処理装置
JPH02160298A (ja) 雑音除去方法、それに用いるニューラルネットワークの学習方法
JP2011124872A (ja) 音源分離装置、方法及びプログラム
CN108449687A (zh) 一种多麦克风阵列降噪的会议系统
Zhang et al. Neural cascade architecture for multi-channel acoustic echo suppression
KR20010002997A (ko) 신경회로망을 이용한 선택적 주의집중 방법
KR102316626B1 (ko) 병렬 구조의 심화신경망을 이용한 잡음 및 에코 신호 통합 제거 방법 및 장치
US5745874A (en) Preprocessor for automatic speech recognition system
Simmer et al. Suppression of coherent and incoherent noise using a microphone array
JPH05232986A (ja) 音声信号用前処理方法
Tamura et al. Improvements to the noise reduction neural network
JP3756828B2 (ja) 反響消去方法、この方法を実施する装置、プログラムおよびその記録媒体
KR102471709B1 (ko) 다자간 화상 회의 또는 화상 교육을 위한 노이즈 및 에코 제거 시스템과 그 방법
KR102374167B1 (ko) 어텐션 메커니즘을 이용한 음성 신호 추정 방법 및 장치
JPH0462599A (ja) 雑音除去装置
CN113409810B (zh) 一种联合去混响的回声消除方法
Zhang et al. Neural Multi-Channel and Multi-Microphone Acoustic Echo Cancellation