JPH05232986A - 音声信号用前処理方法 - Google Patents

音声信号用前処理方法

Info

Publication number
JPH05232986A
JPH05232986A JP4034737A JP3473792A JPH05232986A JP H05232986 A JPH05232986 A JP H05232986A JP 4034737 A JP4034737 A JP 4034737A JP 3473792 A JP3473792 A JP 3473792A JP H05232986 A JPH05232986 A JP H05232986A
Authority
JP
Japan
Prior art keywords
learning
neural network
signal
noise
coupling coefficient
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP4034737A
Other languages
English (en)
Inventor
Hiroshi Ichikawa
熹 市川
Akio Amano
明雄 天野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP4034737A priority Critical patent/JPH05232986A/ja
Publication of JPH05232986A publication Critical patent/JPH05232986A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【構成】1ないし2以上のマイクロフォン103〜10
5と、このマイクロフォンからの信号ないしその信号を
変換した信号を入力とするニューラルネットワーク・タ
イプのフィルタと、音声区間を検出する手段と、ニュー
ラルネットワークの結合係数を学習するための学習入力
として、マイクロフォンからの信号ないしその信号を変
換した音声及び雑音信号を各々一旦格納しておくための
内部メモリ109〜111とを有し、結合係数の学習に
は、事前学習モードにおける結合係数のデフォルト値を
事前に学習する第一の学習ステップと、利用モードにお
ける利用時に大きく変化する雑音条件に基づいて結合係
数のデフォルト値を修正学習する第二の学習ステップと
をもつように構成する。 【効果】利用時の音声入力の直前の雑音状態に対し短時
間での適応的学習が可能となり、利用時に雑音条件が大
きく変化する場合にも十分にS/N改善の効果を発揮す
る。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は音声処理装置における入
力音声の信号対雑音比(S/N)を改善するための前処
理方法に関する。
【0002】
【従来の技術】従来、音声の信号対雑音比(S/N)を
改善するには、予め雑音の周波数特性を調べ、その成分
を差し引く方法があったが、それらは雑音の定常性を仮
定していた。また、日本音響学会講演論文集3−p−1
3,pp253−254(昭和63年5月)において報
告されているように、ニューラルネットワークを用いた
手法が論じられている。更に、本発明の発明者により考
案された、複数マイクロフォンとニューラルネットワー
クを組み合わせた方法(特開平2−72398号公報)等があ
る。
【0003】
【発明が解決しようとする課題】上記ニューラルネット
ワークを用いた従来技術は、それ迄のサブトラクション
法などの手法に比べ優れたS/N改善性能を示している
が、相当規模の事前学習をしておく必要があるため、雑
音条件が利用時に大きく変化する場合は十分に効果を発
揮する事ができなかった。
【0004】本発明の目的は、ニューラルネットワーク
を用いた従来技術の利点を活かしながら、雑音条件が利
用時に大きく変化する場合にも十分に効果を発揮する方
法の提供にある。
【0005】
【課題を解決するための手段】上記目的を達成するため
に、本発明は少なくとも、事前学習モードと利用モード
とを有し、更に、少なくとも、1ないし2以上のマイク
ロフォンと、前記マイクロフォンからの信号ないしその
信号を変換した信号を入力とするニューラルネットワー
ク・タイプのフィルタと、音声区間を検出する手段と、
前記ニューラルネットワークの結合係数を学習するため
の学習入力として、前記マイクロフォンからの信号ない
しその信号を変換した音声及び雑音信号を各々一旦格納
しておくための内部メモリとを有し、前記ニューラルネ
ットワーク結合係数の学習には、事前学習モードにおけ
るニューラルネットワーク結合係数のデフォルト値を事
前に学習する第一の学習ステップと、利用モードにおけ
る利用時に大きく変化する雑音条件に基づいてニューラ
ルネットワーク結合係数のデフォルト値を修正学習する
第二の学習ステップとを有するように構成した。
【0006】また、事前学習モードにおけるニューラル
ネットワーク結合係数を学習するための学習入力とし
て、前記マイクロフォンからの信号ないしその信号を変
換した音声及び雑音信号を各々内部メモリに一旦格納し
た後、オフラインでニューラルネットワーク結合係数デ
フォルト値を事前に学習するように構成した。
【0007】この事前学習モードにおけるニューラルネ
ットワーク結合係数デフォルト値の事前学習用入力は、
音声信号と雑音信号が別々に入力され、内部で両者を組
合せ、雑音付加された学習用信号を生成する手段を有す
るように構成した。
【0008】更に、利用モードでは、音声区間を検出す
る手段により雑音区間と判定された入力信号を雑音用内
部メモリに取り込み、音声信号は、事前学習モードに於
いて取り込まれ、音声用内部メモリに格納されている音
声を用い、内部で両者を組合せ、雑音付加された修正学
習用信号を生成し、前記ニューラルネットワーク結合係
数デフォルト値を結合係数の初期値として、オンライン
でニューラルネットワーク結合係数デフォルト値を修正
学習するようにニューラルネットワーク結合係数修正学
習方法を構成した。
【0009】
【作用】少なくとも、事前学習モードと利用モードとを
有し、更に、少なくとも、1ないし2以上のマイクロフ
ォンと、前記マイクロフォンからの信号ないしその信号
を変換した信号を入力とするニューラルネットワーク・
タイプのフィルタと、音声区間を検出する手段と、前記
ニューラルネットワークの結合係数を学習するための学
習入力として、前記マイクロフォンからの信号ないしそ
の信号を変換した音声及び雑音信号を各々一旦格納して
おくための内部メモリとを有し、前記ニューラルネット
ワーク結合係数の学習には、事前学習モードにおけるニ
ューラルネットワーク結合係数のデフォルト値を事前に
学習する第一の学習ステップと、利用モードにおける利
用時に大きく変化する雑音条件に基づいてニューラルネ
ットワーク結合係数のデフォルト値を修正学習する第二
の学習ステップとを有するように構成し、事前学習モー
ドにおけるニューラルネットワーク結合係数を学習する
ための学習入力として、音声信号と雑音信号が別々に入
力され、前記マイクロフォンからの信号ないしその信号
を変換した様々な種類の音声及び雑音信号を各々内部メ
モリに一旦格納した後、内部にて両者を様々な組合せと
S/N条件に相当するように組合せ、雑音付加された学
習用信号を生成し、オフラインでニューラルネットワー
ク結合係数デフォルト値を事前に学習するように構成す
ることによって、長時間の処理が必要なニューラルネッ
トワーク結合係数の学習の大部分が事前に行われる。
【0010】また、利用モードでは、音声区間を検出す
る手段により雑音区間と判定された入力信号を雑音用内
部メモリに取り込み、音声信号としては、事前学習モー
ドに於いて取り込まれ、音声用内部メモリに格納されて
いる音声を用い、内部で両者を組合せ、雑音付加された
利用時点での雑音条件での修正学習用信号を生成し、前
記ニューラルネットワーク結合係数デフォルト値を結合
係数の初期値として、オンラインでニューラルネットワ
ーク結合係数デフォルト値を修正学習するようにニュー
ラルネットワーク結合係数修正学習方法を構成した事に
よって、変動している雑音環境を利用時の音声入力の直
前の雑音の状態で適応的に短時間で学習が行われる。
【0011】
【実施例】以下、図を用いて本発明の一実施例を説明す
る。
【0012】図1は本発明の中心となるニューラルネッ
トワークによるS/N改善用のフィルタの構成を説明す
る図、図2は本発明によるフィルタ及び学習用のシステ
ムの説明図である。
【0013】図2において、入力音声信号101及び雑
音102はマイクロフォン群201及び多重型アナログ
/デジタル変換器(A/D)202を経てデジタル化さ
れスイッチS/W203に送られる。学習時にはスイッ
チS/W203は内部バス204を経てマイクロプロセ
ッサ205の制御により、一旦、メモリ206に格納さ
れ、マイクロプロセッサ205中の予め設定された手順
によりニューラルネットワークを学習する。学習された
結果はニューラルネットワークの各素子間の結合の重み
係数として得られる。この重み係数は信号線207を経
て、ニューラルネットワーク型のS/N改善フィルタを
構成するデジタル信号処理プロセッサDSP208に送
られる。デジタル信号処理プロセッサDSP208は重
みが既学習のニューラルネットワーク型のS/N改善フ
ィルタとなる。
【0014】S/N改善フィルタとしてシステムを用い
る場合は、入力音声信号101はマイクロフォン群20
1及び多重型アナログ/デジタル変換器(A/D)20
2を経てデジタル化されスイッチS/W203を経て、
直接、ニューラルネットワーク型のS/N改善フィルタ
を構成するデジタル信号処理プロセッサDSP208に
送られ、S/N改善された出力209が出力される。
【0015】尚、図1は処理の流れを説明しており、図
2との関係は、学習時には図1の各部はマイクロプロセ
ッサ205及びメモリ206の中に仮想的に実現され、
S/N改善フィルタとして動作させる場合にはニューラ
ルネットワーク型S/N改善フィルタの構造がデジタル
信号処理プロセッサDSP208の中に構成される。ま
た、マイクロフォン群201や多重型アナログ/デジタ
ル変換器202がデジタル回線により遠方に設置される
ような構成も当然ありうる。
【0016】以下の説明では、説明を簡単にするために
入力系を二つとするが、1或いは3以上でも同様に構成
できることは言うまでもない。
【0017】以下、先ず図1を用いてS/N改善フィル
タとしての動作を説明し、その後に学習に付いて説明を
行う。
【0018】図1に於いて、第p層の第q番目のニュー
ロン素子の出力をO(p,q),第(p−1)層のr番
目の素子の出力をO(p−1,r),第p層の第q番目
のニューロン素子と第(p−1)層のr番目の素子との
結合係数をw(p−1,q,r)とする。また、各素子
の入力xと出力yの間の特性を、説明を簡単にするため
にみな同じとし(同一である必要はない)(1)式とする
と、(2),(3)式と記述する。
【0019】
【数1】 y=f(x) (1)
【0020】
【数2】 I(p,q)=Σw(p−1,q,r)・O(p−1,r) (2)
【0021】
【数3】 O(p,q)=f(I(p,q)) (3) 上記(2)式が示すように、積和計算が中心であり、本
処理はいわゆるデジタル信号処理プロセッサDSPが得
意とするものが主体となっていることが分かる。本実施
例のニューラルネットワークは、(3)式の特性を持つ
ニューロン素子を多数階層的に接続したものであるが、
特に、この特性のニューラルネットワークに限定するも
のではない。また本実施例では4層のものを示したが、
特に、4層に限定するものでもない。
【0022】雑音102と入力音声信号101が混合し
た入力信号はマイク103及びマイク104を経てアナ
ログ/デジタル変換器106及びアナログ/デジタル変
換器107によりデジタル信号化され、その出力はシフ
トレジスタ112とシフトレジスタ113に各々加えら
れる。シフトレジスタ112とシフトレジスタ113及
び後に説明するシフトレジスタ124はアナログ/デジ
タル変換器のサンプリング周期に同期して、順次、デー
タをシフトすると共に、シフトレジスタの格段のデータ
を出力する機能を有する。シフトレジスタ112とシフ
トレジスタ113の格段の出力はニューラルネットワーク
第一層(入力層)114の入力層素子群115と入力層
素子群116に加えられる。
【0023】入力層素子群115と入力層素子群116
の出力はニューラルネットワーク第二層117の素子群
118に式(2),式(3)の関係で結合されている。
ニューラルネットワーク第二層素子群118とニューラ
ルネットワーク第三層119の素子群120,ニューラ
ルネットワーク第三層119の素子群120とニューラ
ルネットワーク第四層121の素子群122の間も同様
である。かく素子の間を信号が式(2),式(3)の関
係で処理されていくと、ニューラルネットワーク第四層
121(本実施例では出力層に相当)の素子群122か
らの出力端子群123からS/Nの改善された出力信号
サンプル値群128が出力される。出力端子群123の
任意の一つの端子の出力を外部出力として取り出せばS
/Nの改善された音声信号209(図2参照)が得られ
る。
【0024】次に本発明のフィルタを構成するニューラ
ルネットワークの学習手順を説明しよう。
【0025】学習には、良く知られているバックプロパ
ゲーション法を用いることができる。バックプロパゲー
ション法については、例えば、公知の文献、エム・アイ
・テイ・プレス社出版の“パラレル・ディストリビュー
テッド・プロセッシング 第1巻”(1986)第8章
318−362頁(M. I. T. Press, “ParallelDisdri
buted Processing”vol.1(1986),Chap.8,p
p.318−362)に詳しく記述されている。
【0026】説明の簡単化のために幾つかの記号を導入
する。ニューラルネットワーク第四層素子群122の出
力信号サンプル値群128をO(4,i),ニューラル
ネットワーク第三層素子群120の出力値をO(3,
j),ニューラルネットワーク第二層素子群118の出
力値をO(2,k),学習入力としてニューラルネット
ワーク第四層素子群122に与える目標出力サンプル値
群125をT(4,i)とする。バックプロパゲーショ
ンの過程で各素子毎に求まる誤差信号値についても、ニ
ューラルネットワーク第四層素子群122に対してδ
(4,i),ニューラルネットワーク第三層素子群12
0に対してδ(3,j),ニューラルネットワーク第二
層素子群118に対してδ(2,k)等とする。ニュー
ラルネットワーク第四層素子群122のi番目の素子と
ニューラルネットワーク第三層素子群120のj番目の
素子の間の結合係数をw(3,i,j),ニューラルネ
ットワーク第三層素子群120のj番目の素子とニュー
ラルネットワーク第二層素子群118のk番目の素子の
間の結合係数をw(2,j,k)と記す。また、各層の
各素子の特性は皆同一とし(3)式で述べた関係で記述
されるものとする。更に、関係fを微分したものをf′
と記す事とする。
【0027】先ず、事前学習モードにおけるニューラル
ネットワーク結合係数のデフォルト値を事前に学習する
第一の学習ステップについて、図1により説明する。
【0028】学習用の各種の入力音声信号101はマイ
ク105から、各種の雑音102はマイク103とマイ
ク104から別々に入力される。マイク105から入力
される各種の入力音声信号101は目標出力サンプル値
群T(4,i)125に用いるものであり、音声信号の
みである。マイク105から入力される各種の入力音声
信号101はアナログ/デジタル変換器108でデジタ
ル化されメモリ111に、マイク103とマイク104
から入力される各種の雑音102は各々アナログ/デジ
タル変換器106とアナログ/デジタル変換器107で
デジタル化され、メモリ109とメモリ110(図2の
メモリ206の中の領域として設定される)に格納され
る。
【0029】尚、マイク105とアナログ/デジタル変
換器108はマイク103とアナログ/デジタル変換器
106またはマイク104とアナログ/デジタル変換器
107と兼用しても良い。
【0030】メモリ111に格納された学習用の各種の
入力音声信号101とメモリ109に格納された各種の
雑音102は加算器129で加算され、又同時にメモリ
111に格納された学習用の各種の入力音声信号101と
メモリ110に格納された各種の雑音102は加算器1
30で加算され、各々、学習用入力として用いられる雑
音の重畳した音声信号として合成され、シフトレジスタ
112とシフトレジスタ113に加えられる。この重畳
処理は実際には図2のマイクロプロセッサ205の演算機
能を用いて行われる。
【0031】雑音の重畳の程度(S/N)や組合せは、
予想される様々な条件のものを繰返し作成し、学習用入
力として用いられる。発声者とマイクロフォンの位置関
係が一定の範囲に限定される場合は、そのような条件下
で学習用音声や雑音を入力したり、又、その状況を想定
したマイクロフォン間のレベルや位相差を想定した学習
信号を内部で合成するとS/N改善効果は大幅に向上す
る。発声者の位置にある程度の範囲を許容したい場合
は、学習音声入力をその条件に合うように選定したり内
部で合成することが望ましい。これらの条件は内部で合
成生成によっても音響工学の原理から当業者には容易に
実現できる(発声者とマイクロフォンの距離による音声
信号の到着の遅れによる位相のシフト及びレベルの自乗
則による減衰を考慮すればよい。)。
【0032】目標出力サンプル値群T(4,i)125は
各種の入力音声信号101の中から学習入力として合成
に用いられた対応する入力音声信号であり、S/N改善
の結果として、ありたいと思う学習音声126である。
目標出力サンプル値群T(4,i)125は、学習音声1
26がシフトレジスタ124に入力されたもののシフト
レジスタ124の格段の出力となっており、ニューラル
ネットワーク第四層素子群122の各目標出力値として
与えられる。
【0033】ニューラルネットワーク第一層(入力層)
114の各素子である入力層素子群115と入力層素子
群116に合成された学習用入力が入力されると、
(2)式及び(3)式の関係により、各素子の出力が入
力層から出力層に向け、順次、求められていく。各素子
の出力が求まると、出力層(ニューラルネットワーク第
四層121)からニューラルネットワーク第一層(入力
層)114に向け、順次、誤差信号を求めていく。第p
層と第(p−1)層との間の結合係数の修正は第(p+
1)層における誤差信号と第p層における出力値を用い
て行う。ここでは結合係数w(3,i,j)とw(2,
j,k)の修正過程を説明する。層が増えた場合も以下
同様の処理を入力層まで繰り返せば良い。
【0034】結合係数w(3,i,j)とw(2,j,
k)の修正過程に於いて、ニューラルネットワーク第二
層素子群118のk番目の素子の出力値O(2,k),
ニューラルネットワーク第三層素子群120のj番目の
素子の出力値O(3,j),およびニューラルネットワ
ーク第三層素子群120のj番目の素子の誤差信号値δ
(3,j),ニューラルネットワーク第四層素子群12
2に対してδ(4,i)が必要となる。O(2,k)とO
(3,j)の値は、前述のようにニューラルネットワー
ク第一層(入力層)114の各素子である入力層素子群
115と入力層素子群116に合成された学習用入力を
入力することによりフォワードな計算により求めること
ができる。一方、δ(3,j)とδ(4,i)は次式に
従って算出することができる。
【0035】
【数4】
【0036】
【数5】
【0037】尚、結合係数wの初期値は乱数で与えてお
く。
【0038】次に、結合係数w(3,i,j)とw
(2,j,k)の修正であるが、この修正量をそれぞれ
Δw(3,i,j),Δw(2,j,k)と記すと、こ
の修正量は次式によって算出することができる。
【0039】
【数6】 Δw(3,i,j)=α・δ(4,i)・O(3,j) (6)
【0040】
【数7】 Δw(2,j,k)=α・δ(3,j)・O(2,k) (7) ここでα実験的に収束速度を調べながら設定してやれば
良い。以下同様である。
【0041】以上により、全ての結合係数が1回修正さ
れることになる。雑音の重畳の程度(S/N)や組合せ
を変えた、予想される様々な条件のものを学習用入力と
して作成し、以上の結合係数の修正の過程を行うことを
繰り返す。この繰返し毎に次式に示す評価値
【0042】
【数8】 E=Σ(T(4,i)−O(4,i))2 (8) を求め、これを全ての学習サンプルについて平均する。
この値が予め定めた閾値より小さくなった段階で学習が
完了したものとして事前学習モードを終了すれば良い。
【0043】尚、入力信号を複素フーリェ変換などを行
い、周波数領域などの情報形態でニューラルネットワー
クに入力する方式なども当然ありうる。この場合は入力
層は周波数スペクトル情報と位相スペクトル情報、又は
実部と虚部の二次元配列にすれば良い。出力は周波数領
域の場合は波形領域に逆変換することになる。これらの
方式では領域変換はフーリェ変換とその逆変換の処理等
を挿入する必要があることは言うまでもない。
【0044】次に利用時におけるオンラインの学習に付
いて説明する。
【0045】(4)式から(8)式までの学習手順は事
前学習モードの場合と同じである。各結合係数wの初期
値は事前学習モードで得られている各結合係数値を用い
る。又、学習用の各種の入力音声信号101は事前学習
モードで用いた音声データをそのまま用いて良い。雑音
102のみが利用時にオンラインで取り込まれ、そのま
ま用いられる。このモードでは各種入力音声信号101
とオンラインで取り込まれた雑音102はそのまま組み
合わされ、学習用入力として用いられ、S/N条件の変
更した組合せは行わないので、学習すべきデータの量は
少ない。オンラインで取り込む雑音102は通常の音声
認識装置等で用いられている音声区間検出手順で、音声
とは逆の部分を取り出せば良いから、当業者には容易に
実現可能である。
【0046】各結合係数wの初期値が事前学習モードで
得られている事と、学習すべきデータの量が少ないた
め、学習が完了するための処理量は大幅に少なくなり、
オンラインでの学習が可能となる。
【0047】本実施例により、例えば、図3に示すよう
なシステムでは、(a) 本発明の前処理装置を用いたフ
ィルタ301を音声認識装置302の前に置くことによ
り認識結果303の正解度が向上、(b) 本発明の前処
理装置を用いたフィルタ301を音声符号化装置304
の前に置くことによりS/Nの良い聞きやすい符号化音
声305が得られ、高騒音下での音声通信が可能、(c)
本発明の前処理装置を用いたフィルタ301を一般の
各種音声信号分析装置306の前に置くことにより、高
騒音下での音声の変形(ロンバート効果と呼ばれる。一
般に発声者自身が騒音に対向すべく努力して発声するた
め、音声が普通とは異なった力んだものとなる)の観測
の実現が可能、等の効果が得られる。
【0048】
【発明の効果】本発明によれば、長時間の処理が必要な
ニューラルネットワーク結合係数の学習の大部分が事前
に行われ、変動している雑音環境を利用時の音声入力の
直前の雑音の状態で適応的に短時間での学習が可能とな
り、雑音条件が利用時に大きく変化する場合にも十分に
S/N改善の効果を発揮する方法が提供された。
【図面の簡単な説明】
【図1】本発明の一実施例の中心部となるS/N改善フ
ィルタの構成と学習を説明するための系統図。
【図2】本発明部分を実現する装置の説明図。
【図3】本発明の応用システムの構成例の説明図。
【符号の説明】
101…入力音声信号、102…雑音、103〜105
…マイク、106〜108…アナログ/デジタル変換
器、109〜111…メモリ、112,113,124
…シフトレジスタ、114…ニューラルネットワーク第
一層、115,116…入力層素子群、117…ニュー
ラルネットワーク第二層、118…ニューラルネットワ
ーク第二層素子群、119…ニューラルネットワーク第
三層、120…ニューラルネットワーク第三層素子群、
121…ニューラルネットワーク第四層、122…ニュ
ーラルネットワーク第四層素子群、123…出力端子
群、125…目標出力サンプル値群、126…学習音
声、127…結線。

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】少なくとも、事前学習モードと、利用モー
    ドと、を有し、更に、少なくとも、1ないし2以上のマ
    イクロフォンと、前記マイクロフォンからの信号ないし
    その信号を変換した信号を入力とするニューラルネット
    ワーク・タイプのフィルタと、音声区間を検出する手段
    と、前記ニューラルネットワークの結合係数を学習する
    ための学習入力として、 前記マイクロフォンからの信号ないしその信号を変換し
    た音声及び雑音信号を各々一旦格納しておくための内部
    メモリと、を有し、 前記ニューラルネットワーク結合係数の学習には、事前
    学習モードにおける、ニューラルネットワーク結合係数
    のデフォルト値を事前に学習する第一の学習ステップ
    と、利用モードにおける、利用時に大きく変化する雑音
    条件に基づいてニューラルネットワーク結合係数のデフ
    ォルト値を修正学習する第二の学習ステップとを有する
    ことを特徴とする音声信号用前処理方法。
  2. 【請求項2】請求項1において、事前学習モードにおけ
    るニューラルネットワーク結合係数を学習するための学
    習入力として、前記マイクロフォンからの信号ないしそ
    の信号を変換した音声及び雑音信号を各々内部メモリに
    一旦格納した後、オフラインでニューラルネットワーク
    結合係数デフォルト値を事前に学習するニューラルネッ
    トワーク結合係数デフォルト値学習方法。
  3. 【請求項3】請求項2において、前記事前学習モードに
    おけるニューラルネットワーク結合係数デフォルト値の
    事前学習用入力は、音声信号と雑音信号が別々に入力さ
    れ、内部で両者を組合せ、雑音付加された学習用信号を
    生成する手段を有するニューラルネットワーク結合係数
    デフォルト値学習方法。
  4. 【請求項4】請求項1において、 利用モードの音声区間を検出する手段により雑音区間と
    判定された入力信号を雑音用内部メモリに取り込み、音
    声信号は、事前学習モードに於いて取り込まれ、音声用
    内部メモリに格納されている音声を用い、内部で両者を
    組合せ、雑音付加された修正学習用信号を生成し、前記
    ニューラルネットワーク結合係数デフォルト値を結合係
    数の初期値として、 オンラインでニューラルネットワーク結合係数デフォル
    ト値を修正学習するニューラルネットワーク結合係数修
    正学習方法。
JP4034737A 1992-02-21 1992-02-21 音声信号用前処理方法 Pending JPH05232986A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4034737A JPH05232986A (ja) 1992-02-21 1992-02-21 音声信号用前処理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4034737A JPH05232986A (ja) 1992-02-21 1992-02-21 音声信号用前処理方法

Publications (1)

Publication Number Publication Date
JPH05232986A true JPH05232986A (ja) 1993-09-10

Family

ID=12422635

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4034737A Pending JPH05232986A (ja) 1992-02-21 1992-02-21 音声信号用前処理方法

Country Status (1)

Country Link
JP (1) JPH05232986A (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5960391A (en) * 1995-12-13 1999-09-28 Denso Corporation Signal extraction system, system and method for speech restoration, learning method for neural network model, constructing method of neural network model, and signal processing system
JP2004503001A (ja) * 2000-06-29 2004-01-29 アスペン テクノロジー インコーポレイテッド 経験的プロセスの非線形近似器を制約するコンピュータ装置とその方法
JP2017107141A (ja) * 2015-12-09 2017-06-15 日本電信電話株式会社 音源情報推定装置、音源情報推定方法、およびプログラム
WO2017221412A1 (ja) * 2016-06-24 2017-12-28 オリンパス株式会社 画像処理装置、学習装置、画像処理方法、識別基準の作成方法、学習方法およびプログラム
CN108604452A (zh) * 2016-02-15 2018-09-28 三菱电机株式会社 声音信号增强装置
JP2020034624A (ja) * 2018-08-27 2020-03-05 株式会社東芝 信号生成装置、信号生成システム、信号生成方法およびプログラム
JPWO2019031305A1 (ja) * 2017-08-08 2020-07-02 国立大学法人横浜国立大学 ニューラルネットワークシステム、機械学習方法及びプログラム

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5960391A (en) * 1995-12-13 1999-09-28 Denso Corporation Signal extraction system, system and method for speech restoration, learning method for neural network model, constructing method of neural network model, and signal processing system
JP2004503001A (ja) * 2000-06-29 2004-01-29 アスペン テクノロジー インコーポレイテッド 経験的プロセスの非線形近似器を制約するコンピュータ装置とその方法
JP4918207B2 (ja) * 2000-06-29 2012-04-18 アスペン テクノロジー インコーポレイテッド 経験的プロセスの非線形近似器を制約するコンピュータ装置とその方法
US8296107B2 (en) 2000-06-29 2012-10-23 Aspen Technology, Inc. Computer method and apparatus for constraining a non-linear approximator of an empirical process
JP2017107141A (ja) * 2015-12-09 2017-06-15 日本電信電話株式会社 音源情報推定装置、音源情報推定方法、およびプログラム
CN108604452A (zh) * 2016-02-15 2018-09-28 三菱电机株式会社 声音信号增强装置
US10741195B2 (en) 2016-02-15 2020-08-11 Mitsubishi Electric Corporation Sound signal enhancement device
DE112016006218B4 (de) 2016-02-15 2022-02-10 Mitsubishi Electric Corporation Schallsignal-Verbesserungsvorrichtung
CN108604452B (zh) * 2016-02-15 2022-08-02 三菱电机株式会社 声音信号增强装置
WO2017221412A1 (ja) * 2016-06-24 2017-12-28 オリンパス株式会社 画像処理装置、学習装置、画像処理方法、識別基準の作成方法、学習方法およびプログラム
JPWO2017221412A1 (ja) * 2016-06-24 2019-04-11 オリンパス株式会社 画像処理装置、学習装置、画像処理方法、識別基準の作成方法、学習方法およびプログラム
JPWO2019031305A1 (ja) * 2017-08-08 2020-07-02 国立大学法人横浜国立大学 ニューラルネットワークシステム、機械学習方法及びプログラム
US11604983B2 (en) 2017-08-08 2023-03-14 National University Corporation Yokohama National University Neural network system, machine learning method, and program
JP2020034624A (ja) * 2018-08-27 2020-03-05 株式会社東芝 信号生成装置、信号生成システム、信号生成方法およびプログラム

Similar Documents

Publication Publication Date Title
CN111292759B (zh) 一种基于神经网络的立体声回声消除方法及系统
Wang et al. Multi-microphone complex spectral mapping for utterance-wise and continuous speech separation
US5185848A (en) Noise reduction system using neural network
US10123113B2 (en) Selective audio source enhancement
CN110867181B (zh) 基于scnn和tcnn联合估计的多目标语音增强方法
JP2764277B2 (ja) 音声認識装置
US7995767B2 (en) Sound signal processing method and apparatus
CN101325061A (zh) 用于音频信号处理的方法和装置
CN107039045A (zh) 用于语音增强的全局优化最小二乘后滤波
CN109979476A (zh) 一种语音去混响的方法及装置
CN112904279B (zh) 基于卷积神经网络和子带srp-phat空间谱的声源定位方法
CN109490822A (zh) 基于ResNet的语音DOA估计方法
US11908487B2 (en) Signal processing apparatus and non-transitory computer readable medium
JPH0272398A (ja) 音声信号用前処理装置
Cui et al. Multi-objective based multi-channel speech enhancement with BiLSTM network
Pfeifenberger et al. Deep complex-valued neural beamformers
JPH05232986A (ja) 音声信号用前処理方法
US6799171B1 (en) Applicator and method for combating pests, especially cockroaches
US5745874A (en) Preprocessor for automatic speech recognition system
CN112712818A (zh) 语音增强方法、装置、设备
Tamura et al. Improvements to the noise reduction neural network
CN111883153A (zh) 一种基于麦克风阵列的双端讲话状态检测方法及装置
CN113409810B (zh) 一种联合去混响的回声消除方法
KR102471709B1 (ko) 다자간 화상 회의 또는 화상 교육을 위한 노이즈 및 에코 제거 시스템과 그 방법
CN107393553A (zh) 用于语音活动检测的听觉特征提取方法