JPH0462599A - 雑音除去装置 - Google Patents

雑音除去装置

Info

Publication number
JPH0462599A
JPH0462599A JP2174928A JP17492890A JPH0462599A JP H0462599 A JPH0462599 A JP H0462599A JP 2174928 A JP2174928 A JP 2174928A JP 17492890 A JP17492890 A JP 17492890A JP H0462599 A JPH0462599 A JP H0462599A
Authority
JP
Japan
Prior art keywords
noise
microphone
input
voice
neural network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2174928A
Other languages
English (en)
Inventor
Hajime Miyasaka
宮坂 肇
Noriya Murakami
村上 憲也
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
N T T DATA TSUSHIN KK
NTT Data Group Corp
Original Assignee
N T T DATA TSUSHIN KK
NTT Data Communications Systems Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by N T T DATA TSUSHIN KK, NTT Data Communications Systems Corp filed Critical N T T DATA TSUSHIN KK
Priority to JP2174928A priority Critical patent/JPH0462599A/ja
Publication of JPH0462599A publication Critical patent/JPH0462599A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [産業上の利用分野] 本発明は、機械室、工事現場あるいは車両内等の高雑音
下における音声認識装置の認識性能向上に好適な雑音除
去装置に関し、より詳細には、音声認識装置を用いて、
電話機やマイクロホンから入力される音声を認識する場
合に、雑音と音声が重畳した音声信号から、埋もれた音
声のみを抽出するための雑音除去装置に関する。
〔従来の技術〕
高雑音下で、音声認識装置を動作させようとする場合、
雑音の中から音声だけを抽出し、雑音を抑制しようとす
る試みは、従来から、多方面で行われている。
従来は、信号の取り込み方により二つの方法が利用され
ていた。第一は、1本のマイクロホンを使用する1人力
力式であり、第二は、2本以上のマイクロホンを使用す
る複数入力方式である。前者は、1本のマイクロホンか
ら収録した騒音または周囲雑音を予め分析し、分析の結
果得られる雑音のパワーとかスペクトル等の特徴から、
逆フィルタを構成して、これに雑音の重畳した音声信号
を通すことで、雑音を除去し、信号対雑音比(S/N)
を改善しようとするものである。
また、後者の複数入力方式は、音声入力用と1本以上の
参照用マイクロホンを用いて、各方面から入力される雑
音・音声のそれぞれの特徴を位相を含めて分析し、特徴
の顕著な入力を取り出すものである。なお、これに関し
ては、例えば、黒ノ等による昭和62年電子情報通信学
会情報・システム部門全国大会資料、pp、l−156
r帯域分割法による周波数領域でのノイズキャンセルの
一方法」の記載を参考にすることができる。
〔発明が解決しようとする課題〕
しかし、これらの方法は、いずれも、音響分析の後、得
られた特徴パラメータ上で行うものであり、マイクロホ
ン入力から得られた生の音声波形の状態で雑音を除去す
るものではなかった。そのため、これらの方法は、既知
雑音に対してはある程度の雑音除去効果があるものの、
未知雑音に対しては効果を有しないものであった。
すなわち、上記従来技術では、入力される雑音が予め既
知の場合でなければ効果がなく、また、予定していた雑
音と異なる雑音が入力された場合には、雑音除去そのも
のが正しく行われず、過小推定の場合には雑音が残って
しまい、過大推定の場合には音声部分も一緒に除去され
てしまうという問題があった。
更に、多数のマイクロホンを使用する場合は、装置規模
が大がかりとなり、経済的に実現することが困難になる
という問題もあった。
本発明は上記事情に鑑みてなされたもので、その目的と
するところは、従来の技術における上述の如き問題を解
消し、装置規模をあまり大きくすることなしに、未知雑
音にも対処し得るようにした雑音除去装置を提供するこ
とにある。
〔課題を解決するための手段〕
本発明の上記目的は、発声者の口に近い位置に配置され
た第一のマイクロホンおよび該第一のマイクロホンより
は発声者から離れた位置に配置された第二のマイクロホ
ン、UJ記二つのマイクロホンの出力をそれぞれ同時に
ディジタル信号への変換を行う A/D変換部を有する
音声認識装置において、希望する出力値と実際の出力値
との誤差に基づいて、入力層と一つ以上の中間層および
出力層の間の結合の重みを変化させるアルゴリズムによ
り、希望する出力値が得られるように学習する学習型ニ
ューラルネットを設けて、該学習型ニューラルネットの
、二つの入力端子を設けたニューロンを有する入力層に
、同時刻の前記二つのAID変換部の出力を与える如く
構成したことを特徴とする音声認識装置の雑音除去装置
によって達成される。
〔作用〕
本発明に係る雑音除去装置においては、二本のマイクロ
ホンを使用し、発声者の口に近い位置に配置された第一
のマイクロホンと、該第一のマイクロホンよりは発声者
から離れた位置に配置された第二のマイクロホンに、同
時に、同時期の音声信号が入力される。このため、片方
のマイクロホンには音声の信号レベルが高く、雑音の信
号レベルが低く入力される。また、一方のマイクロホン
には高いレベルの雑音が入力され、低いレベルの音声が
入力される。そこで、上述のそれぞれの信号波形から学
習型多層構造のニューラルネットによって音声のみを分
離することが可能である。
[実施例] 以下、本発明の実施例を図面に基づいて詳細に説明する
まず、ニューラルネット全般について説明し、次に、本
発明の特徴である二人力の学習型多層構造のニューラル
ネットについて説明する。
ニューラルネットは、第3図に示す如く、入力層と、一
つ以上の中間層(以下、「隠れ層Jという)および出力
層の、多層構造を有する。上記各層は複数のニューロン
を有し、また、各層間では、相対するすべてのニューロ
ンが接続されている。
今、一つのニューロンiにデータ x4が与えられると
、各々の入力に対する重み値WJと、これらの積和から
閾値θlを加え、出力間数fに通すと、あるニューロン
の入出力関係は、 で与えられる。出力関数fは、微分が可能である非線形
関数が用いられ、シグモイド関数が用いられることが多
い。これを次式に示す。
一方、ニューラルネットの学習は、実際の出力値と希望
する出力値との誤差を減らすように、重み値や閾値を変
化させる教師付きの学習方法を使用する。この方法は、
最適値を求める最急降下法を利用した逆伝播法(BPア
ルゴリズム)が用いられる。
ある時刻pにおける出力層の出力を0□とし、希望する
出力をt□とするとき、両者の誤差は、E、=−Σ(t
FJ  0PJ)’     ”°(3)J となる。学習は、この誤差E、を減少させるように出力
層から入力層に向かって重み値と閾値を変化させて行う
次に、第2図および第3図を用いて、二人力の学習型多
層構造のニューラルネットについて説明する。従来の、
学習型多層構造のニューラルネットにおいて、入力層に
データを与える方法は、第2図(b)に示す如く、各ニ
ューロンに一本の入力端子を設けて、ここにデータを入
力するものであった。また、入力層は、単に入力データ
を受は付けるためのバッファとして使用されることが多
かった・ これに対して、本発明において使用する学習型多層構造
のニューラルネットにおいては、第2図(a)に示す如
く、入力層の各ニューロンに二つの入力端子を設けて、
二つのデータ入力を行う。また、入力層の出力も、前述
の式(1)で示される入出力関係そのものを使用する。
第1図に、本発明の一実施例を示す雑音除去装置の構成
を示す。本装置においては、発声者の口に近い位置に配
置されたマイクロホン2および該マイクロホン2よりは
発声者から離れた位置に配置されたマイクロホンlの、
同形式の二つのマイクロホンを用いる。マイクロホン2
には、音声の信号レベルが高く、雑音の信号レベルが低
く入力される。また、他方のマイクロホンlには、高い
信号レベルの雑音と、低い信号レベルの音声とが入力さ
れる。説明を簡単にするため、以下の説明では、マイク
ロホンlからの入力を「雑音」、マイクロホン2からの
入力を「音声+雑音」とする。
上述の各々のマイクロホンの出力を、対応する二つのA
/D変換器3および4にそれぞれ接続して、標本化、量
子化を行う。ある時刻nに得られた時系列データを、マ
イクロホン2に対応するデータをS (n)+αN(n
)、マイクロホン1に対応するデータをN(n)とする
。ここで、αは、二つのマイクロホンの雑音レベルが異
なるのを補正するための係数である。ここで得られた時
系列データを、前述のニューラルネット(第2図(a)
参照)5に渡す。
ニューラルネット5は、入力層の出力として、前述の式
(1)で示される入出力関係を使用する。
従って、入力層の1番目のニューロンの出力yiは、 y、= f[W、、N(n) +W、t(S(n)+αN(n))−θi]・・・・(
4)となる。各層の出力を入力層から出力層に向かって
計算し、結果として出力層の出力信号を得る。
学習を行う前に、重み値や閾値は初期値として乱数を与
える。この乱数δ(X)は、 1≦δ(X)≦1       ・・・・(5)の条件
で、−様乱数を与える。
最初、入力層に音声データを与えても、出力層からは乱
雑な出力しか出力されない。そこで、前に述べた、逆伝
播法を用いて、希望する出力が得られるように学習を行
う。この学習は、入力層の「音声+雑音」入力端子に音
声信号を与え、他方の端子には「雑音」を与える。また
、教師信号jrJとしては、入力層に与えた雑音の重畳
していない音声信号を与える。
このとき、逆伝播法で、重み値や閾値を変化させ、誤差
が十分小さくなるまで繰り返す。この結果、ニューラル
ネットは、音声信号を記憶し、敏感に反応するようにな
り、逆に、雑音に対しては鈍感になる。この性質から、
雑音の重畳している音声から雑音のみを除去することが
可能になる。
第4図に、各信号の波形の例を示す。図中、11はマイ
クロホンlに入力される「雑音」波形、12はマイクロ
ホン2に入力される「音声+雑音」波形、14は二人力
のニューロンを入力層に持つ学習型ニューラルネット1
3を介して出力される雑音除去後の「音声」波形である
上記実施例によれば、分布した雑音で劣化した音声を含
む信号から雑音を消去することが可能になり、機械室、
工事現場あるいは車両内等の高雑音下における音声認識
装置の認識性能向上に好適な雑音除去装置を実現するこ
とができる。
なお、上記実施例は本発明の一例を示すものであり、本
発明はこれに限定されるべきものではないことは、言う
までもない。
[発明の効果] 以上、詳細に説明した如く、本発明によれば、二本のマ
イクロホンを使用し、発声者の口に近い位置に配置され
た第一のマイクロホンと、該第一のマイクロホンよりは
発声者から離れた位置に配置された第二のマイクロホン
に、同時に、同時期の音声信号が入力され、片方のマイ
クロホンには音声の信号レベルが高く、雑音の信号レベ
ルが低く入力される。また、一方のマイクロホンには高
いレベルの雑音が入力され、低いレベルの音声が入力さ
れる。そこで、上述のそれぞれの信号波形から学習型多
層構造のニューラルネットによって音声のみを分離する
ことが可能となり、装置規模をあまり大きくすることな
しに、未知雑音にも対処し得るようにした雑音除去装置
を実現できるという顕著な効果を奏するものである。
【図面の簡単な説明】
第1図は本発明の一実施例を示す雑音除去装置の構成を
示す図、第2図は学習型多層構造のニューラルネットの
説明図、第3図はニューラルネットの全般的な説明図、
第4図は実施例の動作を説明する図である。 1.2:マイクロホン、3.4+A/D変換器、5ニユ
ーラルネツトワーク、+1・「雑音」波形の例、12:
「音声+雑音」波形の例、13.二人力のニューロンを
入力層に持つ学習型ニューラルネット、14雑音除去後
の「音声」波形の例。 (a) 第 図 入力1 第 出力 図 入力2

Claims (1)

    【特許請求の範囲】
  1. (1)発声者の口に近い位置に配置された第一のマイク
    ロホンおよび該第一のマイクロホンよりは発声者から離
    れた位置に配置された第二のマイクロホン、前記二つの
    マイクロホンの出力をそれぞれ同時にディジタル信号へ
    の変換を行うA/D変換部を有する音声認識装置におい
    て、希望する出力値と実際の出力値との誤差に基づいて
    、入力層と一つ以上の中間層および出力層の間の結合の
    重みを変化させるアルゴリズムにより、希望する出力値
    が得られるように学習する学習型ニューラルネットを設
    けて、該学習型ニューラルネットの、二つの入力端子を
    設けたニューロンを有する入力層に、同時刻の前記二つ
    のA/D変換部の出力を与える如く構成したことを特徴
    とする音声認識装置の雑音除去装置。
JP2174928A 1990-07-02 1990-07-02 雑音除去装置 Pending JPH0462599A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2174928A JPH0462599A (ja) 1990-07-02 1990-07-02 雑音除去装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2174928A JPH0462599A (ja) 1990-07-02 1990-07-02 雑音除去装置

Publications (1)

Publication Number Publication Date
JPH0462599A true JPH0462599A (ja) 1992-02-27

Family

ID=15987172

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2174928A Pending JPH0462599A (ja) 1990-07-02 1990-07-02 雑音除去装置

Country Status (1)

Country Link
JP (1) JPH0462599A (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10176949A (ja) * 1996-12-10 1998-06-30 Caterpillar Inc ニューラルネットワーク処理振動データ分析を用いる機械部品試験装置および方法
JP2012230160A (ja) * 2011-04-25 2012-11-22 Nippon Telegr & Teleph Corp <Ntt> クリップノイズ検出装置、クリップノイズ検出方法、プログラム
CN105304094A (zh) * 2015-12-08 2016-02-03 南京师范大学 基于神经网络的手机定位方法及定位装置
CN105469785A (zh) * 2015-11-25 2016-04-06 南京师范大学 通信终端双麦克风消噪系统中的语音活动检测方法及装置
CN105847584A (zh) * 2016-05-12 2016-08-10 歌尔声学股份有限公司 一种智能设备识别悄悄话的方法
JP2020197906A (ja) * 2019-06-03 2020-12-10 株式会社東芝 信号処理装置、信号処理システム、信号処理方法、およびプログラム
JP2022088133A (ja) * 2020-12-02 2022-06-14 三菱ロジスネクスト株式会社 荷役車用通知システムおよび当該通知システムを備えた荷役車
JP2022088134A (ja) * 2020-12-02 2022-06-14 三菱ロジスネクスト株式会社 荷役車用運転者認識システムおよび当該認識システムを利用した最適動作モード出力システム

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0272398A (ja) * 1988-09-07 1990-03-12 Hitachi Ltd 音声信号用前処理装置
JPH02253298A (ja) * 1989-03-28 1990-10-12 Sharp Corp 音声通過フィルタ

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0272398A (ja) * 1988-09-07 1990-03-12 Hitachi Ltd 音声信号用前処理装置
JPH02253298A (ja) * 1989-03-28 1990-10-12 Sharp Corp 音声通過フィルタ

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10176949A (ja) * 1996-12-10 1998-06-30 Caterpillar Inc ニューラルネットワーク処理振動データ分析を用いる機械部品試験装置および方法
JP2012230160A (ja) * 2011-04-25 2012-11-22 Nippon Telegr & Teleph Corp <Ntt> クリップノイズ検出装置、クリップノイズ検出方法、プログラム
CN105469785A (zh) * 2015-11-25 2016-04-06 南京师范大学 通信终端双麦克风消噪系统中的语音活动检测方法及装置
CN105469785B (zh) * 2015-11-25 2019-01-18 南京师范大学 通信终端双麦克风消噪系统中的语音活动检测方法及装置
CN105304094A (zh) * 2015-12-08 2016-02-03 南京师范大学 基于神经网络的手机定位方法及定位装置
CN105304094B (zh) * 2015-12-08 2019-03-08 南京师范大学 基于神经网络的手机定位方法及定位装置
CN105847584A (zh) * 2016-05-12 2016-08-10 歌尔声学股份有限公司 一种智能设备识别悄悄话的方法
CN105847584B (zh) * 2016-05-12 2019-03-05 歌尔股份有限公司 一种智能设备识别悄悄话的方法
JP2020197906A (ja) * 2019-06-03 2020-12-10 株式会社東芝 信号処理装置、信号処理システム、信号処理方法、およびプログラム
JP2022088133A (ja) * 2020-12-02 2022-06-14 三菱ロジスネクスト株式会社 荷役車用通知システムおよび当該通知システムを備えた荷役車
JP2022088134A (ja) * 2020-12-02 2022-06-14 三菱ロジスネクスト株式会社 荷役車用運転者認識システムおよび当該認識システムを利用した最適動作モード出力システム

Similar Documents

Publication Publication Date Title
CN109065067B (zh) 一种基于神经网络模型的会议终端语音降噪方法
Lin et al. Speech enhancement using multi-stage self-attentive temporal convolutional networks
JPH02160298A (ja) 雑音除去方法、それに用いるニューラルネットワークの学習方法
CN111292759A (zh) 一种基于神经网络的立体声回声消除方法及系统
JP2007526511A (ja) 周波数領域で多重経路多チャネル混合信号のブラインド分離のための方法及びその装置
JPH09252235A (ja) 遅延されかつろ波されたソースのブラインドセパレーションのための方法および装置
JPH03273722A (ja) 音声・モデム信号識別回路
CN113823304A (zh) 语音信号的处理方法、装置、电子设备及可读存储介质
JPH0462599A (ja) 雑音除去装置
Braun et al. Task splitting for dnn-based acoustic echo and noise removal
CN113782044B (zh) 一种语音增强方法及装置
JP3274133B2 (ja) 入力音声の個別単語の認識方法及び装置
CN108962276B (zh) 一种语音分离方法及装置
JPH0272398A (ja) 音声信号用前処理装置
CN113409810B (zh) 一种联合去混响的回声消除方法
CN113035225A (zh) 视觉声纹辅助的语音分离方法及装置
JP3084721B2 (ja) 雑音除去回路
JPH08123486A (ja) 時系列信号フィルタ及びその学習方法
CN115295002A (zh) 一种基于交互性时频注意力机制的单通道语音增强方法
JPH02253298A (ja) 音声通過フィルタ
CN113763978A (zh) 语音信号处理方法、装置、电子设备以及存储介质
JP3765567B2 (ja) 収音装置、収音方法、収音プログラムおよび記録媒体
JPH05232986A (ja) 音声信号用前処理方法
Biradar et al. Implementation of an Active Noise Cancellation Technique using Deep Learning
JP2991752B2 (ja) 音声認識装置