JPH02160298A

JPH02160298A - 雑音除去方法、それに用いるニューラルネットワークの学習方法

Info

Publication number: JPH02160298A
Application number: JP63313859A
Authority: JP
Inventors: Toshiyuki Aritsuka; 俊之在塚; Akio Amano; 天野　明雄; Nobuo Hataoka; 畑岡　信夫; Hiroshi Ichikawa; 市川　熹
Original assignee: Hitachi Ltd
Current assignee: Hitachi Ltd
Priority date: 1988-12-14
Filing date: 1988-12-14
Publication date: 1990-06-20
Anticipated expiration: 2013-07-16
Also published as: JP2776848B2; CA2005117A1; US5185848A; CA2005117C

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】

【産業上の利用分野１本発明は、音声の伝送、認識等における分析時の雑音除
去方式に関する。（従来の技術１従来の雑音除去方式には、接話マイク法、サブストラク
ション法、複数マイク法、フィルタリング法等が提案さ
れている。このうち接話マイク法は、マイクの指向性を
利用するものである。サブストラクション法は、予め雑
音のみを登録しておき、雑音重畳信号から差し引くこと
による。複数マイク法は、マイク位置による位相差等を
利用するものである。フィルタリング法は、信号と雑音
の帯域が異なる場合にフィルタリングによって信号のみ
を取り出すものである。一方、田村震−，アレックス・ワイベル：　「ニューラ
ル　ネットワークを使った波形入出力による雑音抑圧」
（信学技報Ｖｏ１．８７　、　Ｎｏ、３５１　。ｐｐ、３３−３７．１９８８年１月）記載のように、雑
音を含む音声波形を入力とし、雑音を除去した音声を出
力とするように、ニューラルネットワークを学習させる
ものも提案されている。【発明が解決しようとする課題】上記従来技術のうち、接話マイク法は、接話マイクを装
着する必要があり、使い勝手に問題があった。またサブ
ストラクション法、フィルタリング法は、雑音の性質が
既知であるときにのみ有効であるという問題があった。さらに複数マイク法はマイクを複数個必要とするため、
設置方法に問題があった。一方、ニューラルネットワークを用いて雑音を除去する
方法は、音韻性の劣化を伴うという問題があった。本発明は、信号の伝送または認識を行う際に、−殻内な
捕音装置を用いて入力した信号から、雑音を、性質によ
らずかつ音韻性の劣化を伴うことなく除去し、信号のＳ
／Ｎを改善することを目的としており、また伝送または
認識の前処理を高速に行う手段を提供することを目的と
する。

【課題を解決するための手段１上記目的を達成するために、雑音を含む信号を自己相関係数などの特徴ベクトル（特
徴量の組）に変換する分析部と、これを入力とし、該当
するクラスタを代表する、雑音を含まない信号を変換し
た特徴ベクトルに対応する、代表ベクトルのインデクス
を出力とする。ニューラルネットワークを用いたもので
ある。なお、上記ニューラルネットワークを学習させる目的で
、まず代表的な雑音と、雑音を含まない信号を予め用意
し、次に雑音を含まない信号を変換した特徴ベクトルに
対してクラスタリングを行い、そのクラスタを代表する
代表ベクトルを選択しコードブックを作成する。そして
、このコードブックから、上記特徴ベクトルの該当する
最適なクラスタを代表する代表ベクトルのインデクスを
得てこれを教師データとし、また雑音と、雑音を含まな
い信号を重畳し、これを変換した特徴ベクトルを学習デ
ータとして、ニューラルネットワークを学習させる方式
を用いたものである。また、上記雑音除去方式を伝送に利用する場合には、受
信側の合成部において、合成に適した特徴ベクトルを代
表ベクトルに持つコードブックを、別途用いる。【作用】ニューラルネットワークの写像機能を利用して、雑音を
含む信号を変換した特徴ベクトルを、該当する最適なク
ラスタを代表する、雑音を含まない信号の特徴ベクトル
に対応する１代表ベクトルのインデクスに写像すること
によりＳ／Ｎを改善し、かつ高速にコード化を行う。また、雑音重畳信号を特徴ベクトルに変換した後、その
中から雑音の影響の小さい特徴量を選んで、ニューラル
ネットワークの入力ベクトルとすることにより、写像の
性能を向上させ、Ｓ／Ｎを改善することができる。例え
ば、特徴ベクトルとして自己相関係数を選択した場合、
雑音の影響はパワーを表す零次の係数に集中する。そこ
でこの零次の係数を除いた残りの係数を正規化し、ニュ
ーラルネットワークの入力とすることでＳ／Ｎを改善す
る。またこのとき、残りの係数のうちの最大値をもって
擬似パワーとし、これを別途合成部等に送ることでパワ
ー情報を回復する。さらに、上記雑音除去方式を伝送に用いる場合には、受
信側のコードブックとして、各クラスタの代表ベクトル
が１合成に適した特徴ベクトルに対応するように学習さ
せたものを用いることにより１合成処理の高速化を行う
ことができる。【実施例１以下１本発明の実施例を第１図〜第７図により説明する
。第１図は、前処理部に本雑音除去方式を用いてＳ／Ｎ改
善を行う符号化方式の、一実施例の構成を表すブロック
図である。以下、各動作について説明する。まず、入力
された雑音を含む音声信号は、分析部１０１において公
知の分析手段によって自己相関係数ｖ０〜ｖ　ｎ１０２
に変換される。次に、雑音の影響の大きい零次の係数ｖ
０を除いたＶ□〜Ｖｎから、最大値検出部１０３によっ
て最大値ＶｍａＸ１０４を擬似パワーとして検出し、正
規化部１０５によって正規化する。正規化された自己相
関係数Ｖ工′〜Ｖ　ｎ　’　１０６は、第２図に示すよ
うに、入力層、中間層および出力層のユニット間を重み
つきで結合させた、階層構造を持つニューラルネットワ
ーク１０７に入力され、ニューラルネットワーク１０７
は、該当する最適なクラスタを代表する代表ベクトルの
インデクス１０８を出力する。ただし上記ニューラルネ
ットワークは後述する方法等によって予め学習させてお
くものとする。出力されたインデクス１０８は、最大値
検出部によって検出された上記自己相関係数の最大値Ｖ
、□１０４と共に、送信部１０９より伝送路１１０を通
り受信部１１１に伝送される。受信されたインデクス１１２は、ベクトル選択部１１３
へ入力され、ベクトル選択部１１３は、上記インデクス
１１２に対応する代表ベクトルをコードブック１１４か
ら選択し、出力する。このときコードブック１１４は、
アイ・イー・イー・イー、トランザクションズ　オン　
コミュニケーションズ、ボリューム　シーオーエム−２
８、ナンバー１．１９８０年　（丁Ｅ［！Ｅ　　ＴＲＡ
ＮＳＡＣＴＩＱＮＳ　　ＯＮ　　ＣＯＭＭＵＮＩＣＡＴ
ＩＯＮＳ。ＶＯＬ、Ｃ０Ｍ−２８，Ｎｏ、１．　ＪＡＮＵＡＲＹ　
１９８０．　ｐｐ、８４−９５）記載のコードブック生
成法等によって、各クラスタの代表ベクトルが偏自己相
関係数に０〜ｋ　ｎ１１５に対応するように学習してい
るものとする０合成部１１６では、上記偏自己相関係数
に４〜ｋ　、１１５と、伝送された擬似パワーＶｍａｘ
ｌ１７によって音声信号を合成し出力する。第３図（ａ）は、ニューラルネットワークを構成するニ
ューロンのモデルの例である。入力ｘ２〜Ｘｎは、それ
ぞれ重みＷ工〜Ｗｎをかけた荷重和の形でニューロンに
入力される。二ニーロンは、入力に対しある関数ｆ（・
）によって出力ｙを規定する。すなわち、ｙ＝ｆ（ΣＷ　ｔ　Ｘ　＋十〇）となる。ただし、θはオフセットである。（ｂ）、（ｃ
）、（ｄ）に関数ｆ（・）の例を示す。第４図は、第２図に示すように、入力層、中間層および
出力層のユニット間を重みつきで結合させた、階層構造
を持つニューラルネットワークを、上述した雑音除去の
目的を実現する性質を持つように学習させる。ニューラ
ルネットワーク学習方式の流れ図である。アルゴリズム
を以下に示す。五還ヱ１：適用範囲を代表する雑音を含まない信号を選び入力する
。五上ｌλ：適用環境を代表する雑音を選び入力する。互遵上ｙ：すべての信号データを、偏自己相関係数に変換する。 −ｊ遵すＡ−：偏自己相関係数に対し、上記コードブック生成法等によ
って、クラスタリングを行いコードブックを生成する。５遵１１：信号データと雑音データを、すべての組み合わせについ
て重畳し、これを自己相関係数に変換する。５ｙ１乱：すべての偏自己相関係数に対し、コードブックより、該
当する最適なクラスタを代表する代表ベクトルに対応す
るインデクスを選択する。盈遵１Ｌ：同じ信号から得た自己相関係数とインデクスをそれぞれ
学習データ、教師データとする学習セットを、すべての
信号および雑音に対し作り、これらをニューラルネット
ワークに与え、ニューラルネットワークを学習させる。５ぶ１炙：学習結果が収束するまで５ｔｅｐ　　７を繰り返す。第５図は、第２図に示すように、入力層、中間層および
出力層のユニット間を重みつきで結合させた、階層構造
を持つニューラルネットワークを。上述した雑音除去の目的を実現する性質を持つように学
習させる、ニューラルネットワーク学習方式の構成図で
ある。まず、適用範囲を代表する雑音を含まない音声を入力し
、第１のスイッチ５０２によりＡ／Ｄ変換器５０２を通
した後、第２のスイッチ５０３により第１のメモリ５０
４に格納する。また、適用環境を代表する雑音を入力し、第１のスイッ
チ５０１によりＡ／Ｄ変換器５０２を通した後、第２の
スイッチ５０３により第２のメモリ５０５に格納する。次に、信号重畳部５０６において、第１のメモリ５０４
より取り出した音声データと、第２のメモリ５０５から
取り出した雑音データを重畳し、雑音重畳音声を、第３
のスイッチ５０７により分析部５０８に入力し、分析部
５０８において自己相関係数ｖ０〜ｖ、５０９に変換す
る。自己相関係数のうち、雑音の影響の大きい零次の係
数Ｖ。を除いたｖ１〜Ｖｎから、最大値検出部５１０に
よって最大値Ｖ　＋ａａｘ５１１を擬似パワーとして検
出し、また、正規化部５１２によって正規化する。正規
化された自己相関係数、／〜ｖｎ’５１３を、ニューラ
ルネットワーク学習部５１４において、第２図に示す階
層構造を持つニューラルネットワーク５１５の学習デー
タとする。また、第１のメモリ５０４から第３のスイッチ５０７に
より取り出した音声データを、分析部５０８において自
己相関係数ｕ０〜ｕ　、５１６に変換する。偏自己相関
係数抽出部５１７は＋　ｕＱ〜ｕ　ｎ５ｔｓを合成に適
した偏自己相関係数に工〜ｋ　、５１８に変換する。イ
ｆンデクス生成部５１９は、ｋ工〜ｋ　ｎ５１８の該当
する最適なクラスタを代表する代表ベクトルを、コード
ブック５２０から選択し、そのインデクス５２１を生成
する。ただしコードブック５２０は、上記コードブック
生成法等によって、各クラスタの代表ベクトルが偏自己
相関係数に１〜ｋ　ｎ５１ｇに対応するように予め学習
しているものとする。インデクス５２１は、レジスタ５
２２を介してニューラルネットワーク学習部５１４に入
力され、ニューラルネットワーク５１５を学習させるた
めの教師データに用いられる。ニューラルネットワーク学習部５１４は、上記学習デー
タと教師データを、同じ音声データによるもの同志がセ
ットとなるタイミングでニューラルネットワーク５１５
に与え、これを学習させる。ところで上記実施例では、ニユーラルネツトワーりとし
て、階層型構造を持つものを用いているが、入力と出力
の関係を満たしているものであればよいため、例えば、
ホップフィールド型や、ボルツマンマシン型構造を持つ
ニューラルネットワークを用いても、同様の機能を実現
できることは明らかである。　また、ニューラルネット
ワークへの入力数が多い場合には、ニューラルネットワ
ークの規模を抑えるために、第６図に示すような多段型
ニューラルネットワークの構成を用いることができる６
第６図は、２段、４ニユーラルネツトワークからなる多
段型ニューラルネットワークの例である。入力ベクトル
は３つに分けられそれぞれニューラルネットワーク６０
１．６０２．６０３に入力される。各ニューラルネット
ワークの出力は、次段のニューラルネットワーク６０４
の入力となる。第７図は１本雑音除去方式を前処理に用いた、音声認識
のブロック図であり１本雑音除去方式による雑音除去部
７０１において、音声信号から雑音を除去し、コードに
変換した特徴量を、認識部７０２において認識する。【発明の効果１本発明によれば、雑音を含む信号の特徴ベクトルから、
該当する最適なクラスタを代表する、雑音を含まない代
表ベクトルのインデクスを得る目的で、ニューラルネッ
トワークを用いることにより、雑音の除去が行える。し
かも、特徴ベクトルの該当する最適なクラスタを代表す
る代表ベクトルを、最小歪の計算等により検索する必要
がなくなり、単純な積和演算のみでインデクスを得るこ
とができるため、処理を高速に行えるという効果を持つ
。また、雑音の影響の小さい特徴量のみを用いることによ
って雑音の影響を軽減することができる。例えば、特徴ベクトルとして自己相関係数を用いた場合
、雑音の影響の大きいパワーを表す零次の係数を除いた
、残りの係数のみを用いる。このとき、残りの係数の最
大値をもって擬似パワーとすることで、パワー情報を回
復する。一方、ニューラルネットワークは、学習時の入力を正規
化することによって、収束を早めることができる場合が
ある。特徴ベクトルを正規化する正規化部を設けること
により、そのような学習を行ったニューラルネットワー
クを用いることができるようになる。さらに、合成側のコードブックとして、各クラスタの代
表ベクトルが、合成に適した特徴ベクトルとなるように
学習させたものを用いることにより、特徴ベクトル間の
変換にかかる時間を節約でき、処理の高速化が望める。例えば、自己相関係数を分析部の出力とすることで、雑
音の影響を零次の項に集中させ１合成部では、合成に適
した偏自己相関係数を用いる場合、上記ニューラルネッ
トワークを学習させる過程で、偏自己相関係数を各クラ
スタの代表ベクトルとするコードブックを用いれば、こ
れを合成側のコードブックとすることができ、あらたに
コードブック生成を行う必要がなくなる。また、上記ニ
ューラルネットワークを学習させる過程で、自己相関係
数を代表ベクトルとするコードブックを用いている場合
でも、これを偏自己相関係数に変換することは容易であ
り、従って、これにより簡単に合成側のコードブックを
作成することができる。

【図面の簡単な説明】

第１図は、前処理部に本雑音除去方式を用いてＳ／Ｎ改
善を行う符号化方式の、一実施例の構成を表すブロック
図、第２図は、階層構造を持つニューラルネットワーク
の例を示す図、第３図は、ニューラルネットワークを構
成するニューロンのモデルの例を示す図、第４図は、第
２図に示したような構造を持つニューラルネットワーク
を学習させる。ニューラルネットワーク学習方式の流れ
図、第５図は、第２図に示したような構造を持つニュー
ラルネットワークを学習させる、ニューラルネットワー
ク学習方式の構成図、第６図は、２段、４ニユーラルネ
ツトワークからなる多段型ニューラルネットワークの例
を示す図、第７図は、本雑音除去方式を前処理に用いた
、音声認識のブロック図である。符号の説明１０１・・・分析部、１０３・・・最大値検出部、１０
５・・・正規化部、１０７・・・ニューラルネットワー
ク、１１３・・・ベクトル選択部、１１４・・・コード
ブック、１１６・・・合成部、５０２・・・Ａ／Ｄ変換
器、５０４・・・第１のメモリ、５０５・・・第２のメ
モリ、５０６・・・信号重畳部、５０８・・・分析部、
５１０・・・最大値検出部、５１２・・・正規化部、５
１４・・・ニューラルネットワーク学習部、５１５・・
・ニューラルネットワーク、５１７・・・偏自己相関係
数抽出部、５１９・・・インデクス生成部、５２０・・
・コードブック、６０１、６０２．６０３．６０４・・
・ニューラルネットワーク、７０１・・雑音除去部、７
０２・・・認識部子２目 ↑　　−一、−−シ　　１人力層　　　丁関屑　　　ムアｋ（ｂ）　　　　　　　（Ｃ）　　　　　　　ばフ第４図

Claims

【特許請求の範囲】１、分析部とニューラルネットワークとよりなり、上記
分析部は、信号を特徴ベクトル（特徴量の組）に変換し
、上記ニューラルネットワークは、上記特徴ベクトルの入
力に対し、該当する最適なクラスタを代表する代表ベク
トルのインデクスを出力することを特徴とする雑音除去
方式。２、分析部が信号を自己相関係数に変換することを特徴
とする請求項１記載の雑音除去方式。３、上記特徴ベクトルのうち雑音の影響の小さい特徴量
のみを入力ベクトルとし、該当する最適なクラスタを代
表する代表ベクトルのインデクスを出力することを特徴
とするニューラルネットワークを有する請求項１および
２記載の雑音除去方式。４、請求項１〜３記載の雑音除去方式において、正規化
部を有し、上記正規化部は、分析部によって変換された
特徴ベクトルの要素の正規化を行うことを特徴とする雑
音除去方式。５、請求項１〜４記載の雑音除去方式において、最大値
検出部を有し、上記最大値検出部は分析部によって変換
された特徴ベクトルの要素の最大値を検出することを特
徴とする雑音除去方式。６、階層構造を持つニューラルネットワークを有する請
求項１〜５記載の雑音除去方式。７、ホップフィールド型構造を持つニューラルネットワ
ークを有する請求項１〜５記載の雑音除去方式。８、ボルツマンマシン型構造を持つニューラルネットワ
ークを有する請求項１〜５記載の雑音除去方式。９、複数個のニューラルネットワークを直列および並列
に配置した、多段型構造を持つニューラルネットワーク
を有する請求項１〜８記載の雑音除去方式。１０、請求項１〜９記載の分析部およびニューラルネッ
トワークに、ベクトル選択部とコードブックと合成部と
を付加することによる分析・合成装置。１１、分析部によって変換された特徴ベクトルと、異な
る特徴ベクトルに対応する代表ベクトルを持つコードブ
ックを有する請求項１０記載の分析・合成装置。１２、信号重畳部と分析部とコードブックとインデクス
生成部とニューラルネットワークとニューラルネットワ
ーク学習部とよりなり、上記信号重畳部は、雑音と雑音を含まない信号とを重畳
し、上記分析部は、雑音を含まない信号、または信号重畳部
で重畳された雑音重畳信号を特徴ベクトルに変換し、上記インデクス生成部は、分析部で変換された雑音を含
まない信号の特徴ベクトルの、該当する最適なクラスタ
を代表する代表ベクトルをコードブックから選択してそ
のインデクスを生成し、上記ニューラルネットワーク学習部は、分析部で変換さ
れた雑音重畳信号の特徴ベクトルを学習データとし、上
記インデクスを教師データとしてニューラルネットワー
クを学習させることを特徴とするニューラルネットワー
ク学習方式。１３、上記雑音重畳信号を変換した特徴ベクトルのうち
、雑音の影響の小さい特徴量からなるベクトルのみを学
習データとする、ニューラルネットワーク学習部を有す
る請求項１２記載のニューラルネットワーク学習方式。１４、請求項１２および１３記載のニューラルネットワ
ーク学習方式において、分析部によって変換された雑音
重畳信号の特徴ベクトルの要素を正規化する、正規化部
を有するニューラルネットワーク学習方式。１５、階層構造を持つニューラルネットワークを学習さ
せる、ニューラルネットワーク学習部を有する請求項１
２〜１４記載のニューラルネットワーク学習方式。