JP2020197906A - 信号処理装置、信号処理システム、信号処理方法、およびプログラム - Google Patents

信号処理装置、信号処理システム、信号処理方法、およびプログラム Download PDF

Info

Publication number
JP2020197906A
JP2020197906A JP2019103658A JP2019103658A JP2020197906A JP 2020197906 A JP2020197906 A JP 2020197906A JP 2019103658 A JP2019103658 A JP 2019103658A JP 2019103658 A JP2019103658 A JP 2019103658A JP 2020197906 A JP2020197906 A JP 2020197906A
Authority
JP
Japan
Prior art keywords
signal
signal processing
processing device
restoration
correction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2019103658A
Other languages
English (en)
Other versions
JP7051749B2 (ja
Inventor
典太 笹谷
Tenta Sasaya
典太 笹谷
隆志 渡辺
Takashi Watanabe
隆志 渡辺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2019103658A priority Critical patent/JP7051749B2/ja
Priority to US16/798,534 priority patent/US20200380281A1/en
Publication of JP2020197906A publication Critical patent/JP2020197906A/ja
Application granted granted Critical
Publication of JP7051749B2 publication Critical patent/JP7051749B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/30Noise filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/98Detection or correction of errors, e.g. by rescanning the pattern or by human intervention; Evaluation of the quality of the acquired patterns
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/21Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being power information
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/27Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique
    • G10L25/30Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique using neural networks
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Databases & Information Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Studio Devices (AREA)
  • Image Processing (AREA)

Abstract

【課題】入力信号に含まれる不要成分を抑制する信号処理時に、必要な信号成分が抑制されることを抑制する。【解決手段】第1信号処理装置10は、信号処理部10Bと、第1信号調整部10Cと、誤差算出部10Dと、更新部10Eと、を備える。信号処理部10Bは、第1信号20に第2信号22が重畳された入力信号24に対して、少なくとも1以上のパラメータを用いた第1信号処理を行い、第1信号20を復元した第1復元信号26を出力する。第1信号調整部10Cは、第1信号20および第1復元信号26の少なくとも一方に、重み係数を乗算し、補正第1信号28および補正第1復元信号29を出力する。更新部10Eは、補正第1信号28と補正第1復元信号29との誤差を用いてパラメータを更新する。【選択図】図2

Description

本発明の実施形態は、信号処理装置、信号処理システム、信号処理方法、およびプログラムに関する。
近年、ニューラルネットワークによる、センサ信号(1次元信号や画像)の認識処理には目覚ましい進歩がある。認識処理は、アカデミックな世界に留まらず、自動運転に代表されるような産業応用も進みつつある。しかし、アカデミックな分野で開発された認識処理は、SN比が高い理想的なセンサ信号を対象としていることが多い。このため、産業応用をする場合には、センサ信号に含まれる不要成分(ノイズ等)を抑制する前処理が必要不可欠である。
On least squares and linear combination of observations(A.Aitken,1934)
しかしながら、従来技術では、ノイズ等の不要成分を抑制する信号処理時に、必要な信号成分も抑制される場合があった。
実施形態の信号処理装置は、信号処理部と、第1信号調整部と、更新部と、を備える。第1信号調整部は、第1信号に第2信号が重畳された入力信号に対して、少なくとも1以上のパラメータを用いた第1信号処理を行い、前記第1信号を復元した第1復元信号を出力する。第1信号調整部は、前記第1信号および前記第1復元信号の少なくとも一方に重み係数を乗算し、補正第1信号および補正第1復元信号を出力する。更新部は、前記補正第1信号と前記補正第1復元信号との誤差を用いて前記パラメータを更新する。
第1の実施の形態に係る信号処理システムの模式図。 第1の実施の形態に係る第1信号処理装置の機能的構成のブロック図。 第1の実施の形態に係る第1信号の一例を示す図。 第1の実施の形態に係る第2信号の一例を示す図。 第1の実施の形態に係る信号処理の流れを示すフローチャート。 第2の実施の形態に係る第1信号処理装置の機能的構成のブロック図。 第2の実施の形態に係る信号処理の流れを示すフローチャート。 第3の実施の形態に係る第1信号処理装置の機能的構成を示すブロック図。 第3の実施の形態に係る信号処理の流れを示すフローチャート。 第4の実施の形態に係る第2信号処理装置の機能的構成を示すブロック図。 第4の実施の形態に係る信号処理の流れを示すフローチャート。 第5の実施の形態に係る第2信号処理装置の機能的構成を示すブロック図。 第5の実施の形態に係る特徴情報の抽出の説明図。 第5の実施の形態に係る特徴情報の抽出の説明図。 第5の実施の形態に係る特徴情報の抽出の説明図。 第5の実施の形態に係る特徴情報の抽出の説明図。 第5の実施の形態に係る信号処理の流れを示すフローチャート。 第1の実施の形態から第5の実施形態にかかる信号処理装置のハードウェア構成図。
以下に添付図面を参照して、この発明にかかる信号処理装置、信号処理システム、信号処理方法、およびプログラムの実施の形態を詳細に説明する。
(第1の実施の形態)
図1は、本実施の形態の信号処理システム1の構成の一例を示す模式図である。
信号処理システム1は、第1信号処理装置10と、第2信号処理装置30と、を備える。
第1信号処理装置10と第2信号処理装置30とは、データまたは信号を授受可能に接続可能である。詳細には、第1信号処理装置10と第2信号処理装置30とは、有線通信または無線通信により、データまたは信号を授受可能に接続される。なお、第1信号処理装置10と第2信号処理装置30とは、他の装置や媒体を介して、データまたは信号を授受可能に接続してもよい。例えば、第1信号処理装置10と第2信号処理装置30とは、一方の信号処理装置で記憶媒体に記憶されたデータを、他方の信号処理装置で読取ることで、データを授受可能に接続してもよい。
第1信号処理装置10は、信号処理装置の一例である。第1信号処理装置10は、1以上のパラメータを学習するための信号処理装置である。パラメータは、一次元信号や多次元信号(画素など)などの入力信号から、該入力信号に含まれる第1信号を復元した第1復元信号を生成する時に用いられる。入力信号、第1信号、および第1復元信号の詳細は後述する。
第2信号処理装置30は、信号処理装置の一例である。第2信号処理装置30は、第1復元信号に対して各種の認識処理を実行する信号処理装置である。
認識処理は、例えば、画像の画像分類、画像認識、画像のセグメンテーション、画像のキャプショニング、電気信号、振動などの1次元信号の分類処理、音声の機械翻訳、などである。第2信号処理装置30による認識処理結果は、例えば、入力信号の発生源(例えば、装置の異常箇所)の特定や、入力信号の発生源の動作状況(例えば、異常状況など)の特定に用いられる。
なお、第1信号処理装置10と第2信号処理装置30とは、物理的に異なる装置として構成してもよい。また、第1信号処理装置10と第2信号処理装置30とを一体的に構成してもよい、また、第1信号処理装置10および第2信号処理装置30の少なくとも一方が備える機能を、複数の物理的に異なる装置に分散して備えてもよい。例えば、第1信号処理装置10の機能の少なくとも一部は、クラウド上で処理を実行するクラウドサーバに搭載されていてもよい。
本実施の形態では、第1信号処理装置10について説明する。
図2は、第1信号処理装置10の機能的構成の一例を示すブロック図である。第1信号処理装置10は、合成部10Aと、信号処理部10Bと、第1信号調整部10Cと、誤差算出部10Dと、更新部10Eと、を備える。
合成部10A、信号処理部10B、第1信号調整部10C、誤差算出部10D、および更新部10Eは、例えば、1または複数のプロセッサにより実現される。例えば上記各部は、CPU(Central Processing Unit)などのプロセッサにプログラムを実行させること、すなわちソフトウェアにより実現してもよい。上記各部は、専用のICなどのプロセッサ、すなわちハードウェアにより実現してもよい。上記各部は、ソフトウェアおよびハードウェアを併用して実現してもよい。複数のプロセッサを用いる場合、各プロセッサは、各部のうち1つを実現してもよいし、各部のうち2以上を実現してもよい。
合成部10Aは、第1信号20に第2信号22を重畳し、入力信号24を出力する。
第1信号20および第2信号22は、それぞれ、一次元信号または多次元信号である。一次元信号は、例えば、音響信号、または電気信号などである。多次元信号は、例えば、画像、または音声などの信号である。なお、一次元信号および多次元信号は、これら以外のどのような信号であってもよい。また、第1信号20は、画像または音声を一定区間(フレームなど)で分割した複数の一次元または多次元信号であってもよい。一次元信号および多次元信号は、時系列信号であってもよい。
第1信号20は、第2信号処理装置30で実行される認識処理で用いる必要成分である。第2信号22は、第2信号処理装置30で実行される認識処理では不要な成分である。言い換えると、第2信号22は、入力信号24に含まれる必要成分である第1信号20以外の信号である。例えば、第2信号22は、ノイズ成分である。
本実施の形態では、第1信号20は、第2信号22に比べて疎な信号である。第1信号20が第2信号22に比べて疎な信号であるとは、第2信号22の存在区間に比べて第1信号20の存在区間が短い、または、第1信号20に含まれる信号ピークの値と第1信号20に含まれるノイズ領域の値の平均値との比が、第2信号22に含まれる信号ピークの値と第2信号に含まれるノイズ領域の値の平均値との比よりも大きい、ことを意味する。
図3Aは、第1信号20の一例を示す図である。図3Bは、第2信号22の一例を示す図である。図3Aおよび図3Bに示すように、第2信号22の存在区間S2に比べて第1信号20の存在区間S1が短い。また、第1信号20は、一部の位置(時間的な位置)の値(信号強度)が大きく、その他の位置の値(信号強度)は0または0に近い値である。
一方、第2信号22は、第1信号20に比べて密な信号である。第2信号22に比べて密な信号であるとは、第1信号20の存在区間に比べて22の存在区間が長い、または、信号ピークの間隔が第2信号22より短いことを意味する。
また、第2信号22は、電力(パワー)、振幅、および分散の少なくとも1つが第1信号20より大きい。具体的には、例えば、第2信号22がノイズ成分であると想定する。この場合、第1信号20と第2信号22との合成信号(重畳信号)である入力信号24は、ノイズレベルが高い(すなわち、SN比が小さい)信号であるといえる。
合成部10Aは、第1信号20に第2信号22を重畳させることで、第1信号20と第2信号22との合成信号である入力信号24を生成する。なお、合成部10Aは、公知の方法で、第1信号20と第2信号22とを合成し、入力信号24を生成すればよい。
信号処理部10Bは、入力信号24から、入力信号24に含まれる第1信号20を復元した第1復元信号26を生成する。詳細には、信号処理部10Bは、第1信号20に第2信号22が重畳された入力信号24に対して、少なくとも1以上のパラメータを用いた第1信号処理を行い、第1信号20を復元した第1復元信号26を出力する。
本実施の形態では、信号処理部10Bは、少なくとも1以上のパラメータと入力信号24とに基づいて第1信号処理を実行することで、第1復元信号26を出力する。
第1信号処理は、入力信号24から第1復元信号26を復元する復元処理である。具体的には、第1信号処理は、入力信号24に対する線形変換と非線形変換の組合せによる処理である。具体的には、例えば、第1信号処理は、ニューラルネットワークを用いた信号処理である。この場合、信号処理部10Bは、例えば、畳込み層、活性化関数、Batch Normalizationからなるニューラルネットワークにより第1信号処理を行う。
ニューラルネットワークは、ネットワークパラメータW(重み行列)による線形変換と活性化関数による非線形変換の組み合わせによって、入力信号xから所望の信号yを出力する関数を指す。ネットワークパラメータWは、パラメータの一例であり。言い換えると、ネットワークパラメータWは、第1信号処理がニューラルネットワークである場合の、該ニューラルネットワークのパラメータである。この関数は、下記式(A)によって表さる。
y=F(W,x)・・式(A)
式(A)中、xは入力信号24を示し、yは第1復元信号26を示す。Wは、ネットワークパラメータW(重み行列)を示す。
なお、第1信号処理は、入力信号24から第1復元信号26を復元する復元処理であればよく、ニューラルネットワークを用いた信号処理に限定されない。例えば、第1信号処理は、フィルタを用いた復元処理を含んでもよい。フィルタは、ガウシアンフィルタ、および、メディアンフィルタなどのローパスフィルタなどである。例えば、多次元信号が画像の場合、BM3D(Block Matching and 3D Collaborative Filtering)などのハンドクラフト方式を適用してもよい。
なお、本実施の形態では、信号処理部10Bは、ニューラルネットワークにより第1信号処理を行い、入力信号24から第1復元信号26を復元する場合を一例として説明する。
第1復元信号26は、信号処理部10Bによって入力信号24から復元された第1信号20である。第1復元信号26は、第1信号20と同じ次元、かつ、同じ個数の1次元または多次元信号である。
第1信号調整部10Cは、第1信号20および第1復元信号26の少なくとも一方に、重み係数を乗算し、補正第1信号28および補正第1復元信号29を出力する。
なお、第1信号調整部10Cから出力される信号を、補正第1信号28および補正第1復元信号29と称して説明する。このため、第1信号20に重み係数を乗算し、第1復元信号26に重み係数を乗算しなかった場合、第1信号調整部10Cは、重み係数の乗算された第1信号20である補正第1信号28と、重み係数の乗算されていない第1復元信号26である補正第1復元信号29と、を出力する。同様に、第1信号20に重み係数を乗算せず、第1復元信号26に重み係数を乗算した場合、第1信号調整部10Cは、重み係数の乗算されていない第1信号20である補正第1信号28と、重み係数の乗算された第1復元信号26である補正第1復元信号29と、を出力する。
重み係数は、該第1信号20と該第1復元信号26との誤差を、該入力信号24に含まれる第2信号22の信号強度より大きくするための、重み係数である。言い換えると、重み係数は、信号処理部10Bによる信号処理によって、入力信号24に含まれる第1信号20以外の信号成分である第2信号22と共に、入力信号24に含まれる第1信号20が抑制された第1復元信号26が出力されることを、抑制するための重み係数である。
重み係数は、上記関係を満たす誤差が得られるように、予め設定すればよい。また、重み係数は、ベクトル、および、対角成分に係数が並ぶ行列、の何れであってもよい。
例えば、重み係数が、第1信号20に乗算することで上記関係を満たす誤差を得るための、重み係数であると想定する。この場合、第1信号調整部10Cは、第1信号20に該重み係数を乗算した乗算結果である補正第1信号28と、第1復元信号26である補正第1復元信号29と、を出力する。
また、例えば、重み係数が、第2信号22に乗算することで上記関係を満たす誤差を得るための、重み係数であると想定する。この場合、第1信号調整部10Cは、第1復元信号26に該重み係数を乗算した乗算結果である補正第1復元信号29と、第1信号20である補正第1信号28と、を出力する。
また、例えば、重み係数が、上記関係を満たす誤差を得るために、第1信号20および第1復元信号26の各々に乗算するための、第1復元信号26および第1復元信号26の各々用の重み係数であると想定する。この場合、第1信号調整部10Cは、第1信号20に該第1信号20用の重み係数を乗算した補正第1信号28と、第1復元信号26に該第1復元信号26用の重み係数を乗算した補正第1復元信号29と、を出力する。
誤差算出部10Dは、補正第1信号28と補正第1復元信号29との誤差を算出する。
例えば、誤差算出部10Dは、補正第1信号28と補正第1復元信号29との二乗誤差を、誤差として算出する。具体的には、例えば、誤差算出部10Dは、下記式(1)を用いて誤差を算出する。
式(1)中、E(W)は、誤差を意味する。kは、重み係数を意味する。tは、第1信号20を意味する。すなわち、ktは、補正第1信号28を意味する。F(W,x)は、第1復元信号26を示し、上記式(A)と同様である。
なお、式(1)には、第1信号調整部10Cによって、第1信号20に重み係数が乗算された例を一例として示した。しかし、上述したように、重み係数(k)は、第1信号20および第1復元信号26の少なくとも一方に乗算されればよい。この場合、式(1)中、“kt”を“t”とし、“F(W,x)”を“F(W,x)t”とした式を用いて、誤差を算出すればよい。
また、例えば、第1信号調整部10Cが、2つ以上の重み係数を用いた場合には、誤差算出部10Dは、対角成分に重み係数が並ぶ行列Kを用いた下記式(2)を用いて、誤差を算出すればよい。
式(2)中、E(W)は、誤差を意味する。Kは、重み係数である行列を意味する。tは、第1信号20を意味する。すなわち、ktは、補正第1信号28を意味する。F(W,x)は、第1復元信号26を示し、上記式(A)と同様である。
誤差算出部10Dは、算出した誤差を、更新部10Eへ出力する。
なお、誤差算出部10Dは、補正第1信号28と補正第1復元信号29との誤差を算出すればよく、二乗誤差(L2ロス)を誤差として算出する算出方法に限定されない。例えば、誤差算出部10Dは、補正第1信号28と補正第1復元信号29とのL1ロス、Charbonnierロス、Huberロスを、誤差として算出してもよい。
更新部10Eは、誤差算出部10Dで算出された誤差を用いて、第1信号処理に用いるパラメータを更新する。言い換えると、例えば、更新部10Eは、誤差E(W)を用いて、ニューラルネットワークに用いるネットワークパラメータWを更新する。
例えば、更新部10Eは、勾配法などによってニューラルネットワークのネットワークパラメータWを更新する。
具体的には、更新部10Eは、誤差E(W)をネットワークパラメータWで偏微分して得られる勾配(σE(W)/σW)に基づいて、勾配法によってネットワークパラメータWを更新する。また、誤差E(W)が活性化関数を含んだ入れ子構造となっているため、効率的に偏微分を行う観点から、誤差逆伝播法により誤差の勾配を計算してもよい。なお、勾配計算方法は、誤差逆伝播法に限られず、どのような方法であってもよい。
例えば、更新部10Eは、下記式(3)を用いて、ネットワークパラメータWを更新する。なお、下記式(3)は、最も単純な勾配法によるネットワークパラメータの更新式の一例である。
式(3)中、W’は、更新後のネットワークパラメータWを示す。ηは、一度の更新でどの程度ネットワークパラメータWを変化させるかを決めるための、学習率を意味する。
信号処理部10Bは、更新部10Eによって更新されたパラメータ(ネットワークパラメータW)を用いて、入力信号24に対して上述した第1信号処理を行い、第1信号20を復元した第1復元信号26を出力する。
そして、第1信号処理装置10では、合成部10A、信号処理部10B、第1信号調整部10C、誤差算出部10D、および更新部10Eが、上記処理を繰返し実行する。第1信号調整部10Cが、この繰返しの処理を実行することで、パラメータが更新され、パラメータが最適化(学習)される。
次に、第1信号処理装置10が実行する信号処理の流れの一例を説明する。第1信号処理装置10が実行する信号処理は、すなわち、パラメータの学習処理である。
図4は、第1信号処理装置10が実行する信号処理の流れの一例を示す、フローチャートである。
合成部10Aは、第1信号20と第2信号22を重畳し、入力信号24を出力する(ステップS100)。
信号処理部10Bは、更新部10Eによって更新されたパラメータを用いて、入力信号24に対して第1信号処理を行い、第1復元信号26を出力する。
第1信号調整部10Cは、ステップS100で入力信号24の生成に用いた第1信号20、および、ステップS102で出力された第1復元信号26、の少なくとも一方に重み係数を乗算する(ステップS104)。ステップS104の処理によって、第1信号調整部10Cは、補正第1信号28および補正第1復元信号29を誤差算出部10Dへ出力する。
誤差算出部10Dは、補正第1信号28と補正第1復元信号29との誤差を計算する(ステップS106)。
更新部10Eは、ステップS106で計算された誤差を用いて、信号処理部10Bによる第1信号処理のパラメータを更新する(ステップS108)。
次に、第1信号処理装置10は、パラメータの学習を終了するか否かを判断する(ステップS110)。例えば、第1信号処理装置10は、予め定めた繰返し回数に足しているか否かを判別することで、ステップS110の判断を行う。繰返し回数は、ステップS100〜ステップS108の一連の処理の繰返し回数である。ステップS110で肯定判断すると(ステップS110:Yes)。上記ステップS100へ戻る。一方、ステップS110で否定判断すると(ステップS110:No)、本ルーチンを終了する。
以上説明したように、本実施の形態の第1信号処理装置10は、信号処理部10Bと、第1信号調整部10Cと、誤差算出部10Dと、更新部10Eと、を備える。信号処理部10Bは、第1信号20に第2信号22が重畳された入力信号24に対して、少なくとも1以上のパラメータを用いた第1信号処理を行い、第1信号20を復元した第1復元信号26を出力する。第1信号調整部10Cは、第1信号20および第1復元信号26の少なくとも一方に、重み係数を乗算し、補正第1信号28および補正第1復元信号29を出力する。更新部10Eは、補正第1信号28と補正第1復元信号29との誤差を用いてパラメータを更新する。
ここで、従来では、第1信号20および第1復元信号26の少なくとも一方に対する重み係数の乗算が行われずに、第1信号20と第1復元信号26との誤差が算出されていた。そして、従来では、該誤差に基づいてパラメータの学習(最適化)が実行されていた。
例えば、従来では、誤差の算出には、下記式(4)が用いられていた。
式(4)中、E(W)、t、F(W,x)は、上記式(A)と同様である。
また、従来では、誤差E(W)として、二乗誤差または重み付き二乗誤差を用いる方法が知られている。この方法は、データ毎の二乗誤差をデータの分散などで重み付けした和を、誤差E(W)とする方法である。この方法は、上記式(4)を一般化最小二乗法に書き換えることで、式(5)で表される。
式(5)中、E(W)、y、F(W,x)は、上記式(A)と同様である。また、式(5)中、Ωは、対角成分に分散が並ぶ行列を意味する。
式(4)および式(5)に示すように、従来では、誤差E(W)の算出には、本実施の形態における、第1信号20および第1復元信号26の少なくとも一方への重み係数の乗算は行われていなかった。
このため、従来技術では、ノイズレベルが高く(例えば、SN比(S/N)が1未満)、且つ、必要成分(例えば、第1信号20)がノイズなどの不要成分(例えば、第2信号22)に比べて疎である場合、ノイズなどの不要成分だけでなく、必要な信号成分も抑制する方向に向かって、パラメータが更新される場合があった。
また、従来では、重み付き最小二乗誤差を誤差とした場合であっても、信号成分が抑制された時の誤差、および、ノイズ成分を抑制しきれなかった場合の誤差の両方に重み付けがなされていた。このため、従来では、ノイズなどの不要成分だけでなく、必要な信号成分も抑制する方向に向かって、パラメータが更新される場合があった。
また、従来より、入力信号24に含まれる必要成分(例えば、第1信号20)を復元する復元処理が長年研究されており、信号強度よりノイズ強度が小さい一般的なケースについては有効な手法が数多く存在する。しかし、従来技術では、信号強度よりノイズ強度が大きいようなSN比が著しく低いケースに対しては有効な手法は確立されていなかった。
信号のSN比が著しく低くなるシーンとして以下の例が挙げられる。
・早期発見や予兆検知を目的とした計測のため、対象となる信号が微弱である。
・計測時間の制約や環境特有の外乱により、ノイズが増大する。
一方、本実施の形態の第1信号処理装置10は、信号処理部10Bが入力信号24から第1信号20を復元した第1復元信号26を導出する時に用いるパラメータを、補正第1信号28と補正第1復元信号29との誤差を用いて補正する。補正第1信号28および補正第1復元信号29は、第1信号20および第1復元信号26の少なくとも一方に重み係数を乗算した結果の信号である。
すなわち、第1信号処理装置10は、第1信号20と第1復元信号26との誤差では無く、重み係数を乗算した後の補正第1信号28と補正第1復元信号29との誤差を用いて、パラメータを更新する。
このため、本実施の形態の第1信号処理装置10は、重み係数を調整することで、E(W)中の第1信号20が抑制されたときに算出される誤差と、第2信号22を抑制しきれなかった場合に算出される誤差と、の割合を調整することができる。
このため、第1信号処理装置10では、該誤差E(W)を用いて更新されたパラメータを用いることで、入力信号24の信号処理時に、第1信号20の信号成分の抑制を防ぎつつ、且つ、第2信号22の信号成分を抑制した信号処理を実行するためのパラメータを、学習することができる。すなわち、第1信号処理装置10は、該パラメータを学習することができるため、入力信号24の信号処理時における、入力信号24に含まれる必要成分である第1信号20の信号成分の抑制の防止と、入力信号24に含まれる必要成分以外の第2信号22の信号成分の抑制と、を図ることができる。
従って、本実施の形態の第1信号処理装置10は、入力信号24に含まれる不要成分(第2信号22)を抑制する信号処理時に、必要な信号成分(第1信号20)が抑制されることを抑制することができる。
また、第2信号22は、電力(パワー)、振幅、および分散の少なくとも1つが第1信号20より大きい。また、第1信号20は、第2信号22に比べて疎な信号である。
ここで、異常信号の検出による製造装置やインフラ設備の故障診断では、性質上早期発見が望まれる。このため、ノイズレベルが高く(例えばS/N<1)かつ異常信号が疎となる場合がある。しかし、従来では、このような信号の検出をニューラルネットワークに学習させる際、一般的に用いられる二乗誤差をロス関数として最適化すると、ノイズ成分だけでなく信号成分も抑制するような望ましくない解に収束する場合があった。また、重み付け最小二乗誤差をロス関数とした場合であっても、望ましくない解への収束を回避できなかった。
一方、本実施の形態の誤差算出部10Dでは、第1信号20と第1復元信号26との誤差では無く、重み係数を乗算した後の補正第1信号28と補正第1復元信号29との誤差を用いて、パラメータを更新する。
このため、本実施の形態では、第2信号22の電力、振幅、および分散の少なくとも1つが第1信号20より大きく、また、第1信号20が第2信号22に比べて疎な信号であっても、信号処理時に第1信号20が抑制されることを抑制することができる。
なお、本実施の形態では、信号処理部10Bと、更新部10Eと、誤差算出部10Dと、を別体として構成した場合を一例として示した(図2参照)。しかし、信号処理部10B、更新部10E、および誤差算出部10Dの少なくとも2以上を、一体的に構成してもよい。
(第2の実施の形態)
上記第1の実施の形態では、第1信号20および第1復元信号26の少なくとも一方に乗算する重み係数が、上記関係を満たすように予め設定されている場合を、一例として説明した。
本実施の形態では、第1信号20および第2信号22に基づいて重み係数を算出する形態を説明する。
図5は、第1信号処理装置11の機能的構成の一例を示すブロック図である。第1信号処理装置11は、信号処理装置の一例である。
第1信号処理装置11は、合成部10Aと、信号処理部10Bと、第1信号調整部11Cと、誤差算出部10Dと、更新部10Eと、第1算出部11Fと、を備える。
第1信号処理装置11は、第1算出部11Fを更に備える点、および第1信号調整部10Cに代えて第1信号調整部11Cを備える点以外は、第1の実施の形態の第1信号処理装置10と同様である。その他の機能は、第1の実施形態にかかる第1信号処理装置10のブロック図である図2と同様であるため、同一符号を付し、ここでの説明は省略する。
第1算出部11Fは、第1信号20の第1統計情報、および第2信号22の第2統計情報の少なくとも一方に基づいて、重み係数を算出する。
第1統計情報は、第1信号20の統計情報である。第2統計情報は、第2信号22の統計情報である。第1統計情報および第2統計情報は、それぞれ、第1信号20および第2信号22の各々の、信号処理における二乗平均値である電力(パワー)、振幅、分散、の少なくとも1つを示す。
詳細には、第1統計情報および第2統計情報が、それぞれ、第1信号20および第2信号22の各々の、電力を示すと想定する。この場合、第1算出部11Fは、受付けた第1信号20の電力を、第1信号20の第1統計情報として算出する。また、第1算出部11Fは、受付けた第2信号22の電力を、第2信号22の第2統計情報として算出する。
また、第1統計情報および第2統計情報が、それぞれ、第1信号20および第2信号22の各々の、振幅を示すと想定する。この場合、第1算出部11Fは、受付けた第1信号20の単位時間あたりの振幅の最大値または平均値を、第1信号20の第1統計情報として算出する。また、第1算出部11Fは、受付けた第2信号22の単位時間あたりの振幅の最大値を、第2信号22の第2統計情報として算出する。
また、第1統計情報および第2統計情報が、それぞれ、第1信号20および第2信号22の各々の、分散または標準偏差を示すと想定する。この場合、第1算出部11Fは、受付けた第1信号20のヒストグラムによって表される分散または標準偏差を、第1信号20の第1統計情報として算出する。また、第1算出部11Fは、受付けた第2信号22のヒストグラムによって表される分散または標準偏差を、第2信号22の第2統計情報として算出する。
第1算出部11Fは、第1統計情報および第2統計情報の少なくとも一方に基づいて、上記第1の実施の形態で説明した上記関係を満たす誤差が得られる、重み係数を算出する。
例えば、第1算出部11Fは、第1統計情報と第2統計情報との比を、重み係数として算出する。例えば、第1算出部11Fは、第1統計情報に対する第2統計情報の比、または、第2統計情報に対する第1統計情報の比を、重み係数として算出する。そして、第1算出部11Fは、算出した重み係数を、第1信号調整部11Cへ出力する。
第1信号調整部11Cは、第1算出部11Fで算出された重み係数を、第1信号20および第1復元信号26の少なくとも一方に乗算し、補正第1信号28および補正第1復元信号29を誤差算出部10Dへ出力する。
第1信号調整部11Cは、予め設定された重み係数に代えて、第1算出部11Fから受付けた重み係数を用いる点以外は、第1の実施の形態の第1信号調整部10Cと同様の処理を実行すればよい。
次に、第1信号処理装置11が実行する信号処理の流れの一例を説明する。第1信号処理装置11が実行する信号処理は、すなわち、パラメータの学習処理である。
図6は、第1信号処理装置11が実行する信号処理の流れの一例を示す、フローチャートである。
ステップS200〜ステップS202は、第1の実施の形態の第1信号処理装置10におけるステップS100〜ステップS102と同様である(図4参照)。このため、その説明を省略する。
第1算出部11Fは、ステップS200で入力信号24の生成に用いた第1信号20と第2信号22について、第1信号20の第1統計情報と第2信号22の第2統計情報とを算出する。そして、第1算出部11Fは、これらの第1統計情報と第2統計情報戸を用いて、重み係数を算出し、第1信号調整部11Cで用いられる重み係数を更新する(ステップS204)。
第1信号調整部11Cは、ステップS200で入力信号24の生成に用いた第1信号20、および、ステップS202で出力された第1復元信号26、の少なくとも一方に、ステップS204で算出および更新された重み係数を乗算する(ステップS204)。
そして、第1信号処理装置11は、ステップS206〜ステップS212の処理を実行し、本ルーチンを終了する。ステップS206〜ステップS212は、第1の実施の形態の第1信号処理装置10におけるステップS104〜ステップS110と同様である(図4参照)。このため、その説明を省略する。
以上説明したように、本実施の形態の第1信号処理装置11では、第1算出部11Fが、第1信号20の第1統計情報、および、第2信号22の第2統計情報、の少なくとも一方に基づいて、重み係数を算出する。第1信号調整部11Cは、第1算出部11Fで算出された重み係数を第1信号20および第1復元信号26の少なくとも一方に乗算する。
このため、本実施の形態の第1信号処理装置11では、重み係数が上記関係を満たすように、第1信号20および第2信号22に基づいて、重み係数を動的に算出し、更新することができる。
上記関係とは、すなわち、入力信号24から第1信号20に一致する第1復元信号26が復元出来なかったときの、該第1信号20と該第1復元信号26との誤差を、該入力信号24に含まれる第2信号22の信号強度より大きくするための、重み係数であることである。また、上記関係とは、信号処理部10Bによる信号処理によって、入力信号24に含まれる第1信号20以外の信号成分である第2信号22と共に、入力信号24に含まれる第1信号20が抑制された第1復元信号26が出力されることを、抑制するための重み係数であることである。
従って、本実施の形態の第1信号処理装置11は、上記第1の実施の形態の効果に加えて、入力信号24に含まれる不要成分(第2信号22)の抑制と、必要な信号成分(第1信号20)が抑制されることの抑制と、の両立を更に図ることができる。
(第3の実施の形態)
上記第1実施の形態では、第1信号20および第1復元信号26の少なくとも一方に乗算する重み係数が、上記関係を満たすように予め設定されている場合を、一例として説明した。
本実施の形態では、誤差算出部10Dで算出された誤差に基づいて、重み係数を算出する形態を説明する。
図7は、第1信号処理装置12の機能的構成の一例を示すブロック図である。第1信号処理装置12は、信号処理装置の一例である。
第1信号処理装置12は、合成部10Aと、信号処理部10Bと、第1信号調整部12Cと、誤差算出部10Dと、更新部10Eと、第2算出部12Gと、を備える。
第1信号処理装置12は、第1信号調整部10Cに代えて第1信号調整部12Cを備える点、および第2算出部12Gを更に備える点以外は、第1の実施の形態の第1信号処理装置10と同様である。その他の機能は、第1の実施形態にかかる第1信号処理装置10のブロック図である図2と同様であるため、同一符号を付し、ここでの説明は省略する。
第2算出部12Gは、誤差算出部10Dで算出された誤差に基づいて、重み係数を算出する。
詳細には、第2算出部12Gは、例えば、一定の繰り返し期間、誤差の変化が停滞している場合には、重み係数を前回算出した値より大きくし、誤差の変化が大きい場合には、重み係数を前回算出した値より小さくする。
例えば、第2算出部12Gは、誤差を重み係数で偏微分した時の勾配を用いて、下記式(6)により、新たな重み係数を算出する。
式(6)中、k’は、更新後の新たな重み係数を示す。kは、更新前、すなわち前回算出した重み係数を示す。ηは、更新量を決める係数である。Wは、ネットワークパラメータW(重み行列)を示す。
なお、式(6)では、最急降下法によって重み係数の更新を行う例を示した。しかし、第2算出部12Gは、反復最適化を行う任意の最適化アルゴリズムを用いて、新たな重み係数“k’”を算出してもよい。
また、式(6)には、重み係数がスカラ値である場合の一例を示した。しかし、重み係数が、2つ以上の重み係数を有するベクトルや行列の場合であっても、第2算出部12Gは、式(6)と同様の式により、新たな重み係数“k’”を算出してもよい。
第1信号調整部12Cは、第2算出部12Gで算出された重み係数を、第1信号20および第1復元信号26の少なくとも一方に乗算し、補正第1信号28および補正第1復元信号29を誤差算出部10Dへ出力する。言い換えると、第1信号調整部12Cは、第2算出部12Gによって更新された新たな重み係数“k’”を、第1信号20および第1復元信号26の少なくとも一方に乗算する。
なお、第1信号調整部11Cは、予め設定された重み係数に代えて、第2算出部12Gから受付けた重み係数を用いる点以外は、第1の実施の形態の第1信号調整部10Cと同様の処理を実行すればよい。
次に、第1信号処理装置12が実行する信号処理の流れの一例を説明する。第1信号処理装置11が実行する信号処理は、すなわち、パラメータの学習処理である。
図8は、第1信号処理装置12が実行する信号処理の流れの一例を示す、フローチャートである。
ステップS300〜ステップS308は、第1の実施の形態の第1信号処理装置10におけるステップS100〜ステップS108と同様である(図4参照)。このため、その説明を省略する。
第2算出部12Gは、ステップS306で算出された誤差を用いて、重み係数を算出し、算出した新たな重み係数に更新する(ステップS310)。このため、次回の処理時には、第1信号調整部12Cは、ステップS310で算出および更新された重み係数を、第1信号20および第1復元信号26の少なくとも一方に乗算し、補正第1信号28および補正第1復元信号29を出力することとなる。
なお、初回の処理時には、第1信号調整部12Cは、予め設定された重み係数を用いればよい。そして、次回の処理時以降では、第1信号処理装置12は、第2算出部12Gから受付けた新たな重み係数を用いればよい。
そして、第1信号処理装置12は、上記ステップS110と同様にしてステップS312の処理を実行した後に、本ルーチンを終了する。
以上説明したように、本実施の形態の第1信号処理装置12では、第2算出部12Gが、補正第1信号28と補正第1復元信号29との誤差に基づいて、重み係数を算出する。第1信号調整部12Cは、算出された重み係数を、第1信号20および第1復元信号26の少なくとも一方に乗算し、補正第1信号28および補正第1復元信号29を出力する。
このため、本実施の形態の第1信号処理装置11では、重み係数が、第1の実施の形態で説明した上記関係を満たすように、第1信号20および第2信号22に基づいて、重み係数を動的に算出し、更新することができる。
従って、本実施の形態の第1信号処理装置13は、上記第1の実施の形態の効果に加えて、入力信号24に含まれる不要成分(第2信号22)の抑制と、必要な信号成分(第1信号20)が抑制されることの抑制と、の両立を更に図ることができる。
(第4の実施の形態)
本実施の形態では、信号処理システム1に含まれる第2信号処理装置30について説明する(図1参照)。
図9は、第2信号処理装置30の機能的構成の一例を示すブロック図である。第2信号処理装置30は、信号処理部30Aと、第2信号調整部30Bと、を備える。
信号処理部30A、および第2信号調整部30Bは、例えば、1または複数のプロセッサにより実現される。例えば上記各部は、CPUなどのプロセッサにプログラムを実行させること、すなわちソフトウェアにより実現してもよい。上記各部は、専用のICなどのプロセッサ、すなわちハードウェアにより実現してもよい。上記各部は、ソフトウェアおよびハードウェアを併用して実現してもよい。複数のプロセッサを用いる場合、各プロセッサは、各部のうち1つを実現してもよいし、各部のうち2以上を実現してもよい。
信号処理部30Aは、入力信号46から、入力信号46に含まれる第1信号20を復元した第1復元信号48を生成する。
入力信号46は、上記実施の形態で説明した入力信号24と同様である。すなわち、入力信号46は、第1信号20に第2信号22を重畳した信号である。
但し、本実施の形態の第2信号処理装置30で用いる入力信号46は、合成部10Aによって合成された信号ではなく、第2信号処理装置30による認識処理時に、第2信号処理装置30が外部装置または外部環境から取得した入力信号46である。
信号処理部30Aは、第1信号処理装置10、第1信号処理装置11、または第1信号処理装置12によって学習されたパラメータである学習済パラメータ44を取得し、記憶する。例えば、信号処理部30Aは、第1信号処理装置10、第1信号処理装置11、または第1信号処理装置12から、有線通信または無線通信などにより直接、または他の装置などを介して、学習済パラメータ44を取得すればよい。
信号処理部30Aは、学習済パラメータ44と、入力信号46と、基づいて、第1信号処理を実行することで、第1復元信号48を出力する。
信号処理部30Aは、パラメータとして学習済パラメータ44を用い、入力信号24に代えて入力信号46を用いる点以外は、上記実施の形態の信号処理部10Bと同様にして、第1復元信号48を復元し、出力すればよい。
第1復元信号48は、入力信号24に代えて入力信号46から復元された信号である点以外は、第1の実施の形態の第1復元信号26と同様である。
第2信号調整部30Bは、第1復元信号48に、上記学習済パラメータ44を学習した第1信号処理装置(第1信号処理装置10、第1信号処理装置11、または第1信号処理装置12)で用いた重み係数に基づく補正重み係数を乗算し、第2復元信号49を出力する。
詳細には、第2信号調整部30Bは、信号処理部30Aで用いる学習済パラメータ44を学習した第1信号処理装置(第1信号処理装置10、第1信号処理装置11、または第1信号処理装置12)から、該第1信号処理装置による学習済パラメータ44の学習時の重み係数40を取得する。学習時の重み係数40とは、該第1信号処理装置で該学習済パラメータ44を算出したときに、該第1信号処理装置の第1信号調整部10C(または、第1信号調整部11C、第1信号調整部12C)で用いていた重み係数である。
また、第2信号調整部30Bは、信号処理部30Aで用いる学習済パラメータ44を学習した第1信号処理装置(第1信号処理装置10、第1信号処理装置11、または第1信号処理装置12)から、該第1信号処理装置による学習済パラメータ44の学習時のノイズレベル42を取得する。学習時のノイズレベル42とは、該第1信号処理装置で該学習済パラメータ44を算出したときに、該第1信号処理装置の第1信号調整部10C(または、第1信号調整部11C、第1信号調整部12C)で用いた、入力信号24のノイズレベル42である。
ノイズレベル42は、該入力信号24に含まれる第1信号20と第2信号22とのパワー比によって表される。
第2信号調整部30Bは、第1信号処理装置10、第1信号処理装置11、または第1信号処理装置12から、有線通信または無線通信などにより直接、または他の装置などを介して、重み係数40およびノイズレベル42を取得すればよい。
そして、第2信号調整部30Bは、取得した重み係数40を補正した補正重み係数を導出する。
例えば、第2信号調整部30Bは、重み係数40の逆数を、補正重み係数として導出する。そして、第2信号調整部30Bは、第1復元信号48に該補正重み係数を乗算することで、第2復元信号49を生成する。この処理により、第2信号調整部30Bは、入力信号46と第2復元信号49とのスケール(単位)を統一することができる。
ここで、ノイズレベル42が大きいほど、第2復元信号49のスケールが真の第1信号20の値より小さい値に復元される傾向にある。このため、第2信号調整部30Bは、学習時の重み係数40に、ノイズレベル42に基づく補正係数を乗算した結果を、補正重み係数として導出してもよい。
すなわち、第2信号調整部30Bは、重み係数40を、第1信号20と第2信号22とのパワー比であるノイズレベル42を用いて補正した補正重み係数を導出し、第1復元信号48に該補正重み係数を乗算した第2復元信号49を出力してもよい。
そして、第2信号調整部30Bは、第2復元信号49を出力する。なお、第2信号処理装置30は、第2復元信号49について、更に、認識処理を実行してもよい。認識処理については、第1の実施の形態で説明したため、ここでは説明を省略する。
次に、第2信号処理装置30が実行する信号処理の流れの一例を説明する。
図10は、第2信号処理装置30が実行する信号処理の流れの一例を示す、フローチャートである。
まず、信号処理部30Aが、学習済パラメータ44を登録する(ステップS400)。次に、第2信号調整部30Bが、ステップS400で登録した学習済パラメータ44の学習時に用いられた重み係数40およびノイズレベル42を受付ける(ステップS402)。
次に、信号処理部30Aが、入力信号46に対して、学習済パラメータ44を用いて第1信号処理を行い、第1復元信号48を出力する(ステップS404)。
次に、第2信号調整部30Bが、ステップS400で登録した重み係数40を補正するか否かを判断する(ステップS406)。例えば、第2信号調整部30Bは、ステップS402で受付けたノイズレベル42が予め定めた閾値以上である場合に、補正すると判断する。また、ノイズレベル42が該閾値未満である場合に、補正しないと判断する。
ステップS406で肯定判断すると(ステップS406:Yes)、ステップS408へ進む。ステップS408では、第2信号調整部30Bは、重み係数40を補正し、補正重み係数を算出する(ステップS408)。そして、第2信号調整部30Bは、第1復元信号48にステップS408で算出した補正重み係数を乗算し、第2復元信号49を出力する(ステップS410)。
ステップS406で否定判断すると(ステップS406:No)、ステップS412へ進む。ステップS412では、第2信号調整部30Bは、第1復元信号48に重み係数40を乗算し、第2復元信号49を出力する(ステップS410)。
第2信号処理装置30は、信号処理を終了するか否かを判断する(ステップS414)。例えば、第2信号処理装置30は、ユーザによる操作指示などによって終了を示す信号を受信したか否を判別することで、ステップS414の判断を行う。ステップS414で否定判断すると(ステップS414:No)、上記ステップS404へ戻る。なお、ステップS414で否定判断すると(ステップS414:No)、上記ステップS400へ戻ってもよい。一方、ステップS414で肯定判断すると(ステップS414:Yes)、本ルーチンを終了する。
以上説明したように、本実施の形態の第2信号処理装置30の第2信号調整部30Bは、学習済パラメータ44を用いて復元された第1復元信号48に、信号処理部10B(第1信号処理部)が用いた重み係数40を補正した補正重み係数を乗算し、第2復元信号49を出力する。
このように、本実施の形態の第2信号調整部30Bは、第1信号20と第1復元信号26との誤差では無く、重み係数を乗算した後の補正第1信号28と補正第1復元信号29との誤差を用いて学習された学習済パラメータ44を用いて、入力信号46から第1復元信号48を復元する。また、本実施の形態の第2信号処理装置30は、第1復元信号48を、重み係数40を補正した補正重み係数を用いて補正し、第2復元信号49を出力する。
このため、本実施の形態の第2信号処理装置30は、上記第1の実施の形態の効果に加えて、入力信号46に対して統一されたスケール(単位)の第2復元信号49を出力することができる。
なお、第2信号処理装置30の機能の少なくとも一部を、第1信号処理装置10、第1信号処理装置11、または第1信号処理装置12に含めた構成としてもよい。
例えば、第1信号処理装置10(図2参照)に、信号処理部30Aおよび第2信号調整部30Bを設けた構成としてもよい。この場合、信号処理部30Aは、信号処理部10B、第1信号調整部10C、更新部10E、および更新部10Eで学習された学習済パラメータ44を受付け、入力信号24または別途取得した入力信号46に対して第1信号処理を実行すればよい。
(第5の実施の形態)
本実施の形態では、第2信号処理装置31について説明する。第2信号処理装置31は、信号処理システム1に含まれる第2信号処理装置30の、第4の実施例とは異なる形態の一例である。
図11は、第2信号処理装置31の機能的構成の一例を示すブロック図である。第2信号処理装置31は、信号処理部30Aと、推定部31Cと、を備える。推定部31Cは、特徴抽出部31Dと、属性導出部31Eと、を備える。
信号処理部30A、推定部31C、特徴抽出部31D、および属性導出部31Eは、例えば、1または複数のプロセッサにより実現される。例えば上記各部は、CPUなどのプロセッサにプログラムを実行させること、すなわちソフトウェアにより実現してもよい。上記各部は、専用のICなどのプロセッサ、すなわちハードウェアにより実現してもよい。上記各部は、ソフトウェアおよびハードウェアを併用して実現してもよい。複数のプロセッサを用いる場合、各プロセッサは、各部のうち1つを実現してもよいし、各部のうち2以上を実現してもよい。
信号処理部30Aは、第4の実施の形態の信号処理部30Aと同様であるため、詳細な説明を省略する。
推定部31Cは、第1復元信号48を用いた認識処理を実行する。認識処理は、上記第1の実施の形態で説明したように、例えば、画像の画像分類、画像認識、画像のセグメンテーション、画像のキャプショニング、電気信号、振動などの1次元信号の分類処理、音声の機械翻訳、などである。
本実施の形態では、推定部31Cは、第1復元信号48の特徴情報の属性50を推定する。属性50は、認識処理結果を用いて特定される各種の情報である。特徴情報の抽出および属性50の推定が、上記認識処理に相当する。
詳細には、推定部31Cは、特徴抽出部31Dと、属性導出部31Eと、を有する。
特徴抽出部31Dは、第1復元信号48の特徴を抽出し、特徴抽出後の信号である特徴情報を出力する。例えば、特徴抽出部31Dは、認識処理として、第1復元信号48に対して量子化および標本化の少なくとも一方を行う。
図12A〜図12Dは、特徴情報64の抽出の一例の説明図である。なお、図12A〜図12Dには、第1復元信号48が部分放電を示す信号である場合を、一例として示した。
図12Aは、第1復元信号48の一例を示す図である。特徴抽出部31Dは、第1復元信号48に対して、所定の範囲毎の最大値60Aと最小値60Bとを並べた2つの信号60を出力する(図12B参照)。例えば、特徴抽出部31Dは、第1復元信号48を標本化(ダウンサンプリング)することで、最大値60Aと最小値60Bとを並べた信号60を出力する。
そして、特徴抽出部31Dは、振幅の最大値が“1”となるように、2つの信号60(最大値60A、最小値60B)の各々を正規化する(図12B参照)。その後、2つの信号60の各々の振幅の最大値が“1”となるように、それぞれ正規化する。
次に、特徴抽出部31Dは、正規化後の信号60に対して、予め定めた閾値以下の信号を“0”に置換し、閾値処理後の信号62とする(図12C参照)。
そして、特徴抽出部31Dは、閾値処理後の信号62に対して、横軸をΦ(位相)、縦軸をq(電荷量)として量子化したときの、各セルあたりの個数を、特徴情報64として抽出する。具体的には、62に対して、周期単位分割、重ね合せ、および量子化を実行することで、認識処理結果である特徴情報64を抽出する。
すなわち、これらの処理によって、特徴抽出部31Dは、Φ(位相)−q(電荷量)−n(頻度)パターンによって表される特徴情報64を抽出する。なお、特徴情報64は、Φ(位相)−q(電荷量)−n(頻度)パターンに限定されない。
図11に戻り説明を続ける。属性導出部31Eは、特徴情報64を用いて、第1復元信号48の属性50を導出する。属性50は、上述したように、特徴情報64(認識処理結果)を用いて特定される各種の情報である。属性50は、例えば、入力信号46の発生源(例えば、装置の異常箇所)や、入力信号46の発生源の動作状況(例えば、異常状況など)などである。
次に、第2信号処理装置31が実行する信号処理の流れの一例を説明する。
図13は、第2信号処理装置31が実行する信号処理の流れの一例を示す、フローチャートである。
まず、信号処理部30Aが、入力信号46に対して、学習済パラメータ44を用いて第1信号処理を行い、第1復元信号48を出力する(ステップS500)。
次に、特徴抽出部31Dが、ステップS500で出力された第1復元信号48から特徴情報64を抽出する(ステップS502)。
次に、属性導出部31Eが、ステップS502で抽出された特徴情報64から属性50を導出し、出力する(ステップS504)。そして、本ルーチンを終了する。
以上説明したように、本実施の形態の第2信号処理装置31は、学習済パラメータ44を用いて復元された第1復元信号48の特徴情報64の属性50を推定する。
このため、本実施の形態では、高精度に復元された第1復元信号48を用いて、属性50を推定する認識処理を実行することができる。
従って、本実施の形態の第2信号処理装置31は、上記第1の実施の形態の効果に加えて、高精度に復元された第1復元信号48を用いて、認識処理を実行することができる。
なお、第2信号処理装置31の機能の少なくとも一部を、第1信号処理装置10、第1信号処理装置11、または第1信号処理装置12に含めた構成としてもよい。
例えば、第1信号処理装置10(図2参照)に、信号処理部30Aおよび推定部31Cを設けた構成としてもよい。この場合、信号処理部30Aは、信号処理部10B、第1信号調整部10C、更新部10E、および更新部10Eで学習された学習済パラメータ44を受付け、入力信号24または別途取得した入力信号46に対して第1信号処理を実行すればよい。
また、第2信号処理装置31の機能の少なくとも一部を、第2信号処理装置30(図9)に設けた構成としてもよい。この場合、例えば、第2信号処理装置30に、推定部31Cを設けた構成とすればよい。そして、第2信号処理装置31は、信号処理部30Aに代えて第2信号調整部30Bから、第2復元信号49を受付け、該第2復元信号49の属性50を推定すればよい。
次に、上記実施の形態に係る、第1信号処理装置10、第1信号処理装置11、第1信号処理装置12、第2信号処理装置30、および第2信号処理装置31のハードウェア構成の一例を説明する。
図14は、上記実施の形態に係る第1信号処理装置10、第1信号処理装置11、第1信号処理装置12、第2信号処理装置30、および第2信号処理装置31のハードウェア構成例を示す説明図である。
上記実施の形態に係る第1信号処理装置10、第1信号処理装置11、第1信号処理装置12、第2信号処理装置30、および第2信号処理装置31は、CPU51などの制御装置と、ROM(Read Only Memory)52やRAM53などの記憶装置と、ネットワークに接続して通信を行う通信I/F54と、各部を接続するバス61を備えている。
上記実施の形態に係る第1信号処理装置10、第1信号処理装置11、第1信号処理装置12、第2信号処理装置30、および第2信号処理装置31で実行されるプログラムは、ROM52等に予め組み込まれて提供される。
上記実施の形態に係る第1信号処理装置10、第1信号処理装置11、第1信号処理装置12、第2信号処理装置30、および第2信号処理装置31で実行されるプログラムは、インストール可能な形式又は実行可能な形式のファイルでCD−ROM(Compact Disk Read Only Memory)、フレキシブルディスク(FD)、CD−R(Compact Disk Recordable)、DVD(Digital Versatile Disk)等のコンピュータで読み取り可能な記録媒体に記録してコンピュータプログラムプロダクトとして提供されるように構成してもよい。
さらに、上記実施の形態に係る第1信号処理装置10、第1信号処理装置11、第1信号処理装置12、第2信号処理装置30、および第2信号処理装置31で実行されるプログラムを、インターネット等のネットワークに接続されたコンピュータ上に格納し、ネットワーク経由でダウンロードさせることにより提供するように構成してもよい。また、第1から第3の実施形態にかかる信号処理装置で実行されるプログラムをインターネット等のネットワーク経由で提供または配布するように構成してもよい。
第1から第3の実施形態にかかる信号処理装置で実行されるプログラムは、コンピュータを上述した信号処理装置の各部として機能させうる。このコンピュータは、CPU51がコンピュータ読取可能な記憶媒体からプログラムを主記憶装置上に読み出して実行することができる。
本発明のいくつかの実施の形態を説明したが、これらの実施の形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら新規な実施の形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施の形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。
1 信号処理システム
10、11、12 第1信号処理装置
10B 信号処理部
10C、11C、12C 第1信号調整部
10D 誤差算出部
10E 更新部
11F 第1算出部
12G 第2算出部
30、31 第2信号処理装置
30A 信号処理部
30B 第2信号調整部
31C 推定部

Claims (15)

  1. 第1信号に第2信号が重畳された入力信号に対して、少なくとも1以上のパラメータを用いた第1信号処理を行い、前記第1信号を復元した第1復元信号を出力する信号処理部と、
    前記第1信号および前記第1復元信号の少なくとも一方に重み係数を乗算し、補正第1信号および補正第1復元信号を出力する第1信号調整部と、
    前記補正第1信号と前記補正第1復元信号との誤差を用いて前記パラメータを更新する更新部と、
    を備える信号処理装置。
  2. 前記重み係数は、
    前記誤差を前記第2信号の信号強度より大きくするための係数である、
    請求項1に記載の信号処理装置。
  3. 前記信号処理部は、
    前記入力信号に対する線形変換と非線形変換の組合せである前記第1信号処理を行う、
    請求項1または請求項2に記載の信号処理装置。
  4. 前記信号処理部は、
    ニューラルネットワークにより前記第1信号処理を行う、
    請求項3に記載の信号処理装置。
  5. 前記第1信号の第1統計情報、および、前記第2信号の第2統計情報、の少なくとも一方に基づいて、前記重み係数を算出する第1算出部を備え、
    前記第1信号調整部は、
    算出された前記重み係数を前記第1信号および前記第1復元信号の少なくとも一方に乗算する、
    請求項1〜請求項4の何れか1項に記載の信号処理装置。
  6. 前記誤差に基づいて、前記重み係数を算出する第2算出部を備え、
    前記第1信号調整部は、
    算出された前記重み係数を前記第1信号および前記第1復元信号の少なくとも一方に乗算する、
    請求項1〜請求項4の何れか1項に記載の信号処理装置。
  7. 前記第1復元信号に、前記第1信号調整部が用いた前記重み係数を補正した補正重み係数を乗算し、第2復元信号を出力する第2信号調整部を備える、
    請求項1〜請求項6の何れか1項に記載の信号処理装置。
  8. 前記第2信号調整部は、
    前記重み係数を前記第1信号と前記第2信号とのパワー比であるノイズレベルを用いて補正した前記補正重み係数を導出し、前記第1復元信号に該補正重み係数を乗算した前記第2復元信号を出力する、
    請求項7に記載の信号処理装置。
  9. 前記第1復元信号の特徴情報の属性を推定する推定部、
    を備える請求項1〜請求項8の何れか1項に記載の信号処理装置。
  10. 前記第2信号は、電力、振幅、および分散の少なくとも1つが前記第1信号より大きい、
    請求項1〜請求項9の何れか1項に記載の信号処理装置。
  11. 前記第1信号は、前記第2信号に比べて疎な信号である、
    請求項1〜請求項10の何れか1項に記載の信号処理装置。
  12. 第1信号に第2信号が重畳された入力信号に対して、少なくとも1以上のパラメータを用いた第1信号処理を行い、前記第1信号を復元した第1復元信号を出力する信号処理部と、
    前記第1信号および前記第1復元信号の少なくとも一方に重み係数を乗算し、補正第1信号および補正第1復元信号を出力する第1信号調整部と、
    前記補正第1信号と前記補正第1復元信号との誤差を用いて前記パラメータを更新する更新部と、
    前記第1復元信号に、前記第1信号調整部が用いた前記重み係数を補正した補正重み係数を乗算し、第2復元信号を出力する第2信号調整部と、を備える、
    信号処理装置。
  13. 第1信号処理装置と、第2信号処理装置と、を備えた信号処理システムであって、
    前記第1信号処理装置は、
    第1信号に第2信号が重畳された入力信号に対して、少なくとも1以上のパラメータを用いた第1信号処理を行い、前記第1信号を復元した第1復元信号を出力する信号処理部と、
    前記第1信号および前記第1復元信号の少なくとも一方に重み係数を乗算し、補正第1信号および補正第1復元信号を出力する第1信号調整部と、
    前記補正第1信号と前記補正第1復元信号との誤差を用いて前記パラメータを更新する更新部と、
    を備え、
    前記第2信号処理装置は、
    前記第1復元信号に、前記第1信号調整部が用いた前記重み係数を補正した補正重み係数を乗算し、第2復元信号を出力する第2信号調整部を備える、
    信号処理システム。
  14. コンピュータが、
    第1信号に第2信号が重畳された入力信号に対して、少なくとも1以上のパラメータを用いた第1信号処理を行い、前記第1信号を復元した第1復元信号を出力し、
    前記第1信号および前記第1復元信号の少なくとも一方に重み係数を乗算し、補正第1信号および補正第1復元信号を出力し、
    前記補正第1信号と前記補正第1復元信号との誤差を用いて前記パラメータを更新する、
    信号処理方法。
  15. 第1信号に第2信号が重畳された入力信号に対して、少なくとも1以上のパラメータを用いた第1信号処理を行い、前記第1信号を復元した第1復元信号を出力するステップと、
    前記第1信号および前記第1復元信号の少なくとも一方に重み係数を乗算し、補正第1信号および補正第1復元信号を出力するステップと、
    前記補正第1信号と前記補正第1復元信号との誤差を用いて前記パラメータを更新するステップと、
    をコンピュータに実行させるためのプログラム。
JP2019103658A 2019-06-03 2019-06-03 信号処理装置、信号処理システム、信号処理方法、およびプログラム Active JP7051749B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2019103658A JP7051749B2 (ja) 2019-06-03 2019-06-03 信号処理装置、信号処理システム、信号処理方法、およびプログラム
US16/798,534 US20200380281A1 (en) 2019-06-03 2020-02-24 Signal processing apparatus, signal processing system, signal processing method, and computer program product

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019103658A JP7051749B2 (ja) 2019-06-03 2019-06-03 信号処理装置、信号処理システム、信号処理方法、およびプログラム

Publications (2)

Publication Number Publication Date
JP2020197906A true JP2020197906A (ja) 2020-12-10
JP7051749B2 JP7051749B2 (ja) 2022-04-11

Family

ID=73551291

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019103658A Active JP7051749B2 (ja) 2019-06-03 2019-06-03 信号処理装置、信号処理システム、信号処理方法、およびプログラム

Country Status (2)

Country Link
US (1) US20200380281A1 (ja)
JP (1) JP7051749B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022112979A1 (en) 2020-11-30 2022-06-02 Ricoh Company, Ltd. Liquid composition set, porous resin manufacturing apparatus, and porous resin manufacturing method

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0462599A (ja) * 1990-07-02 1992-02-27 N T T Data Tsushin Kk 雑音除去装置
JPH0756877A (ja) * 1993-08-11 1995-03-03 Toshiba Corp ニューラルネットワーク装置
JPH09237260A (ja) * 1996-02-29 1997-09-09 Toshiba Corp 多層神経回路網学習装置

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11416742B2 (en) * 2017-11-24 2022-08-16 Electronics And Telecommunications Research Institute Audio signal encoding method and apparatus and audio signal decoding method and apparatus using psychoacoustic-based weighted error function
CN110444214B (zh) * 2017-11-24 2021-08-17 深圳市腾讯计算机系统有限公司 语音信号处理模型训练方法、装置、电子设备及存储介质
JP6773707B2 (ja) * 2018-03-20 2020-10-21 株式会社東芝 信号処理装置、信号処理方法およびプログラム
US10726858B2 (en) * 2018-06-22 2020-07-28 Intel Corporation Neural network for speech denoising trained with deep feature losses

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0462599A (ja) * 1990-07-02 1992-02-27 N T T Data Tsushin Kk 雑音除去装置
JPH0756877A (ja) * 1993-08-11 1995-03-03 Toshiba Corp ニューラルネットワーク装置
JPH09237260A (ja) * 1996-02-29 1997-09-09 Toshiba Corp 多層神経回路網学習装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022112979A1 (en) 2020-11-30 2022-06-02 Ricoh Company, Ltd. Liquid composition set, porous resin manufacturing apparatus, and porous resin manufacturing method

Also Published As

Publication number Publication date
US20200380281A1 (en) 2020-12-03
JP7051749B2 (ja) 2022-04-11

Similar Documents

Publication Publication Date Title
US20180132049A1 (en) Non-linear control of loudspeakers
US10080085B2 (en) Loudspeaker nonlinear compensation method and apparatus
MXPA05008740A (es) Metodo y aparato para el mejoramiento de lenguaje multi-sensorial.
US20120230503A1 (en) Entrainment avoidance with pole stabilization
JP6533340B2 (ja) ビーム形成用途のための適応的位相歪曲のない振幅応答等化
JP2008192136A (ja) 変換器パラメータの最適推定装置および方法
JP7051749B2 (ja) 信号処理装置、信号処理システム、信号処理方法、およびプログラム
WO2004090782A1 (en) Accurate linear parameter estimation with noisy inputs
JP2000232384A (ja) データ処理装置およびデータ処理方法
CN116884429B (zh) 一种基于信号增强的音频处理方法
JP2020177582A (ja) 学習装置、学習方法、プログラムおよび認識装置
JP2019035862A (ja) 入力音マスク処理学習装置、入力データ処理関数学習装置、入力音マスク処理学習方法、入力データ処理関数学習方法、プログラム
KR101707337B1 (ko) 영상 디노이징을 위한 다중해상도 nlm 필터링 방법
CN113299284B (zh) 一种基于自适应滤波的语音识别装置、方法、设备及介质
CN105657248A (zh) 控制设备及方法、图像处理设备、系统及方法和镜头设备
US20210232947A1 (en) Signal processing device, signal processing method, and computer program product
US9654156B2 (en) Nonlinear compensating apparatus and method, transmitter and communication system
CN110610714B (zh) 一种音频信号增强处理的方法和相关装置
JP4473709B2 (ja) 信号推定方法、信号推定装置、信号推定プログラム及びその記録媒体
WO2022223132A1 (en) Error correction of head-related filters
US9848261B2 (en) Apparatus for removing howling and method for removing howling
JP2021039426A (ja) 推定装置、推定方法及びプログラム
EP4124016A1 (en) Data generating method, learning method, estimating method, data generating device, and program
JP4225039B2 (ja) データ処理装置および方法、記録媒体、並びにプログラム
KR101459317B1 (ko) 마이크로폰 어레이를 통해 획득한 음원 신호를 보정하는방법 및 장치

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210311

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220216

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220301

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220330

R150 Certificate of patent or registration of utility model

Ref document number: 7051749

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150