JP2021071586A - 音抽出システム及び音抽出方法 - Google Patents

音抽出システム及び音抽出方法 Download PDF

Info

Publication number
JP2021071586A
JP2021071586A JP2019197987A JP2019197987A JP2021071586A JP 2021071586 A JP2021071586 A JP 2021071586A JP 2019197987 A JP2019197987 A JP 2019197987A JP 2019197987 A JP2019197987 A JP 2019197987A JP 2021071586 A JP2021071586 A JP 2021071586A
Authority
JP
Japan
Prior art keywords
sound
distance
sound extraction
unit
diagnosis target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2019197987A
Other languages
English (en)
Other versions
JP7373358B2 (ja
Inventor
洋平 川口
Yohei Kawaguchi
洋平 川口
佳小里 末房
Kaori Suefusa
佳小里 末房
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2019197987A priority Critical patent/JP7373358B2/ja
Publication of JP2021071586A publication Critical patent/JP2021071586A/ja
Application granted granted Critical
Publication of JP7373358B2 publication Critical patent/JP7373358B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

【課題】入力信号から外来の雑音を除去し、診断対象の音を選択的に抽出すること。【解決手段】ユーザにマイクロホン102を移動させて診断対象105からの距離が異なる複数の位置で録音させることで、可搬端末101は、複数の入力音を距離と対応付けて取得し、複数の入力音についてそれぞれ特徴量を求め、特徴量と対応する距離との組み合わせを複数用いて、診断対象105の音の特徴量を抽出する。抽出した診断対象105の音の特徴量は、正常音モデルと比較することで、診断対象105の異常の検知に用いることができる。【選択図】 図1

Description

本発明は、音抽出システム及び音抽出方法に関する。
設備の異常や故障予兆などの状態は、音に現れることが多い。そこで、設備の状態を把握するために設備の稼動音に基づく診断は重要である。ただし、診断対象以外に由来する雑音の影響で診断を誤りうることがある。したがって、入力信号から、外来の雑音を除去し、診断対象の音を選択的に抽出する音抽出処理が求められる。
音抽出の問題を解決する方法として、特開2009−128906(特許文献1)がある。この公報には、「制約付き非負行列因数分解(NMF)を混成信号に適用する工程であって、前記NMFは雑音除去モデルによって制約され、前記雑音除去モデルはトレーニング音響信号とトレーニング雑音信号とのトレーニング基礎マトリクスおよび該トレーニング基礎マトリクスの重みの統計値とからなり、前記適用により前記混成信号の内の前記音響信号の基底行列の重みを生成する工程と、前記音響信号を再構成するために、該音響信号の基底行列の重みと、前記トレーニング音響信号と前記トレーニング雑音信号とのトレーニング基礎マトリクスとの積を取る工程と、を含む、音響信号と雑音信号とを含む混成信号の雑音を除去するための方法。」と記載されている。
特開2009−128906号公報
特許文献1で開示された発明は、雑音が混合した信号から、NMFを使って音声と雑音に分離する。ただし、抽出したい音声と、除去したい雑音の両方の学習データが与えられている条件でしか機能しない。例えば、診断対象の設備の稼働音に異常があったとしても、異常時の音を事前に学習することは困難であるため、特許文献1の技術で抽出することはできないのである。雑音を小さく、診断対象の音を大きくする方法として、診断対象にマイクロホンをできるだけ近づけて録音するという方法がある。ただし、環境雑音が著しく大きい場合にはそれでも不十分である。
そこで、本発明では、入力信号から外来の雑音を除去し、診断対象の音を選択的に抽出する音抽出処理を課題とする。
上記課題を解決するために、例えば特許請求の範囲に記載の構成を採用する。すなわち、診断対象からの距離が異なる複数の位置で録音した複数の入力音を距離と対応付けて取得し、複数の入力音についてそれぞれ特徴量を求め、特徴量と対応する距離との組み合わせを複数用いて、診断対象の音の特徴量を抽出する。
本発明によれば、入力信号から外来の雑音を除去し、診断対象の音を選択的に抽出することができる。上記した以外の課題、構成及び効果は、以下の実施形態の説明により明らかにされる。
実施例のハードウェア構成の説明図。 実施例の正常音モデルの学習時の処理に係る機能ブロック図。 実施例の異常検知実行時の処理に係る機能ブロック図。 複数距離入力音取得部による録音に係る処理手順を示すフローチャート。 距離別の正常音モデルの学習時の処理に係る機能ブロック図。 距離別の異常検知実行時の処理に係る機能ブロック図。 距離−音量制約付き音抽出部による音抽出の処理手順を示すフローチャート。 音抽出の第1の変形例を示すフローチャート。 音抽出の第2の変形例を示すフローチャート。
以下、実施例を、図面を用いて説明する。
図1は、実施例のハードウェア構成の説明図である。図1に示すように、可搬端末101は、マイクロホン102、AD変換器103、測距センサ104を備えており、ユーザが持って移動することが可能な端末であり、例えばタブレット端末である。
マイクロホン102はアナログ入力信号をAD変換器103に送る。AD変換器103はアナログ入力信号をデジタル出力信号に変換し、可搬端末101に送る。測距センサ104は診断対象105からの距離を計測し、可搬端末101に送る。可搬端末101に測距センサ104が接続されていない場合は、ユーザ自身が別途距離を測ることで代替してもよい。なお、診断対象105は、例えば工場の設備として設置された装置などである。
可搬端末101は、そのディスプレイを通して、診断対象105からの距離の指示値(短距離r1、長距離r2など)と、現在の診断対象105からの距離rを表示する。これらの表示により、ユーザは容易に距離rを指示値にすることができる。また、録音停止中であれば、録音可否と録音開始ボタンを表示する。距離rと指示値との差の絶対値が閾値eps以上であれば録音不可の表示をする。そうでなければ録音可の表示をして録音開始ボタンを有効にして押下を可能とする。これにより、正確な距離で安定的に録音することができる。録音開始後、録音中は、全録音時間T、録音開始からの経過時間t、残りの録音時間(T−t)を表示する。この表示は、録音条件の安定化、及び録音中のユーザの心理負担の軽減の効果を有する。
ユーザは、診断対象105からの距離が、短距離r1、長距離r2などの異なる複数の位置に可搬端末101を移動させて録音を行う。この録音結果は、診断対象105の音と背景雑音106とを含むものであり、診断対象105の音の正常音モデルの学習と、診断対象105の異常検知に用いられる。
具体的には、まず、診断対象105である装置が適正に動作している状態で、短距離r1での録音と長距離r2での録音を行い、複数距離の録音結果から診断対象105の音の特徴を抽出し、正常音モデルとして学習する。その後、診断対象105の異常検知を実行するときに、改めて短距離r1での録音と長距離r2での録音を行い、複数距離の録音結果から診断対象105の音の特徴を抽出し、正常音モデルと比較することで異常の検知を行う。
図2は、実施例の正常音モデルの学習時の処理に係る機能ブロック図である。正常音モデルの学習時の一連の処理は可搬端末101上において行っても良く、別のコンピュータやサーバ上で行っても良い。複数距離入力音取得部201は、診断対象105から複数の距離で録音されたデジタル入力音を距離に対応付けて取得する。デジタル入力音としては、AD変換器103が出力するデジタル出力信号を用いる。距離は、測距センサ104の出力を用いることができる。例えば、診断対象105からの距離が、短距離r1、長距離r2、などと異なる複数の位置に可搬端末101を移動させて、ユーザに録音を実行させることで複数の距離とデジタル入力音とを対応付けて取得すればよい。
複数距離入力音取得部201は、デジタル入力音と距離時系列を出力する。複数距離入力音取得部201が出力するデジタル入力音は、時間軸に沿って信号値を示す時間領域の信号である。距離時系列は、デジタル入力信号の時間軸に録音時の距離を値として与えたものである。短距離r1での録音と長距離r2での録音は個別に行われ、時間的な連続性を有さないが、複数距離入力音取得部201は、それぞれの録音結果を連続させて1つのデジタル入力音として出力する。このとき、距離時系列は、連続した時系列に対してそれぞれの録音距離を示す1つのデータとなる。
前処理部202は、デジタル入力音をフレームごとに分割し、そのフレームに窓関数を乗算し、窓関数乗算後の信号に短時間フーリエ変換を施して、周波数領域信号を計算する。周波数領域信号は、フレームサイズがNであれば、(N/2+1)=M個の周波数ビンそれぞれに1個の複素数が対応する、M個の複素数の組である。さらに、周波数領域信号から入力音スペクトログラム(パワースペクトログラムまたは振幅スペクトログラム)を計算する。
距離−音量制約付き音抽出部203は、入力音スペクトログラムおよび距離時系列を元に、診断対象抽出音スペクトログラムを抽出する。正常音モデル学習部204は、過去に得られた多数の診断対象抽出音スペクトログラムを元に、連続するLフレームからなる特徴量ベクトルの正常時の分布のモデルを学習し、そのモデルを正常音モデルデータベース205に格納する。
正常音モデルとして、混合ガウス分布(GMM)、1クラスサポートベクター分類器、部分空間法、局所部分空間法、k-meansクラスタリング、Deep Neural Network (DNN) autoencoder、Convolutional Neural Network (CNN) autoencoder、Long Short Term Memory (LSTM) autoencoder、variational autoencoder (VAE) などを用いてよい。
各正常音モデルには、それぞれのモデルに適したアルゴリズムが知られており、それを用いて学習を行う。例えば、GMMであればEMアルゴリズムにより、あらかじめ定めたクラスタ数の個数だけのガウス分布の組み合わせによるあてはめがなされる。学習された正常音モデルは、算出されたモデルパラメタによって規定される。そのモデルパラメタ全てを図示していない正常音モデルデータベースに格納する。
図3は、実施例の異常検知実行時の処理に係る機能ブロック図である。異常検知実行時の一連の処理は、可搬端末101上において行われる。複数距離入力音取得部201から距離−音量制約付き音抽出部203までの処理は図2と同一である。
異常検知部301は、正常音モデルデータベース205から正常音モデルを読み出し、診断対象抽出音スペクトログラムに対して異常検知処理を実行する。すなわち、連続するLフレームからなる特徴量ベクトルの時系列を計算し、その時系列が正常音モデルから十分な確率で生成されうるかどうかを判定する。
例えば、正常音モデルがGMMの場合、M×L次元の特徴量ベクトルvが正常音モデル(モデルパラメタΘ=((μ1、Γ1、π1)、・・・(μq、Γq、πq) 、(μQ、ΓQ、πQ))から生成される確率p(v|Θ)を、次式により計算する。
Figure 2021071586
ここで、
Figure 2021071586
例えば、前記確率p(v | Θ)の負の対数尤度 - log p(v | Θ) を推定異常度と定義し、出力する。
正常音モデルとしてDeep Neural Network (DNN) autoencoderを用いた場合は、SGD、Momentum SGD、AdaGrad、RMSprop、AdaDelta、Adamなどの最適化アルゴリズムによって、正常音の特徴量ベクトルを入力した際に、入力した特徴量ベクトルと出力される特徴量ベクトルとの間の復元誤差が小さくなるように内部パラメタが最適化される。異常音の特徴量ベクトルを入力した場合、その間の復元誤差が大きくなることが期待される。したがって復元誤差を推定異常度と定義し、出力する。
異常表示部302は、前記推定異常度の値を表示し、さらに推定異常度の値が一定以上である場合には異常である旨を表示する。
図4は、複数距離入力音取得部201による録音に係る処理手順を示すフローチャートの例を示している。この例では、短距離r1と長距離r2の2通りの距離でユーザに録音をさせるよう制御する場合を示しているが、短距離r1及び長距離r2と同様の手順で3通り以上の距離で録音させても良い。
まず、S401において、複数距離入力音取得部201は、短距離r1での録音を指示する出力を行い、S402に進む。
S402において、複数距離入力音取得部201は、tに0を代入し、S403に進む。
S403において、複数距離入力音取得部201は、t<TであればS404に進み、そうでなければS408に進む。
S404において、測距センサ104で測距を実行し、現在の距離rを取得し、S405に進む。
S405において、複数距離入力音取得部201は、|r−r1|<epsであればS406に進み、そうでなければS401に戻る。
S406において、マイクロホン102とAD変換器103を用いて録音を実行し、S407に進む。
S407において、複数距離入力音取得部201は、tに対して、前回からの経過時間Δtを加算し、S403に戻る。
次に、S408において、複数距離入力音取得部201は、長距離r2での録音を指示し、S409に進む。
S409において、複数距離入力音取得部201は、tに0を代入し、S410に進む。
S410において、複数距離入力音取得部201は、t<TであればS411に進み、そうでなければ処理を終了する。
S411において、測距センサ104で測距を実行し、現在の距離rを取得し、S412に進む。
S412において、複数距離入力音取得部201は、|r−r2|<epsであればS413に進み、そうでなければS408に戻る。
S413において、マイクロホン102とAD変換器103を用いて録音を実行し、S414に進む。
S414において、複数距離入力音取得部201は、tに対して、前回からの経過時間Δtを加算し、S410に戻る。
ここで、正常音モデルのモデルパラメタの規模を抑えることができる変形例を開示する。図2及び図3に示した構成との違いは、距離毎に異なる正常音モデルを学習し、異常検知処理においても、その時の距離に対応した正常音モデルを用いる点である。
図5は、距離別の正常音モデルの学習時の処理に係る機能ブロック図である。複数距離入力音取得部201から距離−音量制約付き音抽出部203までの処理は図2と同一である。距離毎正常音モデル学習部501は、距離−音量制約付き音抽出部203が出力した診断対象抽出音スペクトログラムと複数距離入力音取得部201が出力した距離時系列とを用いて、距離毎に別の正常音モデルを学習し、距離毎正常音モデルデータベース502に格納する。各モデルの学習のアルゴリズムは正常音モデル学習部204と同一でよい。
図6は、距離別の異常検知実行時の処理に係るブロック図である。複数距離入力音取得部201から距離−音量制約付き音抽出部203までの処理は図2と同一である。距離毎異常検知部601は、距離−音量制約付き音抽出部203が出力した診断対象抽出音スペクトログラムと複数距離入力音取得部201が出力した距離時系列とを用いて、診断対象抽出音スペクトログラムを、録音時の距離毎に分割し、分割したスペクトログラムに対応した距離の正常音モデルを用いて異常検知を行い、推定異常度を出力する。
統合異常検知部602は、分割したスペクトログラム間にわたっての推定異常度を統合する。もし、事前に距離d毎のROC(Receiver Operating Characteristic)曲線におけるAUC(Area under the curve)をw_dとして計算している場合は、各距離dの異常度に、w_dが大きいほど大きくなる重み係数を乗算した値の総和を統合推定異常度として出力する。重み係数は例えば、−1.0/log(w_d)である。
異常表示部603は、前記統合推定異常度の値を表示し、さらに統合推定異常度の値が一定以上である場合には異常である旨を表示する。
図7は、距離−音量制約付き音抽出部203による音抽出の処理手順を示すフローチャートである。まず、S701において、距離−音量制約付き音抽出部203は、入力音スペクトログラムを行列Xとし、行列Xに対する教師なしNMFの初期化を実行する。例えば、各音源のアクティベーションと基底を乱数で初期化し、S702に進む。
S702において、距離−音量制約付き音抽出部203は、行列Xに対する教師なしNMFを実行し、S703に進む。
S703において、距離−音量制約付き音抽出部203は、教師なしNMFで得られたアクティベーションを録音時の距離d毎に分割し、S704に進む。アクティベーションは、入力音スペクトログラムにおける時間成分を示し、入力音の時間と距離の関係は距離時系列として与えられている。したがって、距離時系列から距離に対応する時間帯を特定し、距離に応じた時間帯でアクティベーションを分割することができる。
S704において、距離−音量制約付き音抽出部203は、基底kを選択して、S705に進む。
S705において、距離−音量制約付き音抽出部203は、選択した基底kについて、分割した時間内にわたるアクティベーションの平均値a_{k,d}を計算し、S706に進む。すなわち、a_{k,d}は、距離dで録音した時間帯における基底kのアクティベーションの平均値となる。
S706において、距離−音量制約付き音抽出部203は、a_{k,d}の大小順序が距離の逆数1/dの大小順序と一致するか否かを判定する。判定の結果、一致するならば(S706;Yes)、S707に進む。また、一致しなければ(S706;No)、S708に進む。
S707において、距離−音量制約付き音抽出部203は、選択した基底kを診断対象105の成分とみなして集合Sに格納し、S708に進む。
S708において、距離−音量制約付き音抽出部203は、全ての基底kを選択したかを判定する。判定の結果、未選択の基底kが残っていれば(S708;No)、S704に進む。そして、全ての基底kが選択済みであれば(S708;Yes)、S709に進む。
S709において、距離−音量制約付き音抽出部203は、診断対象音スペクトログラム復元を行う。具体的には、距離−音量制約付き音抽出部203は、集合Sの全要素kにわたって、アクティベーションW_kと基底ベクトルH_kとの乗算W_k H_kの総和^Xを計算する。距離−音量制約付き音抽出部203は、^Xを診断対象抽出音として出力し、処理を終了する。
図8は、音抽出の第1の変形例を示すフローチャートである。まず、S801において、距離−音量制約付き音抽出部203は、最長距離で録音した時刻のスペクトログラムである行列X_farに対する教師なしNMFの初期化を行い、S802に進む。
S802において、距離−音量制約付き音抽出部203は、行列X_farに対する教師なしNMFを行い、行列X_farに対する背景雑音のアクティベーションの初期解W_far_iniと背景雑音の基底ベクトルH_far_iniを出力し、S803に進む。
S803において、距離−音量制約付き音抽出部203は、入力音スペクトログラムである行列Xに対する半教師有りNMFの初期化を行う。すなわち、背景雑音のアクティベーションとして、最長距離で録音した時刻の初期解をW_far_iniとし、それ以外の時刻の初期解はW_far_iniの時間平均値とする。背景雑音の基底ベクトルにH_far_iniを格納する。診断対象音のアクティベーションとして、最長距離で録音した時刻の初期解に十分小さい正の値を格納し、それ以外の時刻の初期解には乱数を格納する。診断対象音の基底ベクトルに初期解として乱数を格納し、S804に進む。
S804において、距離−音量制約付き音抽出部203は、行列Xに対する半教師有りNMFを実行し、S805に進む。
S805において、距離−音量制約付き音抽出部203は、図7のS709と同様に診断対象音スペクトログラム復元を行い、処理を終了する。
図9は、音抽出の第2の変形例を示すフローチャートである。図9は、図8のS804に対応するS901において行列Xに対する距離正則化付き半教師有りNMFを実行する以外は図8と同じである。距離正則化とは、NMFの繰り返し処理毎に、距離がr倍である時刻のアクティベーションの平均値の比率が1/rとなるように、アクティベーションを距離毎に定数倍する処理である。
上述してきたように、本実施例に係る音抽出システム及び音抽出方法は、診断対象からの距離が異なる複数の位置で録音した複数の入力音を距離と対応付けて取得し、複数の入力音についてそれぞれ特徴量を求め、特徴量と対応する距離との組み合わせを複数用いて、診断対象の音の特徴量を抽出する。このため、入力信号から外来の雑音を除去し、診断対象の音を選択的に抽出することができる。
そして、本実施例に係る音抽出システム及び音抽出方法は、抽出したい音と、除去したい雑音の両方の学習データが事前に与えられている条件を必要としない。例えば、事前に学習できる音が雑音の混ざった正常時の診断対象の音のみであってもよい。また、診断対象の正常時の音だけでなく、事前の学習が困難な異常音も抽出することができる。
また、本実施例に係る音抽出システム及び音抽出方法は、同一のマイクロホンを移動させて複数の位置で録音した複数の入力音を用いて診断対象の音を抽出することができる。このため、可搬の端末装置単体で運用することが可能である。また、録音を行うべき位置をマイクロホンの位置との関係を出力してユーザを誘導することで、録音条件の安定化、及び録音中のユーザの心理負担の軽減の効果を奏することができる。
また、本実施例に係る音抽出システム及び音抽出方法は、抽出された診断対象の音の特徴量に基づいて推定異常度を計算することで、診断対象の異常を検知することができる。また、推定異常度に応じた表示により、ユーザに異常を認識させることができる。異常推定度は、例えば、抽出した診断対象の音の特徴量と診断対象の適正動作時の音の特徴量とを比較して求めればよい。さらに、診断対象の適正動作時の音の特徴量を正常音モデルとして予め学習することも可能である。
また、本実施例に係る音抽出システム及び音抽出方法は、複数の距離に対応する複数の特徴量に共通して存在し、距離に応じた大小関係を示す特徴成分を診断対象の音の特徴量として抽出することができる。すなわち、複数の距離で録音するので、短距離で録音した時刻に音量が大きく、長距離で録音した時刻に音量が小さい成分を診断対象音であると特定することができ、その成分だけを抽出することができる。また、大小関係のみではなく、距離に応じた変化を示す特徴成分を診断対象の音の特徴量として抽出することも可能である。
また、本実施例に係る音抽出システム及び音抽出方法は、複数の入力音についてそれぞれ周波数領域信号を計算し、それぞれの周波数領域信号からスペクトログラムを計算して、該スペクトログラムを特徴量として用いることができる。
本実施例では説明を省略したが、診断対象は、複数の動作モードを有する装置であってもよい。この場合、複数の動作モードのいずれかで適正に動作している状態で録音を行い、正常音モデルを学習する。
また、本実施例では、正常音モデルの学習を含めて説明を行ったが、正常音モデルは予め与えられていてもよい。また、本実施例では、診断対象の音を抽出したのち、異常の検知まで行う構成を例示して説明を行ったが、例えば抽出した診断対象音スペクトログラムから診断対象の音を再構成し、再構成した診断対象の音をユーザが聞いて異常の有無を判断することも可能である。また、本実施例では、指定した距離でそれぞれ録音を行う場合を例示したが、録音を継続したまま録音位置を移動させて、診断対象の音を抽出してもよい。
なお、本発明は上記した実施例に限定されるものではなく、様々な変形例が含まれる。例えば、上記した実施例は本発明を分かりやすく説明するために詳細に説明したものであり、必ずしも説明した全ての構成を備えるものに限定されるものではない。また、ある実施例の構成の一部を他の実施例の構成に置き換えることが可能であり、また、ある実施例の構成に他の実施例の構成を加えることも可能である。また、各実施例の構成の一部について、他の構成の追加・削除・置換をすることが可能である。
また、上記の各構成、機能、処理部、処理手段等は、それらの一部又は全部を、例えば集積回路で設計する等によりハードウェアで実現してもよい。また、上記の各構成、機能等は、プロセッサがそれぞれの機能を実現するプログラムを解釈し、実行することによりソフトウェアで実現してもよい。各機能を実現するプログラム、テーブル、ファイル等の情報は、メモリや、ハードディスク、SSD(Solid State Drive)等の記録装置、または、ICカード、SDカード、DVD等の記録媒体に置くことができる。
また、制御線や情報線は説明上必要と考えられるものを示しており、製品上必ずしも全ての制御線や情報線を示しているとは限らない。実際には殆ど全ての構成が相互に接続されていると考えてもよい。
101・・・可搬端末、102・・・マイクロホン、103・・・AD変換器、104・・・測距センサ、105・・・診断対象、106・・・背景雑音、201・・・複数距離入力音取得部、202・・・前処理部、203・・・距離−音量制約付き音抽出部、204・・・正常音モデル学習部、205・・・正常音モデルデータベース、301・・・異常検知部、302・・・異常表示部、501・・・距離毎正常音モデル学習部、502・・・距離毎正常音モデルデータベース、601・・・距離毎異常検知部、602・・・統合異常検知部、603・・・異常表示部

Claims (11)

  1. 診断対象からの距離が異なる複数の位置で録音した複数の入力音を前記距離と対応付けて取得する複数距離入力音取得部と、
    前記複数の入力音についてそれぞれ特徴量を求める前処理部と、
    前記特徴量と対応する距離との組み合わせを複数用いて、前記診断対象の音の特徴量を抽出する音抽出部と、
    を備えたことを特徴とする音抽出システム。
  2. 前記複数距離入力音取得部は、同一のマイクロホンを移動させて前記複数の位置で録音した複数の入力音を取得することを特徴とする請求項1に記載の音抽出システム。
  3. 前記複数距離入力音取得部は、マイクロホンと前記複数の位置との関係を出力して前記複数の位置への誘導を行い、前記マイクロホンを移動させて前記複数の位置で録音した複数の入力音を取得することを特徴とする請求項1に記載の音抽出システム。
  4. 前記音抽出部により抽出された前記診断対象の音の特徴量に基づいて、前記診断対象の異常を示す推定異常度を計算する異常検知部をさらに備えたことを特徴とする請求項1に記載の音抽出システム。
  5. 前記音抽出部により抽出された前記診断対象の音の特徴量に基づいて、前記診断対象の異常を示す推定異常度を計算する異常検知部と、
    前記推定異常度に応じた表示を行う異常表示部と
    をさらに備えたことを特徴とする請求項1に記載の音抽出システム。
  6. 前記音抽出部により抽出された前記診断対象の音の特徴量と前記診断対象の適正動作時の音の特徴量とを比較して、前記診断対象の異常を示す推定異常度を計算する異常検知部をさらに備えたことを特徴とする請求項1に記載の音抽出システム。
  7. 前記診断対象の適正動作時の音の特徴量を学習する学習部と、
    前記音抽出部により抽出された前記診断対象の音の特徴量と前記適正動作時の音の特徴量とを比較して、前記診断対象の異常を示す推定異常度を計算する異常検知部と
    をさらに備えたことを特徴とする請求項1に記載の音抽出システム。
  8. 前記音抽出部は、前記複数の距離に対応する複数の特徴量に共通して存在し、前記距離に応じた大小関係を示す特徴成分を前記診断対象の音の特徴量として抽出することを特徴とする請求項1に記載の音抽出システム。
  9. 前記音抽出部は、前記複数の距離に対応する複数の特徴量に共通して存在し、前記距離に応じた変化を示す特徴成分を前記診断対象の音の特徴量として抽出することを特徴とする請求項1に記載の音抽出システム。
  10. 前記前処理部は、前記複数の入力音についてそれぞれ周波数領域信号を計算し、それぞれの周波数領域信号からスペクトログラムを計算して、該スペクトログラムを前記特徴量とすることを特徴とする請求項1に記載の音抽出システム。
  11. 診断対象からの距離が異なる複数の位置で録音した複数の入力音を前記距離と対応付けて取得する複数距離入力音取得ステップと、
    前記複数の入力音についてそれぞれ特徴量を求める前処理ステップと、
    前記特徴量と対応する距離との組み合わせを複数用いて、前記診断対象の音の特徴量を抽出する音抽出ステップと
    を含むことを特徴とする音抽出方法。
JP2019197987A 2019-10-30 2019-10-30 音抽出システム及び音抽出方法 Active JP7373358B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019197987A JP7373358B2 (ja) 2019-10-30 2019-10-30 音抽出システム及び音抽出方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019197987A JP7373358B2 (ja) 2019-10-30 2019-10-30 音抽出システム及び音抽出方法

Publications (2)

Publication Number Publication Date
JP2021071586A true JP2021071586A (ja) 2021-05-06
JP7373358B2 JP7373358B2 (ja) 2023-11-02

Family

ID=75713678

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019197987A Active JP7373358B2 (ja) 2019-10-30 2019-10-30 音抽出システム及び音抽出方法

Country Status (1)

Country Link
JP (1) JP7373358B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113823291A (zh) * 2021-09-07 2021-12-21 广西电网有限责任公司贺州供电局 一种应用于电力作业中的声纹识别的方法及系统
WO2023199904A1 (ja) * 2022-04-15 2023-10-19 シャープ株式会社 異常診断システム及びプログラム

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004177359A (ja) * 2002-11-29 2004-06-24 Toshiba Eng Co Ltd 設備の運転状態音響監視方法および設備の運転状態音響監視装置
JP2006010631A (ja) * 2004-06-29 2006-01-12 Chugoku Electric Power Co Inc:The 音情報取得システム、音情報取得装置、非接触診断システム、及び非接触診断方法
JP2006060720A (ja) * 2004-08-24 2006-03-02 Hitachi Ltd 集音システム
JP2006300895A (ja) * 2005-04-25 2006-11-02 Matsushita Electric Works Ltd 設備監視方法および設備監視装置
JP2015192364A (ja) * 2014-03-28 2015-11-02 富士通株式会社 音声検査装置、音声検査方法、および音声検査プログラム
WO2017171051A1 (ja) * 2016-04-01 2017-10-05 日本電信電話株式会社 異常音検出学習装置、音響特徴量抽出装置、異常音サンプリング装置、これらの方法及びプログラム
JP2019144187A (ja) * 2018-02-23 2019-08-29 パナソニックIpマネジメント株式会社 診断方法、診断装置及び診断プログラム

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004177359A (ja) * 2002-11-29 2004-06-24 Toshiba Eng Co Ltd 設備の運転状態音響監視方法および設備の運転状態音響監視装置
JP2006010631A (ja) * 2004-06-29 2006-01-12 Chugoku Electric Power Co Inc:The 音情報取得システム、音情報取得装置、非接触診断システム、及び非接触診断方法
JP2006060720A (ja) * 2004-08-24 2006-03-02 Hitachi Ltd 集音システム
JP2006300895A (ja) * 2005-04-25 2006-11-02 Matsushita Electric Works Ltd 設備監視方法および設備監視装置
JP2015192364A (ja) * 2014-03-28 2015-11-02 富士通株式会社 音声検査装置、音声検査方法、および音声検査プログラム
WO2017171051A1 (ja) * 2016-04-01 2017-10-05 日本電信電話株式会社 異常音検出学習装置、音響特徴量抽出装置、異常音サンプリング装置、これらの方法及びプログラム
JP2019144187A (ja) * 2018-02-23 2019-08-29 パナソニックIpマネジメント株式会社 診断方法、診断装置及び診断プログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113823291A (zh) * 2021-09-07 2021-12-21 广西电网有限责任公司贺州供电局 一种应用于电力作业中的声纹识别的方法及系统
WO2023199904A1 (ja) * 2022-04-15 2023-10-19 シャープ株式会社 異常診断システム及びプログラム

Also Published As

Publication number Publication date
JP7373358B2 (ja) 2023-11-02

Similar Documents

Publication Publication Date Title
EP3142106A1 (en) Apparatus and method for generating acoustic model, and apparatus and method for speech recognition
JP4546767B2 (ja) 感情推定装置及び感情推定プログラム
JP2020126021A (ja) 異常音検知装置および異常音検知方法
JP6967197B2 (ja) 異常検出装置、異常検出方法及びプログラム
CN113192536B (zh) 语音质量检测模型的训练方法、语音质量检测方法及装置
JPWO2016117358A1 (ja) 検査データ処理装置および検査データ処理方法
JP7373358B2 (ja) 音抽出システム及び音抽出方法
CN104490417A (zh) 数字听诊器与心音信号的处理方法
JP6950504B2 (ja) 異常候補抽出プログラム、異常候補抽出方法および異常候補抽出装置
CN112967735A (zh) 语音质量检测模型的训练方法及语音质量的检测方法
Prasetio et al. Ensemble support vector machine and neural network method for speech stress recognition
JP2019066339A (ja) 音による診断装置、診断方法、および診断システム
Rahman et al. Dynamic time warping assisted svm classifier for bangla speech recognition
US20160366529A1 (en) Estimating parameter values for a lumped parameter model of a loudspeaker
CN115989465A (zh) 异常检测装置及异常检测程序
KR20220103370A (ko) 노이즈 필터를 이용한 이상치 탐지 방법 및 장치
JP6724290B2 (ja) 音響処理装置、音響処理方法、及び、プログラム
JP2021156631A (ja) 異常検知装置および方法
CN116712099A (zh) 基于多模态数据的胎心状态检测方法、电子设备、存储介质
US20190385590A1 (en) Generating device, generating method, and non-transitory computer readable storage medium
CN113925495B (zh) 结合统计学习和时频分析的动静脉瘘异常震颤信号识别系统及方法
JP6905892B2 (ja) 計算機システム
Neili et al. Gammatonegram based pulmonary pathologies classification using convolutional neural networks
CN117007914A (zh) 利用人工智能及信号处理的非接触式电力设备诊断方法
CA3164369A1 (en) Diagnosing respiratory maladies from subject sounds

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220627

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230515

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230523

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230719

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20231017

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20231023

R150 Certificate of patent or registration of utility model

Ref document number: 7373358

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150