JP2021001964A - 異常音検知システム、擬似音生成システム、および擬似音生成方法 - Google Patents
異常音検知システム、擬似音生成システム、および擬似音生成方法 Download PDFInfo
- Publication number
- JP2021001964A JP2021001964A JP2019115257A JP2019115257A JP2021001964A JP 2021001964 A JP2021001964 A JP 2021001964A JP 2019115257 A JP2019115257 A JP 2019115257A JP 2019115257 A JP2019115257 A JP 2019115257A JP 2021001964 A JP2021001964 A JP 2021001964A
- Authority
- JP
- Japan
- Prior art keywords
- spectrogram
- sound
- pseudo
- statistics
- component
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000002159 abnormal effect Effects 0.000 title claims abstract description 40
- 238000001514 detection method Methods 0.000 title claims abstract description 36
- 238000004519 manufacturing process Methods 0.000 title 2
- 238000004364 calculation method Methods 0.000 claims abstract description 43
- 239000013598 vector Substances 0.000 claims description 34
- 239000011159 matrix material Substances 0.000 claims description 21
- 238000000034 method Methods 0.000 claims description 18
- 239000000284 extract Substances 0.000 claims description 12
- 238000013528 artificial neural network Methods 0.000 claims description 11
- 238000013507 mapping Methods 0.000 claims description 10
- 230000000737 periodic effect Effects 0.000 abstract description 10
- 230000005540 biological transmission Effects 0.000 abstract description 4
- 238000012544 monitoring process Methods 0.000 description 39
- 230000005856 abnormality Effects 0.000 description 20
- 230000006870 function Effects 0.000 description 14
- 238000004891 communication Methods 0.000 description 11
- 230000008569 process Effects 0.000 description 11
- 238000010586 diagram Methods 0.000 description 10
- 238000012545 processing Methods 0.000 description 10
- 230000008859 change Effects 0.000 description 5
- 238000006243 chemical reaction Methods 0.000 description 5
- 238000009826 distribution Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 5
- 238000009434 installation Methods 0.000 description 5
- 238000001228 spectrum Methods 0.000 description 4
- 230000008901 benefit Effects 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 238000013527 convolutional neural network Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 238000013139 quantization Methods 0.000 description 2
- 230000001932 seasonal effect Effects 0.000 description 2
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 238000003064 k means clustering Methods 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 230000015654 memory Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/04—Time compression or expansion
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/24—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being the cepstrum
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01M—TESTING STATIC OR DYNAMIC BALANCE OF MACHINES OR STRUCTURES; TESTING OF STRUCTURES OR APPARATUS, NOT OTHERWISE PROVIDED FOR
- G01M13/00—Testing of machine parts
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/088—Non-supervised learning, e.g. competitive learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N7/00—Computing arrangements based on specific mathematical models
- G06N7/01—Probabilistic graphical models, e.g. probabilistic networks
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/27—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique
- G10L25/30—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique using neural networks
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/18—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Multimedia (AREA)
- Acoustics & Sound (AREA)
- Human Computer Interaction (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Theoretical Computer Science (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Molecular Biology (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- General Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Quality & Reliability (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Optimization (AREA)
- Mathematical Analysis (AREA)
- Computational Mathematics (AREA)
- Probability & Statistics with Applications (AREA)
- Algebra (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Medical Informatics (AREA)
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
Abstract
Description
マイクロホン101は設置した対象設備110の稼動音を、例えば所定の周期ごとに、またはユーザが指定した時刻ごとに、入力としてアナログ入力信号をAD変換器102に送る。
AD変換器102は入力されたアナログ入力信号をデジタル入力信号に変換し、音響監視端末103に送る。
音響監視端末103はデジタル入力信号を入力として、各周波数の振幅時系列の直流成分、周期成分、および、独立同分布成分それぞれの統計量(圧縮データ)に変換し、遠隔地の音響監視サーバ104に、無線ネットワークを含むネットワーク120を介して送る。
音響監視サーバ104は前記統計量を入力として、対象設備の稼動音を模擬した擬似音をデジタル出力信号としてDA変換器105に送る。
DA変換器105は入力されたデジタル出力信号をアナログ出力信号に変換し、ヘッドホン106に送り、ヘッドホン106から擬似音を出力する。
ここで、一般に人間の耳には実際の周波数の音がそのまま聞こえるわけではなく、ずれが生じ、可聴域の上限に近い音は実際の音よりも低めに聞こえる。このずれを人間の知覚する音の高さを測る尺度に調整した周波数をメル(尺度)周波数という。メル尺度で等間隔な特定の周波数帯のみを抽出するフィルタであるメルフィルタバンクを、パワースペクトログラムXに適用して、対数メルスペクトログラムYを計算する。
M行×T列の行列である対数メルスペクトログラムYの各成分値をy(m,t)と表すと、その時間差分信号Δは、M行×(T-1)列の行列となり、その成分値δy(m,t)=y(m,t)-y(m,t-1) と算出される。
統計量の組は、例えば、メル周波数ビンmの行の対数メルスペクトログラムYの各成分値y(m,t)の平均値μ(m)、標準偏差σ(m)、および、時間差分信号Δのメル周波数ビンmの行の各成分値δy(m,t)の標準偏差σΔ(m)である。平均値μ(m)は振幅時系列の直流成分を表し、標準偏差σ(m)は独立同分布成分を表す。σΔ(m) / σ(m)が振幅時系列の周期成分を表す。
この場合、統計量の組は、例えば、メル周波数ビンmの行の対数メルスペクトログラムYの各成分値y(m,t)の平均値μ(m)、および、y(m, t)に対する時間t方向のフーリエ変換によって得られる振幅スペクトラムが最大である交流成分の角周波数ω(m)、および、その振幅a(m)、および、残差e(m, t)の標準偏差σ_e(m)である。ただし、残差e(m, t)は数式(2)であらわされる。
ここで、擬似パワースペクトログラム^Xは周波数領域信号レベルであり、位相成分は消失しているので、Griffin-Limアルゴリズムを使用して位相成分を生成して時間領域の音響信号(時間領域擬似音)を復元する。
M行×T列の行列である擬似対数メルスペクトログラムZの各成分値をz(m,t)と表すと、その時間差分信号Δは、M行×(T-1)列の行列となり、その成分値δz(m,t)=z(m,t) - z(m,t-1) と算出される。
そして、その2M×(T-1)次元の行列の中から、2M×L次元の特徴量ベクトルを、1列ずつずらしながら、(T-L) 個{この場合には、例えば(T-L)通りある。}だけ抽出する。
正常音モデルデータベースに格納されるモデルパラメタは、例えばGMMの場合、Q個の各クラスタq = 1、・・・Qの平均ベクトル(2M×L次元)μq、各クラスタの共分散行列(2M×L×2M×L次元)Γq、各クラスタの重み係数(1次元)πqである。
音響監視端末103の異常検知部218で異常検知処理を実行する際に、正常音モデルデータベースから該当する正常音モデルが読み出されて送信される。
非定常成分除去部301は、パワー計算部203から送られたパワースペクトログラムXから非定常音を除去し、周期定常的な音のみを抽出し、対数メルスペクトログラム算出部204に送る。具体的な処理方法として、Harmonic/Percussive Sound Separation (HPSS) やNearest Neighbor filter (NN filter) を用いることができる。
擬似スペクトログラム直接復元部401は、ユーザが指定した時刻に対応するタイムスタンプの統計量の組をタイムスタンプ-統計量DB209から読み出し、読みだされた統計量の組 (μ(m)、σ(m)、σΔ(m)) から擬似パワースペクトログラム^Xを計算し、出力する。
擬似対数メルスペクトログラム生成部701は、統計量計算部206から送られた統計量の組 (μ(m)、σ(m)、σΔ(m)) から擬似対数メルスペクトログラムZを計算し、Δ(時間差分)計算部702に出力する。設備の稼動音が周期定常的な音であると仮定すれば、擬似対数メルスペクトログラムZの各成分z(m,t)は数式(1)で計算できる。
ただし、γは0〜1の定数パラメタ、ω = 2 sin^-1 (0.5 σΔ(m) / σ(m))、 φは任意、rは正規分布N(0, σ(m))に従う確率変数である。
102 AD変換器
103 音響監視端末
104 音響監視サーバ
105 DA変換器
106 ヘッドホン
110 対象設備
120 ネットワーク
201 音響信号録音部
202 周波数変換部
203 パワー計算部
204 対数メルスペクトログラム算出部
205 Δ(時間差分)計算部
206 統計量計算部
207 統計量送信部
208 統計量受信部
209 タイムスタンプ−統計量DB
210 擬似対数メルスペクトログラム生成部
211 擬似スペクトログラム復元部
212 周波数−時間領域変換部
213 擬似音再生部
214 Δ(時間差分)計算部
215 特徴量ベクトル作成部
216 正常音モデル学習部
217 特徴量ベクトル作成部
218 異常検知部
219 異常通知部
220 異常表示部
301 非定常成分除去部
401 擬似スペクトログラム直接復元部
402 対数メルスペクトログラム算出部
501 振幅時系列位相の抽出
601 ランダム位相生成部
701 擬似対数メルスペクトログラム生成部
702 Δ(時間差分)計算部
Claims (13)
- 音データに含まれる異常音を判定する異常音検知システムであって、前記異常音検知システムは、端末と、サーバと、を有し、
前記端末は:
前記音データを入力して、対数メルスペクトログラムを算出する対数メルスペクトログラム算出部と、
対数メルスペクトログラムから、各周波数の振幅時系列の直流成分、交流成分、雑音成分のそれぞれの大きさを表す統計量の組を計算する統計量計算部と、
前記統計量の組を送信する統計量送信部と、
を有し、
前記サーバは:
前記統計量の組を受信する統計量受信部と、
前記統計量の組から生成した擬似対数メルスペクトログラムから、特徴量ベクトルを抽出する特徴量ベクトル生成部と、
前記特徴量ベクトルを用いて正常音モデルを学習する正常音モデル学習部と、
を有し、
前記端末が、前記対数メルスペクトログラムから特徴量ベクトルを抽出し、前記サーバから正常音モデルを受信し、前記特徴量ベクトルが前記正常音モデルから生成される確率または距離に相当する値を算出し、該確率または距離に相当する値が所定の値未満であれば異常音を含むと判定して前記サーバへ報告することを特徴とする異常音検知システム。 - 前記対数メルスペクトログラム算出部が、対数メルスペクトログラムに代えて、オクターブバンドスペクトログラム、1/3オクターブバンドスペクトログラム、ガンマトーンスペクトログラム、または周波数パワー特性を表す任意のスペクトログラムを算出することを特徴とする請求項1に記載の異常音検知システム。
- 前記端末の前記対数メルスペクトログラム算出部の前段に、入力した前記音データから生成したパワースペクトログラムから非定常音を除去し、周期定常的な音を抽出する非定常成分除去部を更に備えることを特徴とする請求項1に記載の異常音検知システム。
- 前記サーバにおいて、
事前に診断対象の設備から録音した非圧縮の稼動音、および、そこから計算した各周波数の振幅時系列の直流成分、交流成分、雑音成分のそれぞれの大きさを表す統計量の組に基づいて、統計量の組から非圧縮の音のスペクトログラムへの写像を学習し、
学習した写像に基づいて、サーバが受信した統計量の組から擬似パワースペクトログラムを生成する擬似スペクトログラム直接復元部を更に備えることを特徴とする請求項1に記載の異常音検知システム。 - 前記学習した写像は、多層ニューラルネットワークでモデル化され、ランダム位相生成部が各周波数kの位相φ(k)をランダムに生成し、多層ニューラルネットワークの中間層の各周波数kの分岐の後ろの素子に入力する構成となることを特徴とする請求項4に記載の異常音検知システム。
- 前記端末が、前記統計量計算部が算出した統計量の組から擬似対数メルスペクトログラムを生成して、前記擬似対数メルスペクトログラムとその時間差分信号の組から特徴量ベクトルを抽出し、前記サーバから正常音モデルを受信し、前記特徴量ベクトルが前記正常音モデルから生成される確率を算出し、該確率が所定の確率未満であれば異常音を含むと判定して前記サーバへ報告することを特徴とする請求項1に記載の異常音検知システム。
- 擬似音生成システムは、端末と、サーバと、を有し、
前記端末は:
音データを入力して、対数メルスペクトログラムを算出する対数メルスペクトログラム算出部と、
対数メルスペクトログラムから、各周波数の振幅時系列の直流成分、交流成分、雑音成分のそれぞれの大きさを表す統計量の組を計算する統計量計算部と、
前記統計量の組を送信する統計量送信部と、
を有し、
前記サーバは:
前記統計量の組を受信する統計量受信部と、
前記統計量の組から生成した擬似対数メルスペクトログラムに対してメルフィルタバンクの擬似逆行列を乗算して擬似パワースペクトログラムを算出する擬似スペクトログラム復元部と、
前記擬似パワースペクトログラムに各周波数の位相成分を生成して組合せて時間領域のデジタル出力信号を出力する周波数−時間領域変換部と、
前記時間領域のデジタル出力信号を再生する擬似音再生部と、
を有することを特徴とする擬似音生成システム。 - 前記対数メルスペクトログラム算出部が、対数メルスペクトログラムに代えて、オクターブバンドスペクトログラム、1/3オクターブバンドスペクトログラム、ガンマトーンスペクトログラム、または周波数パワー特性を表す任意のスペクトログラムを算出することを特徴とする請求項7に記載の擬似音生成システム。
- 前記端末の前記対数メルスペクトログラム算出部の前段に、入力した前記音データから生成したパワースペクトログラムから非定常音を除去し、周期定常的な音を抽出する非定常成分除去部を更に備えることを特徴とする請求項7に記載の擬似音生成システム。
- 前記サーバにおいて、
事前に診断対象の設備から録音した非圧縮の稼動音、および、そこから計算した各周波数の振幅時系列の直流成分、交流成分、雑音成分のそれぞれの大きさを表す統計量の組に基づいて、統計量の組から非圧縮の音のスペクトログラムへの写像を学習し、
学習した写像に基づいて、サーバが受信した統計量の組から擬似パワースペクトログラムを生成する擬似スペクトログラム直接復元部を更に備えることを特徴とする請求項7に記載の擬似音生成システム。 - 前記学習した写像は、多層ニューラルネットワークでモデル化され、ランダム位相生成部が各周波数kの位相φ(k)をランダムに生成し、多層ニューラルネットワークの中間層の各周波数kの分岐の後ろの素子に入力する構成となることを特徴とする請求項10に記載の擬似音生成システム。
- マイクロホン、AD変換器を備えた端末が、
入力した音響信号からパワースペクトログラムを計算し、
前記パワースペクトログラムから対数メルスペクトログラムを算出し、
前記対数メルスペクトログラムから、各周波数の振幅時系列の直流成分、交流成分、雑音成分のそれぞれの大きさを表す統計量の組を計算し、
前記統計量の組をサーバへ送信し、
前記サーバが、
前記統計量の組を前記端末から受信し、
前記統計量の組から擬似対数メルスペクトログラムを生成し、
前記擬似対数メルスペクトログラムに対してメルフィルタバンクの擬似逆行列を乗算して擬似パワースペクトログラムを算出し、
前記擬似パワースペクトログラムに各周波数の位相成分を生成して組合せて時間領域のデジタル出力信号を生成し、
前記時間領域のデジタル出力信号を擬似音として再生する、
ことを特徴とする擬似音生成方法。 - 前記端末が前記パワースペクトログラムから算出する対数メルスペクトログラムに代えて、オクターブバンドスペクトログラム、1/3オクターブバンドスペクトログラム、ガンマトーンスペクトログラム、または周波数パワー特性を表す任意のスペクトログラムを算出することを特徴とする請求項12に記載の擬似音生成方法。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019115257A JP7385381B2 (ja) | 2019-06-21 | 2019-06-21 | 異常音検知システム、擬似音生成システム、および擬似音生成方法 |
CN202010459129.4A CN112116924B (zh) | 2019-06-21 | 2020-05-27 | 异常音检测系统、伪音生成系统及伪音生成方法 |
US16/892,936 US11164594B2 (en) | 2019-06-21 | 2020-06-04 | Abnormal sound detection system, artificial sound creation system, and artificial sound creating method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019115257A JP7385381B2 (ja) | 2019-06-21 | 2019-06-21 | 異常音検知システム、擬似音生成システム、および擬似音生成方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021001964A true JP2021001964A (ja) | 2021-01-07 |
JP7385381B2 JP7385381B2 (ja) | 2023-11-22 |
Family
ID=73798897
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019115257A Active JP7385381B2 (ja) | 2019-06-21 | 2019-06-21 | 異常音検知システム、擬似音生成システム、および擬似音生成方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US11164594B2 (ja) |
JP (1) | JP7385381B2 (ja) |
CN (1) | CN112116924B (ja) |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112397055B (zh) * | 2021-01-19 | 2021-07-27 | 北京家人智能科技有限公司 | 一种异常声音检测方法、装置和电子设备 |
CN112767960B (zh) * | 2021-02-05 | 2022-04-26 | 云从科技集团股份有限公司 | 一种音频降噪方法、系统、设备及介质 |
CN113077810A (zh) * | 2021-03-19 | 2021-07-06 | 杨予诺 | 一种基于β-VAE算法的声源分离方法 |
CN113488072A (zh) * | 2021-06-10 | 2021-10-08 | 东台科创机械实业有限公司 | 一种无线检测车辆异响的装置和方法 |
CN113326899A (zh) * | 2021-06-29 | 2021-08-31 | 西藏新好科技有限公司 | 一种基于深度学习模型的仔猪被压检测方法 |
CN113724725B (zh) * | 2021-11-04 | 2022-01-18 | 北京百瑞互联技术有限公司 | 一种蓝牙音频啸叫检测抑制方法、装置、介质及蓝牙设备 |
CN114299907B (zh) * | 2022-01-19 | 2024-07-05 | 东风汽车集团股份有限公司 | 一种减振器总成异响检测方法 |
CN116825131A (zh) * | 2022-06-24 | 2023-09-29 | 南方电网调峰调频发电有限公司储能科研院 | 融合频带自向下注意力机制的电厂设备状态听觉监测方法 |
CN114927141B (zh) * | 2022-07-19 | 2022-10-25 | 中国人民解放军海军工程大学 | 异常水声信号的检测方法及系统 |
CN115424635B (zh) * | 2022-11-03 | 2023-02-10 | 南京凯盛国际工程有限公司 | 一种基于声音特征的水泥厂设备故障诊断方法 |
CN116222997B (zh) * | 2023-03-07 | 2024-04-05 | 华北电力大学(保定) | 基于波束形成及时空网络的托辊故障声源距离估计方法 |
CN117059128A (zh) * | 2023-09-04 | 2023-11-14 | 深圳远大科技工程有限公司 | 基于声音识别的机房异常监测方法 |
CN118230758B (zh) * | 2024-05-27 | 2024-08-09 | 崂山国家实验室 | 基于编码器与卷积融合的水声目标识别方法及系统 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09166483A (ja) * | 1995-12-19 | 1997-06-24 | Hitachi Ltd | 機器監視方法及びその装置 |
JP2002140090A (ja) * | 2000-11-02 | 2002-05-17 | Toshiba Corp | 異常監視装置 |
JP2002257625A (ja) * | 2001-03-06 | 2002-09-11 | Kobe Steel Ltd | 異常診断装置 |
JP2003501925A (ja) * | 1999-06-07 | 2003-01-14 | エリクソン インコーポレイテッド | パラメトリックノイズモデル統計値を用いたコンフォートノイズの生成方法及び装置 |
JP2009175077A (ja) * | 2008-01-28 | 2009-08-06 | Koga:Kk | 異音判定装置 |
WO2018150616A1 (ja) * | 2017-02-15 | 2018-08-23 | 日本電信電話株式会社 | 異常音検出装置、異常度計算装置、異常音生成装置、異常音検出学習装置、異常信号検出装置、異常信号検出学習装置、これらの方法及びプログラム |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101236742B (zh) * | 2008-03-03 | 2011-08-10 | 中兴通讯股份有限公司 | 音乐/非音乐的实时检测方法和装置 |
US10026407B1 (en) * | 2010-12-17 | 2018-07-17 | Arrowhead Center, Inc. | Low bit-rate speech coding through quantization of mel-frequency cepstral coefficients |
JP5572541B2 (ja) | 2010-12-27 | 2014-08-13 | 株式会社日立超エル・エス・アイ・システムズ | ビデオエンコーダシステム |
CN102664006B (zh) * | 2012-04-14 | 2014-05-14 | 中国人民解放军国防科学技术大学 | 基于时频域分析的异常人声检测方法 |
CN104392717A (zh) * | 2014-12-08 | 2015-03-04 | 常州工学院 | 一种基于声道谱高斯混合建模的快速语音转换系统及其方法 |
JP6420198B2 (ja) * | 2015-04-23 | 2018-11-07 | 日本電信電話株式会社 | 閾値推定装置、音声合成装置、その方法及びプログラム |
JP6377592B2 (ja) * | 2015-11-09 | 2018-08-22 | 日本電信電話株式会社 | 異常音検出装置、異常音検出学習装置、これらの方法及びプログラム |
US10147415B2 (en) * | 2017-02-02 | 2018-12-04 | Microsoft Technology Licensing, Llc | Artificially generated speech for a communication session |
CN106941005A (zh) * | 2017-02-24 | 2017-07-11 | 华南理工大学 | 一种基于语音声学特征的声带异常检测方法 |
EP3424432B1 (en) * | 2017-07-04 | 2020-09-30 | Tata Consultancy Services Limited | Systems and methods for detecting pulmonary abnormalities using lung sounds |
US20200233397A1 (en) * | 2019-01-23 | 2020-07-23 | New York University | System, method and computer-accessible medium for machine condition monitoring |
-
2019
- 2019-06-21 JP JP2019115257A patent/JP7385381B2/ja active Active
-
2020
- 2020-05-27 CN CN202010459129.4A patent/CN112116924B/zh active Active
- 2020-06-04 US US16/892,936 patent/US11164594B2/en active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09166483A (ja) * | 1995-12-19 | 1997-06-24 | Hitachi Ltd | 機器監視方法及びその装置 |
JP2003501925A (ja) * | 1999-06-07 | 2003-01-14 | エリクソン インコーポレイテッド | パラメトリックノイズモデル統計値を用いたコンフォートノイズの生成方法及び装置 |
JP2002140090A (ja) * | 2000-11-02 | 2002-05-17 | Toshiba Corp | 異常監視装置 |
JP2002257625A (ja) * | 2001-03-06 | 2002-09-11 | Kobe Steel Ltd | 異常診断装置 |
JP2009175077A (ja) * | 2008-01-28 | 2009-08-06 | Koga:Kk | 異音判定装置 |
WO2018150616A1 (ja) * | 2017-02-15 | 2018-08-23 | 日本電信電話株式会社 | 異常音検出装置、異常度計算装置、異常音生成装置、異常音検出学習装置、異常信号検出装置、異常信号検出学習装置、これらの方法及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
US20200402527A1 (en) | 2020-12-24 |
CN112116924B (zh) | 2024-02-13 |
CN112116924A (zh) | 2020-12-22 |
JP7385381B2 (ja) | 2023-11-22 |
US11164594B2 (en) | 2021-11-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7385381B2 (ja) | 異常音検知システム、擬似音生成システム、および擬似音生成方法 | |
CN111768795B (zh) | 语音信号的噪声抑制方法、装置、设备及存储介质 | |
US10924849B2 (en) | Sound source separation device and method | |
US9099066B2 (en) | Musical instrument pickup signal processor | |
US20150043737A1 (en) | Sound detecting apparatus, sound detecting method, sound feature value detecting apparatus, sound feature value detecting method, sound section detecting apparatus, sound section detecting method, and program | |
WO2022012195A1 (zh) | 音频信号处理方法和相关装置 | |
CN103546853A (zh) | 一种基于短时傅里叶变换的扬声器异常音检测方法 | |
Hussain et al. | Vibration analysis and time series prediction for wind turbine gearbox prognostics | |
US10262677B2 (en) | Systems and methods for removing reverberation from audio signals | |
TW201432672A (zh) | 增強回響化語音的方法與裝置 | |
KR20220102940A (ko) | 사운드 기반 다중 기기 운영 모니터링 방법과 이를 위한 시스템 | |
CN113792657A (zh) | 提取声学信号识别与盲解卷积算法的齿轮箱故障的方法 | |
US20230136220A1 (en) | Quantifying Signal Purity by means of Machine Learning | |
CN114627897A (zh) | 音频信号异常监测方法、装置、设备、介质和程序产品 | |
Suhaimy et al. | Classification of ambulance siren sound with MFCC-SVM | |
CN115116469A (zh) | 特征表示的提取方法、装置、设备、介质及程序产品 | |
US20230419984A1 (en) | Apparatus and method for clean dialogue loudness estimates based on deep neural networks | |
JP2013182161A (ja) | 音響処理装置およびプログラム | |
US20230067510A1 (en) | Signal processing apparatus, signal processing method, and program | |
CN117409799B (zh) | 音频信号处理系统及方法 | |
JP7304301B2 (ja) | 音響診断方法、音響診断システム、及び音響診断プログラム | |
Singh et al. | An Efficient Method and Hardware System for Monitoring of Illegal Logging Events in Forest | |
Shaikh et al. | Sound Database of Industrial Machine for Audio Anomaly Detection | |
Laña et al. | Industrial Pump Condition Monitoring with Audio Samples: a Low-Rank Linear Autoencoder Feature Extraction Approach | |
Rakonjac et al. | One Realization of an Industrial Device for Machine State Estimation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220308 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230117 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230124 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230221 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230613 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230719 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20231031 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20231110 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7385381 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |