JP7407382B2 - 音データ処理方法、音データ処理装置及びプログラム - Google Patents
音データ処理方法、音データ処理装置及びプログラム Download PDFInfo
- Publication number
- JP7407382B2 JP7407382B2 JP2020533417A JP2020533417A JP7407382B2 JP 7407382 B2 JP7407382 B2 JP 7407382B2 JP 2020533417 A JP2020533417 A JP 2020533417A JP 2020533417 A JP2020533417 A JP 2020533417A JP 7407382 B2 JP7407382 B2 JP 7407382B2
- Authority
- JP
- Japan
- Prior art keywords
- sound data
- learning
- sound
- similar
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012545 processing Methods 0.000 title claims description 218
- 238000003672 processing method Methods 0.000 title claims description 43
- 230000002159 abnormal effect Effects 0.000 claims description 282
- 238000010801 machine learning Methods 0.000 claims description 117
- 238000000034 method Methods 0.000 claims description 81
- 230000008569 process Effects 0.000 claims description 48
- 230000008859 change Effects 0.000 claims description 10
- 230000005856 abnormality Effects 0.000 description 73
- 230000010365 information processing Effects 0.000 description 33
- 238000010586 diagram Methods 0.000 description 24
- 230000006870 function Effects 0.000 description 19
- 238000012549 training Methods 0.000 description 16
- 238000004891 communication Methods 0.000 description 14
- 238000001514 detection method Methods 0.000 description 14
- 238000012360 testing method Methods 0.000 description 13
- 230000007423 decrease Effects 0.000 description 8
- 238000007689 inspection Methods 0.000 description 8
- 230000012447 hatching Effects 0.000 description 6
- 239000000203 mixture Substances 0.000 description 5
- 238000013135 deep learning Methods 0.000 description 4
- 238000013473 artificial intelligence Methods 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 3
- 230000007613 environmental effect Effects 0.000 description 3
- 238000001914 filtration Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 230000000052 comparative effect Effects 0.000 description 2
- 238000003066 decision tree Methods 0.000 description 2
- 238000005401 electroluminescence Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000012417 linear regression Methods 0.000 description 2
- 238000007477 logistic regression Methods 0.000 description 2
- 230000015654 memory Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000007637 random forest analysis Methods 0.000 description 2
- 238000010079 rubber tapping Methods 0.000 description 2
- 238000004088 simulation Methods 0.000 description 2
- 230000005236 sound signal Effects 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- 238000004148 unit process Methods 0.000 description 2
- 230000003936 working memory Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 230000003416 augmentation Effects 0.000 description 1
- 230000003190 augmentative effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000002354 daily effect Effects 0.000 description 1
- 238000013434 data augmentation Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 239000004519 grease Substances 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/10—Machine learning using kernel methods, e.g. support vector machines [SVM]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/01—Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N7/00—Computing arrangements based on specific mathematical models
- G06N7/01—Probabilistic graphical models, e.g. probabilistic networks
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Multimedia (AREA)
- Acoustics & Sound (AREA)
- Human Computer Interaction (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Medical Informatics (AREA)
- Mathematical Physics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Computing Systems (AREA)
- Evolutionary Computation (AREA)
- Data Mining & Analysis (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
- Testing And Monitoring For Control Systems (AREA)
Description
音データの機械学習を行う場合、学習用のデータが十分に得られない場合がある。機械学習では、一般的に学習のための多くのデータを必要とする。特にディープラーニング技術は、その階層の深さを活かすために大量のデータ(数万~数百万)を必要とする。しかし、利用シーンによっては学習用のデータが安易に得られないケースがある。特に音データは画像データよりも既存のデータとして得られるサンプルデータが少なく、設備検査の打音などのインターネットを用いて学習用のデータを検索収集する環境も整っていない。例えば、機械の稼動音、設備検査の打音などの音データの機械学習を行う場合、十分な量の学習用のデータを得られないという課題がある。
図1は、本実施の形態に係る音データ処理装置の構成の一例を示すブロック図である。音データ処理装置は、1つ又は複数のマイクロホン(マイク)10、AD変換器20、情報処理装置30、50を含む構成である。情報処理装置30、50は、例えばプロセッサ及びメモリを有するPC(Personal Computer)等のコンピュータにより構成され、本実施の形態に係る機械学習等に関する各種の情報処理を実行する。
実施の形態1では、取得した音データの類似環境を作成することにより、対象の音データの類似音を生成して学習用のデータの水増しを行い、音データの学習及び評価を行う例を示す。
実施の形態2では、学習用のデータとして正常音のみしか得られない場合に、異常音データベースを用いて模擬的な異常音を生成することにより、目的とする学習用のデータとしての異常音の音データを作り出して学習用のデータの水増しを行い、音データの学習及び評価を行う例を示す。
実施の形態3では、実施の形態2における処理を一部変更し、対象の音データに基づき設定される異常種類に応じて、模擬的な異常音を生成する例を示す。ここでは実施の形態2と異なる部分を中心に説明し、同様の構成及び機能については説明を省略する。
ケース1:異音の混入(正常時の音から異なる音が発生する)。ケース1は、例えば回転体のベアリング異常、ファンベルト異常、駆動系の異常接触などによって発生する異常である。
ケース2:ピーク周波数の変動(正常時の音のピーク周波数が上昇又は低下する)。ケース2は、例えば回転体の回転数の変化などによって発生する異常である。
ケース3:ピーク周波数の欠落(正常時の音のピーク周波数が欠落する)。ケース3は、例えば駆動系の接触部の変化などによって発生する異常である。
ケース4:音量の変化(正常時の音のレベルが上昇又は低下する)。ケース4は、例えば回転体又は駆動系の摩擦の増加又は減少などによって発生する異常である。
実施の形態4として、前述した実施の形態1、実施の形態2、実施の形態3のうちの少なくとも二つを組み合わせた態様の機能構成を採用することもできる。この実施の形態4では、例えば対象の正常音のみが取得可能な環境において、図7に示した実施の形態2の機能ブロックによって模擬異常音の音データを生成し、この模擬異常音を含む学習用の音データを元にして、さらに図2に示した実施の形態1の機能ブロックによって類似音の音データを生成し、模擬異常音及び類似音を含む学習用の音データを用いて機械学習を行う。このようにして、模擬異常音及び類似音を生成して学習用の音データの水増しを行い、大量の学習用データを用いた機械学習を可能とし、より的確な異音検知を実行できるようにする。
20 AD変換器
30 情報処理装置(端末装置)
40 通信路
50 情報処理装置(サーバ装置)
201 類似環境生成部
202、604 機械学習部
251 対象音データ
252、452、652 学習モデル
253 類似音データ
254 汎用音データベース
301、501 処理部
302、502 記憶部
303、503 格納部
304、504 通信インタフェース
401 判定部
451 検査音データ
453 判定結果
454 異常判定結果
601 正常音加工部
602 異常音選択部
603 ミキシング部
651 正常音データ
653 模擬異常音データ
654 異常音データベース
Claims (9)
- 対象の音データを取得し、前記音データの処理を行う処理部を有する音データ処理装置における音データ処理方法であって、
前記取得した対象音データに基づき、前記対象音データに類似する類似音となる複数の類似音データを生成するステップと、
前記複数の類似音データのうち機械学習において学習矛盾が生じるデータを判断するステップと、
前記取得した対象音データと、前記生成した前記複数の類似音データのうち前記学習矛盾が生じないと判断された類似音データとを学習用の音データとして用いて前記機械学習を行い、前記対象の音データに関する分類判定を行うための学習モデルを生成するステップと、
を有する、音データ処理方法。 - 請求項1に記載の音データ処理方法であって、
前記学習矛盾が生じるデータを判断するステップにおいて、
前記複数の類似音データのうち前記学習矛盾が生じると判断されたデータを破棄する、
音データ処理方法。 - 請求項2に記載の音データ処理方法であって、
前記類似音データを生成するステップにおいて、
前記対象音データの周波数特性、音量のうちの少なくとも一つを変化させて複数の前記類似音データを生成する、
音データ処理方法。 - 請求項3に記載の音データ処理方法であって、
前記類似音データを生成するステップにおいて、
前記対象音データの周波数特性を変化させるフィルタを用いて前記類似音データを生成する、
音データ処理方法。 - 請求項3に記載の音データ処理方法であって、
前記類似音データを生成するステップにおいて、
前記対象音データの周波数帯域全体の音量、又は特定の周波数帯域の音量を変化させる音量変化パラメータを用いて前記類似音データを生成する、
音データ処理方法。 - 請求項1に記載の音データ処理方法であって、
前記学習モデルを生成するステップにおいて、
前記対象の音データに関する分類判定として、前記対象の音データの異常音を判定して異音検知を行うための学習モデルを生成する、
音データ処理方法。 - 請求項1に記載の音データ処理方法であって、
前記学習モデルを生成するステップにおいて、
前記対象音データ及び前記類似音データとともに、汎用的な音を含む汎用音データを蓄積した汎用音データベースを前記学習用の音データとして用いて機械学習を行う、
音データ処理方法。 - 対象の音データを取得し、前記音データの処理を行う処理部を有する音データ処理装置であって、
前記処理部は、
前記取得した対象音データに基づき、前記対象音データに類似する類似音となる複数の類似音データを生成し、前記複数の類似音データのうち機械学習において学習矛盾が生じるデータを判断する類似環境生成部と、
前記取得した対象音データ、前記生成した前記複数の類似音データのうち前記学習矛盾が生じないと判断された類似音データを学習用の音データとして用いて前記機械学習を行い、前記対象の音データに関する分類判定を行うための学習モデルを生成する機械学習部と、
を有する、音データ処理装置。 - コンピュータである音データ処理装置に、
対象の音データを取得するステップと、
前記取得した対象音データに基づき、前記対象音データに類似する類似音となる複数の類似音データを生成するステップと、
前記複数の類似音データのうち機械学習において学習矛盾が生じるデータを判断するステップと、
前記取得した対象音データ、前記生成した前記複数の類似音データのうち前記学習矛盾が生じないと判断された類似音データを学習用の音データとして用いて前記機械学習を行い、前記対象の音データに関する分類判定を行うための学習モデルを生成するステップと、
を実行させるための、プログラム。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018144436 | 2018-07-31 | ||
JP2018144436 | 2018-07-31 | ||
JP2018144437 | 2018-07-31 | ||
JP2018144437 | 2018-07-31 | ||
PCT/JP2019/028229 WO2020026829A1 (ja) | 2018-07-31 | 2019-07-18 | 音データ処理方法、音データ処理装置及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2020026829A1 JPWO2020026829A1 (ja) | 2021-08-02 |
JP7407382B2 true JP7407382B2 (ja) | 2024-01-04 |
Family
ID=69230818
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020533417A Active JP7407382B2 (ja) | 2018-07-31 | 2019-07-18 | 音データ処理方法、音データ処理装置及びプログラム |
Country Status (3)
Country | Link |
---|---|
US (2) | US11830518B2 (ja) |
JP (1) | JP7407382B2 (ja) |
WO (1) | WO2020026829A1 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2023046893A (ja) * | 2021-09-24 | 2023-04-05 | 株式会社デンソー | 異音検出装置 |
JP2023169558A (ja) | 2022-05-17 | 2023-11-30 | トヨタ自動車株式会社 | 車両評価システム |
WO2024075634A1 (ja) * | 2022-10-04 | 2024-04-11 | ヤマハ株式会社 | 音波形の特性分布に係る表示方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010134367A (ja) | 2008-12-08 | 2010-06-17 | Mitsubishi Electric Corp | 電気機器 |
WO2015011791A1 (ja) | 2013-07-24 | 2015-01-29 | 株式会社日立製作所 | 異常検知評価システム |
JP2015161745A (ja) | 2014-02-26 | 2015-09-07 | 株式会社リコー | パターン認識システムおよびプログラム |
WO2017171051A1 (ja) | 2016-04-01 | 2017-10-05 | 日本電信電話株式会社 | 異常音検出学習装置、音響特徴量抽出装置、異常音サンプリング装置、これらの方法及びプログラム |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS56104246A (en) | 1980-01-23 | 1981-08-19 | Rion Co Ltd | Product inspecting apparatus by sound discrimination |
JP6377592B2 (ja) * | 2015-11-09 | 2018-08-22 | 日本電信電話株式会社 | 異常音検出装置、異常音検出学習装置、これらの方法及びプログラム |
-
2019
- 2019-07-18 US US17/264,194 patent/US11830518B2/en active Active
- 2019-07-18 JP JP2020533417A patent/JP7407382B2/ja active Active
- 2019-07-18 WO PCT/JP2019/028229 patent/WO2020026829A1/ja active Application Filing
-
2023
- 2023-10-18 US US18/489,246 patent/US20240046953A1/en active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010134367A (ja) | 2008-12-08 | 2010-06-17 | Mitsubishi Electric Corp | 電気機器 |
WO2015011791A1 (ja) | 2013-07-24 | 2015-01-29 | 株式会社日立製作所 | 異常検知評価システム |
JP2015161745A (ja) | 2014-02-26 | 2015-09-07 | 株式会社リコー | パターン認識システムおよびプログラム |
WO2017171051A1 (ja) | 2016-04-01 | 2017-10-05 | 日本電信電話株式会社 | 異常音検出学習装置、音響特徴量抽出装置、異常音サンプリング装置、これらの方法及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
US20240046953A1 (en) | 2024-02-08 |
WO2020026829A1 (ja) | 2020-02-06 |
US20210304786A1 (en) | 2021-09-30 |
JPWO2020026829A1 (ja) | 2021-08-02 |
US11830518B2 (en) | 2023-11-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20200233397A1 (en) | System, method and computer-accessible medium for machine condition monitoring | |
JP7407382B2 (ja) | 音データ処理方法、音データ処理装置及びプログラム | |
US11022633B2 (en) | Enhanced system and method for conducting PCA analysis on data signals | |
Scanlon et al. | Residual life prediction of rotating machines using acoustic noise signals | |
US6687654B2 (en) | Techniques for distributed machinery monitoring | |
KR101539896B1 (ko) | 유도전동기 오류 진단 방법 | |
KR102209401B1 (ko) | 컨볼루션 신경망을 이용한 기어박스의 결함상태 판별 장치 및 방법 | |
WO2020009210A1 (ja) | 異常予測システム及び異常予測方法 | |
Chen et al. | Multiple fault condition recognition of gearbox with sequential hypothesis test | |
EP2208981B1 (en) | Monitoring of rotating machines | |
Haj Mohamad et al. | Rolling element bearing diagnostics using extended phase space topology | |
US20220155258A1 (en) | Stamping quality inspection system and stamping quality inspection method | |
JP2012018066A (ja) | 異常検査装置 | |
JP2015114294A (ja) | 音響装置の検査装置及び音響装置の検査方法並びに音響装置の検査プログラム | |
Unal et al. | Fault diagnosis of rolling bearings using data mining techniques and boosting | |
US20230030911A1 (en) | Abnormal sound detection method and apparatus | |
Huang et al. | Research on fan vibration fault diagnosis based on image recognition | |
Singh et al. | Faulty voice diagnosis of automotive gearbox based on acoustic feature extraction and classification technique | |
Grandhi et al. | Machine-learning based fault diagnosis of electrical motors using acoustic signals | |
CN116907029A (zh) | 检测室外机内风扇异常的方法、控制装置以及空调室外机 | |
Martins et al. | Improved variational mode decomposition for combined imbalance-and-misalignment fault recognition and severity quantification | |
Decker et al. | Does your model think like an engineer? explainable ai for bearing fault detection with deep learning | |
JP4513796B2 (ja) | 異常監視装置 | |
Lee et al. | Octave-band filtering for convolutional neural network-based diagnostics for rotating machinery | |
Wißbrock et al. | Discussion of Features for Acoustic Anomaly Detection under Industrial Disturbing Noise in an End-of-Line Test of Geared Motors |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210125 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220601 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230704 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230810 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20231107 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20231207 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 7407382 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |