JP2023157213A - 特定装置 - Google Patents
特定装置 Download PDFInfo
- Publication number
- JP2023157213A JP2023157213A JP2022066971A JP2022066971A JP2023157213A JP 2023157213 A JP2023157213 A JP 2023157213A JP 2022066971 A JP2022066971 A JP 2022066971A JP 2022066971 A JP2022066971 A JP 2022066971A JP 2023157213 A JP2023157213 A JP 2023157213A
- Authority
- JP
- Japan
- Prior art keywords
- unit
- type
- sound
- identification
- signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 239000011159 matrix material Substances 0.000 claims abstract description 65
- 230000005856 abnormality Effects 0.000 claims abstract description 34
- 238000010801 machine learning Methods 0.000 claims abstract description 11
- 238000012549 training Methods 0.000 claims abstract description 5
- 230000002159 abnormal effect Effects 0.000 abstract description 103
- 238000012545 processing Methods 0.000 description 22
- 238000010586 diagram Methods 0.000 description 17
- 238000012937 correction Methods 0.000 description 16
- 238000000034 method Methods 0.000 description 15
- 230000004913 activation Effects 0.000 description 14
- 238000001994 activation Methods 0.000 description 14
- 238000007781 pre-processing Methods 0.000 description 12
- 238000004364 calculation method Methods 0.000 description 10
- 230000006870 function Effects 0.000 description 9
- 230000008569 process Effects 0.000 description 9
- 230000035807 sensation Effects 0.000 description 8
- 230000003595 spectral effect Effects 0.000 description 6
- 230000008859 change Effects 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 210000005069 ears Anatomy 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000001902 propagating effect Effects 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
- 239000013598 vector Substances 0.000 description 1
Images
Landscapes
- Testing Of Devices, Machine Parts, Or Other Structures Thereof (AREA)
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
- Testing Of Engines (AREA)
Abstract
【課題】異音又は振動の発生要因を適切に特定することが可能な特定装置を提供すること。【解決手段】本開示にかかる特定装置10は、対象物から発生する音及び振動の少なくとも一方を示す観測信号と、観測信号に含まれる異常の種別である異常種別と、の組を教師データとして機械学習を行うことにより、入力された観測信号から異常種別を出力するように生成された学習モデルを記憶する記憶部12と、未知の観測信号の入力を受け付ける入力部16と、学習モデルを用いて、未知の観測信号から異常種別を特定する特定部143と、を備える。機械学習では、観測信号から生成されたスペクトログラムに対して半教師付き非負値行列因子分解を行うことで得られた基底行列を用いて異常種別が学習されている。特定部143は、観測信号の振幅が所定の閾値以上であるか否かを判定し、閾値以上である場合に当該異常種別を特定する。【選択図】図2
Description
本開示は、特定装置に関する。
車両や装置などで発生する異音の音圧データを取得し、所定の処理を行うことで異音の発生要因を特定する技術が知られている。例えば、特許文献1は、取得された音圧データを高速フーリエ変換(FFT:Fast Fourier Transform)し、統計解析処理による異常度を演算し、異常発生要因毎にクラスタリングされたクラスタと照合し、異音発生要因を特定する異音発生要因特定システムを開示する。
例えば車両内で発生する音の発生要因を特定するとする。車両内では、周波数の近い複数の異音が同時に発生している場合がある。特許文献1が開示する技術を用いた場合、これらの異音を同じクラスタに分けてしまうため、異音発生要因を精度よく特定することが難しいという問題がある。
本開示の目的は、上述した課題を鑑み、異音又は振動の発生要因を適切に特定することが可能な特定装置を提供することにある。
本開示にかかる特定装置は、
対象物から発生する音及び振動の少なくとも一方を示す観測信号と、前記観測信号に含まれる異常の種別である異常種別と、の組を教師データとして機械学習を行うことにより、入力された前記観測信号から前記異常種別を出力するように生成された学習モデルを記憶する記憶部と、
未知の前記観測信号の入力を受け付ける入力部と、
前記学習モデルを用いて、前記未知の観測信号から前記異常種別を特定する特定部と、を備え、
前記機械学習では、前記観測信号から生成されたスペクトログラムに対して半教師付き非負値行列因子分解を行うことで得られた基底行列を用いて前記異常種別が学習されており、
前記特定部は、前記学習モデルを用いて前記未知の観測信号に含まれる前記異常種別を取得し、取得した前記異常種別に対応する前記観測信号の振幅が所定の閾値以上であるか否かを判定し、前記閾値以上である場合に当該異常種別を特定する。
対象物から発生する音及び振動の少なくとも一方を示す観測信号と、前記観測信号に含まれる異常の種別である異常種別と、の組を教師データとして機械学習を行うことにより、入力された前記観測信号から前記異常種別を出力するように生成された学習モデルを記憶する記憶部と、
未知の前記観測信号の入力を受け付ける入力部と、
前記学習モデルを用いて、前記未知の観測信号から前記異常種別を特定する特定部と、を備え、
前記機械学習では、前記観測信号から生成されたスペクトログラムに対して半教師付き非負値行列因子分解を行うことで得られた基底行列を用いて前記異常種別が学習されており、
前記特定部は、前記学習モデルを用いて前記未知の観測信号に含まれる前記異常種別を取得し、取得した前記異常種別に対応する前記観測信号の振幅が所定の閾値以上であるか否かを判定し、前記閾値以上である場合に当該異常種別を特定する。
本開示にかかる特定装置は、異音又は振動の発生要因を適切に特定することを可能とする。
以下では、本開示の実施形態について、図面を参照しながら詳細に説明する。各図面において、同一又は対応する要素には同一の符号が付されている。説明の明確化のため、必要に応じて重複説明は省略される。
<特定システム100の構成>
図1を参照して、本実施形態にかかる特定システム100について説明する。図1は、本実施形態にかかる特定システム100の構成を示すブロック図である。特定システム100は、本実施形態にかかる特定処理を実行する特定装置10を備えている。特定装置10は、周囲で発生する音又は振動を示す観測信号を取得して、所定の特定処理を行うことで、対象物から発生する観測信号の発生要因を特定する情報処理装置である。
図1を参照して、本実施形態にかかる特定システム100について説明する。図1は、本実施形態にかかる特定システム100の構成を示すブロック図である。特定システム100は、本実施形態にかかる特定処理を実行する特定装置10を備えている。特定装置10は、周囲で発生する音又は振動を示す観測信号を取得して、所定の特定処理を行うことで、対象物から発生する観測信号の発生要因を特定する情報処理装置である。
特定装置10は、例えば、対象物である車両や装置などにおいて発生する音又は振動の発生要因を特定するために用いられ得る。特定装置10は、車両等に搭載される専用の装置として実現されてもよいし、ユーザが使用する携帯電話端末、スマートフォン、タブレット端末、又はPC(Personal Computer)などの情報端末により実現されてもよい。
本実施形態では、観測信号の例として、車両7で発生した音を示す音響信号を用いて説明を行う。また、以下では、車両7で発生した音であって、車両7の状態が正常である場合には発生しない音を「異音」と称して説明する場合がある。また、以下では、異音の発生要因の種別を、「異音種別」と称して説明する場合がある。特定装置10は、車両7で発生した異音の異音種別を特定する。
なお、本実施形態では、特定装置10が音響信号から異音種別を特定する例を用いて説明するが、特定装置10は、車両7で発生した振動であって、車両7の状態が正常な正常である場合には発生しない振動の種別を特定してもよい。
図1に示されるように、特定システム100は、特定装置10の他、マイク20及びCAN(Controller Area Network)30を備えている。
マイク20は、車両7で発生する音を検出するマイクロフォンである。マイク20は、例えば、図1に示されるように、車両7が備える原動機40、又はその近傍に設けられている。これに限らず、マイク20は任意の場所に設けられてよい。また、マイク20は複数設けられてもよい。なお、本実施形態では、マイク20を用いて説明を行うが、特定システム100は、マイク20に代えて、車両7で発生する振動を検出する振動ピックアップなどを備えていてもよい。また、特定システム100は、マイク20及び振動ピックアップの両方を備えていてもよい。
CAN30は、車両7の状態を示す車両信号を取得する。車両信号は、例えば、車両7の走行状態に関する走行情報を含み得る。走行情報は、例えば、車両7の車速、エンジン回転数、エンジン負荷、ブレーキ信号、シフトポジション、又はステアリング操舵角などを含み得る。車両信号は、車両に搭載される各種ECU(Electric Control Unit)が生成するDTC(Diagnostic Trouble Code)情報を含んでもよい。また、車両信号は、車両7の停止時における車両7の状態を示す情報を含んでもよい。
<特定装置10の構成>
続いて、図2を参照して、特定装置10について説明する。図2は、特定装置10の構成を示すブロック図である。特定装置10は、記憶部12、演算部14、表示部15、及び入力部16を備えている。
続いて、図2を参照して、特定装置10について説明する。図2は、特定装置10の構成を示すブロック図である。特定装置10は、記憶部12、演算部14、表示部15、及び入力部16を備えている。
記憶部12は、特定装置10の各機能を実現するためのプログラムを格納する記憶装置である。また、記憶部12は、後述する学習部141で生成された基底行列及び特定モデルをそれぞれ格納する異音基底DB121及びモデルDB122を有している。
異音基底DB121は、特定対象である異音の周波数パターンを示すスペクトル基底群である基底行列を格納する。モデルDB122は、当該基底行列を用いた学習により生成された特定モデルを格納する。特定モデルは、音響信号と、音響信号が示す異常の種別である異音種別と、の組を教師データとして機械学習を行うことにより、入力された音響信号から異音種別を出力するように生成された学習モデルである。当該機械学習では、音響信号から生成されたスペクトログラムに対して、例えば、半教師付き非負値行列因子分解を行うことで得られた基底行列を用いて異音種別が学習されている。基底行列及び特定モデルの詳細については後述する。
異音基底DB121及びモデルDB122は、記憶部12においてライブラリとして登録されている。また、異音基底DB121及びモデルDB122は、学習部141が適宜参照することが可能に構成されている。なお、記憶部12は、特定装置10の内部に限らず、特定装置10の外部に設けられていてもよい。
図3は、異音基底DB121に登録された基底行列が示す異音基底の一例を示す図である。図では、種別の異なる5つの異音1~5に対応する異音基底が示されている。縦軸は振幅、横軸は周波数である。後述するように、基底行列は、非負値行列因子分解(NMF:Nonnegative Matrix Factorization)を用いて生成され得る。また、基底行列は、半教師付き非負値行列因子分解(SSNMF:Semi-supervised Non-negative Matrix Factorization)を用いて生成され得る。
図2に戻り説明を続ける。演算部14は、特定装置10における各種演算を行うための演算装置である。演算部14は、学習部141、前処理部142、及び特定部143を備えている。
学習部141は、NMFを用いて、異音発生要因の特定に用いるための基底行列を生成し、当該基底行列を用いて、異音特定処理を行うための特定モデルを生成する。学習部141は、特定対象である複数の異音に対応する複数の基底行列を生成することができる。学習部141は、生成した複数の基底行列を、記憶部12の異音基底DB121に格納する。また、学習部141は、当該基底行列を用いて生成された特定モデルを、記憶部12のモデルDB122に格納する。基底行列及び特定モデルの生成について、詳細は後述する。
前処理部142は、特定装置10に入力された音響信号に対し、聴感補正を用いた前処理を行う。前処理部142は、例えば、入力された音響信号を、いわゆるAカーブと呼ばれる聴感補正カーブのフィルタ特性を用いてフィルタリング処理する。
図4は、聴感補正カーブを示す図である。人間の耳は、20Hz以下の周波数、及び5kHz以上の周波数の音響信号を聞き取りにくく、2kHz~4kHz程度の周波数の音響信号を聞き取りやすくなっている。前処理部142は、このような人間の耳の聴感上の特徴を考慮し、音響信号に対して聴感補正処理を行う。図5及び図6は、それぞれ聴感補正前及び聴感補正後の音響信号のスペクトログラムを示す図である。前処理部142が聴感補正処理を行うことで、特定装置10は、人間の耳の聴感特性を考慮して、異音の特定処理を行うことができる。
図2に戻り説明を続ける。特定部143は、学習モデルを用いて、未知の観測信号から異常種別を特定する。例えば、特定部143は、学習部141で生成された特定モデルを用いて所定の演算を行い、入力部16で入力された未知の音響信号に含まれる異音の発生要因を特定する特定処理を行う。また、前処理部142において聴感補正処理が行われた場合、特定部143は、当該補正処理後の音響信号を用いて特定処理を行う。
特定部143は、未知の音響信号を、モデルDB122に格納された特定モデルに入力し、出力として、当該音響信号に含まれる異音種別を取得する。また、特定部143は、取得された異音種別ごとの振幅を推定する。入力された音響信号が複数の異音種別を含む場合、特定部143は、特定モデルから複数の異音種別を取得し、異音種別のそれぞれに対応する振幅を推定する。これにより、特定部143は、未知の音響信号から当該音響信号に含まれる複数の異音種別と、異音種別ごとの振幅を取得することができるので、未知の音響信号に含まれる複数の異音を分離することができる。
図7は、取得された異音種別の所定時間ごとの出力の一例を示す図である。縦軸は振幅、横軸は時間を示している。図の例では、異音種別の異なる複数の異音1~5が出力されている。このようにして、特定部143は、入力された未知の音響信号に含まれる異音を特定し、所定時間ごとの振幅を求めることができる。なお、振幅に代えて、各異音種別に対応する音の音量を示す他の指標が用いられてもよい。
なお、特定部143は、学習モデルを用いて取得された異音種別の全てを、異音種別としてそのまま特定してもよいし、所定の判定処理を行い、その結果に応じて、それらの一部を異音種別として特定してもよい。
例えば、特定部143は、取得した異音種別に対応する音響信号の振幅が所定の閾値以上であるか否かを判定し、判定結果に応じて異音種別を特定してもよい。例えば図7の例では、特定部143は、取得された複数の異音種別のそれぞれの振幅を、予め設定された所定の閾値Th1と比較する。特定部143は、各音の振幅がTh1以上であるか否かを判定し、振幅がTh1以上である音を異音種別として特定し、Th1未満である音を異音種別として特定しない。このようにすることで、音量の小さい異音については、異音として扱わないものとすることができるので、音量が所定の閾値以上の音のみを異音として特定することができる。
所定の閾値は、予め設定されていてもよいし、適宜変更されてもよい。例えば、特定部143は、車両信号に応じて当該閾値を変更し、車両信号に応じた閾値を用いて異音の特定を行う。車両信号は、例えば、エンジン回転数又はエンジン負荷などである。これらに限らず、他の車両信号が用いられてもよい。
図8は、閾値の変化を示す図である。特定部143は、例えばエンジン回転数の大きさに応じて閾値を変更する。図では、閾値Th2と、Th2より大きい閾値Th3が示されている。特定部143は、エンジン回転数が小さい場合はTh2を閾値とし、エンジン回転数が大きい場合はTh3を閾値として上記の判定を行う。このようにすることで、特定部143はエンジン回転数などに応じた閾値を設定し、適切に判定を行うことができるので、精度よく異音を特定することができる。なお、ここでは閾値を2段階に変更する例を用いたが、閾値を3段階以上に変更するようにしてもよい。
また、特定部143は、CAN30で取得される車両信号を加味して異音を特定してもよい。例えば、周波数の近い複数の異音が取得された場合、特定部143は、当該音が取得されたタイミングにおいて取得された車両信号との関連の大きさに応じて異音を特定する。取得された複数の音の間の周波数が近いか否かは、閾値などにより適宜判定されてよい。
例えば、特定モデルの出力として取得された複数の異音種別に、周波数の近いバキュームポンプ異音とウォーターポンプベアリング異音とが含まれており、かつ、音の発生タイミングにおいて、車両信号としてブレーキ信号が取得されているとする。この場合、特定部143は、ブレーキとの関連が大きいバキュームポンプ異音を異音として特定し、ブレーキとの関連が小さいウォーターベアリング異音を、異音として特定しないようにしてもよい。このようにすることで、特定部143は、周波数の近い複数の異音の異音種別を、適切に特定することができる。
図2に戻り説明を続ける。表示部15は、演算部14における演算の結果を表示する表示装置である。表示部15は、文字や画像を表示するディスプレイなどであってよい。また、表示部15は、入力部16の機能を備えるタッチパネルなどであってもよい。表示部15は、例えば、観測音に含まれる異音に関する情報を表示する。
例えば、表示部15は、「○○音が発生しています。」のように、異音種別を示す情報を表示する。また、「発生音が○○音である確率は△△%です。」のように、特定された異音種別の確からしさを示す情報を、異音種別と共に表示してもよい。複数の異音が特定された場合はそれぞれの異音について情報を表示してもよい。
例えば、表示部15は、複数の異音に関する情報を同一画面上に表示する。表示部15は、車両7と、異音の発生箇所とを重ねて表示するなどしてもよい。このようにすることで、ユーザは容易に異音の発生箇所及び発生要因を確認することができる。表示部15は、演算部14で特定された、所定の閾値以上の音量を示す異音を表示するようにしてよい。これにより、異音の大きさに応じて表示を行うことができる。
入力部16は、未知の観測信号の入力を受け付ける。例えば、入力部16は、車両7で発生した音を示す音響信号の入力をマイク20から受け付ける。また、入力部16は、CAN30から車両信号の入力を受け付ける。車両信号は、車両7のエンジン回転数、エンジン負荷、又はブレーキ信号などを含み得る。入力部16は、車両7が備える他のセンサ(例えば、振動ピックアップ)からの入力を受け付けてもよい。
ここで、図9を参照して、本開示にかかる特定方法に用いるNMFによる音源分離動作について説明する。図9は、本実施形態で用いられるNMFの説明図である。NMFは、入力された音響信号のスペクトログラムを、基底行列とアクティベーション行列との積で近似する数理アルゴリズムである。
ここでは、NMFに入力される音響信号のスペクトログラムをX、基底行列をT、アクティベーション行列をVとする。入力される音響信号のスペクトログラムXは、例えば、音響時系列信号x(t)に対して短時間フーリエ変換(STFT:short-time Fourier transform)を行って得られる、I行J列の強度数値データからなる観測行列X(i,j)であってもよい。ここで、tは時間のインデックスを示している。また、Iは周波数ビン数、Jは時間フレーム数、iは周波数ビンのインデックス、jは時間フレームのインデックスを示している。
音響時系列信号x(t)は、例えば、マイク20で収録したアナログ信号をAD変換(Analog Digital Convert)して得られるデジタル信号である。スペクトログラムXは、I行K列の基底行列T(i,k)と、K行J列のアクティベーション行列V(k,j)と、を用いて、以下に示す式(1)で表すことができる。ここで、Kは基底数を示し、kは基底のインデックスを示している。
X≒TV・・・ (1)
図9に示されるように、基底行列T(i,k)は、スペクトル形状を表すベクトルとして表現されるスペクトル基底を、列方向にK個結合したものとして表すことができる。図9は、一例として、K=2の場合を示したものである。同様に、アクティベーション行列V(k,j)は、各スペクトル基底に対応する発現度合いを表すアクティベーションを行方向にK個結合したものとして表すことができる。
上述の式(1)のように、NMFでは音響信号のスペクトログラムXを、基底行列T及びアクティベーション行列Vを用いて近似を行うが、一般に2つの行列の間には誤差が発生する。そのため、学習部141は、XとTVの距離を示すコスト関数を最小化するような基底行列T及びアクティベーション行列Vを求める。コスト関数には、例えば、ユークリッド距離、KL(Kullback-Leibler)ダイバージェンス、板倉齋藤距離、又はβダイバージェンスなどの距離規範が用いられてよい。
学習部141は、コスト関数が所定の閾値以下になるか、又は設定した繰り返し回数に達するまで、基底行列T及びアクティベーション行列Vを更新する。このようにして、学習部141は、適切な基底行列T及びアクティベーション行列Vを得ることができる。
本実施形態では、学習部141は、異音特定の前処理として、特定しようとする異音を含む音響信号のスペクトログラムに対し、上述のようなNMFを行うことで、当該異音に対応するスペクトル基底群(基底行列T)を生成する。また、特定部143は、未知の音響信号のスペクトログラムに対し、基底行列Tを用いた半教師付きNMFなどを行い、各スペクトル基底の発現度合い(アクティベーション行列V)を生成する。そして、特定部143は、各スペクトル基底の発現度合いの組み合わせから、未知の音響信号に、特定対象の異音が含まれているか否かを判定する。これにより、特定部143は、未知の音響信号に含まれる異音の種別を特定する。
上述したように、特許文献1の技術では、分割したデータごとに、突出した周波数を統計処理して異常度を算出し、異常発生要因ごとにクラスタリングされたクラスタと照合することで、異音の発生要因を特定した。特許文献1では、着眼点はデータのピーク値であるので、複数の異音が同時に発生している場合には、異音の検出精度が低下する。
これに対し、本実施形態では、NMFを用いるので、検出精度の低下を低減することができる。例えば、図9の例において、基底行列Tが基底K1、K2、・・・、Knを含むとする。特定部143は、これらの基底K1、K2、・・・、Knが示す周波数が全て音源に含まれる場合、当該基底行列Tに対応する異音が発生したと判断する。そのため、本実施形態にかかる特定装置10では、近い周波数において複数の異音が発生した場合であっても、異音を正しく判別することが可能である。
<特定装置10が行う処理>
続いて、図10及び図11を参照して、特定装置10が行う処理について具体的に説明する。まず、図10を参照して、特定装置10が行う全体的な動作を説明する。図10は、特定装置10が行う全体動作の処理を示すフローチャートである。
続いて、図10及び図11を参照して、特定装置10が行う処理について具体的に説明する。まず、図10を参照して、特定装置10が行う全体的な動作を説明する。図10は、特定装置10が行う全体動作の処理を示すフローチャートである。
まず、学習部141は、基底を生成するための基底生成処理を行う(S101)。ここでは、特定装置10は、基底生成用スペクトログラムX1の入力を受け付けて、基底行列T1を生成するものとする。X1としては、特定対象とされる異音を含む音響信号を示すスペクトログラムが用いられ得る。
学習部141は、基底生成用スペクトログラムX1が入力されると、上述したNMFを行うことで基底行列T1を生成し、生成した基底行列T1を異音基底DB121に格納する。学習部141は、教師付きNMFを用いて基底行列T1を生成してもよいし、半教師付きNMFを用いて基底行列T1を生成してもよい。また、これに限らず、学習部141は、他の手法を用いて基底行列T1を生成してもよい。
学習部141は、X1に対して、以下の式(2)で示す近似式によるNMFを行うことにより、基底行列T1及びアクティベーション行列V1を生成する。
X1≒T1V1 ・・・(2)
学習部141は、T1及びV1を最適化(更新)する。学習部141は、生成した基底行列T1を異音基底DB121に格納する。基底行列T1は、学習データとして用いられる。
続いて、学習部141は、生成された基底行列T1を用いてモデル学習処理を行う(S102)。学習には、例えば、ニューラルネットワーク、混合ガウスモデル、又はサポートベクトルマシンなどの公知の手法が用いられ得る。これらに限らず、種々の機械学習方法が用いられてもよい。
例えば、まず、学習部141は、対応する異音種別を示す異音ラベルが付けられたラベル付きスペクトログラムX2の入力を受け付ける。学習部141は、X2を取得すると、X2に対し、異音基底DB121に格納されている基底行列T1を教師基底に用いた教師付きNMFを実施する。学習部141は、半教師付きNMFを実施してもよい。
学習部141は、上述した式(1)及び式(2)と同様にして、X2を、基底行列T2とアクティベーション行列V2との積で表現される近似式に適用する。学習部141は、V2の更新が所定の更新回数以上となるか、又はコスト関数が所定の閾値以下となるまでV2を更新する。
次に、学習部141は、異音ラベルごとのアクティベーション行列V2を特徴量として、V2と異音ラベルとの関係を表す特定モデルを学習する。これにより、学習部141は、音響信号を入力とし、当該音響信号に含まれる異音の異音種別を出力とする特定モデルを生成する。学習部141は、学習の結果得られた特定モデルを、モデルDB122に格納する。
そして、特定部143は、異音特定処理を行う(S103)。異音特定処理の詳細については、図11を参照して説明する。図11は、特定装置10が行う異音特定処理を示すフローチャートである。
まず、特定部143は、車両7において観測された観測音を示す音響信号をマイク20から取得する(S201)。ここで、当該音響信号から生成されるスペクトログラムを特定用スペクトログラムX3とする。なお、特定部143は、音響信号に代えて、又は音響信号と共に、車両7の振動を示す振動信号を振動ピックアップから取得してもよい。また、特定部143は、車両信号をCAN30から取得する。
前処理部142は、特定用スペクトログラムX3に対して聴感補正処理を行う(S202)。前処理部142は、図4に示すような聴感補正カーブを用いて、特定用スペクトログラムX3を補正する。前処理部142は、必要に応じて聴感補正以外の補正を行ってもよいし、これらの補正を行わなくともよい。
特定部143は、モデルDB122に格納された特定モデルを用いて、特定用スペクトログラムX3に含まれる音に対応する異音種別を取得する(S203)。ここでは、特定部143は、聴感補正後の特定用スペクトログラムX3を特定モデルに入力し、特定モデルから異音種別を取得する。特定部143は、例えば図7の例に示すように、出力として複数の異音種別を取得する。また、特定部143は、異音種別ごとに、音響信号の振幅を推定する。これにより、特定部143は、特定用スペクトログラムX3に含まれる異音種別ごとの振幅を取得する。
特定部143は、取得された異音種別のそれぞれの振幅を所定の閾値と比較し、振幅が閾値以上であるか否かを判定する(S204)。特定部143は、判定結果に応じて、異音種別を特定する(S205)。特定部143は、各異音種別に対応する音の振幅が閾値以上であると判定した場合、当該音を異音として特定し、閾値未満であると判定した場合、当該音を異音として特定しないようにしてもよい。
また、特定部143は、車両信号に基づいて上記の閾値を変更してもよい。車両信号は、例えば、エンジン回転数又はエンジン負荷などである。これにより、図8を用いて説明したように、特定部143は、エンジン回転数などに応じて複数の閾値を設定し、判定を行うことができる。
また、特定部143は、当該音が取得されたタイミングにおいて取得された車両信号との関連の大きさに応じて異音種別を特定してもよい。例えば、周波数の近い複数の異音が取得された場合、特定部143は、当該音が取得されたタイミングにおいて取得された車両信号との関連の大きさに応じて異音を特定することができる。
特定部143は、特定結果を表示部15に出力する(S206)。例えば、特定部143は、観測音に含まれる異音に関する情報を表示するための表示情報を生成して表示部15に出力する。これにより、例えば、表示部15は、「○○音が発生しています。」、「発生音が○○音である確率は△△%です。」のような表示を行う。なお、特定結果を画像や音声等により出力するようにしてもよい。
以上説明したように、本実施形態にかかる特定システム100は、特定装置10、マイク20、及びCAN30を備えており、特定装置10は、マイク20及びCAN30から音響信号及び車両信号を取得して異音の特定処理を行う。
特定装置10において、記憶部12は、特定処理に用いられる特定モデルをモデルDB122に格納する。特定モデルは、学習部141により、対象物から発生する音及び振動の少なくとも一方を示す音響信号と、音響信号が示す異常の種別である異音種別と、の組を教師データとして機械学習を行うことにより生成されている。当該機械学習では、音響信号から生成されたスペクトログラムに対して半教師付き非負値行列因子分解などを行うことで得られた基底行列を用いて異音種別が学習されている。これにより、特定モデルは、入力された音響信号から異音種別を出力することが可能に構築されている。
また、入力部16は、マイク20から未知の音響信号の入力を受け付け、CAN30から車両信号の入力を受け付ける。特定装置10の演算部14において、特定部143は、上記の特定モデルを用いて、未知の音響信号から異音種別を特定する。特定部143は、特定モデルを用いて未知の音響信号に含まれる異音種別を取得し、取得した異音種別に対応する音響信号の振幅が所定の閾値以上であるか否かを判定する。特定部143は、当該音響信号の振幅が所定値以上である場合に、当該異音種別を特定する。
このような構成により、本実施形態にかかる特定装置10によれば、僅かに特徴の違う異音が発生している場合であっても、それぞれの異音種別を判別することができる。また、特定部143は、ブレーキ信号などの車両信号を加味して異音種別を特定することができるので、より精度よく異音を検出することができる。さらに、特定部143は、上述した振幅の判定において、エンジン回転数などの車両信号に応じて閾値を変更することができるので、精度よく異音を検出することができる。
本実施形態にかかる特定装置10を用いることで、例えば、車両の販売店において、異音で入庫された車両の原因特定を支援することができるので、無駄な部品交換による無償修理費を低減することができる。また、開発現場においては、異音を特定することで、異常を早期発見することができるので、早期の対応が可能となり品質向上に繋げることができる。
なお、図1及び図2に示される構成は一例に過ぎず、特定システム100は、複数の構成が集約された装置などを用いて構成されてもよい。例えば、特定装置10における各機能部は、複数の装置などを用いて分散処理されてもよい。本実施形態では、学習部141を特定装置10の内部に設けているが、学習部141は特定装置10の外部に設けられてもよい。
また、特定システム100の各機能が同一の装置に集約されていてもよい。例えば、本実施形態では、車両7に設けられたマイク20を用いて観測音を取得したが、ユーザが使用するスマートフォンなどの携帯端末が備えるマイクを用いてもよい。また、ネットワークを介して、携帯端末がCAN30から車両信号を受信するようにしてもよい。これにより、ユーザの携帯端末を、特定装置10として実現することができる。
例えば、携帯端末のマイクで車両7内の音を録音し、WAVファイル等を取得してSTFTを行い、上述したスペクトログラムXを得る。携帯端末において、上述した特定処理を行い、特定結果を携帯端末の表示部に表示する。このようにすることで、ユーザは、自身の携帯端末を用いて、車両7内で発生した異音の種別を特定することができる。この場合、携帯端末を特定装置10として用いてもよいし、必要な情報を、携帯端末から特定装置10に送信するようにしてもよい。携帯端末と特定装置10とは、有線又は無線により接続されてよい。例えば、携帯端末において、車両7内で観測された音を示す音響信号を特定装置10に送信する。特定装置10は、上述した特定処理により異音種別を特定し、特定結果を携帯端末に送信する。このようにすることで、ユーザは携帯端末を用いて異音を特定することができる。
<ハードウエアの構成例>
特定装置10の各機能構成部は、各機能構成部を実現するハードウエア(例:ハードワイヤードされた電子回路など)で実現されてもよいし、ハードウエアとソフトウエアとの組み合わせ(例:電子回路とそれを制御するプログラムの組み合わせなど)で実現されてもよい。以下、特定装置10の各機能構成部がハードウエアとソフトウエアとの組み合わせで実現される場合について説明する。
特定装置10の各機能構成部は、各機能構成部を実現するハードウエア(例:ハードワイヤードされた電子回路など)で実現されてもよいし、ハードウエアとソフトウエアとの組み合わせ(例:電子回路とそれを制御するプログラムの組み合わせなど)で実現されてもよい。以下、特定装置10の各機能構成部がハードウエアとソフトウエアとの組み合わせで実現される場合について説明する。
図12は、特定装置10を実現するコンピュータ900のハードウエア構成を例示するブロック図である。コンピュータ900は、特定装置10を実現するために設計された専用のコンピュータであってもよいし、汎用のコンピュータであってもよい。コンピュータ900は、スマートフォンやタブレット端末などといった可搬型のコンピュータであってもよい。
例えば、コンピュータ900に対して所定のアプリケーションをインストールすることにより、コンピュータ900で、特定装置10の各機能が実現される。上記アプリケーションは、特定装置10の機能構成部を実現するためのプログラムで構成される。
コンピュータ900は、バス902、プロセッサ904、メモリ906、ストレージデバイス908、入出力インタフェース910、及びネットワークインタフェース912を有する。バス902は、プロセッサ904、メモリ906、ストレージデバイス908、入出力インタフェース910、及びネットワークインタフェース912が、相互にデータを送受信するためのデータ伝送路である。ただし、プロセッサ904などを互いに接続する方法は、バス接続に限定されない。
プロセッサ904は、CPU(Central Processing Unit)、GPU(Graphics Processing Unit)、又は FPGA(Field-Programmable Gate Array)などの種々のプロセッサである。メモリ906は、RAM(Random Access Memory)などを用いて実現される主記憶装置である。ストレージデバイス908は、ハードディスク、SSD(Solid State Drive)、メモリカード、又は ROM(Read Only Memory)などを用いて実現される補助記憶装置である。
入出力インタフェース910は、コンピュータ900と入出力デバイスとを接続するためのインタフェースである。例えば入出力インタフェース910には、キーボードなどの入力装置や、ディスプレイ装置などの出力装置が接続される。
ネットワークインタフェース912は、コンピュータ900をネットワークに接続するためのインタフェースである。このネットワークは、LAN(Local Area Network)であってもよいし、WAN(Wide Area Network)であってもよい。
ストレージデバイス908は、特定装置10の各機能構成部を実現するプログラム(前述したアプリケーションを実現するプログラム)を記憶している。プロセッサ904は、このプログラムをメモリ906に読み出して実行することで、特定装置10の各機能構成部を実現する。
プロセッサの各々は、アルゴリズムをコンピュータに行わせるための命令群を含む1又はそれ以上のプログラムを実行する。このプログラムは、コンピュータに読み込まれた場合に、実施形態で説明された1又はそれ以上の機能をコンピュータに行わせるための命令群(又はソフトウェアコード)を含む。プログラムは、様々なタイプの非一時的なコンピュータ可読媒体(non-transitory computer readable medium)又は実体のある記憶媒体(tangible storage medium)に格納されてもよい。限定ではなく例として、コンピュータ可読媒体又は実体のある記憶媒体は、random-access memory(RAM)、read-only memory(ROM)、フラッシュメモリ、solid-state drive(SSD)又はその他のメモリ技術、CD-ROM、digital versatile disc(DVD)、Blu-ray(登録商標)ディスク又はその他の光ディスクストレージ、磁気カセット、磁気テープ、磁気ディスクストレージ又はその他の磁気ストレージデバイスを含む。プログラムは、様々なタイプの一時的なコンピュータ可読媒体(transitory computer readable medium)又は通信媒体上で送信されてもよい。限定ではなく例として、一時的なコンピュータ可読媒体又は通信媒体は、電気的、光学的、音響的、又はその他の形式の伝搬信号を含む。
なお、本開示は上記実施形態に限られたものではなく、趣旨を逸脱しない範囲で適宜変更することが可能である。
1~5 異音
7 車両
10 特定装置
12 記憶部
121 異音基底DB
122 モデルDB
14 演算部
141 学習部
142 前処理部
143 特定部
15 表示部
16 入力部
20 マイク
30 CAN
40 原動機
100 特定システム
K1、K2 基底
T、T1、T2 基底行列
V、V1、V2 アクティベーション行列
Th1~Th3 閾値
X スペクトログラム(観測行列)
X1 基底生成用スペクトログラム
X2 ラベル付きスペクトログラム
X3 特定用スペクトログラム
900 コンピュータ
902 バス
904 プロセッサ
906 メモリ
908 ストレージデバイス
910 入出力インタフェース
912 ネットワークインタフェース
7 車両
10 特定装置
12 記憶部
121 異音基底DB
122 モデルDB
14 演算部
141 学習部
142 前処理部
143 特定部
15 表示部
16 入力部
20 マイク
30 CAN
40 原動機
100 特定システム
K1、K2 基底
T、T1、T2 基底行列
V、V1、V2 アクティベーション行列
Th1~Th3 閾値
X スペクトログラム(観測行列)
X1 基底生成用スペクトログラム
X2 ラベル付きスペクトログラム
X3 特定用スペクトログラム
900 コンピュータ
902 バス
904 プロセッサ
906 メモリ
908 ストレージデバイス
910 入出力インタフェース
912 ネットワークインタフェース
Claims (1)
- 対象物から発生する音及び振動の少なくとも一方を示す観測信号と、前記観測信号に含まれる異常の種別である異常種別と、の組を教師データとして機械学習を行うことにより、入力された前記観測信号から前記異常種別を出力するように生成された学習モデルを記憶する記憶部と、
未知の前記観測信号の入力を受け付ける入力部と、
前記学習モデルを用いて、前記未知の観測信号から前記異常種別を特定する特定部と、を備え、
前記機械学習では、前記観測信号から生成されたスペクトログラムに対して半教師付き非負値行列因子分解を行うことで得られた基底行列を用いて前記異常種別が学習されており、
前記特定部は、前記学習モデルを用いて前記未知の観測信号に含まれる前記異常種別を取得し、取得した前記異常種別に対応する前記観測信号の振幅が所定の閾値以上であるか否かを判定し、前記閾値以上である場合に当該異常種別を特定する
特定装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2022066971A JP2023157213A (ja) | 2022-04-14 | 2022-04-14 | 特定装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2022066971A JP2023157213A (ja) | 2022-04-14 | 2022-04-14 | 特定装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2023157213A true JP2023157213A (ja) | 2023-10-26 |
Family
ID=88469280
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022066971A Pending JP2023157213A (ja) | 2022-04-14 | 2022-04-14 | 特定装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2023157213A (ja) |
-
2022
- 2022-04-14 JP JP2022066971A patent/JP2023157213A/ja active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20150043737A1 (en) | Sound detecting apparatus, sound detecting method, sound feature value detecting apparatus, sound feature value detecting method, sound section detecting apparatus, sound section detecting method, and program | |
US20210142796A1 (en) | Information processing apparatus, information processing method, and program | |
US10339960B2 (en) | Personal device for hearing degradation monitoring | |
JP5197853B2 (ja) | モニタリング装置 | |
US20150139446A1 (en) | Audio signal processing apparatus and method | |
CN111868823A (zh) | 一种声源分离方法、装置及设备 | |
JP2019066339A (ja) | 音による診断装置、診断方法、および診断システム | |
JP2018189522A (ja) | 設備故障の予兆診断方法 | |
US20220187486A1 (en) | Computer system and data processing method | |
US12106770B2 (en) | Sound model generation device, sound model generation method, and recording medium | |
JP2023157213A (ja) | 特定装置 | |
JP7373358B2 (ja) | 音抽出システム及び音抽出方法 | |
US20230012559A1 (en) | Abnormal sound identification device, abnormal sound identification method, and non-transitory storage medium | |
CN115731945A (zh) | 异常声音确定装置、异常声音确定方法以及异常声音确定程序 | |
JP7288218B2 (ja) | 異常音判定システム、異常音判定装置、及びプログラム | |
KR20230152936A (ko) | 인공지능 및 신호처리 기술을 이용한 비접촉식 전력설비 진단 방법 및 이를 이용한 장치 | |
US20210232947A1 (en) | Signal processing device, signal processing method, and computer program product | |
JP6843450B1 (ja) | 教師データ生成方法、学習済みモデルを生成する方法、装置、記録媒体、プログラム、情報処理装置 | |
US11439320B2 (en) | Biological-sound analysis device, biological-sound analysis method, program, and storage medium | |
US11922921B1 (en) | Systems and methods for comparing acoustic properties of environments and audio equipment | |
KR20210013292A (ko) | 정보 처리 장치, 프로그램을 기록한 기록 매체 및 정보 처리 방법 | |
US11887587B2 (en) | Apparatus and method for processing an audio input recording to obtain a processed audio recording to address privacy issues | |
JP7304301B2 (ja) | 音響診断方法、音響診断システム、及び音響診断プログラム | |
CN116863957B (zh) | 工业设备运行状态的识别方法、装置、设备及存储介质 | |
JP7559702B2 (ja) | 車両の発生音を診断する診断装置 |