JP6301891B2 - 学習装置、識別装置、その方法、およびプログラム - Google Patents
学習装置、識別装置、その方法、およびプログラム Download PDFInfo
- Publication number
- JP6301891B2 JP6301891B2 JP2015191445A JP2015191445A JP6301891B2 JP 6301891 B2 JP6301891 B2 JP 6301891B2 JP 2015191445 A JP2015191445 A JP 2015191445A JP 2015191445 A JP2015191445 A JP 2015191445A JP 6301891 B2 JP6301891 B2 JP 6301891B2
- Authority
- JP
- Japan
- Prior art keywords
- noise
- sound
- frequency
- acoustic signal
- operation sound
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Landscapes
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
Description
観測信号(音響信号)から機械音の動作音の種類を識別する。より詳しくは、識別したい動作音毎に与えられた学習データを用いて、大騒音下で動作音の識別と強調を行う技術に関する。
1. 各動作音は、毎回同じ音が鳴る。
2. 機械の動作順には法則性がある。
3. 工場内の騒音は、ほぼ定常(冷却ファンなど)か、突発音が繰り返して鳴る(打鋲音など)。
4. 観測音は、動作音と騒音が混ざった音である。
<1.各動作音は、毎回同じ音が鳴る>
各パーツの動作音は、モーター等に起因する「ウィーン」のような音と、アラームなどに起因する「ピー」という音の2種類に大別できると考える。製造機器は、製品ごとの個体差をなくすために、毎回同じ動きをする。つまり、各パーツでは、動作音として常に同じような音が鳴ると考えられる。また、「ウィーン」や「ピー」といった動作音は、特徴的な周波数を持つことが多い。図3は、比較的静かな環境で収録した動作音の時間周波数解析結果である。この動作音は、「ピー」という音であり、3000Hzと4000Hzのあたりに強いピークを確認できる。このことから動作音st,kは、以下の正弦波重畳モデルで近似的に表現できるものとする。
機械による製品の製造は、アルゴリズムで記述できる決められた「手順」に基づき行われる。図1を例に挙げれば、「ベルトコンベアによる製品の移動」→「塗料の噴射」→「製品の回収」→「休止」、という手順に従って、機械は動作している。これは現在動作しているパーツは、1時刻前の動作しているパーツに応じて推測できることを示している。時間フレームをτと置き、zτ∈{1,2,…,K}を時刻τでの動作の種類と置くと、zτはzτ-1に依存した1次のマルコフモデルで記述できる。図1を例に挙げると、「ベルトコンベアによる製品の移動」をzτ=1、「塗料の噴射」をzτ=2、「製品の回収」をzτ=3、「休止」をzτ=4と置いたとき、zτ-1=1ならば、zτは1か2しか取りえない。このことを確率を用いて記述すると、以下のように書ける。
工場内の騒音(背景雑音、単に雑音ともいう)は、ほぼ定常(冷却ファンなど)か数個のスペクトル状態で記述できる突発音(打鋲音など)の2種類に大別できると考える。ここで定常な雑音とは、送風機のような「ゴー」という雑音である。また数個のスペクトル状態で記述できる突発音とは、ドリルやハンマーのような「ドドドドドド」など一定のリズムで大きな打撃音が鳴るものである。また、実際の騒音(背景雑音)は、これらの音、つまりM種類の雑音のテンプレートμω,mが、混合比率wm,τ(ただしΣM mwm,τ=1)で混ぜ合わさったものと考え、時刻τでの雑音の音響信号Nω,τを以下のように記述する。
実際にマイクロホンで観測される音(振幅スペクトル)Xω,τは、1.から3.で説明される音が足しあわされて観測されるものと考える。
本実施形態の学習手順を実現する学習装置100について説明する。
識別対象の機器の近くに(内部でも可能)マイクホロンを設置し、音響信号(以下、マイクロホンで収音された音響信号を「観測信号」ともいう)x(L) tを収集する。なお、上付き添え字(L)は学習データ自体、または、学習データから得られるデータを表すインデックスである。収集した音響信号x(L) tに、生成したい詳細な動作ログと同じ粒度でラベルファイル(動作ログ)labelを人手で作成する。ラベルファイルlabelは、時刻tに対応する音響信号x(L) tがどの動作音に対応するかを示す情報であり、例えば、各時刻tに対応する各音響信号x(L) tに各動作音を示すラベルを付与してもよいし、対象となる学習データ(音響信号x(L) 1,x(L) 2,…)全てに対して、各動作音を示すラベルとその動作音の開始時刻及び終了時刻を付与してもよい。
周波数領域変換部102は、音響信号x(L) tを受け取り、音響信号x(L) tを短時間フーリエ変換(STFT)などの手法で周波数領域に変換する。その後、複素スペクトルの絶対値を取り、振幅スペクトル(以下、この振幅スペクトルを単に「周波数領域に変換された音響信号」または「音響信号」ともいう)X(L) τ=(X(L) 1,τ,X(L) 2,τ,…,X(L) ω,τ,…,X(L) Ω,τ,)Tを得(S102)、出力する。ただし、Tは転置を表す。ここで、フーリエ変換長は32ms、シフト幅は16msなどに設定できる。
データ切り出し部103は、周波数領域に変換された音響信号X(L) τと、ラベルファイルlabelとを受け取り、ラベルファイルlabelを元に、周波数領域に変換された音響信号X(L) τを、雑音と、動作音の種類ごとに分割し(S103)、雑音の音響信号x(L) j,0と動作音kの音響信号x(L) i,kと出力する。ここで、雑音の音響信号x(L) j,0には雑音のみが、動作音kの音響信号x(L) i,kには動作音と雑音が重畳された状態となっている。なお、音響信号x(L) j,0に含まれる雑音と音響信号x(L) i,kとに含まれる雑音は、同じ種類の雑音である。ただし、そのレベルは異なってもよい。
x(L) i,k=(X(L) 1,i,k,X(L) 2,i,k,…,X(L) ω,i,k,…,X(L) Ω,i,k)T
とおき、音響信号X(L) τから切り出された雑音のJフレーム分の音響信号を
x(L) j,0=(X(L) 1,j,0,X(L) 2,j,0,…,X(L) ω,j,0,…,X(L) Ω,j,0)T
とおく。ただし、Ikは動作音k毎に異なり、i=1,2,…,Ikである。
雑音モデル学習部104は、音響信号X(L) τから切り出された雑音のJフレーム分の音響信号x(L) j,0を受け取り、この値を用いて、雑音モデルを学習し(S104)、学習装置100の出力値として雑音モデルパラメータΥを出力する。ここで、雑音モデルは、M個(Mは1以上の整数)の雑音テンプレートμ1,m,μ2,m,…,μΩ,m(ただし、m=1,2,…,M)を含み、確率モデルであらわされる。言い換えると、学習時には、雑音のみの学習データ(雑音のJフレーム分の音響信号x(L) j,0)を用いて、何らかの確率モデルにより雑音モデルを事前学習する。GMMの場合は、何らかの確率モデルとして「混合ガウス分布(GMM)」を用いる。GMMの場合、EMアルゴリズムなどの手法を用いて雑音モデルを学習する(例えば、参考文献1参照)。
[非特許文献2]小西貞則、“多変量解析入門、付録C EMアルゴリズム”、岩波書店、pp.294-298、2010年
この場合、雑音データ(ここでは、雑音のJフレーム分の音響信号x(L) j,0=(X(L) 1,j,0,X(L) 2,j,0,…,X(L) Ω,j,0)Tであり、X(L) ω,j,0をN(L) ω,τとも記載する(X(L) ω,j,0=N(L) ω,τ)。ここでjは、時刻フレームτの何れかに対応する)は以下の確率分布に従って生成されたものとしてモデル化する。
K個の特徴周波数計算部105−kはそれぞれ以下の処理を行う。特徴周波数計算部105−kは、雑音の音響信号x(L) j,0と動作音kの音響信号x(L) i,kとを受け取り、動作音kの正弦波重畳モデルパラメータ(ここでは、正弦波数Hk,その周波数fk,h,正弦波強度Ak,h)を学習し(S105)、出力する。例えば、特徴周波数計算部105−kは、周波数重要度計算部105Aと、正弦波数及び周波数計算部105Bと正弦波強度計算部105Cとを含む(図8参照)。
周波数重要度計算部105Aは、雑音の音響信号x(L) j,0と動作音kの音響信号x(L) i,kとを受け取り、これらの値を用いて、動作音kにおける周波数ωの重要度γω,kを計算し(S105A)、出力する。なお、重要度γω,kとは、周波数ωの成分が前記動作音kを識別する際に重要な成分か否かを示す指標である。例えば、以下のようにして重要度γω,kを計算する。
(参考文献2)小西貞則、“多変量解析入門、4章ロジスティック回帰モデル”、岩波書店、pp.79-96、2010年。
と置き、以下のロジスティック回帰モデルを学習する。
正弦波数及び周波数計算部105Bは、重要度γω,kを受け取り、重要度γω,kが高いと判断された周波数fk,hと、周波数fk,hの総数Hkとを求め(S105B)、出力する。なお、重要度γω,kが高いとは、周波数ωの成分が動作音kを識別する際に重要な成分であることを意味する。例えば、周波数重要度に対する閾値γTHを設定する。重要度γω,kと閾値γTHとの大小関係により、重要度γω,kが高いか否かを判断する。重要度γω,kが式(12)で表される場合には、重要度γω,kが大きければ大きいほど、動作音kに対して周波数ωが重要であると考えられるので、γω,k>γTHとなる周波数が動作音kを識別する際に重要な成分であると考える。そこで、γω,k>γTHとなる周波数をfk,hとする。ただし、fk,hは周波数の値自体であってもよいし、それと等価な値(例えば周波数のインデックス)であってもよい。さらに、γω,k>γTHとなる周波数fk,hの個数を数え、その総数をHkとする。総数Hkと周波数fk,hの例を図9に示す。動作音1を例に挙げれば、Hk=2であり、fk,1は2100Hz付近、fk,2は4200Hz付近となる。なお閾値γTHは総数Hkが大きくなりすぎないよう経験的に決定すべきであり、たとえば0.5に設定できる。
正弦波強度計算部105Cは、総数Hkと、Hk個の周波数fk,hと、雑音の音響信号x(L) j,0と動作音kの音響信号x(L) i,kとを受け取り、周波数fk,hにおける音響信号の正弦波強度Ak,hを計算し(S105C)、出力する。例えば、正弦波強度Ak,hは以下のように計算する。
図7を用いて、本実施形態の識別及び強調手順を実現する識別装置200について説明する。
周波数領域変換部202は、識別対象の音響信号xtを受け取り、音響信号xtを短時間フーリエ変換(STFT)などの手法で周波数領域に変換する。その後、複素スペクトルの絶対値を取り、振幅スペクトル(以下、この振幅スペクトルを単に「周波数領域に変換された音響信号」または「音響信号」ともいう)Xτ=(X1,τ,X2,τ,…,Xω,τ,…,XΩ,τ)Tを得(S202)、出力する。ここで、変換パラメータは、学習時と同じものを用いる。
雑音計算部203は、音響信号Xτと雑音モデルパラメータΥとを受け取り、雑音の推定値Nτ=(N1,τ,N2,τ,…,Nω,τ,…,NΩ,τ)Tを式(3)で計算し(S203)、出力する。例えば、音響信号Xτと雑音モデルパラメータΥに含まれる雑音テンプレートμ1,m,…,μΩ,mとを用いて、雑音テンプレートμ1,m,…,μΩ,mの混合比wm,τを求め、雑音テンプレートμ1,m,…,μΩ,mと混合比wm,τとから雑音の推定値Nτを計算する。雑音GMMを用いた場合、まず、混合比wm,τを以下の式で計算する。
とする。
フレームワイズ動作音確率計算部204は、音響信号Xτと、雑音の推定値Nτと、正弦波重畳モデルパラメータ(ここでは、K個のHkと、(ΣK k=1Hk)個の周波数fk,hと、(ΣK k=1Hk)個の正弦波強度Ak,h)とを受け取り、まず、正弦波重畳モデルにより、動作音kの近似値を求める。ここでは、正弦波重畳モデルパラメータを用いて、式(1)により時間領域での動作音kの近似値st,kを計算する。
動作音確率計算部205は、フレームワイズ動作音確率p(zτ|Xω,τ,Nω,τ)と遷移確率θk,k'とを受け取り、これらの値を用いて、時刻τ-1の動作音kを考慮した、ある時刻τにおいて音響信号Xω,τに動作音kが含まれる確率である動作音確率p(zτ|Xω,τ,Nω,τ,zτ-1)を計算し(S205)、出力する。動作の状態を逐次的に推定するために、隠れマルコフモデルの前向き状態推定アルゴリズムに基づき、以下のように動作音確率p(zτ|Xω,τ,Nω,τ,zτ-1)を求める。
動作音推定部206は、動作音確率p(zτ|Xω,τ,Nω,τ,zτ-1)を受け取り、時刻τでの動作音の種類zτを、以下の式に従って推定し(S206)、推定結果である種類zτを出力する。
ウィナーフィルタ設計部207は、推定結果である種類zτと雑音の推定値Nτ(雑音計算部203の出力値)と動作音の近似値Sk(フレームワイズ動作音確率計算部204においてフレームワイズ動作音確率の計算過程で得られる値)とを受け取り、次式により、音響信号Xω,τに含まれる動作音k=zτだけを強調するためのウィナーフィルタGτ=(G1,τ,G2,τ,…,Gω,τ,…,GΩ,τ)Tを設計し(S207)、出力する。
ウィナーフィルタリング部208は、音響信号XτとウィナーフィルタGτとを受け取り、音響信号XτをウィナーフィルタGτでフィルタリングし(S208)、音響信号Xτに含まれる動作音k=zτを強調し、強調した音響信号X(E) τ=(X(E) 1,τ,X(E) 2,τ,…,X(E) ω,τ,…,X(E) Ω,τ)Tを出力する。例えば、次式のように、音響信号XτにウィナーフィルタGτを乗算することでフィルタリングする。
X(E) ω,τ=Gω,τXω,τ
時間領域変換部209は、音響信号X(E) τを受け取り、周波数領域変換部202で行った周波数領域への変換方法に対応する時間領域への変換方法(例えばIFFT)を用いて、音響信号X(E) τを時間領域の音響信号x(E) tに変換し(S209)、識別装置200の出力値として出力する。
以上の構成により、大騒音のノイズが存在する状況においても、音響信号に含まれる動作音を識別することができる。
また、推定結果zτと、推定結果が得られた時刻τとを用いて、動作音のログ(図1参照)を生成してもよい。このような構成により詳細な動作ログを容易に残すことができる。工場などに設置された大型の製造機・造型機などの、詳細な動作ログを音響信号から作成することで、機械の稼働状況や使用頻度から、各パーツの消耗・摩耗度合いなどを推定でき、故障時期の予測や交換時期の提案などが可能になり、故障率を大幅に落とせる。産業、特に製造業の効率化に寄与する技術である。
本発明は上記の実施形態及び変形例に限定されるものではない。例えば、上述の各種の処理は、記載に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。その他、本発明の趣旨を逸脱しない範囲で適宜変更が可能である。
また、上記の実施形態及び変形例で説明した各装置における各種の処理機能をコンピュータによって実現してもよい。その場合、各装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記各装置における各種の処理機能がコンピュータ上で実現される。
Claims (8)
- 雑音は1つ以上の雑音テンプレートの混合で表現されるものとし、周波数領域に変換された雑音の音信号x(L) j,0を用いて、1つ以上の雑音テンプレートを含み、確率モデルであらわされる雑音モデルを学習する雑音モデル学習部と、
前記音信号x(L) j,0と、周波数領域に変換された既定の動作音kと雑音とが混ざった音信号x(L) i,kとを用いて、前記動作音kにおける周波数ωの重要度γω,kを計算する周波数重要度計算部と、
h=1,2,…,Hkとし、前記重要度γω,kが高いと判断された周波数fk,hと、前記周波数fk,hの総数Hkとを求める正弦波数及び周波数計算部と、
前記音信号x(L) j,0と前記音信号x(L) i,kとを用いて、前記周波数fk,hにおける正弦波強度Ak,hを計算する正弦波強度計算部とを含む、
学習装置。 - 請求項1の学習装置で得た雑音モデル及び周波数fk,h、総数Hk、正弦波強度Ak,hを用いて、識別対象の音響信号に含まれる動作音を識別する識別装置であって、
周波数領域に変換された識別対象の音響信号Xω,τと前記雑音モデルに含まれる雑音テンプレートとを用いて、前記雑音テンプレートの混合比を求め、前記雑音テンプレートと前記混合比とから雑音の推定値Nω,τを計算する雑音計算部と、
前記周波数fk,hと前記総数Hkと前記正弦波強度Ak,hとを用いて、正弦波重畳モデルにより、動作音kの近似値を求め、前記音響信号Xω,τと前記近似値と前記推定値Nω,τとから、ある時刻において前記音響信号Xω,τに前記動作音kが含まれる確率であるフレームワイズ動作音確率を計算するフレームワイズ動作音確率計算部とを含む、
識別装置。 - 請求項2の識別装置であって、
識別対象の音響信号に含まれると想定される動作音の種類の総数をKとし、k=1,2,…,K、k'=1,2,…,Kとし、ある時刻の動作音k'から次の時刻の動作音kへ移り変わる遷移確率と前記フレームワイズ動作音確率とを用いて、一つ前の時刻の動作音を考慮した、ある時刻において前記音響信号Xω,τに前記動作音kが含まれる確率である動作音確率を計算する動作音確率計算部を含む、
識別装置。 - 請求項2または請求項3の識別装置であって、
前記フレームワイズ動作音確率に基づき得られる動作音の推定結果zτと前記近似値と前記推定値Nω,τとを用いて、前記音響信号Xω,τに含まれる動作音を強調するためのフィルタを設計するフィルタ設計部と、
前記音響信号Xω,τと前記フィルタとを用いて、前記音響信号Xω,τに含まれる動作音を強調するフィルタリング部とを含む、
識別装置。 - 請求項2から請求項4の何れかの識別装置であって、
前記推定結果zτと、推定結果が得られた時刻とを用いて、動作音のログを生成する、
識別装置。 - 雑音は1つ以上の雑音テンプレートの混合で表現されるものとし、周波数領域に変換された雑音の音信号x(L) j,0を用いて、1つ以上の雑音テンプレートを含み、確率モデルであらわされる雑音モデルを学習する雑音モデル学習ステップと、
前記音信号x(L) j,0と、周波数領域に変換された既定の動作音kと雑音とが混ざった音信号x(L) i,kとを用いて、前記動作音kにおける周波数ωの重要度γω,kを計算する周波数重要度計算ステップと、
h=1,2,…,Hkとし、前記重要度γω,kが高いと判断された周波数fk,hと、前記周波数fk,hの総数Hkとを求める正弦波数及び周波数計算ステップと、
前記音信号x(L) j,0と前記音信号x(L) i,kとを用いて、前記周波数fk,hにおける正弦波強度Ak,hを計算する正弦波強度計算ステップとを含む、
学習方法。 - 請求項6の学習方法で得た雑音モデル及び周波数fk,h、総数Hk、正弦波強度Ak,hを用いて、識別対象の音響信号に含まれる動作音を識別する識別方法であって、
周波数領域に変換された識別対象の音響信号Xω,τと前記雑音モデルに含まれる雑音テンプレートとを用いて、前記雑音テンプレートの混合比を求め、前記雑音テンプレートと前記混合比とから雑音の推定値Nω,τを計算する雑音計算ステップと、
前記周波数fk,hと前記総数Hkと前記正弦波強度Ak,hとを用いて、正弦波重畳モデルにより、動作音kの近似値を求め、前記音響信号Xω,τと前記近似値と前記推定値Nω,τとから、ある時刻において前記音響信号Xω,τに前記動作音kが含まれる確率であるフレームワイズ動作音確率を計算するフレームワイズ動作音確率計算ステップとを含む、
識別方法。 - 請求項1の学習装置、または、請求項2から請求項5の何れかの識別装置として、コンピュータを機能させるためのプログラム。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2015191445A JP6301891B2 (ja) | 2015-09-29 | 2015-09-29 | 学習装置、識別装置、その方法、およびプログラム |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2015191445A JP6301891B2 (ja) | 2015-09-29 | 2015-09-29 | 学習装置、識別装置、その方法、およびプログラム |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2017067929A JP2017067929A (ja) | 2017-04-06 |
| JP6301891B2 true JP6301891B2 (ja) | 2018-03-28 |
Family
ID=58494576
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2015191445A Active JP6301891B2 (ja) | 2015-09-29 | 2015-09-29 | 学習装置、識別装置、その方法、およびプログラム |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP6301891B2 (ja) |
Families Citing this family (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP6960823B2 (ja) * | 2017-10-30 | 2021-11-05 | 三菱電機株式会社 | 音声解析装置、音声解析システム、音声解析方法及びプログラム |
| JP2020056918A (ja) * | 2018-10-02 | 2020-04-09 | パナソニックIpマネジメント株式会社 | 音データ学習システム、音データ学習方法および音データ学習装置 |
| WO2021186597A1 (ja) * | 2020-03-18 | 2021-09-23 | 日本電気株式会社 | 信号分析装置、信号分析方法、および記録媒体 |
| KR102535920B1 (ko) * | 2020-07-22 | 2023-05-26 | 미쓰비시덴키 가부시키가이샤 | 거리 계측 장치, 거리 계측 방법, 및 공작 장치 |
Family Cites Families (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH10282985A (ja) * | 1997-04-07 | 1998-10-23 | Omron Corp | 聴覚支援装置 |
| JP6004792B2 (ja) * | 2011-07-06 | 2016-10-12 | 本田技研工業株式会社 | 音響処理装置、音響処理方法、及び音響処理プログラム |
| JP6011536B2 (ja) * | 2011-08-29 | 2016-10-19 | 日本電気株式会社 | 信号処理装置、信号処理方法、およびコンピュータ・プログラム |
-
2015
- 2015-09-29 JP JP2015191445A patent/JP6301891B2/ja active Active
Also Published As
| Publication number | Publication date |
|---|---|
| JP2017067929A (ja) | 2017-04-06 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| Natesha et al. | Fog-based intelligent machine malfunction monitoring system for industry 4.0 | |
| JP6377592B2 (ja) | 異常音検出装置、異常音検出学習装置、これらの方法及びプログラム | |
| CN108885133B (zh) | 异常音检测学习装置、其方法以及记录介质 | |
| JP6235938B2 (ja) | 音響イベント識別モデル学習装置、音響イベント検出装置、音響イベント識別モデル学習方法、音響イベント検出方法及びプログラム | |
| CN110352349B (zh) | 异常音检测装置、异常度计算装置、异常音生成装置、异常信号检测装置、及其方法、记录介质 | |
| JP6976804B2 (ja) | 音源分離方法および音源分離装置 | |
| JP6301891B2 (ja) | 学習装置、識別装置、その方法、およびプログラム | |
| Parmar et al. | Effectiveness of cross-domain architectures for whisper-to-normal speech conversion | |
| JP6721165B2 (ja) | 入力音マスク処理学習装置、入力データ処理関数学習装置、入力音マスク処理学習方法、入力データ処理関数学習方法、プログラム | |
| JP4746533B2 (ja) | 多音源有音区間判定装置、方法、プログラム及びその記録媒体 | |
| CN108881652A (zh) | 回音检测方法、存储介质和电子设备 | |
| JP3987927B2 (ja) | 波形認識方法及び装置、並びにプログラム | |
| CN116072146A (zh) | 基于声纹识别的抽水蓄能站检测方法及系统 | |
| Samui et al. | Deep Recurrent Neural Network Based Monaural Speech Separation Using Recurrent Temporal Restricted Boltzmann Machines. | |
| Kavitha et al. | Deep learning based audio processing speech emotion detection | |
| Pérez-López et al. | A hybrid parametric-deep learning approach for sound event localization and detection | |
| Bharat Babu et al. | Development of acoustic source localization with adaptive neural network using distance mating‐based red deer algorithm | |
| Ntalampiras | Adversarial attacks against acoustic monitoring of industrial machines | |
| Dov et al. | Multimodal kernel method for activity detection of sound sources | |
| Adhin et al. | Acoustic Side Channel Attack for Device Identification using Deep Learning Models | |
| Ferraro et al. | Unsupervised Anomaly Detection in Predictive Maintenance Using Sound Data. | |
| Lee et al. | Discriminative training of complex-valued deep recurrent neural network for singing voice separation | |
| Mittel et al. | Mel spectrogram analysis for punching machine operating state classification with cnns | |
| Lin et al. | A novel methodology based on hidden semi-Markov model for equipment health assessment | |
| Mondal et al. | Improved Speech Activity Detection Using Cochleagram Spectral Basis by Nonnegative Matrix Factorization |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20170220 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20180214 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20180227 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180301 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 6301891 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
| R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |