JP2016095434A - 報知音感知・識別装置、報知音感知・識別方法、報知音感知・識別プログラム - Google Patents

報知音感知・識別装置、報知音感知・識別方法、報知音感知・識別プログラム Download PDF

Info

Publication number
JP2016095434A
JP2016095434A JP2014232317A JP2014232317A JP2016095434A JP 2016095434 A JP2016095434 A JP 2016095434A JP 2014232317 A JP2014232317 A JP 2014232317A JP 2014232317 A JP2014232317 A JP 2014232317A JP 2016095434 A JP2016095434 A JP 2016095434A
Authority
JP
Japan
Prior art keywords
notification sound
feature amount
unit
identification
time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2014232317A
Other languages
English (en)
Other versions
JP6367691B2 (ja
Inventor
悠馬 小泉
Yuma Koizumi
悠馬 小泉
桂右 井本
Keisuke Imoto
桂右 井本
尚 植松
Hisashi Uematsu
尚 植松
仲 大室
Hitoshi Omuro
仲 大室
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2014232317A priority Critical patent/JP6367691B2/ja
Publication of JP2016095434A publication Critical patent/JP2016095434A/ja
Application granted granted Critical
Publication of JP6367691B2 publication Critical patent/JP6367691B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)

Abstract

【課題】周囲で発生した音が報知音であるかないかをより厳密に判断し、その報知音の種類を識別する装置、方法、プログラムを提供する。
【解決手段】報知音感知・識別装置100は、報知音感知部、特徴抽出部130、記憶部190、報知音識別部140を備える。報知音感知部は、音響信号のあらかじめ定めた周波数帯の中に、あらかじめ定めた条件を満たすパワーのピークとなる周波数が存在するかを確認する。特徴抽出部130は、音響信号のピークとなる周波数の時間パターンに基づいた報知音特徴量を出力する。記憶部190は、照合報知音特徴量と報知音IDとを対応付けた組をあらかじめ記録しておく。報知音識別部140は、入力報知音特徴量を照合報知音特徴量ごとに対比することで一致率を求める。一致率が高い照合報知音特徴量があるときは、最も一致率の高い照合報知音特徴量に対応付けられた報知音IDを出力する。
【選択図】図7

Description

本発明は、周囲で発生した音声や音響を感知し、識別する技術に関する。より詳しくは、時計や家電のアラーム音、玄関のチャイム、火災警報器の警報音、電話の着信音、自動車のクラクション、注意を喚起する笛の音などが発生したときに、その音の発生を感知し、識別する報知音感知・識別装置、報知音感知・識別方法、報知音感知・識別プログラムに関する。
人は何らかの情報を伝達する際、日常動作に伴う音や自然界に存在する音とは特徴の異なる音を発生させることが多い。例えば目覚まし時計の「ピピピッ」という音、玄関チャイムの「ピンポーン」という音などがある。本明細書では、これらを総称して「報知音」と呼ぶ。
しかし、聴覚障がいのある人にとっては、報知音が発生してもそれを聞くことができず、日常生活に不便を生じるだけでなく、身に危険が生じる可能性もある。この問題に対して、マイクで収音した報知音を振動に変えて呈示する従来技術として、非特許文献1の技術が知られている。例えば、スマートフォンや専用の機器をユーザが身につけ、マイクから取り込んだ音をソフトウェアで常時分析し、高域通過フィルタで帯域制限した信号のパワーが閾値以上の音を検知したときにはバイブレータを起動し、音の情報を振動に変換してユーザに知らせるものである。
織田、古家、片岡「聴覚障害者支援を目的とした振動による報知音の伝達方法とその有効性」, 電子情報通信学会論文誌D, Vol.J89-D, No.12, pp.2671-2678.
非特許文献1の方法は、環境に遍在する雑音とは異なる報知音が発生したことを振動で伝えることで聴覚障がい者に一定の利便性を提供する一方で、(1)雑音と報知音とを閾値で分離しようとしたときに閾値の調整が困難であり、(2)検出した報知音が何を報知するかの識別は行わない、という問題があった。
図1は類似した異なる2つの報知音の例を表示した図である。図1(A)は時間領域の波形を、横軸を時間、縦軸を振幅として示したもの、図1(B)は図1(A)と同一時刻における時間周波数領域のデータを、横軸を時間、縦軸を周波数、濃淡を強度で示している。図1において左側の報知ベル1と右側の報知ベル2とはスペクトルの特徴ならびに鳴動パターンは互いに異なっている。しかし非特許文献1の方法ではベルが鳴動している/していないの鳴動パターンを振動として伝えるに留まっていて、それぞれの報知ベルのスペクトル的特徴を利用者に通知することはできない。また鳴動パターンの正確な識別は利用者自身の記憶に依存するものとなる。従って、発生頻度の低い報知音が発生すると、利用者は普段思い出しやすい報知音と混同しやすくなる課題があった。
本発明はこのような状況に鑑み、周囲で発生した音が報知音であるかないかをより厳密に判断し、その報知音の種類を識別することを目的とする。
本発明の報知音感知・識別装置は、報知音感知部、特徴抽出部、記憶部、報知音識別部を備え、入力された音響信号に含まれた報知音を感知・識別する。報知音感知部は、音響信号に、あらかじめ定めた周波数帯の中に、あらかじめ定めた条件を満たすパワーのピークとなる周波数が存在するかを確認し、存在するときは報知音を感知したことを示す感知情報を出力する。特徴抽出部は、報知音感知部が報知音を感知した時刻を含む音響信号のピークとなる周波数の時間パターンに基づいた報知音特徴量を出力する。記憶部は、報知音IDが既知の報知音を含む音響信号の報知音特徴量である照合報知音特徴量と当該報知音IDとを対応付けた組を、あらかじめ1組以上記録しておく。報知音識別部は、感知・識別の対象である音響信号の報知音特徴量である入力報知音特徴量を、前記照合報知音特徴量ごとに対比することで一致率を求める。そして、一致率の中に、一致率が高いことを示す所定範囲の照合報知音特徴量があるときは、最も一致率の高い照合報知音特徴量に対応付けられた報知音IDを出力する。
本発明の報知音感知・識別装置によれば、報知音のスペクトルだけでなく、その時間変化も含めて報知音を感知・識別する。よって、人の日常動作に伴う音や自然界に存在する音がある環境において、報知音が鳴ったことを、正確に感知・識別できる。
類似した異なる2つの報知音の例を表示した図。 オフィスで一定時間録音した音の例を示す図。 図2の時刻2−A、2−Bにおけるパワースペクトルを示す図。 図1の時刻1−A、1−Bにおけるパワースペクトルを示す図。 雑音下で観測される報知音を含んだ音響信号のスペクトルの概念図。 観測スペクトルからピークを検出する処理の概要を示す図。 報知音感知・識別装置の機能構成例を示す図。 判定部の詳細な構成例を示す図。 学習時の報知音感知・識別装置の処理フローを示す図。 識別時の報知音感知・識別装置の処理フローを示す図。 図3に示したスペクトルに対してステップS111〜S117の処理を行った後の周波数スペクトルを示す図。 音響信号のピークとなる周波数の時間パターンF(k,τ)の例を示す図。 時間パターンF(k,τ)に基づいて報知音特徴量Θ(k,t)を求めた例を示す図。 照合報知音特徴量Θ’(k,t)と比較報知音特徴量Θ(k,t)の例を示す図。
以下、本発明の実施の形態について、詳細に説明する。なお、同じ機能を有する構成部には同じ番号を付し、重複説明を省略する。
<報知音の分析>
まず、報知音の特徴を分析する。図2は、オフィスで一定時間録音した音の例で、図2(A)は時間領域の波形を、横軸を時間、縦軸を振幅として示した図、図2(B)は時間周波数領域のデータを、横軸を時間、縦軸を周波数、濃淡を強度として示した図である。時刻2−A付近は、携帯電話の着信音が鳴ったとき波形を示している。音を言葉で表現すると、ピピピッピピピッ、ピピピッピピピッ、ピピピッピピピッ、ピピピッピピピッといった感じである。それ以外の時間は、オフィスにおける通常業務で発生するノイズ(オフィスノイズ)であり、定常的な音もあれば、突発性で音量の大きいノイズ(時刻2−B付近)も発生している。
図2のような状況においては、報知音感知・識別装置には、携帯電話の着信音が鳴ったときに報知音を感知し、学習時には報知音が鳴った区間のみを登録し、識別時にはそれが登録されたどの報知音なのかを示す識別情報を出力することが求められる。またそれ以外の時間帯では識別情報を出力しないことが求められる。
図3は、図2の時刻2−A、2−Bにおけるパワースペクトルを図示したもので、横軸が周波数(kHz)、縦軸がパワー(dB)である。報知音の波形である時刻2−Aの時刻の波形は、突発性ノイズの波形である時刻2−Bの波形に対して顕著な特徴があり、2.8kHz付近と5.6kHz付近にピークを持つスペクトル構造をしていることが分かる。時刻2−Bの波形ではそのような特徴は認められない。
図4は、図1(類似した異なる2つの報知音の例を表示した図)の時刻1−A、1−Bにおけるパワースペクトルを図3と同様に図示したものである。図1の時間波形では二種類の報知音に差異はないように見られたが、時刻1−Aのスペクトルには1.4kHz付近にピークが、時刻1−Bのスペクトルには1.2kHz付近にピークがあることが分かる。さらに、図1(B)より、それらピークの継続時間や間欠時間も、報知音を識別する手がかりとなることが分かる。
これらの観察結果より、報知音をその他の周囲雑音の中から見つけるためには、1〜数か所の周波数にピークを持つ、すなわちパワーが集中した音であるかどうかを見分ければよい。また、あらかじめ登録した報知音と、検出した報知音が同一のものかを識別するためには、ピークの出現周波数や継続時間、間欠時間を比較すればよい。
<周波数のピークを安定的に検出するための方法の検討>
次に、雑音がある状況でも周波数のピークを安定的に検出するための方法について検討する。まず、雑音下での観測されるスペクトルS(k)をモデル化する。ここでk∈{1,2,…,K}は周波数ビンのインデックスである。概念図を図5に示す。ただし図5中の「*」は周波数軸上の畳み込み演算を表す。報知音のスペクトルX(k)は周波数領域で、報知音に含まれる周波数成分にパワーを持つパルス(図5ではパルススペクトルと記載)に、報知音の音色および強度を表すスペクトル包絡が乗算され、さらに短時間フーリエ変換の際に用いられた切り出し窓の周波数特性が畳み込まれたものと考えられる。すると、環境雑音のスペクトルをN(k)とし、環境雑音のスペクトルと報知音のスペクトルとは無相関と仮定すると、環境雑音のスペクトルは報知音のスペクトルに対して加法的に観測されるため、観測スペクトルS(k)は、S(k)=X(k)+N(k)のようにモデル化できる(図5参照)。
また、図3(B)の時刻2−Bのパワースペクトルから分かるように、環境雑音のスペクトルをN(k)は明確なピークを持たないため、S(k)からN(k)のスペクトル包絡およびパワー情報を除去することで、S(k)への雑音の影響を軽減できる。さらに、報知音を検出するためには、報知音スペクトルのピーク周波数とピーク数、すなわち報知音に含まれる周波数成分にパワーを持つパルスを検出すればよいため、報知音のスペクトル包絡およびスペクトル全体のパワー情報は検出には重要ではない。
以上の検討より、報知音スペクトルのパルスを検出するためには、観測スペクトルS(k)から雑音および報知音のスペクトル包絡情報とパワー情報を取り除き、さらにスペクトル上のピークを検出すればよいことがわかる(図6参照)。
<報知音感知・識別装置>
図7に報知音感知・識別装置の機能構成例を、図8に判定部の詳細な構成例を示す。また、図9に学習時の報知音感知・識別装置の処理フローを、図10に識別時の報知音感知・識別装置の処理フローを示す。報知音感知・識別装置100は、報知音感知部110、特徴抽出部130、記憶部190、報知音識別部140を備え、入力された音響信号に含まれた報知音を感知・識別する。
<報知音感知部>
報知音感知部110は、音響信号に、あらかじめ定めた周波数帯の中に、あらかじめ定めた条件を満たすパワーのピークとなる周波数が存在するかを確認し、存在するときは報知音を感知したことを示す感知情報を出力する(S110)。報知音は一般に、ブーという低い音ではなく、図3の時刻2−Aの波形に見られるようにピーという比較的高い音が用いられることから、あらかじめ定めた周波数帯は、第一の周波数ω(例えば、1.0kHz)から、第二の周波数ω(例えば6.0kHz)とすればよい。そしてその周波数帯に1〜Nか所程度(Nの具体的な値は、使用環境や使用目的などを考慮して実験的に求めるのがよいが、6程度がよいと思われる)の周波数にピークを持つ(パワーが集中した)音であると判断したら、感知情報を出力すればよい。あらかじめ定めた条件についての詳細は後述するが、周波数のピークに関する閾値を定め、閾値以上または閾値を超える周波数のピークが満たす条件を決めればよい。
ここで、報知音感知部110について更に詳細に説明する。上述の「周波数のピークを安定的に検出するための方法の検討」に示したように、報知音感知部110は、環境中の音響信号を短時間フレーム単位でフーリエ変換を適用して周波数分析し、その短時間スペクトルから報知音の特徴を得る処理を行えばよい。そこで、報知音感知部110は、例えば、第一FFT部111、対数パワースペクトル計算部112、逆FFT部113、窓かけ部116、第二FFT部117、判定部120を備えればよい。第一FFT部111、対数パワースペクトル計算部112、逆FFT部113で、ケプストラム計算部115を構成している。ケプストラム計算部115は、入力された音響信号に対するケプストラムを求める(S115)。なお、FFTは、Fast Fourier Transformの略であり、高速フーリエ変換を表す。
入力される音響信号s(n)はPCMなどのディジタル形式であり、フレームと呼ばれる一定の時間毎に区切られている。ここでn∈{1,2,…,N}は時間領域での時間インデックスであり、Nは最大サンプル数である。サンプリング周波数は任意の値を利用してよいが、1kHzから6kHzの周波数特性を分析するには、16kHz以上でサンプリングするのが適当である。以下、サンプリング周波数が16kHzであることを前提として説明する。フレーム長も任意の値を利用してよく、例えば、5ms(16kHzサンプリングの場合は、80サンプル)、10ms(同、160サンプル)、20ms(同、320サンプル)、32ms(同、512サンプル)などが利用できる。
第一FFT部111は、短時間フーリエ変換の手法を用いて、入力音響信号s(n)を周波数スペクトルS(k)に変換する(S111)。このとき、フーリエ変換の窓長はフレーム長以上にする。対数パワースペクトル計算部112は、S(k)を対数尺度のパワースペクトルに変換する(S112)。逆FFT部113は、それを逆フーリエ変換して時間領域の信号c(n)に戻す(S113)。逆FFT部の出力c(n)はFFTケプストラム係数(以下、単に「ケプストラム」)と呼ばれ、第一FFT部111から逆FFT部113までがケプストラム計算部115である。ケプストラムの計算方法の詳細は、一般に広く知られている方法を用いることができる。ケプストラム分析およびケプストラムに窓かけをする手法については、例えば文献(古井貞熙, “ディジタル音声処理” 東海大学出版会, 2003年, pp.44-47.)に記載されている。
窓かけ部116は、ケプストラムに重み付けをし、重み付けケプストラムを求める(S116)。具体的には、あらかじめ決められた窓関数(リフター)を用いて、ケプストラムc(n)に重みを掛けた重み付けケプストラムw(n)c(n)を出力すればよい。ケプストラムの値c(n)は、nが小さい領域はスペクトルの傾きや緩やかな概形(スペクトル包絡)を、nが大きくなるにつれてスペクトルの微細構造を表すことが知られている。nの値に応じた重み係数を乗算(リフタリング)することによって、スペクトル包絡や微細構造を強調/除去できることが知られている。報知音感知部110では、スペクトルのピーク、すなわち微細構造を取得することが目的なので、nが小さい領域の重みがそれ以外の領域よりも小さくなるリフターを利用すればよい。例えば、インデックスN,N(ただし、N<N)で制御される方形窓
を利用できる。フレーム長を32ms(512サンプル)、フーリエ変換の窓長を1024サンプルの場合、Nの値を例えば10、Nの値を例えば100〜400に設定すればよい。方形窓以外にも、例えば、nの値によってゆるやかにw(n)の値が変化する窓関数(例えば、ハミング窓やハニング窓など)を用いてもよい。
第二FFT部117は、重み付けケプストラムw(n)c(n)を再度周波数領域にフーリエ変換した信号Cw(k)を出力する(S117)。図11に、図3に示したスペクトルに対してステップS111〜S117の処理を行った後のあらかじめ定めた周波数帯ω〜ωを含む範囲の周波数スペクトルを示す。図11(A)は図3(A)に示した時刻2−Aのスペクトルの場合、図11(B)は時刻2−Bのスペクトルの場合を示している。図11(A)より、報知音である時刻2−Aの音響信号からは、急峻なピークを検出できていることが分かる。また、図11のCaは閾値である。
判定部120は、KL≦k≦KHの範囲の各Cw(k)の値を調べ、あらかじめ決めた閾値Caを超える(以上でもよい。以下同じ)値があるときには、閾値Caを超えるピークがあらかじめ定めた条件を満たすときは感知情報a(例えばa=1)を出力する。閾値Caを超える値がないときやあらかじめ定めた条件を満たさないときは、感知情報a(例えばa=0)を出力する(S120)。ただし、KLはω、KHはωにそれぞれ対応する周波数ビンのインデックスである。このように、報知音感知部110は、重み付けケプストラムw(n)c(n)を用いてピークとなる周波数が存在するかを確認する。
<判定部>
ここで、判定部120および「あらかじめ定めた条件」について詳細に説明する。例えば、判定部120は、ピーク検出部121、メモリ124、総合判定部125で構成すればよい(図8参照)。また、ピーク検出部121はピーク数検出部122とピーク周波数検出部123で構成し、総合判定部125は連続音判定部126と間欠音判定部127で構成すればよい。
ピーク数検出部122は、KL≦k≦KHの範囲の各Cw(k)の値を調べ、あらかじめ決めた閾値Caを超える値がある場合には、ピーク数aを求める。なお、最大のピーク数を6のように決めておいてもよい。ピーク周波数検出部123は、最大a個のピークの中心周波数ビンインデックスa(ν)を求め出力する(S121)。ただしνはν∈{1,2,…,a}となるピークのインデックスである。なお、ピークの数とは、閾値Caを超えたkの個数ではなく、kの小さい(または大きい)ほうから順(または逆順)にCw(k)の値を調べ、閾値Caを超えない状態からCw(k)の値が閾値Caを超えた状態にかわり、次に閾値Caを超えない状態になるまでを1つのピークとして数える。ピークの中心周波数ビンインデックスは、検出された各ピークでCw(k)の値が最大になる周波数インデックスとする。
メモリ124は、あらかじめ決められたフレーム数T(例えば1.5秒分に相当するフレーム数)にわたってピーク数a,中心周波数ビンインデックスa(ν)の値を蓄積し、総合判定部に送る。以降、説明の簡単のために、メモリ124から出力される蓄積されたピーク数と、ピークの中心周波数ビンインデックスに、周波数領域のフレームインデックスτ∈{1,2,…,T}を導入する。すなわち、時刻τ(フレームインデックスτで示される時刻)のピークの数をa(τ)、時刻τのピークの中心周波数ビンインデックスをa(ντ,τ)と表記する。ντ∈{1,2,…,a(τ)}は時刻τでのピークのインデックスである。
ここで、大きさK×Tのビット行列
を導入して説明する。ただしk∈{1,2,…,K},τ∈{1,2,…,T}である。このビット行列は、時刻τにおいて、周波数ビンインデックスa(ντ,τ)に値1、それ以外のビンで値0を持つ行列であり、音響信号のピークとなる周波数の時間パターンである。言い換えると、F(k,τ)は、時刻(フレーム)ごとに、ピークではない周波数はピークではないことを示す値である第1の値(F(k,τ)=0)で表現し、ピークとなる周波数はピークであることを示す値である第2の値(F(k,τ)=1)で表現した時間パターンである。
報知音をより誤りなく感知するため、総合判定部125を連続音判定部126と間欠音判定部127で構成し、連続音と間欠音で異なる規則を決める。連続音としては、ピーという同じ音が一定時間継続する報知音(洗濯機、電子レンジなどの動作終了音など)のほか、ピーンポーンという音程が変わるインターフォンの呼び出し音、ピューピューと音程が連続的に変わる火災警報音、トゥルルルルやチリリリンといった複雑な音質の電話の着信音などが想定される。間欠音としては、ピピッ、ピピッ、という目覚まし時計、キッチンタイマー、携帯電話の着信音などが想定される。図12に、音響信号のピークとなる周波数の時間パターンF(k,τ)の例を示す。図12(A)は連続音の報知音の例、図12(B)は間欠音の報知音の例、図12(C)は報知音以外の例を示している。これらの図では、白い部分がF(k,τ)=0、黒い部分がF(k,τ)=1を表している。図12(A)に示された音は、同じ音が長時間は継続せず、一定間隔で音程が変化するが、特定の周波数にパワーが集中する音が一定間隔は継続することによって、人は報知音であると認識する。図12(B)の音は、音の鳴り始めから鳴り終わりまでの時間は一定以上継続しているが、一回一回の音が出ている時間は短時間である。しかし、同じ音が規則正しく間欠的に鳴ることによって、人は報知音であると認識する。
以上の特徴から、報知音を判定するためには、現在のフレームτのピーク数a(τ),中心周波数ビンインデックスa(ντ,τ)の値と、過去のフレームτ’のピーク数a(τ’),中心周波数ビンインデックスa(ντ’,τ’)の値の履歴を利用し、あらかじめ決められた、連続音と間欠音それぞれの規則(「あらかじめ定めた条件」に相当)を参照することにより、報知音が発生したかどうかを判定できる。規則に適合するピーク数a(τ),中心周波数ビンインデックスa(ντ,τ)が得られたときは報知音を感知したことを示す感知情報a(例えばa=1)と感知された時点までに蓄積されたピーク数a(τ),中心周波数ビンインデックスa(ντ,τ)(k∈{1,2,…,K},τ∈{1,2,…,T})を特徴抽出部130へ送り、それ以外の場合は、報知音が感知されていないことを示す感知情報a(例えばa=0)を出力する(S125)。
連続音検出の規則には例えば、「連続でTcontフレーム以上、ピークの数a(τ)が1以上のときに報知音が発生したものと判定する。」などが考えられる。例えば、Tcont=10でフレーム長が32msのときは、320ms以上連続して周波数のピークが検出されると報知音を感知したと判断される。間欠音を検出する規則には例えば、「あらかじめ決められた過去一定時間内に、Tintermフレーム以上ピーク数a(τ)の値が0でない、中心周波数ビンインデックa(ντ,τ)が同一(または差があらかじめ決めた許容差以内。以下総称して同一と呼ぶ)のフレームの組を抽出し、当該フレーム間の時間差(フレーム番号の差)があらかじめ決めた所定の値以下の場合には、当該フレーム間は連続して同一の音が鳴っているとみなしたうえで、前記連続音を検出する規則を適用して報知音の発生を判定する。」などが考えられる。例えば、過去一定時間は過去6秒以内、Tintermは10のように設定すればよい。
なお、「同一」の判定には、例えば、F(k,τ)の相関関数などが使用できる。具体的には、Tintermフレーム以上ピーク数a(τ)の値が0でないフレームのセット(すなわちTinterm分のF(k,τ))を切り出し、それを正の時間方向にシフトしながら相関(正確には行列のため、要素積の和)を取る。すると、切り出したF(k,τ)と、F(k,τ)全体との相関関数を得ることができ、シフト量0の値を1とすれば正規化相関関数を得ることができる。シフト量0以外の最大ピークの値は類似度を表し「同一性」の特徴量となり、シフト量がその時間差を表している。このように、時間パターンF(k,τ)を判定部120で求めた場合は、報知音感知部110からの出力に時間パターンF(k,τ)を含めてもよい。
総合判定部125を連続音判定部126と間欠音判定部127で構成することで、食器やテレビ番組の音を報知音と判断する誤検出を減らすことができる。例えば、上述の連続音の規則の例で間欠音を認識しようとすると、Tcontを極端に小さな値に設定する必要がある。すると、図12(C)のような日常生活音の時間パターンF(k,τ)が得られたときでも、報知音と誤って判断し、感知情報を出力してしまうことがある。連続音判定部126と間欠音判定部127は並列して両方動作させてもよいし、まず連続音判定部126を動作させ、報知音が発生したと判定されなかったときに間欠音判定部127を動作させてもよい。
<特徴抽出部>
特徴抽出部130は、報知音感知部110が報知音を感知した時刻を含む音響信号のピークとなる周波数の時間パターンに基づいた報知音特徴量を出力する(S130)。なお、ピークとなる周波数の時間パターンの具体例は、上述の時間パターンF(k,τ)である。特徴抽出部130は、報知音を感知したことを示す感知情報a(例えばa=1)と感知された時点までに蓄積されたピーク数a(τ),中心周波数ビンインデックスa(ντ,τ)(k∈{1,2,…,K},τ∈{1,2,…,T})を判定部120から受け取り、パターンF(k,τ)を生成する。ただし、判定部120の判断で時間パターンF(k,τ)を使う場合は、判定部120が、蓄積されたピーク数a(τ),中心周波数ビンインデックスa(ντ,τ)の代わりに、時間パターンF(k,τ)を特徴抽出部130に送信してもよい。つまり、ピーク数a(τ),中心周波数ビンインデックスa(ντ,τ)そのものでなくても、これらの情報が判定部120から特徴抽出部130に伝えればよい。
報知音識別部140では、特徴抽出部130が出力する報知音特徴量を用いて、事前に登録された報知音特徴量(照合報知音特徴量)と、感知された報知音特徴量(入力報知音特徴量)の一致率を評価する。また、上述のとおり、報知音には、特定の周波数に強度のピークがあり、その時間変化も考慮することでより正確に感知・識別できる。したがって、報知音特徴量としてはスペクトルピークの数と周波数、またその時間構造を示すものが有効である。例えば、時間パターンF(k,τ)のような時間周波数領域でのピークの有無を2値で表現した特徴量(ビット行列)は有効である。したがって、報知音特徴量を、音響信号のピークとなる周波数の時間パターンF(k,τ)自体としてもよい。
ただし、スペクトルピークの位置や強度は、FFTの切り出し位置やリフターの形状、方形窓のパラメータN,N、また環境ノイズなどに影響を受ける。そのため、単にビット行列の一致率を求めると、ピーク位置の揺らぎなどにより精度が低下する恐れがある。そこでピークの有無および位置の揺らぎを表現するために、時間パターンF(k,τ)で表現されるビットを確率的に立ち上がったものと解釈し、F(k,τ)に対してBerunoulli(Θ(k,t))の生成モデルを仮定する。ここで、Berunoulli(α)はパラメータαを持つベルヌーイ分布である。ベルヌーイ分布とは、確率αで1を出力し、確率(1−α)で0を出力する確率分布である。また、tは周波数領域の時間フレームインデックスである。
本発明では、報知音の周期パルススペクトルの解析結果である時間パターンF(k,τ)と同じ大きさ(K×T)を持つパラメータ行列Θ(k,t)を、報知音特徴量として求める。Θ(k,t)は、「時間−周波数インデックス(k,τ)で、F(k,τ)=1が解析されたとしても、実際にはそのピークは周辺の時間−周波数インデックスに存在した可能性もある」ことを表現できればよい。よって、F(k,τ)=1ならば、時間−周波数インデックス(k,τ)周辺のΘ(k,t)にも0以上の値を与えればよい。これは、F(k,τ)=1を時間方向と周波数方向に「滲ませる」ことに相当する。図13は、時間パターンF(k,τ)に基づいて報知音特徴量Θ(k,t)を求めた例を示す図である。また、F(k,τ)を、時刻(フレーム)ごとに、ピークではない周波数はピークではないことを示す値である第1の値(F(k,τ)=0)で表現し、ピークとなる周波数はピークであることを示す値である第2の値(F(k,τ)=1)で表現した時間パターンと表現すると、Θ(k,t)は、時間パターンF(k,τ)のそれぞれの値を、確率分布に基づいた第1の値から第2の値の範囲の値に変更した時間パターンである。
上記の計算は、F(k,τ)=1ならば時間−周波数インデックス(k,τ)を中心に減衰する非負の値を持つ関数で表現できる。それを、すべてのF(k,τ)=1となる時間−周波数インデックス(k,τ)について計算し総和を取ればよい。この性質を満たす関数にはガウス関数などがあり、例えばΘ(k,t)は以下のように計算できる。
ここでσは、「滲み」の大きさを表す非負のパラメータである(例えばσ=3などに設定すればよい)。また、σ→0の極限を取ると、F(k,t)=Θ(k,t)となり、Θ(k,t)はビット行列となる。すなわち、時間パターンF(k,t)自体を報知音特徴量とすることも、上記の変換に含まれる。
なお、TやKが大きな値となると後述する報知音識別部の計算コストが増大するため、Θ(k,t)の情報をなるべく損失させないようサイズを圧縮してもよい。特に、計算の高速化などのためにσ=0としたい場合には、時間パターンF(k,t)の隣接する周波数ビンや時間フレーム同士で論理積や論理和を取ることで、サイズ圧縮と、時間周波数方向への平滑化(滲みの作成)を疑似的に行い、報知音特徴量Θ(k’,t’)としてもよい。例えば、隣り合う2つの周波数ビンと2つの時間フレームで作られる2×2のビット行列を、1つのビットで表現するようにビット行列で表現される時間パターンF(k,t)を圧縮することを考える。このとき、2×2のビット行列の中のいずれかのビットが“1”であれば“1”、すべてのビットが“0”ならば“0”となるように論理和を取ればよい。このような圧縮を行えば、報知音特徴量Θ(k’,t’)の情報量は時間パターンF(k,t)の1/4となる。
<記憶部>
記憶部190は、報知音IDが既知の報知音を含む音響信号の報知音特徴量を照合報知音特徴量として当該報知音IDと対応付けた組を、あらかじめ1組以上記録しておく。報知音IDとは、報知音の識別子を意味しており、報知音名(例えば、目覚まし時計、玄関チャイム、電話、火災警報など)を示す文字列でもよいし、それらを示す番号やアルファベットなどでもよい。記憶部190があらかじめ照合報知音特徴量と報知音IDとを記録しておく学習時と、未知の報知音を識別する識別時があり、学習時と識別時で処理が異なる。
ユーザの指定によって報知音IDと報知音特徴量を学習するときは、記憶部190には、学習することを示す命令(入力命令)、登録する報知音ID、および特徴抽出部で抽出された報知音特徴量として入力される。なお、記憶部190にあらかじめ記録される報知音特徴量を、照合報知音特徴量Θ’(k,t)と表現し、識別時に特徴抽出部130から出力される報知音特徴量と区別する。記憶部190は、例えば入出力制御部191と記録媒体192を備えればよい(図7参照)。入力命令は、何らかの変数ioを媒介して渡すことができ、例えばio=0などでよい。これらは入出力制御部191に渡され、報知音IDと報知音特徴量Θ’(k,t)が対応付けられて記録媒体192に記録される(S190、図9参照)。記録媒体192は、コンピュータで読み取り可能な記録媒体であり、例えば磁気記憶装置、光ディスク、光磁気記録媒体、半導体メモリなどどのようなものでもよい。本発明の報知音感知・識別装置であれば、報知音感知部110で報知音を感知したときに報知音特徴量を記録できる。
報知音IDと報知音特徴量を識別に用いるときは、引数に照合報知音特徴量を出力することを示す命令(出力命令)、出力する報知音IDをとる。出力命令も、何らかの変数ioを媒介して渡すことができ、例えばio=1などでよい。報知音IDは、学習時に入力した報知音IDである。これらは入出力制御部191に渡され、報知音IDに対応した照合報知音特徴量Θ’(k,t)が記録媒体192から読みだされ、出力される。なお、この記憶部190の処理は、後述するマッチング部142での処理(S142、図10参照)の中で実行される。
<報知音識別部>
報知音識別部140は、感知・識別の対象である音響信号の報知音特徴量である入力報知音特徴量Θ(k,t)を、照合報知音特徴量Θ’(k,t)ごとに対比することで一致率を求める。そして、一致率の中に、一致率が高いことを示す所定範囲の照合報知音特徴量があるときは、最も一致率の高い照合報知音特徴量に対応付けられた報知音IDを出力する(S140)。入力報知音特徴量Θ(k,t)とは、識別時に特徴抽出部130が出力する報知音特徴量であり、照合報知音特徴量Θ’(k,t)と区別するための表現である。
さらに具体的には、報知音識別部140は、初期制御部141とマッチング部142を備えればよい。初期制御部141には、判定部120の判定結果である感知情報aと大きさK×Tの入力報知音特徴量Θ(k,t)が入力される。ここで、Kは周波数ビンの数、Tは入力信号の周波数領域の時間フレーム数である。報知音を感知していないことを示す感知情報a(例えばa=0)が入力されると、初期制御部141は値を返さないもしくは識別情報として不感知情報を出力し、報知音識別部140の処理を終了させる。報知音を感知したことを示す感知情報a(例えばa=1)が入力されると、初期制御部141は入力報知音特徴量Θ(k,t)をマッチング部142に送り、識別処理(マッチング)を開始させる(S141)。
マッチング部142は、記憶部190に記憶されているすべての照合報知音特徴量Θ’(k,t)と入力報知音特徴量Θ(k,t)を比較する。具体的には、まず、所望の報知音の報知音IDを用いて記憶部190から大きさK×Tの照合報知音特徴量Θ’(k,t)を読みだす。Tは照合報知音特徴量Θ’(k,t)の周波数領域の時間フレーム数である。そして、T<Tとなるように、入力報知音特徴量Θ(k,t)を時間方向に切り出し、大きさをK×Tにする。切り出しの長さTは適宜決めればよく、例えばTが6秒分ならTを1.5秒分程度にすればよい。切り出し位置も適宜決めればよく、例えば切り出し前の中心時刻を中心時刻として持つように切り出しを行えばよい。ここで、切り出し後の入力報知音特徴量を、区別のために比較報知音特徴量Θ(k,t)と呼ぶことにする。
そして比較報知音特徴量Θ(k,t)と照合報知音特徴量Θ’(k,t)の一致率Mを評価する。まず、Θ’(k,t)を時間方向にt’シフトさせながら時間方向に長さTで切り出し、t’ごとに比較報知音特徴量Θ(k,t)との一致率を求め、暫定一致率Mtmpとする。そして、すべてのt’に対する暫定一致率Mtmpで最大の暫定一致率Mtmpを、照合報知音特徴量Θ’(k,t)と比較報知音特徴量Θ(k,t)との一致率Mとする。ただしt’∈{0,1,…,T−T}である。この処理を、記憶部190に記憶されているすべての照合報知音特徴量Θ’(k,t)に対して実行する。図14は、照合報知音特徴量Θ’(k,t)と比較報知音特徴量Θ(k,t)の例を示す図である。
報知音識別部140は、求めた一致率Mの中に、一致率が高いことを示す所定範囲の照合報知音特徴量Θ’(k,t)が存在する場合は、最も一致率の高い照合報知音特徴量Θ’(k,t)に対応付けされた報知音IDと、識別情報として報知音を感知したことを示す感知情報a(例えばa=1)を出力する。一致率が高いことを示す所定範囲とは、あらかじめ定めた閾値MTHより大きい範囲、閾値MTH以上の範囲などを意味している。求めた一致率Mの中に、一致率が高いことを示す所定範囲の照合報知音特徴量Θ’(k,t)が存在しない場合、報知音識別部140は値を返さない、もしくは識別情報として報知音を感知していないことを示す感知情報a(例えばa=0)を出力し、報知音識別部の処理を終了させる。
なお、一致率の尺度には様々なものが利用できる。例えばΘ(k,t)を確率行列とみなして一般化KLダイバージェンスを用いて
のように算出できる。またより簡便な計算法として
のように計算してもよい。0<Θ(k,t)<1であることから、この尺度は0≦M≦1を満たすため、閾値MTHを容易に設定することができる(例えば0.5などに設定すればよい)。なお、TやKが大きな値となると計算コストが増大する。計算コストによる問題が生じるときは、特徴抽出部の説明で示した情報量を圧縮した報知音特徴量を用いればよい。
本発明の報知音感知・識別装置によれば、報知音のスペクトルだけでなく、その時間変化も含めて報知音を感知・識別する。よって、人の日常動作に伴う音や自然界に存在する音がある環境において、報知音が鳴ったことを、正確に検知・識別することができる。つまり、聴覚障がい者に音以外の方法によって何の報知音が鳴ったかを正確に通知できる。また、聴覚障がい者向けのサービスに限らず健常者向けにも、報知音の発生源から離れた場所にいるときに、報知音の発生源の近くに本検知装置を置き、検知結果を例えば無線などの手段を用いて離れたユーザに通知できる。
[プログラム、記録媒体]
上述の各種の処理は、記載に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。その他、本発明の趣旨を逸脱しない範囲で適宜変更が可能であることはいうまでもない。
また、上述の構成をコンピュータによって実現する場合、各装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記処理機能がコンピュータ上で実現される。
この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。
また、このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD−ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。
このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶装置に格納する。そして、処理の実行時、このコンピュータは、自己の記録媒体に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。また、このプログラムの別の実行形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよく、さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるASP(Application Service Provider)型のサービスによって、上述の処理を実行する構成としてもよい。なお、本形態におけるプログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの(コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータ等)を含むものとする。
また、この形態では、コンピュータ上で所定のプログラムを実行させることにより、本装置を構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。
100 報知音感知・識別装置 110 報知音感知部
111 第一FFT部 112 対数パワースペクトル計算部
113 逆FFT部 115 ケプストラム計算部
116 窓かけ部 117 第二FFT部
120 判定部 121 ピーク検出部
122 ピーク数検出部 123 ピーク周波数検出部
124 メモリ 125 総合判定部
126 連続音判定部 127 間欠音判定部
130 特徴抽出部 140 報知音識別部
141 初期制御部 142 マッチング部
190 記憶部 191 入出力制御部
192 記録媒体

Claims (7)

  1. 入力された音響信号に含まれた報知音を感知・識別する報知音感知・識別装置であって、
    前記音響信号に、あらかじめ定めた周波数帯の中に、あらかじめ定めた条件を満たすパワーのピークとなる周波数が存在するかを確認し、存在するときは報知音を感知したことを示す感知情報を出力する報知音感知部と、
    前記報知音感知部が報知音を感知した時刻を含む前記音響信号の前記ピークとなる周波数の時間パターンに基づいた報知音特徴量を出力する特徴抽出部と、
    報知音IDが既知の報知音を含む音響信号の報知音特徴量である照合報知音特徴量と当該報知音IDとを対応付けた組を、あらかじめ1組以上記録した記憶部と、
    感知・識別の対象である音響信号の報知音特徴量である入力報知音特徴量を、前記照合報知音特徴量ごとに対比することで一致率を求め、前記一致率の中に、一致率が高いことを示す所定範囲の照合報知音特徴量があるときは、最も一致率の高い照合報知音特徴量に対応付けられた報知音IDを出力する報知音識別部と、
    を備えた報知音感知・識別装置。
  2. 請求項1記載の報知音感知・識別装置であって、
    前記時間パターンとは、時刻ごとに、ピークではない周波数はピークではないことを示す値である第1の値で表現し、ピークとなる周波数はピークであることを示す値である第2の値で表現した時間パターンである
    ことを特徴とする報知音感知・識別装置。
  3. 請求項2記載の報知音感知・識別装置であって、
    前記報知音特徴量とは、前記時間パターンのそれぞれの値を、確率分布に基づいた前記第1の値から前記第2の値の範囲の値に変更した確率分布時間パターンである
    ことを特徴とする報知音感知・識別装置。
  4. 請求項1から3のいずれかに記載の報知音感知・識別装置であって、
    前記報知音感知部は、
    前記音響信号に対するケプストラムを求めるケプストラム計算部と、
    前記ケプストラムに重み付けをし、重み付けケプストラムを求める窓かけ部と、
    を備え、前記重み付けケプストラムを用いて前記ピークとなる周波数が存在するかを確認する
    ことを特徴とする報知音感知・識別装置。
  5. 請求項1から4のいずれかに記載の報知音感知・識別装置であって、
    前記報知音識別部は、初期制御部とマッチング部を備え、
    前記初期制御部は、報知音を感知したことを示す感知情報を受信すると、前記入力報知音特徴量を前記マッチング部に送り、
    前記マッチング部は、
    前記入力報知音特徴量から、前記照合報知音特徴量の時間よりも短い時間分の報知音特徴量を切り出し、比較報知音特徴量とし、
    照合報知音特徴量ごとに、前記比較報知音特徴量に対して当該照合報知特徴量を時間方向にシフトしながら複数の暫定一致率を求め、前記暫定一致率の中かで最も高い値を当該照合報知特徴量と前記比較報知音特徴量との一致率とする
    ことを特徴とする報知音感知・識別装置。
  6. 入力された音響信号に含まれた報知音を感知・識別する報知音感知・識別方法であって、
    記憶部に、報知音IDが既知の報知音を含む音響信号の報知音特徴量である照合報知音特徴量を当該報知音IDとを対応付けた組を、あらかじめ1組以上記録しておき、
    入力された音響信号のあらかじめ定めた周波数帯の中に、あらかじめ定めた条件を満たすパワーのピークとなる周波数が存在するかを確認し、存在するときは報知音を感知したことを示す感知情報を出力する報知音感知ステップと、
    前記報知音感知ステップで報知音を感知した時刻を含む前記音響信号の前記ピークとなる周波数の時間パターンに基づいた報知音特徴量を出力する特徴抽出ステップと、
    感知・識別の対象である音響信号の報知音特徴量である入力報知音特徴量を、前記照合報知音特徴量ごとに対比することで一致率を求め、前記一致率の中に、一致率が高いことを示す所定範囲の照合報知音特徴量があるときは、最も一致率の高い照合報知音特徴量に対応付けられた報知音IDを出力する報知音識別ステップと、
    を実行する報知音感知・識別方法。
  7. 請求項1から5のいずれかに記載の報知音感知・識別装置としてコンピュータを機能させるための報知音感知・識別プログラム。
JP2014232317A 2014-11-17 2014-11-17 報知音感知・識別装置、報知音感知・識別方法、報知音感知・識別プログラム Active JP6367691B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014232317A JP6367691B2 (ja) 2014-11-17 2014-11-17 報知音感知・識別装置、報知音感知・識別方法、報知音感知・識別プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014232317A JP6367691B2 (ja) 2014-11-17 2014-11-17 報知音感知・識別装置、報知音感知・識別方法、報知音感知・識別プログラム

Publications (2)

Publication Number Publication Date
JP2016095434A true JP2016095434A (ja) 2016-05-26
JP6367691B2 JP6367691B2 (ja) 2018-08-01

Family

ID=56071090

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014232317A Active JP6367691B2 (ja) 2014-11-17 2014-11-17 報知音感知・識別装置、報知音感知・識別方法、報知音感知・識別プログラム

Country Status (1)

Country Link
JP (1) JP6367691B2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021002013A (ja) * 2019-06-24 2021-01-07 日本キャステム株式会社 報知音検出装置および報知音検出方法
CN114417665A (zh) * 2022-01-11 2022-04-29 南京安广电力设备有限公司 一种风机机舱设备异常声音检测方法及装置
US11423298B2 (en) 2017-12-08 2022-08-23 Fujitsu Limited Computer-readable recording medium, determination method, and determination apparatus
US11625570B2 (en) 2017-12-08 2023-04-11 Fujitsu Limited Computer-readable recording medium, determination method, and determination apparatus for classifying time series data

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110136745A (zh) * 2019-05-08 2019-08-16 西北工业大学 一种基于卷积神经网络的汽车鸣笛识别方法
EP4211493A1 (en) 2020-09-11 2023-07-19 Fluke Corporation System and method for acoustic imaging with an accumulated-time view

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004053626A (ja) * 2002-07-16 2004-02-19 Nippon Telegr & Teleph Corp <Ntt> 雑音重畳量評価方法、雑音抑制方法、雑音抑制装置、雑音重畳量評価プログラム、雑音抑制プログラム、雑音重畳量評価プログラム又は雑音抑制プログラムの何れか一方又は双方を記録した記録媒体
JP2005077875A (ja) * 2003-09-02 2005-03-24 Tama Tlo Kk 警報音源認識装置及び警報音源認識方法
JP2007047422A (ja) * 2005-08-09 2007-02-22 Kazuhiro Fuchi 音声分析合成装置および音声分析合成方法
JP2009237254A (ja) * 2008-03-27 2009-10-15 Namco Bandai Games Inc プログラム、情報記憶媒体、及び特定音認識システム

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004053626A (ja) * 2002-07-16 2004-02-19 Nippon Telegr & Teleph Corp <Ntt> 雑音重畳量評価方法、雑音抑制方法、雑音抑制装置、雑音重畳量評価プログラム、雑音抑制プログラム、雑音重畳量評価プログラム又は雑音抑制プログラムの何れか一方又は双方を記録した記録媒体
JP2005077875A (ja) * 2003-09-02 2005-03-24 Tama Tlo Kk 警報音源認識装置及び警報音源認識方法
JP2007047422A (ja) * 2005-08-09 2007-02-22 Kazuhiro Fuchi 音声分析合成装置および音声分析合成方法
JP2009237254A (ja) * 2008-03-27 2009-10-15 Namco Bandai Games Inc プログラム、情報記憶媒体、及び特定音認識システム

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11423298B2 (en) 2017-12-08 2022-08-23 Fujitsu Limited Computer-readable recording medium, determination method, and determination apparatus
US11625570B2 (en) 2017-12-08 2023-04-11 Fujitsu Limited Computer-readable recording medium, determination method, and determination apparatus for classifying time series data
JP2021002013A (ja) * 2019-06-24 2021-01-07 日本キャステム株式会社 報知音検出装置および報知音検出方法
JP7250329B2 (ja) 2019-06-24 2023-04-03 日本キャステム株式会社 報知音検出装置および報知音検出方法
CN114417665A (zh) * 2022-01-11 2022-04-29 南京安广电力设备有限公司 一种风机机舱设备异常声音检测方法及装置

Also Published As

Publication number Publication date
JP6367691B2 (ja) 2018-08-01

Similar Documents

Publication Publication Date Title
JP6367691B2 (ja) 報知音感知・識別装置、報知音感知・識別方法、報知音感知・識別プログラム
US10373609B2 (en) Voice recognition method and apparatus
Vafeiadis et al. Audio content analysis for unobtrusive event detection in smart homes
US20230177942A1 (en) Systems and methods for identifying an acoustic source based on observed sound
Droghini et al. A Combined One‐Class SVM and Template‐Matching Approach for User‐Aided Human Fall Detection by Means of Floor Acoustic Features
JP6294747B2 (ja) 報知音感知装置、報知音感知方法及びプログラム
EP3847642B1 (en) Methods and apparatus to fingerprint an audio signal via normalization
GB2577570A (en) Sound event detection
US20230060936A1 (en) Method for identifying an audio signal
EP3193317A1 (en) Activity classification from audio
Poorjam et al. Dominant distortion classification for pre-processing of vowels in remote biomedical voice analysis
Li et al. Learning normality is enough: a software-based mitigation against inaudible voice attacks
JP6758890B2 (ja) 音声判別装置、音声判別方法、コンピュータプログラム
Diaconita et al. Do you hear what i hear? using acoustic probing to detect smartphone locations
CN115223584B (zh) 音频数据处理方法、装置、设备及存储介质
CN108962389A (zh) 用于风险提示的方法及系统
KR20110079161A (ko) 이동 단말기에서 화자 인증 방법 및 장치
CN110875043B (zh) 声纹识别方法、装置、移动终端及计算机可读存储介质
JP7250329B2 (ja) 報知音検出装置および報知音検出方法
Gougeh et al. Optimizing Auditory Immersion Safety on Edge Devices: An On-Device Sound Event Detection System
CN108520755B (zh) 一种检测方法及装置
De Lauretis et al. EarSaver: A Device to Detect Dangerous Audio Noises.
CN114283845A (zh) 用于音频识别的模型建构方法
Qadri et al. Comparative Analysis of Gender Identification using Speech Analysis and Higher Order Statistics
US11881200B2 (en) Mask generation device, mask generation method, and recording medium

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20161209

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20171127

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20171219

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180123

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180703

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180705

R150 Certificate of patent or registration of utility model

Ref document number: 6367691

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150