JP2016095434A - 報知音感知・識別装置、報知音感知・識別方法、報知音感知・識別プログラム - Google Patents
報知音感知・識別装置、報知音感知・識別方法、報知音感知・識別プログラム Download PDFInfo
- Publication number
- JP2016095434A JP2016095434A JP2014232317A JP2014232317A JP2016095434A JP 2016095434 A JP2016095434 A JP 2016095434A JP 2014232317 A JP2014232317 A JP 2014232317A JP 2014232317 A JP2014232317 A JP 2014232317A JP 2016095434 A JP2016095434 A JP 2016095434A
- Authority
- JP
- Japan
- Prior art keywords
- notification sound
- feature amount
- unit
- identification
- time
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 52
- 238000000034 method Methods 0.000 title claims abstract description 25
- 238000000605 extraction Methods 0.000 claims abstract description 19
- 238000012795 verification Methods 0.000 claims description 20
- 230000000052 comparative effect Effects 0.000 claims description 3
- 230000005236 sound signal Effects 0.000 claims description 3
- 230000002596 correlated effect Effects 0.000 abstract 2
- 238000001228 spectrum Methods 0.000 description 47
- 238000012545 processing Methods 0.000 description 22
- 238000004364 calculation method Methods 0.000 description 15
- 239000011159 matrix material Substances 0.000 description 12
- 230000006870 function Effects 0.000 description 10
- 230000008569 process Effects 0.000 description 9
- 238000010586 diagram Methods 0.000 description 5
- 230000007613 environmental effect Effects 0.000 description 5
- 208000032041 Hearing impaired Diseases 0.000 description 4
- 230000008859 change Effects 0.000 description 4
- 230000002354 daily effect Effects 0.000 description 4
- 230000003595 spectral effect Effects 0.000 description 4
- 241000282414 Homo sapiens Species 0.000 description 3
- 238000005314 correlation function Methods 0.000 description 3
- 238000005070 sampling Methods 0.000 description 3
- 230000002123 temporal effect Effects 0.000 description 3
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 238000007664 blowing Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 208000016354 hearing loss disease Diseases 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
Landscapes
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
Abstract
【解決手段】報知音感知・識別装置100は、報知音感知部、特徴抽出部130、記憶部190、報知音識別部140を備える。報知音感知部は、音響信号のあらかじめ定めた周波数帯の中に、あらかじめ定めた条件を満たすパワーのピークとなる周波数が存在するかを確認する。特徴抽出部130は、音響信号のピークとなる周波数の時間パターンに基づいた報知音特徴量を出力する。記憶部190は、照合報知音特徴量と報知音IDとを対応付けた組をあらかじめ記録しておく。報知音識別部140は、入力報知音特徴量を照合報知音特徴量ごとに対比することで一致率を求める。一致率が高い照合報知音特徴量があるときは、最も一致率の高い照合報知音特徴量に対応付けられた報知音IDを出力する。
【選択図】図7
Description
まず、報知音の特徴を分析する。図2は、オフィスで一定時間録音した音の例で、図2(A)は時間領域の波形を、横軸を時間、縦軸を振幅として示した図、図2(B)は時間周波数領域のデータを、横軸を時間、縦軸を周波数、濃淡を強度として示した図である。時刻2−A付近は、携帯電話の着信音が鳴ったとき波形を示している。音を言葉で表現すると、ピピピッピピピッ、ピピピッピピピッ、ピピピッピピピッ、ピピピッピピピッといった感じである。それ以外の時間は、オフィスにおける通常業務で発生するノイズ(オフィスノイズ)であり、定常的な音もあれば、突発性で音量の大きいノイズ(時刻2−B付近)も発生している。
次に、雑音がある状況でも周波数のピークを安定的に検出するための方法について検討する。まず、雑音下での観測されるスペクトルS(k)をモデル化する。ここでk∈{1,2,…,K}は周波数ビンのインデックスである。概念図を図5に示す。ただし図5中の「*」は周波数軸上の畳み込み演算を表す。報知音のスペクトルX(k)は周波数領域で、報知音に含まれる周波数成分にパワーを持つパルス(図5ではパルススペクトルと記載)に、報知音の音色および強度を表すスペクトル包絡が乗算され、さらに短時間フーリエ変換の際に用いられた切り出し窓の周波数特性が畳み込まれたものと考えられる。すると、環境雑音のスペクトルをN(k)とし、環境雑音のスペクトルと報知音のスペクトルとは無相関と仮定すると、環境雑音のスペクトルは報知音のスペクトルに対して加法的に観測されるため、観測スペクトルS(k)は、S(k)=X(k)+N(k)のようにモデル化できる(図5参照)。
図7に報知音感知・識別装置の機能構成例を、図8に判定部の詳細な構成例を示す。また、図9に学習時の報知音感知・識別装置の処理フローを、図10に識別時の報知音感知・識別装置の処理フローを示す。報知音感知・識別装置100は、報知音感知部110、特徴抽出部130、記憶部190、報知音識別部140を備え、入力された音響信号に含まれた報知音を感知・識別する。
報知音感知部110は、音響信号に、あらかじめ定めた周波数帯の中に、あらかじめ定めた条件を満たすパワーのピークとなる周波数が存在するかを確認し、存在するときは報知音を感知したことを示す感知情報を出力する(S110)。報知音は一般に、ブーという低い音ではなく、図3の時刻2−Aの波形に見られるようにピーという比較的高い音が用いられることから、あらかじめ定めた周波数帯は、第一の周波数ωL(例えば、1.0kHz)から、第二の周波数ωH(例えば6.0kHz)とすればよい。そしてその周波数帯に1〜Nか所程度(Nの具体的な値は、使用環境や使用目的などを考慮して実験的に求めるのがよいが、6程度がよいと思われる)の周波数にピークを持つ(パワーが集中した)音であると判断したら、感知情報を出力すればよい。あらかじめ定めた条件についての詳細は後述するが、周波数のピークに関する閾値を定め、閾値以上または閾値を超える周波数のピークが満たす条件を決めればよい。
ここで、判定部120および「あらかじめ定めた条件」について詳細に説明する。例えば、判定部120は、ピーク検出部121、メモリ124、総合判定部125で構成すればよい(図8参照)。また、ピーク検出部121はピーク数検出部122とピーク周波数検出部123で構成し、総合判定部125は連続音判定部126と間欠音判定部127で構成すればよい。
特徴抽出部130は、報知音感知部110が報知音を感知した時刻を含む音響信号のピークとなる周波数の時間パターンに基づいた報知音特徴量を出力する(S130)。なお、ピークとなる周波数の時間パターンの具体例は、上述の時間パターンF(k,τ)である。特徴抽出部130は、報知音を感知したことを示す感知情報a(例えばa=1)と感知された時点までに蓄積されたピーク数an(τ),中心周波数ビンインデックスak(ντ,τ)(k∈{1,2,…,K},τ∈{1,2,…,T})を判定部120から受け取り、パターンF(k,τ)を生成する。ただし、判定部120の判断で時間パターンF(k,τ)を使う場合は、判定部120が、蓄積されたピーク数an(τ),中心周波数ビンインデックスak(ντ,τ)の代わりに、時間パターンF(k,τ)を特徴抽出部130に送信してもよい。つまり、ピーク数an(τ),中心周波数ビンインデックスak(ντ,τ)そのものでなくても、これらの情報が判定部120から特徴抽出部130に伝えればよい。
記憶部190は、報知音IDが既知の報知音を含む音響信号の報知音特徴量を照合報知音特徴量として当該報知音IDと対応付けた組を、あらかじめ1組以上記録しておく。報知音IDとは、報知音の識別子を意味しており、報知音名(例えば、目覚まし時計、玄関チャイム、電話、火災警報など)を示す文字列でもよいし、それらを示す番号やアルファベットなどでもよい。記憶部190があらかじめ照合報知音特徴量と報知音IDとを記録しておく学習時と、未知の報知音を識別する識別時があり、学習時と識別時で処理が異なる。
報知音識別部140は、感知・識別の対象である音響信号の報知音特徴量である入力報知音特徴量Θ(k,t)を、照合報知音特徴量Θ’(k,t)ごとに対比することで一致率を求める。そして、一致率の中に、一致率が高いことを示す所定範囲の照合報知音特徴量があるときは、最も一致率の高い照合報知音特徴量に対応付けられた報知音IDを出力する(S140)。入力報知音特徴量Θ(k,t)とは、識別時に特徴抽出部130が出力する報知音特徴量であり、照合報知音特徴量Θ’(k,t)と区別するための表現である。
上述の各種の処理は、記載に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。その他、本発明の趣旨を逸脱しない範囲で適宜変更が可能であることはいうまでもない。
111 第一FFT部 112 対数パワースペクトル計算部
113 逆FFT部 115 ケプストラム計算部
116 窓かけ部 117 第二FFT部
120 判定部 121 ピーク検出部
122 ピーク数検出部 123 ピーク周波数検出部
124 メモリ 125 総合判定部
126 連続音判定部 127 間欠音判定部
130 特徴抽出部 140 報知音識別部
141 初期制御部 142 マッチング部
190 記憶部 191 入出力制御部
192 記録媒体
Claims (7)
- 入力された音響信号に含まれた報知音を感知・識別する報知音感知・識別装置であって、
前記音響信号に、あらかじめ定めた周波数帯の中に、あらかじめ定めた条件を満たすパワーのピークとなる周波数が存在するかを確認し、存在するときは報知音を感知したことを示す感知情報を出力する報知音感知部と、
前記報知音感知部が報知音を感知した時刻を含む前記音響信号の前記ピークとなる周波数の時間パターンに基づいた報知音特徴量を出力する特徴抽出部と、
報知音IDが既知の報知音を含む音響信号の報知音特徴量である照合報知音特徴量と当該報知音IDとを対応付けた組を、あらかじめ1組以上記録した記憶部と、
感知・識別の対象である音響信号の報知音特徴量である入力報知音特徴量を、前記照合報知音特徴量ごとに対比することで一致率を求め、前記一致率の中に、一致率が高いことを示す所定範囲の照合報知音特徴量があるときは、最も一致率の高い照合報知音特徴量に対応付けられた報知音IDを出力する報知音識別部と、
を備えた報知音感知・識別装置。 - 請求項1記載の報知音感知・識別装置であって、
前記時間パターンとは、時刻ごとに、ピークではない周波数はピークではないことを示す値である第1の値で表現し、ピークとなる周波数はピークであることを示す値である第2の値で表現した時間パターンである
ことを特徴とする報知音感知・識別装置。 - 請求項2記載の報知音感知・識別装置であって、
前記報知音特徴量とは、前記時間パターンのそれぞれの値を、確率分布に基づいた前記第1の値から前記第2の値の範囲の値に変更した確率分布時間パターンである
ことを特徴とする報知音感知・識別装置。 - 請求項1から3のいずれかに記載の報知音感知・識別装置であって、
前記報知音感知部は、
前記音響信号に対するケプストラムを求めるケプストラム計算部と、
前記ケプストラムに重み付けをし、重み付けケプストラムを求める窓かけ部と、
を備え、前記重み付けケプストラムを用いて前記ピークとなる周波数が存在するかを確認する
ことを特徴とする報知音感知・識別装置。 - 請求項1から4のいずれかに記載の報知音感知・識別装置であって、
前記報知音識別部は、初期制御部とマッチング部を備え、
前記初期制御部は、報知音を感知したことを示す感知情報を受信すると、前記入力報知音特徴量を前記マッチング部に送り、
前記マッチング部は、
前記入力報知音特徴量から、前記照合報知音特徴量の時間よりも短い時間分の報知音特徴量を切り出し、比較報知音特徴量とし、
照合報知音特徴量ごとに、前記比較報知音特徴量に対して当該照合報知特徴量を時間方向にシフトしながら複数の暫定一致率を求め、前記暫定一致率の中かで最も高い値を当該照合報知特徴量と前記比較報知音特徴量との一致率とする
ことを特徴とする報知音感知・識別装置。 - 入力された音響信号に含まれた報知音を感知・識別する報知音感知・識別方法であって、
記憶部に、報知音IDが既知の報知音を含む音響信号の報知音特徴量である照合報知音特徴量を当該報知音IDとを対応付けた組を、あらかじめ1組以上記録しておき、
入力された音響信号のあらかじめ定めた周波数帯の中に、あらかじめ定めた条件を満たすパワーのピークとなる周波数が存在するかを確認し、存在するときは報知音を感知したことを示す感知情報を出力する報知音感知ステップと、
前記報知音感知ステップで報知音を感知した時刻を含む前記音響信号の前記ピークとなる周波数の時間パターンに基づいた報知音特徴量を出力する特徴抽出ステップと、
感知・識別の対象である音響信号の報知音特徴量である入力報知音特徴量を、前記照合報知音特徴量ごとに対比することで一致率を求め、前記一致率の中に、一致率が高いことを示す所定範囲の照合報知音特徴量があるときは、最も一致率の高い照合報知音特徴量に対応付けられた報知音IDを出力する報知音識別ステップと、
を実行する報知音感知・識別方法。 - 請求項1から5のいずれかに記載の報知音感知・識別装置としてコンピュータを機能させるための報知音感知・識別プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014232317A JP6367691B2 (ja) | 2014-11-17 | 2014-11-17 | 報知音感知・識別装置、報知音感知・識別方法、報知音感知・識別プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014232317A JP6367691B2 (ja) | 2014-11-17 | 2014-11-17 | 報知音感知・識別装置、報知音感知・識別方法、報知音感知・識別プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016095434A true JP2016095434A (ja) | 2016-05-26 |
JP6367691B2 JP6367691B2 (ja) | 2018-08-01 |
Family
ID=56071090
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014232317A Active JP6367691B2 (ja) | 2014-11-17 | 2014-11-17 | 報知音感知・識別装置、報知音感知・識別方法、報知音感知・識別プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6367691B2 (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2021002013A (ja) * | 2019-06-24 | 2021-01-07 | 日本キャステム株式会社 | 報知音検出装置および報知音検出方法 |
CN114417665A (zh) * | 2022-01-11 | 2022-04-29 | 南京安广电力设备有限公司 | 一种风机机舱设备异常声音检测方法及装置 |
US11423298B2 (en) | 2017-12-08 | 2022-08-23 | Fujitsu Limited | Computer-readable recording medium, determination method, and determination apparatus |
US11625570B2 (en) | 2017-12-08 | 2023-04-11 | Fujitsu Limited | Computer-readable recording medium, determination method, and determination apparatus for classifying time series data |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110136745A (zh) * | 2019-05-08 | 2019-08-16 | 西北工业大学 | 一种基于卷积神经网络的汽车鸣笛识别方法 |
EP4211493A1 (en) | 2020-09-11 | 2023-07-19 | Fluke Corporation | System and method for acoustic imaging with an accumulated-time view |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004053626A (ja) * | 2002-07-16 | 2004-02-19 | Nippon Telegr & Teleph Corp <Ntt> | 雑音重畳量評価方法、雑音抑制方法、雑音抑制装置、雑音重畳量評価プログラム、雑音抑制プログラム、雑音重畳量評価プログラム又は雑音抑制プログラムの何れか一方又は双方を記録した記録媒体 |
JP2005077875A (ja) * | 2003-09-02 | 2005-03-24 | Tama Tlo Kk | 警報音源認識装置及び警報音源認識方法 |
JP2007047422A (ja) * | 2005-08-09 | 2007-02-22 | Kazuhiro Fuchi | 音声分析合成装置および音声分析合成方法 |
JP2009237254A (ja) * | 2008-03-27 | 2009-10-15 | Namco Bandai Games Inc | プログラム、情報記憶媒体、及び特定音認識システム |
-
2014
- 2014-11-17 JP JP2014232317A patent/JP6367691B2/ja active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004053626A (ja) * | 2002-07-16 | 2004-02-19 | Nippon Telegr & Teleph Corp <Ntt> | 雑音重畳量評価方法、雑音抑制方法、雑音抑制装置、雑音重畳量評価プログラム、雑音抑制プログラム、雑音重畳量評価プログラム又は雑音抑制プログラムの何れか一方又は双方を記録した記録媒体 |
JP2005077875A (ja) * | 2003-09-02 | 2005-03-24 | Tama Tlo Kk | 警報音源認識装置及び警報音源認識方法 |
JP2007047422A (ja) * | 2005-08-09 | 2007-02-22 | Kazuhiro Fuchi | 音声分析合成装置および音声分析合成方法 |
JP2009237254A (ja) * | 2008-03-27 | 2009-10-15 | Namco Bandai Games Inc | プログラム、情報記憶媒体、及び特定音認識システム |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11423298B2 (en) | 2017-12-08 | 2022-08-23 | Fujitsu Limited | Computer-readable recording medium, determination method, and determination apparatus |
US11625570B2 (en) | 2017-12-08 | 2023-04-11 | Fujitsu Limited | Computer-readable recording medium, determination method, and determination apparatus for classifying time series data |
JP2021002013A (ja) * | 2019-06-24 | 2021-01-07 | 日本キャステム株式会社 | 報知音検出装置および報知音検出方法 |
JP7250329B2 (ja) | 2019-06-24 | 2023-04-03 | 日本キャステム株式会社 | 報知音検出装置および報知音検出方法 |
CN114417665A (zh) * | 2022-01-11 | 2022-04-29 | 南京安广电力设备有限公司 | 一种风机机舱设备异常声音检测方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
JP6367691B2 (ja) | 2018-08-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6367691B2 (ja) | 報知音感知・識別装置、報知音感知・識別方法、報知音感知・識別プログラム | |
US10373609B2 (en) | Voice recognition method and apparatus | |
Vafeiadis et al. | Audio content analysis for unobtrusive event detection in smart homes | |
US20230177942A1 (en) | Systems and methods for identifying an acoustic source based on observed sound | |
Droghini et al. | A Combined One‐Class SVM and Template‐Matching Approach for User‐Aided Human Fall Detection by Means of Floor Acoustic Features | |
JP6294747B2 (ja) | 報知音感知装置、報知音感知方法及びプログラム | |
EP3847642B1 (en) | Methods and apparatus to fingerprint an audio signal via normalization | |
GB2577570A (en) | Sound event detection | |
US20230060936A1 (en) | Method for identifying an audio signal | |
EP3193317A1 (en) | Activity classification from audio | |
Poorjam et al. | Dominant distortion classification for pre-processing of vowels in remote biomedical voice analysis | |
Li et al. | Learning normality is enough: a software-based mitigation against inaudible voice attacks | |
JP6758890B2 (ja) | 音声判別装置、音声判別方法、コンピュータプログラム | |
Diaconita et al. | Do you hear what i hear? using acoustic probing to detect smartphone locations | |
CN115223584B (zh) | 音频数据处理方法、装置、设备及存储介质 | |
CN108962389A (zh) | 用于风险提示的方法及系统 | |
KR20110079161A (ko) | 이동 단말기에서 화자 인증 방법 및 장치 | |
CN110875043B (zh) | 声纹识别方法、装置、移动终端及计算机可读存储介质 | |
JP7250329B2 (ja) | 報知音検出装置および報知音検出方法 | |
Gougeh et al. | Optimizing Auditory Immersion Safety on Edge Devices: An On-Device Sound Event Detection System | |
CN108520755B (zh) | 一种检测方法及装置 | |
De Lauretis et al. | EarSaver: A Device to Detect Dangerous Audio Noises. | |
CN114283845A (zh) | 用于音频识别的模型建构方法 | |
Qadri et al. | Comparative Analysis of Gender Identification using Speech Analysis and Higher Order Statistics | |
US11881200B2 (en) | Mask generation device, mask generation method, and recording medium |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20161209 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20171127 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20171219 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180123 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20180703 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180705 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6367691 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |