JP2012048173A - 悲鳴検知装置 - Google Patents

悲鳴検知装置 Download PDF

Info

Publication number
JP2012048173A
JP2012048173A JP2010192964A JP2010192964A JP2012048173A JP 2012048173 A JP2012048173 A JP 2012048173A JP 2010192964 A JP2010192964 A JP 2010192964A JP 2010192964 A JP2010192964 A JP 2010192964A JP 2012048173 A JP2012048173 A JP 2012048173A
Authority
JP
Japan
Prior art keywords
scream
vowel
unit
detection device
determination
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2010192964A
Other languages
English (en)
Other versions
JP5619529B2 (ja
Inventor
Kazuyoshi Fukushi
和義 福士
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Secom Co Ltd
Original Assignee
Secom Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Secom Co Ltd filed Critical Secom Co Ltd
Priority to JP2010192964A priority Critical patent/JP5619529B2/ja
Publication of JP2012048173A publication Critical patent/JP2012048173A/ja
Application granted granted Critical
Publication of JP5619529B2 publication Critical patent/JP5619529B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

【課題】様々な環境音や会話音声を含む監視空間において、悲鳴の検知精度を向上させた悲鳴検知装置を提供する。
【解決手段】悲鳴の語尾が母音を所定時間継続した音声であるという特質を利用し、悲鳴検知装置2は、監視空間にて音響を集音するマイク部20と、マイク部が集音した音響から音声の母音部分を抽出する母音抽出部220と、抽出した母音部分が、所定の悲鳴音量以上であり、且つ所定時間以上継続していると悲鳴であると判定する悲鳴判定部221と、悲鳴判定部が悲鳴と判定すると異常信号を出力する異常出力部222と、を有する。
【選択図】 図2

Description

本発明は、事務所や店舗に強盗が押し入った際に、事務所等で発せられる音声を分析し、異常状態を判定する装置に関し、特に、音声の中から悲鳴を検出する悲鳴検知装置に関する。
従来、強盗が押し入ったことを、入力される音声を分析して悲鳴を検知する悲鳴検知装置が提案されている(特許文献1)。
特許文献1には、通常の音声に基く周波数幅と、悲鳴に基く高音域の周波数幅を分析し、通常音声に基く周波数幅の音量が低下するとともに、悲鳴音声に基く周波数幅の音量が増加すると異常事態とするものである。
特開平9−251583号公報
しかし、悲鳴においては、必ずしも高音域の周波数と、低音域の周波数の音量がこのような振る舞いをするわけではない。例えば、男声の悲鳴は低音域においても大きな音量が継続し得るために悲鳴として検知されないおそれがある。また例えば、低音域から高音域に推移するサイレン等の人工音は悲鳴として誤検知されるおそれがある。
ところで、悲鳴は、人間がとっさに発する音声なので、人間が最も自然に発する声となる。即ち、とっさの際の口の形状から発せられる声であり、その内容を特定するのは困難である。他方、悲鳴を発する状況は、強盗に襲われたときや恐ろしいものを見たときなどで、「わあー」「きやあー」「あわわあー」のように語尾の母音部分が長音化することが多い。また、母音の中でも悲鳴の語尾に発せられるのは特に「あ」「え」「お」が多いことを、発明者が知覚した。
そこで、本発明は、悲鳴の語尾が母音を所定時間継続した音声であるという特質を利用して、様々な環境音や会話音声を含む監視空間において、悲鳴の検知精度を向上させた悲鳴検知装置を実現することを目的とする。
かかる課題を解決するために本発明は、監視空間にて音響を集音するマイク部と、マイク部が集音した音響から音声の母音部分を抽出する母音抽出部と、抽出した母音部分が、所定の悲鳴音量以上であり、且つ所定時間以上継続していると悲鳴であると判定する悲鳴判定部と、悲鳴判定部が悲鳴と判定すると異常信号を出力する異常出力部と、を有することを特徴とした悲鳴検知装置を提供する。
また、かかる悲鳴検知装置において、母音抽出部は、「あ」に相当する音響を抽出することが好ましい。
また、かかる悲鳴検知装置において、母音抽出部は、「え」に相当する音響を抽出することが好ましい。
また、かかる悲鳴検知装置において、母音抽出部は、「お」に相当する音響を抽出することが好ましい。
また、かかる悲鳴検知装置において、悲鳴判定部は、母音部分の基本周波数又は音量を解析して揺らぎの有無を判定し、揺らぎが無いときは悲鳴と判定しないことが好ましい。
また、かかる悲鳴検知装置において、母音抽出部は、さらに母音部分の母音種別を判別し、悲鳴判定部は、母音種別が同一の母音部分が所定時間以上継続していると悲鳴であると判定することが好ましい。
また、かかる悲鳴検知装置において、悲鳴判定部は、さらに集音した音響から当該音響がクリッピングし得る音量を有する音量過大部分を検出し、母音部分と連続する音量過大部分を当該母音部分の一部とみなして判定を行なうことが好ましい。
かかる構成によれば、様々な環境音や会話音声を含む監視空間の音響から、母音部分が所定以上継続し、母音部分の音量が大きいことを検出すると悲鳴を検知できる。つまり、悲鳴を定義する言葉情報や悲鳴が呈する複数種類の周波数の相関的なレベル変動の観察をすることなく、精度よく悲鳴を検知することができる。
本発明に係る悲鳴検知装置を含んだ監視装置を説明する図である。 悲鳴検知装置の構成を説明する図である。 悲鳴検知装置の悲鳴検知処理を説明するフローチャートである。
以下、本発明に係る悲鳴検知装置を含んだ監視装置の一例について図を参照しつつ説明する。
この監視装置は、金品等の重要物が保管された金庫(保管庫)が設置された事務所内或いは店舗内の一室を監視空間とし、監視空間にて集音した音響信号を処理して、押込み強盗の発生時に賊に脅された従業員が発する悲鳴を検知して、警備センターへ異常信号を送信する。
[監視装置1の構成]
図1に監視装置1の全体構成を示す。監視装置1は、悲鳴検知装置2、警備センター装置5、警報装置6等がコントローラ3に接続されて構成される。
悲鳴検知装置2は、金庫10が設置された部屋内に設置され、金庫10の周辺にて賊に脅された従業員等が発する悲鳴を検知する。悲鳴検知装置2は、同室或いは別室に設置されたコントローラ3と接続され、悲鳴を検知するとコントローラ3へ異常信号を出力する。
コントローラ3は、電話回線又はインターネット回線等の広域網4を介して警備センター装置5と接続され、悲鳴検知装置2から異常信号が入力されると、当該異常信号を遠隔地の警備センター内に設置された警備センター装置5へ伝送する。また、コントローラ3には同室又は/及び別室に設置されたパトランプ又はブザー等の警報装置6も接続され、悲鳴検知装置2から異常信号が入力されると、当該警報装置6を動作させて従業員等への報知及び賊への威嚇を行なう。
尚、コントローラ3には、さらに監視カメラ7、録画装置8等が接続されてもよく、これらの機器により悲鳴を検知した時間帯における金庫10の周辺の映像を撮像し、記録することもできる。
以下、図2を参照して悲鳴検知装置2の構成を説明する。
悲鳴検知装置2は、マイク部20、記憶部21及び通信部23が信号処理部22に接続されてなる。
マイク部20は、監視空間にて発生した音をデジタル信号(音響信号)に変換する電気回路であり、信号処理部22に接続される。マイク部20は、マイクロフォン、増幅器及びA/D変換器などにより構成される。すなわち、マイク部20は、金庫10の周辺にて発生した音をマイクロフォンにより集音してアナログ電気信号に変換し、該信号を増幅器により増幅し、増幅された信号をA/D変換器によりデジタルの音響信号に変換して信号処理部22に出力する。
尚、増幅器は、金庫10が設置された部屋内で悲鳴が発せられたときに出力される音響信号の音量が70〜100dBの範囲内に納まる程度の増幅率に予め設定される。
記憶部21は、ROM(Read Only Memory)、RAM(Random Access Memory)等のメモリ装置であり、各種プログラムや各種データを記憶し、信号処理部22との間でこれらの情報を入出力する。各種データには音響信号、母音特徴量211が含まれる。
記憶部21には音響信号を循環記憶する記憶領域として音響信号格納部210が設けられる。悲鳴検知装置2の信号処理部22は、音響信号格納部210にマイク部20からの音響信号のうち最新の音響信号を予め設定された長さ(例えば10秒間)だけ時系列に循環記憶する。
母音特徴量211は予め作成された母音の特徴量のデータであり、後述する母音抽出部220において音響信号から母音を抽出するために参照される。母音特徴量211は母音の種類ごとに各母音の種類を表す識別子と対応付けて記憶されている。
母音特徴量211の元データは、多数の話者から採取した悲鳴の語尾のサンプル音響信号である。事前に、これらのサンプル音響信号のそれぞれから悲鳴の語尾の周波数特徴量を表すスペクトル包絡のパラメータを抽出し、母音の種類ごとに当該パラメータの分布を学習しておく。本例では、スペクトル包絡を表すパラメータとして8次のLPCケプストラム(LPC:Linear Predictive Coding)、分布としてGMM(Gaussian Mixture Model;混合正規分布)を用いる。また、悲鳴の語尾の母音として「あ」「え」「お」の3種類を用いる。
すなわち、母音特徴量211として、「あ」のLPCケプストラムのGMM、「え」のLPCケプストラムのGMM、「お」のLPCケプストラムのGMMのそれぞれが記憶部21に記憶されている。悲鳴の語尾の周波数特徴量は母音種別が同一であってもそのバリエーションが比較的多いため、このようなバリエーションを的確に表すことのできるGMMは悲鳴の検知に適している。尚、各母音種別の母音特徴量211において、さらに男声のGMMと女声のGMMを別々に学習しておくこともできる。
信号処理部22は、CPU(Central Processing Unit)、DSP(Digital Signal Processor)、MCU(Micro Control Unit)等の演算装置と当該演算装置上で動作するプログラムにより構成される。信号処理部22は、母音抽出部220、悲鳴判定部221及び異常出力部222等を含んでなる。演算装置がプログラムに従い動作することで信号処理部22、母音抽出部220、悲鳴判定部221及び異常出力部222等の各部として動作する。
母音抽出部220はマイク部20が集音した音響信号(入力音響信号)から音声の母音部分を抽出して、抽出結果を悲鳴判定部221に出力する。すなわち母音抽出部220は、入力音響信号の周波数特徴量をフレームごとに算出して各周波数特徴量を母音特徴量211と比較し、各フレームが母音の周波数特徴量を有するか否かを判定して判定結果を悲鳴判定部221に出力する。
好ましくは、母音抽出部220は、母音の周波数特徴量を有するフレームが判定されたときに当該フレームの母音種別(「あ」、「え」又は「お」)の情報をも悲鳴判定部221に出力する。
母音抽出部220が抽出する母音「あ」、「え」又は「お」は、悲鳴の語尾として典型的に発声される母音である。「あ」を語尾とする典型例な悲鳴の例としては「きゃー」「ぎゃー」「わー」「うわー」「あわわー」を挙げることができ、「え」を語尾とする典型例な悲鳴の例としては「助けてー」「止めてー」「助けてくれー」「止めてくれー」を挙げることができ、「お」を語尾とする典型例な悲鳴の例としては「止めろー」を挙げることができる。
母音抽出部220が算出する周波数特徴量は母音特徴量211と同種であり、本例では8次のLPCケプストラムである。フレーム長及びフレーム周期には音声分析に適した値が予め設定される。本例では、フレーム長を20ms、フレーム周期を10msとする。
具体的には母音抽出部220は、入力音響信号の各フレームの周波数特徴量と各母音の母音特徴量211との距離を算出して予め設定された母音判定しきい値と比較し、フレームの周波数特徴量といずれかの母音特徴量211の距離が母音判定しきい値以下であれば、当該フレームは母音であり当該母音特徴量211と対応する母音種別であると判定する。一方、母音抽出部220は、距離が母音判定しきい値以下の母音特徴量211がひとつもないフレームは母音ではないと判定する。
母音特徴量211がGMMで記憶されている本例において、各母音特徴量211とフレームの周波数特徴量の距離Dは、数式1で算出される。
但し、Kは距離算出対象の母音特徴量211を構成している正規分布の数、kはそのインデックス番号(k=1,…,K)を表しており、nは周波数特徴量の次数、iはそのインデックス番号(i=1,…,n)を表している。また、xは入力音響信号の周波数特徴量を表すベクトルのi番目要素、mk,iはk番目の正規分布の平均を表す平均ベクトルのi番目要素、σ k,iはk番目の正規分布におけるベクトルi番目要素の分散、wはk番目の正規分布の重み係数、をそれぞれ表している。
悲鳴判定部221は、母音抽出部220により抽出された母音部分が、予め設定された悲鳴音量しきい値以上の音量を有し、且つ予め設定された悲鳴判定時間以上継続していると母音部分が悲鳴の語尾であると判定し、悲鳴検知の旨を異常出力部222に出力する。
そのために悲鳴判定部221は、各フレームに対する母音抽出部220の抽出結果を参照するとともに各フレームの音量(パワー)を算出して悲鳴音量しきい値と比較し、母音が抽出され且つ音量が悲鳴音量しきい値以上であるフレームの連続出現数をカウントして連続出現数が悲鳴判定時間以上に達したときに悲鳴を検知する。
悲鳴音量しきい値及び悲鳴判定時間には悲鳴の語尾の検知に適した値が予め設定される。本例では、悲鳴音量しきい値を70dB、悲鳴判定時間を200msとする。因みにフレーム周期が10msと設定される本例においてフレーム数に換算された悲鳴判定時間は20フレームとなる。
上述したように悲鳴音声全体の発声内容は様々だが、悲鳴の語尾に注目することで抽出すべき発声内容を高々3種類に減少させることができる。これにより発声内容が想定外の悲鳴を検知し損ねる不具合が著しく減少する。
また母音部分を有することにより咳、くしゃみ、クラクション、扉を閉める音、きしみ音、缶等の落下音など、音量が大きく継続時間長の長い悲鳴以外の音を悲鳴と誤検知する不具合を減少させることができる。
また母音部分の音量の条件により通常音量の会話音声を悲鳴と誤検知する不具合を減少させることができる。
また母音部分の継続時間長の条件により笑い声のような大声の母音を悲鳴と誤検知する不具合を減少させることができる。
ここで大声での会話音声の語中において母音が連続する区間が含まれると、悲鳴と誤検知する可能性がある。そこで悲鳴判定部221は、母音抽出部220が抽出した母音種別を参照して同一母音が継続している区間のそれぞれを上記母音部分(判定区間)として悲鳴か否かを判定する。つまり母音種別が異なる区間は互いに異なる母音部分として悲鳴か否かが判定される。
これにより、例えば大声会話音声の語中に「あ」と「お」が連続する「あお」という区間が含まれ、「あお」の区間の長さが悲鳴判定時間に達していたとしても、「あ」の区間と「お」の区間が別々の判定区間となるので、この大声会話音声を悲鳴と誤検知する不具合を減少させることができる。
また想定外の大きな悲鳴が入力された場合、悲鳴部分の一部の音響信号が飽和(いわゆるクリッピング)して周波数特徴量が正しく分析できなくなり、母音部分であるにも拘わらず母音が抽出されない不具合が生じ得る。
そこで悲鳴判定部221は、音響信号の音量を予め設定された過大音量しきい値と比較して音量が過大音量しきい値を超えている音量過大部分を検出し、上記母音部分と連続している音量過大部分を母音抽出部220の抽出結果に依らず母音部分の一部として悲鳴か否かを判定する。過大音量しきい値は、悲鳴音量しきい値よりも高くクリッピング発生のおそれがある音量値に設定され、例えば100dBと設定する。
これにより悲鳴区間内に断続的なクリッピングが生じていても、クリッピングが原因で悲鳴を検知し損ねる不具合を防ぐことができる。
尚、クリッピングの原因がマイクへの悪戯など悲鳴以外である場合もあるため、悲鳴判定部221は、音量過大部分の継続時間長が予め設定された音割れ異常判定時間を超える場合は音割れ異常の旨を異常出力部222に出力する。
音割れ異常判定時間は、悲鳴判定時間より短い時間長が設定される。例えば、悲鳴判定時間が200msに設定される本例において、音割れ異常判定時間を100msに設定することができる。
また多様な雑音の中には偶然的に母音と類似した周波数特徴を有する人工音が存在する可能性がある。そこで悲鳴判定部221は、人工音を肉声である悲鳴と区別するために、さらに母音部分の基本周波数(ピッチ)又は音量を解析して揺らぎの有無を判定し、揺らぎが有るときに悲鳴と判定し、揺らぎが無いときは悲鳴と判定しない。
具体的には悲鳴判定部221は、音響信号の基本周波数をフレームごとに算出し、母音部分の基本周波数の分散値を算出して予め設定された揺らぎ判定しきい値と比較し、分散値が揺らぎしきい値以上であれば揺らぎあり、そうでなければ揺らぎなしを判定する。
異常出力部222は、悲鳴判定部221が悲鳴と判定すると、悲鳴検知の旨を表す異常信号を生成して通信部23に出力する。また異常出力部222は、悲鳴判定部221が音割れ異常を判定すると、音割れ異常発生の旨を表す異常信号を生成して通信部23に出力する。
通信部23は、コントローラ3との通信を行なう電気回路であり、コントローラ3と所定の通信線にて接続され、異常出力部222から異常信号が入力されると当該信号をコントローラ3に伝送する。
[監視装置1の動作]
以下、悲鳴検知装置2の動作を中心に監視装置1の動作を説明する。
電源が投入されると、各部が初期化されて動作を始める。以降、悲鳴検知装置2においては、マイク部20が金庫10の周辺の音を音響信号に変換して信号処理部22に出力し、信号処理部22がマイク部20からの音響信号を音響信号格納部210に循環記憶させる、という動作が、悲鳴検知処理とは独立して随時繰り返される。
また初期化において信号処理部22は後述する悲鳴カウンタの値及び音割れカウンタの値をそれぞれ0に初期化する。
以下、図3のフローチャートを参照して、悲鳴検知装置2にて行なわれる悲鳴検知処理を説明する。
まず、信号処理部22はフレーム周期が到来したか否かを確認する(S1)。すなわち信号処理部22は音響信号格納部210にフレーム周期の長さの音響信号が新たに追加記憶されたか否かを確認する。フレーム周期が到来していなければ、信号処理部22は到来まで待機する(S1にてNO→S1)。
フレーム周期が到来すると(S1にてYES)、信号処理部22は、音響信号格納部210から最新の音響信号を予め設定されたフレーム長だけのフレームデータを読み出して、ハミング窓関数による窓掛け処理を行い、窓掛けしたフレームデータを悲鳴判定部221に入力する(S2)。
フレームデータを入力された悲鳴判定部221は、当該フレームデータの音量(パワー)を算出し(S3)、算出された音量を悲鳴音量しきい値と比較する(S4)。音量が悲鳴音量しきい値を超えていなければ(S4にてNO)、悲鳴判定部221は悲鳴なしと判定し、信号処理部22は悲鳴カウンタの値及び音割れカウンタをリセットして(S20)、処理をステップS1に戻す。
一方、音量が悲鳴音量しきい値を超えていれば(S4にてYES)、悲鳴判定部221は、悲鳴が発生している可能性があるとして処理をステップS5へ進める。
まず、悲鳴判定部221は、揺らぎ判定に備えてフレームデータから基本周波数を算出し(S5)、算出した基本周波数を記憶部21に記憶させる。
次に、悲鳴判定部221は、ステップS3にて算出した音量を過大音量しきい値と比較する(S6)。
音量が過大音量しきい値以上であれば(S6にてYES)、クリッピングによりフレームデータに対する母音判定を誤る可能性があるため母音判定は省略される。悲鳴判定部221は、音割れカウンタを1だけ増加させて(S14)、増加させた音割れカウンタを音割れ異常判定時間と比較する(S15)。
音割れカウンタが音割れ異常判定時間を超えていた場合(S15にてYES)、現在起きている事象に対して正しい判定を継続するのは不可能であるとして、悲鳴判定部221は音割れ異常発生の旨を異常出力部222に出力する(S19)。この出力を受けた異常出力部222は音響信号格納部210に記憶されている10秒間の音響信号を含めた音割れ異常信号を生成して通信部23に出力する。音割れ異常信号はコントローラ3及び広域網4を経由して通信部23から警備センター装置5に伝送される。
音量が過大音量しきい値未満であれば(S6にてNO)、フレームデータに対する正常な母音判定が可能であるので、悲鳴判定部221はフレームデータを母音抽出部220に入力して母音判定を行なわせる。
フレームデータを入力された母音抽出部220は、当該フレームデータの周波数特徴量を算出する(S7)。
続いて母音抽出部220は、記憶部21から「あ」の母音特徴量211、「え」の母音特徴量211及び「お」の母音特徴量211を順次読み出し、読み出した各母音特徴量211とフレームデータの周波数特徴量を比較してフレームデータが母音であるか否かを判定する(S8)。また母音抽出部220は、フレームデータが母音と判定された場合、その母音種別を特定する。
フレームデータが母音でないと判定された場合(S9にてNO)、母音抽出部220は母音が抽出されなかった旨を悲鳴判定部221に出力し、この出力を受けた悲鳴判定部221は悲鳴なしと判定し、信号処理部22は悲鳴カウンタの値及び音割れカウンタをリセットして(S20)、処理をステップS1に戻す。
一方、フレームデータが母音であると判定されると(S9にてYES)、母音抽出部220は、特定された母音種別が前回特定された母音種別と同一か否かを確認するとともに今回特定された母音種別を記憶部21に記憶させる(S10)。次回の確認では記憶部21に記憶される今回の母音種別が前回の母音種別として参照される。
今回特定された母音種別が前回特定された母音種別と同一ならば(S10にてYES)、母音抽出部220は同母音が継続抽出された旨を悲鳴判定部221に出力する。この出力を受けた悲鳴判定部221は悲鳴カウンタを1だけ増加させる(S11)。
他方、今回特定された母音種別が前回特定された母音種別と同一でなければ(S10にてNO)、母音抽出部220は新たな母音が抽出された旨を悲鳴判定部221に出力する。この出力を受けた悲鳴判定部221は悲鳴カウンタに1を設定するとともに(S12)、音割れカウンタを0に設定する(S13)。
こうしてステップS11又はステップS12にて悲鳴カウンタの値が更新されると、悲鳴判定部221は、悲鳴カウンタを悲鳴判定時間と比較する(S16)。悲鳴カウンタが悲鳴判定時間を超えていない場合(S16にてNO)、悲鳴判定部221は判定継続中であるとし、信号処理部22は以降の音響信号を処理するために、処理をステップS1に戻す。
一方、悲鳴カウンタが悲鳴判定時間を超えていれば(S16にてYES)、悲鳴判定部221は揺らぎ判定を行なう(S17)。すなわち、悲鳴判定部221は、ステップS5にて時系列に蓄積してきた基本周波数の値を記憶部21から読み出し、読み出した値の分散値を算出して揺らぎしきい値と比較し、分散値が揺らぎしきい値以上であれば揺らぎあり、そうでなければ揺らぎなしを判定する。
揺らぎありが判定されると(S18にてYES)、悲鳴判定部221は、悲鳴が発生していると判定し、悲鳴検知の旨を異常出力部222に出力する(S19)。この出力を受けた異常出力部222は音響信号格納部210に記憶されている10秒間の音響信号を含めた異常信号を生成して通信部23に出力する。異常信号はコントローラ3及び広域網4を経由して通信部23から警備センター装置5に伝送される。またコントローラ3は警報装置6を動作させる。
こうして異常信号が出力されると、信号処理部22は、引き続き悲鳴検知を行うために悲鳴カウンタ及び音割れカウンタを0にリセットして(S20)、処理をステップS1に戻す。尚、信号処理部22は、カウンタのリセットに伴い、蓄積していた基本周波数の値や前回特定された母音種別のデータもクリアする。
一方、揺らぎなしが判定されると(S18にてNO)、信号処理部22は、引き続き悲鳴検知を行うために悲鳴カウンタ及び音割れカウンタを0にリセットして(S20)、処理をステップS1に戻す。
<変形例>
上記実施形態において母音特徴量211は各母音の分布を表すGMMの形態で記憶された。別の実施形態において母音特徴量211は各母音の平均的な特徴ベクトル又は代表的な特徴ベクトルの形態で記憶してもよい。この場合、母音抽出部220はこれらの特徴ベクトルと入力音響信号の周波数特徴量との距離を算出して母音を抽出する。
また上記実施形態において周波数特徴量としてLPCケプストラムを例示した。周波数特徴量はこれに限らず、MFCC(Mel−Frequency Cepstral Coefficients)など音声分析で知られている様々なスペクトルパラメータを利用することができる。
上記実施形態において悲鳴判定部221は基本周波数の分散値によって揺らぎ判定を行なった。別の実施形態において悲鳴判定部221は基本周波数の変動幅によって揺らぎ判定を行うこともできる。すなわち悲鳴判定部221は、ステップS5にて時系列に蓄積してきた基本周波数から最大値と最小値を抽出してその差を変動幅として算出し、算出された変動幅が変動幅に対して予め設定された揺らぎ判定しきい値を超えていれば揺らぎあり、そうでなければ揺らぎなしと判定する。
さらに別の実施形態において悲鳴判定部221は基本周波数の代わりに音量を用いて揺らぎ判定を行なうこともできる。すなわち悲鳴判定部221は、ステップS4にて悲鳴音量を超えていると判定されたときにステップS3にて算出された音量を時系列に蓄積し、これらの分散又は変動幅を算出して、算出された分散又は変動幅がこれらに対して予め設定された揺らぎ判定しきい値を超えていれば揺らぎあり、そうでなければ揺らぎなしと判定する。このように音量を揺らぎ判定に用いる場合はステップS5を省略することができ、処理量を軽減できる利点がある。
また上記実施形態において母音抽出部220は予め記憶された母音特徴量211との比較により母音部分を抽出した。別の実施形態において母音抽出部220は、予め記憶された母音特徴量211を用いずに、入力音響信号における周波数特徴量の継続性と揺らぎの有無から母音部分を抽出する。すなわち母音抽出部220は入力音響信号において前後するフレーム間で周波数特徴量を比較して互いに類似しているか否かを判定するとともに入力音響信号の各フレームの基本周波数を抽出し、予め設定された母音継続時間以上(例えば100ms以上)連続して類似が判定された連続区間における基本周波数の揺らぎを判定し、揺らぎがあると判定された連続区間を母音部分として抽出する。このとき基本周波数が抽出されないフレームが含まれる区間は母音部分として抽出しない或いはそもそも連続区間として抽出しないのが好ましい。他方、母音抽出部220は、同一周波数特徴量が連続していない区間、基本周波数が抽出されない区間、又は揺らぎが判定されない区間を母音部分として抽出しない。つまり同一周波数特徴量が継続していることと基本周波数が有ることから子音を排除し、基本周波数の揺らぎが有ることから雑音を排除して母音部分を抽出するのである。尚、この場合、悲鳴判定部221による揺らぎ判定は省略しても良い。悲鳴の語尾の中には稀に2kHz近い基本周波数を有するものもあるが、周波数特徴量の継続性と揺らぎの有無から母音部分を抽出することでこのように稀な特性を有する悲鳴であっても検知できる。
1・・・監視装置
2・・・悲鳴検知装置
20・・・マイク部
21・・・記憶部
210・・・音響信号格納部
211・・・母音特徴量
22・・・信号処理部
220・・・母音抽出部
221・・・悲鳴判定部
222・・・異常出力部
23・・・通信部
3・・・コントローラ
4・・・広域網
5・・・警備センター装置
6・・・警報装置
7・・・監視カメラ
8・・・録画装置
10・・・金庫

Claims (7)

  1. 監視空間にて音響を集音するマイク部と、
    前記マイク部が集音した音響から音声の母音部分を抽出する母音抽出部と、
    前記母音部分が、所定の悲鳴音量以上であり、且つ所定時間以上継続していると悲鳴であると判定する悲鳴判定部と、
    前記悲鳴判定部が悲鳴と判定すると異常信号を出力する異常出力部と、
    を有することを特徴とした悲鳴検知装置。
  2. 前記母音抽出部は、「あ」に相当する音響を抽出する請求項1に記載の悲鳴検知装置。
  3. 前記母音抽出部は、「え」に相当する音響を抽出する請求項1または請求項2の何れか1項に記載の悲鳴検知装置。
  4. 前記母音抽出部は、「お」に相当する音響を抽出する請求項1〜請求項3の何れか1項に記載の悲鳴検知装置。
  5. 前記悲鳴判定部は、前記母音部分の基本周波数又は音量を解析して揺らぎの有無を判定し、前記揺らぎが無いときは悲鳴と判定しない請求項1〜請求項4の何れか1項に記載の悲鳴検知装置。
  6. 前記母音抽出部は、さらに前記母音部分の母音種別を判別し、
    前記悲鳴判定部は、前記母音種別が同一の前記母音部分が前記所定時間以上継続していると悲鳴であると判定する請求項1〜請求項5の何れか1項に記載の悲鳴検知装置。
  7. 前記悲鳴判定部は、さらに前記集音した音響から当該音響がクリッピングし得る音量を有する音量過大部分を検出し、前記母音部分と連続する前記音量過大部分を当該母音部分の一部とみなして前記判定を行なう請求項1〜請求項6の何れか1項に記載の悲鳴検知装置。

JP2010192964A 2010-08-30 2010-08-30 悲鳴検知装置 Expired - Fee Related JP5619529B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010192964A JP5619529B2 (ja) 2010-08-30 2010-08-30 悲鳴検知装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010192964A JP5619529B2 (ja) 2010-08-30 2010-08-30 悲鳴検知装置

Publications (2)

Publication Number Publication Date
JP2012048173A true JP2012048173A (ja) 2012-03-08
JP5619529B2 JP5619529B2 (ja) 2014-11-05

Family

ID=45903074

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010192964A Expired - Fee Related JP5619529B2 (ja) 2010-08-30 2010-08-30 悲鳴検知装置

Country Status (1)

Country Link
JP (1) JP5619529B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101578108B1 (ko) * 2014-09-01 2015-12-16 상명대학교서울산학협력단 오디오 데이터 기반의 감시 시스템을 위한 비명 검출 장치 및 그 방법

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10034099B2 (en) 2015-07-16 2018-07-24 International Business Machines Corporation Vowel and consonant discriminating microphones using carbon nanotubes
JP6758890B2 (ja) 2016-04-07 2020-09-23 キヤノン株式会社 音声判別装置、音声判別方法、コンピュータプログラム

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS55161764A (en) * 1979-05-31 1980-12-16 Mitsubishi Electric Corp Crime prevention device for elevator
JPH0627986A (ja) * 1992-07-13 1994-02-04 Toshiba Corp 音声認識装置利用の機器制御システム
JP2005346254A (ja) * 2004-06-01 2005-12-15 Hitachi Ltd 危機監視システム
JP2007114631A (ja) * 2005-10-24 2007-05-10 Takuya Shinkawa 情報処理装置、情報処理方法、およびプログラム
JP2008049462A (ja) * 2006-08-28 2008-03-06 National Institute Of Advanced Industrial & Technology 叫び声を用いたロボットの緊急停止方法及びシステム
JP2010183417A (ja) * 2009-02-06 2010-08-19 Hitachi Ltd 音声情報表示システム、音声情報表示方法、及び音声情報表示装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS55161764A (en) * 1979-05-31 1980-12-16 Mitsubishi Electric Corp Crime prevention device for elevator
JPH0627986A (ja) * 1992-07-13 1994-02-04 Toshiba Corp 音声認識装置利用の機器制御システム
JP2005346254A (ja) * 2004-06-01 2005-12-15 Hitachi Ltd 危機監視システム
JP2007114631A (ja) * 2005-10-24 2007-05-10 Takuya Shinkawa 情報処理装置、情報処理方法、およびプログラム
JP2008049462A (ja) * 2006-08-28 2008-03-06 National Institute Of Advanced Industrial & Technology 叫び声を用いたロボットの緊急停止方法及びシステム
JP2010183417A (ja) * 2009-02-06 2010-08-19 Hitachi Ltd 音声情報表示システム、音声情報表示方法、及び音声情報表示装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101578108B1 (ko) * 2014-09-01 2015-12-16 상명대학교서울산학협력단 오디오 데이터 기반의 감시 시스템을 위한 비명 검출 장치 및 그 방법

Also Published As

Publication number Publication date
JP5619529B2 (ja) 2014-11-05

Similar Documents

Publication Publication Date Title
JP2012048689A (ja) 異常検知装置
Marchi et al. A novel approach for automatic acoustic novelty detection using a denoising autoencoder with bidirectional LSTM neural networks
US8918343B2 (en) Sound identification systems
Ntalampiras et al. An adaptive framework for acoustic monitoring of potential hazards
Huang et al. Scream detection for home applications
CN105679310A (zh) 一种用于语音识别方法及系统
JPH06332492A (ja) 音声検出方法および検出装置
US7359856B2 (en) Speech detection system in an audio signal in noisy surrounding
Droghini et al. A Combined One‐Class SVM and Template‐Matching Approach for User‐Aided Human Fall Detection by Means of Floor Acoustic Features
CN111784971B (zh) 报警处理方法和系统、计算机可读存储介质和电子设备
JP5619529B2 (ja) 悲鳴検知装置
Kim et al. Hierarchical approach for abnormal acoustic event classification in an elevator
JP5627962B2 (ja) 異常検知装置
CN112447170A (zh) 一种基于声音信息的安防方法、装置及电子设备
KR101736466B1 (ko) 음향 정보 기반 상황 인식 장치 및 방법
JP2014145932A (ja) 話者認識装置、話者認識方法及び話者認識プログラム
KR101741418B1 (ko) 연속된 충격음에 대한 음향 특징 추출 및 확률 모델에 기반한 음향 인식 방법
CN114550395B (zh) 声音报警检测方法及设备
Sadjadi et al. Robust front-end processing for speaker identification over extremely degraded communication channels
EP2864969A1 (en) Method of classifying glass break sounds in an audio signal
JP2797861B2 (ja) 音声検出方法および音声検出装置
US20180108345A1 (en) Device and method for audio frame processing
US20230366729A1 (en) Trained autoencoder, trained autoencoder generation method, non-stationary vibration detection method, non-stationary vibration detection device, and computer program
Mesbahi et al. Shout analysis and characterisation
KR20220072579A (ko) 이상음원 감지 시스템 및 방법

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130805

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140605

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140708

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140826

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140916

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140917

R150 Certificate of patent or registration of utility model

Ref document number: 5619529

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees