JP2014002217A - 発生音感知装置、方法、プログラム - Google Patents

発生音感知装置、方法、プログラム Download PDF

Info

Publication number
JP2014002217A
JP2014002217A JP2012136166A JP2012136166A JP2014002217A JP 2014002217 A JP2014002217 A JP 2014002217A JP 2012136166 A JP2012136166 A JP 2012136166A JP 2012136166 A JP2012136166 A JP 2012136166A JP 2014002217 A JP2014002217 A JP 2014002217A
Authority
JP
Japan
Prior art keywords
sound
frequency
unit
sensing device
high frequency
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2012136166A
Other languages
English (en)
Other versions
JP5840077B2 (ja
Inventor
Naka Omuro
仲 大室
Kenichi Noguchi
賢一 野口
Suehiro Shimauchi
末廣 島内
Yoichi Haneda
陽一 羽田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2012136166A priority Critical patent/JP5840077B2/ja
Publication of JP2014002217A publication Critical patent/JP2014002217A/ja
Application granted granted Critical
Publication of JP5840077B2 publication Critical patent/JP5840077B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)

Abstract

【課題】感知対象スペース内で発生した音と感知対象スペース以外のスペースで発生した音とを区別して、発生音を感知する発生音感知技術を提供する。
【解決手段】発生音感知装置100は、入力された音響信号の高域周波数成分の変動を検知するスペクトル変化検知部130と、スペクトル変化検知部130によって得られた検知結果が、高域周波数成分に予め定められたレベル以上の変化が生じたことを表す場合に、音が発生したと判定する判定部150とを含む。スペクトル変化検知部130は、例えば、音響信号の周波数分析を行う短時間周波数分析部131と、短時間周波数分析部131によって得られた周波数パラメータに基づき、高域周波数成分の変動を検知するスペクトル高域変動検知部132を含む。
【選択図】図2

Description

本発明は、感知対象スペース内で発生した音声や音響を感知する発生音感知技術に関し、より詳しくは、感知対象スペース内で発生した音声や音響と感知対象スペース以外のスペースで発生した音声や音響とを区別して、発生音を感知する発生音感知技術に関する。
例えば、互いに離れたところに住む親族の間で、通常は、互いのプライバシーを守りながら居住室内における人の存在情報を隔地者である相手に通知(以下、バックグラウンドコミュニケーションという)しつつ、少なくともいずれか一方における何らかの出来事(例えば、呼びかけ)を契機に、音声電話やテレビ電話などの双方向リアルタイム通信(以下、フォアグラウンドコミュニケーションという)に容易に移行できる、「コミュニケーショントリガ」と呼ばれるサービスが非特許文献1に開示されている。
「コミュニケーショントリガ」で利用される端末は、少なくとも1つ以上のマイクロフォン(以下、マイクという)を具備しており、バックグラウンドコミュニケーションでは、マイクに入力された音声音響信号(以下、単に音響信号という)を分析して、無音か、物音か、音声かを判別し、この判別結果を通信ネットワークを通して相手端末に通知する。相手端末は、チャイムや鳥の声などの音を鳴らし、あるいは画面表示によって、相手ユーザに受信した判別結果を提示する。このとき、物音の感知には、マイクに入力された音響信号のパワーが用いられる。ただし、単純に、音響信号のパワーが固定閾値よりも大きいときに物音を感知したと判定し、当該パワーが当該固定閾値よりも小さいときに無音であると判定すると、空気調節装置等の定常雑音が存在する環境では判別結果が不正確になるため、定常雑音レベルを推定し、マイクに入力された音響信号から推定定常雑音レベルを差し引いた後に、音響信号のパワーが固定閾値よりも大きいか小さいかを判定することによって、物音の感知精度を向上させている。
野口、阪内、島内、大室、羽田「コミュニケーショントリガ:音環境状態遷移に基づくシームレスコミュニケーション」画像電子学会年次大会、2011年6月
非特許文献1に開示された物音の感知方法によると、定常的な雑音が存在する環境でも、ある程度の感知精度を得ることができる。しかしながら、この方法によると、上記判定にパワーを用いるため、屋外で非定常な雑音が発生した場合(例えば、付近を車両(自動車、原動機付自転車など)が通ったり、隣家の扉の開閉音が発生した場合)に、屋内で人が動いたことによって発生した音なのか、屋外で発生した音なのかの区別をすることができない。「コミュニケーショントリガ」による物音の感知は、屋内で人の動きがあるかどうか、即ち、在宅なのか留守なのか、元気なのか病気で寝込んでいるのかなどの人の活動状況を推知させる屋内情報を、プライバシーを守りつつ相手に通知することが可能であるので、コミュニケーショントリガは隔地者の安否を通知するというサービスに利用可能であるが、屋外の音を屋内の音と誤感知して通知してしまったのでは、当該サービスの目的を達成することができない。
また、ユーザによっては、同じ屋内であっても、端末が設置してある部屋(例えばリビング)で音が発生したことは相手に通知してもよいが、端末が設置してある部屋以外の部屋(例えばトイレや寝室)で音が発生したことはプライバシーの観点から通知したくないかもしれない。非特許文献1に開示された物音の感知方法によると、パワーと固定閾値との比較判定を行うため、端末に近い場所で発生した小さな物音と、端末から遠い場所で発生した大きな物音の区別をすることができず、感知対象の部屋以外での音の発生を通知したくないというユーザの要望に応えることが難しい。
コミュニケーショントリガは、前述のサービス以外に、防犯や警備保障にも利用することができる。このような利用環境の場合、屋外で発生した音を屋内で発生したものと誤感知すると不必要なアラームが通知されることになり、他方、屋外の音に基づいて誤った通知がされないように感度を調整すると、屋内で発生した音の感知漏れが発生し防犯目的が達成されない可能性がある。
本発明は、このような状況に鑑み、感知対象スペース内で発生した音声や音響と感知対象スペース以外のスペースで発生した音声や音響とを区別して、発生音を感知する発生音感知技術を提供することを目的とする。
本発明の発生音感知技術は、入力された音響信号の高域周波数成分の変動を検知するスペクトル変化検知処理と、スペクトル変化検知処理で得られた検知結果が、高域周波数成分に、予め定められたレベル以上の変化が生じたことを表す場合に、音が発生したと判定する判定処理とを含む。
例えば、スペクトル変化検知処理は、音響信号の周波数分析を行う周波数分析処理と、周波数分析処理によって得られた周波数パラメータに基づき、高域周波数成分の変動を検知するスペクトル高域変動検知処理とを含む。さらに、周波数分析処理によって得られた、予め定められた時間の周波数パラメータの平均を求める平均化処理を含んでもよい。この場合、スペクトル高域変動検知処理は、現在時刻の周波数パラメータと、平均化処理によって得られた周波数パラメータの平均とを比較して、高域周波数成分の変動を検知する。
あるいは、スペクトル変化検知処理は、音響信号の自己相関係数を求める自己相関係数計算処理と、自己相関係数に基づいてスペクトルの傾きを計算する傾き計算処理と、予め定められた時間の傾きの平均を求める平均化処理と、現在時刻の傾きと、平均化処理によって得られた傾きの平均とを比較することによって、高域周波数成分の変動を検知する傾き変動検知処理とを含む。
あるいは、スペクトル変化検知処理は、音響信号の自己相関係数を求める自己相関係数計算処理と、予め定められた時間の自己相関係数の平均を求める平均化処理と、現在時刻の自己相関係数と、平均化処理によって得られた自己相関係数の平均とを比較することによって、高域周波数成分の変動を検知する傾き変動検知処理とを含む。
あるいは、スペクトル変化検知処理は、音響信号を高域信号と低域信号とに分ける帯域分割フィルタリング処理と、低域信号のパワーを計算する低域パワー計算処理と、高域信号のパワーを計算する高域パワー計算処理と、低域パワー計算処理によって得られた低域信号のパワーと、高域パワー計算処理によって得られた高域信号のパワーとに基づいて、スペクトルの傾きを計算する傾き計算処理と、予め定められた時間の傾きの平均を求める平均化処理と、現在時刻の傾きと、平均化処理によって得られた傾きの平均とを比較することによって、高域周波数成分の変動を検知する傾き変動検知処理とを含む。
あるいは、さらに、音響信号に人の声の母音特性が含まれるか否かを検知する母音検知処理を行い、判定処理では、母音検知処理によって得られた検知結果が、音響信号に人の声の母音特性が含まれることを表す場合に、発声があったと判定するようにしてもよい。
本発明によると、詳細は後述するが、高域周波数成分に予め定められたレベル以上の変化が生じたか否かに着目して音の発生の有無を判定するため、感知対象スペース内で発生した音声や音響と感知対象スペース以外のスペースで発生した音声や音響とを区別して発生音を感知することができる。
一般的な集合住宅の間取りの例。 実施例1の機能構成例。 高域周波数成分に予め定められたレベル以上の変化が発生したかどうかを模式的に説明する図。 室内で発生した音と室外から侵入してきた音との違いを模式的に示す図。 実施例2の機能構成例。 高域周波数成分に予め定められたレベル以上の変化が発生したかどうかを模式的に説明する図。 実施例3の機能構成例。 周波数スペクトルの傾きを説明するための例。 実施例4の機能構成例。 実施例5の機能構成例。 実施例6の機能構成例。
図面を参照しながら本発明の実施形態を説明する。各形態に共通の構成要素には同じ符号を割り当てて重複説明を省略することとする。
[実施例1]
図1は一般的な集合住宅の間取りを例示している。このような間取りは一般的に3LDKと呼ばれ、リビング・ダイニング・キッチン、洋室1、洋室2、和室、トイレ、浴室、廊下、洗面室等の部屋が壁で隔てられている。各部屋の入り口には、ドアまたは引き戸が設置されており、人の出入りができるようになっている。リビング・ダイニング・キッチンは、多くの場合、リビングのためのスペース、ダイニングテーブルを置くスペース、調理をするスペースに分かれているものの、完全には壁で隔てられておらず、空間的にはつながっていることが多い。
このような住宅環境において、或る部屋の一箇所、例えば図1に示すようにリビングスペースの一角(図中にてCで示す位置)に、発生音感知装置100が設置されているものとする。発生音感知装置100が設置される場所は、ユーザの意思によって、リビングのほか、洋室1、洋室2や和室など住宅内の任意の一部屋内でよいが、この実施形態では、リビングスペースの一角(図中にてCで示す位置)に発生音感知装置100を設置した例を用いて説明する。
図2に、本発明の一実施例である発生音感知装置100の機能構成を示す。発生音感知装置100は、A/D変換部110、スペクトル変化検知部130、判定部150を含む。マイク200に入力された音は、A/D変換部110によって例えばサンプリング周波数が8kHzのデジタル音響信号に変換される。サンプリング周波数は8kHzのほか、16kHzなど音響信号のデジタル化で一般的に用いられる周波数でよい。デジタル音響信号は、短時間周波数分析部131によって、予め決められた長さの時間毎に短時間周波数分析される。予め決められた長さの時間として、例えば10ミリ秒や20ミリ秒を用いることができる。短時間周波数分析には、帯域分割フィルタ、フィルタバンク、フーリエ変換、自己相関係数(自己相関係数は自己相関関数とも呼ばれる。)など、広く知られた方法を用いることができる。短時間周波数分析によって、予め決められた長さの時間毎の周波数パラメータの時系列が得られる。周波数パラメータの時系列は、スペクトル高域変動検知部132に送られる。スペクトル高域変動検知部132は、周波数パラメータの時系列を観測し、入力のデジタル音響信号の高域周波数成分の変動を検知する。なお、実施例1では、短時間周波数分析部131とスペクトル高域変動検知部132はスペクトル変化検知部130に含まれる。
スペクトル高域変動検知部132による検知結果は、判定部150に送られる。判定部150は、スペクトル高域変動検知部132による検知結果について、高域周波数成分に、予め定められたレベル以上の変化が生じたか否かを判定する。検知結果が、高域周波数成分に、予め定められたレベル以上の変化が生じたことを表す場合、感知対象の室内で物音が発生したという判定結果(以下、感知情報)を出力し、それ以外のときは感知対象の室内で物音が発生したとは確認できないという判定結果(以下、非感知情報)を出力するか、何も出力しない。
判定部150が出力した判定結果は、例えば、発生音感知装置100の通信部(図示せず)を介して、隔地者の端末に通知される。隔地者の端末は、発生音感知装置100からの判定結果を受信する機能を有する装置であれば特に限定はなく、双方向通信可能な構成であれば、隔地者の端末も発生音感知装置100と同じ構成を持つ装置とすることができる。
図3は、高域周波数成分に、あらかじめ定められたレベル以上の変化が発生したかどうかを模式的に表したものである。図3(a)、図3(b)、図3(c)、図3(d)、図3(e)、図3(f)は、それぞれ或る時刻におけるマイク200に入力された音の周波数パラメータの一例であるパワースペクトルを表している。通常、一般的な住宅環境の定常的な環境音、例えば空気調節装置、換気扇、パーソナルコンピュータ等のファンの音は、図3(a)に示すように、低域周波数成分が大きく、周波数が高くなるにしたがって周波数成分のパワーが低くなっているという特徴が認められる。
時刻t1において、スペクトルが図3(a)の形状であったとする。時刻t2になると、図3(b)に示すように、高域成分のパワーが時刻t1でのそれよりも大きくなり、時刻t3には、図3(c)に示すように、再び時刻t1と同様のスペクトル形状になったとする。このような場合には、判定部150は感知情報を出力する。なお、t1<t2<t3である。
図3(e)は、図3(b)とは異なり、時刻t2において、低域成分のパワーが時刻t1でのそれよりも大きくなった状態を示している。時刻t1におけるスペクトルが図3(d)に、時刻t3におけるスペクトルが図3(f)に示すとおりであるとすると、t1〜t3の時間の流れ(t1<t2<t3)において、低域周波数成分に一定の変化が生じているが、高域周波数成分にはあまり変化が生じていない。このような場合には、判定部150は非感知情報を出力するか、何も出力しない。
図3(b)も図3(e)も前後の時刻に比べてスペクトルが変化しているが、判定部150が、高域に変化があったときだけ感知情報を出力し、低域に変化があっても感知情報を出力しない理由を、図4を用いて説明する。
感知対象の室内で発生した音(以下、室内音という)、例えば、感知対象の室内で人が新聞を読んだり、食器を使ったり、コンピュータを操作することによって生じる音は、高域周波数成分が大きく減衰することなく、室内に設置されたマイク200に入力される。他方、感知対象の部屋以外のスペースで発生して感知対象の室内に入ってくる音(以下、室外音という)、例えば、車両が通過する音、隣戸の扉の開閉音などは、感知対象の部屋の窓が開いていないことを前提とすると、壁、扉、窓ガラス等を通過してマイク200に入力される。壁、扉、窓ガラス等の建材は、一般的に、室外音の室内への侵入を減らすように設計されているが、高度な防音性能を有する建材でない限り、完全に音を遮断することはできない。しかしながら、種々の室外音の多くでは、一般的な建材によって遮断されずに室内に侵入するものの、室外音の高域周波数成分が大きく減衰する。つまり、マイク200の入力音の低域周波数成分が変化した場合は、感知対象の室内の音源で発生した高域周波数成分の少ない音か、室外音源(感知対象の部屋以外のスペースに在る音源)で発生し、建材通過減衰によって高域周波数成分が少なくなった音なのか、の区別がつかない。他方、マイク200の入力音の高域周波数成分が変化した場合は、音源の音に高域周波数成分が多く含まれており、かつマイク200の入力音が室内音であると判断できる。
なお、高域周波数成分が多い音とは、例えば、事象としては、紙をめくる音、紙が擦れる音、衣服が擦れる音、硬いものをテーブルに置く音、ドアの開閉音、キーボードの打鍵音、マウスのクリック音、物が割れる音、スリッパで歩く音など、擬音語では、サー、シュッ、カツン、コトッ、カチャ、カチ、パタンといった言葉で表現される音のほか、人の声の子音、呼吸音などが含まれ、人が生活していれば、頻繁に発生する音である。他方、高域周波数成分が少ない音とは、太鼓の音、机を拳で軽く叩く音、靴下をはいた足で床を歩く音などで、擬音語では、ドンドン、ドタドタ、ゴンといった言葉で表現される音である。
本発明によると、高域周波数成分が少ない音はこれが感知対象の室内で発生しても室内音として感知されないが、コミュニケーショントリガの目的や当該目的に応じた精度の観点からすると、感知対象の室内で発生した高域周波数成分の多い音のみが感知されれば十分である。
なお、図4では、室内音と室外音をそれぞれ、屋内音と屋外音の例で説明したが、このような例に限定されない。例えば、図1において、リビング・ダイニング・キッチンと和室の間の引き戸1が開放されているときは、和室内の任意の位置は発生音感知装置100の設置位置Cに対して感知対象スペース内であるとするが、引き戸1が閉められているときは、和室内の任意の位置は発生音感知装置100の設置位置Cに対して感知対象スペース外であるとする。すなわち、感知対象スペース内か否かは、建築上の構造をいうのではなく、音響的に建材で隔てられているか隔てられていないか(つまり、音響的に閉空間か否か)をいう。つまり、引き戸1が開放されているときは、和室で発生した音が、建材で隔てられることなく発生音感知装置100の設置位置Cに届く。他方、引き戸1が閉められているときは、和室で発生した音は、引き戸1やその周囲の壁部を通過して発生音感知装置100の設置位置Cに届く。このため、同じ音が和室で発生しても、引き戸1が開放されていると、音源の音の高域周波数成分は減衰せずに発生音感知装置100の設置位置Cまで届き、引き戸1が閉められていると、音源の音の高域周波数成分は減衰して発生音感知装置100の設置位置Cまで届く。したがって、発生音感知装置100は、引き戸1が開放されているときは、リビング・ダイニング・キッチンと和室の範囲で発生した高域周波数成分の多い音を感知し、引き戸1が閉められていると、リビング・ダイニング・キッチンで発生した高域周波数成分の多い音を感知するが和室で発生した音を感知しなくなるので、プライバシーを守りたいときは引き戸1を閉めるという視覚上の効果と、人の動きに伴う音が感知されなくなるという効果が一致する。
図1において、リビング・ダイニング・キッチンとの関係で廊下が感知対象スペース内に該当するか感知対象スペース外に該当するかの区別も、ドア1が開いているか否かに応じて判断される。ドア1が開放されているときは、例えば玄関のドアの開閉音は、リビング・ダイニング・キッチンに設置した発生音感知装置100によって感知されるが、ドア1が閉められているときは、玄関のドアの開閉音は感知されない。
なお、戸を閉めても、戸と天井の間が空いているような建築構造、例えば、可動式のパーティションで視覚を遮るだけの場合は、音響的に同一空間、すなわち、本実施例では感知対象スペース内に該当する。
[実施例2]
図5を用いて、本発明の第二の実施例を示す。図6は本実施例の判定概念を示す模式図である。
本実施例の構成は、実施例1のスペクトル変化検知部130を変形した構成を有しており、詳しくは図2に示すスペクトル変化検知部130の構成に平均化部133を追加した構成である。
短時間周波数分析部131の出力である周波数パラメータの時系列は、スペクトル高域変動検知部132に送られるとともに、平均化部133に送られる。平均化部133は、過去T時間の周波数パラメータの平均を計算して、この結果をスペクトル高域変動検知部132に送る。T時間として、例えば、1秒、5秒、10秒、30秒などを用いることができる。スペクトル高域変動検知部132は、現時刻の周波数パラメータと、過去T時間の周波数パラメータの平均とを比較することによって高域周波数成分の変動を検知して、この検知結果を判定部150に通知する。これ以外の処理は実施例1と共通であるので、重複説明を省略する。
図6は、現時刻の周波数パラメータと、過去T時間の周波数パラメータの平均とを比較することによって、高域周波数成分に、あらかじめ定められたレベル以上の変化が発生したかどうかを模式的に表したものである。図6(a)は過去T時間のパワースペクトルの平均、図6(b)は時刻tにおけるパワースペクトルを表している。時刻tでは、高域成分のパワーが過去T時間の平均よりも大きくなり、このような場合には、判定部150は感知情報を出力する。一方、図6(c)は過去T時間のパワースペクトルの平均、図6(d)は時刻tにおけるパワースペクトルを表しており、この場合には、図6(d)に示されるパワースペクトルは図6(c)に示されるパワースペクトルと比べて低域周波数成分に一定の変化が生じているが、高域周波数成分にはあまり変化が生じていない。このような場合には、判定部150は非感知情報を出力するか、何も出力しない。
実施例2と実施例1との違いは、実施例1では、現在の時刻の周波数パラメータと、前後の時刻の周波数パラメータを比較して、高域周波数成分の変動を検知していたのに対して、実施例2では、現在の時刻の周波数パラメータと、過去T時間の周波数パラメータの平均とを比較して、高域周波数成分の変動を検知している点である。
感知対象スペース内の音を感知し、壁や引き戸などの建材を通過した音を感知しないという効果は実施例1と同じであるが、実施例2では、判定部150が、過去の平均的なスペクトルに対して、現時刻のスペクトルの高域周波数成分がどの程度違っているかを判別するので、実施例1よりもより安定した感知精度が得られる、即ち、感知対象スペース内の音の感知漏れが減り、感知対象スペース外で発生した音を誤感知する頻度を減らすことができる。
[実施例3]
図7を用いて、本発明の第三の実施例を示す。
実施例3の構成は、実施例2のスペクトル変化検知部130の、短時間周波数分析部131を自己相関係数計算部134aと傾き計算部134bに、スペクトル高域変動検知部132を傾き変動検知部135に置き換えた構成である。自己相関係数計算部134aは、A/D変換部110から送られたデジタル音響信号を用いて、自己相関係数を計算する。自己相関係数はスペクトルの傾きを得るために計算するものであるので、自己相関係数は1次まで計算すればよい。
第i番目の時間区間のn次の自己相関係数c(n)は、フレームの先頭時刻を基準とする相対的なサンプル番号をt、第i番目の時間区間のデジタル音響信号をs(t)とすると、例えば、式(3−1)に従って計算できる。ここで、Nは自己相関係数の最大次数、Wは分析窓長、Pはパワーである。
Figure 2014002217
パワーPは、式(3−2)に従って計算できる。
Figure 2014002217
式(3−1)においてパワーPによる正規化は省略することができ、式(3−1)の右辺の分子、または式(3−1)の右辺の分子を分析窓長Wで除したものをn次の自己相関係数としてもよい。その場合、パワーP(またはパワーPを分析窓長Wで除したもの)は0次の自己相関係数と同じである。また、自己相関係数c(n)を式(3−1)の平方根として定義してもよい。前述のように、本構成では、1次までの自己相関係数を計算すればよいので、N=1でよい。自己相関係数計算部134aは、1次の自己相関係数c(1)を傾き計算部134bに送る。
傾き計算部134bは、自己相関係数からスペクトルの傾きgを計算する。スペクトルの傾きgは、例えば、
=1−c(1) (3−3)
と定義することができる。式(3−1)でc(1)を求めると、c(1)の値の範囲は、通常、−1≦c(1)≦1であるので、gを式(3−3)で定義するとgの値の範囲は、通常、0≦g≦2となる。スペクトルの傾きgは、スペクトルの高域周波数成分が低域周波数成分に対して大きいか小さいかを表す周波数パラメータである。例えば、図8(a)、図8(b)、図8(c)のような周波数スペクトルを持つ信号のスペクトルの傾きgを、それぞれg1 、g2 、g3 とすると、0≦g1 <g2 <g3 ≦2である。
スペクトルの傾きgは、平均化部133と傾き変動検知部135に送られる。平均化部133は、過去T時間のスペクトルの傾きgの平均gAを計算して傾き変動検知部135に送る。T時間として、例えば、1秒、5秒、10秒、30秒などを用いることができる。
傾き変動検知部135は、現時刻のスペクトルの傾きgと、過去T時間のスペクトルの傾きgの平均gAを比較して、高域周波数成分の変動を検知する。この検知結果は判定部150に送られる。検知結果としては、例えば、g−gAである。
判定部150による、現時刻のスペクトルの傾きgが平均gAよりもあらかじめ定められた閾値G以上変化したか否かの判定は、例えば、検知結果g−gAがあらかじめ定められた閾値G以上であるか否か、つまり
G<g−gA (3−4)
を満たすか否かによって行われる。判定部150は、式(3−4)が成立するときに、感知情報を出力し、それ以外のときは非感知情報を出力するか、何も出力しない。
なお、式(3−4)において、不等号<を「以上」を表す不等号≦に変更してもよく、以下、等しい場合(つまり、等号=に相当する)を含まないことが明示されている場合を除いて、記号としての不等号<は不等号≦の概念を包含するものとする。また、「より大きい」「以上」の用語も同様に、等しい場合を含むか含まないかが明示されている場合を除いて、「より大きい」と「以上」、「より小さい」と「以下」は、本実施例では同義とする。
あらかじめ定められた閾値Gは、例えば0.4や0.5などの固定値(定数)を用いることができる。また、過去T時間のスペクトルの傾きgの平均gAに連動した閾値としてもよく、例えば、
G = 0.2gA (3−5)
のように、過去T時間のスペクトルの傾きgの平均gAの実数倍としてもよい。また、検知結果をg/gAとし、式(3−4)に替えてG<g/gAに従って判定してもよい。
[実施例4]
実施例4は、図9に示すように、実施例3の傾き計算部134bを省略した構成である。実施例4では、平均化部133は、自己相関係数c(1)の過去T時間の平均cAを計算する。傾き変動検知部135は、現時刻の自己相関係数c(1)と、過去T時間の平均cAを比較して、高域周波数成分の変動を検知する。この検知結果は判定部150に送られる。検知結果としては、例えば、c(1)−cAである。
判定部150による、c(1)がcAよりもあらかじめ定められた閾値C以上変化したか否かの判定は、例えば、検知結果c(1)−cAがあらかじめ定められた閾値C以下であるか否か、つまり
C>c(1)−cA (4−1)
を満たすか否かによって行われる。判定部150は、式(4−1)が成立するときに、感知情報を出力し、それ以外のときは非感知情報を出力するか、何も出力しない。なお、式(3−4)と式(4−1)とを比較すると、実施例3と実施例4では判定のための不等号が逆向きになっているが、これは、式(3−3)で示すように、gとc(1)は正負の符号が反対であることによる。また、実施例4における閾値Cは実施例3における閾値Gを用いてC=−Gとしてもよい。
[実施例5]
実施例5は、図10に示すように、実施例3のスペクトル変化検知部130を変形した例である。本実施例では、実施例3の自己相関係数の計算及び傾きの計算の代わりに、帯域分割フィルタ部136、低域パワー計算部137a、高域パワー計算部137b、傾き計算部134bを用いてスペクトルの傾きを計算する。
帯域分割フィルタ136は、A/D変換部110から送られたデジタル音響信号を、低域信号と高域信号に分割する。帯域分割フィルタ136には、世の中で広く知られた任意の手法を用いてよい。一例として、ITU-T G.722や、ITU-T G.711.1で利用されているQMF(Quadrature Mirror Filter)を用いることができる。または、デジタル音響信号を低域通過フィルタ(ローパスフィルタ)に通した信号を低域信号、高域通過フィルタ(ハイパスフィルタ)に通した信号を高域信号としてもよい。
低域信号は低域パワー計算部137aに送られる。低域パワー計算部137aは、低域信号のパワーPLを計算して傾き計算部134bに送る。高域信号は高域パワー計算部137bに送られる。高域パワー計算部137bは、高域信号のパワーPHを計算して傾き計算部134bに送る。傾き計算部134bはPLとPHを用いてスペクトルの傾きgを計算する。gの計算には、例えば
=PH/PL (4−1)
を用いることができる。本実施例で求めるgも実施例3で求めるgと同様に、スペクトルの高域周波数成分が低域周波数成分に対して大きいか小さいかを表す周波数パラメータであり、図8(a)、図8(b)、図8(c)のような周波数スペクトルを持つ信号のスペクトルの傾きgを、それぞれg1 、g2 、g3 とすると、0≦g1 <g2 <g3 である。ただし、gを自己相関係数を用いて定義する場合と異なり、gの値に理論的上限はない。
平均化部133、傾き変動検知部135は実施例3と同様であるので、説明を省略する。
[実施例6]
実施例6は、図11に示すように、実施例1から実施例5のいずれかに記載の構成に、母音検知部170を追加した構成である。図11に示すスペクトル変化検知部130は、図2、図5、図7、図9、図10のいずれかに示されるスペクトル変化検知部130である。
母音検知部170は、A/D変換部110からデジタル音響信号を受け取り、マイク200に入力された音に、人の声の母音の特性が含まれるかを判断し、判断結果を判定部150に通知する。母音特性の有無の判断には、信号のピッチ周期性を利用することができる。ピッチ周期性の有無の判断については、非特許文献1に記載されているほか、一般に広く知られているピッチ周期性の分析手法を用いることができる。
判定部150は、母音検知部170から人の声の母音の特性が含まれるという判断結果を通知されたときは、マイク200の入力音は音声であると判定する。なお、判定部150による、実施例1から実施例5のいずれかの構成に応じたスペクトル変化検知部130からの検知結果に基づいた感知情報または非感知情報を出力するための判定処理の内容は、実施例1から実施例5で説明したとおりである。判定部150は、「音声」であるという判定結果と感知情報(つまり、音声を含む上位概念としての「物音」であるという判定結果)のうち、何れかの一方のみを判定結果として出力してもよいし、両方を出力してもよい。
<発生音感知装置のハードウェア構成例>
上述の実施形態に関わる発生音感知装置は、CPU(Central Processing Unit)やDSP(Digital Sygnal Processor)〔キャッシュメモリなどを備えていてもよい。〕、メモリであるRAM(Random Access Memory)やROM(Read Only Memory)と、ハードディスクである外部記憶装置、並びにこれらのCPUやDSP、RAMやROM、外部記憶装置間のデータのやり取りが可能なように接続するバスなどを備えている。また必要に応じて、発生音感知装置に、CD−ROMなどの記憶媒体を読み書きできる装置(ドライブ)などを設けるとしてもよい。
発生音感知装置の外部記憶装置には、上述の発生音感知処理のためのプログラム並びにこのプログラムの処理において必要となるデータなどが記憶されている〔外部記憶装置に限らず、例えばプログラムを読み出し専用記憶装置であるROMに記憶させておくなどでもよい。〕。また、これらのプログラムの処理によって得られるデータなどは、RAMや外部記憶装置などに適宜に記憶される場合がある。データやその格納領域のアドレスなどを記憶する記憶装置を単に「記憶部」と呼ぶことにする。
発生音感知装置の記憶部には、入力された音響信号の高域周波数成分の変動を検知するためのプログラムと、当該検知結果が、高域周波数成分に、予め定められたレベル以上の変化が生じたことを表す場合に、感知対象スペース内で音が発生したと判定するためのプログラムなどが記憶されている。
発生音感知装置では、記憶部に記憶された各プログラムとこの各プログラムの処理に必要なデータが必要に応じてRAMに読み込まれて、CPUで解釈実行・処理される。この結果、CPUが所定の機能(スペクトル変化検知部、判定部など)を実現することで上述の発生音の感知が実現される。
<補記>
本発明は上述の実施形態に限定されるものではなく、本発明の趣旨を逸脱しない範囲で適宜変更が可能である。また、上記実施形態において説明した処理は、記載の順に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されるとしてもよい。
また、上記実施形態において説明したハードウェアエンティティ(発生音感知装置)における処理機能をコンピュータによって実現する場合、ハードウェアエンティティが有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記ハードウェアエンティティにおける処理機能がコンピュータ上で実現される。
この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。具体的には、例えば、磁気記録装置として、ハードディスク装置、フレキシブルディスク、磁気テープ等を、光ディスクとして、DVD(Digital Versatile Disc)、DVD−RAM(Random Access Memory)、CD−ROM(Compact Disc Read Only Memory)、CD−R(Recordable)/RW(ReWritable)等を、光磁気記録媒体として、MO(Magneto-Optical disc)等を、半導体メモリとしてEEP−ROM(Electronically Erasable and Programmable-Read Only Memory)等を用いることができる。
また、このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD−ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。
このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶装置に格納する。そして、処理の実行時、このコンピュータは、自己の記録媒体に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。また、このプログラムの別の実行形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよく、さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるASP(Application Service Provider)型のサービスによって、上述の処理を実行する構成としてもよい。なお、本形態におけるプログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの(コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータ等)を含むものとする。
また、この形態では、コンピュータ上で所定のプログラムを実行させることにより、ハードウェアエンティティを構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。

Claims (9)

  1. 入力された音響信号の高域周波数成分の変動を検知するスペクトル変化検知部と、
    上記スペクトル変化検知部が出力した検知結果が、上記高域周波数成分に、予め定められたレベル以上の変化が生じたことを表す場合に、音が発生したと判定する判定部と
    を含む発生音感知装置。
  2. 請求項1に記載の発生音感知装置であって、
    上記スペクトル変化検知部が、
    上記音響信号の周波数分析を行う周波数分析部と、
    上記周波数分析部によって得られた周波数パラメータに基づき、上記高域周波数成分の変動を検知するスペクトル高域変動検知部と
    を含むことを特徴とする発生音感知装置。
  3. 請求項2に記載の発生音感知装置であって、
    さらに、上記周波数分析部によって得られた、予め定められた時間の周波数パラメータの平均を求める平均化部を含み、
    上記スペクトル高域変動検知部は、
    現在時刻の周波数パラメータと、上記平均化部によって得られた周波数パラメータの平均とを比較して、上記高域周波数成分の変動を検知する
    ことを特徴とする発生音感知装置。
  4. 請求項1に記載の発生音感知装置であって、
    上記スペクトル変化検知部が、
    上記音響信号の自己相関係数を求める自己相関係数計算部と、
    上記自己相関係数に基づいてスペクトルの傾きを計算する傾き計算部と、
    予め定められた時間の上記傾きの平均を求める平均化部と、
    現在時刻の上記傾きと、上記平均化部によって得られた傾きの平均とを比較することによって、上記高域周波数成分の変動を検知する傾き変動検知部と
    を含むことを特徴とする発生音感知装置。
  5. 請求項1に記載の発生音感知装置であって、
    上記スペクトル変化検知部が、
    上記音響信号の自己相関係数を求める自己相関係数計算部と、
    予め定められた時間の上記自己相関係数の平均を求める平均化部と、
    現在時刻の上記自己相関係数と、上記平均化部によって得られた自己相関係数の平均とを比較することによって、上記高域周波数成分の変動を検知する傾き変動検知部と
    を含むことを特徴とする発生音感知装置。
  6. 請求項1に記載の発生音感知装置であって、
    上記スペクトル変化検知部が、
    上記音響信号を高域信号と低域信号とに分ける帯域分割フィルタと、
    上記低域信号のパワーを計算する低域パワー計算部と、
    上記高域信号のパワーを計算する高域パワー計算部と、
    上記低域パワー計算部によって得られた上記低域信号のパワーと、上記高域パワー計算部によって得られた上記高域信号のパワーとに基づいて、スペクトルの傾きを計算する傾き計算部と、
    予め定められた時間の上記傾きの平均を求める平均化部と、
    現在時刻の上記傾きと、上記平均化部によって得られた傾きの平均とを比較することによって、上記高域周波数成分の変動を検知する傾き変動検知部と
    を含むことを特徴とする発生音感知装置。
  7. 請求項1から請求項6のいずれかに記載の発生音感知装置であって、
    さらに、上記音響信号に人の声の母音特性が含まれるか否かを検知する母音検知部を含み、
    上記判定部は、上記母音検知部によって得られた検知結果が、上記音響信号に人の声の母音特性が含まれることを表す場合に、発声があったと判定する
    ことを特徴とする発生音感知装置。
  8. 入力された音響信号の高域周波数成分の変動を検知するスペクトル変化検知ステップと、
    上記スペクトル変化検知部が出力した検知結果が、上記高域周波数成分に、予め定められたレベル以上の変化が生じたことを表す場合に、音が発生したと判定する判定ステップと
    を有する発生音感知方法。
  9. コンピュータを、請求項1から請求項7のいずれかに記載の発生音感知装置として機能させるためのプログラム。
JP2012136166A 2012-06-15 2012-06-15 発生音感知装置、方法、プログラム Expired - Fee Related JP5840077B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012136166A JP5840077B2 (ja) 2012-06-15 2012-06-15 発生音感知装置、方法、プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012136166A JP5840077B2 (ja) 2012-06-15 2012-06-15 発生音感知装置、方法、プログラム

Publications (2)

Publication Number Publication Date
JP2014002217A true JP2014002217A (ja) 2014-01-09
JP5840077B2 JP5840077B2 (ja) 2016-01-06

Family

ID=50035452

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012136166A Expired - Fee Related JP5840077B2 (ja) 2012-06-15 2012-06-15 発生音感知装置、方法、プログラム

Country Status (1)

Country Link
JP (1) JP5840077B2 (ja)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5895400A (ja) * 1981-11-30 1983-06-06 松下電工株式会社 音声メツセ−ジ識別方式
JPS63137300A (ja) * 1986-11-28 1988-06-09 シャープ株式会社 適応ベクトル量子化器
JPH0683391A (ja) * 1992-09-04 1994-03-25 Matsushita Electric Ind Co Ltd テレビ会議用発言音声検出装置
JP2002268657A (ja) * 2001-03-09 2002-09-20 Nippon Telegr & Teleph Corp <Ntt> 音響信号の立ち上がり・立ち下がり検出方法及び装置並びにプログラム及び記録媒体
JP2011065044A (ja) * 2009-09-18 2011-03-31 Brother Industries Ltd 音声処理装置、プログラム
JP2011242755A (ja) * 2010-04-22 2011-12-01 Fujitsu Ltd 発話状態検出装置、発話状態検出プログラムおよび発話状態検出方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5895400A (ja) * 1981-11-30 1983-06-06 松下電工株式会社 音声メツセ−ジ識別方式
JPS63137300A (ja) * 1986-11-28 1988-06-09 シャープ株式会社 適応ベクトル量子化器
JPH0683391A (ja) * 1992-09-04 1994-03-25 Matsushita Electric Ind Co Ltd テレビ会議用発言音声検出装置
JP2002268657A (ja) * 2001-03-09 2002-09-20 Nippon Telegr & Teleph Corp <Ntt> 音響信号の立ち上がり・立ち下がり検出方法及び装置並びにプログラム及び記録媒体
JP2011065044A (ja) * 2009-09-18 2011-03-31 Brother Industries Ltd 音声処理装置、プログラム
JP2011242755A (ja) * 2010-04-22 2011-12-01 Fujitsu Ltd 発話状態検出装置、発話状態検出プログラムおよび発話状態検出方法

Also Published As

Publication number Publication date
JP5840077B2 (ja) 2016-01-06

Similar Documents

Publication Publication Date Title
US10176705B1 (en) Audio monitoring and sound identification process for remote alarms
Park et al. Levels and sources of neighbour noise in heavyweight residential buildings in Korea
US20190103005A1 (en) Multi-resolution audio activity tracker based on acoustic scene recognition
US10152877B2 (en) Systems and methods for adaptive detection of audio alarms
Principi et al. Acoustic cues from the floor: a new approach for fall classification
JP7011189B2 (ja) 機器制御システム
KR20150105144A (ko) 공동주택 층간소음 실시간 모니터링 시스템 및 모니터링 방법
JP2012021969A (ja) 部屋、配線器具
US9852620B1 (en) System and method for detecting sound and performing an action on the detected sound
JP6294747B2 (ja) 報知音感知装置、報知音感知方法及びプログラム
NZ773753A (en) Systems and methods for identifying vaping
Nguyen et al. Human perception of wind farm vibration
Feng et al. An adl recognition system on smart phone
JP5840077B2 (ja) 発生音感知装置、方法、プログラム
Armknecht et al. Privacy implications of room climate data
US10109298B2 (en) Information processing apparatus, computer readable storage medium, and information processing method
Lee et al. Sound attenuation and audibility of fire alarm signal in Korean residential apartment buildings: a case study
Bornand et al. A user aware interface for seclusion rooms
Jung et al. Real-time unusual user event detection algorithm fusing vision, audio, activity, and dust patterns
WO2021176770A1 (ja) 行動識別方法、行動識別装置及び行動識別プログラム
Hyun et al. The Edge Computing System for the Detection of Water Usage Activities with Sound Classification
KR102014370B1 (ko) 반복적 소음 기반 공동주택의 층간 소음 관리 시스템
US20240170117A1 (en) Homeowner Health Alerts and Mitigation Based on Home Sensor Data
JP2005172548A (ja) 監視装置およびデータベース構築方法
Castelli et al. Everyday life sounds and speech analysis for a medical telemonitoring system.

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140710

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150310

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150324

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150518

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20151104

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20151110

R150 Certificate of patent or registration of utility model

Ref document number: 5840077

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees