JP2016126479A

JP2016126479A - 特徴音抽出方法、特徴音抽出装置、コンピュータプログラム、配信システム

Info

Publication number: JP2016126479A
Application number: JP2014266102A
Authority: JP
Inventors: 成幸小田嶋; Shigeyuki Odajima; 美和岡林; Miwa Okabayashi
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 2014-12-26
Filing date: 2014-12-26
Publication date: 2016-07-11
Anticipated expiration: 2034-12-26
Also published as: JP6467915B2

Abstract

【課題】生活音の中に、複数の特徴箇所が存在する場合でも、最も特徴的な箇所を特定し、特定箇所に係る音声を抽出する特徴音抽出方法等を提供する。
【解決手段】コンピュータにより実行する特徴音抽出方法において、音データを所定時間毎に区切り、区切られた期間毎に音データの周波数成分を含む特徴量を算出し、期間毎に算出した音データの周波数成分を含む特徴量の１以上の成分値ｘに対して、区間ａ_ｂ≦ｘ≦ａ_ｔ（０≦ａ_ｂ＜ａ_ｔ≦∞）において、ｘで微分又は劣微分した関数が単調減少であり、下記の式を満たす関数値の下界Ｔが存在する関数ｆ（ｘ）を作用させ、作用させた結果に基づき、前記期間毎の特徴量を求め、求めた期間毎の特徴量に基づいて、特徴音データを抽出する処理を行う。

【選択図】図２

Description

本発明は、生活音の中から、特徴的な箇所を抽出する技術等に関する。

近年、生活音センシング・提示による高齢者見守りサービス、コミュニケーションサービスが検討されている。これらのサービスに共通する要素技術として、全ての音を聞かずとも様子がわかるための、生活音の要約技術がある。生活音の要約技術とは、収集した生活音の中から、ドアの開閉音や人の笑い声などの特徴的な箇所を抽出し、提示する技術である。

従来、信号の特徴的な箇所を抽出する技術として、定常状態のデータを取得しておき、その定常状態からのズレに基づき異変検出する方法がある（例えば、特許文献１）。

特開２００４−２９５８６１号公報

しかし、生活音においては、エアコンのファンの音、水の音、咳払いの音など、特徴度合いが異なる複数の特徴的な箇所を含むという性質がある。そのため、定常状態からのズレの度合いを閾値で判断し、提示するか否かを判定する方法では、特徴箇所が全て提示されてしまうか、特徴度合いが弱い箇所が全く提示されなくなるという問題が生じる。

１つの側面では、生活音の中に、複数の特徴箇所が存在しうる場合でも、最も特徴的な箇所を特定し、当該特定箇所に係る音声を抽出する特徴音抽出方法等を提供することを目的とする。

１つ態様では、コンピュータにより実行する特徴音抽出方法は、音データを所定時間毎に区切り、区切られた期間毎に音データの周波数成分を含む特徴量を算出し、前記期間毎に算出した音データの周波数成分を含む特徴量の１以上の成分値ｘに対して、区間ａ_ｂ≦ｘ≦ａ_ｔ（０≦ａ_ｂ＜ａ_ｔ≦∞）において、ｘで微分又は劣微分した関数が単調減少であり、下記の式を満たす関数値の下界Ｔが存在する関数ｆ（ｘ）を作用させ、作用させた結果に基づき、前記期間毎の特徴量を求め、求めた期間毎の特徴量に基づいて、特徴音データを抽出する。

方法の一観点によれば、生活音の中から、最も特徴的な箇所を抽出することが可能となる。

特徴音抽出装置のハードウェア構成を示すブロック図である。特徴音抽出装置の機能構成例を示すブロック図である。生活音ＤＢのレコードレイアウトの一例を示す説明図である。音特徴ＤＢのレコードレイアウトの一例を示す説明図である。音クラスタＤＢのレコードレイアウトの一例を示す説明図である。ダイジェスト表示ＤＢのレコードレイアウトの一例を示す説明図である。特徴音ＤＢのレコードレイアウトの一例を示す説明図である。メイン処理の手順の一例を示すフローチャートである。特徴スコア計算処理の手順の一例を示すフローチャートである。特徴計算処理の一例を示すブロック線図である。特徴計算処理の手順の一例を示すフローチャートである。フィルタの入出力関係の一例を示すグラフである。特徴量の一例を示すグラフである。出力抑制処理の手順の一例を示すフローチャートである。提示処理の手順の一例を示すフローチャートである。出力抑制処理、提示処理の具体例を示す説明図である。在・不在判定処理の手順の一例を示すフローチャートである。在・不在判定処理の具体例を示す説明図である。ダイジェスト表示の一例を示す説明図である。発生頻度計算処理の手順の一例を示すフローチャートである。出力抑制処理の手順の一例を示すフローチャートである。出力抑制処理の具体例を示す説明図である。出力抑制処理の他の例を示す説明図である。フィルタの入出力の関係の一例を示すグラフである。配信システムの構成の一例を示す説明図である。

実施の形態１
以下、本発明の実施の形態を、図面を参照して説明する。図１は特徴音抽出装置１
のハードウェア構成を示すブロック図である。特徴音抽出装置１は、汎用コンピュータ、ワークステーション、デスクトップ型ＰＣ（パーソナルコンピュータ）、ノートブック型ＰＣ等である。特徴音抽出装置１は、ＣＰＵ（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）１１、ＲＡＭ（ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）１２、ＲＯＭ（ＲｅａｄＯｎｌｙＭｅｍｏｒｙ）１３、大容量記憶装置１４、入力部１５、出力部１６、通信部１７（送信部）、読取り部１８を含む。各構成はバスで接続されている。

ＣＰＵ１１はＲＯＭ１３に記憶された制御プログラム１Ｐに従いハードウェア各部を制御する。ＲＡＭ１２は例えばＳＲＡＭ（ＳｔａｔｉｃＲＡＭ）、ＤＲＡＭ（ＤｙｎａｍｉｃＲＡＭ）、フラッシュメモリである。ＲＡＭ１２はＣＰＵ１１によるプログラムの実行時に発生するデータを一時的に記憶する。

大容量記憶装置１４は、例えばハードディスク、ＳＳＤ（ＳｏｌｉｄＳｔａｔｅＤｒｉｖｅ）などである。大容量記憶装置１４には、後述する各種データベースが記憶されている。また、制御プログラム１Ｐを大容量記憶装置１４に記憶するようにしておいても良い。

入力部１５は特徴音抽出装置１にデータを入力するためのキーボード、マウスなどを含む。また、生活音を収集する例えば、マイク１５ａが接続され、マイク１５ａから収集された生活音は電気信号となり、入力部１５に入力される。
なお、本明細書において、「音」とは、空気中の振動をマイクで取得する狭義の「音」に限らず、例えば空気中、物質中、液体中を伝搬する「振動」を、例えばマイクやピエゾ素子、レーザ微小変位計といった測定装置で計測した場合も含む広義の概念である。

出力部１６は特徴音抽出装置１の画像出力を表示装置１６ａに、音声出力をスピーカなどに行うためのものである。

通信部１７はネットワークを介して、他のコンピュータと通信を行う。読取り部１８はＣＤ（ＣｏｍｐａｃｔＤｉｓｋ）−ＲＯＭ、ＤＶＤ（ＤｉｇｉｔａｌＶｅｒｓａｔｉｌｅＤｉｓｃ）−ＲＯＭを含む可搬型記憶媒体１ａを読み取る。ＣＰＵ１１が読取り部１８を介して、制御プログラム１Ｐを可搬型記憶媒体１ａより読み取り、大容量記憶装置１４に記憶しても良い。また、ネットワークを介して他のコンピュータからＣＰＵ１１が制御プログラム１Ｐをダウンロードし、大容量記憶装置１４に記憶しても良い。さらにまた、半導体メモリ１ｂから、ＣＰＵ１１が制御プログラム１Ｐを読み込んでも良い。

図２は特徴音抽出装置１の機能構成例を示すブロック図である。特徴音抽出装置１の各機能部は、大容量記憶装置１４に記憶された制御プログラム１Ｐと、ＣＰＵ１１、ＲＡＭ１２等のハードウェア資源とが協働して動作することにより実現される。

特徴音抽出装置１は、入力部１１０、特徴スコア計算部１２０、クラスタリング部１３０、ダイジェスト表示生成部１４０、出力抑制部１５０及び提示部１６０、並びに、生活音ＤＢ１４ａ、音特徴ＤＢ１４ｂ、音クラスタＤＢ１４ｃ、ダイジェスト表示ＤＢ１４ｄ及び特徴音ＤＢ１４ｅを含む。

入力部１１０は生活音入力部１１１を含む。入力部１１０はハードウェアである入力部１５に対応する機能部である。特徴スコア計算部１２０は、音特徴計算部１２１（算出部、フィルタ部）、音クラスタマッチング・スコア計算部１２２（特徴量算出部）を含む。クラスタリング部１３０はクラスタリング処理部１３１、クラスタ発生頻度計算部１３２を含む。ダイジェスト表示生成部１４０は在／不在判定部１４１（計数部、判定部）を含む。出力抑制部１５０は特徴箇所出力抑制部１５１（抽出部）を含む。提示部１６０はＧＵＩ表示部１６１、音声提示部１６２を含む。

生活音ＤＢ１４ａ、音特徴ＤＢ１４ｂ、音クラスタＤＢ１４ｃ、ダイジェスト表示ＤＢ１４ｄ及び特徴音ＤＢ１４ｅは、大容量記憶装置１４に記憶されている。

図３は生活音ＤＢ１４ａのレコードレイアウトの一例を示す説明図である。生活音ＤＢ１４ａはタイムスタンプ、音ファイル名の各列を含む。タイムスタンプには生活音を取得した時刻を記憶する。タイムスタンプとする時刻は、音ファイルとして記憶される生活音の冒頭の時刻や末尾の時刻などである。音ファイル名には、ファイル名を記憶する。

図４は音特徴ＤＢ１４ｂのレコードレイアウトの一例を示す説明図である。音特徴ＤＢ１４ｂはタイムスタンプ、特徴量の各列を含む。タイムスタンプには、音データのタイムスタンプを記憶する。特徴量には、音データの特徴量の値を記憶する。

図５は音クラスタＤＢ１４ｃのレコードレイアウトの一例を示す説明図である。音クラスタＤＢ１４ｃはクラスタＩＤ、特徴量、発生頻度の各列を含む。クラスタＩＤは各クラスタを特定するＩＤを記憶する。特徴量は各クラスタの特徴量、すなわち、各クラスタの中心座標やクラスタに含まれるデータの中央値などのクラスタの代表値を記憶する。発生頻度は各クラスタの発生頻度を記憶する。

図６はダイジェスト表示ＤＢ１４ｄのレコードレイアウトの一例を示す説明図である。ダイジェスト表示ＤＢ１４ｄは開始時刻、終了時刻、ダイジェストＩＤの各列を含む。開始時刻、終了時刻は、人の在または不在を示す時間帯の開始、終了の時刻を記憶する。ダイジェストＩＤは人の在又は不在を示すＩＤを記憶する。例えば、ＩＤ＝１は在を示し、ＩＤ＝０は不在を示す。

図７は特徴音ＤＢ１４ｅのレコードレイアウトの一例を示す説明図である。特徴音ＤＢ１４ｅはタイムスタンプ、スコア、クラスタＩＤの各列を含む。タイムスタンプは音データが観測された日時を記憶する。スコアは音データの発生頻度を記憶する。クラスタＩＤは特徴音が属するクラスタのＩＤを記憶する。

次に、特徴音抽出装置１の動作概要を説明する。生活音入力部１１１はマイク１５ａから収集された音をデータ（音データ）として生活音ＤＢ１４ａに記憶する。生活音ＤＢ１４ａに記憶する音声データの形式は、ＷＡＶ（ＲＩＦＦｗａｖｅｆｏｒｍＡｕｄｉｏＦｏｒｍａｔ）、ＡＩＦＦ（ＡｕｄｉｏＩｎｔｅｒｃｈａｎｇｅＦｉｌｅＦｏｒｍａｔ）といった非圧縮形式でも良いし、ＭＰ３（ＭＰＥＧ−１ＡｕｄｉｏＬａｙｅｒ−３）、ＷＭＡ（ＷｉｎｄｏｗｓＭｅｄｉａ（登録商標）Ａｕｄｉｏ）といった圧縮形式でも良い。また、生活音入力部１１１は音データを音特徴計算部１２１に渡す。

音特徴計算部１２１は音声データを時間ウィンドウにより区切り、区切られた時間毎に特徴量を算出する。算出した特徴量は音特徴ＤＢ１４ｂに記憶する。クラスタリング処理部１３１は所定期間毎、音特徴ＤＢ１４ｂが更新される毎などのタイミングで、音特徴ＤＢ１４ｂが記憶している特徴量をクラスタリングする。クラスタ発生頻度計算部１３２は各クラスタの発生頻度を計算し、音クラスタＤＢ１４ｃに記憶する。また、音特徴計算部１２１は算出した特徴量を音クラスタマッチング・スコア計算部１２２に渡す。

音クラスタマッチング・スコア計算部１２２は、音特徴計算部１２１より受け取った特徴量と音クラスタＤＢ１４ｃに記憶してある各クラスタの特徴量とのマッチングを行い、処理対象となっている音が所属すべきクラスタを決定する。所属すべきクラスタの発生頻度は、例えば区切られた音声データの発生頻度としてもよいし、特徴量の近傍に存在するクラスタの発生頻度の重みづけ和を用いてもよい。音クラスタマッチング・スコア計算部１２２は、以上の処理結果として、区切られた音声データ毎に、所属すべきクラスタのＩＤ、発生頻度、区切られた音声のタイムスタンプを、特徴音ＤＢ１４ｅに記憶する。

特徴箇所出力抑制部１５１は、特徴音ＤＢ１４ｅに記憶されたデータより一定時間分、例えば３０分間分のデータを取り出し、発生頻度の最も低い音データを特定し、特定した音データのタイムスタンプを出力する。

在／不在判定部１４１は、上述の一時記憶領域に蓄えられたデータより一定時間分のデータを取り出し、入力データとする。また、在／不在判定部１４１は、音クラスタＤＢ１４ｃから、背景音テーブル（図示しない）を作成する。非背景音テーブルは、各音クラスタに背景音または非背景音の種別を付与したものである。背景音、非背景音の区別は、発生頻度を基に決定する。在／不在判定部１４１は、入力データに含まれる非背景音の出現回数を求め、当該出現回数が予め定めた閾値を越えていれば人が居たと判定し、当該出現回数が閾値以下であれば人は居なかったと判定する。在／不在判定部１４１は、判定結果をダイジェスト表示ＤＢ１４ｄに記憶する。

音声提示部１６２は、特徴箇所出力抑制部１５１が出力した音データのスコアが所定の閾値を越えたもののみを提示する。なお、ここでのスコアは例えば発生頻度とは反比例するスコアとしてよい。

ＧＵＩ表示部１６１はダイジェスト表示ＤＢ１４ｄに基づいて、在・不在の判定結果を示す表示画面を表示装置１６ａに表示させる。

次に、特徴音抽出装置１の動作を詳細に説明する。図８はメイン処理の手順の一例を示すフローチャートである。特徴音抽出装置１のＣＰＵ１１は、特徴スコア計算処理を行う（ステップＳ１）。続いて、ＣＰＵ１１は出力抑制処理を行う（ステップＳ２）。最後に、ＣＰＵ１１は提示処理を行う（ステップＳ３）。

図９は特徴スコア計算処理の手順の一例を示すフローチャートである。特徴音抽出装置１のＣＰＵ１１は特徴量計算を行う（ステップＳ１１）。図１０は特徴量計算処理の一例を示すブロック線図である。図１０は特徴量計算処理の概要を示している。特徴量計算処理は、例えば高域強調処理、ＦＦＴ（ＦａｓｔＦｏｕｒｉｅｒＴｒａｎｓｆｏｒｍ）処理、雑音除去処理、メルフィルタ処理、スペクトル成分の累乗処理の順で行ってよい。音データから算出した周波数成分を含む特徴量（例えばメルスペクトル）を算出した後にスペクトル成分の累乗処理を行う点が、本実施の形態の特徴である。特徴量計算処理の詳細について、図１１を用いて説明する。なお、以下の例は、音データから算出した周波数成分を含む特徴量として、メルスペクトルを用いる場合のものである。

図１１は特徴量計算処理の手順の一例を示すフローチャートである。特徴音抽出装置１のＣＰＵ１１は入力された音データを所定時間毎に区切り、区切られた期間毎に処理を行う。すなわち、ＣＰＵ１１は時間ウィンドウを設定し、時間ウィンドウ内のデータを処理し、処理が終了した場合、時間ウィンドウをずらして、同様の処理を繰り返し行う。ＣＰＵ１１は時間ウィンドウ内のデータを取得する（ステップＳ２１）。ＣＰＵ１１は時間ウィンドウ内のデータに対して、高域強調（ステップＳ２２）、ＦＦＴ（ステップＳ２３）、振幅計算（ステップＳ２４）、雑音除去（ステップＳ２５）、メルスペクトル抽出（ステップＳ２６）の各処理を行う。これらの処理については、公知の技術であるので、説明を省略する。

続いて、ＣＰＵ１１はステップＳ２６で得たメルスペクトルに対して、フィルタを適用する（ステップＳ２７）。ＣＰＵ１１はフィルタを適用したメルスペクトルを特徴量として出力する（ステップＳ２８）。ＣＰＵ１１は処理を呼び出し元に戻す。

ここで、フィルタは乗数ｐが１乗未満の累乗関数であり、例えば、以下の式で表される。

図１２は、フィルタの入出力関係の一例を示すグラフである。横軸が入力、縦軸が出力である。横軸、縦軸とも無次元である。乗数ｐの値が１であるグラフｆ１は参考のために表示しており、フィルタとしては用いない。グラフｆ２は乗数ｐの値が０．５の場合、グラフｆ３は乗数ｐが０．２５の場合である。１乗未満の乗数を持つ累乗フィルタは、図１２で示すように、１以上の値を持つ場合には出力を抑制する効果を有し、また１以下の入力に対しても必ず０以上の値を持つことが保証される。したがって、メルスペクトル特徴を用いた場合に生じる、細かい音量で大幅に特徴量形状が異なる問題と、ｌｏｇフィルタを用いた場合に生じる、１以下の出力で値が発散する問題は解決される。更に、特徴量に音量と周波数成分が同時に考慮されるため、音量・周波数成分を別個の処理で取り扱う必要がなく、処理が容易である。

図１３は特徴量の一例を示すグラフである。横軸は周波数で、単位はＫＨｚである。縦軸はスペクトル値で無次元数である。図１３Ａが咳払い声、図１３Ｂがファン音から得た特徴量である。両図を比較すると明らかのように、両者で大きく特徴量形状（スペクトル値）が異なっている。したがって、非背景音（咳払い声）と背景音（ファン音）とを類別するのに適した特徴量であると言える。

図９に戻り、ＣＰＵ１１は特徴量計算で得た音特徴（特徴量）を音特徴ＤＢ１４ｂに記憶する（ステップＳ１２）。続いて、ＣＰＵ１１は特徴量と、音クラスタＤＢ１４ｃに記憶されている各クラスタの特徴量とのマッチングを行う（ステップＳ１３）。ＣＰＵ１１はマッチングした音クラスタのＩＤと発生頻度を出力する（ステップＳ１４）。ＣＰＵ１１は処理を呼び出し元に戻す。図８に戻り、ＣＰＵ１１は出力抑制処理（ステップＳ２）を行う。

出力抑制処理について説明する。実施の形態１における出力抑制処理は、すでに蓄積されている一定時間分の音データを処理対象とするバッチ処理を前提としている。処理対象となる音データは、音クラスタＩＤ、発生頻度スコア、タイムスタンプを含んでいる。図１４は出力抑制処理の手順の一例を示すフローチャートである。特徴音抽出装置１のＣＰＵ１１は各音データの抑制フラグをＦａｌｓｅとし、特徴箇所リストＦを空集合にする（ステップＳ３１）。抑制フラグは対応する音を抑制するか否かを示すフラグである。抑制フラグがＴｒｕｅの場合、出力抑制を意味するので音は出力されない。抑制フラグがＦａｌｓｅの場合、出力を抑制しないことを意味するので音を出力する。また特徴箇所リストＦは、特徴音が含まれる箇所のリストである。特徴箇所は、例えば、特徴音のタイムスタンプである。

ＣＰＵ１１は音クラスタＤＢ１４ｃを参照し、発生頻度の低い順に音クラスタをソートする（ステップＳ３２）。ＣＰＵ１１は、ソートした結果から得られるＩＤの順列を音クラスタリストとして、ＲＡＭ１２などに記憶する。ＣＰＵ１１は音クラスタリストの先頭のクラスタを処理対象クラスタとして選択する（ステップＳ３３）。ＣＰＵ１１は、処理対象となっている音データの中で、選択したクラスと同じクラスタＩＤを持つ音データを取得し、リストＬに格納する（ステップＳ３４）。

ＣＰＵ１１はリストＬから先頭の音データｓを取得する（ステップＳ３５）。ＣＰＵ１１はｓの抑制フラグがＦａｌｓｅで、かつ、発生頻度スコアが閾値を超えているか否かを判定する（ステップＳ３６）。ＣＰＵ１１は、抑制フラグがＦａｌｓｅで、かつ、発生頻度スコアが閾値を超えていると判定した場合（ステップＳ３６でＹＥＳ）、音データｓのタイムスタンプを特徴箇所リストＦに追加する（ステップＳ３７）。なお、閾値は予め定められているものとする。ＣＰＵ１１は音データｓの周囲（前後）一定時間の抑制フラグの値をＴｒｕｅとする（ステップＳ３８）。ＣＰＵ１１はリストＬに未処理の音データがあるか否かを判定する（ステップＳ３９）。ＣＰＵ１１は、抑制フラグがＴｒｕｅか、または、発生頻度スコアが閾値以下であると判定した場合（ステップＳ３６でＮＯ）、処理をステップＳ３９に移す。ＣＰＵ１１は、リストＬに未処理の音データがあると判定した場合（ステップＳ３９でＹＥＳ）、処理をステップＳ３５に戻す。ＣＰＵ１１は、リストＬに未処理の音データがないと判定した場合（ステップＳ３９でＮＯ）、処理していないクラスタが音クラスタＤＢ１４ｃにあるか否かを判定する（ステップＳ４０）。ＣＵＰ１１は、未処理クラスタがあると判定とした場合（ステップＳ４０でＹＥＳ）、処理をステップＳ３３に戻す。ＣＰＵ１１は、未処理クラスタがないと判定した場合（ステップＳ４０でＮＯ）、特徴箇所リストを出力する（ステップＳ４１）。ＣＰＵ１１は出力抑制処理を終了し、処理を呼び出し元に戻す。再び、図８に戻り、ＣＰＵ１１は提示処理（ステップＳ３）を実行し、メイン処理を終了する。

提示処理について説明する。図１５は提示処理の手順の一例を示すフローチャートである。特徴音抽出装置１のＣＰＵ１１は、出力抑制処理によって得られた特徴箇所リストに基づき、特徴音ＤＢ１４ｅから特徴箇所に対応する音データ（特徴音データ）を取得する（ステップＳ５１）。ＣＰＵ１１は取得した特徴音データのスコアが、閾値Ｔｉを超えているか否かを判定する（ステップＳ５２）。閾値Ｔｉは予め定めておいても良いし、提示処理を実行するに当たり定めても良い。閾値Ｔｉは、多くの特徴音を確認したい場合は小さめの値とし、そうでない場合は大きめの値とすれば良い。ＣＰＵ１１は、スコアが閾値を超えている判定した場合（ステップＳ５２でＹＥＳ）、特徴音を再生する（ステップＳ５３）。ＣＰＵ１１は、未処理の特徴音データがあるか否かを判定する（ステップＳ５４）。ＣＰＵ１１は、未処理の特徴音データがあると判定した場合（ステップＳ５４でＹＥＳ）、処理をステップＳ５１に戻す。ＣＰＵ１１は、未処理の特徴音データがないと判定した場合（ステップＳ５４でＮＯ）、提示処理を終了し、処理を呼び出し元に戻す。ＣＰＵ１１は、スコアが閾値以下であると判定した場合（ステップＳ５２でＮＯ）、処理をステップＳ５４に移す。

次に、出力抑制処理、提示処理の具体例を示す。図１６は出力抑制処理、提示処理の具体例を示す説明図である。図１６では横軸を時間、縦軸を振幅として、音声信号の波形を示している。波形と重なる矩形は時間ウィンドウで区切られる期間を示している。波形の上に示しているのは、期間毎の特徴度合いのスコアである。図１６に２つの例を示している。２つの例ともに時間ウィンドウで区切られた期間が７つ（Ｋ１からＫ７、Ｋ１１からＫ１７）示され、そのうち、５つの期間で出力抑制処理が行われる例である。図１６の例に示されている特徴度合いのスコアは、発生頻度と反比例するスコアであり、発生頻度が低いほど大きな値となるスコアである。図１６の左側の例では、期間Ｋ４のスコアが０．５であり、他の期間Ｋ１からＫ３、Ｋ５からＫ７のスコアはいずれも０．１となっている。出力抑制処理の対象とする期間Ｋ２からＫ６において、期間Ｋ４が０．５で他の期間に比べて、スコアが大きいため、期間Ｋ４の音が提示される。図１６の右側の例では、期間Ｋ１５のスコアが１．０であり、他の期間Ｋ１１からＫ１４、Ｋ１６からＫ１７のスコアはいずれも０．５となっている。出力抑制処理の対象とする期間Ｋ１２からＫ１６において、期間Ｋ１５が１．０で他の期間に比べて、スコアが大きいため、期間Ｋ１５の音が提示される。このように、出力抑制処理では、複数の期間中で特徴音を判定して提示するので、スコアが０．５の音であっても提示される場合もあれば、提示されない場合もある。すなわち、少数の特徴的な箇所が抽出され、閾値による一律的な判定の場合のように、全部出力されるか、全部出力されないかの何れかのようになってしまうことを防ぐことが可能となる。

続いて、人の在・不在判定について説明する。図１７は在・不在判定処理の手順の一例を示すフローチャートである。特徴音抽出装置１のＣＰＵ１１は、特徴音ＤＢ１４ｅから過去一定時間に抽出された音データを取得する（ステップＳ６１）。ＣＰＵ１１は取得した音データの中で、背景音に含まれない音データの個数Ｃを算出する（ステップＳ６２）。ＣＰＵ１１は個数Ｃが閾値を超えているか否かを判定する（ステップＳ６３）。ＣＰＵ１１は個数Ｃが閾値を超えていると判定した場合（ステップＳ６３でＹＥＳ）、戻り値を在とする（ステップＳ６４）。ＣＰＵ１１は個数Ｃが閾値以下であると判定した場合（ステップＳ６３でＮＯ）、戻り値を不在とする（ステップＳ６５）。ＣＰＵ１１は在・不在判定処理を終了する。ＣＰＵ１１は、在・不在判定処理を適切な回数、繰り返し実行することにより、ダイジェスト表示ＤＢ１４ｄを作成する。なお、背景音テーブルは、在・不在判定処理が実行される前に作成されているものとする。

図１８は在・不在判定処理の具体例を示す説明図である。図１８に示す波形などは図１６と同様である。図１８の左側は音データの例を示している。図１８の右側には背景音テーブルを概念的に表現したものを記載している。音データは期間Ｋ２１からＫ３０の１０期間のデータである。音データには、咳払いの音、テレビの音、ファンの音の３種類の音が含まれている。また、背景音テーブルにより、咳払いの音、テレビの音は非背景音と定義され、ファンの音は背景音と定義されている。図１８の音データにおいては、期間Ｋ２１、Ｋ２２、Ｋ２４がファンの音、期間Ｋ２３、Ｋ２９が咳払いの音、期間Ｋ２５からＫ２８、Ｋ３０がテレビの音となっている。したがって、非背景音（図１８ではマルを付している。）の数が７、背景音（図１８ではバツを付している。）の数が３となっている。例えば、閾値が６であれば、期間Ｋ２１からＫ３０に掛けての時間帯には、人が居たと判定する。なお、図１８で定義された音データ、背景音データ等は一例であり、環境の差異により、別の音が背景音として定義されていることもありうる。

図１９はダイジェスト表示の一例を示す説明図である。ダイジェスト表示では過去２４時間について表示される。図１９に示す例では、ハッチングが掛かっている期間が人の不在期間１９ａを、ハッチングがない期間が人の在期間１９ｂを表している。在期間１９ｂでは、さらに特徴音が発生した箇所１９ｃが矢印により示されている。さらに現在の時刻も矢印１９ｄにより示されている。

以上のように、在・不在判定処理により、細かな瞬間の情報と共に、比較的長時間の傾向を示すことが可能となる。

図２０は発生頻度計算処理の手順の一例を示すフローチャートである。発生頻度計算処理は、クラスタリング部１３０が行う処理であり、音クラスタＤＢ１４ｃを更新する処理である。ＣＰＵ１１は、音特徴ＤＢ１４ｂから特徴量データを取得する（ステップＳ７１）。ＣＰＵ１１は、特徴量データのクラスタリング処理を行う（ステップＳ７２）。ここで、クラスタリング処理としては、例えばｋ−ｍｅａｎｓ法のようなクラスタ数を固定するハードクラスタリング手法、例えばＷａｒｄ法のような階層クラスタリング手法やＤＰ−ｍｅａｎｓ法のようなクラスタ数を動的に決定するハードクラスタリング手法、例えばＥＭ法による混合ガウスモデルの最適化に基づく方法やマルコフ連鎖モンテカルロ法による階層ベイズ法に基づく方法といったソフトクラスタリング手法を用いてもよい。

ＣＰＵ１１は得られたクラスタの発生頻度を算出する（ステップＳ７３）。ＣＰＵ１１は処理結果、クラスタＩＤ、クラスタの発生頻度、特徴量（例えばクラスタ中心座標）を音クラスタＤＢ１４ｃに記憶する（ステップＳ７４）。ＣＰＵ１１は発生頻度計算処理を終了する。

発生頻度計算処理は、所定量の音データが得られる毎に実行しても良いし、時間ウィンドウ毎に特徴量が算出される毎に行っても良い。

以上のように、実施の形態１においては、乗数が１以下の累乗関数をフィルタとして採用したことにより、メルスペクトル特徴を用いた場合に生じる、細かい音量で大幅に特徴量形状が異なる問題と、ｌｏｇフィルタを用いた場合に生じる、１以下の出力で値が発散する問題は解決される。また、出力抑制処理により、少数の特徴的な箇所が抽出され、閾値による一律的な判定の場合のように、全部出力されるか、全部出力されないかの何れかのようになってしまうことを防ぐことが可能となる。すなわち、生活音の中から、最も特徴的な箇所を抽出することが可能となる。さらに、在・不在判定処理により、細かな瞬間の情報と共に、比較的長時間の傾向を示すことが可能となる。

実施の形態２
実施の形態２では、出力抑制処理をオンラインで行う。実施の形態２において、特徴音抽出装置１の構成は、実施の形態１と同様であるので、説明を省略する。特徴音抽出装置１が行う処理についても、出力抑制処理を除いて、実施の形態１と同様であるので、以下の説明おいては、主として実施の形態１と異なる部分について説明する。

図２１は出力抑制処理の手順の一例を示すフローチャートである。特徴音抽出装置１のＣＰＵ１１は、新たに入力された時間ウィンドウで区切られた音の情報、入力音情報Ｒを取得する（ステップＳ８１）。入力音情報Ｒは、音クラスタＩＤ、発生頻度スコア、タイムスタンプを含む。ＣＰＵ１１は、リングバッファの示すインデクス（index)の要素を取り出し、構造体Ｅに設定する（ステップＳ８２）。ＣＰＵ１１は、Ｅが最大値要素と同じか否かを判定する（ステップＳ８３）。最大値要素とは、発生頻度と例えば反比例するスコアが最も大きい要素としてよい。

ＣＰＵ１１はＥが最大値要素と同じと判定した場合（ステップＳ８３でＹＥＳ）、特徴音ＤＢ１４ｅにＥを記憶する（ステップＳ８４）。ＣＰＵ１１は最大値要素をクリアする、すなわち、ＮＵＬＬとする（ステップＳ８５）。ＣＰＵ１１は入力音情報Ｒをリングバッファに登録する（ステップＳ８６）。ＣＰＵ１１は、Ｅが最大値要素と同じでないと判定した場合（ステップＳ８３でＮＯ）、処理をステップＳ８６に移す。

ＣＰＵ１１は最大要素がクリアされたか、または最大値要素のスコアが、入力音情報Ｒのスコアよりも大きいか否かを判定する（ステップＳ８７）。ＣＰＵ１１は、最大要素がクリアされたか、または最大値要素のスコアが、入力音情報Ｒのスコアよりも大きい場合（ステップＳ８７でＹＥＳ）、最大値要素をＲとする（ステップＳ８８）。ＣＰＵ１１は出力抑制処理を終了する。ＣＰＵ１１は、最大値要素がＮＵＬＬでもなく、最大値要素のスコアが、入力音情報Ｒのスコア以下の場合（ステップＳ８７でＮＯ）、出力抑制処理を終了する。

提示処理では、リングバッファ記憶されているデータの中で、最大値要素と同じスコア持つものが１つであり、かつ未だに提示されていないデータに対応する音データを再生する。

図２２は出力抑制処理の具体例を示す説明図である。図２２の上段に示す波形等については、図１６と同様である。図２２の中段、下段は、リングバッファＲｉの状態を示している。図２２に示す例では、リングバッファＲｉはＲ１、Ｒ２、Ｒ３の３つのバッファからなる。上向き矢印がインデクスの位置を示す。縦に並ぶ値は各バッファに格納されている値を示している。上から順に、スコア、クラスタＩＤ、タイムスタンプの順である。図２２は、入力音情報Ｒとして、期間Ｋ３６のデータが入力された場合を示す。ＲのスコアＳは１．０、音クラスタＩＤは０１、タイムスタンプは１２：３３である。最大値要素は、スコアＳは２．０、音クラスタＩＤは０２、タイムスタンプは１２：３０である。図２２の中段に示すように、リングバッファＲｉの示すインデックスＩの要素は、最大値要素と同じであるから、最大値要素は一度クリアされ、入力音情報Ｒに基づいた値に更新されている（図２２の下段参照）。

実施の形態２では、オンライン処理を行うことにより、ほぼリアルタイムに特徴音の提示が可能となる。

実施の形態３
実施の形態３では、出力抑制処理が実施の形態１とは異なる。実施の形態３において、特徴音抽出装置１の構成は、実施の形態１と同様であるので、説明を省略する。特徴音抽出装置１が行う処理についても、出力抑制処理を除いて、実施の形態１と同様であるので、以下の説明においては、主として実施の形態１と異なる部分について説明する。

図２３は出力抑制処理の他の例を示す説明図である。図２３に示す波形等については、図１６と同様である。実施の形態３では、単純に最大スコアとなる１箇所を選択するのではなく、特徴箇所内の評価スコアの和が最大となるように選択する。図２３に示す例では、期間３つを１つのグループとして評価スコアの和を求めている。本例における音データの種別は、図２３の右側に示すように、咳払いの音、テレビの音、ファンの音の３種類である。評価スコアの値は、それぞれ２．０、１．０、０．０である。グループｇ１は、咳払いの音が１つ、テレビの音はなし、ファンの音が１つであるため、評価値の和Ｓ（Ｗ）は次のように計算される。Ｓ（Ｗ）＝２．０×１＋１．０×０＋０．０×１＝２．０

同様に計算すると、グループｇ２の評価スコアは１．０、グループｇ３の評価スコアは３．０である。したがって、グループｇ３が提示候補となる。

実施の形態３においては、複数箇所をグループ化して、グループごとに出力抑制処理を行うので、できるだけ多くの種類の音が含まれるように提示することが可能となる。

累乗フィルタ以外のフィルタの例
上述において、フィルタは累乗フィルタに限られない。次の２つの要件を満たすものであれば、フィルタとして採用可能である。１の要件は、０以上のある閾値ａ_ｂ以下で最小値Ｔを取るものである。これは、ｘが小さい時に値を発散させないためである。他の１の要件は、閾値ａ_ｂを超え範囲ではｘで微分又は劣微分した値が単調減少となることである。これは、強い音の時には、その影響を下げるためである。

図２４はフィルタの入出力の関係の一例を示すグラフである。横軸は入力、縦軸は出力で、横軸、縦軸とも無次元である。図２４Ａは１乗以下の累乗関数を示している。図２４Ｂは最小値が０でないフィルタ関数を示している。図２４Ｃはｘ＝０では最小値とはならないフィルタ関数を示している。図２４Ｄは局所的に値が大きく変動するフィルタ関数を示している。いずれのフィルタ関数も、上述の条件を満たしているため、実施の形態１から３において、累乗フィルタに替えて、図２４に示したフィルタを採用してもよい。なお、図２４に示すのはフィルタの例であり、これらに限られるものではない。

実施の形態４
上述した実施の形態１から実施の形態３の特徴音抽出装置１をプレイスサーバ（配信装置）と連携した配信システムを構成することも可能である。図２５は配信システムの構成の一例を示す説明図である。配信システムは、特徴音抽出装置１、プレイスサーバ２、端末機３、ルータ４を含む。プレイスサーバ２、端末機３は、それぞれ、汎用コンピュータ、ワークステーション、デスクトップ型ＰＣ（パーソナルコンピュータ）、ノートブック型ＰＣ、タブレットＰＣ、スマートフォン等である。特徴音抽出装置１及び端末機３はルータ４、ネットワークＮを介して、プレイスサーバ２と接続されている。ルータ４は必須の構成ではなく、特徴音抽出装置１及び端末機３は直接、ネットワークＮと接続されても良い。端末機３の台数は適宜、定めれば良い。また、図２５に示す例では、特徴音抽出装置１、端末機３、ルータ４は同一の空間ＳＰに設置されている。

プレイスサーバ２は、制御部２１、記憶部２２、通信部２３（受信部、配信部）を含む。制御部２１はＣＰＵ、ＲＡＭ、ＲＯＭ等を含み、ハードウェア各部を制御する。記憶部２２は特徴音抽出装置１や端末機３に配信するコンピュータプログラムなどを記憶する。通信部２３はネットワークＮ、ルータ４を介して、特徴音抽出装置１や端末機３と通信を行う。

プレイスサーバ２の制御部２１は通信部２３を介して、特徴音抽出装置１の在／不在判定部１４１（判定部）より人の在／不在の判定結果を受け取る。制御部２１は受け取った判定結果に基づいて、通信部２３を介して、コンピュータプログラムを特徴音抽出装置１に配信する。特徴音抽出装置１は、受信したコンピュータプログラムをさらに、端末機３に配信する。端末機３は、受信したコンピュータプログラムを実行する。それにより、端末機３は、人の在／不在に応じた動作を行う。

配信システムの一例としては、ＣＡＩ（Ｃｏｍｐｕｔｅｒ−ＡｓｓｉｓｔｅｄＩｎｓｔｒｕｃｔｉｏｎまたはＣｏｍｐｕｔｅｒ−ＡｉｄｅｄＩｎｓｔｒｕｃｔｉｏｎ）においての利用である。特徴音抽出装置１、端末機３、ルータ４が設置されている空間ＳＰを１つの教室とする。特徴音抽出装置１が、空間ＳＰに人が不在と判定した場合、端末機３には、スリープ状態を保つコンピュータプログラムを実行させ、消費電力の節約を行う。特徴音抽出装置１が、空間ＳＰに人が存在すると判定した場合、端末機３にコンピュータプログラムの配信を行い、端末機３の利用を可能とする。空間ＳＰが学校のパソコンルームの場合には、プレイスサーバ２に時間割の情報を記憶させ、時間帯に応じて、適切な教科の教育用プログラムを配信すれば良い。

実施の形態４では、人の在／不在により、端末機３の動作を変更することが可能となるので、端末機３の利用者又は管理者が動作変更の操作を行う必要がないという効果を奏する。

各実施例で記載されている技術的特徴（構成要件）はお互いに組合せ可能であり、組み合わせすることにより、新しい技術的特徴を形成することができる。
今回開示された実施の形態はすべての点で例示であって、制限的なものでは無いと考えられるべきである。本発明の範囲は、上記した意味では無く、特許請求の範囲によって示され、特許請求の範囲と均等の意味及び範囲内でのすべての変更が含まれることが意図される。

以上の実施の形態に関し、さらに以下の付記を開示する。

（付記１）
音データを所定時間毎に区切り、
区切られた期間毎に音データの周波数成分を含む特徴量を算出し、
前記期間毎に算出した音データの周波数成分を含む特徴量の１以上の成分値ｘに対して、
区間ａ_ｂ≦ｘ≦ａ_ｔ（０≦ａ_ｂ＜ａ_ｔ≦∞）において、ｘで微分又は劣微分した関数が単調減少であり、下記の式を満たす関数値の下界Ｔが存在する関数ｆ（ｘ）を作用させ、
作用させた結果に基づき、前記期間毎の特徴量を求め、
求めた期間毎の特徴量に基づいて、特徴音データを抽出する
処理をコンピュータにより実行する特徴音抽出方法。

（付記２）
前記関数ｆ（ｘ）は、下記の式で示す乗数ｐが１未満の累乗関数である
付記１に記載の特徴音抽出方法。

（付記３）
前記期間毎の特徴量をクラスタリング処理して音データの種別分けを行い、
夫々の音の種別毎の発生頻度に基づいて、特徴音データを抽出する
付記１又は２に記載の特徴音抽出方法。

（付記４）
前記発生頻度から音データの種別毎の評価指標を算出し、複数の前記期間の中で評価指標が最大となる種別の音データを特徴音データと判定し、判定した特徴音データを抽出する
付記３に記載の特徴音抽出方法。

（付記５）
前記特徴音データと判定した音データの評価指標の値が閾値よりも小さい場合は、特徴音データを抽出しない
付記４に記載の特徴音抽出方法。

（付記６）
前記発生頻度から音データの種別毎の評価指標を算出し、
前記期間を所定数含む評価区間夫々に含まれる音データの評価指標を加算し、
加算した評価指標が最大となる評価区間を特定し、
特定した評価区間に含まれる音データを特徴音データとして抽出する
付記４又は５に記載の特徴音抽出方法。

（付記７）
前記音データは、人が存在しうる空間で収集されたものであり、
所定の時間幅に対して、前記特徴音データの出現回数をカウントし、
出現回数が所定値以上であれば、前記空間に人は存在し、そうでなければ存在しないと判定する
付記４から６のいずれか１つに記載の特徴音抽出方法。

（付記８）
音データを所定時間毎に区切り、区切られた期間毎に音データの周波数成分を含む特徴量を算出する算出部と、
前記期間毎に算出した音データの周波数成分を含む特徴量の１以上の成分値ｘに対して、区間ａ_ｂ≦ｘ≦ａ_ｔ（０≦ａ_ｂ＜ａ_ｔ≦∞）において、ｘで微分又は劣微分した関数が単調減少であり、下記の式を満たす関数値の下界Ｔが存在する関数ｆ（ｘ）を作用させるフィルタ部と、
作用させた結果に基づき、前記期間毎の特徴量を算出する特徴量算出部と、
求めた期間毎の特徴量に基づいて、特徴音データを抽出する抽出部と
を備える特徴音抽出装置。

（付記９）
音データを所定時間毎に区切り、
区切られた期間毎に音データの周波数成分を含む特徴量を算出し、
前記期間毎に算出した音データの周波数成分を含む特徴量の１以上の成分値ｘに対して、
区間ａ_ｂ≦ｘ≦ａ_ｔ（０≦ａ_ｂ＜ａ_ｔ≦∞）において、ｘで微分又は劣微分した関数が単調減少であり、下記の式を満たす関数値の下界Ｔが存在する関数ｆ（ｘ）を作用させ、
作用させた結果に基づき、前記期間毎の特徴量を求め、
求めた期間毎の特徴量に基づいて、特徴音データを抽出する
処理をコンピュータに実行させるコンピュータプログラム。

（付記１０）
人が存在しうる空間で収集された音データを所定時間毎に区切り、区切られた期間毎に音データの周波数成分を含む特徴量を算出する算出部と、
前記期間毎に算出した音データの周波数成分を含む特徴量の１以上の成分値ｘに対して、区間ａ_ｂ≦ｘ≦ａ_ｔ（０≦ａ_ｂ＜ａ_ｔ≦∞）において、ｘで微分又は劣微分した関数が単調減少であり、下記の式を満たす関数値の下界Ｔが存在する関数ｆ（ｘ）を作用させるフィルタ部と、
作用させた結果に基づき、前記期間毎の特徴量を算出する特徴量算出部と、
求めた期間毎の特徴量に基づいて、特徴音データを抽出する抽出部と、
所定の時間幅に対して、抽出した特徴音データの出現回数をカウントする計数部と、
出現回数が所定以上であれば、前記空間に人が存在すると判定し、そうでなければ存在しないと判定する判定部と、
判定した結果を送信する送信部と
を有する特徴音抽出装置、及び
前記判定した結果を受信する受信部と、
受信した結果に基づいて、前記特徴音抽出装置に所定のコンピュータプログラムを配信する配信部と
を有する配信装置を
備える配信システム。

１特徴音抽出装置
１１ＣＰＵ
１２ＲＡＭ
１３ＲＯＭ
１４大容量記憶装置
１４ａ生活音ＤＢ
１４ｂ音特徴ＤＢ
１４ｃ音クラスタＤＢ
１４ｄダイジェスト表示ＤＢ
１４ｅ特徴音ＤＢ
１５入力部
１５ａマイク
１６出力部
１６ａ表示装置
１７通信部
１８読取り部
１Ｐ制御プログラム
１ａ可搬型記憶媒体
１ｂ半導体メモリ
１１０入力部
１１１生活音入力部
１２０特徴スコア計算部
１２１音特徴計算部
１２２音クラスタマッチング・スコア計算部
１３０クラスタリング部
１３１クラスタリング処理部
１３２クラスタ発生頻度計算部
１４０ダイジェスト表示生成部
１４１在／不在判定部
１５０出力抑制部
１５１特徴箇所出力抑制部
１６０提示部
１６１ＧＵＩ表示部
１６２音声提示部
２プレイスサーバ
３端末機
４ルータ
Ｎネットワーク

Claims

音データを所定時間毎に区切り、
区切られた期間毎に音データの周波数成分を含む特徴量を算出し、
前記期間毎に算出した音データの周波数成分を含む特徴量の１以上の成分値ｘに対して、
区間ａ_ｂ≦ｘ≦ａ_ｔ（０≦ａ_ｂ＜ａ_ｔ≦∞）において、ｘで微分又は劣微分した関数が単調減少であり、下記の式を満たす関数値の下界Ｔが存在する関数ｆ（ｘ）を作用させ、
作用させた結果に基づき、前記期間毎の特徴量を求め、
求めた期間毎の特徴量に基づいて、特徴音データを抽出する
処理をコンピュータにより実行する特徴音抽出方法。
前記関数ｆ（ｘ）は、下記の式で示す乗数ｐが１未満の累乗関数である
請求項１に記載の特徴音抽出方法。
音データを所定時間毎に区切り、区切られた期間毎に音データの周波数成分を含む特徴量を算出する算出部と、
前記期間毎に算出した音データの周波数成分を含む特徴量の１以上の成分値ｘに対して、区間ａ_ｂ≦ｘ≦ａ_ｔ（０≦ａ_ｂ＜ａ_ｔ≦∞）において、ｘで微分又は劣微分した関数が単調減少であり、下記の式を満たす関数値の下界Ｔが存在する関数ｆ（ｘ）を作用させるフィルタ部と、
作用させた結果に基づき、前記期間毎の特徴量を算出する特徴量算出部と、
求めた期間毎の特徴量に基づいて、特徴音データを抽出する抽出部と
を備える特徴音抽出装置。
音データを所定時間毎に区切り、
区切られた期間毎に音データの周波数成分を含む特徴量を算出し、
前記期間毎に算出した音データの周波数成分を含む特徴量の１以上の成分値ｘに対して、
区間ａ_ｂ≦ｘ≦ａ_ｔ（０≦ａ_ｂ＜ａ_ｔ≦∞）において、ｘで微分又は劣微分した関数が単調減少であり、下記の式を満たす関数値の下界Ｔが存在する関数ｆ（ｘ）を作用させ、
作用させた結果に基づき、前記期間毎の特徴量を求め、
求めた期間毎の特徴量に基づいて、特徴音データを抽出する
処理をコンピュータに実行させるコンピュータプログラム。
人が存在しうる空間で収集された音データを所定時間毎に区切り、区切られた期間毎に音データの周波数成分を含む特徴量を算出する算出部と、
前記期間毎に算出した音データの周波数成分を含む特徴量の１以上の成分値ｘに対して、区間ａ_ｂ≦ｘ≦ａ_ｔ（０≦ａ_ｂ＜ａ_ｔ≦∞）において、ｘで微分又は劣微分した関数が単調減少であり、下記の式を満たす関数値の下界Ｔが存在する関数ｆ（ｘ）を作用させるフィルタ部と、
作用させた結果に基づき、前記期間毎の特徴量を算出する特徴量算出部と、
求めた期間毎の特徴量に基づいて、特徴音データを抽出する抽出部と、
所定の時間幅に対して、抽出した特徴音データの出現回数をカウントする計数部と、
出現回数が所定以上であれば、前記空間に人が存在すると判定し、そうでなければ存在しないと判定する判定部と、
判定した結果を送信する送信部と
を有する特徴音抽出装置、及び
前記判定した結果を受信する受信部と、
受信した結果に基づいて、前記特徴音抽出装置に所定のコンピュータプログラムを配信する配信部と
を有する配信装置を
備える配信システム。