JP6766346B2

JP6766346B2 - 情報処理装置、活動状態検出プログラムおよび活動状態検出方法

Info

Publication number: JP6766346B2
Application number: JP2015234038A
Authority: JP
Inventors: 成幸小田嶋; 金岡　利知; 利知金岡; 勝司三浦; 桂樹岡林
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 2015-11-30
Filing date: 2015-11-30
Publication date: 2020-10-14
Anticipated expiration: 2035-11-30
Also published as: US20170154639A1; JP2017102612A; US10109298B2

Description

本発明は、情報処理装置、活動状態検出プログラムおよび活動状態検出方法に関する。

高齢化社会の到来に伴い、独居高齢者の安否を自動的に確認する「見守りサービス」への期待が高まっている。見守りサービスは、家庭内に取り付けたセンサの情報を用いて高齢者の様子を確認するのが一般的である。例えば、ポットに取り付けたセンサを用いた見守り（象印マホービン株式会社「みまもりホットライン」、http://http://www.mimamori.net/）や、家庭内に焦電センサを複数配置した見守り（立山科学グループ「みまもリンク」、https://www.tateyama.jp/mimamolink/outline.html）等がサービス化されている。

しかし、これらの見守り技術のうち、単一のセンサによるもの（例：ポットセンサ）は見守りの検出範囲が狭く、また複数のセンサを用いるものはセンサの設置コストが高いという問題がある。

そこで、ここでは、少ないセンサで広いカバー範囲を実現することのできる、「音情報」を用いた見守り技術について取り扱う。音情報を用いた異常等の検出の技術がいくつか知られている（例えば、特許文献１―６等を参照）。

見守りシステムでは、見守られるユーザ（被見守りユーザ）の「活動状態」と「非活動状態」の判定を行う。具体的には、「活動状態」は、図１の左側に示すように、被見守りユーザが在室し、かつ起床して活動を行っている場合である。人間の行動で出る音から「活動状態」であると認識することができる。「非活動状態」は、図１の右側に示すように、被見守りユーザが不在であるか、在室していても就寝中であるとか静かにしていて音を立てない状態であることを指す。機械（洗濯機、ファン）等の出す音から「非活動状態」であると認識することができる。

これらの「活動状態」「非活動状態」の認識は、例えば被見守りユーザが倒れていることの検出や、夜間の徘徊の検出等、見守りサービスの実現に有用な情報を提供する。なお、部屋の外の音、例えば雨音や自動車の音が鳴っていたとしても、部屋の中で人間が活動していなければ「非活動」として検出するのが好ましい。

特開２０１１−２３７８６５号公報特開２００４−１０１２１６号公報特開２０１３−２２５２４８号公報特開２０００−２７５０９６号公報特開２０１５−１０８９９０号公報特開平８−３２９３７３号公報

上述したように、「活動状態」「非活動状態」の認識は見守りサービスの基本的な情報となるが、人の活動に起因する音と外部の音とを区別できない場合があり、判定精度の向上が求められていた。

そこで、一側面では、人が存在しうる空間での人の活動状態の判定精度を向上することを目的とする。

一つの形態では、情報処理装置が、人が存在しうる空間で収集された第１音を取得する取得手段と、前記第１音を所定の時間幅に分割した各音データの特徴量をそれぞれ抽出する抽出手段と、生活音を所定の時間幅に分割した各音データに対する特徴量がクラスタリングされた結果が記憶された記憶部を参照して、抽出された前記第１音の各音データの特徴量に対応するクラスタをそれぞれ特定する特定手段と、前記第１音の各音データに対応するクラスタの種類数が所定値以上であれば、前記空間で人の活動が行われ、そうでなければ人の活動が行われていないと判定する判定手段と、を有する。

人が存在しうる空間での人の活動状態の判定精度を向上することができる。

活動状態および非活動状態の認識の例を示す図である。情報処理装置のハードウェア構成例を示す図である。情報処理装置のソフトウェア構成例を示す図である。音特徴ＤＢおよび音クラスタＤＢのデータ構造例を示す図である。学習時の処理例を示すフローチャートである。認識時の処理例を示すフローチャートである。認識時の処理例を示す図である。「音の多様性」の指標の計算の処理例を示すフローチャート（その１）である。ヒストグラム上のクラスタの出現と指標の関係の例を示す図（その１）である。「音の多様性」の指標の計算の処理例を示すフローチャート（その２）である。ヒストグラム上のクラスタの出現と指標の関係の例を示す図（その２）である。活動状態の判定の例を示す図である。

以下、本発明の好適な実施形態につき説明する。

＜活動状態、非活動状態の検出＞
生活音を用い、頑健な活動状態検出を行う方式として、「人間の活動に特有の音」は長時間にわたって生活音を取り続けると僅かであることを利用するものがある。例えば、冷蔵庫のファン音等の人間の活動に関係ない音（背景音）は常時鳴り続ける一方、人間の会話音、食器音等の人間の活動に関係する音（活動音）は、常時鳴り続けるわけではないため、各々の音ごとの頻度を取れば、背景音の頻度は高く、活動音の頻度は低くなることが想定される。そこで、学習データ中での頻度が低い活動音が多数検出された場合に活動状態と検出することができる。

「音の種類」はクラスタリング処理によって自動的に抽出することができるため、予め家庭環境で長時間の生活音を蓄積し、クラスタリング処理を行った上でクラスタ毎の頻度を算出して学習処理を行う。認識時には入力音をクラスタとの対応付けを行って活動音か否かを判定することで、「音の種類」の定義付けなしに活動音の抽出が可能である。一般的に用いられる「特定音を検出したら活動と見なす」アプローチ（例えば、「咳払いの音」が検出されたら「活動」として検出する）では、各家庭環境の差に頑健になるために細かな網羅的な定義付（例えば「金属のドア」「木のドア」等）が必要となる。また、その細かな定義付に対応する大量の音データが必要になるため、事実上は環境の差異に頑健とすることは困難である。前述した頻度に基づいて活動音を背景音から区別する方式では、音の種類の定義付を回避できるため、環境の差に頑健としやすいという利点がある。なお、活動検出時のロバスト性（頑健性）を高めるため、一定時間の時間幅（例えば１０分間）での活動音検出数をカウントし、活動音検出数が一定以上の場合に「活動」と検出する。

しかし、上述した方式では、例えば雨音のように、普段は頻度が低いが、活動に関係なく低頻度の音が多数出る場合があり、その場合に活動状態であると誤検出してしまう問題がある。例えば、人が不在の時間帯と雨の時間帯が重なった場合、活動状態であると誤検出してしまい、状態を正確に検出できなくなる。雨の時間帯を活動状態であると誤検出しないようにする方針として、単純には「雨音」を多く含むような学習データを与え、頻度を再計算する方法も考えられる。しかし、背景音として扱うべき「雨音」は活動音として扱うべき音に類似した「水道音」があるため（両者は同じ「水音」である）、「雨音」を背景音として頑健に認識することは難しい。従って、学習データの変更による解決は困難である。

そこで、上述した問題を回避するため、音情報を用いて生活者の活動状態を判定するシステムにおいて、一定時間内に観測された音の多様性を指標として活動状態を判定する手法を開示する。これは、例えば活動と見なすべき「皿洗い」時は、水音（水道音）以外にも食器音や蛇口音などの多種の音がする可能性が高い一方、背景音と見なすべき「雨」の時は、人が活動していなければ水音（雨音）しかしないことが期待される。そのため、活動音と背景音（非活動音）を見分ける基準として、多種の音がしているか否かが重要な手がかりとなることが期待されるからである。

より具体的には、生活音を用いてユーザの活動状態を認識するシステムにおいて、一定時間内の音の多様性に基づき、活動状態を判定する。実施例としては、音の多様性として、一定時間ウィンドウ内のクラスタの種類数を用いることが可能である。この方式により、天候等で雨音のような低頻度の音が一時的に多数出る場合において「活動状態」と誤検出することを防止することができる。更に、音の多様性として、正規化されたヒストグラムのｐ次ノルム（０＜ｐ＜１）を用いることにより、頑健性を増した活動検出手法を提供する。詳細については、以下に説明する。

＜構成＞
図２は活動状態検出装置を構成する情報処理装置１のハードウェア構成例を示す図である。図２において、情報処理装置１は、汎用コンピュータ、ワークステーション、デスクトップ型ＰＣ（パーソナルコンピュータ）、ノートブック型ＰＣ等である。情報処理装置１は、ＣＰＵ（Central Processing Unit）１１、ＲＡＭ（Random Access Memory）１２、ＲＯＭ（Read Only Memory）１３、大容量記憶装置１４、入力部１５、出力部１６、通信部（送信部）１７、読取部１８を含む。各構成要素はバスで接続されている。

ＣＰＵ１１はＲＯＭ１３に記憶された制御プログラム１Ｐに従いハードウェア各部を制御する。ＲＡＭ１２は例えばＳＲＡＭ（Static RAM）、ＤＲＡＭ（Dynamic RAM）、フラッシュメモリ等である。ＲＡＭ１２はＣＰＵ１１によるプログラムの実行時に使用するデータを一時的に記憶する。

大容量記憶装置１４は、例えばＨＤＤ（Hard Disk Drive）、ＳＳＤ（Solid State Drive）等である。大容量記憶装置１４には、後述する各種データベースが記憶される。また、制御プログラム１Ｐを大容量記憶装置１４に記憶するようにしておいてもよい。

入力部１５は情報処理装置１にデータを入力するためのキーボート、マウス等を含む。また、生活音を収集する例えばマイク１５ａが接続され、マイク１５ａから収集された生活音は電気信号となり、入力部１５に入力される。なお、本明細書において、「音」とは、空気中の振動をマイクで取得する狭義の「音」に限らず、例えば空気中、物質中、液体中を伝搬する「振動」を、例えばマイクやピエゾ素子、レーザ微小変位計といった測定装置で計測した場合も含む広義の概念である。

出力部１６は情報処理装置１の画像出力を表示装置１６ａに、音声出力をスピーカ等に行うためのものである。

通信部１７はネットワークを介して、他のコンピュータと通信を行う。読取部１８はＣＤ（Compact Disk）−ＲＯＭ、ＤＶＤ（Digital Versatile Disc）−ＲＯＭを含む可搬型記憶媒体１Ｍを読み取る。ＣＰＵ１１が読取部１８を介して、制御プログラム１Ｐを可搬型記憶媒体１Ｍより読み取り、大容量記憶装置１４に記憶してもよい。また、ネットワークを介して他のコンピュータからＣＰＵ１１が制御プログラム１Ｐをダウンロードし、大容量記憶装置１４に記憶してもよい。さらにまた、半導体メモリから、ＣＰＵ１１が制御プログラム１Ｐを読み込んでもよい。

図３は情報処理装置１のソフトウェア構成例を示す図である。図３において、情報処理装置１は、入力部１０１と特徴算出部１０３と音特徴ＤＢ１０５と学習部１０６と音クラスタＤＢ１０９と活動判定部１１０と出力部１１５とを備えている。入力部１０１は、生活音入力部１０２を含んでいる。特徴算出部１０３は、音特徴計算部１０４を含んでいる。学習部１０６は、クラスタリング処理部１０７とクラスタ発生頻度計算部１０８とを含んでいる。活動判定部１１０は、音クラスタマッチング部１１１とヒストグラム計算部１１２と多様性指標計算部１１３と活動／非活動判定部１１４とを含んでいる。出力部１１５は、活動状態出力部１１６を含んでいる。

入力部１０１の生活音入力部１０２は、マイク１５ａから収集された音をデータ（音データ）として取得する。また、生活音入力部１０２は、音データを特徴算出部１０３に渡す。

特徴算出部１０３の音特徴計算部１０４は、音声データを時間ウィンドウにより区切り、区切られた時間毎の音響特徴を示す特徴量を算出する。算出した特徴量は音特徴ＤＢ１０５に記憶する。

図４（ａ）は音特徴ＤＢ１０５のデータ構造例を示している。音特徴ＤＢ１０５は、タイムスタンプと特徴量の各列を含む。タイムスタンプには、音データのタイムスタンプを記憶する。特徴量には、音データの特徴量の値を記憶する。音データの特徴量としては、次のような値、すなわち、
・音波形そのもの
・音波形をフィルタにかけたもの（例えば、Deep Learningのモデルに入力）
・音の周波数スペクトル（音波形にＦＦＴをかけたもの）
・メルスペクトル特徴量（スペクトル）
・ＭＦＣＣ特徴量（ケプストラム）
・ＰＬＰ特徴量（ケプストラム）
・ゼロクロッシングレート（音波形がゼロ点を交差した回数）
・音量（平均、最大値、実効値等）
等を用いることができる。

図３に戻り、学習部１０６のクラスタリング処理部１０７は、所定期間毎、音特徴ＤＢ１０５が更新される毎などのタイミングで、音特徴ＤＢ１０５が記憶している特徴量をクラスタリングする。クラスタ発生頻度計算部１０８は、各クラスタの発生頻度を計算し、音クラスタＤＢ１０９に記憶する。なお、各クラスタの発生頻度は、活動音と背景音とを区別するために用いることができるが、後続の処理において活動音と背景音とを区別する必要がない場合は、計算を省略することができる。

図４（ｂ）は音クラスタＤＢ１０９のデータ構造例を示している。音クラスタＤＢ１０９は、クラスタＩＤ、特徴量、発生頻度の各列を含む。クラスタＩＤは各クラスタを特定するＩＤを記憶する。特徴量は各クラスタの特徴量、すなわち、各クラスタの中心座標やクラスタに含まれるデータの中央値などのクラスタの代表値を記憶する。発生頻度は各クラスタの発生頻度を記憶する。発生頻度の計算を省略する場合は、発生頻度の項目はなくなる。

図３に戻り、活動判定部１１０の音クラスタマッチング部１１１は、認識時において音特徴計算部１０４より受け取った特徴量と音クラスタＤＢ１０９に記憶してある各クラスタの特徴量とのマッチングを行い、処理対象となっている音が所属すべきクラスタを決定し、クラスタのＩＤを出力する。

ヒストグラム計算部１１２は、所定時間内において出現するクラスタのＩＤ毎に出現回数を計数する。多様性指標計算部１１３は、ヒストグラム計算部１１２により計数されたクラスタのＩＤ毎の出現回数から、音の多様性の指標を計算する。音の多様性の指標の詳細は後述する。活動／非活動判定部１１４は、多様性指標計算部１１３により計算された音の多様性の指標の値から、活動状態であるか非活動状態であるかを判定する。

出力部１１５の活動状態出力部１１６は、活動判定部１１０の多様性指標計算部１１３により判定された「活動状態」「非活動状態」を外部に出力する。例えば、ネットワーク２を介して予め登録されたアドレスの端末装置３（スマートフォン、ＰＣ等）に「活動状態」であるか「非活動状態」であるかを通知する。

なお、図３では、情報処理装置１として、いわゆるスタンドアロンの構成について説明したが、機能の一部をクラウド構成（ネットワーク上のサーバによる処理を利用する構成）とすることができる。入力部１０１は物理的に設置されるマイク１５ａとの結びつきが強いため、特徴算出部１０３以降の任意の部分をクラウド側の処理に委ねることができる。

＜動作＞
図５は学習時の処理例を示すフローチャートである。図５において、特徴算出部１０３の音特徴計算部１０４は、入力部１０１の生活音入力部１０２からリアルタイムに出力される音データまたは予め蓄積された音データを入力する。そして、音特徴計算部１０４は、音データを一定時間区切りの時間窓に分割し、音響特徴を抽出し、特徴量を音特徴ＤＢ１０５に記憶する（ステップＳ１１）。

次いで、学習部１０６のクラスタリング処理部１０７は、音特徴ＤＢ１０５に記憶された特徴量に基づき、クラスタリング処理を行い、似通った音響特徴のクラスタを抽出する（ステップＳ１２）。

次いで、クラスタ発生頻度計算部１０８は、クラスタ毎の発生頻度を計算する（ステップＳ１３）。抽出したクラスタおよび発生頻度は音クラスタＤＢ１０９に記憶する。

図６は認識時の処理例を示すフローチャートである。図６において、特徴算出部１０３の音特徴計算部１０４は、入力部１０１の生活音入力部１０２からリアルタイムに出力される音データと学習済のクラスタ（音クラスタＤＢ１０９）を入力する。そして、音特徴計算部１０４は、音データを一定時間区切りの時間窓に分割し、音響特徴を抽出し、特徴量を活動判定部１１０に渡す（ステップＳ２１）。図７（ａ）は、音データから特徴量を抽出する様子を示している。

次いで、図６に戻り、活動判定部１１０の音クラスタマッチング部１１１は、特徴算出部１０３から渡された特徴量の示す音響特徴に基づいて音クラスタＤＢ１０９に記憶されたクラスタと対応付け（マッチング）を行い、最近傍のクラスタを抽出する（ステップＳ２２）。図７（ｂ）は、特徴量をクラスタにマッチングする様子を示している。

次いで、図６に戻り、ヒストグラム計算部１１２は、一定時間幅で、割り当てられた最近傍クラスタのヒストグラムを計算する（ステップＳ２３）。図７（ｃ）は、クラスタごとの頻度を示すヒストグラムの例を示している。

次いで、図６に戻り、多様性指標計算部１１３は、ヒストグラムに基づいて「音の多様性」の指標を計算する（ステップＳ２４）。なお、ヒストグラムには、活動音に基づくクラスタの出現と背景音に基づくクラスタの出現とが含まれ、両者を区別なく「音の多様性」の指標を計算してもよいし、活動音に基づくクラスタの出現のみに基づいて「音の多様性」の指標を計算してもよい。活動音と背景音を区別するには、クラスタ発生頻度計算部１０８により計算された各クラスタの発生頻度を用いることができる。「音の多様性」の指標の計算の詳細については後述する。

次いで、活動／非活動判定部１１４は、ヒストグラムから計算された「音の多様性」の指標が所定の閾値以上であるか否か判断し（ステップＳ２５）、閾値以上であると判断した場合（ステップＳ２５のＹｅｓ）は「活動状態」と判断し（ステップＳ２６）、閾値以上でないと判定した場合（ステップＳ２５のＮｏ）は「非活動状態」と判定する（ステップＳ２７）。

［音の多様性の指標の計算例（その１）］
図８は「音の多様性」の指標の計算の処理例を示すフローチャートであり、音の多様性の指標として、一定時間ウィンドウ内のクラスタの種類数（一定時間内の時間ウィンドウ内に１回以上出現したクラスタの数）を求めるようにしたものである。

図８において、多様性指標計算部１１３は、ヒストグラム計算部１１２が計算したヒストグラムを入力とし（ステップＳ３１）、変数Resultに「０」を設定する（ステップＳ３２）。

次いで、多様性指標計算部１１３は、ヒストグラムのビンのうちの一つの値を取り出し（ステップＳ３３）、ビンの値が０より大きいか否か判断する（ステップＳ３４）。

多様性指標計算部１１３は、ビンの値が０より大きいと判断した場合（ステップＳ３４のＹｅｓ）は、変数Resultをインクリメント（１加算）する（ステップＳ３５）。

多様性指標計算部１１３は、ビンの値が０より大きくないと判断した場合（ステップＳ３４のＮｏ）および変数Resultのインクリメント（ステップＳ３５）の後、ヒストグラムの全てのビンを取り出したか否か判断し（ステップＳ３６）、取り出していない場合はヒストグラムのビンのうちの一つの値の取り出し（ステップＳ３３）から処理を繰り返す。多様性指標計算部１１３は、ヒストグラムの全てのビンを取り出した場合、変数Resultを音の多様性の指標として出力する（ステップＳ３７）。

［音の多様性の指標の計算例（その２）］
上述した一定時間ウィンドウ内のクラスタの種類数を音の多様性の指標とする場合、入力される音データにノイズが含まれる場合に脆弱な面がある。図９は、ヒストグラムから出現したクラスタ数を計算した例を示している。図９（ａ）は１クラスタに集中して出現している場合（出現したクラスタ数：１）、図９（ｃ）は４クラスタに等分散に出現している場合（出現したクラスタ数：４）であり、それぞれの出現したクラスタ数は大きく異なる値となっている。

しかし、図９（ｂ）は殆どが１つのクラスタに集中して出現した一方、他クラスタにもごく少数出現した場合となり、直感的には図９（ａ）と図９（ｃ）の中間程度の値となるはずであるが、出現クラスタ数は「４」となり、図９（ｃ）のクラスタが等分散した場合と同じになる。従って、この計算方法では「特定のクラスタに集中したが、他のクラスタもごく少数出た場合」と「全てのクラスタが等しく出現した場合」を見分けることができず、突発的にノイズ音がした場合の影響を強く受けることとなる。

そこで、この問題に対応するため、音の多様性の指標として、クラスタのヒストグラムの次数が１未満のｐ次ノルムを用いる方式を開示する。ｐ次ノルムは、
||ｘ||_ｐ=|ｘ_１|^ｐ＋|ｘ_２|^ｐ＋・・・＋|ｘ_ｎ|^ｐ
で計算される。ただし、ｘ_ｉは、ヒストグラムのｉ番目のビンの値である。

ｐ次ノルムは、非ゼロの成分の個数を大きく反映する一方、各成分の大きさも反映した値を出力するため、「特定のクラスタに集中したが、他のクラスタもごく少数出た場合」と「全てのクラスタが等しく出現した場合」では異なる値を出力することが可能となる。

図１０はｐ次ノルムによる「音の多様性」の指標の計算の処理例を示すフローチャートである。図１０において、多様性指標計算部１１３は、ヒストグラム計算部１１２が計算したヒストグラムを入力とし（ステップＳ４１）、変数Resultに「０」を設定する（ステップＳ４２）。

次いで、多様性指標計算部１１３は、ヒストグラムのビンのうちの一つの値を取り出し（ステップＳ４３）、変数Resultにビンの値をｐ乗したものを加える（ステップＳ４４）。

次いで、多様性指標計算部１１３は、ヒストグラムの全てのビンを取り出したか否か判断し（ステップＳ４５）、取り出していない場合はヒストグラムのビンのうちの一つの値の取り出し（ステップＳ４３）から処理を繰り返す。多様性指標計算部１１３は、ヒストグラムの全てのビンを取り出した場合、変数Resultを音の多様性の指標として出力する（ステップＳ４６）。

図１１はヒストグラム上のクラスタの出現と指標の関係の例を示す図であり、p=0.1としている。ヒストグラムは図９のクラスタ出現数の場合と同じとしており、図９では（ｂ）と（ｃ）で同じ値が出力されていたが、図１１のｐ次ノルムでは（ｂ）と（ｃ）で異なる値が出力されており、ノイズ頑健性が増していることがわかる。

［活動状態の判定の例］
図１２は活動状態の判定の例を示す図であり、横右方向に時間が経過するものとし、（ａ）に示すように、被見守りユーザが睡眠→不在→睡眠という状態にあり、不在の前半において雨が降ったとする。

図１２（ｂ）はｐ次ノルムによる音の多様性の指標の変化を示しており、所定の閾値を超えた時点（起床、帰宅、入室、トイレ、起床）で活動状態が検出されている。なお、出現したクラスタの種類数を用いた場合についても、ノイズ音による影響が若干加わるが、指標の変化は同様となる。

図１２（ｃ）は、比較のために、頻度から活動音と認識された特徴音の所定時間内の個数の変化を示しており、帰宅、入出といった活動状態は正確に認識されているが、雨の時間帯において雨音を活動音と認識したため、活動指標が高くなってしまっている。そのため、不在時にもかかわらず活動状態と誤検出される可能性が高い。この点、図１２（ｂ）では、雨の時間帯における指標は低い値に保たれ、帰宅／入室などの活動を検出すべき箇所では指標が高くなっており、活動を頑健に検出できていることがわかる。

＜総括＞
以上説明したように、本実施形態によれば、人が存在しうる空間での人の活動状態の判定精度を向上することができる。

以上、好適な実施の形態により説明した。ここでは特定の具体例を示して説明したが、特許請求の範囲に定義された広範な趣旨および範囲から逸脱することなく、これら具体例に様々な修正および変更を加えることができることは明らかである。すなわち、具体例の詳細および添付の図面により限定されるものと解釈してはならない。

以上の説明に関し、更に以下の項を開示する。
（付記１）
人が存在しうる空間で収集された音を取得する取得手段と、
所定の時間幅に対する前記音の特徴量を抽出する抽出手段と、
抽出された前記特徴量の成分を基に、特徴量ごとに特徴量の成分と識別子とが対応付けられた記憶部を参照して、抽出された前記特徴量に対応する識別子を特定する特定手段と、
複数の前記特徴量での前記識別子の出現パターンを計数すると共に、該出現パターンの種類の数を計数する計数手段と、
前記種類の数が所定値以上であれば、前記空間で人の活動が行われ、そうでなければ人の活動が行われていないと判定する判定手段と、
を有することを特徴とする情報処理装置。
（付記２）
人が存在しうる空間で収集された音を取得する取得手段と、
所定の時間幅に対する前記音の特徴量を抽出する抽出手段と、
抽出された前記特徴量の成分を基に、特徴量ごとに特徴量の成分と識別子とが対応付けられた記憶部を参照して、抽出された前記特徴量に対応する識別子を特定する特定手段と、
複数の前記特徴量での前記識別子の出現パターンを計数すると共に、該出現パターンごとの数のｐ次ノルムの値を計算する計算手段と、
前記ｐ次ノルムの値が所定値以上であれば、前記空間で人の活動が行われ、そうでなければ人の活動が行われていないと判定する判定手段と、
を有することを特徴とする情報処理装置。
（付記３）
前記判定手段の判定結果を所定の端末装置に通知する通知手段
を有することを特徴とする付記１または２に記載の情報処理装置。
（付記４）
人が存在しうる空間で収集された音を取得し、
所定の時間幅に対する前記音の特徴量を抽出し、
抽出された前記特徴量の成分を基に、特徴量ごとに特徴量の成分と識別子とが対応付けられた記憶部を参照して、抽出された前記特徴量に対応する識別子を特定し、
複数の前記特徴量での前記識別子の出現パターンを計数すると共に、該出現パターンの種類の数を計数し、
前記種類の数が所定値以上であれば、前記空間で人の活動が行われ、そうでなければ人の活動が行われていないと判定する、
処理をコンピュータに実行させることを特徴とする活動状態検出プログラム。
（付記５）
人が存在しうる空間で収集された音を取得し、
所定の時間幅に対する前記音の特徴量を抽出し、
抽出された前記特徴量の成分を基に、特徴量ごとに特徴量の成分と識別子とが対応付けられた記憶部を参照して、抽出された前記特徴量に対応する識別子を特定し、
複数の前記特徴量での前記識別子の出現パターンを計数すると共に、該出現パターンごとの数のｐ次ノルムの値を計算し、
前記ｐ次ノルムの値が所定値以上であれば、前記空間で人の活動が行われ、そうでなければ人の活動が行われていないと判定する、
処理をコンピュータに実行させることを特徴とする活動状態検出プログラム。
（付記６）
前記判定する処理の判定結果を所定の端末装置に通知する、
処理をコンピュータに実行させることを特徴とする付記４または５に記載の活動状態検出プログラム。
（付記７）
人が存在しうる空間で収集された音を取得し、
所定の時間幅に対する前記音の特徴量を抽出し、
抽出された前記特徴量の成分を基に、特徴量ごとに特徴量の成分と識別子とが対応付けられた記憶部を参照して、抽出された前記特徴量に対応する識別子を特定し、
複数の前記特徴量での前記識別子の出現パターンを計数すると共に、該出現パターンの種類の数を計数し、
前記種類の数が所定値以上であれば、前記空間で人の活動が行われ、そうでなければ人の活動が行われていないと判定する、
処理をコンピュータが実行することを特徴とする活動状態検出方法。
（付記８）
人が存在しうる空間で収集された音を取得し、
所定の時間幅に対する前記音の特徴量を抽出し、
抽出された前記特徴量の成分を基に、特徴量ごとに特徴量の成分と識別子とが対応付けられた記憶部を参照して、抽出された前記特徴量に対応する識別子を特定し、
複数の前記特徴量での前記識別子の出現パターンを計数すると共に、該出現パターンごとの数のｐ次ノルムの値を計算し、
前記ｐ次ノルムの値が所定値以上であれば、前記空間で人の活動が行われ、そうでなければ人の活動が行われていないと判定する、
処理をコンピュータが実行することを特徴とする活動状態検出方法。
（付記９）
前記判定する処理の判定結果を所定の端末装置に通知する、
処理をコンピュータが実行することを特徴とする付記７または８に記載の活動状態検出方法。

生活音入力部１０２は「取得手段」の一例である。音特徴計算部１０４は「抽出手段」の一例である。音クラスタマッチング部１１１は「特定手段」の一例である。ヒストグラム計算部１１２および多様性指標計算部１１３は「計数手段」の一例である。活動／非活動判定部１１４は「判定手段」の一例である。活動状態出力部１１６は「通知手段」の一例である。

１情報処理装置
１１ＣＰＵ
１２ＲＡＭ
１３ＲＯＭ
１４大容量記憶装置
１５入力部
１５ａマイク
１６出力部
１６ａ表示装置
１７通信部
１８読取部
１Ｐ制御プログラム
１Ｍ可搬型記憶媒体
１０１入力部
１０２生活音入力部
１０４音特徴計算部
１０５音特徴ＤＢ
１０６学習部
１０７クラスタリング処理部
１０８クラスタ発生頻度計算部
１０９音クラスタＤＢ
１１０活動判定部
１１１音クラスタマッチング部
１１２ヒストグラム計算部
１１３多様性指標計算部
１１４活動／非活動判定部
１１５出力部
１１６活動状態出力部
２ネットワーク
３端末装置

Claims

人が存在しうる空間で収集された第１音を取得する取得手段と、
前記第１音を所定の時間幅に分割した各音データの特徴量をそれぞれ抽出する抽出手段と、
生活音を所定の時間幅に分割した各音データに対する特徴量がクラスタリングされた結果が記憶された記憶部を参照して、抽出された前記第１音の各音データの特徴量に対応するクラスタをそれぞれ特定する特定手段と、
前記第１音の各音データに対応するクラスタの種類数が所定値以上であれば、前記空間で人の活動が行われ、そうでなければ人の活動が行われていないと判定する判定手段と、
を有することを特徴とする情報処理装置。
人が存在しうる空間で収集された第１音を取得する取得手段と、
前記第１音を所定の時間幅に分割した各音データの特徴量をそれぞれ抽出する抽出手段と、
生活音を所定の時間幅に分割した各音データに対する特徴量がクラスタリングされた結果が記憶された記憶部を参照して、抽出された前記第１音の各音データの特徴量に対応するクラスタをそれぞれ特定する特定手段と、
前記特定手段により特定された各クラスタの出現数をそれぞれ所定数乗した値の合計値が所定値以上であれば、前記空間で人の活動が行われ、そうでなければ人の活動が行われていないと判定する判定手段と、
を有することを特徴とする情報処理装置。
前記判定手段の判定結果を所定の端末装置に通知する通知手段
を有することを特徴とする請求項１または２に記載の情報処理装置。
人が存在しうる空間で収集された第１音を取得する取得し、
前記第１音を所定の時間幅に分割した各音データの特徴量をそれぞれ抽出し、
生活音を所定の時間幅に分割した各音データに対する特徴量がクラスタリングされた結果が記憶された記憶部を参照して、抽出された前記第１音の各音データの特徴量に対応するクラスタをそれぞれ特定し、
前記第１音の各音データに対応するクラスタの種類数が所定値以上であれば、前記空間で人の活動が行われ、そうでなければ人の活動が行われていないと判定する、
処理をコンピュータに実行させることを特徴とする活動状態検出プログラム。
人が存在しうる空間で収集された第１音を取得し、
前記第１音を所定の時間幅に分割した各音データの特徴量をそれぞれ抽出し、
生活音を所定の時間幅に分割した各音データに対する特徴量がクラスタリングされた結果が記憶された記憶部を参照して、抽出された前記第１音の各音データの特徴量に対応するクラスタをそれぞれ特定し、
特定した各クラスタの出現数をそれぞれ所定数乗した値の合計値が所定値以上であれば、前記空間で人の活動が行われ、そうでなければ人の活動が行われていないと判定する、
処理をコンピュータに実行させることを特徴とする活動状態検出プログラム。
人が存在しうる空間で収集された第１音を取得する取得し、
前記第１音を所定の時間幅に分割した各音データの特徴量をそれぞれ抽出し、
生活音を所定の時間幅に分割した各音データに対する特徴量がクラスタリングされた結果が記憶された記憶部を参照して、抽出された前記第１音の各音データの特徴量に対応するクラスタをそれぞれ特定し、
前記第１音の各音データに対応するクラスタの種類数が所定値以上であれば、前記空間で人の活動が行われ、そうでなければ人の活動が行われていないと判定する、
処理をコンピュータが実行することを特徴とする活動状態検出方法。
人が存在しうる空間で収集された第１音を取得し、
前記第１音を所定の時間幅に分割した各音データの特徴量をそれぞれ抽出し、
生活音を所定の時間幅に分割した各音データに対する特徴量がクラスタリングされた結果が記憶された記憶部を参照して、抽出された前記第１音の各音データの特徴量に対応するクラスタをそれぞれ特定し、
特定した各クラスタの出現数をそれぞれ所定数乗した値の合計値が所定値以上であれば、前記空間で人の活動が行われ、そうでなければ人の活動が行われていないと判定する、
処理をコンピュータが実行することを特徴とする活動状態検出方法。