JP2018528453A

JP2018528453A - データベースを生成するための方法および装置

Info

Publication number: JP2018528453A
Application number: JP2017568346A
Authority: JP
Inventors: トーマス・シュポラー; トビアス・クラウス; リーベトゥラウ・ユディス; サラ・ケップリンガー; ディトマー・ケップリンガー
Original assignee: フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン
Priority date: 2015-06-30
Filing date: 2016-06-30
Publication date: 2018-09-27
Anticipated expiration: 2036-06-30
Also published as: CN108028047B; EP3317878A1; EP3317878B1; US20180122398A1; WO2017001607A1; CA2990891A1; WO2017001611A1; CA2990888A1; US11880407B2; EP3317879A1; KR20180022967A; CN108028048A; KR102087832B1; EP3317879B1; JP6602406B2; US20180121540A1; US11003709B2; CN108028047A; CN108028048B; KR102137537B1

Abstract

【解決手段】
本発明の実施形態は、データベースを生成するための方法を提供する。この方法は、典型的には外乱ノイズを含み得る「環境ノイズを受信する」ステップと、３０もしくは６０秒のような、または好ましくは５秒超の「移動時間窓のために環境ノイズをバッファリングする」ステップを含む。別の選択肢として、この方法は、「環境ノイズに対するパラメータの組を取り出す」ステップと、「移動時間窓のためにパラメータの組をバッファリングする」ステップとを含むこともまた、考えられる。このバッファリングされた環境ノイズまたはこのバッファリングされたパラメータの組のうちの少なくとも一方は、通常、録音と呼ばれている。さらに、この方法は、「信号を取得する」ステップを含み、このステップは、環境ノイズ中の複数の信号種別（外乱ノイズおよび非外乱ノイズ）のうちの（外乱ノイズのような）ある信号種別を識別する。第３の基本的なステップは、内部メモリまたは外部メモリのようなメモリの中に「信号に応答してバッファリングされた録音を記憶する」ステップである。取得するおよび記憶するというこれらのステップは、同一の信号種別に対する複数のバッファリングされた録音を含むデータベースを構築するために、繰り返される。
【選択図】図１ａ

Description

本発明の実施形態は、複数の信号種別の録音をバッファリングしたデータベースを生成するための方法および装置に関する。

ノイズは、例えば、外乱ノイズおよび非外乱ノイズのように、信号種別に細分割される場合がある。例えば、さらに外乱の多いノイズおよびさらに外乱の少ないノイズに細分割することもまた、考えられる。

外乱ノイズを分類することは、必ずしも容易であるとは限らない。あるノイズが外乱ノイズとして知覚されるかどうかに影響を与える様々な要因が存在することを理解することが重要である。鳥のさえずりが騒しく（客観的な測定可能なパラメータは、音圧レベル）、しかもその他の環境ノイズ（客観的な測定可能なパラメータは、ダイナミクス因子）からはっきりと区別できるときにも、鳥は、主観的に外乱ノイズとして知覚されるわけではない。しかしながら、それより相当静かに通過している飛行機は、より多くの試験者によって、上述の鳥よりも、外乱ノイズとして知覚されるであろう。

ここでの結果は、すなわち、例えば現行の方法を使ってノイズ評価の予測を可能にする目的で、外乱ノイズに対して、ホテル、ホテルのウェルネスエリア、または職場のような、ある環境を試験するときに、評価をその試験者に任せる必要があることを意味する。

例えば、絶対的なラウドネスもしくは音量を基準とした、またはレベルの増加量を基準とした完全自動評価は、最初の１つのヒントとしての役割を果たすが、最終的な評価としては、十分ではない。よって、改善された方法の必要性がある。
（主な態様）

本発明の目的は、主観的な外乱ノイズのように、ノイズを分類するための概念を提供することである。

この目的は、本願の独立請求項の主題によって達成される。

本発明の実施形態は、データベースを生成するための方法を提供する。この方法は、典型的には外乱ノイズを含み得る「環境ノイズを受信する」ステップと、３０もしくは６０秒のような、または好ましくは５秒超の「移動時間窓のために環境ノイズをバッファリングする」ステップを含む。別の選択肢として、この方法は、「環境ノイズに対するパラメータの組を取り出す」ステップと、「移動時間窓のためにパラメータの組をバッファリングする」ステップとを含むこともまた、考えられる。このバッファリングされた環境ノイズまたはこのバッファリングされたパラメータの組のうちの少なくとも一方は、通常、録音と呼ばれている。さらに、この方法は、「信号を取得する」ステップを含み、このステップは、環境ノイズ中の複数の信号種別（外乱ノイズおよび非外乱ノイズ）のうちの（外乱ノイズのような）ある信号種別を識別する。第３の基本的なステップは、内部メモリまたは外部メモリのように、メモリの中に「信号に応答してバッファリングされた録音を記憶する」ステップである。取得するおよび記憶するというこれらのステップは、同一の信号種別に対する複数のバッファリングされた録音を含むデータベースを構築するために、繰り返される。

本発明の実施形態は、以下の知見に基づいており、その知見とは、環境の中の適切な場所を連続的に録音し記憶する装置を使って、その録音の音響フィンガープリントまたは心理音響パラメータのような、録音または特性が記憶され、その結果、後になってそのような音響シーケンスを認識することが可能となるデータベースを構築することができるということである。ここでの概念は、「主観的な外乱ノイズまたはある種別のノイズを認識する」ステップが、ボタンもしくはキーまたは様々な入力インターフェースを使用して、その外乱ノイズまたは信号種別を典型的に識別しまたは採点する人間によって実行されることを前提としている。この信号は、シーケンスを切り出しまたは現在連続的に動作しているシーケンスからその特性を抽出し、構築されるべきデータベースのメモリの中に同一の特性を記憶するためのインジケータとして使用される。このため、一義的にサウンド表現パラメータを関連付けるための外乱ノイズまたは選別機のライブラリを簡単に構築することができ、このことにより主観的なノイズの知覚を後になって予測することが可能になる。

いくつかの実施形態によれば、その主観的な外乱ノイズは、オーディオフィンガープリントのような、音量、ダイナミクス、エクステント、ダイナミクスの拡大、周波数スペクトル、モノトニ、もしくは繰り返し特性のような個別のパラメータを含むパラメータによって、またはシャープネス、ラフネス、トーナリティ、変動強度、または音量のような、心理音響パラメータによって、表現されることができる。このため、さらなる実施形態によれば、この方法は、バッファリングされた録音に対するオーディオフィンガープリントを判定するステップ、または心理音響パラメータを判定するステップを含む。通常、その録音またはそのオーディオフィンガープリントがデータベースに記憶されることは、それで十分事足りることであるが、これに対して心理音響パラメータは、追加情報を表す。その録音を記憶することが匿名にされた方法で行われることは、オーディオフィンガープリントの利点である。

ボタンのようなユーザインターフェースから信号を取得する個別のステップでは、現在識別された制御ノイズを主観的に評価する、さらなる代替信号または追加信号が取得されてもよい。この主観的な評価により、そのオーディオ信号を（少ない外乱または多い外乱のような）信号種別に割り当てている。次いで、この主観的な評価は、それぞれの部分またはパラメータと組み合わせて記憶される。

さらなる実施形態によれば、タイムスタンプが、その部分またはパラメータに加えて記憶されることができる。なおもさらなる実施形態によれば、例えばＧＰＳ受信機からの現在の位置情報を記憶することもまた、考えられる。このデータベースをあまり大規模にしないようにするため、データ圧縮方法でバッファリングされたデータを記憶することもまた、実行可能である。

ここで、１つの実施形態によれば、そのメモリまたはデータベースは、この方法を実行するそれぞれの装置の中に直接含まれ、または別の実施形態によれば、そのメモリまたはデータベースは、外部にもまた設けられることができる。

さらなる実施形態は、対応する装置に関する。当該装置は、連続的に録音するためのマイクロフォン、バッファリングするためのバッファ、信号を受信するためのインターフェース、および識別された外乱ノイズに属する信号種別と関連する録音（オーディオファイル、オーディオフィンガープリント、または心理音響パラメータ）を記憶するためのさらなるメモリを備える。さらなる実施形態によれば、この装置は、ボタンのような、入力インターフェースを備えてもよく、この入力インターフェースを使って、主観的外乱ノイズの存在を確証することができ、または通常は、あるノイズは、ある信号種別に割り当てられることができる。この入力手段はまた、複数の信号種別のうちの１つに仕分けすることによって、すなわち評価によって拡張されてもよい。なおもさらなる実施形態によれば、この装置はまた、外部メモリ（外部データベース）を接続させる通信インターフェースを備えてもよい。

さらなる展開は、従属請求項において定義されている。
（さらなる態様）

本発明の実施形態は、（外乱ノイズおよび非外乱ノイズのような）複数の信号種別のうちの（外乱ノイズのような）ある信号種別のノイズを認識するための方法を提供する。本方法は、「環境ノイズを受信する」ステップと、「当該環境ノイズまたは当該環境ノイズから取り出されたパラメータの組のうちの少なくとも一方が、当該複数の信号種別のうちの当該信号種別を表現する所定の規則を満たすかどうかを確立する」ステップと、を含む。ここから、「当該所定の規則が満たされたことをログ記録する」ステップ、「移動時間窓のために受信された当該環境ノイズを録音する」ステップ、「当該移動時間窓のために当該環境ノイズからパラメータの組を取り出して保存する」ステップ、または「ノイズを認識するための別の装置に対して動作信号を発する」ステップが実行される。

この態様の実施形態は、以下の知見に基づいており、その知見とは、現在のノイズ環境を、データベースからのノイズ、またはデータベースから取得されたもしくはデータベースに記憶されたパラメータからのノイズ、すなわちオーディオフィンガープリントのようなノイズと比較するような、上述された方法に基づいて上述された装置という手段によって判定されることができるようなデータベースから、主観的に知覚された外乱ノイズの存在を認識することが可能である、ということである。この方法は、自動化された方式で実行されることができ、人によって実行されるどんな主観的な評価も必要とせず、蓄積されたデータベースを使用するのみで、ノイズ状況（鳥のさえずり対空気調節）の評価の予測を可能にする。

規則の一致を認識するステップは、環境ノイズと以前バッファリングされた環境ノイズとを比較することによって、または現在取り出されたパラメータデータセット（オーディオフィンガープリント）と以前判定されたパラメータデータセットとを比較することによって、または心理音響パラメータを取り出して当該心理音響パラメータに対してあらかじめ設定された閾値とを比較することによって、典型的に実行されてもよい。

別の実施形態は、複数の信号種別のうちの１つの信号種別のノイズを認識するための装置に関する。この装置は、現在の環境ノイズを連続的に聴取するためのマイクロフォン、その現在の環境ノイズと（外乱ノイズまたはその外乱ノイズを表現しているパラメータを録音している）データベースに記憶されたデータとを比較するためのプロセッサ、および外乱ノイズが現在の環境の中で識別されると直ちに情報を出力するためのインターフェースを含む。ここで、以前判定された録音等のデータ、および以前判定されたオーディオフィンガープリントまたは心理音響パラメータのために以前確立された閾値は、内部に記憶されることができるか、またはさらなる実施形態に基づいて、データベースを使って外部に読み出されることができ、例えば当該さらなる態様に基づいて、これと同じように、判定され続ける。

これらの認識されるべき客観的な外乱ノイズまたは信号種別から、当該情報は、単独でまたは時間の表示、場所の表示もしくは当該外乱ノイズの複数の種別（対応する外乱グループは、少ない外乱、外乱、多い外乱）のうちの１つへの分類を組み合わせて、さらに処理されてもよい。１つの好ましい実施形態によれば、これらの情報は、外部のデータベースに出力される。

この実施形態では、またはさらなる実施形態によれば、１つの場所またはこの１つの所在位置の評価のみが提供されるため、間隙を介してまたは屋外環境の複数の所在位置、すなわち（街全体に分布されているような）複数の近隣の所在位置等の複数の所在位置に、この評価を拡張することも考えられる。このため、１つのさらなる実施形態は、「録音する」、「比較する」、および「出力する」ステップが、２つの近隣の所在位置に対して受信される方法を提供する。２つの近隣の所在位置に対する情報がある場合、例えば、主観的に知覚された外乱ノイズの移動、空間的広がり、または方向を判定するために、第１の所在位置の録音と第２の所在位置の録音との間の関係が判定されることができる。

１つのさらなる実施形態によれば、外乱ノイズを認識することから類推すると、対応する制御信号が出力されるのに使われる制御命令と同じような、異なったシーケンスを認識することも考えられる。ここで、その制御信号に関連付けられる録音は、音声コマンドでもよく、または上述のように、外乱ノイズとして分類された音響信号でもよい。例えば、この制御信号は、例えば録音が開始されるようにそれ自体がその方法を実行する装置、またはその制御信号により録音モードに切り替えられる異なった所在位置に配置された別の装置のような、外部装置によって出力される。

さらなる実施形態によれば、上で概説された装置はまた、以前に判定された外乱ノイズもしくはパラメータを読み込むためまたは外乱ノイズに関する情報を出力するため、データベースと通信するための通信インターフェースを備えてもよい。なおもさらなる実施形態によれば、外乱ノイズが２つの近隣の所在位置に対して取得されかつ／または分析されることができるように、その装置がこの通信インターフェースを使って別の装置と通信することも可能である。

１つの下位態様の実施形態は、ある信号種別のノイズを分析する方法を提供する。この方法は、第１の所在位置および第２の所在位置における現在の環境ノイズを連続的に録音するステップを含む。ここでの次々に録音するステップとは、オーディオフィンガープリントまたは心理音響パラメータのように、環境ノイズを直接録音するステップまたは環境ノイズに属するパラメータの組から、同一の環境ノイズを取り出すステップを意味する。さらに、各録音に対して、主観的に知覚された外乱ノイズのうちの以前取得された録音、または外乱ノイズを表現するパラメータとの比較が実行され、その結果、各所在位置（第１のおよび第２の所在位置）の外乱ノイズを識別する。それら録音同士間の関係は、異なった所在位置の一方の外乱ノイズを含む当該２つの録音（第１のおよび第２の録音）から判定されることができ、その結果生じた外乱ノイズを、例えばその外乱ノイズの所在位置、拡大、または移動に対してより正確に分析することができるようになる。

この態様の実施形態は、以下の知見に基づいており、その知見とは、２つの異なった所在位置で録音した同一の外乱ノイズの２つの録音の関係を使うと、外乱ノイズ自体に関する拡張された情報を獲得することが可能となることである。ここで、まず、それぞれの環境（すなわち、第１の所在位置における、および第２の所在位置における）外乱ノイズが識別され、識別されるときに互いに関連付けられる。好都合なことに、外乱ノイズの移動に関する、または外乱ノイズの拡張に関する、または外乱ノイズの伝播方向に関する情報を取得することも、ここでは可能である。さらにまた、ローカル外乱ノイズすなわち１つの所在位置のみでの外乱ノイズと、グローバルイベントすなわち複数の所在位置で生じる外乱ノイズとを区別することも可能である。特徴的なノイズイベントおよびそれらの移動伝播を認識することは、この方法を使用することにより可能である。

いくつかの実施態様によれば、第１の録音と第２の録音との間の関係を判定するステップは、第１の録音と第２の録音との間のレベル差を分析することによって実行される。他の方法としてまたは追加の方法としては、時間オフセット、すなわち当該２つの異なった所在位置で確立された２つの録音におけるイベント同士間の待ち時間または実行時間オフセットが、その関係を判定するステップで確立されることもまた可能である。他の方法としては、その２つの録音はまた、周波数およびホール効果における差異に対しても評価されてもよい。これらすべての分析パラメータを使って、ノイズ源と録音位置との間の距離を測定することが可能であり、その理由は、音は、通常、距離が増加するに伴い減衰することや、高域周波数が削除されるような周波数シフトが存在することからである。

さらなる実施態様によれば、この方法は、第１の所在位置と第２の所在位置との間の距離に対するオーディオイベントまたはそれぞれのオーディオ源を分析するステップ、主観的外乱ノイズ源の移動に対して分析するステップ、または主観的外乱ノイズ源の数量に対して分析するステップのうちの少なくとも１つのステップを含む。これらの３つの分析は、第１の録音と第２の録音との間の関係を評価すること、すなわち例えば、上で言及された要因を比較することからその関係を評価することに基づいている。

この態様で説明されるべきことは、連続的に録音する方法は、移動時間窓を使用して実行されることが好ましいことである。さらに、上の態様と同様に、比較されるべき外部のノイズを読み込むことも考えられる。

ここで、この方法は、当然ながら、第３の所在位置に拡張されてもよい。

この態様による実施形態では、伝播する外乱信号の時間分析を可能にするために、録音は、外乱信号が第１の所在位置で判定されたときに、第２の所在位置で開始されてもよい。

１つのさらなる実施形態は、ある信号種別の複数の信号を分析するためのシステムに関する。このシステムは、現在の環境ノイズを連続的に録音するための各ユニット毎に１つのマイクロフォンを有する２つのユニットを備える。この２つのユニットは、近隣の所在位置のような異なった所在位置に配置されてもよい。ここで再び、「録音する」とは、環境ノイズを直接録音すること、およびオーディオフィンガープリントと同じようなパラメータから同一の環境ノイズを取り出すことの両方を意味する。さらに、このシステムは、少なくとも１つのプロセッサを備え、このプロセッサは、第１のユニットまたは第２のユニットの中に一体化されてもよく、また、第１のユニットおよび第２のユニットの第１の録音および第２の録音と、以前取得された少なくとも１つの録音／信号種別の信号のオーディオフィンガープリント、または信号種別の信号を表現するパラメータとを比較することによって、そのノイズを識別するように構成されることができる。さらに、このプロセッサは、第１の録音と第２の録音との間の関係を確立するように構成されている。

いくつかの実施態様によれば、この２つのユニットは、無線インターフェースのような通信インターフェースを通じて互いに接続されてもよい。

さらなる実施形態によれば、上述の方法のうちの１つを実行するためのコンピュータプログラムが提供される。

本発明の実施形態は、添付された図面を参照して以下に論述する。
基本的な変形例の態様１「データベースの構築」に基づく本方法を例示するためのフローチャートである。態様１に基づく拡張された方法を例示するためのフローチャートである。態様１の装置の変形例を示す図である。態様１の装置の変形例を示す図である。態様１の装置の変形例を示す図である。態様１の装置の変形例を示す図である。態様２の対応する基本的な変形例の方法「ある信号種別のノイズを認識する方法」を例示するためのフローチャートである。態様２の拡張された実施形態のフローチャートである。態様２の装置の略ブロック図である。態様３の基本的な変形例の方法「個別の信号種別のノイズを分析する方法」を例示するためのフローチャートである。態様３の装置の略ブロック図である。

本発明の態様の実施形態を以下により詳細に論述する前に、同じ効果の構成要素および構造体には、同じ参照番号が付与されており、その結果、それらの説明が相互に適用可能でありまたは交換可能であることを指摘しておく。

図１ａは、「マイクロフォン１１および信号受信１２０を使って受信し録音する１１０」ステップを含むデータベースを構築するための方法１００を示す。信号１２０が受信されたとき（判断場所１２５を参照）、ステップ１１０の録音は、データベースの中に記憶され、このデータベースはステップ１３０を用いて例示されている。このステップ１３０は、基本的な方法１００の終了を本質的に表している（終了点１３５を参照）。

「録音する１１０」のステップに関して指摘されておくべきことは、録音するときは、通常、符号化というサブステップが含まれることができる。符号化はまた、いわゆるオーディオフィンガープリント、すなわちその録音のための特性パラメータの取り出しが得られるように、実行されてもよい。このオーディオフィンガープリントは、ある録音と比較されるとき、高い圧縮率で圧縮されしたがって匿名化され、そのオーディオフィンガープリントは、依然として、比較可能なノイズ、すなわち同一種別のノイズをそのオーディオフィンガープリントを用いて認識することを可能にしている。一般的に、オーディオフィンガープリントは、そのオーディオフィンガープリントがオーディオ信号のすべての本質的な特徴を表すオーディオ信号の代表であり、その結果、その後の分類が可能であるように表現されてもよい。オーディオフィンガープリントは、通常、実際のオーディオ信号を形成する復号化を可能にするには十分ではなく、よってプライバシを保護する。符号化と同様にまたは並行して、心理音響パラメータのようなパラメータを取り出すサブステップが存在してもよく、この心理音響パラメータはその録音を表現する。

録音処理１１０はまた、リングバッファであるように表現されてもよく、その理由は、その録音が、通常何度も何度も上書きされるためであり、例えば１２０、６０、もしくは３０秒、または、概ね５秒超のような所定期間だけバッファリングされる。このリングバッファはまた、プライバシ要求条件が満たされるという利点をも提供する。最後の期間に対する環境ノイズのこの時間窓が記憶され、または、ステップ１３０を使って信号１２０を取得しているとき、（データベースのような）さらなるメモリの中に最終的に記憶され、その結果、この時間窓は、後になって利用可能になる。このデータベースを効率的に構築するため、方法１００を実行するステップが、１つのまたは異なった複数の信号種別を持つ複数の信号に対して繰り返される。

この方法１００は、マイクロフォン１１により受信された（すなわち、録音された）主観的外乱ノイズが識別される場所のデータベースを構築する役割を果たす。識別するステップは、ユーザがその環境において外乱ノイズを認識した際に、ボタン１２（または一般的にはユーザ入力インターフェース１２）を使って「信号１２０出力」ステップを典型的に実行するユーザにより実施されるステップを使って実行される。マイクロフォン１１０が環境ノイズを受信し、これらの環境ノイズがステップ１１０においてバッファリングされるため、これらの外乱ノイズはまた、録音され、その結果、バッファリングされた録音またはその一部は、データベースを構築するための固定記憶装置の中に記憶されてもよい（ステップ１３０を参照）。外乱ノイズがユーザにより認識されなかった場合には、この方法は繰り返されることになり、この繰り返しは、主観的評価（判断要素１２５）から開始点１０１までの矢印を使って例示されている。

この方法は、このように十分広範囲のデータベースが構築されることができるという点で有利であり、このデータベースは、オーディオフィンガープリントと同じような複数の録音またはパラメータを含み、これらは主観的に知覚された外乱ノイズと関連付けられる。

ここで、この結果は、その信号の時点が時間窓に依存する。典型的には、その依存は、その信号のその時点での時間窓の始まりが、その信号のその時点よりも３０または６０秒等の一定期間前であるという事実からもたらされる。さらに、その時間窓の終了もまた、その信号のその時点に依存してもよく、その結果、例えばその信号の時間およびその時間窓が一致し、または（その信号のその時点より前に終了する）５秒の時間間隔が存在する。一般に、この依存性は、録音時間窓が、常にその信号のその時点に先行するように選択され、その信号もまた、その時間窓内に存在してもよい。

図１ｂは、データベースの構築、ただし拡張された情報と一緒にデータベースの構築を可能にする拡張された方法１００’を示す。この方法１００’は、概して方法１００に基づいており、開始１０１および終了１３５によるその経路には制約がある。その結果、この方法１００’もまた、録音するステップ１１０’と、主観的ノイズ評価に対する信号、または一般には、（非外乱ノイズ、弱外乱ノイズ、および強外乱ノイズのような）複数の信号種別を起点にした（外乱ノイズのような）信号種別への受信信号の割り当てに対する信号を受信するステップ１２０’と、データベースを使うような、バッファリングされた録音を記憶するステップ１３０との基本的なステップを含む。さらに、ステップ１３０および１２０’は、判断ポイント１２５を介して接続されている。

この実施形態では、録音するステップ１１０’は、２つのサブステップ、すなわち１１０ａ’および１１０ｂ’に細分割される。ステップ１１０ａは、例えばラフネス、シャープネス、音量、トーナリティ、変動強度等の心理音響パラメータを計算するステップを表す。ステップ１１０ｂは、録音の固有の特徴をオーディオフィンガープリントによって後に再度確認できるように、その録音を表現するオーディオフィンガープリントを判定することと単純化できる。

主観的ノイズ評価のステップ１２０’を実行するための様々な入力手段があり得る。これらの入力手段は、方法１００’（参照番号１２ａ’を参照）を実行する装置上のキーまたはボタンを使った「評価」であり、アンケート調査を使った主観的ノイズ評価（参照番号１２ｂ’を参照）またはスマートデバイスを使った評価（参照番号１２ｃ’を参照）と関連付けている。これら３つの評価変形例１２ａ’、１２ｂ’、および１２ｃ’は、主観的ノイズ評価ステップ１２０’を実行するため、単独でまたは組み合わせて使用されてもよい。ある評価（判断点１２５を参照）がなされるとすぐに、心理音響パラメータ（参照番号１１０ａ’を参照）やオーディオフィンガープリント（参照番号１１０ｂ’を参照）が、ステップ１３０に例示されているメモリの中に記憶される。

さらなる実施形態によれば、時間や場所の情報は、純然たるパラメータまたはフィンガープリントまたはオーディオ録音の一部に加えて、追加されてもよい。これらの情報もまた、ステップ１３０で記憶され、それらに応じて現在の場所を判定するステップや現在の時間を判定するステップを含む別のステップ１３２から作り出される。

データベースが構築され、ある対応する大きさを有する場合（ステップ１３０を参照）、ステップ１３２に例示されているように、そのデータベースは、相関性または統計的評価等により評価されることができる。

上述の方法１００および１００’の典型的な応用例としては、例えばホテルの部屋に置かれて現在の環境ノイズをモニタリングする装置がある。宿泊客が彼のホテルの部屋で安らぎや静けさを得たいが、外乱ノイズによりそのようにすることができない場合、この宿泊客はこれらの外乱ノイズを採点することができる。これにより達成され得る結果としては、宿泊客の就寝を妨げる空気調節装置のように、その部屋がそれほど騒々しくないのか、そうは言ってもある程度の騒音が存在し得るのかという例である。この装置を使って、宿泊客は、主観的評価、すなわち「騒がしい」、「大変騒がしい」、または「極めて騒がしい」等の信号種別の分類を実行することができる。この評価は、様々なパラメータを使って評価されたノイズ状態を特徴付ける。最終的には、信号種別のうちの１つに関連付けられた、オーディオフィンガープリント、心理音響パラメータ、または一般的には録音が、データベースの中に記憶される。

３つの装置の変形例について、図１ｃ、図１ｄ、および図１ｅを参照しながら以下に論述される。

図１ｃは、第１の装置の変形例すなわち装置２０を示し、インターフェースまたは無線インターフェースを通じて実際の信号処理装置（図示されていない）に接続され、基本的に外乱信号または特定の信号種別を識別するための信号を放射するように構成されている。ここで、本実施形態の装置２２は、主観的評価を実行し得る２つのボタン２４ａおよび２４ｂを備えている。これらのボタン２４ａおよび２４ｂは、様々な信号種別と関連付けられている。

この装置２０は、典型的には、タブレット型コンピュータ、スマートウォッチ、スマートフォンのようなスマートデバイスとしてもよい、これらは、１つのアプリに一体化された仮想ボタン２４ａおよび２４ｂを含む。このアプリはまた、全般的な品質に関するさらなる情報を宿泊客等のユーザから収集することができるアンケート調査を典型的には含んでもよい。

ボタン２４ａおよび２４ｂを操作すると、環境ノイズをバッファリングしまたはパラメータを取り出し、次いで実際に記憶する方法が、実際のデータ収集装置の中で実行される。この外部装置は、例えばモニタリングするそれぞれの場所にマイクロフォンを有するサーバとしてもよい。

図１ｄは、別の変形例を示し、ここで、環境ノイズを受信するための内部マイクロフォン２６は、ボタン２４ａおよび２４ｂを備える装置２０’の中に一体化されている。追加の方法としてまたは別の方法として、外部マイクロフォン２６ｅが、インターフェースを通じて装置２０’と接続されてもよい。

図１ｅは、装置２０’’である別の変形例を示し、この変形例は、もはや入力手段としてのボタンを備えておらず、ただし内部マイクロフォン２６または省略可能なもしくは代替えの外部マイクロフォン２６ｅを備え、ある信号種別の環境ノイズに関連付けられることができるこの音声コマンドを使って制御されることができる。

この装置２０’および２０’’を参照すると、複数の外部マイクロフォンもまた、接続されることができるという点に注目すべきである。ここでは、通常の空中音に加えて、固体伝播音も録音される（それぞれの装置が固体伝播音受信機を備えることを意味する）こともまた、考えられる。

図１ｃおよび図１ｄの実施形態を参照すると、異なったボタン２４ａおよび２４ｂはまた、別のボタンにより拡張してもよいことに注意すべきである。これらのボタンを区別するため、色コーディング、すなわち赤色＝騒がしい、黄色＝問題なし、緑色＝大変心地よい、といった環境ノイズ（典型的には、後者は、鳥のさえずりがはっきりと聞こえるが、望ましいノイズとして知覚される）を提供することもできる。

図１ｃ〜１ｄを参照すると、装置２０、２０’、および２０’’は、ソフトウエアアプリケーションとしてさらに一体化されてもよく、またスマートフォン、タブレット型コンピュータ、またはスマートウォッチのような装置の中に追加して一体化されてもよいことについて言及されるべきである。これらのソフトウエアアプリケーションは、以下の機能を可能にすることができる。
‐ アンケート手法または様々な主観的獲得手法による上述のノイズ品質の検出の拡張、
‐ より遠くの装置の中に存在するセンサシステム（マイクロフォン、ＧＰＳ、傾斜センサ、バイオフィードバック機能）の使用、
‐ 無線または、適用可能な場合、ここで開発された装置とデータ通信との機械的な接続、
‐ ここで開発されたソフトウエアを使った、ここで開発された装置の完全制御、である。

図１ｆは、装置２０’’’の構成部品を示す。この装置２０’’’は、マイクロフォン２６、そのマイクロフォンを校正するための省略可能な較正手段２６ｋ、および処理装置４２、およびメモリ４４を備える。

この処理手段４２は、オーディオファイルを符号化するための、またはオーディオフィンガープリントを取り出すための前処理４６、および心理音響パラメータを判定するためのユニット４８を含む。前処理４６のメタデータおよびユニット４８の心理音響パラメータの両方は、メモリ４４に書き込まれる。さらに、オーディオ信号は、記憶され、または例えばボタンにより制御されたユニット４９の手段によりメモリ４４の中に一層正確に記憶されてもよい。

その較正手段２６ｋは、ある定義された感度の値を有するすべてのセンサを提供する役割を果たす。ここで、例えばスイッチ、周波数応答、または圧縮の測定または録音は、事前に実行される。

記憶されたオーディオサンプル、メタデータ（心理音響パラメータのオーディオフィンガープリント）、図１ｃ〜１ｄの入力手段のうちの１つによる採点を基に、データ分析機５０の手段による実際のデータ分析、および個々の信号種別との関連付けが、実行されてもよい。

ここで、この装置は、典型的にはモバイル機器であり、その結果、そのモバイル機器は通常、バッテリまたは蓄電池を用いて電力を供給されることができる。別の方法としては、従来の電源もまた、実施可能である。その録音を記憶するため、この装置はまた、（ＳＤカード等の）携帯型メモリ媒体のようなメモリ媒体、またはサーバとの接続も含んでもよい。このサーバとの接続は、電線もしくはガラスファイバのインターフェース、または無線インターフェースさえも介して実現される。プロトコルレベルについては、これを実行する様々な方法があるが、ここではより詳細には論述されない。

評価可能性を向上させるため、この装置はまた、例えばタイムコードまたは世界時計のような、他の装置と正確に同期するための手段も備えてもよい。さらにまた、この装置が、ＧＰＳ受信機のような位置判定ユニットに結合されることも考えられ、またはどの外乱ノイズが、どの位置で判定されたかまたは外乱であると知覚されたかを判定するために一体化された同じ位置判定ユニットを有することも考えられる。

ここで、さらなる実施形態によれば、この方法１００または１００’はまた、事前較正（較正手段２６ｋを参照）も含んでもよい。このことは、いくつかの実施形態によれば、上で論述されたこの方法１００または１００’が、較正するステップを含むことを意味する。

態様１に関して、いくつかの実施形態によれば、これらすべての装置が、データを減らすためその測定データのデータ圧縮録音を実行することも考えられる。このデータ圧縮はまた、長期間の測定に関して有利となる場合がある。圧縮または誤りの程度に応じて、プライバシの維持が保証されることができ、その理由は、モニタされたデータは常に圧縮されることができるため、基本的に心理音響パラメータ（ラフネス、シャープネス、トーナリティ等）またはオーディオフィンガープリントのようなパラメータのみが録音されるからである。さらに、録音もしくはオーディオフィンガープリントを使うべきか、または心理音響パラメータのみを使うべきかの的確な判断は、データ保護および消費者保護に対する法的枠組み条件により根本的に影響を受けることである。

上で論述されたように、いわゆる「オーディオフィンガープリント」という用語が使われているが、これには様々な変形種が存在し、以下に詳細に論述される。いくつかの方法がすでに知られており、それを使って、特徴またはフィンガープリントが、あるオーディオ信号から抽出されることができる。米国特許第５，９１８，２２３号は、オーディオ情報のコンテンツベースの分析、記憶、復元、および分割のための方法を開示している。オーディオデータの分析は、１組の数値を生成し、この組は特徴ベクトルとして参照され、このベクトルはそれぞれのオーディオ素片同士間の類似点を分類しかつ格付けするために使用されることができる。１つのオーディオ素片の素片量、ピッチ、音質の鮮明度、帯域幅、およびいわゆるメル周波数ケプストラム係数（ＭＦＣＣ）が、オーディオ素片を特徴化しまたは分類するための特徴として使用される。ブロックまたはフレーム当たりの値は、記憶され、次いで時間に対して第１の取り出しを受ける。これらの各特徴の平均値または標準偏差のような統計的な量は、その中に一次微分を含み、時間にわたる偏差を表現するため、この一次微分から計算される。この統計的な量の組が、その特徴ベクトルを形成する。したがって、この特徴ベクトルが、そのオーディオ素片のフィンガープリントであり、データベースの中に記憶されることができる。

専門誌「ＭｕｌｔｉｍｅｄｉａＣｏｎｔｅｎｔＡｎａｌｙｓｉｓ」、ＹａｏＷａｎｇｅｔａｌ．，ＩＥＥＥＳｉｇｎａｌＰｒｏｃｅｓｓｉｎｇＭａｇａｚｉｎｅ，Ｎｏｖｅｍｂｅｒ２０００，ｐａｇｅｓ１２ｔｏ３６には、マルチメディア素片を索引付けして特徴付けるための同様な概念が開示されている。オーディオ信号とある特定の種別との効果的な関連付けを保証するため、いくつかの特徴および分類機が開発されてきた。時間領域の特徴または周波数領域の特徴は、マルチメディア素片の中身を分類するための特徴として提案される。これらの特徴は、音量、オーディオ信号形状の基本周波数としてのピッチ、全エネルギ量に対するある帯域のエネルギ量のようなスペクトル特徴、スペクトル推移におけるカットオフ周波数等を含む。いわゆるオーディオ信号のサンプルブロック当たりの大きさに対する短時間の特徴は別として、そのオーディオ素片のより長い期間に対する長期間の量が提案される。さらなる典型的な特徴は、それぞれの特徴が時間的相違を形成することによって形成される。各ブロックで獲得された特徴は、データレートが高すぎるため、その状態のまま直接分類へ送られることはめったにない。さらなる処理の１つの伝統的な形式は、短期間の統計情報を計算することである。これには、例えば平均値、分散量、および時間相関係数の計算が含まれる。これにより、データレートを減少させているが、その反面、結果としてオーディオ信号の認識を向上させている。

ＷＯ０２／０６５７８２は、マルチメディア信号を形成するためにフィンガープリントを形成するための方法について述べている。この方法は、オーディオ信号から１つまたは複数の特徴を抽出することに関する。ここでのオーディオ信号は、セグメントに分割され、ブロックおよび周波数帯域に関する処理が各セグメントにおいて行われる。そのパワー密度スペクトラムのエネルギ、トーナリティ、および標準偏差の帯域的な計算が、実施例として言及されている。

オーディオ信号を分類するための装置および方法は、ＤＥ１０１３４４７１およびＤＥ１０１０９６４８から既知であり、その中で、フィンガープリントは、そのオーディオ信号のトーナリティの測定により獲得される。ここでのフィンガープリントは、オーディオ信号のロバストな、コンテンツベースの分類を可能にしている。これらの文献は、あるオーディオ信号全体にわたってトーナリティの測定を発生させる複数の可能性を明らかにしている。この場合、オーディオ信号のセグメントをスペクトル領域に変換することが、そのトーナリティを計算する基本となる。次いで、このトーナリティは、周波数帯域に対してまたはすべての周波数帯域に対して並行して計算されることができる。しかしながら、そのようなシステムの欠点は、オーディオ信号の歪みが増えるにつれ、フィンガープリントはもはや十分に表現できないこと、また信頼性を満たしながらオーディオ信号を認識することは、もはや不可能であることである。しかしながら、歪みは、極めて多くの場合、特にオーディオ信号が伝送品質の低いシステムを使って送信される場合に、起こる。現在、これは、特にモバイルシステムを伴う場合、またはデータ圧縮が強い場合である。携帯型電話等のそのようなシステムは、当初、音声信号の双方向通信用に実現され、またたびたび品質の極めて低い音楽信号を送信するにすぎない。低品質のマイクロフォン、チャネル妨害、およびトランスコーディング効果のように、送信された信号の品質に負の影響を与える可能性があるさらなる要因が存在する。信号を識別し分類するための装置の場合、信号品質の低下の結果は、認識性能の大きな低下をもたらす。様々な試験により、特にＤＥ１０１３４４７１およびＤＥ１０１０９６４８による装置および方法を使う場合、そのシステムに変化が起こり、同時にトーナリティの認識判定基準（ＳｐｅｃｔｒａｌＦｌａｔｎｅｓｓＭｅａｓｕｒｅ）を維持しても、結果として認識性能における顕著な改善が見られないことが明らかとなった。

異なった信号種別の外乱ノイズのようなノイズを含む十分な量のデータベースが構築され、ここから開始すると仮定する場合、ある一定の外乱ノイズが任意の環境に対して調査されることができ、次いでその一定の外乱ノイズは、そのような外乱ノイズが認識されるかどうかをログ記録されることができる。この方法は、図２ａに例示されている。

図２ａは、方法２００を示し、この方法は、マイクロフォン１１（受信するステップ２０５を参照）を通じて受信された環境ノイズをデータベース１５からの録音と一致させるステップ２１０を含む。判断２１５の場所において例示されているある一致が見つかるとすぐに、ログ記録するためまたはさらなる操作を除外するためといった目的で信号が出力される。一致が見つからない限り、その方法は、繰り返され、開始点２０１までの矢印を使って例示されている。

いくつかの実施形態によれば、録音の代わりに、現在の環境ノイズのそれぞれのオーディオフィンガープリントは、データベース１５の中に以前記憶されたオーディオフィンガープリントと比較されてもよい。ここでのその方法は、現在の環境ノイズのオーディオフィンガープリントを判定するステップと、それを、データベース１５の中に記憶されたオーディオフィンガープリントと比較するステップを含む。

方法２００において、環境ノイズまたはオーディオフィンガープリントを、データベース１５の中に事前に記憶された環境ノイズ／オーディオフィンガープリントに一致させることが、認識のために行われると仮定されている場合であっても、一般的に表現すれば、その環境ノイズは、ある規則に対してモニタリングされ得る。環境ノイズ／オーディオフィンガープリントを比較する場合、その規則は「部分一致」を意味することになる。

別のそのような規則は、例えば簡単に超えられる音量値、または超えられるべき心理音響パラメータに関する閾値としてもよい。いくつかの実施形態によれば、現在の環境ノイズの心理音響パラメータを取り出すステップが起こり、そのパラメータは、そのようなイベントが生じたことを認識するため、所定の規則の手段により所定のそれぞれの閾値と比較される。

拡張された実施形態によれば、この方法は、そのような外乱ノイズを完全に認識するだけでなく、そのノイズを、例えば音声、モータ騒音、音楽、教会の鐘、または発砲音に分類することもできる。

スマートフォン、または特にこの方法のために設計された装置の上で典型的に実行されるそのような方法を応用するための１つの潜在的なシナリオは、その装置が、ホテルの部屋に設置されてその環境ノイズをモニタリングすることである。ここで、その環境ノイズは、データベース１５からのデータを使って評価され、おそらく外乱であると知覚されたいくつのおよびどのノイズイベントが時間と共に生じたかがログ記録される。このことは、例えばその日の間の空気調節外乱ノイズを計数し続けることができる。ログ記録とは別の方法として、このノイズのオーディオ録音、または事前にバッファリングされた環境ノイズを記憶する（上述を参照）ことが実行され得る。その根底にあるアイデアは、ホテルの操作員がこの方法を使ってそのノイズ知覚を予測したり評価したりすることができることである。

図２ｂは、拡張された方法２００’を示し、この方法は、判断２１５のステップまたはポイントと終了２１６との間にさらなるステップを含む。

これらのステップは、ステップ２２０の手段により、またはセル変数２２１を使ってそのイベントを計数し、結果としてイベントの数２２２が取得される。必要に応じて、オーディオ録音は、ステップ２３０を使って例示されているように、認識されたイベントによって開始されることができる。

図２ｃは、装置４０のさらなる具体例を示す。その装置は、中央装置として、分析／マッチングの実際のステップを実行するプロセッサ４１を含む。まず第一に、その装置は、内部マイクロフォン２６を使用し、外部マイクロフォン２６ｅ１および２６ｅ２とのアクセスも考えられる。マッチング用データは、例えば内部メモリ４４の中に記憶されている。

必要に応じて、このプロセッサは、オーディオフィンガープリントまたは心理音響パラメータのうち少なくとも一方を判定しマッチングさせ、対応する規則との一致を得るように構成されている。

この機能を可能にするため、必要に応じて、内部クロック５５、バッテリ５６ｂ、または通常、それ用のケーブル５６ｋを使って実現されてもよい電源５６のような、さらなる周辺装置が設けられる。必要に応じて、このプロセッサはまた、録音動作ボタンまたはタイマ５９のような、さらなるセンサ素子５７、制御装置５８にアクセスすることもできる。ここで、さらなる実施形態によれば、プロセッサ４１はまた、主観的評価（主観的音調イベントを認識すること）を組み合わせて相関性を確立するため、客観的ノイズ評価を実行するように構成されてもよい。

いくつかの実施形態によれば、以前取得された心地よさの主観的評価から開始すると、このＣＰＵは、様々な評価マトリックスに、その信号種別の各々の認識されたノイズを、それぞれのノイズ種別に応じて、分類／仕分けすることができる。

さらなる実施形態によれば、外部データ記憶装置６０は、外部ハードディスクまたはサーバのように、データベースを記憶するまたは展開するために設けられてもよい。この接続は、有線接続または無線接続であってもよい。さらなる実施形態によれば、無線通信では、無線インターフェース６２ｗまたは有線インターフェース６２ｋのように、外部とのアクセスを実現する通信インターフェース６２を設けることができる。

別の態様によれば、以前説明され、基本的に互いに組み合わされた２つの装置４０からなるシステムが提供され、その結果、その２つの装置は、対応するノイズ、すなわち信号種別が、それらの装置のうちの１つに受信されるとすぐに、相互に動作する。このシステムは、それぞれのノイズ種別のノイズをより詳細に分析しまたは評価するための役割を果たす。図３で以下に論述される方法は、ここで実行される。

図３ａは、方法３００を示しており、この方法は、第１の所在位置でおよび第２の所在位置で実行される方法２００または２００’に基づくノイズ分析のステップを含む。これは、ステップ２１０が２倍（２１０ａおよび２１０ｂを参照）存在することを意味する。

（ステップ２１０ａおよび２１０ｂによる）２つの所在位置でのオーディオフィンガープリントのような、録音および判定されたパラメータは、次いで別のステップ２２０において比較される。

いくつかの実施形態によれば、この２つの近隣の所在位置でのこの２つのステップ２１０は、省略可能なステップ「近隣装置２１１におけるオーディオ録音」を使って例示されているように、相互に依存し合うことができる。別の方法として、別の動作が、近隣装置で実行されてもよい。これは、方法２１０ａを実行する第１の装置が、例えばあるノイズを認識し、方法２１０ｂを実行する第２の装置を動作させる場合、その同一のノイズは、異なった所在位置で認識されることができるからである。ここで最後に言及されるべきことは、判断２１５の場所から開始すると、開始点３０１に向かう別の矢印が存在し、その矢印は、ノイズ分析の方法２１０ａが、対応する一致が見つかるまで実行されるという事実を基本的に暗示していることである。

それらの所在位置は、典型的には空間的に近隣にあるため、そのノイズの伝播、速度、またはより大きなノイズ源をこのようにして推定することが可能である。

典型的には、その分析と別の装置での分析を同時に比較する際、同一のイベントが複数の装置で認識されたときに、このイベントが雷鳴や稲妻のようなグローバルイベント（判断３２１の領域の後の参照番号２３２を参照）か、またはローカルイベント（判断３２１の領域の後の参照番号３２４）かが判定されることができる。グローバルイベント３２３の場合、通常、「近隣の」装置と「遠隔の」装置との間のレベル差は、無視できるほど小さい（ｒの変化がｒに対して小さい場合、レベルは約１／ｒ）。ローカルイベント３２４の場合、そのレベル差は大きい（ｒの変化がｒに対して大きい場合、レベルは約１／ｒ）。あるローカルイベントは、例えば助けを求める叫び、破裂音、野外コンサートの音であり得る。ローカルイベントの場合、さらなる分析、すなわちさらなるパラメータに関する分析３２５へ続くことができる。時間偏差または周波数シフトから開始すると、そのローカルイベントの量、伝播またはタイムラインを判定することができる。グローバルイベント３２３またはローカルイベント３２４を判定するステップは、それらの分析３２５と同様に、その方法の終了３２９である。

１つの可能性のある応用シナリオは、例えば複数の装置が都市中心全体に分散している場合である。それらのすべての装置は、（有線、無線、イーサネットまたはＬＡＮ接続等の）データ接続を介して互いに接続されている。サーバを使った接続もまた、可能である。それらのすべての装置は、そのノイズ状態（心理音響パラメータ、オーディオフィンガープリント）を分析する。これらの装置のうちの１台は、事前にデータベースの中で分類されたある信号種別のような、特徴イベントを認識する。オーディオ録音は、現地で起動される。同時に、その装置は、近隣ノード上の動作のような、動作を開始する。この２つのノードを比較することによって、グローバルイベントおよびローカルイベントは、上で論述されたように、区別されてもよい。

この方法３００は、基本的に、２つの装置４０（図２ｃ）を含むシステムにより実行される。

しかしながら、この２つの装置を接続するための予備のインターフェースが設けられているため、図３ｂに例示されているように、ほとんどの変形例もまた、可能とすることができない。

図３ｂは、入力側にマイクロフォン２６および省略可能な較正装置２６ｋを含む装置７０を示す。このマイクロフォンにより受信されたオーディオストリームは、例えばオーディオフィンガープリント（参照番号４６ａを参照）または心理音響パラメータ（参照番号４８を参照）を取り出すため、前処理４６の手段により前処理される。並行して、イベントまたは種別が認識されてもよい（参照番号５０を参照）。イベント／種別を認識する手段によって、一方では自動オーディオ録音が起動されることができ（参照番号５０ａ１を参照）、またはさらなるノードを動作させるような制御命令（参照番号５０ａ２またはさらなる装置７０’）が発せられることができる。制御命令を出力するための手段５０ａ２は、典型的にはメモリを作動させることができ、次いでこのメモリは、オーディオフィンガープリント４６ａを生成するための手段からの、または心理音響パラメータ４８を取り出すための手段からの、データを受信し録音する。このオーディオ信号はまた、メモリ４４の中にも記憶されてもよく、ここでもまた、ボタン４９ａにより、録音が可能とされまたは防止されてもよい。この実施形態では、ＣＰＵ４１はまた、タイマ５９にも接続されてもよい。

装置７０は別として、装置７０’は、基本的に同一の機能を満足し、別の近隣の場所に設置される。この装置７０’もまた、メモリ４４を含み、この装置７０’が動作させる手段５０ａ２の手段により動作されたとき、または認識されある種別に属するノイズから開始するとき、メモリ４４は、この時間間隔の間にそのオーディオ結果を記憶した。装置７０および７０’のメモリ４４からの録音またはオーディオフィンガープリントまたは心理音響パラメータは、例えば拡張に関する次のステップでのデータ分析機７２によって分析される。しかしながら、データ分析機７２がそのさらなる装置の両方のメモリと接続されていることは、ここでは好都合であり、そこではこのデータ分析機７２が、装置７０および７０’のうちの１台の中に、またはその両者に対して外部に配置されてもよいことをここで述べておく。

さらなる実施形態によれば、ボタン２４ａ’のような任意のボタンが装置７０の中に一体化されてもよい、その結果、装置７０は、装置２０、２０’、または２０’’の機能も実行する。

省略可能な構成要素５０ａ’により、分類を認識した後の自動録音起動を可能にする。別の方法として、ここでは、この自動録音が、すでに取得されたどの信号種別にもノイズが見つからなかったときに開始されることも考えられる。

言い換えると、この方法３０３は、方法２００の機能性、すなわち音声、モータノイズ、音楽、キッチンブロック、発砲音のようなノイズを認識し分類する機能が、基本的にカバーされていることを説明することができ、この機能性は、異なった場所にあるいくつかのマイクロフォンから開始され、分析により拡張される。

ここで、例えばテロリズムを示唆する破裂音および発砲音を伴うような特定の種別の自動録音もまた可能である。ここで、すべての近隣ノード７０／７０’が、録音することに直接切り替えられることは、有効である。

さらに、特定のノイズ閾値が、ある時間間隔にわたって超えている場合でも、自動的な（例えば、時間的に制約された）録音は、可能である。その録音はまた、近隣ノードに拡張されてもよく、したがって、これらのより長い録音によりその信号源の正確な位置測定を実行することができ、そのときは、（ノイズ源を分離しながら外乱源の調査を可能とする）複数のノードを併合する。

上述の３つのシナリオの潜在的な応用分野は、以下のようである。
‐ 観光事業、ホテル、ウェルネスセクタ、サイクリング道路、ハイキング道路
‐ 作業保護（事務作業、機械工場、客室の職場）
‐ 都市計画（サウンドスケープ、ノイズマッピング）
‐ 公安（生産設備の監視）

方法１００／１００’、２００／２００’および３００、または装置２０／２０’／２０’’／２０’’’、４０および７０／７０’の機能性の組み合わせもまた、考えられる。この例は、装置内で主観的に評価し録音するための、また装置の機械評価のための装置および方法の組み合わせである。

ここで、別の態様と関連して論述された構成要素は、当然ながら、さらに第２の態様にも適用されてもよい。典型的には、オーディオフィンガープリントまたは心理音響パラメータに関する教示は、３つのすべての態様に適用可能であり、その教示は、第１の態様に関連するのみ、より詳細に論述されている。

いくつかの態様は、ある装置の文脈で説明されてきたが、これらの態様はまた、その対応する方法の説明をも表していることは明らかであり、その結果、ある装置のブロックまたは構成要素はまた、それぞれの方法ステップまたは方法ステップの特徴にも対応している。同様に、方法ステップの文脈で説明された態様は、対応するブロックもしくは用語または対応する装置の特徴についての説明をも表している。いくつかのまたはすべての方法ステップは、例えばマイクロプロセッサ、プログラマブルコンピュータ、または電子回路のようなハードウエア装置によって（または使用することによって）実行されてもよい。いくつかの実施形態では、最も重要な方法ステップのいくつかは、そのような装置によって実行されてもよい。

オーディオ信号、ビデオ信号またはトランスポートストリーム信号のような信号を本発明の方法で符号化した信号は、デジタル記憶媒体上に記憶されてもよく、または、インターネット等の、無線伝送媒体もしくは有線伝送媒体のような伝送媒体上に送信されてもよい。

本発明の方法で符号化されたオーディオ信号は、デジタル記憶媒体上に記憶されてもよく、または、例えばインターネット等の、無線伝送媒体もしくは有線伝送媒体のような伝送媒体上に送信されてもよい。

特定の実現要求条件に依存して、本発明の実施形態は、ハードウエアの中に、またはソフトウエアの中に実現されることができる。この実現は、デジタル記憶媒体を用いて実現されることができ、例えばフロッピーディスク、ＤＶＤ．Ｂｌｕ−Ｒａｙディスク、ＣＤ、ＲＯＭ、ＰＲＯＭ、ＥＰＲＯＭ、ＥＥＰＲＯＭもしくはＦＬＡＳＨメモリ、ハードドライブ、または電子的可読制御信号が上部に記憶された別の磁気的メモリもしくは光学的メモリであり、これらは、そのそれぞれの方法が実現されるように、互いに協働、またはプログラミング可能なコンピュータと協働することができる。したがって、デジタル記憶媒体は、コンピュータ可読であってもよい。

本発明に基づくいくつかの実施形態は、電子的可読制御信号を含むデータ媒体を含み、これらの制御信号は、本明細書に記載された方法のうちの１つが実行されるように、プログラミング可能なコンピュータシステムと協働することができる。

一般に、本発明の実施形態は、プログラムコードを有するコンピュータプログラム製品として実装されることができ、このプログラムコードは、そのコンピュータプログラム製品がコンピュータ上で実行されるとき、その方法のうちの１つを実行するために動作する。

このプログラムコードは、例えば機械可読媒体の上に記憶されてもよい。

他の実施形態は、本明細書に記載された方法のうちの１つを実行するためのコンピュータプログラムを含み、このコンピュータプログラムは、機械可読媒体の上に記憶される。

言い換えれば、本発明の方法の実施形態は、したがって、そのコンピュータプログラムが、コンピュータ上で実行されるとき、本明細書に記載された方法のうちの１つを実行するためのプログラムコードを含むコンピュータプログラムである。

本発明の方法のさらなる実施形態は、したがって、上部に録音された、本明細書に記載された方法のうちの１つを実行するためのコンピュータプログラムを含む、データ媒体（またはデジタル記憶媒体またはコンピュータ可読媒体）である。

本発明の方法のさらなる実施形態は、したがって、本明細書に記載された方法のうちの１つを実行するためのコンピュータプログラムを表すデータストリームまたは一連の信号である。このデータストリームまたは一連の信号は、例えば、データ通信接続、例えばインターネットを介して転送されるように構成されてもよい。

さらなる実施形態は、本明細書に記載された方法のうちの１つを実行するように構成されまたは適合されたコンピュータ、またはプログラム可能論理回路のような処理手段を含む。

さらなる実施形態は、本明細書に記載された方法のうちの１つを実行するためのコンピュータプログラムをその上にインストールしたコンピュータを含む。

本発明に基づくさらなる実施形態は、本明細書に記載された方法のうちの少なくとも１つを実行するためのコンピュータプログラムを受信機に転送するように構成されている装置またはシステムを含む。この送信は、電子的にまたは光学的に実行されることができる。この受信機は、例えばコンピュータ、モバイル機器、メモリデバイス等とであってもよい。この装置またはシステムは、例えばそのコンピュータプログラムを受信機に転送するためのファイルサーバを含んでもよい。

いくつかの実施形態では、プログラム可能論理回路（例えば、フィールドプログラマブルゲートアレイ（Field-Programmable Gate Array：ＦＰＧＡ））が使われ、本明細書に記載された方法のいくつかのまたはすべての機能性を実行することができる。いくつかの実施形態では、フィールドプログラマブルゲートアレイは、本明細書に記載された方法のうちの１つを実行するため、マイクロプロセッサと協働してもよい。概して、ある実施形態では、これらの方法は、任意のハードウエアにより実行されている。これは、コンピュータプロセッサ（Computer Processor：ＣＰＵ）等の普遍的に適用可能なハードウエアとすることができ、またはＡＳＩＣ等の当該方法に特化したハードウエアとすることができる。

上述された実施形態は、本発明の原理に対する単なる例示にすぎない。本明細書に記載された配置および詳細について様々な修正例および変形例が存在することは、当業者には明らかであることを理解されたい。したがって、本発明は、添付された特許請求の範囲によってのみ限定され、本明細書の実施形態の記載および説明によって示された特定の詳細によっては限定されないことを意図している。

Claims

データベース（１５）を生成するための方法（１００、１００’）であって、
バッファリングされた録音を取得するため、環境ノイズを受信して（１１０、１１０’）移動時間窓のために前記環境ノイズをバッファリングし、または前記環境ノイズからパラメータの組を取り出して前記移動時間窓のために前記パラメータの組をバッファリングするステップと、
前記環境ノイズの中の複数の信号種別のうちのある信号種別を識別する信号を取得するステップ（１２０）と、
前記信号に応答してメモリの中に前記バッファリングされた録音を記憶するステップ（１３０）と、
同一の信号種別のための複数のバッファリングされた録音を含む前記データベース（１５）を取得するため、取得するステップ（１２０）および記憶するステップ（１３０）を繰り返すステップと、を含む方法。
前記信号と前記バッファリングされた録音の前記移動時間窓との間に時間的な依存が存在する、請求項１に記載の方法（１００、１００’）。
前記時間的な依存は、前記移動時間窓の先頭が前記信号の時間より前であるか、または
前記移動時間窓の最後尾が前記信号の前記時間であるかもしくは前記時間より前である、請求項２に記載の方法（１００、１００’）。
前記信号は、ユーザ入力手段（２４ａ、２４ｂ）、ボタン（２４ａ、２４ｂ）、またはスマートデバイスによって受信されている、請求項１〜３のいずれか一項に記載の方法（１００、１００’）。
前記信号は、音量を判定するための検出器、前記環境ノイズの中の制御信号を識別するためのプロセッサ、または近隣の所在位置でのデータベース（１５）を生成するための装置によって受信されている、請求項１〜４のいずれか一項に記載の方法（１００、１００’）。
前記パラメータの組の取り出しは、前記バッファリングされた環境ノイズのための音響フィンガープリントを判定することを含む、請求項１〜５のいずれか一項に記載の方法（１００、１００’）。
前記パラメータの組の取り出しは、前記バッファリングされた録音の心理音響パラメータを判定することを含む、請求項１〜６のいずれか一項に記載の方法（１００、１００’）。
前記心理音響パラメータは、音量、シャープネス、トーナリティ、ラフネス、または変動強度のうちの少なくとも１つを含む、請求項７に記載の方法（１００、１００’）。
前記環境ノイズの中の複数の信号種別のうちのさらなる信号種別を識別するさらなる信号を取得するステップを含み、前記記憶するステップは、前記種別または前記さらなる信号種別に対する前記バッファリングされた録音の対応付けが維持されるように、前記さらなる信号に応答して実行されている、請求項１〜８のいずれか一項に記載の方法（１００、１００’）。
前記記憶する（１３０）ステップにおいて、前記信号が取得されるときのタイムスタンプもまた、前記バッファリングされた録音と一緒に記憶される、請求項１〜９のいずれか一項に記載の方法（１００、１００’）。
前記方法（１００、１００’）は、前記信号を取得するステップにおいて現在の場所を判定するステップを含み、前記判定された場所は、前記バッファリングされた録音と一緒に記憶される、請求項１〜１０のいずれか一項に記載の方法（１００、１００’）。
前記バッファリングされた録音は、データ圧縮方法で記憶される、請求項１〜１１のいずれか一項に記載の方法（１００、１００’）。
前記メモリ（４４）が、外部に配置されている、請求項１〜１２のいずれか一項に記載の方法（１００、１００’）。
コンピュータプログラムであって、前記プログラムがコンピュータ上で実行されるとき、請求項１〜１３のいずれか一項に記載の方法（１００、１００’）を実行するためのプログラムコードを有する、コンピュータプログラム。
データベース（１５）を生成するための装置（２０、２０’、２０’’、２０’’’）であって、
環境ノイズを受信するためのマイクロフォン（１１）と、
バッファリングされた録音を取得するため、移動時間窓のために前記環境ノイズをバッファリングし、または前記環境ノイズからパラメータの組を取り出して前記移動時間窓のために前記パラメータの組をバッファリングするためのバッファと、
前記環境ノイズの中の複数の信号種別のうちのある信号種別を識別する信号を取得するためのインターフェースと、
前記信号に応答して前記バッファリングされた録音を記憶するためのメモリ（４４）と、を含み、
前記装置（２０、２０’、２０’’、２０’’’）は、同一の信号種別に対する複数のバッファリングされた録音を含む前記データベース（１５）を取得するために、取得することおよび記憶することを繰り返すように構成されている、装置。
前記装置（２０、２０’、２０’’、２０’’’）は、前記入力インターフェースに接続された入力手段、ボタンもしくはスマートデバイスを備え、または
前記入力インターフェースは、前記音量を判定するための検出器、前記環境ノイズの中の制御信号を識別するためのプロセッサ、または近隣の所在位置でのデータベース（１５）を生成するためのさらなる装置（２０、２０’、２０’’、２０’’’）に接続されている、請求項１５に記載の装置（２０、２０’、２０’’、２０’’’）。
前記装置（２０、２０’、２０’’、２０’’’）は、現在の所在位置が、記憶されるべき前記バッファリングされた録音の一部またはパラメータに関連して記憶されることができるように、前記現在の所在位置が判定されることができる所在位置判定手段を含む、請求項１５または１６に記載の装置（２０、２０’、２０’’、２０’’’）。
前記バッファはリングメモリである、請求項１５〜１７のいずれか一項に記載の装置（２０、２０’、２０’’、２０’’’）。
前記装置（２０、２０’、２０’’、２０’’’）は、前記外部メモリ（４４）が接続されることができる通信インターフェースを含む、請求項１５〜１８のいずれか一項に記載の装置（２０、２０’、２０’’、２０’’’）。
請求項１〜１３のいずれか一項に記載の方法の手段によって生成されるデータベース（１５）の使用方法。