JP2011022602A

JP2011022602A - サウンドの検出および特定システム

Info

Publication number: JP2011022602A
Application number: JP2010208638A
Authority: JP
Inventors: David H Griesinger; エイチ．グリーシンガーデービッド
Original assignee: Harman International Industries Inc
Current assignee: Harman International Industries Inc
Priority date: 2002-05-03
Filing date: 2010-09-16
Publication date: 2011-02-03
Also published as: AU2003265935A1; JP4744874B2; CN1830009B; CA2483609C; US7567676B2; US20040005064A1; EP1585947A2; WO2003093775A2; EP1585947A4; US7492908B2; AU2003265935A8; US7499553B2; CA2773294A1; US20040022392A1; JP2005539413A; KR101047194B1; CN1830009A; US20040179697A1; CA2773294C; KR20040105252A

Abstract

【課題】人間の聴覚機構が有する開始検出、順応性、および周波数バイアス特性をモデル化して、指向性のある一過性現象（「サウンドイベント」）を音場から検出して、別個に特定することが可能なシステムを提供すること。
【解決手段】このようなモデルは、音場をサウンドイベントと非サウンドイベントに細分化し、サウンドイベントと非サウンドイベントとを別個に特定する。サウンドイベントは、通常、周波数バイアスおよび開始検出特性に従って識別される。サウンドイベントは、検出されると、差分指向角（定常信号が順応化された指向角）または通常指向角に従って特定され、サウンドイベントがその立ち上がり時間に示した方向を反映している。サウンドイベントが検出されない場合、高速の動きを反映しない指向角に従って、非サウンドイベントが特定される。
【選択図】図１

Description

（発明の背景）
（１．関連出願の相互参照画像）
本出願は、同時係属の米国仮出願番号６０／３７７，５５８号、発明の名称「合成音場に組み込まれたサウンドイベントの方向およびタイミングを決定するための適応回路」に基づく。本仮出願の出願日の利益は、本出願において主張される。

（２．技術分野）
本発明は、一般的に、サウンドの検出および特定に関する。より特定的には、本発明は、合成音場におけるサウンドイベントを含むサウンドの検出および／または特定に関する。

（３．関連技術）
オーディオ再生システム、オーディオおよび音声符号化システム、音声認識システム、オーディオ増幅システムなどのサウンドに基づく多くのアプリケーションは、特定の型のサウンドを区別および検出し、サウンドが発出または発生された方向を決定する機能を必要とする。特定の型のサウンドを検出する機能は、サウンド増幅などのアプリケーションにとって重要であり、サウンドを検出および特定する機能は、サウンド再生に関するアプリケーションにとって極めて重要である。都合の悪いことに、サウンドの検出および特定は、非常に複雑なものとなりうる。なぜならば、サウンドそれぞれが単独で発生することはめったにないからである。

生であっても再生であっても、通常、サウンドは、時間の経過とともに生じた多くの異なるサウンドの複雑な組み合わせで成り立っている。音場におけるサウンドは部分的に重なったり、次々と生じたり、またはその組み合わせであったりする。音場における個別のサウンドを分類する方法としては、サウンドが特定の場所から発出または発生したかどうかによって分類する方法がある。特定の方向から発出または発生したとして検出することができるサウンドを、方向性サウンドと称し、特定の方向から発出または発生したものではないとして検出することができるサウンドを、非方向性サウンドと称する。サウンドを分類する別の方法では、サウンドが一過性サウンドかまたは定常サウンドかによって分類する。定常サウンドは、ある期間にわたって電力レベルがおおむね一定であるサウンドであって、持続した音符の音などである。定常サウンドは、方向性サウンドの場合もあるし、または非方向サウンドの場合もある。一過性サウンド（または「一過性現象」）は、最初にエネルギーの瞬時的上昇があるサウンドであって、叫びまたはドラムの打音などである。一過性現象は、方向性サウンドの場合もあるし、または非方向サウンドの場合もある。非方向性の一過性サウンドの例としては、直接のサウンドが物体によって妨げられている、残響のある空間における音声がある。この場合、残響時間が１秒未満であれば、信号の時間特性は維持されるが、方向性についての情報は失われる。

方向性のある一過性現象は、本願においては「サウンドイベント」と総称される。サウンドイベントには２つの型があり、音節および衝撃音である。音節は、音素と楽音とがある。音素は、人間の音声における単音に特徴的な一過性サウンドであり、人間の音声の音節を検出および特定するのに特に有用となりうる。楽音は、楽器によって作られる個々の音である。楽音および音素は共通の性質を有するので、これらは本願においては「音節」と総称される。音節は、通常、以下のような性質を有する。すなわち、おおよそ少なくとも５０ｍｓから約２００ｍｓ、典型的には約１５０ｍｓの有限の期間であること、約３３ｍｓの立ち上がり時間であること、通常、せいぜい０．２〜０．５ｍｓ毎に１回ほどの頻度で生じるものであること、および音量（振幅）が低い場合も高い場合もあることである。これとは異なり、衝撃音は、ドラムの打音または音声における摩擦音および破裂音などといった、極めて短期間の一過性現象である。衝撃音は、通常、以下のような性質を有する。すなわち、約５ｍｓ〜約５０ｍｓという短期間であること、約１ｍｓ〜１０ｍｓの立ち上がり時間であること、および音量が高いことである。

音場におけるサウンドを検出するには、その生成が生か再生かを問わず、通常、音場が１つの入力または「入力チャンネル」で生成されればよい。しかしながら、サウンドを特定するには、通常、音場が少なくとも２つの入力または入力チャンネルで生成される必要がある。サウンドを特定するための原型は、自然な聞き取りであり、サウンドの方位角は、２つの耳で表される２つの入力チャンネル間における到着時間差によって主に検出される。電子的手段によってサウンドを特定する場合には、サウンド源の方位角は、２つ以上の入力チャンネルによって生成された信号間の振幅および位相関係によって主に決定される。通常、これらの入力チャンネルにおける方向性サウンドの方位角を説明するために、サウンド源の方向は、各対応するチャンネル対（それぞれ、「チャンネル対」）間の角度によって説明される。サウンドが２つのチャンネルだけで生成される場合には、サウンドの方向は、当該チャンネル対の角、通常は右／左角「Ｉｒ」によって与えられる。サウンドが４つのチャンネルで生成される場合には、サウンドの方向は、各チャンネル対の角、通常は、右／左角Ｉｒおよび前／後角「ｃｓ」によって与えられる。例えば、音場が２つのチャンネルで生成される場合には、音場におけるサウンドの平均方向は、Ｉｒだけによって与えられる。この場合、Ｉｒの値は、−４５度から約４５度の範囲となり、−４５度は、音場が左側入力チャンネルから発生していることを示し、４５度は、音場が右側入力チャンネルから発生していることを示し、０度は、音場が右側および左側入力チャンネルのちょうど真ん中の位置（この位置は、多くの場合「中央」と称される）から発生していることを示す。

しかしながら、サラウンドサウンドシステムなどのように、音場が２つのチャンネル対で生成される場合には、第２の方向性成分を特定する。さらに、音場が１つのチャンネルついで生成する場合にも、第２の方向性成分を特定してもよい。なぜならば、あるチャンネル対から追加のチャンネル対を導出することは通常可能であるからである。Ｉｒによって方向を特定するのに加えて、ｃｓによって方向を特定する。ｃｓの値も、−４５度から約４５度の範囲となり、Ｉｒ＝０度およびｃｓ＝４５度は、音場が中央入力チャンネルからのみ発生していることを示し、Ｉｒ＝０度およびｃｓ＝−４５度は、音場が後部入力チャンネルからのみ発生していることを示す。同様に、Ｉｒ＝−４５度およびｃｓ＝０度は、音場が左から発生していることを示し、Ｉｒ＝４５度およびｃｓ＝０度は、音場が右から発生していることを示す。さらに、Ｉｒ＝−２２．５度およびｃｓ＝−２２．５度は、音場が左後部から発生していることを示し、Ｉｒ＝２２．５度およびｃｓ＝−２２．５度は、音場が右後部から発生していることを示す。

記録済みサウンドの再生に用いられる、これらの角度を決定するための既知の技術がある。一般的に、この既知の技術は、入力チャンネル対のうちの１つの入力チャンネルの信号の振幅を、当該入力チャンネル対のうちの対応する入力チャンネルの信号の振幅と（通常、左を右と、または中心をサラウンドと）比較することによって、サウンドの意図した方向を決定する。より特定的には、振幅比を用いて、一般的に「通常指向角」、すなわちＯＳＡと称されるものを、入力チャンネル対毎に決定する。ＯＳＡを得るためには、入力チャンネル対の各チャンネルにおける電圧信号と、整流化済みの電圧の対数とを取得する。一方の入力チャンネルの整流化済みの電圧の対数を、入力チャンネル対のもう一方の入力チャンネルの整流化済みの電圧の対数から差し引くことによって、入力チャンネル対の電圧比の対数に等しい信号を生成し、それを大きさ領域に再変換すると、通常指向角となる。サラウンド再生システムにおいて、この決定は、マトリックスデコーダと呼ばれる装置によってたいてい行われる。

都合の悪いことに、この既知の技術は、音場全体を単一のサウンドだけを含むかのようにして扱っている。なぜならば、各入力チャンネルにおける相対的な電圧強度に従って、音場全体の方向を決定しているからである。したがって、方向性のある多数の個々のサウンドでは、適切に特定されないであろう。音場を多数のサウンドの複雑な組み合わせとして扱うためには、方向性のある一過性サウンド（サウンドイベント）を分離してその方向を別個に決定できるフィルタを考案する試みがなされている。しかしながら、このようなフィルタを設計する際に、基本的な問題に遭遇する。方向性のある一過性信号すべての変動を区別するのに十分なほどフィルタが高速化すると、残響および雑音のような非方向性の一過性信号の変動特性をも区別してしまうだろう。その結果、残響および雑音の高速な変動が、方向性の変化としてサウンドに再生されてしまい、再生サウンドの質を著しく劣化させる。その一方で、非方向性信号の変動特性を区別しないほどフィルタを低速化すると、フィルタは、一般的に低速すぎて、特定のサウンドイベント、特に衝撃音の変動を区別することができない。その結果、多くのサウンドイベントが、適切に特定されない。このようなフィルタは、どのように設計しても、一般的に、ある種の音楽に対してはうまく作用するものの、すべてに対してはうまくいかない。例えば、高速フィルタは、急速な変化に満ちた、複雑なポピュラー音楽に対してはうまく作用するものの、非常に反響するクラシック曲を再生する際は、誤った方向性変化（指向が大きすぎる）を反映したものとなってしまう。

所定の入力チャンネルにサウンドが記録されて、異なるチャンネル数にわたって再生される場合には、さらなる問題が生じる。例えば、サウンド記録再生技術には、ステレオおよびサラウンドという、２つの一般的な種類がある。ステレオ（２チャンネル）再生用に記録されたサウンドは、正面から発生されたと感じるように意図されている。サラウンド（２より大きい複数の入力チャンネル数であるが、一般的には、５または７つのチャンネル）再生用に記録されたサウンドは、まわり中、一般的には、後方からのサウンド再生に用いられる１または２つの入力チャンネルから発生されたと感じるように意図されている。ステレオ再生用にサウンドを記録するのに用いられる技術は、一般的に、サラウンド再生用にサウンドを記録するのに用いられる技術とは異なるものである。しかしながら、サラウンドシステムはあらゆる場所で用いられるものではないので、サラウンド再生用に記録されたサウンドは、一般的に、高品質のステレオ再生できることが必要となる。例えば、典型的な５チャンネルサラウンドシステムにおいて、中央のチャンネルのサウンドは、中央のチャンネル「ｃ」に含まれるサウンドが左右の入力チャンネルに含まれるサウンドの合計に等しくなるように（ｃ＝ｌ＋ｒ）、左右の入力チャンネルに符号化される。同様に、サラウンドチャンネルのサウンドは、サラウンドチャンネル「ｓ」に含まれるサウンドが左右の入力チャンネルに含まれるサウンドの差に等しくなるように（ｓ＝ｌ−ｒ）、左右の入力チャンネルに符号化される。他の例では、サラウンド再生用にサウンドを記録するドルビーサウンド（登録商標）システムが、聴取者の背後（後ろ）からの再生を意図したサウンドに対して負の位相を付加する。この負の位相は、一般的には、ステレオ再生システムによって検出されず、聴取者には意識されない。しかしながら、負の位相は、後部入力チャンネルの関連サウンドを後に再生するサラウンド再生システムでは検出される。都合の悪いことに、多くのサウンドは、自然に負の位相を有しており、したがって、ステレオ形式で記録された場合であっても、サラウンド再生システムによる後部入力チャンネルでの再生は、不正確なものとなる。これでは、混乱が生じ、不自然になりかねない。

（概要）
サウンドイベントを音場に残ったものから区別することができる検出器、検出されたサウンドイベントの方向を個別に決定できる特定器、およびサウンドイベントの方向を音場における残りのサウンドとともに個別に決定できるサウンド特定器に対する需要がある。既知のサウンド検出およびシステムにおいて生じる多くの問題は、人間の聴覚機構においては生じないので、人間の聴覚機構の特性をモデル化して、上述の特徴を有するシステムを構築するために用いた。

人間の聴覚機構は、音場を個別のサウンドに細分化することによって音場のサウンドを特定し、個別のサウンドの方向を決定し、関連するサウンドをストリーム（特定の楽器のメロディラインまたは特定の話者からの会話の一下りなど）に組み立て直し、ストリーム内の個別のサウンドの平均方向に基づいて、ストリームの向きを決定する。音場を個別のサウンドに細分化する際に、人間の聴覚機構は、一過性サウンドを他のサウンドと区別し、サウンドイベントを非方向性の一過性現象と区別する機能を有する。

さらに、人間の聴覚機構は、たとえ背景信号があっても、開始検出および順応化という特性に、一過性現象を非一過性サウンドおよびサウンドイベントと区別することができる。開始検出は、人類神経学から生じたもので、サウンドの開始点と終了点を決定するほど高度に発達し、それにより、人間の聴覚機構がサウンドの立ち上がりおよび立ち下がり時間に対して特に敏感となっている。順応は、人間の聴覚機構が、定常サウンドの存在を徐々に無視することによって、一過性現象を定常サウンドと区別できるようにしている特性である。さらに、位置特定の目的のために、人間の聴覚機構は、サウンドの開始における特定の周波数および見かけの方向に大きく依存している。人間の聴覚機構が方向を決定するのに最も依存しているのは、約５００Ｈｚおよび約４０００Ｈｚの間の周波数である。この周波数バイアスは、主に外耳（耳介、耳甲介、および耳道）の周波数応答の結果であり、中耳の周波数伝送機能によるものである。人間の聴覚機構は、また、サウンドの他の部分において示されるような方向よりも、サウンドの立ち上がり時に示された方向に依存している。このような依存は、都合がよい。なぜならば、サウンドの立ち上がり時に示された方向は、反響が大きい環境においても、サウンドの反響または残響によって損なわれにくいからである。

個々のサウンドの方向を検出後、人間の聴覚機構は、関連するサウンドをストリームに組み立て直して、各ストリームの方向を別々に決定する。各ストリームの方向は、一般的には、ストリーム内のすべてのサウンドの平均的な方向となる。いずれにせよ、関連するサウンドをストリームに組み立て直して各ストリームの方向を決定する処理は、人間の聴覚機構によって無意識かつ自動的に行われる。

人間の聴覚機構の特性をモデル化して、音場におけるサウンドイベントの発生を示す信号を発生するサウンドイベント検出方法を考案した。このようなサウンドイベント検出方法は、サウンドイベントの発生を検出する開始検出特性を利用している。開始検出特性をモデル化して、サウンドイベントに典型的な始まりを識別し、この始まりを利用してトリガ信号を生成する。さらには、サウンドイベント検出方法は、順応特性を利用して、トリガ信号の精度を向上させてもよい。順応特性をモデル化して、定常サウンドの音場に対すして及ぼしかねない影響を徐々に低減させる。このよう影響は、音場で低減されて、差分信号を生じさせる。その後、開始検出モデルがこの差分信号を用いて、改良されたトリガ信号を発生させてもよい。また、サウンドイベント検出方法は、人間の聴覚機構にとって重要な周波数を強めることを含んでもよい。

また、人間の聴覚機構特性を利用して、背景信号がある状態で生じるサウンドイベントの位置を決定するためのサウンドイベント検出および特定方法を考案した。このようなサウンドイベント検出および特定方法は、トリガ信号がサウンドイベントが生じたことを示す場合にはいつでも、サウンドイベントの方向を示す少なくとも１つの指向角（差分指向角）を生成する。サウンドイベント検出および特定方法は、差分信号を用いて、各入力チャンネル対の各入力チャンネルにおける、定常サウンドを除去した後のサウンドイベントの相対的な電力を比較することによって、差分指向角を決定する。既知の方法において行われるような、各入力チャンネル対の各入力チャンネルにおける電圧の比較の代わりに、各入力チャンネル対の各入力チャンネルにおける電力を比較することによって、個々のサウンドイベントを識別しかつ別個に特定することができる。

人間の聴覚機構特性を利用して、音場内のすべてのサウンドの位置を決定してもよい。サウンドイベント検出および特定方法を、サウンドの意図した方向を決定するための既知の方法と組み合わせることによって、背景サウンドがある状態でどのようなサウンドが組み合わせてあっても個別のサウンドをより正確に特定するサウンド特定方法を開発した。サウンド特定方法は、音場をサウンドイベントと非サウンドイベントとに分割して、真の差分指向角または真の通常指向角で示されるサウンドイベントと、フィルタ後の通常指向角で示される非サウンドイベントとを特定する。これらの方法は、基本的には、非サウンドイベントを方向が個別に決定される個別サウンドとして扱う。サウンド特定方法、サウンドイベント検出および特定方法、ならびにサウンドイベント検出方法は、入力チャンネル対の数がいくつであっても、そこにおいて生成される音場のサウンドイベント型の数および組み合わせがどのようなものであっても、実施可能である。

人間の聴覚機構特性をモデル化して、背景信号がある状態でサウンドイベントを検出する電子回路を考案した。このようなサウンドイベント検出器を、特定の型のサウンドイベント検出の助けとなる様々な応用に用いてもよい。例えば、音節を検出するサウンドイベント検出器を、音声検出器の一部または音声認識または音声符号化システムの一部として用いてもよい。他の例では、音節を検出するサウンドイベント検出器を、マイクロフォンなどの音声増幅装置と共に用いてもよい。これにより、マイクロフォンは、スピーカから音節が検出されるまでオフにしておくことができ、スピーカが音を出さないときに、マイクロフォンが、所望しないサウンドおよびフィードバックをマイクロフォン自体を介して増幅しないようにする。サウンドイベント検出方法と同様に、サウンドイベント検出器は、開始検出特性および順応特性のモデルに基づき、サウンドイベントの発生を示す、パルスなどの何らかのフラグまたはマーカを含むトリガ信号を一般に生成する。

人間の聴覚機構特性をモデル化して、背景信号がある状態でサウンドイベントを検出および特定する電子回路を考案した。このようなサウンドイベント検出器および特定器は、サウンドイベント検出および特定方法と同様に、差分指向角または通常指向角で表される１つ以上の入力チャンネル対に関連して、サウンドイベントの方向を決定し、場合によっては、指向角の精度を検証する。サウンドイベント検出器および特定器の用途の一例としては、ステレオ／サラウンド検出器がある。ステレオ／サラウンド検出器は、音場が２つの入力チャンネルまたは２つ以上の入力チャンネルでの再生用であるかどうかを決定する。

人間の聴覚機構特性をモデル化して、背景信号がある状態でサウンドイベントを検出および特定する電子回路（「サウンドイベント検出器」と総称する）を考案した。サウンドイベント検出器を、特定の型のサウンドイベント検出の助けとなる様々な応用に用いてもよい。例えば、音節を検出するサウンドイベント検出器を、音声検出器の一部ならびに会話認識または会話符号化システムの一部として用いてもよい。他の例では、音節を検出するサウンドイベント検出器を、マイクロフォンなどの音声増幅装置と共に用いてもよい。これにより、マイクロフォンは、スピーカから音節が検出されるまでオフにしておくことができ、スピーカが音を出さないときに、マイクロフォンが、所望しないサウンドおよびフィードバックをマイクロフォン自体を介して増幅しないようにする。サウンドイベント検出器は、サウンドイベント検出方法と同様に、開始検出特性および順応特性のモデルに基づき、サウンドイベントの発生を示す、パルスなどの何らかのフラグまたはマーカを含むトリガ信号を一般に生成する。また、サウンドイベント検出方法と同様に、サウンドイベント検出器は、入力チャンネルの数がいくつであっても、そこにおいて生成される音場のサウンドイベント型の数および組み合わせがどのようなものであっても、実施可能である。

サウンドイベント検出方法、サウンドイベント検出および特定方法、サウンド特定方法は、サウンドイベント検出器、サウンドイベント検出器および特定器、ならびにサウンド特定器と同様に、サウンドイベント装置および／またはコンピュータが読み取り可能なソフトウェアコードで実施されてもよい。

本発明の他のシステム、方法、特徴および利点は、以下の図面および詳細な説明を考察することで、当業者に明らかであり、または明らかとなるであろう。そのような他のシステム、方法、特徴および利点は、本説明内に含まれ、本発明の範囲内に含まれ、および以下の請求項によって保護されることが意図されている。
（項目１）
音場におけるサウンドイベントを検出するための方法であって、
人間の聴覚機構の順応特性をモデル化し、
順応特性に応じて、任意の背景サウンドからサウンドイベントを分離し、
人間の聴覚機構の開始検出特性をモデル化し、
開始検出特性に応じて、サウンドイベントを検出する。
（項目２）
人間の聴覚機構の周波数バイアス特性をモデル化し、
周波数バイアス特性に応じて、音場における方向的に重要な周波数を強めることをさらに含む、項目１に記載の方法。
（項目３）
コンピュータが読み取り可能なプログラムコードを記憶するコンピュータが読み取り可能な記憶媒体であって、
音場を符号化するデータと、
音場におけるサウンドイベントを検出するためのサウンドイベント検出方法を実施するためのコンピュータコードとを備える。
（項目４）
音場は、単一のチャンネルにおいて生成され、サウンドイベント検出方法は、単一チャンネルおよび単一サウンドイベント型用のサウンドイベント検出方法を含み、単一サウンドイベント型のサウンドイベントを検出する、項目３に記載のコンピュータが読み取り可能なプログラムコードを記憶するコンピュータが読み取り可能な記憶媒体。
（項目５）
サウンドイベント検出装置であって、
音場を受信するインターフェース部と、
検出部とを含み、検出装置は、
インターフェース部に接続され、音場を受信するプロセッサと、
プロセッサに接続され、サウンドイベント検出方法を記憶するメモリとを備え、プロセッサからの要求に応答して、メモリは、サウンドイベント検出方法をプロセッサに伝達し、プロセッサは、サウンドイベント検出方法を用いて、音場におけるサウンドイベントを検出し、プロセッサは、トリガ信号をインターフェース部に伝達する。
（項目６）
サウンドイベント検出器であって、
音場を受信して、デシベル電圧信号を生成するリニア‐デシベル変換器と、
デシベル電圧信号を受信して、１つ以上のサウンドイベントが音場で発生したことを示すトリガ信号を生成するトリガ生成回路とを備える。
（項目７）
音場におけるサウンドイベントを検出するためのサウンドイベント検出器であって、
音場を受信してフィルタ後の電力信号を生成する開始検出モデル化手段と、
フィルタ後の電力信号を受信して、順応化された信号を生成する順応性モデル化手段と、
サウンドイベントを順応化された信号に存在する雑音と区別する手段であって、順応性モデル化手段に接続されて、順応化された信号を受信して、トリガ信号を生成する手段とを備える。
（項目８）
音場におけるサウンドイベントを検出および特定するための方法であって、音場は１つ以上の入力チャンネルで生成され、方法は、
人間の聴覚機構の順応特性をモデル化することによって、各入力チャンネル対における入力チャンネル毎の順応信号を生成し、
人間の聴覚機構の開始検出特性をモデル化することで、各入力チャンネル対におけるサウンドイベントを検出し、
初期差分指向角を、各入力チャンネル対における順応信号の関数として決定する。
（項目９）
コンピュータが読み取り可能な記憶媒体であって、
音場を符号化するデータと、
音場におけるサウンドイベントを検出および特定するためのサウンドイベント検出および特定方法を実施するコンピュータコードとを備える。
（項目１０）
音場におけるサウンドイベントを検出および特定するための装置であって、
音場を受信するためのインターフェイス部と、
検出部とを備え、検出装置は、
インターフェイス部に接続して、音場を受信するプロセッサと、
プロセッサに接続して、サウンドイベント検出および特定方法を記憶するメモリとを含み、プロセッサからの要求により、メモリは、サウンドイベント検出および特定方法をプロセッサに伝達し、プロセッサは、音場におけるサウンドイベントを検出するためのサウンドイベント検出および特定方法を用いて、音場におけるサウンドイベントを検出して、サウンドイベントが検出される度に、少なくとも１つの真の差分指向角を生成し、少なくとも１つの真の差分指向角をインターフェイス部に伝達する。
（項目１１）
１以上の入力チャンネル対において生成される音場用のサウンドイベント検出器および特定器であって、
音場を受信して、１つ以上のサウンドイベントの発生を示すトリガ信号を生成する、入力チャンネル対毎のサウンドイベント検出器と、
１つ以上のサウンドイベントの発生を示す、いずれかのチャンネル対からのトリガ信号に応答して、差分指向角を生成する、入力チャンネル対毎のサウンドイベント特定器とを備える。
（項目１２）
音場におけるサウンドイベントを特定するための方法であって、音場は１つ以上の入力チャンネル対において生成され、方法は、
入力チャンネル対毎に差分指向角を決定し、
入力チャンネル対毎に、１つ以上のサウンドイベントの発生を示すトリガ信号を決定し、
チャンネル対毎に通常差分指向角を決定し、
トリガ信号に応答して、差分指向角または通常差分指向角を選択する。
（項目１３）
コンピュータが読み取り可能な記憶媒体であって、
音場を符号化するデータと、
音場を特定するためのサウンド特定方法を実施するコンピュータコードとを備える。
（項目１４）
音場を特定するための装置であって、
音場を受信するためのインターフェイス部と、
検出部とを備え、検出装置は、
インターフェイス部に接続されて、音場を受信するプロセッサと、
プロセッサに接続して、サウンド特定方法を記憶するメモリとを含み、プロセッサからの要求により、メモリは、サウンド特定方法をプロセッサに伝達し、プロセッサは、サウンド特定方法を用いて、音場における１つ以上のサウンドイベントを検出して、１つ以上のサウンドイベントが検出される度に、少なくとも１つの真の差分指向角で表される音場を特定し、サウンドイベントが検出されないときは、少なくとも１つの通常指向角で表される音場を特定し、少なくとも１つの真の差分指向角または少なくとも１つの通常指向角をインターフェイス部に伝達する。
（項目１５）
１つ以上の入力チャンネル対において生成された音場用のサウンド特定器であって、
音場を受信して、１つ以上のサウンドイベントを示すトリガ信号を生成する、入力チャンネル対毎のサウンドイベント検出器と、
１つ以上のサウンドイベントの発生を示すいずれかのチャンネル対からのトリガ信号に応答して、少なくとも１つの真の差分指向角または少なくとも１つの通常指向角を入力チャンネル対毎に生成し、そうでなければ、少なくとも１つの通常指向角を入力チャンネル対毎に生成する、入力チャンネル対毎のサウンド特定回路とを備える。

本発明は、以下の図面および説明を参照して、いっそうよく理解されうる。図面における構成要素は、設計のためのものでは必ずしもなく、むしろ本発明の原理を説明することに重点を置いたものである。図面において、

図１は、単一入力チャンネルおよび単一サウンドイベント型用サウンドイベント検出方法のフローチャートである。図２は、順応方法のフローチャートである。図３は、一過性現象の開始が識別され、一過性現象が背景音から分離される前、最中、および後の音場のサンプル部分についての一連の時間領域のグラフである。図４は、単一入力チャンネル用開始検出方法のフローチャートである。図５は、複数入力チャンネル用サウンドイベント検出方法のフローチャートである。図６は、複数入力チャンネル用開始検出方法のフローチャートである。図７は、単一入力チャンネルおよび複数サウンドイベント型用サウンドイベント検出方法のフローチャートである。図８は、複数入力チャンネルおよび複数サウンドイベント型用サウンドイベント検出方法のフローチャートである。図９は、単一入力チャンネル対および単一サウンドイベント型用サウンドイベント検出および特定方法のフローチャートである。図１０は、複数入力チャンネル対および単一サウンドイベント型用サウンドイベント検出および特定方法のフローチャートである。図１１は、複数入力チャンネル対および単一サウンドイベント型用サウンドイベント検出および特定方法のフローチャートである。図１２は、単一入力チャンネル対および複数サウンドイベント型用サウンドイベント検出および特定方法のフローチャートである。図１３は、サウンド特定方法のフローチャートである。図１４は、単一入力チャンネル対および単一サウンドイベント型用方向選択方法のフローチャートである。図１５は、単一入力チャンネル対および単一短期サウンドイベント用方向選択方法のフローチャートである。図１６は、複数入力チャンネル対および単一サウンドイベント型用方向選択方法のフローチャートである。図１７は、差分指向角決定方法のフローチャートである。図１８は、複数入力チャンネル対および単一短期サウンドイベント用方向選択方法のフローチャートである。図１９は、サウンドイベント装置のブロック図である。図２０は、単一入力チャンネルおよび単一サウンドイベント型用サウンドイベント検出器のブロック図である。図２１は、単一入力チャンネル用順応回路の回路図である。図２２は、単一入力チャンネル用トリガ生成回路の回路図である。図２３は、単一入力チャンネルおよび短期サウンドイベント用サウンドイベント検出器の回路図である。図２４は、複数入力チャンネルおよび単一サウンドイベント型用サウンドイベント検出器のブロック図である。図２５は、複数入力チャンネル対用交互トリガ生成回路の回路図である。図２６は、単一入力チャンネルおよび複数サウンドイベント型用サウンドイベント検出器のブロック図である。図２７は、複数入力チャンネルおよび複数サウンドイベント型用サウンドイベント検出器のブロック図である。図２８は、単一入力チャンネル対および単一サウンドイベント型用サウンドイベント検出器のブロック図である。図２９は、単一入力チャンネル対および単一サウンドイベント型用サウンドイベント特定回路の回路図である。図３０は、複数入力チャネル対および単一サウンドイベント型用サウンドイベント検出器および特定器のブロック図である。図３１は、複数入力チャンネル対および単一サウンドイベント型用サウンドイベント特定回路の回路図である。図３２は、単一入力チャンネル対および複数サウンドイベント型用サウンドイベント検出器および特定器のブロック図である。図３３は、複数入力チャンネル対および複数サウンドイベント型用サウンドイベント検出器および特定器のブロック図である。図３４は、単一サウンドイベント型用ステレオ／サラウンド検出器のブロック図である。図３５は、複数サウンドイベント型用ステレオ／サラウンド検出器のブロック図である。図３６は、単一入力チャンネル対および単一サウンドイベント型用サウンド特定器のブロック図である。図３７は、単一入力チャンネル対および単一サウンドイベント型用サウンド特定回路の回路図である。図３８は、単一入力チャンネル対および短期サウンドイベント用サウンド特定回路の回路図である。図３９は、複数入力チャンネル対および単一サウンドイベント型用サウンド特定器のブロック図である。図４０は、複数入力チャンネル対および単一サウンドイベント型用サウンド特定回路の回路図である。図４１は、単一入力チャンネル対および複数サウンドイベント型用サウンド特定回路のブロック図である。図４２は、単一入力チャンネル対および複数サウンドイベント型用サウンド特定器のブロック図である。図４３は、複数入力チャンネル対および複数サウンドイベント型用サウンド特定器のブロック図である。

（好ましい実施形態の詳細な説明）
開発したサウンド検出および特定システムならびにその方法および装置は、人間の聴覚機構の特性に基づいて、複雑な音場におけるサウンドイベントの方向を検出し、個別に決定する。耳、聴覚システム、脳の関連部位を含む人間の聴覚機構がモデルとして選ばれた基本的な理由は、２つある。第１は、人間の聴覚機構は、サウンドを検出し、既存のシステムの欠点を有することなく、極めて効果的にその方向を決定するからである。第２の理由は、人間の聴覚機構を模してモデル化されたシステムで生じる誤りは、一般的に、人間の聴覚機構によって生じるのと同様の誤りであり、このような誤りは聞き取れないようになっている。

人間の聴覚機構を研究し、サウンド検出および特定システムを構築するモデルとして用いた。周波数バイアス、開始検出特性、順応特性、および人間の聴覚機構の開始依存性をモデル化することによって、極めて効果的で高品質の方法を、定常サウンドがある状態でのサウンドイベントの検出、定常サウンドがある状態でのサウンドイベントの検出および特定、および音場においてのすべてのサウンドの検出および特定のために考案した。このような方法は、ソフトウェアおよびハードウェアで実施して、広範囲の応用に適用可能なプログラム、装置、およびより複雑なシステムを構築することもできる。

既存のサウンド検出および特定ステムが遭遇する問題の多くは、人間の聴覚機構では生じない。例えば、人である聴取者は、通常、残響の多い音楽では、音楽の急速な動きおよびその音源を認識できない。さらに、人間の聴覚機構は、音場を個別のサウンドに分解することによって、音場におけるサウンドを特定し、個別のサウンドの方向を決定し、関連するサウンドをストリーム（特定の楽器のメロディラインまたは特定の話者からの会話の一下りなど）に組み立て直し、ストリーム内の個別のサウンドの平均方向に基づいて、ストリームの向きを決定する。人間の聴覚機構が有する頑丈な性質によって、サウンドを区別して方向を決定する機能が強化され、たとえストリームにおけるサウンドの方向が正確に決定されるのは５０％であっても、ストリーム全体の方向が正確に決定される可能性は高い。

音場を個別のサウンドに分解する際に、人間の聴覚機構は、一過性サウンドを他のサウンドと区別し、サウンドイベントを非方向性の一過性現象と区別する機能を有する。さらに、人間の聴覚機構は、背景信号がある状態でも、開始検出および順応に依存することによって、一過性現象を非一過性サウンドと区別し、サウンドイベントを他の一過性サウンドとを区別することができる。開始検出は、人類神経学から生じたもので、サウンドの開始点と終了点を決定するほど高度に発達し、それにより、人間の聴覚機構がサウンドの立ち上がりおよび立ち下がり時間に対して特に敏感となっている。順応は、人間の聴覚機構が、定常サウンドの存在を徐々に無視することによって、一過性現象を定常サウンドと区別できるようにしている特性である。開始検出および順応特性ならびにそれらの効果は、実験によって発見および実証済みである。ヘッドホンによる実験では、音の（方向を示すものとしての）方位角は、音が貸しまたは停止したときにのみ検出可能である。音が連続している場合には、その方向を決定するのは非常に難しくなる。さらに、新しいサウンドが定常音に吹かされる場合には、新たなサウンドの真の方向は容易に決定される。これは、人間の聴覚機構はサウンドの開始および終了を含む一過性成分に特に敏感であり、サウンドの開始および終了を用いて特定をしている（開始検出特性）ということを示している。また、これは、人間の聴覚機構は定常サウンドを無視して、特定には一般的に依拠していない（順応特性）ということを示している。さらにわかったことは、人間の聴覚機構が定常サウンドを徐々に無視する速度（順応速度）は、検出しようとするサウンドイベント型とは無関係であるということである。また、順応速度は、一定でなくてもよく、音響条件および会話の速さに適応してもよいということもわかった。しかしながら、順応速度の合理的平均値は約３００ｍｓということがわかった。

さらに、位置特定の目的のために、人間の聴覚機構は、サウンドの開始における特定の周波数および見かけの方向に大きく依存している。人間の聴覚機構が方向を決定するのに最も依存しているのは、約５００Ｈｚおよび約４０００Ｈｚの間の周波数である。この周波数バイアスは、主に外耳（耳介、耳甲介、および耳道）の周波数応答の結果であり、中耳の周波数伝送機能によるものである。人間の聴覚機構は、また、サウンドの他の部分において示されるような方向よりも、サウンドの立ち上がり時に示された方向に依存している。このような依存は、都合がよい。なぜならば、サウンドの立ち上がり時に示された方向は、反響が大きい環境においても、サウンドの反響または残響によって損なわれにくいからである。

個々のサウンドの方向を検出後、人間の聴覚機構は、関連するサウンドをストリームに組み立て直して、各ストリームの方向を別々に決定する。各ストリームの方向は、一般的には、ストリーム内のすべてのサウンドの平均的な方向となる。多くの場合、サウンドは前景ストリームおよび背景ストリームに組み立て直される。一例として、前景ストリームは、会話によって成り立ち、背景ストリームは、会話源の周りで生じている環境サウンドによって成り立っていてもよい。いずれにせよ、関連するサウンドをストリームに組み立て直して各ストリームの方向を決定する処理は、人間の聴覚機構によって無意識かつ自動的に行われる。

人間の聴覚機構特性を適用することによって開発したシステムは、（ａ）音場内のサウンドイベントを検出する、（ｂ）音場からサウンドイベントを検出および特定する、および（ｃ）音場内のすべてのサウンドを特定する。このような方法、装置、およびシステムは、人間の聴覚機構特性を利用して、音場を個別のサウンドに分化し、個別のサウンドイベントを区別し、個別のサウンドイベントおよび他のサウンドの方向を決定する。個別のサウンドの方向を用いて音場を再生する場合は、関連サウンドをストリームに組み立てなおして各ストリームの方向を決定するのは、人間の聴覚機構に委ねられている。

（１．サウンドイベントを検出するための方法）
人間の聴覚機構特性をモデル化して、背景信号がある状態でサウンドイベントを検出するための方法（「サウンドイベント検出方法」と総称する）を考案した。サウンドイベント検出方法は、サウンドイベントの発生を示す、パルスなどのフラグまたはマーカを含む信号（本願において「トリガ信号」称する）を生成する。サウンドイベント検出方法は、入力チャンネルの数がいくつであっても、そこにおけるサウンドイベントの数および組み合わせがどのようなものであっても、検出を実施することができる。以下の説明では、複雑でないものから順にサウンドイベント検出方法を説明し、各サウンドイベント検出方法は、特に示さない限り、それに先立って説明した方法のステップを含むものとする。

単一の入力チャンネルにおいて生成された単一のサウンドイベント型のみを音場から検出する、背景信号がある状態でのサウンドイベント検出方法（「単一入力チャンネルおよび単一サウンドイベント型用サウンドイベント検出方法」）の一例を、図１に参照番号１００で示す。単一入力チャンネルおよび単一サウンドイベント型用サウンドイベント検出方法１００は、周波数バイアスをモデル化することによって、方向的に重要な周波数を強めること（１０４）と、順応性をモデル化することによって、分離することによってサウンドイベントを背景サウンドから分離すること（１０６）と、開始検出をモデル化することによって、サウンドイベントを検出すること（１０８）とを含む。

周波数強化方法を用いて、方向的に重要な周波数は、人間の聴覚機構の周波数バイアスをモデル化することによって強められる（１０４）。周波数強化方法は、各入力チャンネルの約５００Ｈｚおよび約４ｋＨｚの間の周波数を強めて、各入力チャンネルのフィルタ後の信号を生成することを含む。これらの周波数を強めるのは、方向を決定する際に、これらの周波数が人間の聴覚機構に最も影響を与えるからである。順応性をモデル化することによってサウンドイベントを背景サウンドから分離すること（１０６）は、一般的に、音場での入力電力の変化を調べることを含み、より詳細には図２に示されている。より特定的には、順応性をモデル化することによってサウンドイベントを背景サウンドから分離すること（１０６）（「順応方法」）は、入力チャンネルの電力エンベロープを決定すること（２０１）と、任意の定常サウンドにおける電力を決定すること（２０２）と、任意の定常サウンドにおける電力を入力チャンネルの電力エンベロープから差し引くこととを含む。入力チャンネルの電力エンベロープを決定すること（２０１）は、一般的に、入力チャンネルにおける電圧を二乗することを含む。音場は、それが生であろうと録音から生じようと、一般的に時間領域における電圧信号として表される。都合の悪いことに、電圧信号は付加特性を有していない。すなわち、１つの電圧信号の組み合わせから生じる電圧信号の大きさは、単に２つの電圧信号の振幅を単純に加算することによっては決定できない。しかしながら、電力信号には、付加特性がある。したがって、電圧信号を電力信号に変換することにより（一般的に、電圧信号を二乗することにより）、他の電力信号を差し引くことが可能な電力エンベロープが生じる。より滑らかな（変動の少ない）電力エンベロープを得るためには、検出しようとするサウンドイベントに特徴的でない電力エンベロープ内の変動を除去してもよい。例えば、音節を検出しようとする場合、３３ｍｓよりも速い立ち上がり時間の変動は、電力エンベロープから除去される。

音場の任意の定常信号の電力を決定すること（２０２）は、音場の長期平均電力を決定することを含む。長期平均電力（本願において「順応信号」と称する）、検出しようとするサウンドイベントの立ち上がり時間に等しい時間の電力パワーを積分することによって決定してもよい。サウンドイベントが最大値（サウンドイベントの立ち上がりの最後）に達すると、順応信号は、人間の聴覚機構の順応速度に等しい速度（約３００ｍｓ）で電力エンベロープから徐々に差し引かれ（２０４）、人間の聴覚機構がサウンドイベントがある状態で定常サウンドの効果を徐々に無視するやり方をモデル化する。順応性を制御するためには、順応信号は、常に電力エンベロープ以下にされる。したがって、サウンドイベントが終了して電力エンベロープが急速に降下すると、順応信号は、電力エンベロープに等しくなる。順応信号を信号電力の絶対値から差し引くと、「差分信号」となる。この差分信号は、正のパルスおよびその他の変動を含む。差分信号における各パルスは、サウンドイベントおよび他の変動が残響、ガウス雑音、および前景ストリームに現在存在しないであろう他の信号といった雑音によって生じることを示す。

順応方法が入力信号にどのように影響を与えるかを、図３に示す。図３の時間軸のグラフＡは、音場のサンプル区間を示す。この区間は、音節３００に特徴的である、様々な周波数のサウンド波の集まりを含む。この音節の大きさは、信号「Ｖ」の電圧である。電圧Ｖは、時間「ｔ」とともに変化し、「Ｄ」という持続期間を有する。時間軸のグラフＢは、電力信号に変換された（図２のステップ２０１）後のセグメント３００であるパルス３０２を示す。パルス３０２は、信号の電力（「Ｖ^２」）を表す振幅を有し、また、持続期間Ｄを有する。時間軸のグラフＣは、音節に特徴的でない立ち上がり時間での変動を除去した後のパルス３０２であるパルス３０４を示す。パルス３０４は、また、振幅Ｖ^２を有し、約３３ｍｓに等しい立ち上がり時間ｔ_ｒを有する。時間軸のグラフＤは、順応信号を差し引くことによって定常サウンドを順応化させた後のパルス３０４であるパルス３０６を示す。パルス３０６の立ち上がり時間は、パルス３０４に準ずる。しかしながら、音節が最大値に達した後（ｔ_ｒの後）、同時に発生する定常信号の効果が、人間の聴覚機構の順応速度に等しい速度（約３００ｍｓ）で、パルス３０６から除去される。サウンドイベントが終了すると、電力エンベロープＶ^２（パルス３０４）は急速に減少する。Ｖ^２が順応信号「ＡｃｃＳｉｇ」よりも低くなろうとする時点で、ＡｃｃＳｉｇはサウンドイベントの終了まで、Ｖ^２に等しくなるようにされる。これにより、差分信号は０へと向かう。

図１を再び参照して、順応性をモデル化することによって背景サウンドからサウンドイベントを分離すると（１０６）、サウンドイベントは開始検出によって検出される（１０８）。開始検出をモデル化することは、サウンドイベントを差分信号に存在する雑音と区別することを含む。上述したように、差分信号は、急速に立ち上がる一連のパルスおよび雑音を含む。各パルスはサウンドイベントの発生を示し、雑音は、サウンドイベントの発生を誤って示す変動を含む。したがって、サウンドイベントを検出するためには、サウンドイベントは雑音と区別される必要がある。図４により詳細に示す開始検出のモデル化（１０８）は、音量効果を弱めることと、サウンドイベントを強めること（４０４）と、雑音を弱めること（４０６）、サウンドイベントを検出すること（４０８）とを含む。

ステップ４０４，４０６，および４０８を同時に遂行可能な方法としては、差分信号の雑音成分に含まれる短期平均電力（「短期平均高周波数電力」）によって、差分信号を調整することが挙げられる。一般的に自動利得制御に関連する手法（「自動利得方法」）を用いて短期平均高周波数電力を分離して、差分信号を分解するために用いる。短期平均高周波数電力の分離は、差分信号をフィルタリングして、検出しようとしているサウンドイベント型に特徴的な周波数よりも高い周波数の差分信号成分を取得し、かつ短期間に渡って高周波数部分を積分することによって行われる。この短期間は、音楽や音声速度によって異なってもよい。しかしながら、広範な様々な入力に関してうまくいくのは、約１６０ｍｓという値であることが実証された。

自動利得方法を用いて差分信号を正規化すると、目に見えてわかる効果と、それほど目に見えてわかるものではない効果という、２つの効果がある。第１の効果は、差分信号の変動の振幅（電力を表す）に関して差分信号を正規化することによって、差分信号に対する音量効果を弱めること（４０２）である。一般的に、サウンドイベントおよび雑音が大きな音ほど、大きな電力を含み、サウンドイベントおよび雑音が大きな音ほど、それほど大きくないものより、より強く調整される。これは自動利得制御方法の通常の機能である。

第２の効果は、検出しようとするサウンドイベント型に特徴的なもの（例えば、一般的に、音節は、約２００ｍｓ毎に発生または反復する）よりも頻繁に生じる変動を弱めることによって、雑音を弱める（４０６）。一般的に、雑音による差分信号部分の変動は、サウンドイベントに典型的な変動よりも頻繁に生じる。このような雑音変動の急激な反復速度により、差分信号部分を分割する平均高周波電力が増加する。これにより、雑音を含む差分信号部分が弱められる。差分信号を正規化する第３の効果は、検出しようとするサウンドイベント型に特徴的な変動の頻度を決して越えないほどの頻度で発生または反復する変動を強めることによって、サウンドイベントを強めることである（４０４）。検出しようとするサウンドイベント型に典型的な変動の頻度以下の頻度で発生する変動を含む差分信号部分は、差分信号部分を分割する平均高周波電力が（雑音を含むものと比べて）低い。これにより、サウンドイベントが相対的に強められる。

雑音を弱めること（４０６）は、雑音による差分信号の変動の多くを除去することによってさらに達成してもよい。雑音による変動の中には、その立ち上がり時間やたの特性に従って識別して除去可能なものもある。例えば、検出しようとするサウンドイベント型の特徴的でない立ち上がり時間を有する変動は除去される。例えば、検出しようとするサウンドイベント型が音節であれば、３３ｍｓよりも速い立ち上がり時間の音は除去される。他の例として、検出しようとするサウンドイベント型が衝撃音であれば、３．３ｍｓよりも速い立ち上がり時間の音は除去される。さらに、サウンドイベントに特徴的な頻度よりも高い頻度で生じる、ある種の雑音および残響などの振幅の低い一過性現象も、除去することができる。さらに、音場の電力レベルが過去のサウンドイベントよりも約１０ｄＢ以上降下したときにはいつでも、同時に検出された一過性現象は雑音またはある種の他の非方向性一過性現象であるとみなすことができるので、そのような状況下で生じた一過性現象も除去することができる。ステップ４０２，４０４，および４０６の結果、差分信号内の変動の多くは除去されて、サウンドイベントの発生をそれぞれ示すパルスを含んだ、改良された差分信号が生成される。しかしながら、雑音はいくらか残ったままである。

したがって、サウンドイベントの発生を示すパルスのみを含むトリガ信号を生成するには、サウンドイベントを雑音から検出する必要がある（４０８）。なぜなら、この時点は、改良された差分信号の雑音による変動の多くは、サウンドイベントによって生じた変動と比べて振幅が低いので、閾値検出方法を用いて、閾値を越える振幅を有する変動を決定することによって、サウンドイベントを決定する（４０８）。閾値検出方法では、閾値を超えない変動を除去または無視して、トリガ信号を生成する。この方法の利点の１つは、トリガが完璧である必要はないということである。サウンドイベントによっては検出されないものもあり、雑音による変動がサウンドイベントの発生を誤って示すトリガ信号を生じさせる場合もあるという点で、サウンドイベント検出方法は、完璧なものではない。しかしながら、このような時折のエラーは問題ではない。なぜなら、サウンドイベント検出方法は、人間の聴覚機構を模してモデル化されており、人間の聴覚機構で生じる同様の型のエラーを生じさせるからである。したがって、その結果は、全く自然なものとして認識される。

雑音または残響に特徴的な低振幅の変動が検出されないように、閾値が選ばれる。閾値は、実験で決定された固定値であってもよい。しかしながら、閾値が音場の関数として変化すれば、より正確な結果が得られる。例えば、音場が多くのサウンドイベントを含む場合、一般的に、音場が少ないサウンドイベントを含む場合よりも閾値は低くなる。これにより、音場にあるサウンドイベントの数が多ければおおいほど、感度が高くすることができる。

代わりに、音場の性質に従って実験で決定された２つ以上の値から手入力で選択することもできる。例えば、音場が現代音楽またはポピュラー音楽のものである場合は、含まれるサウンドイベント数は典型的には多いので、低い閾値を選択でき、代わりに、音場がクラシック音楽のものである場合には、含まれるサウンドイベント数は典型的には少なく、残響が多いことがあるので、高い閾値を選択できる。代わりに、閾値を、所定の期間検出されたサウンドイベントの数の関数として選択することもできる。したがって、検出されるサウンドイベント数が少ない期間では閾値を高め、検出されるサウンドイベント数が多い期間では閾値を低くする。これにより、音場の関数として閾値の自動的かつ継続的な調節を行うことができ、より正確なトリガ信号を得られる。

任意のサウンドイベント検出方法は、衝撃音などの短期間におけるサウンドイベント（「短期サウンドイベント」）の検出時に特化して用いられる開始検出方法のみを行うことを含んでもよい。衝撃音などの短期サウンドイベントは、順応効果が認識される前に終了することが多い。したがって、サウンドイベント検出方法を簡素化して、入力信号（デシベル単位）に対して、直接、開始検出方法のみを行うことができる。開始検出方法のみを行うサウンドイベント検出方法（「短期サウンドイベント用サウンドイベント検出方法」）は、開始検出方法を行う前に、検出しようとする短期サウンドイベントに特徴的な立ち上がり時間よりも遅い立ち上がり時間の変動を除去することを含んでもよい。例えば、衝撃音が検出される場合に、約３ｍｓよりも遅い立ち上がり時間の入力信号の変動は除去される。

背景信号がある状態で単一のサウンドイベント型を検出す方法は、音場が２つ以上の入力チャンネルで生成される場合にも実施してよい（「複数入力チャンネルおよび単一サウンドイベント型用サウンドイベント検出方法」）。複数入力チャンネルおよび単一サウンドイベント型用サウンドイベント検出方法は、単一入力チャンネルおよび単一サウンドイベント型用のサウンドイベント検出方法を各入力チャンネルに対して並列的に行って、どのようなサウンドイベント型の発生も検出していることを示すトリガ信号を入力チャンネル毎に生成することを含んでもよい。

代わりに、複数入力チャンネルおよび単一サウンドイベント用サウンドイベント検出方法は、各チャンネル別々ではなく、チャンネル対でサウンドイベントを検出することを含んでもよい。一般的に、これは、あるチャンネルの順応化された信号を他のチャンネルの順応化された信号から差し引いて、「差分信号」を生成し、その後、この差分信号をトリガ信号の生成に用いることを含む。しばしば、差分信号は、ある入力チャンネル対のある入力チャンネルの順応信号を当該入力チャンネル対の他の入力チャンネルの順応信号から差し引くことによって生成される。例えば、入力チャンネル対は、左右チャンネル対および／または中央／サラウンド入力チャンネル対を含んでもよい。本願において、「入力チャンネル対」という用語は、２つの入力チャンネルのあらゆる組み合わせおよび入力チャンネルから導出可能なチャンネルを含む。１つ以上の入力チャンネルを用いてトリガ信号を導出する目的は、方向性信号に対象を定めることにある。例えば、電子的に録音された音楽や会話では、方向性信号は、入力チャンネル間の移送および振幅関係によって、他の非方向性信号と区別することができる。例えば、音場は、２つの入力チャンネル間（通常のステレオ）で生成されることが多い。これら２つの入力チャンネルから、４つの電力エンベロープを導出し、この４つの電力エンベロープを２つの電力エンベロープ対にまとめたら便利である。例えば、元の２つの入力チャンネルを、従来の「左」および「右」という名前で示し、結果生じた電力エンベロープを、「左電力」および「右電力」でそれぞれ示して、電力エンベロープ対を作成することもできる。残りの電力エンベロープ対は、「左＋右電力」および「左−右電力」という２つの入力チャンネルの和および差から導出された電力エンベロープで構成されている。また、この対は、「中央電力」または「サラウンド電力」と称されることが多い。非方向性の信号は、これら２つのすべてを発生させて同時に立ち上げることをほとんど常に行う。差分信号を用いてトリガ信号を生成する場合に、非方向性の一過性現象は、差分信号の立ち上げを行わないのは、各入力チャンネルで同一だからである。これに対して、例えば左入力チャンネルのみのサウンドイベントなどの方向性信号は、「左電力」エンベロープの大きな変化を生じさせ、「右電力」エンベロープでは対応する増加は生じない。したがって、左および右の順応化された信号から生成された差分信号が大きく増加し、この変化を用いて、方向性信号を非方向性信号と優先的に区別するトリガを生成することができる。

チャンネル対でのサウンドイベントを検出することを含む、複数入力チャンネルおよび単一サウンドイベント用サウンドイベント検出方法５００を、図５に示す。当該方法は、周波数バイアスをモデル化することによって、方向的に重要な周波数を強めること（５０４）、各入力チャンネルにおいて順応性をモデル化することによって、各入力チャンネルにおけるサウンドイベントを背景サウンドから分離すること（５０６）、および各入力チャンネル対において開始検出をモデル化することによって、各チャンネル対からサウンドイベントを検出することとを含む。周波数強化方法を用いて、方向的に重要な周波数を強める（５０４）。その後、順応方法を用いて、サウンドイベントを、各入力チャンネルにおいて背景信号から分離し（５０６）、入力チャンネル毎に差分信号を生成する。その後、入力チャンネル対毎に並行して行う交互開始検出方法と、チャンネル対毎の差分信号とを用いて、サウンドイベントを各入力チャンネル対から検出する（５０８）。

交互開始検出方法の詳細を図６に示す。この方法は、入力チャンネル対毎に差分信号を決定すること（６０１）と、各入力チャンネル対における音量効果を弱めること（６０２）と、各入力チャンネル対におけるサウンドイベントを強めること（６０４）と、各入力チンネル対における雑音を弱めること（６０６）と、各入力チャンネル対からサウンドイベントを検出すること（６０８）とを含んでもよい。したがって、複数入力チャンネル用サウンドイベント区別方法は、各入力チャンネル対の差分信号に対して行われるサウンドイベント区別方法と同じステップを含む。

差分信号の決定（６０１）は、ある入力チャンネル対の各入力チャンネルにおける差分信号間の差を決定し、この差を整流化することによって行われる。入力チャンネル対の入力チャンネル間の差は、入力チャンネル対のいずれかの入力チャンネルでサウンドイベントが発生したことを示す正および負のパルスの両方を含む。このパルスは、入力チャンネル対のうちのどちらの入力チャンネルが特定のサウンドイベントの電力の大半を反映するかによって、負にも正にもなる。したがって、この差を整流化して、正のパルスのみの差分信号を生成する。上述したように、差分信号は依然としてサウンドイベントを示して入るものの、両方の入力チャンネルに共通のサウンドイベントを示してはいない。したがって、差分信号は、個別の入力チャンネルの差分信号よりも信号体雑音比がよくなる。さらに、差分信号は、入力チャンネル対の両方の入力チャンネルで同一の信号を含んでいないので、一般的にすべての入力チャンネルにおいて同一である、雑音などの所定の非方向性信号を除去するのに役立つ。差分信号を入力チャンネル対毎に決定すると（６０１）、差分信号に対する音量効果を弱め（６０２）、サウンドイベントを強め（６０４）、自動利得方法を用いて差分信号における雑音を弱めて（６０６）、残存する一過性現象の存在を示す一連のパルスを生成する。その後、所定の閾値より大きいパルスがどれかを決定することによって、サウンドイベントを各入力チャンネルから検出する（６０８）。一般的に、ステップ６０２，６０４，および６０８は、残存する一過性現象を示すパルスがすべて正となるように、整流化ステップを含む。ステップ６０８の結果、サウンドイベント発生をを示す入力チャンネル毎の正のパルスを有するトリガ信号が生じる。このサウンドイベント検出方法は、複数の入力チャンネル対に対して実施してもよく、入力チャンネル対毎に本方法を行って、入力チャンネル対毎に別々のトリガ信号を生成してもよい。

複数入力チャンネルおよび単一サウンドイベント型用サウンドイベント検出方法は、複数のチャンネル対のサウンドイベント型を検出することを含んでもよい（「複数チャンネル対および単一サウンドイベント型用サウンドイベント検出方法」と総称する）。このような方法は、一般的に、１つ以上のチャンネル対または４つの電力エンベロープを導出できる単一チャンネル対に対して実施される交互開始検出方法を含んだ、複数チャンネルおよび単一サウンドイベント型用サウンドイベント検出方法を含む。

また、背景信号がある状態で１つ以上のサウンドイベントを検出するための方法は、音節および衝撃音などの複数のサウンドイベント型を単一の入力チャンネルから検出するように実施されてもよい（「単一入力チャンネルおよび複数サウンドイベント型用サウンドイベント検出方法」）。音節および衝撃音の両方を検出する、単一入力チャンネルおよび複数サウンドイベント型用サウンドイベント検出方法の一例を、図７に示す（この方法は、サウンドイベント型の数および組み合わせがどのようなものであっても、それを検出するように実施されてもよい）。図７に示す単一入力チャンネルおよび複数サウンドイベント用サウンドイベント検出方法例７００は、基本的に、開始検出をモデル化することによって、方向的に重要な周波数を強めること（７０４）と、順応性をモデル化することによって、サウンドイベントを背景サウンドから分離すること（７０６）と、開始検出をモデル化することによって、音節を検出すること（７０８）と、開始検出をモデル化することによって、衝撃音を検出すること（７１２）とを含む。音節および衝撃音は同時に発生することが多いことを理解することが重要である。

方向的に重要な周波数の強化（７０４）は、周波数バイアス方法を用いて行われる。その後、順応方法を用いて、サウンドイベントを背景信号から分離して（７０６）、差分信号を生成する。結果を改善するために、順応方法は、音節に特徴的でない立ち上がり時間（約３３ｍｓを超える時間）の電力エンベロープの変動を除去することを含んでもよい。その後、単一入力チャンネル用の開始検出方法（図４を参照）を用いて音節を検出し（７１０）、短期サウンドイベント用サウンドイベント検出方法を用いて衝撃音を検出する。図４に関連して説明したように、サウンドイベントの検出は、音量効果を弱めることと、サウンドイベントを強めることと、自動利得方法を用いて特定の変動を除去することによって雑音を弱めることと、閾値検出方法を用いてサウンドイベントを検出することとを含む。しかしながら、この場合、音節を検出する際には、差分信号を正規化するための短期高周波電力は、約１６７ｍｓを超えて決定された約３０Ｈｚを超える差分信号成分内の電力である。さらに、除去された変動は、３３ｍｓ以下の立ち上がり時間の変動である。逆に、このような場合、衝撃音を検出する際には、単一短期サウンドイベント用サウンドイベント検出方法は、所定の周波数を除去することと、音量効果を弱めることと、サウンドイベントを強めることと、自動利得方法を用いて所定の変動を除去することによって雑音を弱めることと、閾値検出方法を用いてサウンドイベントを検出することとを含む。しかしながら、衝撃音を検出する際には、自動利得方法は、差分信号の代わりに入力信号（デシベル単位）を用いる。さらに、除去される変動は、約３ｍ以下の立ち上がり時間の変動である。

また、背景信号がある状態で１つ以上のサウンドイベントを検出するための方法は、サウンドイベントの複数の型を複数の入力チャンネルで生成された音場で検出できるように実施されてもよい（「複数入力チャンネルおよび複数サウンドイベント用サウンドイベント検出方法」）。複数入力チャンネルおよび複数サウンドイベント用サウンドイベント検出方法は、音場の入力チャンネル毎に単一入力チャンネルおよび複数サウンドイベント型用サウンドイベント検出方法を並行して実施して、各入力チャンネルにおけるサウンドイベント毎にトリガ信号を生成することを含む。代わりに、図８に示すように、複数入力チャンネルおよび複数サウンドイベント用サウンドイベント検出方法８００は、各サウンドイベントを各入力チャンネルからのみ検出して、それにより各入力チャンネル対におけるサウンドイベント型毎のトリガ信号を生成してもよい。図８の例では、この方法８００を用いて、２つの入力チャンネル（右入力チャンネルおよび左入力チャンネル）における２つのサウンドイベント型（音節および衝撃音）を検出して、入力チャンネル対毎の２つのトリガ信号を生成し、第１のトリガ信号は音節の発生を示し、第２のトリガ信号は衝撃音の発生を示す。しかしながら、本方法は、入力チャンネルの数がいくつであっても、そこで生じるサウンドイベントの数がいくつであっても検出して、サウンドイベント毎のトリガ信号を入力チャンネル対毎に生成するように実施されてもよい。複数入力チャンネルおよび複数サウンドイベント用サウンドイベント検出方法８００は、一般的に、左入力チャンネルの周波数バイアスをモデル化することによって、方向的に重要な周波数を強めること（８０２）と、右入力チャンネルの周波数バイアスをモデル化することによって、方向的に重要な周波数を強めること（８０４）と、左入力チャンネルの順応性をモデル化することによって、サウンドイベントを背景サウンドから分離すること（８０６）と、左入力チャンネルの順応性をモデル化することによって、サウンドイベントを背景サウンドから分離すること（８０８）と、開始検出をモデル化することによって、左右入力チャンネル対の衝撃音を検出すること（８１２）と、開始検出をモデル化することによって、左右入力チャンネル対の音節を検出すること（８１４）とを含む。

方向的に重要な周波数を左右入力チャンネルの両方で別々に強めること（それぞれ８０２および８０４）は、周波数バイアス方法によって行われる。その後、順応方法を用いて、背景サウンドからサウンドイベントを左右入力チャンネルの両方で別々に分離して（それぞれ８０６および８１０）、左右入力チャンネル用の差分信号をそれぞれ生成する。そして、両チャンネルの差分信号を用いて、開始検出をモデル化することによって音節を検出する（８１４）。音節の検出は、開始検出方法を用いて各入力チャンネルにおける音節を検出して、各チャンネルにおける音節の発生を示すトリガ信号を発生するようなものであってもよい。代わりに、音節の検出は、交互開始検出方法を用いて各チャンネル対における音節の発生を示す単一のトリガ信号を発生するようなものであってもよい。開始検出をモデル化することによって衝撃音を検出する（８１２）には、単一チャンネルおよび短期サウンドイベント用サウンドイベント検出方法を用いて、入力チャンネル毎の衝撃音の発生を示すトリガ信号を生成する。この場合、あらゆるサウンドイベント検出方法と同様に、トリガ信号を組み合わせて、少ない数のトリガ信号を生成してもよい。

複数チャンネルおよび複数サウンドイベント型用サウンドイベント検出方法は、複数のチャンネル対における１つ以上のサウンドイベント型を検出することを含んでもよい（「複数チャンネル対および複数サウンドイベント型用サウンドイベント検出方法」と総称する）。このような方法は、一般的に、１つ以上のチャンネル対または４つの電力エンベロープを導出できる単一チャンネル対に対して実施される交互開始検出方法を含んだ、複数チャンネル対および複数サウンドイベント型用サウンドイベント検出方法を含む。

（２．サウンドイベントを検出および特定するための方法）
人間の聴覚機構特性を利用して、背景信号がある状態で生じるサウンドイベントの位置を決定するための方法を考案した（「サウンドイベント検出および特定方法」と総称する）。前述したように、複数の入力チャンネル用のサウンドイベント検出方法は、サウンドイベントが発生する毎にそれを示すトリガ信号を生成するだけではなく、サウンドイベントの方向を決定できる差分信号をも生成する。サウンドイベント検出および特定方法は、このような差分信号を用いて、定常サウンドを除去した後の、各入力チャンネル対の各入力チャンネルにおけるサウンドイベントの相対電力を比較することによって、サウンドイベントの方向を決定する。既知の方法において行われているような、入力チャンネル対の各入力チャンネルにおける電圧を比較する代わりに、入力チャンネル対の各入力チャンネルにおけるサウンドイベントの電力を比較することによって、個々のサウンドを識別して別個に特定することができる。サウンドイベント検出および特定方法は、入力チャンネル対の数がいくつであっても、そこにおいて生成される音場のサウンドイベント型の数および組み合わせがどのようなものであっても、サウンドイベントの検出および特定を実施することができる。以下の説明では、複雑でないものから順にサウンドイベント検出および特定方法を説明し、各サウンドイベント検出および特定方法は、特に示さない限り、それに先立って説明した方法のステップを含むものとする。

単一入力チャンネル対および単一サウンドイベント型用サウンドイベント検出および特定方法を図９に示す。この単一入力チャンネル対および単一サウンドイベント型用サウンドイベント検出および特定方法９００は、単一のサウンドイベント型を検出し、単一の入力チャンネル対に対するサウンドイベントを特定する。この方法９００によって決定されるようなサウンドイベントの位置は、入力チャンネル対の入力チャンネル間の角度で与えられる（本願では、「真の差分指向角」または「真のＤＳＡ」と称する）。サウンドイベント検出および特定方法９００は、一般的に、差分信号を生成して、入力チャンネル対の入力チャンネル毎に、サウンドイベントを入力チャンネル対から検出すること（９０４）と、最初のサウンドイベント方向を決定すること（９０６）と、真のＤＳＡを切り離すこと（９０８）とを含む。、９０４および９０６は、まとめて、単一入力チャンネルおよび単一サウンドイベント型用ＤＳＡ決定方法を規定する（９０１）。

差分信号は、入力チャンネル対の入力チャンネル毎に生成され、サウンドイベントの入力チャンネル対からの検出（９０４）は、単一入力チャンネル対および単一サウンドイベント型用サウンドイベント検出方法または単一入力チャンネル対および単一短期サウンドイベント型用サウンドイベント検出方法のうちで、検出しようとするサウンドイベント型に適したものを用いて行われる。その結果、単一のサウンドイベント型の発生を示すトリガ信号が当該入力チャンネル対用に生成され、差分信号が当該入力チャンネル対の入力チャンネル毎に生成される。トリガ信号が示すように、入力チャンネル対からサウンドイベントが検出されると（９０４）、初期方向決定方法を用いて、サウンドイベントの初期方向が決定される（９０６）。サウンドイベントが発生するときは差分信号も存在するので、初期方向決定方法は、入力チャンネル対の入力チャンネル毎の差分信号からサウンドイベントの方向を決定する。より特定的には、サウンドイベントが生じているとトリガ信号が示す場合には、入力チャンネル毎の差分信号はデシベルに変換されて、入力チャンネル毎のデシベル差分信号を生成する。そして、ある入力チャンネルのデシベル差分信号が、他の入力チャンネルからのデシベル差分信号から差し引かれて、デシベル比が生じる。このデシベル比は、既知の方法を用いて等価角となり、入力チャンネル対の入力チャンネル間にあるサウンドイベントの位置を示す「差分指向角」または「ＤＳＡ」を生成する。

例えば、音節を検出しようとする場合、音節の概ね最初の２０ｍｓから概ね最初の３０ｍｓで示されるＤＳＡを切り離すことによって、検出する音節の真の方向を取得し、その後、これを約２００ｍｓの間、用いる（保持する）。他の例では、衝撃音を検出しようとする場合、衝撃音の概ね最初の３．３ｍｓから概ね５ｍｓで示されるＤＳＡを切り離すことによって、衝撃音の真の方向を取得し、その後、これを約５０ｍｓの間、用いる。しかしながら、衝撃音のような短期サウンドイベントの場合、初期方向決定方法を実施して、より正確な初期方向を取得してもよい。この初期方向決定方法は、トリガ信号の非常に短い区間（一般的に、約３ｍｓ）に生じたすべてのトリガを検出して、これらのパルスに関連するＤＳＡを決定し、これらのＤＳＡの短期平均を決定し、短期平均ＤＳＡを用いて、検出しようとしている短期サウンドイベント型の典型的な持続期間において、非常に短い区間で検出された短期サウンドイベントの方向を示す。例えば、衝撃音を検出しようとする場合、短期平均を次の約５０ｍｓだけ用いる。サウンドイベントの立ち上がり時間の時間平均を方向の基準に用いるという考え方は、より長い持続期間のサウンドにも適用可能である。しかしながら、平均化にはより長い時間を用いるのが有用である。なぜならば、これらの信号の立ち上がり時間は一般的に長いからである。

サウンドイベント検出および特定方法は、複数の入力チャンネル対における単一のサウンドイベント型を検出および特定するのに実施されてもよい（「複数入力チャンネル対および単一サウンドイベント型用サウンドイベント特定方法」）。例えば、典型的なサラウンドサウンドシステムは、少なくとも左右入力チャンネル対および中央‐サラウンド入力チャンネル対とを含む。複数入力チャンネル対および単一サウンドイベント型用サウンドイベント特定方法では、任意のチャンネル対のトリガ信号がサウンドイベントの発生を示すときにはいつでも、チャンネル対毎の真のＤＳＡを決定する。しかしながら、ＤＳＡを用いてサウンドイベントの方向を示すのは、ＤＳＡが正確な場合だけである。ＤＳＡが正確でない場合には、真のＯＳＡが示す方向を用いる。

複数入力チャンネル対および単一サウンドイベント型用サウンドイベント特定方法の一例を、図１０の参照符号１０００で示す。この方法例は、単一入力チャンネル対および単一サウンドイベント用ＤＳＡ決定方法を、入力チャンネル対毎に実行すること（「複数入力チャンネル対・単一サウンドイベント型用ＤＳＡ決定方法」と総称する）（１０５１）と、チャンネル対毎に通常指向角を決定すること（１００３）と、ＤＳＡが正確かどうかを決定すること（１０１０）と、ＤＳＡが正確でない場合、真のＯＳＡを切り離して、検出しようとするサウンドイベント型の典型的な持続期間に、入力チャンネル毎に用いること（１０１４）と、ＤＳＡが正確な場合、真のＤＳＡを切り離して、検出しようとするサウンドイベント型の典型的な持続期間に、真のＤＳＡを入力チャンネル毎に用いること（１０１２）とを含む。

複数入力チャンネル対および単一サウンドイベント型用ＤＳＡ決定方法１０５１は、各入力チャンネル対におけるサウンドイベントを検出して、チャンネル対の各チャンネル毎に差分信号を生成すること（１００４）と、チャンネル対の入力チャンネル毎に最初のＤＳＡを決定すること（１００６）とを含む。各入力チャンネル対におけるサウンドイベントを検出して、チャンネル対の各チャンネル毎に差分信号を生成すること（１００４）は、単一チャンネル対および単一サウンドイベント型用サウンドイベント検出方法、チャンネル対毎に並行して行うことを含む。チャンネル対の入力チャンネル毎に最初のＤＳＡを決定すること（１００６）は、初期方向決定方法をチャンネル対毎に並行して行うことを含む。チャンネル対毎にＯＳＡを決定すること（１００３）は、一般的に、既知の方法を用いて達成される。

ＤＳＡが正確かどうかを決定することは、サウンドイベントが発生しているとトリガ信号が示すときに、あるチャンネルでサウンドイベントが発生するとともに他のチャンネルでサウンドイベントが終了するかどうかを「背景信号チェック」を用いて決定することと、ＤＳＡのために得た値は互いに整合性があるかどうかを決定する「整合性チェック」を行うこととを含む。一般的に、ある入力チャンネル対が他の入力チャンネル対から導出される場合（例えば、中央‐サラウンド入力チャンネル対が左右入力チャンネル対から導出される場合）で、あるサウンドイベントの発生が、異なる方向の他のサウンドイベントの終了とちょうど同時である場合には、サウンドイベント検出および特定方法から正確な結果はもたらされない。これは、少なくとも２つの入力チャンネルの電力エンベロープが約３ｄＢ分、ほぼ同時に降下することによって特徴付けられる。この種の信号は、自然な環境では一般的ではないが、サウンド装置に用いられる多くの一般的なテスト信号ではよくあることであり、ポピュラー音楽では時折用いられる。しがたって、背景信号チェックによって、各入力チャンネルの電力エンベロープを検査して、そのうちの２つがほぼ同時に約３ｄＢ分降下する場合には、ＤＳＡは正確でないと考えられる。

整合性チェックによって、左右入力チャンネル対および中央‐サラウンド入力チャンネル対の真のサウンドイベント方向の絶対値の和が約４５度未満かどうかを決定する。したがって、和が４５度未満である場合には、定常信号が一定のままであったことを示しており、真のサウンドイベント方向によって示された方向は正確である。しかしながら、和が約４５度以上である場合には、定常信号が一定のままでなかったことを示しており、真のサウンドイベント方向によって示された方向は不正確である。これに基づいて、整合性チェックにより、真のサウンドイベントが正確でないということがわかったときにはいつでも、エラーを示す信号（「エラー信号」）が生成される。

ＤＳＡが正確であるということがわかったときには、真のＤＳＡは切り離されて、検出しようとしているサウンドイベントの典型的な持続期間に用いられる（１０１２）。例えば、音節を検出しようとしている場合、ＤＳＡをサウンドイベントの典型的な持続期間に用いる。他の例では、衝撃音を検出しようとしている場合、ＤＳＡを衝撃音の典型的な持続期間に用いる。しかしながら、ＤＳＡが正確でない場合、真のＯＳＡを切り離して、検出しようとするサウンドイベント型の典型的な持続期間に用いる。真のＯＳＡとは、検出しようとするサウンドイベント型の立ち上がり時間の間に生じるＯＳＡのことである。

また、複数入力チャンネル対および単一サウンドイベント型サウンドイベント検出および特定方法は、順応調整方法を用いて、サウンドイベントの真の方向についてのエラーの発生を減少させる方法を含んでもよい。順応調整方法は、整合性チェックを用いて、順応信号の順応度を調整する。上述したように、順応信号は、人間の聴覚機構によって徐々に無視されるような、音場に存在する定常信号を表す。このような定常信号が無視される速度を、順応速度と称する。順応度は、順応信号（「ＡｃｃＳｉｇ」）によって規定される。順応調整方法は、、順応信号ＡｃｃＳｉｇに調整係数Ａｄｊを乗算して、ＡｃｃＳｉｇが以下の式によって規定されるようにする。

ＡｃｃＳｉｇ＝ＡｃｃＳｉｇ（Ａｄｊ）（１）
式中、Ａｄｊは、以下の式よって規定される。

Ａｄｊ＝ｌ−α／５０（２）
式中、αは、おおよそ数秒という時間で整合性チェックによって決定されるエラーの数である。エラーの数を決定する正確な時間というのは、あまり重要ではない。Ａｄｊは、順応度を減少させて、順応信号を減少させ、定常信号をより遅い速度で無視されるようにするためのものである。これにより、検出される一過性現象が減少し、誤って特定される一過性現象の数が減少する。Ａｄｊが約０．９９８以上であれば、整合性チェックで示されるエラーの数は減少し、利用可能な結果が複数入力チャンネル対用サウンドイベント検出および特定方法によって得られることが、実験的に明らかとなっている。しかしながら、Ａｄｊが約０．９９８以下であれば、あまりに多くの一過性現象が検出されず、複数入力チャンネル対用サウンドイベント検出および特定方法は、利用可能な結果をもたらさない。

代わりに、複数入力チャンネル対および単一サウンドイベント型用サウンドイベント検出および特定方法は、エラーの数を用いて、エラー閾値調整方法の一部として、閾値を調整してもよい。エラー閾値調整方法は、整合性チェックによって決定されたエラーの数を、おおよそ数秒という所定の期間において決定し、この数を用いて閾値を調整する。エラーの数が増えれば、サウンドイベントが少なく検出されるように閾値を増加させる。したがって、閾値を、整合性チェックによって検出されたエラーの数に比例して、継続的に調整することができる。

また、サウンドイベント検出および特定方法は、単一の入力チャンネル対における複数のサウンドイベント型を検出および特定するように実施されてもよい（「単一入力チャンネル対および複数サウンドイベント型用サウンドイベント特定方法」）。図１１は、２種類のサウンドイベント（音節と衝撃音）を検出および特定して、サウンドイベントが発生する度にその発生を示すＤＳＡを生成するように実施されるサウンドイベント検出および特定方法１１００を示す。しかしながら、この方法は、サウンドイベントの数および型がどのようなものであっても検出および特定するのと同様に実施されてもよい。単一入力チャンネル対および複数サウンドイベント型用サウンドイベント検出および特定方法１１００は、一般的に、入力チャンネル対のための差分信号を生成すること（１１０４）と、入力チャンネル対から音節を検出すること（１１０６）と、入力チャンネル対から衝撃音を検出すること（１１０７）と、初期方向を決定すること（１１０８）と、検出されたサウンドイベントのために真のＤＳＡを切り離す（１１１０）とを含む。ステップ１１０４，１１０６，１１０７，および１１０８は、まとめて、単一入力チャンネル対および複数サウンドイベント型用ＤＳＡ決定方法を規定する（１１０１）。

入力チャンネル対のための差分信号を生成すること（１１０４）は、入力チャンネル毎に順応方法を実行することを含む。入力チャンネル対から音節を検出すること（１１０６）は、単一チャンネル対および単一サウンドイベント型用開始検出方法を実行して、チャンネル対で音節が発生したことを示すトリガ信号を生成することを含む。入力チャンネル対から衝撃音を検出すること（１１０７）は、チャンネル対のチャンネル毎に単一入力チャンネルおよび単一短期サウンドイベント型用サウンドイベント検出方法を並行して実行すること（結果生じた２つのトリガ信号は合成されて、チャンネル対で衝撃音が発生したことを示す単一のトリガ信号を形成してもよい）を含む。

その後、任意のトリガ信号が音節または衝撃音が検出されたことを示すと、初期方向が決定される（１１０８）。この時点で、初期方向決定を用いて、検出されたサウンドイベントの初期方向を決定する。この決定は、入力チャンネル対の各入力チャンネルの差分信号を用いて行われる。任意のトリガ信号がいずれかのサウンドイベントが生じていることを示すとき、差分信号を用いて真のＤＳＡの生成を行う、真の方向を切り離す方法に従って、真のＤＳＡが切り離される（１１１０）。そして、検出されたサウンドイベント型の典型的な持続期間に、真のＤＳＡを用いる。例えば、音節を検出しようとする場合、ＤＳＡを音節のの典型的な持続期間に用いる。これに対して、衝撃音が検出された場合、ＤＳＡを衝撃音の典型的な持続期間に用いる。

また、サウンドイベント検出および特定方法は、複数の入力チャンネル対における複数のサウンドイベント型を検出および特定するように実施されてもよい（「複数入力チャンネル対および複数サウンドイベント型用サウンドイベント特定方法」）。複数入力チャンネル対および複数サウンドイベント型用サウンドイベント特定方法は、一般的に、単一入力チャンネル対および複数サウンドイベント型用サウンドイベント検出および特定方法を、入力チャンネル対毎に並行して実行することを含む。交互に、複数入力チャンネル対および複数サウンドイベント型用サウンドイベント特定方法は、サウンドイベントを検出することと、サウンドイベントのためにＤＳＡを決定することと、ＤＳＡが正確かどうかを決定することと、ＤＳＡが正確でない場合にＯＳＡを用いることを含んでもよい。ＤＳＡが正確でない場合にＯＳＡを用いる、複数入力チャンネル対および複数サウンドイベント型用サウンドイベント特定方法の一例を、図１２に示す。この例では、音節および衝撃音を２つのチャンネル対から検出する。しかしながら、この方法は、チャンネルの数がいくつであっても、そこにおける傷イベント型の数がいくつであっても、検出するように実施してもよい。

図１２において、複数入力チャンネル対および複数サウンドイベント型用サウンドイベント特定方法１２００は、入力チャンネル対のために差分信号を生成すること（１２０４）と、各入力チャンネル対から音節を検出すること（１２０６）と、各入力チャンネル対から衝撃音を検出すること（１２０７）と、チャンネル対毎に初期方向を決定すること（１２０８）、ＤＳＡが正確かどうかを決定すること（１２１０）と、ＤＳＡが正確である場合、ＤＳＡを切り離して、検出されたサウンドイベント型の典型的な持続期間に用いること（１２１２）と、ＤＳＡが正確でない場合、ＯＳＡを切り離して、検出されたサウンドイベント型の典型的な持続期間に用いること（１２１４）とを含む。ステップ１２０４，１２０６，１２０７，および１２０８は、まとめて、複数入力チャンネル対および複数サウンドイベント型用ＤＳＡ決定方法を規定する（１２０１）。

入力チャンネル対のための差分信号の生成（１２０４）は、入力チャンネル毎に順応方法を並行して実施することを含む。各入力チャンネル対からの音節の検出（１２０６）は、単一のチャンネル対および単一のサウンドイベント型用の開始検出方法を並行して実施して、任意のチャンネル対で音節が発生していることを示すトリガ信号をチャンネル対毎に生成することを含む。各入力チャンネル対からの衝撃音の検出（１２０７）は、単一の入力チャンネルおよび単一の短期サウンドイベント用のサウンドイベント検出方法を、各チャンネル対の各チャンネルについて並行して実施して（チャンネル対毎に、結果生じた２つのトリガ信号を合成して、チャンネル対で衝撃音が発生していることを示す単一のトリガ信号を形成してもよい）。同時に、既知の方法を用いて、各チャンネル対においてＯＳＡを決定する（１２０３）。

その後、任意のトリガ信号が音節または衝撃音が検出されることを示すと、チャンネル対毎に初期方向を決定する（１２０８）。この時点で、初期方向決定を用いて、検出されたサウンドイベントの初期方向を決定する。この決定は、入力チャンネル対の各入力チャンネルの差分信号を用いて行われる。その後、開始検出方法および／または整合性チェックを用いて、ＤＳＡが正確かどうかを決定する（１２１０）。ＤＳＡが正確であることがわかった場合、差分信号を用いて真のＤＳＡを生成する、真の方向を切り離す方法に従って、真のＤＳＡが切り離される（１２１０）。そして、音節の典型的な持続期間に、真のＤＳＡを用いる。これに対して、衝撃音が検出された場合、ＤＳＡを衝撃音の典型的な持続期間に用いる。しかしながら、ＤＳＡが正確でないことがわかった場合、真のＯＳＡを切り離して（１２１４）、真のＯＳＡを生成する。その後、衝撃音の立ち上がり時間中のＯＳＡから真のＯＳＡを切り離して、衝撃音の典型的な持続期間に用いる。さらに、複数のチャンネル対および単一のサウンドイベント型用サウンドイベント検出および特定方法は、順応調整方法および／またはエラー閾値調節方法をさらに含んでもよい。

どのサウンドイベント検出および特定方法においても、任意のサウンドの方向を用いて、検出されたサウンドイベント型の典型的な持続期間の音場全体の方向を示す。しかしながら、典型的な継続期間中に後続のサウンドイベントが発生する場合、後続のサウンドが発生するとできるだけ早く、後続のサウンドイベントの方向を全入力チャンネルのために用いて、後続のサウンドイベントのサウンドイベント型の典型的な持続時間に継続して用いる。これは、一般的には、複数のサウンドイベント同士が重なる場合に、直近のサウンドイベントの方向が用いられるという意味である。

再生サウンドイベント検出および特定方法の適用例は、記録されたサウンドがステレオ（２チャンネル）再生が意図されていたか、またはサラウンド（２つ以上のチャンネル）再生が意図されていたかを決定する方法（「ステレオ／サラウンド検出方法」」）に含まれる。ステレオ／サラウンド検出方法は、一般的に、聴取者の背後での再生専用のサウンドイベントの数を決定し、この数が所定の値を超えているかどうかを決定する。このような方法は、聴取者の背後での再生専用のサウンドの指標となる負の位相を用いる既知の方法に対して有利である。なぜならば、負の位相を必然的に有する一過性現象は、間違って後ろ方向を示すことはないからである。

上述したように、サラウンド再生専用の音場は、聴取者の背後での再生専用のサウンドイベントを含む。したがって、ステレオ／サラウンド検出方法は、検出しようとしているサウンドイベント型毎に、単一入力チャンネル対用、中央‐サラウンド入力チャンネル対用サウンドイベント検出および特定方法を実施することと、関連する約０度から約−４５度の（後ろ方向を示す）真の差分指向角でサウンドイベントの数を決定することとを含む。不正確な差分指向角によって生じたサラウンドが間違って指定されるのを避けるために、サラウンド検出方法は、また、後方再生用に検出されたのサウンドイベントの数が、規定した時期において所定の値を超えているかどうかを決定する。一般的には、約１０ｓから１５ｓの時間に検出される、後方再生専用のサウンドイベント数が僅かしかなければ（２または３程度）、音場または音場の特定の部分は、サラウンド再生専用と決定される。さらに、サウンドイベントの持続期間を決定して、所定の持続期間を超える持続期間のサウンドイベントのみを、背後再生専用のサウンドイベントとしてカウントしてもよい。例えば、約５０ｍｓ未満程度といった、非常に短期間のサウンドイベントは、音場での意図された方向を正しく示さないことが多い。したがって、約５０ｍｓを超える持続期間のサウンドイベントのみを、背後再生専用のサウンドイベントとしてカウントする。他の例では、約２００ｍｓから約３００ｍｓの持続期間のサウンドイベントのみを、背後再生専用のサウンドイベントとしてカウントする。

（３．サウンドを特定するための方法）
また、人間の聴覚機構特性を用いて、音場内のすべてのサウンドの位置を決定してもよい。サウンドイベント検出および特定方法を、サウンドの意図する方向を決定する既知の方法を組み合わせることによって、背景サウンドがある状態で、どのようなサウンドの組み合わせであっても、個々のサウンドをより正確に特定する方法を開発した（「サウンド特定方法」）。サウンドと九手方法は、音場をサウンドイベントと非サウンドイベントとに分割し、真の差分指向角または通常指向角で表すサウンドイベントと、フィルタ後の指向角で表す非サウンドイベントとを特定する。このような方法は、基本的には、非サウンドイベントを、方向を別途決定する別のサウンドとして扱う。サウンド特定方法は、サウンドイベント型の数や組み合わせがどのようなものであっても、サウンドイベント型を明確に特定して、残存のサウンドを特定するのに加えて、入力チャンネル対の数がいくつであっても、そこで生成される音場において特定を行う。以下の説明では、複雑でないものから順にサウンド特定方法を説明し、各サウンド特定方法は、特に示さない限り、それに先立って説明した方法のステップを含むものとする。

一般的に、すべてのサウンド特定方法において、フィルタ後のＯＳＡを用いて音場の方向を示し、サウンドイベントが検出されると、真のＤＳＡを用いる。複数のチャンネル対（または他のチャンネル対を生成可能な単一のチャンネル対）で生じる音場について実施されるサウンド特定方法では、ＤＳＡが正確であると決定された場合にのみ、真のＤＳＡを用いてサウンドイベントの方向を示す。このような場合、ＤＳＡが正確だと判断されない場合、真のＯＳＡを用いてサウンドイベントの方向を示す。さらに、どのような指向角の型（ＯＳＡまたはＤＳＡ）が選ばれても、音場のすべての入力チャンネルについてその型の指向角を用いる。例えば、雑音がある状態のサウンドイベントをたった１つの入力チャンネルから検出し、かつすべての入力チャンネルに雑音がある場合、ＤＳＡ（サウンドイベントの方向を示す）を用いて（場合によっては、正確な場合にのみ用いる）、サウンドイベントの持続期間に、音場全体の方向を規定する。都合のよいことに、人間の聴覚機構は、一般的に、サウンドイベントを前方ストリームの一部として認識し、雑音を背景ストリームの一部として認識するので、サウンドイベントだけが移動したというように認識する。

単一の入力チャンネル対から単一のイベント型を検出するためのサウンド特定方法（「単一入力チャンネル対および単一サウンドイベント型」）を図１３に示す。この方法は、一般的に、ＤＳＡおよびトリガ信号を決定すること（１３０２）と、ＯＳＡを決定すること（１３０６）と、どの方向を使用するかを決定すること（１３０４）とを含む。１３０２，１３０４，および１３０６は、一般的に、音場が感知される限り、同時並行的に実施される。

ＤＳＡおよびトリガ信号の決定（１３０２）は、一般的に、入力チャンネル対について単一のトリガ信号を生成する交互開始検出方法を含む、単一入力チャンネル対および単一サウンドイベントＤＳＡ決定方法を実施することによって達成される。パルスがトリガ信号内にある場合にのみサウンドイベントが生じるが、ＤＳＡは継続して決定される。代わりに、トリガ信号を継続的に決定して、ＤＳＡは、パルスがトリガ信号内にある場合にのみ決定されるようにしてもよい。ＯＳＡの決定（１３０６）は、一般的に、機知の方法を用いて継続的に行われる。どの方向を使用するかの決定（１３０４）は、基本的に、サウンドイベントが発生すると、検出されたサウンドイベント型に典型的な持続期間に真のＤＳＡを用いると決定して、サウンドイベントの終了時にＯＳＡを減衰することを含む。しかしながら、後続のサウンドイベントが随時発生する場合（たとえサウンドイベント中であっても）、後続のサウンドイベント型に典型的な持続時間に後続のサウンドイベントのＤＳＡが用いられる。

どの方向を用いるかを決定する方法（「単一入力チャンネル対および単一サウンドイベント型用方向決定方法」）を図１４に参照符号１３０４で示す。この方法は、一般的に、入力信号があるかどうかを決定すること（１４０２）と、入力信号がある場合に、サウンドイベントがあるかどうかを決定すること（１４０４）と、サウンドイベントがある場合に、検出されたサウンドイベント型の典型的な持続期間に現在の真のＤＳＡを生成および選択すること（１４０６）と、典型的な持続期間が終了したかどうかを決定すること（１４０８）と、典型的な持続期間が終了していない場合に、後続のサウンドイベントが検出されるかどうかを決定すること（１４１０）と、後続のサウンドイベントが検出されない場合、典型的な持続期間が終了したかどうかの決定（１４０８）および後続のサウンドイベントが検出されたかどうかの決定（１４１０）を、１４０８で典型的な持続期間が終了と決定されるか、または１４１０で後続のサウンドイベントが検出されたと決定されるまで繰り返すことと、後続のサウンドイベントが検出された場合、現在のＤＳＡを後続のサウンドイベントのそれで規定して、適宜１４０６，１４０８，１４１０，および１４１４を繰り返すことと、１４０８で典型的な持続期間が終了したと判断されると、１４０２から本方法全体を適宜繰り繰り返すことと、１４０４でサウンドイベントが検出されない場合、直前のサウンドイベントがあったかどうかを決定すること（１４１６）と、直前のサウンドイベントがない場合、フィルタ後のＯＳＡを選択すること（１４１８）と、本方法全体を１４０２から適宜繰り返すことと、直前のサウンドイベントがある場合、フィルタ後のＯＳＡを選択して真のＤＳＡから減衰すること（１４２０）と、本方法全体を１４０２から適宜繰り返すことと、１４０２で入力信号が検出されなくなるまで本方法全体を適宜繰り返して、入力信号がなくなると、本方法を終了することとを含む。

入力信号があるかどうかの決定（１４０２）は、すべての入力チャンネルにおける音場の入力電力（「Ｉ^２」」）が約０より大きいかどうかを決定することを含む。さらに、すべての入力チャンネルにおいて、入力電力が以前のサウンドイベントから約３０ｄＢ降下したかどうかを決定することを含む。降下していたら、入力信号が停止したと一般的に推定される。入力信号がある場合、トリガ信号を調査することによってサウンドイベントがあるかどうかを決定する（１４０４）。トリガ信号がパルスまたはサウンドイベントの発生を示す他のものを含んでいれば、サウンドイベントが存在する。逆に、トリガ信号がパルスまたはサウンドイベントの発生を示す他のものを含んでいなければ、サウンドイベントは存在しない。

サウンドイベントがある場合、真の方向の切り離し方法を用いて、現在の真のＤＳＡを現在のＤＳＡから生成し、検出しようとするサウンドイベント型の典型的な持続期間に選択する（１４０８）。上述したように、検出しようとするサウンドイベント型が音節の場合、サウンドイベントの典型的な持続期間は約５０ｍｓから２００ｍｓ（好ましくは、約１５０ｍｓ）であり、検出しようとするサウンドイベント型が衝撃音の場合、サウンドイベントの典型的な持続期間は約５０ｍｓである。検出しようとするサウンドイベントが実際に終了したかどうかを問わず、典型的な持続期間にＤＳＡを選択および使用する。しかしながら、典型的な持続期間中に、入力信号が傍受されて、正確なＤＳＡを有する任意の後続のサウンドイベントが検出されるかどうかを決定する（１４０８および１４１０）。典型的な継続期間に中に後続のサウンドイベントが検出されると、現在のＤＳＡは、後続のサウンドイベントのＤＳＡに再規定され（１４１４）、再規定された現在のＤＳＡを用いて、検出されたサウンドイベント型の典型的な持続期間用に選択される現在の真のＤＳＡを生成し、１４０６，１４０８，１４１０，および１４１４を適宜繰り返す。しかしながら、典型的な持続期間中に後続のサウンドイベントが検出されない場合には（１４０８および１４１０）、１４０２から本方法全体を適宜繰り返す。

これに対して、１４０４でサウンドイベントがないと決定されると、直前のサウンドイベントがあるかどうかを決定する（１４１６）。直前のサウンドイベント典型的な持続期間がちょうど終了したサウンドイベント）がない場合、フィルタ後のＯＳＡを選択するか、または常に選択され（１４１８）、処理を１４０２から適宜繰り返す。フィルタ後のＯＳＡは、除去された特定の立ち上がり時間よりも速い立ち上がり時間の変動を有するＯＳＡである。例えば、約３００ｍｓよりも速い立ち上がり時間の変動が除去されてもよい。これにより、サウンドイベントがない場合に、ＯＳＡが急速な方向の変化を反映することを防止する。しかしながら、直前のサウンドイベント（典型的な持続時間がちょうど終了したサウンドイベント）があった場合には、ＯＳＡを選択して、直前のサウンドの真のＤＳＡから減衰する（１４２０）。この減衰は、直前のサウンドイベントのＤＳＡからＯＳＡへの円滑な遷移を提供する効果がある。この円滑な遷移を提供するのに必要な減衰の長さは、直前のサウンドイベントのサウンドイベント型による。直前のサウンドイベントが音節である場合には、減衰は、一般的に、約３００ｍｓ秒である。その後、処理は、１４０２で入力信号が終了したと判断されるまで、１４０２から適宜繰り返す。

場合によっては、特に非常に短期のサウンドイベントを特定しようとする場合には、方向選択方法が、短期サウンドイベントが典型的な持続期間の終了時に実際に終了したかを決定することと、短期サウンドイベントが実際には終了していなかった場合に、減衰なしでＯＳＡをすぐに選択することとを含んでいれば、より正確な結果が得られる。そのような方法（「単一入力チャンネル対および短期サウンドイベント用方向選択方法」）を、図１５の参照符号１５００で示す。単一入力チャンネル対および短期サウンドイベント用方向選択方法は、一般的に、入力信号があるかどうかを決定すること（１５０２）と、入力信号がある場合に、短期サウンドイベントがあるかどうかを決定すること（１５０４）と、短期サウンドイベントがある場合に、検出された短期サウンドイベント型の典型的な持続期間に真のＤＳＡを生成および選択すること（１５０６）と、典型的な持続期間が終了したかどうかを決定すること（１５０８）と、典型的な持続期間が終了していない場合に、後続の短期サウンドイベントが検出されるかどうかを決定すること（１５１０）と、後続の短期サウンドイベントが検出されない場合、典型的な持続期間が終了したかどうかの決定（１５０８）および後続の短期サウンドイベントが検出されたかどうかの決定を、１５０８で典型的な持続期間が終了と決定されるか、または１５１０で後続の短期サウンドイベントが検出されたと決定されるまで繰り返すことと、後続の短期サウンドイベントが検出された場合、現在のＤＳＡを後続の短期サウンドイベントのそれで規定して（１５１２）、適宜１５０６，１５０８，１５１０，および１５１４を繰り返すことと、１５０８で典型的な持続期間が終了したと判断されると、１５０２から本方法全体を適宜繰り繰り返すことと、１５０４で短期サウンドイベントが検出されない場合、直前の短期サウンドイベントがあったかどうかを決定すること（１５１４）と、直前の短期サウンドイベントがなかった場合、フィルタ後のＯＳＡを選択または選択し続けて（１５１６）、本方法全体を１５０２から適宜繰り返すことと、直前の短期サウンドイベントがある場合、直前の短期サウンドイベントが実際に終了したかどうかを決定すること（１５１８）と、直前の短期サウンドイベントが実際に終了した場合には、フィルタ後のＯＳＡへ即座に移行すること（１５２０）と、直前の短期サウンドイベントが実際には終了していない場合には、フィルタ後のＯＳＡを選択および減衰して、本方法全体を１５２２から適宜繰り返すことと、１５０２において入力信号が検出されなくなるまで、本方法全体を適宜繰り返すことと、入力信号がなくなると、処理を終了することとを含む。

この単一入力チャンネル対および短期サウンドイベント用方向選択方法は、上述した方向選択方法と実質上同一であるが、単一入力チャンネル対および短期サウンドイベント用方向選択方法は、短期サウンドイベントを検出するために実施される点が異なる。さらに、短期サウンドイベントの典型的な持続期間の終了時に（新たなサウンドイベントが発生していないまたは発生している最中ではないと仮定）、短期サウンドイベントが実際に終了したかどうかを決定し（１５１４）、短期サウンドイベントが実際に終了したどうかに基づき、フィルタ後のＯＳＡを１５２０で即座に用いるか、１５２２の減衰後に用いる。この単一入力チャンネル対および短期サウンドイベント用方向選択方法は、チャンネル対の入力チャンネル毎に、単一チャンネル対および短期サウンドイベント用サウンドイベント検出方法を用いて、短期サウンドイベントを検出して、短期サウンドイベントが検出されたときにはいつでもそれを示すトリガ信号（または２つのトリガ信号）を生成するように実施することができる。

直前の短期サウンドイベントが実際に終了にしたかは、チャンネル対の各入力チャンネルの電力エンベロープおよび順応信号を比較することによって決定されてもよい。入力チャンネル対の任意の入力チャンネルにおいて入力電力エンベロープＩ^２が順応信号ＡｃｃＳｉｇより大きい場合、短期サウンドイベントは実際には終了していないと決定する。したがって、フィルタ後のＯＳＡは直前のサウンドイベントのＤＳＡから減衰する。しかしながら、入力チャンネル対の各入力チャンネルにおいてＩ^２が順応信号ＡｃｃＳｉｇ以下である場合、短期サウンドイベントは実際に終了したと決定され、フィルタ後のＯＳＡが即座に選択される（１５２２）。この円滑な遷移を提供するのに必要な減衰の長さは、検出しようとするサウンドイベント型による。例えば、直前のサウンドイベントが衝撃音である場合には、減衰に約５ｍｓかかる。

また、音場が１つ以上の入力チャンネル対を含む場合に、サウンド特定方法を用いて、音場におけるサウンドを特定してもよい（「複数入力チャンネル対および単一サウンドイベント型用サウンド特定方法」）。複数入力チャンネル対および単一サウンドイベント用サウンド特定方法は、単一入力チャンネル対および単一サウンドイベント型用サウンド特定方法と同一の基本ステップを含み、一般的に、ＯＳＡを決定することと、ＤＳＡおよびトリガ信号を決定することと、どの方向を使用するかを決定することとを含む。しかしながら、ＤＳＡおよびトリガ信号を決定するステップは、入力チャンネル対毎にＤＳＡおよびトリガ信号を決定することを含み、交互開始検出方法を含む複数入力チャンネル対および単一サウンドイベント用ＤＳＡ決定方法を実行することによって実施される。さらに、どの方向を使用するかを決定するステップ（「複数入力チャンネル対および単一サウンドイベント型用方向選択方法」）は、任意の入力チャンネル対からの差分信号、トリガ信号、およびＤＳＡに応答することと、正確なＤＳＡを有するサウンドイベントが任意の入力チャンネル対において検出される場合に、すべての入力チャンネル対のために真の差分指向角を生成および選択することとを含む。

複数チャンネル対および単一サウンドイベント型用方向選択方法を図１６の参照符号１６００でより詳細に示す。一般的に、この方向選択方法は、任意のトリガ信号がサウンドイベントの発生を示すとき、ＤＳＡが正確かどうかを決定することと、ＤＳＡが正確でない場合に、ＤＳＡの代わりに、検出しようとするサウンドイベント型の典型的な持続期間で真のＯＳＡを用いることを含む。より特定的には、方向選択方法１６００は、入力信号があるかどうかを決定すること（１６０２）と、入力信号がある場合に、サウンドイベントがあるかどうかを決定すること（１６０４）と、サウンドイベントがある場合に、現在の真のＤＳＡが正確かどうかを決定すること（１６０６）と、現在の真のＤＳＡが正確である場合に、検出しようとしているサウンドイベント型の典型的な持続期間に現在の真のＤＳＡを生成して選択すること（１６０８）と、現在の真のＤＳＡが正確でない場合に、検出しようとしているサウンドイベント型の典型的な持続期間に現在の真のＯＳＡを生成して選択すること（１６２０）と、真のＯＳＡまたはＤＳＡが生成および選択されると、典型的な持続期間が終了したかどうかを決定すること（１６１０）と、典型的な持続期間が終了していない場合に、後続のサウンドイベントが検出されるかどうかを決定すること（１６１２）と、後続のサウンドイベントが検出されない場合、典型的な持続期間が終了したかどうかの決定（１６１０）および後続のサウンドイベントが検出されたかどうかの決定（１６１２）を、１６１０で典型的な持続期間が終了と決定されるか、または１６１２で後続のサウンドイベントが検出されたと決定されるまで繰り返すことと、後続のサウンドイベントが検出された場合、後続のサウンドイベントの真のＤＳＡが正確かどうかを決定すること（１６１４）と、後続のサウンドイベントの真のＤＳＡが正確である場合、現在のＤＳＡを後続のサウンドイベントのそれで規定して（１６１６）、適宜１６１０，１６１２，１６１４，１６１６，および１６１８を繰り返すことと、１６１４で後続のサウンドイベントの真のＤＳＡが正確でないと決定された場合、現在のフィルタ後のＯＳＡを後続のサウンドイベントのそれで規定して（１６１８）、適宜１６１０，１６１２，１６１４，１６１６，および１６１８を繰り返すことと、１６１０で典型的な持続期間が終了したと判断されると、１６０２から本方法全体を適宜繰り繰り返すことと、１６０４でサウンドイベントが検出されない場合、直前のサウンドイベントがあったかどうかを決定すること（１６２２）と、直前のサウンドイベントがなかった場合、フィルタ後のＯＳＡを選択または選択し続けて（１６２４）、本方法全体を１６０２から適宜繰り返すことと、直前のサウンドイベントがあった場合、フィルタ後のＯＳＡを選択して真のＤＳＡから減衰して（１６２６）、本方法全体を１６０２から適宜繰り返すことと、１６０２において入力信号が検出されなくなるまで、本方法全体を適宜繰り返すことと、入力信号がなくなると、処理を終了することとを含む。

入力信号があるかどうかの決定（１６０２）は、各チャンネル対の各入力チャンネルに入力信号があるかどうかを決定することを含む。サウンドイベントがあるかどうかの決定（１６０４）は、単一チャンネル対および単一サウンドイベント型用サウンドイベント検出方法をチャンネル対毎に実行して、サウンドイベントの発生を示すトリガ信号を対毎に生成することを含む。現在のＤＳＡが正確かどうかの決定（１６０６）は、各入力チャンネル対からの現在のＤＳＡ（任意のトリガ信号がサウンドイベントの発生を示すときに決定されたＤＳＡ）が正確かどうかを、複数入力チャンネル対に対するＤＳＡの正確性を決定する方法を用いて決定することを含む。複数入力チャンネル対に対するＤＳＡの正確性を決定する方法を図１７の参照符号１７００に詳細に示し、この方法は、少なくとも２つの入力チャンネルにおいて、背景信号が約３ｄＢ以上降下したかどうかを決定すること（１７０２）と、少なくとも２つの入力チャンネルにおいて、背景信号が約３ｄＢ以上降下していない場合、すべての現在のＤＳＡは整合性チェックを通るかどうかを決定すること（１７０４）とを含む。少なくとも２つの入力チャンネルにおいて、背景信号が約３ｄＢ以上降下したかどうかを決定することは、背景信号チェックをすべての入力チャンネルで行うことによって達成される。少なくとも２つの入力チャンネルにおいて、背景信号が約３ｄＢ以上降下した場合、ＤＳＡは正確でないと考えられる。しかしながら、少なくとも２つの入力チャンネルにおいて、背景信号が約３ｄＢ以上降下していない場合、上述のように整合性チェックが行われる。ＤＳＡが整合性チェックを通る場合、ＤＳＡは正確であると考えられる。

図１６に示すように、ＤＳＡが正確であると考えられる場合、真の方向の切り離し方法を用いて、現在の真のＤＳＡをチャンネル対毎に生成および選択する。しかしながら、ＤＳＡが正確でないと考えられる場合、現在の真のＯＳＡ（任意のトリガ信号が、現在のサウンドイベントが発生してことを示すときに決定されたＯＳＡ）をチャンネル対毎に生成および選択する（１６２０）。後続のサウンドイベントが典型的な持続期間中に検出されなければ、検出しようとするサウンドイベント型の典型的な持続期間に現在の真のＯＳＡまたは現在の真のＤＳＡのいずれかを用いる。１６１０において典型的な持続期間が終了していないと決定されている限り、後続のサウンドイベントが検出されるかどうかを決定する（１６１２）。後続のサウンドイベントが検出される場合、複数入力チャンネル対についてＤＳＡの正確性を決定する方法を用いて、後続のサウンドイベントの真のＤＳＡが正確かどうかを決定する（１６１４）。後続のサウンドイベントのＤＳＡが正確であると決定される場合、後続のサウンドイベントのＤＳＡが現在のＤＳＡとなり（１６１６）、後続のサウンドイベントの方向を反映する。しかしながら、後続のサウンドイベントのＤＳＡが正確でないと決定される場合、後続のサウンドのＯＳＡが現在のＯＳＡとなり（１６１８）、後続のサウンドイベントの方向を反映する。後続のサウンドイベントの典型的な持続期間が終了するまで、処理は１６０８または１６２０から適宜繰り返される。

任意の後続のサウンドが終了すると、１６２２において、直前のサウンドイベントがあったかどうかを決定する。直前のサウンドイベントがあった場合、フィルタ後のＯＳＡが選択され、音場の方向は、ＤＳＡで示される方向からＯＳＡで示される方向へ減衰する（１６２６）。しかしながら、直前のサウンドイベントがなかった場合、フィルタ後のＯＳＡを用いるかまたは用い続ける（１６２４）。さらに、任意の複数チャンネル対および単一サウンドイベント型用サウンド特定方法は、整合性チェックを用いて、不正確なＤＳＡの発生を、上述したような順応調整方法および／またはエラー閾値調整方法を用いて減少させることを含んでもよい。

場合によっては、特に非常に短期のサウンドイベントを特定しようとする場合には、方向選択方法が、短期サウンドイベントが典型的な持続期間の終了時に実際に終了したかを決定することと、短期サウンドイベントが実際には終了していなかった場合に、減衰なしでＯＳＡをすぐに選択することとを含んでいれば、より正確な結果が得られる。そのような方法（「複数入力チャンネル対および短期サウンドイベント用方向選択方法」）を、図１８の参照符号１８００で示す。単一入力チャンネル対および短期サウンドイベント用方向選択方法は、一般的に、入力信号があるかどうかを決定すること（１８０２）と、入力信号がある場合に、短期サウンドイベントがあるかどうかを決定すること（１８０４）と、短期サウンドイベントがある場合に、現在の真のＤＳＡが正確かどうかを決定すること（１８０６）と、現在の真のＤＳＡが正確である場合に、検出しようとしている短期サウンドイベント型の典型的な持続期間に現在の真のＤＳＡを生成して選択すること（１８０８）と、現在の真のＤＳＡが正確でない場合に、検出しようとしている短期サウンドイベント型の典型的な持続期間に現在の真のＯＳＡを生成して選択すること（１８２０）と、真のＯＳＡまたはＤＳＡが生成および選択されると、典型的な持続期間が終了したかどうかを決定すること（１８１０）と、典型的な持続期間が終了していない場合に、後続の短期サウンドイベントが検出されるかどうかを決定すること（１８１２）と、後続のサウンドイベントが検出されない場合、典型的な持続期間が終了したかどうかの決定（１８１０）および後続のサウンドイベントが検出されたかどうかの決定（１８１２）を、１８１０で典型的な持続期間が終了と決定されるか、または１８１２で後続のサウンドイベントが検出されたと決定されるまで繰り返すことと、後続のサウンドイベントが検出された場合、後続のサウンドイベントの真のＤＳＡが正確かどうかを決定すること（１８１４）と、後続のサウンドイベントの真のＤＳＡが正確である場合、現在のＤＳＡを後続のサウンドイベントのそれで規定して（１８１６）、適宜１８１０，１８１２，１８１４，１８１６，および１８１８を繰り返すことと、１８１４で後続のサウンドイベントの真のＤＳＡが正確でないと決定された場合、現在のＯＳＡを後続のサウンドイベントのそれで規定して（１８１８）、適宜１８１０，１８１２，１８１４，１８１６，および１８１８を繰り返すことと、１８１０で典型的な持続期間が終了したと判断されると、１８０２から本方法全体を適宜繰り繰り返すことと、１８０４でサウンドイベントが検出されない場合、直前のサウンドイベントがあったかどうかを決定すること（１８２２）と、直前のサウンドイベントがなかった場合、フィルタ後のＯＳＡを選択または選択し続けて（１８２４）、本方法全体を１８０２から適宜繰り返すことと、直前のサウンドイベントがあった場合、直前のサウンドイベントが実際に終了したかどうかを決定すること（１８２５）と、直前のサウンドイベントが実際に終了している場合、フィルタ後のＯＳＡを選択して、真のＤＳＡから即座に移行して（１８２６）、本方法全体を１８０２から適宜繰り返すことと、直前のサウンドイベントが実際には終了していない場合、フィルタ後のＯＳＡを選択して減衰して（１８２８）、本方法全体を１８０２から適宜繰り返すことと、１８０２において入力信号が検出されなくなるまで、本方法全体を適宜繰り返すことと、入力信号がなくなると、処理を終了することとを含む。

この複数入力チャンネル対および短期サウンドイベント用方向選択方法は、上述した複数入力チャンネルおよび単一サウンドイベント型用方向選択方法と実質上同一であるが、複数入力チャンネル対および短期サウンドイベント用方向選択方法は、短期サウンドイベントを検出するために実施される点が異なる。さらに、短期サウンドイベントの典型的な持続期間の終了時に（新たなサウンドイベントが発生していないまたは発生している最中ではないと仮定）、短期サウンドイベントが実際に終了したかどうかを決定し（１８２５）、短期サウンドイベントが実際に終了したどうかに基づき、フィルタ後のＯＳＡを１８２６で即座に用いるか、１８２８の減衰後に用いる。この複数入力チャンネル対および短期サウンドイベント用方向選択方法は、チャンネル対の入力チャンネル毎に、複数チャンネル対および単一短期サウンドイベント用サウンドイベント検出方法を用いて、短期サウンドイベントを検出して、短期サウンドイベントが検出されたときにはいつでもそれを示すトリガ信号（または２つのトリガ信号）を生成するように実施することができる。

直前の短期サウンドイベントが実際に終了にしたかは、入力電力エンベロープが任意の入力チャンネルの短期サウンドイベントについての順応信号より大きいかどうかを決定することによって決定される（１８２５）。入力電力エンベロープが任意の入力チャンネルの短期サウンドイベントについての順応信号より大きい場合、短期サウンドイベントは実際には終了していないと決定する。したがって、直前の短期サウンドイベントのＤＳＡからフィルタ後のＯＳＡへ減衰が起こる（１８２６）。しかしながら、各入力チャンネルにおいて、電力エンベロープが順応信号とほぼ同一である場合、短期サウンドイベントは実際に終了したと決定され、フィルタ後のＯＳＡが即座に選択される（１８２８）。この円滑な遷移を提供するのに必要な減衰の長さは、検出しようとするサウンドイベント型による。例えば、直前のサウンドイベントが衝撃音である場合には、減衰に約５ｍｓかかる。

また、サウンド特定方法は、１つ以上のサウンドイベント型を区別することによって音場におけるサウンドを特定するために用いてもよい（「単一入力チャンネル対および複数サウンドイベント型用サウンド特定方法」）。単一入力チャンネル対および複数サウンドイベント型サウンド特定方法は、単一入力チャンネル対および単一サウンドイベント型サウンド特定方法と同一の基本ステップ同一の基本ステップを含み、一般的に、ＯＳＡを決定することと、ＤＳＡおよびトリガ信号を決定することと、どの方向を使用するかを決定することとを含む。しかしながら、ＤＳＡおよびトリガ信号の決定は、サウンドイベント型毎にＤＳＡおよびトリガ信号を決定することを含み、交互開始検出方法を含む単一入力チャンネル対および複数サウンドイベント用ＤＳＡ決定方法を実行することによって実施される。さらに、どの方向を使用するかの決定は、単一の入力チャンネル対（単一サウンドイベント型または短期サウンドイベントのいずれか）用の方向選択方法を、検出しようとするサウンドイベント型毎に並行して実行することを含む。しかしながら、任意のチャンネル対から任意の型のサウンドイベントが検出される度に、ＤＳＡが、実際に検出されたサウンドイベント型の典型的な持続期間に、各入力チャンネル対において用いられる。

また、サウンド特定方法は、１つ以上のサウンドイベント型を区別することによって、１つ以上の入力チャンネル対のある音場におけるサウンドを特定するために用いてもよい（「複数入力チャンネル対および複数サウンドイベント型用サウンド特定方法」）。複数入力チャンネル対および複数サウンドイベント型サウンド特定方法は、複数入力チャンネル対および単一サウンドイベント型サウンド特定方法と同一の基本ステップ同一の基本ステップを含み、一般的に、ＯＳＡを決定することと、ＤＳＡおよびトリガ信号をチャンネル対毎に決定することと、複数入力チャンネル対および単一サウンドイベント型用方向選択方法に従って、どの方向を使用するかを決定することとを含む。しかしながら、複数のサウンドイベントを検出するための方法では、ＤＳＡおよびトリガ信号のチャンネル対毎の決定は、各入力チャンネル対におけるサウンドイベント型毎のＤＳＡおよびトリガ信号を決定することを含む。各入力チャンネル対におけるサウンドイベント型毎のＤＳＡおよびトリガ信号の決定は、交互開始検出方法を含む複数入力チャンネル対および複数サウンドイベント型用ＤＳＡ決定方法を実行することによって実施される。さらに、複数入力チャンネル対および複数サウンドイベント型用方向選択方法は、任意のサウンドイベント型からのトリガ信号に応答することと、正確なＤＳＡを有するサウンドイベントが任意の入力チャンネル対から検出される場合に、すべての入力チャンネル対のために真の差分指向角を生成および選択すること、または、不正確なＤＳＡを有する任意の型のサウンドイベントが任意のチャンネルから検出される場合に、全ての入力チャンネル対のために真のＯＳＡを選択することとを含む。代わりに、複数入力チャンネル対および複数サウンドイベント型用サウンド特定方法は、上述の順応調整方法および／またはエラー閾値調整方法を用いることを含んでもよい。

このような方法でどの方向を利用するかを決めれば、簡素なサウンドイベントでもより複雑なサウンドイベントでもうまくゆく。例えば、ドラムの打音が顕著なポピュラー音楽を含む音場であって、音楽の大部分が前方（中央入力チャンネル）から発せられ、ドラムの打音は後方（サラウンド入力チャンネル）から発せられる音場を考える。音楽の方向は、フィルタ後のＯＳＡによって規定され、中央入力チャンネルに特定される（音楽が他のサウンドイベントを含まないと仮定）。しかしながら、ドラムの打音が発生すると、本方法は、衝撃音を検出して、（ＤＳＡは正確であると仮定）真のＤＳＡに示された方向を用いて、音場全体を後方へ移動させる。衝撃音の典型的な持続期間が終了すると、本方法は、ドラムの打音が実際に終了したかどうかを決定し、終了していれば、フィルタ後のＯＳＡによって示された方向の利用に戻り、音場全体を中央入力チャンネルへ移動させる。方向がこのように決定されると、人間の聴覚機構は、音楽が移動していなければ、ドラムの打音は後方から、音楽は常に前方から発せられていると認識する。しかしながら、ドラムの打音の典型的な持続期間よりも長くＤＳＡを用いるか、または典型的な持続期間の終了時には、ドラムの打音が典型的な持続期間の終了時以前に実際に終了していれば、減衰を利用して、フィルタ後のＯＳＡに戻り、音楽を含む音場全体は公報に移動したように認識される。

より複雑な例としては、周囲雑音がある状態で、叫びのような非常に鋭いアタックを有する会話音を含む音場を考える。会話音は、衝撃音（アタック）および音節（叫びの残部）の両方を含むので、複雑である。叫びの開始は、インパルスとして検出され、現在の衝撃のＤＳＡが正確であると仮定して、衝撃のＤＳＡが衝撃音の典型的な持続期間に選択される。しかしながら、典型的な持続期間中であっても、その直後であっても、叫びの音節部分は検出され、音節のＤＳＡが正確だと仮定すると、音節のＤＳＡが選択されて、音節の典型的な持続期間に用いられる。音節が検出されるとき、過去に検出された衝撃音のＤＳＡは、当該音節と同一であるため、方向の変化は生じない。したがって、叫びの鋭い開始で示される方向は、衝撃の性質に従って即座に取り込まれ、その方向が、音節の性質の時間特性に用いられる。

（４．サウンドイベント装置）
サウンドイベント検出方法、サウンドイベント検出および特定方法、サウンド特定方法、ならびにこれらの方法に含まれるあらゆる方法は、図１９の参照符号１９００に示すようなサウンドイベント装置で実施されてもよい。最適化装置１９００は、一般的に、検出器１９０２を含み、また、インターフェイス部１９０４を含んでもよい。検出部１９０２は、メモリ装置１９０６に接続されたプロセッサ１９０８を含む。メモリ装置１９０８は、どのような種類の固定または着脱可能なデジタル記憶装置でもよく、（必要があれば）フロッピー（登録商標）ディスク、フロッピー（登録商標）ドライブ、ＣＤ‐ＲＯＭディスクおよびドライブ、光学ディスクおよびドライブ、ハードドライブ、ＲＡＭ、ＲＯＭ、ならびにデジタル情報を記憶する他の装置を含む。プロセッサ１９０８は、デジタル情報を処理するために用いられる装置であればどのような種類であってもよい。メモリ装置１９０６は、音場を記憶してもよく、サウンドイベント検出方法、サウンドイベント検出および特定方法、および任意のこれらの方法に含まれるあらゆる方法（「検出および／または特定方法」と総称する）のうちの少なくとも１つを記憶してもよい。プロセッサ信号１９１０による該当要求がプロセッサ１９０８からあると、メモリは検出および／または特定方法のうちの１つと、必要があれば音場とを、メモリ信号１９１２によってプロセッサ１９０８に伝達する。そして、プロセッサ１９０８は、検出および／または特定方法を実行する。

インターフェイス部１９０４は、一般的に、入力装置１９１４と、出力装置１９１６とを含む。出力装置１９１６は、プロセッサまたはメモリから人間もしくは他のプロセッサまたはメモリに対して情報を伝達することが可能な、映像、手動、音響、電子、または電磁気装置であればどのような種類であってもよい。出力装置の例としては、それに限定するものではないが、モニタ、スピーカ、液晶ディスプレイ、ネットワーク、バス、およびインターフェイスがある。入力装置１９１４は、人間もしくはプロセッサまたはメモリから別のプロセッサまたはメモリに対して情報を伝達することが可能な、映像、手動、音響、電子、または電磁気装置であればどのような種類であってもよい。出力装置の例としては、キーボード、マイクロフォン、音声認識システム、トラックボール、マウス、ネットワーク、バス、およびインターフェイスがある。代わりに、入出力装置１９１４および１９１６は、それぞれ、タッチパネル、コンピュータ、プロセッサ、またはネットワークを介してプロセッサに接続されたメモリなどの単独装置に含まれていてもよい。音場は、入力装置１９１４からプロセッサ１９２０を介してメモリ装置１９１８に伝達されてもよい。さらに、最適化されたモデルパラメータをプロセッサ１９２０から出力装置１９１６へ伝達してもよい。

（６．サウンドイベント検出器）
人間の聴覚機構特性をモデル化して、背景信号がある状態でサウンドイベントを検出する電子回路を考案した（「サウンドイベント検出器」と総称する）。サウンドイベント検出器を、特定の型のサウンドイベント検出の助けとなる様々な応用に用いてもよい。例えば、音節を検出するサウンドイベント検出器を、音声検出器の一部ならびに会話認識または会話符号化システムの一部として用いてもよい。他の例では、音節を検出するサウンドイベント検出器を、マイクロフォンなどの音声増幅装置と共に用いてもよい。これにより、マイクロフォンは、スピーカから音節が検出されるまでオフにしておくことができ、スピーカが音を出さないときに、マイクロフォンが、所望しないサウンドおよびフィードバックをマイクロフォン自体を介して増幅しないようにする。サウンドイベント検出器は、サウンドイベント検出方法と同様に、サウンドイベントの発生を示す、パルスなどの何らかのフラグまたはマーカを含むトリガ信号を一般に生成する。また、サウンドイベント検出方法と同様に、サウンドイベント検出器は、入力チャンネルの数がいくつであっても、そこにおいて生成される音場のサウンドイベント型の数および組み合わせがどのようなものであっても、実施可能である。以下の説明では、複雑でないものから順にサウンドイベント検出器を説明し、各サウンド検出器は、特に示さない限り、それに先立って説明したサウンドイベント検出器の構成要素を含むものとする。

単一の入力チャンネルでのみ生成した音場から単一の型のサウンドイベントを検出するサウンドイベント検出器（「単一入力チャンネルおよび単一サウンドイベント型用サウンドイベント検出器」）の一例を図２０の参照符号２０００で示す。しかしながら、サウンドイベント検出器および特定器は、入力チャンネル対の数がいくつであっても、そこから検出されるサウンドイベント型がいくつであっても、検出するように実施してもよい。本例では、音場全体を左入力チャンネルで生成している。音場全体が単一の入力チャンネルに含まれているので、この例において用いた「左」という語は方向的な意味を持たず、単に説明のために用いただけである。単一入力チャンネルおよび単一サウンドイベント型用サウンドイベント検出器１９００は、周波数バイアスフィルタ２００１と、単一入力チャンネル用順応回路２００２と、単一入力チャンネル用トリガ生成回路２００４とを含む。一般的に、単一入力チャンネル用順応回路２００２は、音場を用いて、検出しようとするサウンドイベント型について左入力チャンネルでの差分信号「Ｌｏ」を生成し、単一入力チャンネル用トリガ生成回路２００４は、順応信号Ｌｏを用いて、検出しようとするサウンドイベントが検出される度に、それを示すトリガ信号「Ｔｌ」を生成する。

周波数バイアスフィルタ２００１は、約５００Ｈｚ〜約４０００Ｈｚの音場における周波数を強めることによって、人間の聴覚機構の周波数バイアスをモデル化する。単一入力チャンネル用順応回路１７０２は、順応性をモデル化することによって、サウンドイベントを音場の背景信号から分離する。この回路２１０２を図２１により詳細に示す。この回路は、一般的に、乗算器２１０２と、低域通過フィルタ２１０４と、順応信号回路２００６とを含む。乗算器２００２は、左入力チャンネルで生成された音場（「入力信号」）を電力信号「Ｌｉｎ^２」に変換する。入力信号は、一般的に電圧信号であり、一般的に、入力信号を二乗することによって電力信号に変換できる。結果生じた電力信号Ｌｉｎ^２は、多くの変動を有しており、変動の中には、サウンドイベントを示すものもあり、雑音を示すものもある。そして、雑音による変動を減少させるためには、低域通過フィルタが、電力信号Ｌ^２から約３０ｍｓ早い立ち上がり時間の変動を除去して、フィルタ後の電力信号Ｌ^２を生成する。この低域通過フィルタ２１０４は、どのようなものでもよく、例えば１２ｄＢ／オクターブのロールオフのフィルタであってもよい。

フィルタ後の電力信号Ｌ^２から、順応信号回路２１０６は順応信号（音場そのままの長期平均電力を表す）を生成して差し引き、差分信号Ｌｏを生成する。順応回路２１０６は、一般的に、演算増幅器２１０８と、抵抗器２１１４と、ダイオード２１１２と、コンデンサ２１１０とを含む。フィルタ後の電力信号Ｌ^２は、演算増幅器２１０８の正端子に入力するか、または代わりに、２つの信号の差を決定可能な装置に入力する。フィルタ後の電力信号Ｌ^２がサウンドイベントを含まない場合、コンデンサ２１１０が開路となり、フィルタ後の電力信号Ｌ^２とほぼ同一の順応信号

が生じ、ほぼゼロに等しい差分信号Ｌｏを生成する。

しかしながら、フィルタ後の電力信号Ｌ^２がサウンドイベントを含む場合でも、フィルタ後の電力信号Ｌ^２は、サウンドイベントの立ち上がり時間に従って、急速に上昇する。このＬ^２の急速な上昇により、差分信号Ｌｏ内に対応するスパイクが生じる。サウンドイベントの立ち上がり時間の後に、コンデンサ２１１０が帯電して、それにより、抵抗器２１１４およびコンデンサ２１１０によって規定された時定数に従って、順応信号

が徐々に上昇する。この時定数は、一般的に、人間の聴覚機構の順応速度に等しいように作成され、約３００ｍｓに実験的に決定される。

は、コンデンサ２１１１０の電圧（したがって、

）がＬ^２と等しくなるか、またはサウンドイベントの減衰が終了または開始するまで、上昇し続ける。この上昇する

をＬ^２から差し引くと、人間の聴覚機構の順応特性をモデル化するＬｏ内の段階的な減衰となる。サウンドイベントが減衰すると、電力エンベロープＬ^２は、サウンドイベントのたち下がり時間に従って、急速に降下する。Ｌ^２が

の値に近づくにつれて、コンデンサ２１１０はダイオード２１１２を介して放電して、順応信号

がフィルタ後の電力信号Ｌ^２を超えないようにする。これにより、サウンドイベントの終了時に、Ｌｏに負のパルスを生成しないようにする。

差分信号Ｌｏは、したがって、検出しようとするサウンドイベント型に特徴的な上昇時間以下の上昇時間と、順応信号によって規定される下降時間とを有する一連の変動および／またはサウンドイベントの終了を含む。そして、単一入力チャンネル用トリガ生成回路１９０４（図１９に示す）は、サウンドイベントを検出して、サウンドイベントが検出される度にパルスを含むトリガ信号Ｔｌ‘を生成する。単一入力チャンネル用トリガ生成回路１９０４は、図２２により詳細に示されており、高域通過フィルタ２２０２と、正規化回路２２０６と、低域通過フィルタ２２０８とを含む。

トリガ生成回路１９０４の目的は、雑音によって生じた変動をできるだけ多く除去して、除去しなかったものを弱めることにある。サウンドイベント検出方法に関連して上述したように、これは、検出しようとするサウンドに特徴的な周波数よりも高い周波数を有する変動を除去して、差分信号の短期高周波電力で差分信号Ｌｏを正規化することによって達成される。正規化は、高域通過フィルタ２２０２と、正規化回路２２０６とを有する自動利得制御回路を用いて達成される。高域通過フィルタは、コンデンサ／抵抗器の対を含み、この対は、カットオフ周波数を、検出しようとするサウンドイベントに特徴的なものとして定義する。さらに、整流器（図示せず）を高域通過フィルタ２２０２および正規化回路２２０６の間に含めて、負のパルスまたは変動を整流化してもよい。積分器２２１０と、除算器２２１２とを含む正規化回路２２０６は、その後、Ｌｏの高周波成分を、積分器２２１０によって規定される短期間に渡って平均化する。積分器によって規定される短期間は、約１６０ｍｓに等しくてもよいが、この期間は、音場の種類の関数として調整されてもよい。除算器２２１２は、その後、平均化されたＨＦｌでＬｏを除して、正規化された差分信号Ｎｌを発生させる。さらに、整流器（図示せず）を正規化回路２２０６および低域通過フィルタ２２０８の間に含めて、負のパルスまたは変動を整流化してもよい。

正規化された差分信号Ｎｌは、その後、低域通過フィルタ２２０８によってフィルタリングされて、検出しようとするサウンドイベントに特徴的な変動より高い周波数の変動を除去して、フィルタ後かつ正規化された差分信号Ｎｌ’を生じさせる。図示していないが、検出しようとするサウンドイベントに特徴的な変動より高い頻度の変動を検出および除去する回路であって少なくとも１０ｄＢの音場の減少が検出されたときに生じる変動を除去する回路を含ませることによって、Ｎｌ’からさらに雑音を除去できる。したがって、Ｎｌ’は、サウンドイベントの発生および雑音による変動を表す様々な振幅の一連のパルスを含む。

フィルタ後かつ正規化された差分信号Ｎｌ’にある雑音からサウンドイベントを検出するためには、閾値検出器２２１８が、閾値より大きな振幅を有するパルスのみを検出する。これは、サウンドイベントを示すパルスを雑音による変動と区別する助けとなる。閾値検出器の出力は、音場の単独の（左）入力チャンネルにおけるサウンドイベントの発生を一般的にパルスによって示す、トリガ信号「Ｔｌ」である。代わりに、単一入力チャンネルおよび単一サウンドイベント型用サウンドイベント検出器は、閾値調整回路を含んでもよい。閾値調整回路は、サウンドイベント検出器の感度を調節するために、閾値検出器の閾値を調整する。閾値検出器は、閾値を調節することもできるし、トリガ生成回路内の閾値検出器に接続された電圧源および可変抵抗器を含んでもよい。抵抗器の抵抗は、つまみ、スイッチ、または電圧源によって供給された電圧を閾値検出器に対して制御する装置であって、閾値検出器が閾値を定義するのに用いる装置によって、手動で制御されてもよい。代わりに、閾値検出器は、閾値の自動調節を提供し、かつ、トリガ生成回路の出力に接続されたカウンタと、カウンタおよびトリガ生成回路内の閾値検出器に接続された比較器とを含む。カウンタは、特定の期間に発生したサウンドイベントの数をカウントして、この数を比較器に伝達する。この特定の期間は、一般的には、約数秒程度である。その後、比較器は、サウンドイベントの数と反比例する電圧を生じさせ、この電圧を閾値検出器に伝達する。閾値検出器は、この電圧を用いて閾値を規定する。一般的に、サウンド検出器の感度がよくなるように、サウンドイベントの数が多い場合には、閾値を増加させる。

いずれのサウンドイベント検出器も、衝撃音などの短期サウンドイベントの検出に特化して利用される順応信号回路を含まなくてもよい。順応信号回路を含まないサウンドイベント検出器の一例を図２３に示す。この短期サウンドイベント用サウンドイベント検出器２３００は、周波数バイアスフィルタ２３０１と、リニア―ｄＢ変換器２３０２と、高域通過フィルタ２３０３と、単一チャンネル対用トリガ生成回路２３０４とを含む。周波数バイアスフィルタ２３０１は、入力信号の周波数を約５００Ｈｚから約４０００Ｈｚへ強めて、フィルタ後の入力信号を生成する。フィルタ後の入力信号は、その後、リニア―ｄＢ変換器２３０２によってデシベルに変換されて、デシベルフィルタ後の入力信号を発生させる。フィルタ後のデシベル入力信号は、今度は高域通過フィルタ２３０３によって再びフィルタリングされる。高域通過フィルタ２３０３は、検出しようとする短期サウンドイベントに特徴的な変動よりも遅い立ち上がり時間の変動を除去する。単一入力チャンネル対用トリガ生成回路２３０４は、この２回フィルタリングされたデシベル入力信号を用いて、短期サウンドイベントの発生を示すトリガ信号を生じさせる。代わりに、短期サウンドイベント用サウンドイベント検出器は、閾値調整回路を含んでもよい。

サウンドイベント検出器は、音場が２つ以上の入力チャンネルで生成される場合も実施されてもよい。２つの入力チャンネルで生成された音場から単一のサウンドイベント型を検出するサウンドイベント検出器（「複数入力チャンネルおよび単一サウンドイベント型用サウンドイベント検出器」）は、単一チャンネルおよびのためのサウンドイベント検出器と、入力チャンネル毎にトリガ信号を生成する各入力チャンネルの単一の入力チャンネル対を含む。代わりに、トリガ信号は合成されて、任意の入力チャンネルにおけるサウンドイベントの発生を示す単一のトリガチャンネルをを形成してもよい。代わりに、複数入力チャンネルおよび単一サウンドイベント型用サウンドイベント検出器は、複数のチャンネル対毎に差分信号からトリガ信号だけを生成するようにしてもよい。そのような複数入力チャンネルおよび単一サウンドイベント型用サウンドイベント検出器を、図２４に示す。この例では、音場全体が、左入力チャンネルおよび右入力チャンネルを含む単一の入力チャンネル対を介して生成される。しかしながら、この方法は、入力チャンネルまたは入力チャンネル対の数がいくらであっても、適用可能である。

複数入力チャンネルおよび単一サウンドイベント型用サウンドイベント検出器２４００は、単一入力チャンネル用第１の順応回路２４０２と、単一入力チャンネル用第２の順応回路２４０４と、単一入力チャンネル対用交互トリガ生成回路２４０６とを含む。第１および第２の順応回路２４０２、２４０４は、それぞれ、一般的に同一である。第１の順応回路２４０２は、左入力チャンネル信号（「Ｌｉｎ」）を用いて、左入力チャンネル用の差分信号を生成する（「左差分信号」または「Ｌｏ］）。第２の順応回路２４０４は、右入力チャンネル信号（「Ｒｉｎ」）を用いて、右入力チャンネル用の差分信号を生成する（「右差分信号」または「Ｒｏ］）。

単一入力チャンネル対用交互トリガ生成回路２４０６は、左右の差分信号両方を用いて、いずれかの入力チャンネルでサウンドイベントが発生していることを示すトリガ信号を生成する（「左右トリガ信号」または「Ｔｒｌ」」。単一入力チャンネル対用トリガ生成回路２４０６は図２５により詳細に示されており、演算増幅器２５０１と、整流化された高域通過フィルタ２５０２と、整流化された正規化回路２５０６と、低域通過フィルタ２５０８と閾値検出器２５１０とを含む。（図２２に示すような）単一入力チャンネル対用トリガ生成回路と同様であるものの、単一入力チャンネル対用トリガ生成回路２４０６は、左と右の差分信号（「左右差分信号」または「Ｌｏ‐Ｒｏ」）間の差分に等しい信号を生成する演算増幅器２５０１（または差分を決定することができる他の装置）をも含み、左右差分信号を用いて左右入力チャンネル対のためのトリガ信号（「左右トリガ信号」または「Ｔｌｒ」）を生成する。この例では、左右差分信号は、ＲｏをＬｏから差し引くことによって取得しているが、代わりに、ＬｏをＲｏから差し引くことによって決定してもよい。左右差分信号Ｌｏ‐Ｒｏは、入力チャンネル対のいずれかの入力チャンネルにおけるサウンドイベントおよび雑音の発生を示した一連のパルスおよび他の変動を含む。しかしながら、両方の入力チャンネルで等しく生じるサウンドイベントは除去されるので、雑音による多くの変動は除去される。差分信号におけるパルスおよび変動は、左入力チャンネルまたは右入力チャンネルでの一過性現象の電力が大きいかどうかによって、正または負の振幅を有してもよい。

正のパルスのみを含むトリガ信号を生成するためには、第１の整流器２５０４を整流化された高域通過フィルタ２５０２に含め、第２の整流器を正規化回路２５０６に含める。整流化された高域通過フィルタ２５０２は、整流化された高域左右差分信号（「ＨＦｌｒ」）を生成する。この整流化された高域左右差分信号は、差分信号Ｌｏ‐Ｒｏを正規化するために正規化回路２５０６によって用いられ、その結果は、第２の整流器２５０７によって整流化されて、正規化された左右信号（「Ｎｌｒ」）を生じさせる。低域通過フィルタ２５０８は、雑音による変動を、検出しようとするサウンドイベントに特徴的な立ち上がり時間よりも早い立ち上がり時間で除去して、フィルタ後の正規化された左右信号（「Ｎｌｒ’」）を生成する。単一入力チャンネル用トリガ生成回路と同様に、検出しようとするサウンドイベントに特徴的な頻度よりも高い頻度で発生する変動を検出および除去する回路であって、かつ音場の少なくとも１０ｄＢの降下が検出されるときに生じる変動を除去する回路を含めることによって、Ｎｌｒ’からさらに雑音（図示せず）を除去することができる。Ｎｌｒ’は、したがって、残存雑音によるサウンドイベントおよび変動の発生を表す様々な振幅を有する一連のパルスを含む。閾値検出器２５１０は、その後、サウンドイベントを閾値より大きい振幅を有するパルスとして検出し、左右トリガ信号Ｔｌｒを生成する。このサウンドイベント検出器を、複数入力チャンネル対用に並行して繰り返して、入力チャンネル対毎のトリガ信号を生成してもよい。代わりに、この複数入力チャンネルおよび単一サウンドイベント用サウンドイベント検出器は、トリガ生成回路毎に閾値調整回路を含んでもよい。この交互トリガ生成回路を含む複数入力チャンネルおよび単一サウンドイベント用サウンドイベント検出器は、「単一入力チャンネル対および単一サウンドイベント型用サウンドイベント検出器」と称してもよい。さらに、複数入力チャンネル（または単一入力チャンネル対）および単一サウンドイベント用サウンドイベント検出器は、トリガ生成回路毎に閾値調整回路を含んでもよい。

また、サウンドイベント検出器は、１つ以上のサウンドイベントの型を検出するように実施されてもよい。この「単一入力チャンネルおよび複数サウンドイベント型用サウンドイベント検出器」は、一般的に、検出しようとするサウンドイベント型毎に並行に実施された単一入力チャンネルおよび単一サウンドイベント型用サウンドイベント検出器を含み、検出しようとするサウンドイベント型毎にトリガ信号を生成する。このような単一入力チャンネルおよび複数サウンドイベント型用サウンドイベント検出器の一例を図２６の参照符号２６００で示す。本例では、音場全体を左入力チャンネルで生成している。音場全体が単一の入力チャンネルに含まれているので、この例において用いたような「左」という語は方向的な意味を持たず、実際、入力チャンネルはどのような方向であってもよい。また、本例では、単一入力チャンネルおよび複数サウンドイベント型用サウンドイベント検出器２６００は、音節および衝撃音を検出するように実施されている。しかしながら、サウンドイベントの数または組み合わせはどのようなものであっても検出されてもよい。

本例では、単一入力チャンネルおよび複数サウンドイベント型用サウンドイベント検出器２６００は、一般的に、単一入力チャンネル用順応回路２６０２と、音節用に実施された単一入力チャンネル用トリガ生成回路２６０４と、衝撃音用に実施された単一入力チャンネルおよび単一短期サウンドイベント用サウンドイベント検出器２６０６とを含む。単一入力チャンネル用順応回路２６０２は、入力信号Ｌｉｎを用いて、差分信号を生成する。音節を検出するために実施された単一入力チャンネル用トリガ生成回路２６０４は、差分信号を用いて、音場の単独の入力チャンネル（左）における音節の発生を示すトリガ信号（「Ｔｌ（ｓ）」）を生成する。音節を検出するために実施された単一入力チャンネル用トリガ生成回路２６０４は、フィルタ（図２２参照）を含み、そのカットオフ周波数立ち上がり時間は約３３ｍｓである。衝撃音を検出するために実施された単一入力チャンネル用トリガ生成回路２６０６は、入力信号Ｌｉｎを用いて、音場の単独の入力チャンネル（左）における衝撃音の発生を示すトリガ信号（「Ｔｌ（ｉ）」）を生成する。衝撃音を検出するために実施された単一入力チャンネル用トリガ生成回路２６０６は、高域通過フィルタ（図２２の２３０３参照）を含み、そのカットオフ周波数立ち上がり時間は約３ｍｓである。代わりに、複数入力チャンネルおよび単一サウンドイベント用サウンドイベント検出器は、トリガ生成回路毎に閾値調整回路を含んでもよい。

また、サウンドイベント検出器は、１つ以上のサウンドイベントの型を１つ以上の入力チャンネルから検出するように実施されてもよい。この「複数入力チャンネルおよび複数サウンドイベント型用サウンドイベント検出器」は、各入力チャンネル対におけるサウンドイベント型毎にトリガ信号を生成してもよい。代わりに、各チャンネル対におけるトリガ信号を、どのような方法を用いてもほぼ構わないが合成して、トリガ信号の数を減らしてもよい。そのような複数入力チャンネルおよび複数サウンドイベント型用サウンドイベント検出器の一例を図２７の参照符号２７００で示す。本例では、音場全体は左および右入力チャンネルで検出または再生のいずれかが行われている。しかしながら、本方法は、入力チャンネルの数および組み合わせがどのようなものであっても実施してよい。さらに、本例では、複数入力チャンネルおよび複数サウンドイベント型用サウンドイベント検出器は、音節および衝撃音を検出するように実施されている。しかしながら、サウンドイベントの数または組み合わせはどのようなものであっても検出されてもよい。

複数入力チャンネルおよび複数サウンドイベント型用サウンドイベント検出器２７００は、一般的に、信号入力チャンネル用第１の順応回路２７０２と、信号入力チャンネル用第２の順応回路２７０６と、単一チャンネルおよび短期サウンドイベント用第１のサウンドイベント検出器２７０８と、単一入力チャンネル対用交互トリガ生成回路２７１０と、単一チャンネルおよび短期サウンドイベント用第２のサウンドイベント検出器２７１２とを含む。

単一チャンネル用第１および第２の順応回路２７０２および２７０３は、それぞれ同一である。単一チャンネル用第１の順応回路２７０２は、左入力チャンネルＬｏについての差分信号を生成する。単一チャンネル用第２の順応回路２７０３は、右入力チャンネルＲｏについての差分信号を生成する。単一入力チャンネル対用交互トリガ生成回路２７１８は、ＬｏおよびＲｏを用いて、左右チャンネル対における恩瀬うの発生を示すトリガ信号Ｔｌｒ（ｓ）を生成する。単一入力チャンネル対用交互トリガ生成回路２７１８（より詳細は、図２５の参照符号２４０６で示す）は、フィルタを含み、そのカットオフ立ち上がり時間は約３３ｍｓに規定されている。単一チャンネルおよび単一短期サウンドイベント用第１および第２のサウンドイベント検出器２７０８および２７１２は、それぞれ、ＬｉｎおよびＲｉｎを用いて、左と右の入力チャンネルにおける衝撃音の発生を示すトリガ信号を生成する。これらのトリガ信号を合成して、左右入力信号対におけるトリガ信号の発生を示す単一のトリガ信号を生成してもよい。単一チャンネルおよび単一短期サウンドイベント用第１および第２のサウンドイベント検出器２７０８および２７１２は、それぞれ、高域通過フィルタ（図２３の２３０３を参照）を含み、そのカットオフ立ち上がり時間は約３ｍｓに規定されている。

代わりに、複数入力チャンネルおよび複数サウンドイベント型用サウンドイベント検出器は、各入力チャンネルにおいてサウンドイベント型毎に並行して実施された単一入力チャンネルおよび単一サウンドイベント用サウンドイベント検出器を含んでもよい。このサウンドイベント検出器は、各入力チャンネルにおいてサウンドイベント型毎のトリガ信号を生成する。代わりに、複数入力チャンネルおよび複数サウンドイベント型用サウンドイベント検出器は、入力チャンネル毎に並行して実施された単一入力チャンネルおよび複数サウンドイベント用サウンドイベント検出器を含んでもよい。この複数入力チャンネルおよび複数サウンドイベント用サウンドイベント検出器も、各入力チャンネルにおいてサウンドイベント型毎のトリガ信号を生成する。代わりに、任意の複数入力チャンネルおよび複数サウンドイベント用サウンドイベント検出器は、トリガ生成回路毎に閾値調整回路を含んでもよい。

（７．サウンドイベント検出器および特定器）
人間の聴覚機構特性をモデル化して、背景信号がある状態でサウンドイベントを検出および特定する電子回路を考案した（「サウンドイベント検出器および特定器」と総称する）。サウンドイベント検出器および特定器は、サウンドイベント検出および特定方法と同様に、１つ以上の入力チャンネルついに関するサウンドイベントの、差分指向角または通常指向角で表す方向を決定し、場合によっては、指向角の正確性を検証する。また、サウンドイベント検出および特定方法と同様に、サウンドイベント検出器および特定器は、入力チャンネルの数がいくつであっても、そこで生成される音場におけるサウンドイベント型の数および組み合わせがどのようなものであっても、それを検出するように実施可能である。以下の説明では、複雑でないものから順にサウンドイベント検出器および特定器を説明し、各サウンド検出器および特定器は、特に示さない限り、それに先立って説明したサウンドイベント検出器および特定器の構成要素を含むものとする。

単一の入力チャンネル対から単一のサウンドイベント型を検出するように実施されたサウンドイベント検出器および特定器の一例を図２８に示す（「単一入力チャンネル対および単一サウンドイベント型用サウンドイベント検出器および特定器」）。本例では、右入力チャンネルおよび左入力チャンネルに関して、サウンドイベントを検出および特定する。しかしながら、この方法は、入力チャンネルのどのような組み合わせにでも適用可能であり、ここで左と右を用いたのは説明のためだけである。図２８に示す単一入力チャンネル対および単一サウンドイベント型用サウンドイベント検出器および特定器２８００は、一般的に、単一入力チャンネル対および単一サウンドイベント型用サウンドイベント検出器２８０４と、単一入力チャンネル対および単一サウンドイベント型用サウンドイベント特定器２８０６とを含む。

単一入力チャンネル対および単一サウンドイベント型用サウンドイベント検出器２８０４は、任意の複数入力チャンネル対および単一サウンドイベント用サウンドイベント検出器を含み、これは、単一の入力チャンネル対用のトリガ生成回路を含み、どのようなサウンドイベントを検出することもできるように実施されている。単一入力チャンネル対および単一サウンドイベント型用サウンドイベント検出器２８０４は、左入力チャンネルＬｉｎおよび右入力チャンネルＲｉｎを用いて、左入力チャンネル用差分信号Ｌｏと、右入力チャンネル用差分信号Ｒｏと、どのようなサウンドイベントを検出するのであっても、いずれかの入力チャンネルにおいてサウンドイベントが発生していること示すトリガ信号とを生成する。その後、単一入力チャンネル対および単一サウンドイベント型用サウンドイベント特定器２８０６は、Ｌｏ，Ｒｏ，およびＴｌｒを用いて、左右の入力チャンネルについて検出されたサウンドイベントの方向を示す真の差分指向角を生成する。

単一入力チャンネル対および単一サウンドイベント型用サウンドイベント特定回路２８０６を図２９に詳細に示し、この回路は、一般的に、ＤＳＡ回路２９０４と、スイッチ２５１８と、抵抗器２９０６と、コンデンサ２９０８と、制御回路２９１０とを含む。ＤＳＡ回路２９０４は、左順応信号Ｌｏおよび右順応信号Ｒｏを用いて、差分指向角ｄｌｒを決定する。ＤＳＡ回路２９０４は、第１のリニア‐デシベル回路２９１２と、第２のリニア‐デシベル回路２９１４と、演算増幅器２９１６と、デシベル‐等価角回路２９１８トを含む。第１および第２のリニア‐デシベル回路２９１２および２９１４は、それぞれ、左と右の順応信号を電力信号からデシベル信号へ変換する。演算増幅器２９１６（または差分を決定できる任意の回路）は、左右のデシベル信号間の比率を、これら２つの信号の差を決定することによって決定する。そして、この比率は、デシベル‐等価角回路２９１８によって等価角に変換され、差分指向角ｄｌｒを生じさせる。

一般的に、制御回路２９１０、スイッチ２９０６、およびコンデンサ２９０８がサンプルホールド回路を形成し、したがって、同様の機能を行う任意の装置または回路によって置き換えることができる。一般的に、サウンドイベントが検出されると、制御回路２９１０は、スイッチ２９０６を閉じて、サウンドイベントの立ち上がり時間の間にコンデンサ２９０８にｄｌｒを取り込ませて、サウンドイベント型の典型的な持続期間に真のＤＳＡ（「ｄｌｒ’」）を生成する。より特定的には、制御回路２９１０は、トリガ信号Ｔｌを受信して、スイッチ２９０６を制御する制御信号「ｃｏｎ」を生成する。スイッチ２９０６は、２点スイッチであり、サウンドイベントが検出されない場合には、一般的に位置Ｃにある。位置Ａのとき、スイッチ２９０６は閉じており、位置Ｂのとき、スイッチは開いており、位置Ｃのとき、スイッチ２９０６は接地している。サウンドイベントが生じている旨の指示をトリガ信号Ｔｌｒから受信すると、制御回路２９１０は、スイッチ２９０６に対する閉じる（位置Ａへの移動）コマンドを「ｃｏｎ」によって伝達する。応答して、スイッチ２９０６は閉じる。検出しようとするサウンドイベント型に典型的な立ち上がり時間の終了時に、制御回路２９１０は、スイッチ２９０６に対する開く（位置Ｂへの移動）コマンドをｃｏｎによって伝達する。検出しようとするサウンドイベント型に典型的な立ち上がり時間の後で、制御回路２９１０は、スイッチ２９０６に対する接地（位置Ｃへの移動）コマンドを「ｃｏｎ」によって伝達する。スイッチ２９０６が閉じている間（サウンドイベントの立ち上がり時間中）、左右差分指向角ｄｌｒはコンデンサ２９０８に取り込まれ、真のＤＳＡｄｌｒ’を生じさせる。真のＤＳＡは、サウンドイベントが実際に終了していなくても、サウンドイベントの典型的な持続期間の終了まで保持される。例えば、検出しようとするサウンドイベントが音節の場合、真のＤＳＡは約５０ｍｓから約２００ｍｓの間、好ましくは約１５０ｍｓ後まで保持される。他の例では、検出しようとするサウンドイベントが衝撃音の場合、真のＤＳＡは約５０ｍｓ保持される。サウンドイベント型の典型的な持続期間の終了時点では、コンデンサはスイッチのＣで接地されており、コンデンサ２９０８に保持された電圧、つまりｄｌｒ’はゼロとなる。コンデンサ２９０８は、検出しようとするサウンドイベントの立ち上がり時間中にｄｌｒを十分に取り込むことができるように選ばれる。例えば、検出しようとするサウンドイベントが音節の場合、コンデンサは、ｄｌｒを２０ｍｓ〜約３０ｍｓで取り込むことができなくてはならない。他の例では、検出しようとするサウンドイベントが衝撃音の場合、コンデンサは、ｄｌｒを約５ｍｓで取り込むことができなくてはならない。

代わりに、単一入力チャンネル対および単一サウンドイベント型用サウンドイベント検出および特定回路を、衝撃音のような非常に短い期間のサウンドイベント用に最適化する。場合によっては、短期サウンドイベント用の正確なＤＳＡを得るのは非常に困難なので、所定の期間（一般的には、約３ｍｓ）に生じるすべての短期サウンドイベントの方向の平均を、当該期間のすべての短期サウンドイベントの方向として用いるのが得策である。したがって、最適化された単一入力チャンネル対および単一サウンドイベント型用サウンドイベント検出および特定回路は、約３ｍｓという時間枠で検出されるすべてのサウンドイベントの平均ＤＳＡを決定するための回路をさらに含む。ＤＳＡ平均回路は、一般的に、ＤＳＡ回路２８０４およびスイッチ２９０６の間のサウンドイベント特定回路２８０６によって実施される。

また、サウンドイベント検出器および特定器は、複数の入力チャンネル対において生成される音場における単一のサウンドイベント型を検出するように実施されてもよい（「複数入力チャンネル対および単一サウンドイベント型用サウンドイベント検出器および特定器」）。左右入力チャンネル対（「ＬＲ入力チャンネル対」）の両方および中央‐サラウンド入力チャンネル対（「ＣＳ入力チャンネル対」）において単一のサウンドイベントを検出および特定するように実施された複数入力チャンネル対および単一サウンドイベント型用サウンドイベント検出器および特定器を図３０の参照番号３０００に示す。この検出器および特定器は、入力チャンネル対の土嚢様な組み合わせに対しても実施可能で、ＬＲ入力チャンネル対およびＣＳ入力チャンネル対は一例としてのみ用いたものである。複数入力チャンネル対および単一サウンドイベント型用サウンドイベント検出器および特定器３０００は、ＬＲ入力チャンネル対（ｄｌｒ’）およびＣＳ入力チャンネル対（ｄｃｓ’）についての真の差分指向角を生成し、一般的には、単一入力チャンネル対および単一サウンドイベント用第１および第２のサウンドイベント検出器３０１０および３０１２と、複数入力チャンネル対および単一サウンドイベント型用サウンドイベント特定回路３０１４とを含む。

単一入力チャンネル対および単一サウンドイベント型用第１および第２のサウンドイベント検出器３０１０および３０１２は、両方とも、同じサウンドイベントを検出するように実施される。複数入力チャンネル用第１のサウンドイベント検出器３０１０は、左右の入力チャンネルの入力信号ＬｉｎおよびＲｉｎを用いて、左差分信号Ｌｏ，右差分信号Ｒｏ，左電力エンベロープＬ^２，右電力エンベロープＲ^２、および左右トリガ信号Ｔｌｒを生成する。同様に、複数入力チャンネル用第２のサウンドイベント検出器３０１２は、中央とサラウンドの入力チャンネルの入力信号ＣｉｎおよびＲｉｎを用いて、中央差分信号Ｃｏ，サラウンド差分信号Ｓｏ，中央電力エンベロープＣ^２，サラウンド電力エンベロープＳ^２、および中央‐サラウンドトリガ信号Ｔｃｓを生成する。

複数入力チャンネル対および単一サウンドイベント型用サウンドイベント特定回路３０１４は、左差分信号Ｌｏ，右差分信号Ｒｏ，および左右トリガ信号Ｔｌｒを用いて、検出されたサウンドイベントの方向を示す角度であって、左右入力対についての真のＯＳＡまたは真のＤＳＡのいずれかに等しい角度（「左右サウンドイベント角度」または「ｄ／ｌｒ’」）を生成し、中央差分信号Ｃｏ，サラウンド差分信号Ｓｏ，および中央‐サラウンドトリガ信号Ｔｃｓを用いて、検出されたサウンドイベントの方向を示す角度であって、中央‐サラウンド入力対についての真のＯＳＡまたは真のＤＳＡのいずれかに等しい角度（「中央‐サラウンドサウンドイベント角度」または「ｄ／ｃｓ’」）を生成する。さらに、回路３０１４は、すべての電力エンベロープｄｌｒ、ｄｃｓを用いて、ＤＳＡの正確性を検証する。複数入力チャンネル対および単一サウンドイベント型用サウンドイベント特定回路２６１４の詳細は図３１に示されており、一般的に、第１のＯＳＡ回路３１０２と、第１のＤＳＡ回路３１０４と、第２のＤＳＡ回路３１０６と、第２のＯＳＡ回路３１０８と、検証回路３１１６と、制御回路３１１８と、第１の２点スイッチ３１１０と、第１の３点スイッチ３１１２と、第１のコンデンサ３１１４と、第２の２点スイッチ３１２０と、第２の３点スイッチ３１２２と、第２のコンデンサ３１２４とを含む。

ｄ／ｌｒ’は、第１のＯＳＡ回路３１０２と、第１のＤＳＡ回路３１０４と、第１の２点スイッチ３１１０と、第１の３点スイッチ３１１２と、第１のコンデンサ３１１４とによって生成される。同様に、ｄ／ｃｓ’は、第２のＯＳＡ回路３１０８と、第２のＤＳＡ回路３１０６と、第２の２点スイッチ３１２０と、第２の３点スイッチ３１２２と、第２のコンデンサ３１２４とによって生成される。第１および第２のＯＳＡ回路３１０２および３１０８は、既知の方法を用いて、Ｌｉｎ，Ｒｉｎ，Ｃｉｎ，およびＳｉｎをそれぞれ通常指向角「ｌｒ」および「ｃｓ」に変換する。制御回路３１１８、第１の３方向スイッチ３１１２、および第１のコンデンサ３１１４は第１のサンプルホールド回路を形成し、制御回路３１１８、第２の３方向スイッチ３１２２、および第２のコンデンサ３１２４は第２のサンプルホールド回路を形成する。第１および第２の３方向スイッチ３１１２および３１２２は、それぞれ、通常、サウンドイベントが検出されていない場合には位置Ｃにあり、サウンドイベントが検出された場合には各スイッチは閉じられ（位置Ａへ移動）、検出しようとするサウンドイベント型の典型的な立ち上がり時間の終了時には開けられ（位置Ｂへ移動）、検出しようとするサウンドイベント型の典型的な持続期間終了時には接地（位置Ｃへ移動）するように、制御回路によって制御される。制御回路３１１８は、３方向スイッチ３１１２および３１２２へ伝達される制御信号「ｃｏｎ」を生成する。制御信号は、サウンドイベントが入力チャンネル対のいずれかで検出されていることをトリガ信号（ＴｌｒまたはＴｃｓ）が示す度に、３方向スイッチ３１１２および３１２２を位置Ａに移動する（またはそこに留まらせる）ようにする。その後、ｃｏｎは、サウンドイベントの立ち上がり時間の典型的な持続期間の終了時に、３方向スイッチ３１１２および３１２２を位置Ｂに移動させる。その後、ｃｏｎは、検出しようとするサウンドイベント型の典型的な持続期間の終了時に、３方向スイッチ３１１２および３１２２を位置Ｃに移動させる
２方向スイッチ３１１０および３１２０は、ともに、位置ＤおよびＥを含む。サウンドイベントが検出されて、両方の２方向スイッチ３１１０および３１２０が位置Ｄにあるときは、チャンネル対毎のＤＳＡを用いて、サウンドイベントの方向を示す。しかしながら、サウンドイベントが検出されて、両方の２方向スイッチ３１１０および３１２０が位置Ｅにあるときは、チャンネル対毎のＯＳＡを用いて、サウンドイベントの方向を示す。検証回路３１１６は、サウンドイベント検出時にＤＳＡが正確かどうかに従って、両方の２方向スイッチ３１１０および３１２０を検証信号「ｖｓ」によって制御する。トリガ信号（ＴｌｒまたはＴｃｓ）のいずれかがサウンドイベントの検出を示す場合には、検証回路は、電力エンベロープ（Ｌ^２，Ｒ^２，Ｃ^２，Ｓ^２）のうち少なくとも２つが少なくとも３ｄＢ以上降下したと決定する。少なくとも２つの電力エンベロープが前回のサウンドイベントから少なくとも３ｄＢ以上降下した場合には、検証回路は、両方の２方向スイッチ３１１０および３１２０に対してｖｓによって通信を行い、位置Ｅに移動または留まらせるようにする。しかしながら、少なくとも２つの電力エンベロープが少なくとも３ｄＢ以上降下していない場合には、検証回路は、両方の２方向スイッチ３１１０および３１２０に対してｖｓによって通信を行い、位置Ｄに移動または留まらせるようにする。

代わりに、サウンドイベント特定回路の検証回路３１１６は、整合性チェックを行うための回路（「整合性チェック回路」）を含む。整合性チェック回路は、両方のＤＳＡ回路に接続され、それぞれが生成した差分指向角を用いて、差分指向角の正確性をさらに決定する。整合性チェック回路は、任意のトリガ信号がサウンドイベントの検出を示すときにｄｌｒおよびｄｃｓの絶対値の和を決定するための既知の回路を用いて、その和が４５度以下かどうかを決定する。和が４５度以下である場合は、電力エンベロープの少なくとも２つが約３ｄｂ以上降下しておらず、検証信号が両方の２方向スイッチ３１１０および３１２０に対して伝送されて、位置Ｄに移動させる。

さらに、順応度を調整するために、さらに回路を付加してもよく（「順応調整回路」）、整合性チェックの関数としての閾値を調整するために、さらに回路を付加してもよい（「エラー閾値回路」）。順応調整回路およびエラー閾値回路（図示せず）は、ともに整合性チェック回路に接続され、約数秒という期間に整合性チェックによって検出されたエラーの数をカウントするカウンタを含む。また、順応調整回路は、ＤＳＡ回路３１０４および３１０２に含まれる一過性現象検出回路に順応信号を入力し、カウンタによってカウントされたエラーの数に従って調整される電圧源をさらに含む。エラーの数が多ければ、順応電圧源によって生じる電圧は上昇して、順応度を減少させる。対照的に、エラー閾値回路は、トリガ生成回路内の閾値検出部に接続され、カウンタによってカウントされたエラーの数に従って調整されるエラー電圧源をさらに含む。エラーの数が多ければ、エラー電圧源によって生じる電圧は上昇して、サウンドイベントが少なく検出されるように閾値電圧を上昇させる。

また、サウンドイベント検出器および特定器は、単一の入力チャンネル対において生成される音場から複数のサウンドイベント型を検出するように実施されてもよい（「単一入力チャンネル対および複数サウンドイベント型用サウンドイベント検出器および特定器」）。単一入力チャンネル対および複数サウンドイベント型用サウンドイベント検出器および特定器は、一般的に、検出しようとするサウンドイベント型毎に並行して実施されて入力チャンネル対におけるサウンドイベント型毎に差分指向角を生成する、単一入力チャンネルおよび単一サウンドイベント型用サウンドイベント検出器および特定器を含む。代わりに、単一入力チャンネル対および複数サウンドイベント型用サウンドイベント検出器および特定器は、サウンドイベント型毎に実施された単一チャンネル対および単一サウンドイベント型用サウンドイベント検出器と、検出しようとするすべてのサウンドイベントの型の方向を示す差分指向角を生成する、単一チャンネル対用単一チャンネル対および単一サウンドイベント型用サウンドイベント特定器とを含んでもよい。そのような単一入力チャンネル対および複数サウンドイベント型用サウンドイベント検出器および特定器の一例を図３２に示す。

図３２では、単一入力チャンネル対および複数サウンドイベント型用サウンドイベント検出器および特定器は、チャンネル対および単一サウンドイベント型用サウンドイベント検出器３２０２と、単一チャンネル対および短期サウンドイベント型用サウンドイベント検出器３２０４と、単一チャンネル対および単一サウンドイベント型用サウンドイベント特定器３２０６とを含む。単一チャンネル対および単一サウンドイベント型用サウンドイベント検出器３２０２は、音節を検出して左差分信号Ｌｏ，右差分信号Ｒｏ、および音節の発生を示す左右トリガ信号「Ｔｌｒ（ｓ）」を生成するように実施された、図２４に示す複数チャンネルおよび単一サウンドイベント型用サウンドイベント検出器を含んでもよい。単一チャンネル対および短期サウンドイベント型用サウンドイベント検出器３２０４は、衝撃音を検出して、衝撃音の発生を示す（左トリガ信号および右トリガ信号の組み合わせとしての）左右トリガ信号「Ｔｌｒ（ｉ）」を生成するように実施された、図２３に示す単一チャンネル対および短期サウンドイベント型用サウンドイベント検出器を含んでもよい。単一チャンネル対および単一サウンドイベント型用サウンドイベント特定器３２０６は、トリガ信号のいずれか（Ｔｌｒ（ｓ）またはＴｌｒ（ｉ））がサウンドイベントの発生を示す度に、音節または衝撃音の方向を示す左右差分指向角を生成するように実施された、図２９に示す単一チャンネル対および複数サウンドイベント型用サウンドイベント特定器を含んでもよい。このようなサウンドイベント検出器および特定器は、左右入力チャンネル対における音節および衝撃音を検出および特定するように実施されているが、所望するサウンドイベント型を検出するように実施され、かつ単一チャンネル対用サウンドイベント検出器によって生成された任意のトリガ信号に応答する単一チャンネル対および単一サウンドイベント型用サウンドイベント特定回路を有する、単一チャンネル対用サウンドイベント検出器を付加することによって、どのチャンネル対においても、そこにおけるサウンドイベント型の数がいくつであっても検出できるように実施可能である。

また、サウンドイベント検出器および特定器は、複数の入力チャンネル対において生成された音場における複数のサウンドイベント型を検出するように実施されてもよい（「複数入力チャンネル対および複数サウンドイベント型用サウンドイベント検出器および特定器」）。左右チャンネル対および中央‐サラウンドチャンネル対の両方における音節および衝撃音を検出する複数入力チャンネル対および複数サウンドイベント型用サウンドイベント検出器および特定器を図３３に示す。この複数入力チャンネル対および複数サウンドイベント型用サウンドイベント検出器および特定器３３００は、単一チャンネル対および単一短期サウンドイベント用第１および第２のサウンドイベント検出器３３０２および３３０８と、単一チャンネル対および単一サウンドイベント用第１および第２のサウンドイベント検出器３３０４および３３０６と、複数チャンネル対および単一サウンドイベント型用サウンドイベント特定回路３３１０とを含む。

単一チャンネル対および単一サウンドイベント用第１のサウンドイベント検出器３３０４は、音節を検出して左差分信号Ｌｏ，右差分信号Ｒｏ、および音節の発生を示す左右トリガ信号「Ｔｌｒ（ｓ）」を生成するように実施された、図２４に示す複数チャンネルおよび単一サウンドイベント型用サウンドイベント検出器を含んでもよい。同様に、単一チャンネル対および単一サウンドイベント用第２のサウンドイベント検出器３３０６は、音節を検出して中央差分信号Ｃｏ，サラウンド差分信号Ｓｏ、および音節の発生を示す中央‐サラウンドトリガ信号「Ｔｃｓ（ｓ）」を生成するように実施された、図２４に示す複数チャンネルおよび単一サウンドイベント型用サウンドイベント検出器を含んでもよい。単一チャンネル対および短期サウンドイベント用第１のサウンドイベント検出器３３０２は、衝撃音を検出して、衝撃音の発生を示す（左トリガ信号および右トリガ信号の組み合わせとしての）左右トリガ信号「Ｔｌｒ（ｉ）」を生成するように実施された、図２３に示す単一チャンネル対および単一短期サウンドイベント用サウンドイベント検出器を含んでもよい。同様に、単一チャンネル対および短期サウンドイベント用第２のサウンドイベント検出器３３０８は、衝撃音を検出して、衝撃音の発生を示す（中央トリガ信号およびサラウンドトリガ信号の組み合わせとしての）中央‐サラウンドトリガ信号「Ｔｃｓ（ｉ）」を生成するように実施された、図２３に示す単一チャンネル対および単一短期サウンドイベント用サウンドイベント検出器を含んでもよい。複数チャンネル対および単一サウンドイベント型用サウンドイベント特定回路３３１０は、任意のトリガ信号（Ｔｌｒ（ｓ），Ｔｌｒ（ｉ），Ｔｃｓ（ｓ），またはＴｃｓ（ｉ））がサウンドイベントの発生を示す度に、検出された音節または衝撃音の方向を示す左右サウンドイベント角度「ｄ／ｌｒ’（ｓ，ｉ）」と、、任意のトリガ信号（Ｔｌｒ（ｓ），Ｔｌｒ（ｉ），Ｔｃｓ（ｓ），またはＴｃｓ（ｉ））がサウンドイベントの発生を示す度に、検出された音節または衝撃音の方向を示す中央‐サラウンドサウンドイベント角度「ｄ／ｃｓ’（ｓ，ｉ）」とを生成するように実施された、図３１に示す複数チャンネル対および単一サウンドイベント型用サウンドイベント特定回路を含んでもよい。このサウンドイベント検出器および特定器は、左右および中央‐サラウンド入力チャンネル対における音節および衝撃音を検出および特定するように実施されているが、所望するチャンネル対から所望するサウンドイベント型を検出するように実施され、かつ単一チャンネル対用サウンドイベント検出器によって生成された任意のトリガ信号に応答する複数チャンネル対および単一サウンドイベント型用サウンドイベント特定回路を有する、単一チャンネル対用サウンドイベント検出器を付加することによって、チャンネル対の数においても、そこにおけるサウンドイベント型の数がいくつであっても検出できるように実施可能である。

さらに、任意の複数入力チャンネル対および複数サウンドイベント型用サウンドイベント検出器および特定器は、順応調整回路および／またはエラー閾値回路をさらに含んでもよい。順応調整回路およびエラー閾値回路（図示せず）は、ともに整合性チェック回路に接続され、約数秒という期間に整合性チェックによって検出されたエラーの数をカウントするカウンタを含む。また、順応調整回路は、ＤＳＡ回路に含まれる一過性現象検出回路に順応信号を入力する。また、エラー閾値回路も、トリガ生成回路内の閾値検出部に接続され、カウンタによってカウントされたエラーの数に従って調整されるエラー電圧源をさらに含む。エラーの数が多ければ、エラー電圧源によって生じる電圧は上昇して、サウンドイベントが少なく検出されるように閾値電圧を上昇させる。

（８．サラウンド検出器）
サウンドイベント検出器および特定器は、ステレオ／サラウンド検出器として応用できる。ステレオ／サラウンド検出器は、音場が２つの入力チャンネル再生用か２つ以上の入力チャンネル再生用かを決定する。単一のサウンドイベント型を検出するように実施されたステレオ／サラウンド検出器３４００（「単一のサウンドイベント型ステレオ／サラウンド検出器」）の一例は図３４に示されており、単一入力チャンネル対および単一サウンドイベント型用サウンドイベント検出器および特定器３４０２と、検出器およびカウンタ３４０４とを含む。単一入力チャンネル対および単一サウンドイベント型用サウンドイベント検出器および特定器３４０２は、中央入力チャンネルＣｉｎおよびサラウンド入力チャンネルＳｉｎにおける信号を用いて、どのようなサウンドイベントを検出しようとしていても、その方向を反映する真の差分指向角ｄｃｓ’を生成する。その後、閾値検出器およびカウンタ３４０４は、回数ｄｃｓ’が約０度〜約−４５度の範囲内に入るかどうかを決定する。数値が所定の値を超える場合には、閾値検出器およびカウンタ３４０４は、音場をサラウンド再生すべきことを示す信号ｓｕｒｓｉｇを生成する。逆に、数値が所定の値を超えない場合には、検出器およびカウンタ３４０４は、音場をステレオ再生すべきことを示す信号ｓｕｒｓｉｇを生成する。一般的に、約１０ｓ〜約１５ｓ程度の比較的長い期間に検出されたサウンドイベントの数は、約２つまたは３つ程度であり、検出器およびカウンタ３４０４は、音場をサラウンド再生すべきことを示す信号ｓｕｒｓｉｇを生成する。さらに、検出器およびカウンタは、サウンドイベントの持続期間を決定して、所定の値を超える持続期間のものだけを、後部からの再生すべきサウンドイベントとしてカウントしてもよい。一例として、約５０ｍｓ未満の持続期間のサウンドイベントは、後部からの再生すべきサウンドイベントとしてカウントしない。他の例として、約２００ｍｓ〜約３００ｍｓの持続期間のサウンドイベントは、後部からの再生すべきサウンドイベントとしてカウントする。

代わりに、単一サウンドイベント型を検出するように実施されたステレオ／サラウンド検出器を図３５の参照番号３５００で示す。図３５の例では、ステレオ／サラウンド検出器３５００は、後部での再生を意図した音節および衝撃機能の数をカウントするように実施されている。しかしながら、カウントするサウンドイベントの型やその組み合わせはどのようなものであって実施可能である。検出器３５００は、単一入力チャンネル対および単一サウンドイベント型用第１および第２のサウンドイベント検出器および特定器３５０２および３５０４と、検出器およびカウンタ３５０６とを含む。単一入力チャンネル対用第１のサウンドイベント検出器および特定器３５０２は、中央入力チャンネルＣｉｎにおける信号と、サラウンド入力チャンネルＳｉｎにおける信号とを用いて、音節の方向を反映する真の差分指向角ｄｃｓ’（ｓ）を生成する。同様に、単一入力チャンネル対用第２のサウンドイベント検出器および特定器３５０４は、中央入力チャンネルＣｉｎにおける信号と、サラウンド入力チャンネルＳｉｎにおける信号とを用いて、衝撃音の方向を反映する真の差分指向角ｄｃｓ’（ｉ）を生成する。その後、検出器およびカウンタ３５０６は、回数ｄｃｓ’（ｓ，ｉ）が約０度〜約−４５度の範囲内に入るかどうかを決定して、音場をステレオ再生またはサラウンド再生すべきことを示す信号ｓｕｒｓｉｇ（ｓ，ｉ）を生成する。

（９．サウンド特定器）
人間の聴覚機構特性をモデル化して、背景信号がある状態でサウンドイベントを特定する電子回路を考案した（「サウンド特定器」と総称する）。サウンド特定器は、音場においてサウンドイベントと非サウンドイベントとを個別に検出および特定して、音場の方向を継続的に示す。このようなサウンド特定器は、録音されたサウンドの再生など、様々な応用分野で利用でき、特に、サウンドが定常サウンドと同時に発生するサウンドイベントを含む複雑な音場の一部である場合に利用できる。音場がサラウンド再生すべきであるがステレオ形式で記憶されている場合、サウンド特定器をマトリックスデコーダの一部として用いて、２つの入力チャンネル混成からサウンドの真の方向を導出することができる。また、サウンド特定器は、入力チャンネルの数がいくつであっても、そこで生成された音場におけるサウンドイベント型の数および組み合わせがどのようなものであっても、検出するように実施できる。以下の説明では、複雑でないものから順にサウンド特定器を説明し、各サウンド特定器は、特に示さない限り、それに先立って説明したサウンド特定器の構成要素を含むものとする。

単一の入力チャンネル対における単一のサウンドイベント型を別個に特定するサウンド特定器（「単一入力チャンネル対および単一サウンドイベント型用サウンド特定器」）の一例を図３６に示す。単一入力チャンネル対および単一サウンドイベント型用サウンド特定器３６００は、単一チャンネル対および単一サウンドイベント型用サウンドイベント検出器３６０２と、単一チャンネル対および単一サウンドイベント型用サウンド特定回路３６０４とを含む。単一チャンネル対および単一サウンドイベント型用サウンドイベント検出器３６０２は、検出しようとするサウンドイベントがどのようなものであっても検出および生成して左右の差分信号ＬｏおよびＲｏ、およびトリガ信号Ｔｌｒを生成するように実施された、図２４に示す複数チャンネルおよび単一サウンドイベント型用サウンドイベント検出器を含んでもよい。サウンド特定回路３６０４は、Ｔｌｒ，Ｌｏ，Ｒｏ，ならびに左右の入力チャンネルにおける信号ＬｉｎおよびＲｉｎを用いて、通常指向角および差分指向角で表される、左右入力チャンネル対に対する音場の方向を示す指向角を生成する（本願においては、一般的に「包括指向角」と称し、左右入力チャンネル対に対する包括指向角を「ｃｌｒ」と称する）。

単一チャンネル対および単一サウンドイベント型用サウンド特定回路３６０４の詳細を図３７に示す。この回路は、通常指向角（ＯＳＡ）回路３７０２と、ＤＳＡ回路３７０４と、制御回路３７０６と、第１のスイッチ３７０８と、抵抗器３７１０と、第２のスイッチ３７１２と、コンデンサ３７１４とを含む。単一チャンネル対および単一サウンドイベント型用サウンドイベント特定回路３６０４は、左右の差分信号ＬｏおよびＲｏと、左右の入力信号ＬｉｎおよびＲｉｎを用いて、左右包括指向角ｃｌｒ’を生成する。一般的に、サウンドイベントが検出されない場合は、ｃｌｒ’はＯＳＡに等しくかつ従い、サウンドイベントが検出されている場合には、いつもＤＳＡに従う。ＯＳＡ回路３７０２は、ＬｉｎおよびＲｉｎを用いて、通常指向角Ｉｒを決定する。ＤＳＡ回路３７０４は、差分信号ＬｏおよびＲｏを用いて、差分指向角を生成する。一般的に、制御回路３７０６、第１のスイッチ３７０８、抵抗器３７１０、およびコンデンサ３７１４は、サンプルホールド回路を形成し、したがって、同様の機能を行う任意の装置または回路によって置き換えることができる。

一般的に、サウンドイベントが検出されない場合、第１のスイッチ３７０８は開き、第２のスイッチ３７１２は閉じる。この状態で、抵抗器３７１０およびコンデンサ３７１４によって規定された割合で、ｃｌｒ’はｌｒに従う。しかしながら、サウンドイベントが検出される場合、制御回路３７０６は、第１のスイッチ３７０８を閉じさせ、ｃｌｒ’が検出しようとするサウンドイベント型の典型的な持続期間における真のＤＳＡと等しくなるように、コンデンサ３７１２に対して、検出しようとするサウンドイベントの典型的な立ち上がり時間の間にｄｌｒを取り込むようにさせる。より特定的には、制御回路３７１６は、トリガ信号Ｔｌｒを受信して、第１のスイッチ３７０８および第２のスイッチ３７１２を制御する制御信号「ｃｏｎ」を生成する。Ｔｌｒがサウンドイベントの発生を示す場合、制御回路３７１６は、第１のスイッチ３７０８に対して、第１のスイッチ３７０８を閉じさせる閉コマンドを「ｃｏｎ」によって伝達する。検出しようとするサウンドイベントの典型的な立ち上がり時間の終了時に、制御回路３７１６は、第１および第２のスイッチ３７０８および３７１２に対して、第１および第２のスイッチ３７０８および３７１２を開く開コマンドをｃｏｎによって伝達する。検出しようとするサウンドイベントの典型的な持続期間の後、制御回路３７１６は、第２のスイッチ３７１２に対して、ｃｏｎによって閉じるコマンドを伝達する。第１のスイッチ３７０８が閉じている間（サウンドイベントの立ち上がり時間）、左右差分指向角ｄｌｒがコンデンサ３７１４によって取り込まれ、真のＤＳＡｄｌｒ’を作成する。Ｃｌｒ’は真のＤＳＡによって規定され、たとえサウンドイベントが実際に終了していなくても、サウンドイベントの典型的な持続期間の終了まで保持される。例えば、検出しようとするサウンドイベントが音節の場合、真のＤＳＡは約５０ｍｓから約２００ｍｓの間、好ましくは約１５０ｍｓ後まで保持される。他の例では、検出しようとするサウンドイベントが衝撃音の場合、真のＤＳＡは約５０ｍｓ保持される。サウンドイベント型の典型的な持続期間の終了時点では、コンデンサ３７１４は、特定の比率でｌｒを反映するまで、帯電または放電する。コンデンサ３７１４および抵抗器３７１０は、特定の減衰比を生じさせるＲＣ時定数を規定するように選ばれる。例えば、ＲＣ時定数は、約３００ｍｓに等しくなるようにする。

代わりに、サウンド特定回路は、短期サウンドイベント用に特化して実施することもできる。上述したように、衝撃音のような短期サウンドイベントがＤＳＡに従って特定される場合、短期サウンドイベントの典型的な持続期間の終了時にサウンドイベントが実際に終了したかどうかを決定して、サウンドイベントが終了していれば即座にＯＳＡに切り替えれば、都合がよいことが多い。この機能を含むサウンドイベント特定回路の一例（本願では、「単一入力チャンネル対および短期サウンドイベント用サウンドイベント特定回路」と称する）を図３８に示す。単一入力チャンネル対および短期サウンドイベント用サウンドイベント特定回路３８００は、ＯＳＡ回路３８０２と、ＤＳＡ回路３８０４と、制御回路３８０８と、検出器３８１０と、第１のスイッチ３８１２と、第１の抵抗器３８１４と、第３のスイッチ３８１３と、第２の抵抗器３８１５と、コンデンサ３８１５とを含む。このサウンド特定回路３８００は、左右包括指向角ｃｌｒ’を生成する。サウンドイベントが検出されない場合、ｃｌｒ’はフィルタ後のＯＳＡに等しい（抵抗器３８１４およびコンデンサ３８１６によってフィルタ後はｌｒ）。しかしながら、サウンドイベントが検出される場合、ｃｌｒ’は真のＯＳＡまたは真のＤＳＡのいずれかに等しい。単一入力チャンネル対および短期サウンドイベント用サウンドイベント特定回路は、一般的に、図３７のサウンド特定回路と同様に振る舞うが、異なるのは、サウンドイベントが実際に終了したかどうかによって、サウンドイベントの終了時にｃｌｒ’がｌｒに減衰するか、即座にＩｒとなるかが決まる点である。

制御回路３８０８がサウンドイベントの発生を示すトリガ信号を受信して、検出しようとするサウンドイベントの典型的な持続期間が終了したと決定した場合、上述した他の機能に加えて、制御回路は、検出器３８１０と通信して、サウンドイベントが実際に終了したかどうかを確立させる。検出器３８１０は、電力エンベロープを、チャンネル対の各入力チャンネルにおける順応信号を比較することによって、サウンドイベントが実際に終了したかどうかを決定する。入力電力エンベロープが入力チャンネル対のいずれかの入力チャンネルにおける順応信号より大きい場合には、検出器３８１０は、短期サウンドイベントが実際には終了していないと決定する。逆に、入力電力エンベロープが入力チャンネル対のいずれかの入力チャンネルにおける順応信号より大きくない場合には、検出器３８１０は、短期サウンドイベントが実際に終了したと決定する。制御回路３８０８がサウンドイベントが実際には終了していないと確立した場合には、第２のスイッチ３８１６に対して、ｃｏｎによって、閉じるよう指示する。第２のスイッチ３８１６が閉じると、ｃｌｒ’はフィルタ後のＯＳＡへ特定の速度で流れる。したがって、コンデンサ３８１８および抵抗器３８１４は、ＲＣ時定数がほぼこの特定の速度（一般的には、３００ｍｓ）に等しくなるように選ばれる。例えば、衝撃音を検出しようとする場合、コンデンサ３８１８および抵抗器３８１４のＲＣ時定数は約５ｍｓである。しかしながら、制御回路３８０８がサウンドイベントが実際に終了したと確立する場合、第３のスイッチ３８１３に対して、ｃｏｎによって、閉じるよう指示する。第２のスイッチ３８１６が閉じると、ｃｌｒ’は即座にＩｒとなる。したがって、第２の抵抗器３８１５およびコンデンサ３８１８のＲＣ時定数が第１の抵抗器３８１４およびコンデンサ３８１８のものよりもはるかに低くなるように（一般的には、１０分の１未満）、第２の抵抗器３８１５は選ばれる。一般的には、第３のスイッチは、非常に短い期間閉じたままである（一般的に、約３ｍｓ〜約１０ｍｓ）。この非常に短い期間が終了した後、制御回路３８０３は、ｃｌｒ’がフィルタ後のＯＳＡとなるように、第３のスイッチ３８１３に対しては開くよう指示し、第２のスイッチ３８１６に対しては閉じるように指示する。さらに、単一入力チャンネル対および短期サウンドイベント用サウンドイベント特定回路は、ＤＳＡ平均化回路をさらに含んでもよい。ＤＳＡ平均化回路は、サウンドイベント特定回路３８００内の、ＤＳＡ回路３８０４およびスイッチ３８１２の間において実施されてもよい。

サウンド特定器は、複数の入力チャンネル対において生成された音場における単一のサウンドイベント型を検出するために実施されてもよい（「複数入力チャンネル対および単一サウンドイベント型用サウンド特定器」）。ＬＲ入力チャンネル対およびＣＳ入力チャンネル対の両方における単一のサウンドイベントを検出および特定するように実施された、複数入力チャンネル対および単一サウンドイベント型用サウンド特定器の一例を図３９の参照符号３９００に示す。このサウンド特定器は、入力チャンネル対のどのような組み合わせにでも適用可能であり、この例でＬＲ入力チャンネル対およびＣＳ入力チャンネル対を用いたのは説明のためだけである。複数入力チャンネル対および単一サウンドイベント型用サウンド特定器３９００は、ＬＲ入力チャンネル対についての包括指向角（「ｃｌｒ’」）およびＣＳ入力チャンネル対について包括指向角（「ｃｃｓ’」）を生成し、一般的に、単一入力チャンネル対および単一サウンドイベント型用第１および第２のサウンドイベント検出器３９０２および３９０４と、複数入力チャンネル対および単一サウンドイベント型用サウンド特定回路３９０６とを含む。

単一入力チャンネルおよび単一サウンドイベント型用第１および第２のサウンドイベント検出器３９０２および３９０４は、図２４に示すような、同一のサウンドイベントを検出するように実施された複数入力チャンネルおよび単一サウンドイベント型用サウンドイベント検出器を含んでもよい。単一入力チャンネル用第１のサウンドイベント検出器３９０２は、Ｌｉｎ’およびＲｉｎ’を用いて、左差分信号Ｌｏ，右差分信号Ｒｏ，および左右トリガ信号Ｔｌｒを生成する。同様に、単一入力チャンネル用第２のサウンドイベント検出器３９０４は、Ｃｉｎ’およびＲｉｎ’を用いて、中央差分信号Ｃｏ，サラウンド差分信号Ｓｏ，および中央‐サラウンドトリガ信号Ｔｃｓを生成する。

複数入力チャンネル対および単一サウンドイベント型用サウンド特定回路３９０６は、左差分信号Ｌｏ，右差分信号Ｒｏ，および左右トリガ信号を用いて、左右包括指向角ｃｌｒ’を生成し、中央差分信号Ｃｏ，サラウンド差分信号Ｓｏ，および中央‐サラウンドトリガ信号Ｔｃｓを用いて、中央‐サラウンド包括指向角ｃｃｓ’を生成する。さらに、回路３９０６は、全ての電力エンベロープｄｌｒおよびｄｃｓを用いて、ＤＳＡの正確性を検証する。この回路３９０６は、図４０により詳細に示されており、一般的に、第１のＯＳＡ回路４００２と、第１のＤＳＡ回路４００４と、第２のＤＳＡ回路４００６と、第２のＯＳＡ回路４００８と、検証回路４０２０と、制御回路４０２２と、第１の２点スイッチ４０１０と、第１のスイッチ４０１２と、第１の抵抗器４０１４と、第１のコンデンサ４０１８と、第２のスイッチ４０１４と、第２の２点スイッチ４０３０と、第３のスイッチ４０３２と、第２のコンデンサ４０３８と、第４のスイッチ４０３６と、第２の抵抗器４０３４とを含む。

ｃｌｒ’は、第１のＯＳＡ回路４００２と、第１のＤＳＡ回路４００４と、第１の２点スイッチ４０１０と、第１のスイッチ４０１２と、第１の抵抗器４０１４と、第２のスイッチ４０１６と、第１のコンデンサ３１１４とによって生成される。同様に、ｄ／ｃｓ’は、第２のＯＳＡ回路４００８と、第２のＤＳＡ回路４００６と、第２の２点スイッチ４０３０と、第３のスイッチ４０３２と、第２の抵抗器４０３４と、第２のコンデンサ４０３８とによって生成される。第１および第２のＯＳＡ回路４００２および４００８は、Ｌｉｎ，Ｒｉｎ，Ｃｉｎ，およびＳｉｎを、それぞれ通常指向角ｌｒおよびｃｓに変換する。制御回路４０２２、第１のスイッチ４０１２、第２のスイッチ４０１６、および第１のコンデンサ４０１８は、第１のサンプルホールド回路を形成し、制御回路４０２２、第３のスイッチ４０３２、第４のスイッチ４０３４、第２の抵抗器４０３４、および第２のコンデンサ４０３８は、第２のサンプルホールド回路を形成する。第１および第３のスイッチ４０１２および４０３２はともに、サウンドイベントが検出されない場合は通常開いており、サウンドイベントが検出されると各スイッチが閉じ、検出しようとするサウンドイベント型の典型的な立ち上がり時間の終了時に開くように、制御回路によって制御されている。第２および第４のスイッチ４０１６および４０３６はともに、サウンドイベントが検出されない場合は通常閉じており、サウンドイベントが検出されるとき、ならびに検出しようとするサウンドイベント型の典型的な立ち上がり時間の終了時に各スイッチが開くように、制御回路によって制御されている。制御回路４０２２は、すべてのスイッチ４０１２，４０１６，および４０３２，４０３６に対して伝達される制御信号「ｃｏｎ」を生成する。この制御信号により、トリガ信号のいずれか（ＴｌｒまたはＴｃｓ）が入力チャンネル対のどちらかでサウンドイベントが検出されたと示す場合に、第１および第２のスイッチ４０１２および４０１６は閉じられる（または閉じたままとなる）。その後、ｃｏｎは、サウンドイベントの立ち上がり時間の典型的な持続期間の終了時に、すべてのスイッチ４０１２，４０１６，および４０３２，４０３６を開かせる。

２方向スイッチ４０１０および４０３０はともに、位置ＤおよびＥを含む。サウンドイベントが検出されて２方向スイッチ４０１０および４０３０がともに位置Ｄにある場合、各チャンネル対のＤＳＡを用いて、サウンドイベントの方向を示す。しかしながら、サウンドイベントが検出されて２方向スイッチ４０１０および４０２０がともに位置Ｅにある場合、各チャンネル対のＯＳＡを用いて、サウンドイベントの方向を示す。検証回路４０２０は、サウンドイベントが検出されると、ＤＳＡが正確かどうかに従って、２方向スイッチ４０１０および４０２０の両方を検証信号「ｖｓ」で制御する。トリガ信号のいずれか（ＴｌｒまたはＴｃｓ）がサウンドイベントが検出されたと示す場合に、検証回路は、電力エンベロープ（Ｌ^２，Ｒ^２，Ｃ^２，Ｓ^２）のうち少なくとも２つが少なくとも３ｄＢ以上降下したかどうかを決定する。電力エンベロープのうち少なくとも２つが以前のサウンドイベントから少なくとも３ｄＢ以上降下した場合、検証回路は、２方向スイッチ４０１０および４０２０の両方に対して、ｖｓによって、位置Ｅに移動または留まらせる。しかしながら、電力エンベロープのうち少なくとも２つが以前のサウンドイベントから少なくとも３ｄＢ以上降下していな場合、検証回路は、２方向スイッチ４０１０および４０２０の両方に対して、ｖｓによって、位置Ｄに移動または留まらせる。

代わりに、サウンドイベント特定回路の検証回路４０２０は、整合性チェック回路を含む。整合性チェック回路は、両方のＤＳＡ回路に接続され、それぞれで生成された差分指向角を用いて、上述のように、差分指向角の正確性をさらに決定する。さらに、複数サウンドイベント型および単一サウンド型用サウンド特定器は、順応調整回路および／またはエラー閾値調節回路をさらに含んでもよい。

代わりに、複数入力チャンネル対および単一サウンドイベント型用サウンド特定回路は、衝撃音のような短期サウンドイベント用に特化して実施することもできる。上述したように、短期サウンドイベントを特定する場合、検出しようとするサウンドイベント型の典型的な持続期間の終了時にサウンドイベントが実際に終了したかどうかを決定して、サウンドイベントが終了していれば即座にＯＳＡに切り替えれば、都合がよいことが多い。そのような複数入力チャンネル対および短期サウンドイベント用サウンド特定回路の一例を図４１に参照符号４１００で示す。この複数入力チャンネル対および短期サウンドイベント用サウンド特定回路４１００は、一般的に、第１のＯＳＡ回路４１０２と、第１のＤＳＡ回路４１０４と、第２のＤＳＡ回路４１０６と、第２のＯＳＡ回路４１０８と、検証回路４１２０と、制御回路４１２２と、検出器４１２４と、第１の２点スイッチ４１１０と、第１のスイッチ４１１２と、第１の抵抗器４１１４と、第１のコンデンサ４１１８と、第２のスイッチ４１１６と、第２の２点スイッチ４１３０と、第３のスイッチ４１３２と、第２のコンデンサ４１３８と、第４のスイッチ４１３６と、第２の抵抗器４１３４と、第５のスイッチ４１１３と、第３の抵抗器４１１５と、第６のスイッチ４１３３と、第４の抵抗器４１３５とを含む。このサウンド特定回路４１００は、左右包括指向角を生成する。サウンドイベントが検出されない場合、ｃｌｒ’はフィルタ後のＯＳＡに等しい（第１の抵抗器４１１４および第１のコンデンサ４１１８によってフィルタ後はｌｒ）。サウンドイベントが検出される場合、ｃｌｒ’は左右チャンネル対の真のＯＳＡまたは真のＤＳＡのいずれかに等しい。このサウンド特定回路４１００は、中央‐サラウンド包括指向ｃｃｓ’も生成する。サウンドイベントが検出されない場合、ｃｌｒ’はフィルタ後のＯＳＡに等しい。サウンドイベントが検出される場合、ｃｌｒ’は中央‐サラウンドチャンネル対の真のＯＳＡまたは真のＤＳＡのいずれかに等しい。複数チャンネル対および単一短期サウンドイベント用サウンド特定回路は、一般的に、図４０の複数チャンネル対および単一サウンドイベント型用サウンド特定回路と同様に振る舞うが、異なるのは、サウンドイベントが実際に終了したかどうかによって、サウンドイベントの終了時にｃｌｒ’がフィルタ後のＯＳＡに減衰するか、即座にフィルタ後のＯＳＡとなるかが決まる点である。

制御回路４１２２がサウンドイベントの発生を示すトリガ信号を受信して、検出しようとするサウンドイベントの典型的な持続期間が終了したと決定した場合、上述した他の機能に加えて、制御回路は、検出器４１２４と通信して、サウンドイベントが実際に終了したかどうかを確立させる。検出器４１２２は、電力エンベロープを、チャンネル対の各入力チャンネルにおける順応信号を比較することによって、サウンドイベントが実際に終了したかどうかを決定する。入力電力エンベロープが入力チャンネル対のいずれかの入力チャンネルにおける順応信号より大きい場合には、検出器４１２２は、短期サウンドイベントが実際には終了していないと決定する。逆に、入力電力エンベロープが入力チャンネル対のいずれかの入力チャンネルにおける順応信号より大きくない場合には、検出器４１２４は、短期サウンドイベントが実際に終了したと決定する。制御回路４１２２がサウンドイベントが実際には終了していないと確立した場合には、第２および第４のスイッチ４１１６および４１３６に対して、ｃｏｎによって、閉じるよう指示する。第２のスイッチ４１１６および第４のスイッチ４１３６が閉じると、ｃｌｒ’は左右のフィルタ後のＯＳＡへ特定の速度で流れ（第１の抵抗器４１１４および第１のコンデンサ４１１８でフィルタ後はＩｒ）、ｃｃｓ’は中央‐サラウンドのフィルタ後のＯＳＡへ特定の速度で流れる（第２の抵抗器４１３６および第２のコンデンサ４１３８でフィルタ後はｃｓ）。したがって、第１および第２のコンデンサ４１１８および４１３８ならびに第１および第２の抵抗器４１１４および４１３４は、ＲＣ時定数がほぼ特定の速度に等しくなるように選ばれる。例えば、衝撃音を検出しようとする場合、コンデンサ４１１８および抵抗器４１１４のＲＣ時定数ならびにコンデンサ４１３８および抵抗器４１３４のＲＣ時定数は約５ｍｓである。

しかしながら、制御回路４１１２がサウンドイベントが実際に終了したと確立する場合、第５および第６のスイッチ４１１３および４１３３に対して、ｃｏｎによって、閉じるよう指示する。第５および第６のスイッチ４１１３および４１３３が閉じると、ｃｌｒ’およびｃｃｓ’は、それぞれ即座にＩｒおよびｃｓとなる。したがって、第３の抵抗器４１１５および第１のコンデンサ４１１８のＲＣ時定数ならびに第４の抵抗器４１３５および第２のコンデンサ４１３８のＲＣ時定数は、ともに非常に低くなる。このようなＲＣ時定数は、第１の抵抗器４１１４および第１のコンデンサ４１１８のＲＣ時定数ならびに第２の抵抗器４１３４および第２のコンデンサ４１３８のＲＣ時定数よりもおおよそ少なくとも１０分の１未満であってもよい。第５および第６のスイッチ４１１３および４１３３は、短い期間閉じたままである。この短い期間は約３ｍｓ〜約１０ｍｓであってもよい。この短い期間が終了した後、制御回路４１２２は、ｃｌｒ’およびｃｃｓ’がフィルタ後のＯＳＡとなるように、第５および第６のスイッチ４１１３および４１３３に対しては開くよう指示し、第２および第４のスイッチ４１６６および４１３６に対しては閉じるように指示する。さらに、複数入力チャンネル対および短期サウンドイベント用サウンドイベント特定回路は、第１および第２のＤＳＡ平均化回路をさらに含んでもよい。第１のＤＳＡ平均化回路は、サウンドイベント特定回路４１００内の、第１のＤＳＡ回路４１０４および第１の２点スイッチ４１１０の間において実施されてもよい。同様に、第２のＤＳＡ平均化回路は、サウンドイベント特定回路４１００内の、第２のＤＳＡ回路４１０６および第２の２点スイッチ４１３０の間において実施されてもよい。

代わりに、複数入力チャンネル対および単一短期サウンドイベント型用サウンド特定回路４１００の検証回路は、整合性チェック回路を含む。

整合性チェック回路は、両方のＤＳＡ回路に接続され、それぞれで生成された差分指向角を用いて、上述のように、差分指向角の正確性をさらに決定する。さらに、複数サウンドイベント型および単一サウンド型用サウンド特定器は、順応調整回路および／またはエラー閾値調節回路をさらに含んでもよい。

サウンド特定回路は、単一の入力チャンネル対において生成される音場から複数のサウンドイベント型を検出するように実施されてもよい（「単一入力チャンネル対および複数サウンドイベント型用サウンド特定回路」）。左右入力チャンネル対における音節および衝撃音を検出および特定するように実施された単一入力チャンネル対および複数サウンドイベント型用サウンド検出器および特定器を図４２の参照符号４２００で示す（しかしながら、この特定器は、あらゆる入力チャンネル対に対してサウンドイベント型の組み合わせがどのようなものであっても検出するように実施されてもよい）。単一入力チャンネル対および複数サウンドイベント型用サウンド検出器および特定器４２００は、一般的に、単一入力チャンネルおよび単一サウンドイベント型用サウンドイベント検出器４２０２と、単一チャンネルおよび単一短期サウンドイベント装置用サウンドイベント検出器４２０６と、単一入力チャンネル対および複数サウンドイベント型用サウンド特定回路４２０４とを含む。

単一入力チャンネル対および単数サウンドイベント型用サウンドイベント検出器４２０２は、図２４に示すような、音節を検出するように実施された複数チャンネルおよび単数サウンドイベント型用サウンドイベント検出器を含んで、左差分信号Ｌｏ，右差分信号Ｒｏ，および音節の発生を示す左右トリガ信号Ｔｌｒ（ｓ）を生成してもよい。単一チャンネル対および単一短期サウンドイベント型用サウンドイベント検出器４２０６は、衝撃音を検出して、衝撃音の発生を示す（左トリガ信号および右トリガ信号の組み合わせとしての）左右トリガ信号「Ｔｌｒ（ｉ）」を生成するように実施された、図２３に示す単一チャンネル対および単一短期サウンドイベント用サウンドイベント検出器を含んでもよい。単一入力チャンネル対および単数サウンドイベント型用サウンド特定回路４２０４は、トリガ信号のいずれか（Ｔｌｒ（ｓ）またはＴｌｒ（ｉ））がサウンドイベントの発生を示す度に、検出された音節または衝撃音の方向を示す左右差分指向角を生成するように実施された、図３７に示すような単一チャンネル対および複数サウンドイベント型用サウンド特定回路を含んでもよい。このサウンド特定器は、左右入力チャンネル対における音節および衝撃音を検出および特定するように実施されているが、所望するサウンドイベント型を検出するように実施され、かつ単一チャンネル対用サウンドイベント検出器によって生成された任意のトリガ信号に応答する単一チャンネル対および単一サウンドイベント型用サウンド特定回路を有する、単一チャンネル対用サウンドイベント検出器を付加することによって、チャンネル対の数においても、そこにおけるサウンドイベント型の数がいくつであっても検出できるように実施可能である。

サウンド特定器は、複数の入力チャンネル対において生成された音場から複数のサウンドイベント型を検出するように実施されてもよい（「複数入力チャンネル対および複数サウンドイベント型用サウンド特定器」）。左右入力チャンネル対および中央‐サラウンド入力チャンネル対における音節および衝撃音を特に特定する、複数入力チャンネル対および複数サウンドイベント型用サウンド特定器の一例を図４３に示す（しかしながら、複数入力チャンネル対および複数サウンドイベント型用サウンド特定器は、入力チャンネル対の数がいくつであっても、そこにおけるサウンドイベントの組み合わせがどのようなものであっても検出するように実施されてもよい）。複数入力チャンネル対および複数サウンドイベント型用サウンド特定器４３００は、単一チャンネル対および単一短期サウンドイベント用第１および第２のサウンドイベント検出器４３０８および４３０６と、単一チャンネル対および単一サウンドイベント型用第１および第２のサウンドイベント検出器４３０２および４３０３と、複数チャンネル対および単数サウンドイベント型用サウンドイベント特定回路４３１０とを含む。

単一チャンネル対および単一サウンドイベント型用第１のサウンドイベント検出器４３０２は、図２４に示すような、音節を検出するように実施された複数チャンネルおよび単数サウンドイベント型用サウンドイベント検出器を含んで、中央差分信号Ｃｏ，サラウンド差分信号Ｓｏ，および音節の発生を示す中央‐サラウンドトリガ信号Ｔｃｓ（ｓ）を生成してもよい。単一チャンネル対および短期サウンドイベント型用第１のサウンドイベント検出器４３０８は、衝撃音を検出して、衝撃音の発生を示す（左トリガ信号および右トリガ信号の組み合わせとしての）左右トリガ信号Ｔｌｒ（ｉ）を生成するように実施された、図２３に示す単一チャンネル対および単一短期サウンドイベント用サウンドイベント検出器を含んでもよい。同様に、単一チャンネル対および短期サウンドイベント型用第２のサウンドイベント検出器４３０６は、衝撃音を検出して、衝撃音の発生を示す（中央トリガ信号およびサラウンドトリガ信号の組み合わせとしての）中央‐サラウンドトリガ信号Ｔｃｓ（ｉ）を生成するように実施された、図２３に示す単一チャンネル対および単一短期サウンドイベント用サウンドイベント検出器を含んでもよい。複数チャンネル対および単数サウンドイベント型用サウンド特定回路４３１０は、任意のトリガ信号（Ｔｌｒ（ｓ），Ｔｌｒ（ｉ），Ｔｃｓ（ｓ），またはＴｃｓ（ｉ））がサウンドイベントの発生を示す度に、検出された音節または衝撃音の方向を示す左右サウンドイベント角度「ｃｌｒ’（ｓ，ｉ）」と、任意のトリガ信号（Ｔｌｒ（ｓ），Ｔｌｒ（ｉ），Ｔｃｓ（ｓ），またはＴｃｓ（ｉ））がサウンドイベントの発生を示す度に、検出された音節または衝撃音の方向を示す中央‐サラウンドサウンドイベント角度「ｃｃｓ（ｓ，ｉ）」とを生成するように実施された、図４０に示す複数チャンネル対および単一サウンドイベント型用サウンドイベント特定回路を含んでもよい。このサウンド特定器は、左右および中央‐サラウンド入力チャンネル対における音節および衝撃音を検出および特定するように実施されているが、所望するチャンネル対から所望するサウンドイベント型を検出するように実施され、かつ単一チャンネル対用サウンドイベント検出器によって生成された任意のトリガ信号に応答する複数チャンネル対および単一サウンドイベント型用サウンド特定回路４３１０を有する、単一チャンネル対用サウンドイベント検出器を単に付加することによって、チャンネル対の数においても、そこにおけるサウンドイベント型の数がいくつであっても検出できるように実施可能である。

（１０．ソフトウェア）
サウンドイベント検出方法、サウンドイベント検出および特定方法、およびサウンドイベント特定方法、ならびに任意のこれらの方法に含まれる方法は、コンピュータが読み取り可能なソフトウェアコードを含む。これらのアルゴリズムは、合わせて実施されてもよいし、独立して実行されてもよい。このようなコードは、プロセッサ、メモリ装置、または他のコンピュータが読み取り可能な記憶媒体に格納されてもよい。代わりに、ソフトウェアコードは、コンピュータが読み取り可能な電子または光信号に符号化されてもよい。コードは、オブジェクトコードまたは本願で説明した機能を記述または制御する他のあらゆるコードであってもよい。コンピュータが読み取り可能な記憶媒体は、フロッピー（登録商標）ディスクのような磁気記憶ディスク、ＣＤ−ＲＯＭのような光学式ディスク、半導体メモリ、またはプログラムコードまたは関連データを格納する他のどのような物理的オブジェクトであってもよい。

本発明の様々な実施形態を説明したが、本発明の範囲内においてさらに多くの実施形態および実現が可能であることは当業者には明白であろう。したがって、本発明は、添付の請求項およびその均等物に照らして限定される以外、限定されない。

Claims

本願明細書に記載の方法。