JP4744874B2 - サウンドの検出および特定システム - Google Patents

サウンドの検出および特定システム Download PDF

Info

Publication number
JP4744874B2
JP4744874B2 JP2004501891A JP2004501891A JP4744874B2 JP 4744874 B2 JP4744874 B2 JP 4744874B2 JP 2004501891 A JP2004501891 A JP 2004501891A JP 2004501891 A JP2004501891 A JP 2004501891A JP 4744874 B2 JP4744874 B2 JP 4744874B2
Authority
JP
Japan
Prior art keywords
sound
sound event
input channel
signal
power
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2004501891A
Other languages
English (en)
Other versions
JP2005539413A (ja
JP2005539413A5 (ja
Inventor
デービッド エイチ. グリーシンガー,
Original Assignee
ハーマン インターナショナル インダストリーズ インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ハーマン インターナショナル インダストリーズ インコーポレイテッド filed Critical ハーマン インターナショナル インダストリーズ インコーポレイテッド
Publication of JP2005539413A publication Critical patent/JP2005539413A/ja
Publication of JP2005539413A5 publication Critical patent/JP2005539413A5/ja
Application granted granted Critical
Publication of JP4744874B2 publication Critical patent/JP4744874B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S3/00Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received
    • G01S3/80Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received using ultrasonic, sonic or infrasonic waves
    • G01S3/802Systems for determining direction or deviation from predetermined direction
    • G01S3/808Systems for determining direction or deviation from predetermined direction using transducers spaced apart and measuring phase or time difference between signals therefrom, i.e. path-difference systems
    • G01S3/8083Systems for determining direction or deviation from predetermined direction using transducers spaced apart and measuring phase or time difference between signals therefrom, i.e. path-difference systems determining direction of source
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01VGEOPHYSICS; GRAVITATIONAL MEASUREMENTS; DETECTING MASSES OR OBJECTS; TAGS
    • G01V1/00Seismology; Seismic or acoustic prospecting or detecting
    • G01V1/001Acoustic presence detection
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0272Voice signal separating

Description

(発明の背景)
(1.関連出願の相互参照画像)
本出願は、同時係属の米国仮出願番号60/377,558号、発明の名称「合成音場に組み込まれたサウンドイベントの方向およびタイミングを決定するための適応回路」に基づく。本仮出願の出願日の利益は、本出願において主張される。
(2.技術分野)
本発明は、一般的に、サウンドの検出および特定に関する。より特定的には、本発明は、合成音場におけるサウンドイベントを含むサウンドの検出および/または特定に関する。
(3.関連技術)
オーディオ再生システム、オーディオおよび音声符号化システム、音声認識システム、オーディオ増幅システムなどのサウンドに基づく多くのアプリケーションは、特定の型のサウンドを区別および検出し、サウンドが発出または発生された方向を決定する機能を必要とする。特定の型のサウンドを検出する機能は、サウンド増幅などのアプリケーションにとって重要であり、サウンドを検出および特定する機能は、サウンド再生に関するアプリケーションにとって極めて重要である。都合の悪いことに、サウンドの検出および特定は、非常に複雑なものとなりうる。なぜならば、サウンドそれぞれが単独で発生することはめったにないからである。
生であっても再生であっても、通常、サウンドは、時間の経過とともに生じた多くの異なるサウンドの複雑な組み合わせで成り立っている。音場におけるサウンドは部分的に重なったり、次々と生じたり、またはその組み合わせであったりする。音場における個別のサウンドを分類する方法としては、サウンドが特定の場所から発出または発生したかどうかによって分類する方法がある。特定の方向から発出または発生したとして検出することができるサウンドを、方向性サウンドと称し、特定の方向から発出または発生したものではないとして検出することができるサウンドを、非方向性サウンドと称する。サウンドを分類する別の方法では、サウンドが一過性サウンドかまたは定常サウンドかによって分類する。定常サウンドは、ある期間にわたって電力レベルがおおむね一定であるサウンドであって、持続した音符の音などである。定常サウンドは、方向性サウンドの場合もあるし、または非方向サウンドの場合もある。一過性サウンド(または「一過性現象」)は、最初にエネルギーの瞬時的上昇があるサウンドであって、叫びまたはドラムの打音などである。一過性現象は、方向性サウンドの場合もあるし、または非方向サウンドの場合もある。非方向性の一過性サウンドの例としては、直接のサウンドが物体によって妨げられている、残響のある空間における音声がある。この場合、残響時間が1秒未満であれば、信号の時間特性は維持されるが、方向性についての情報は失われる。
方向性のある一過性現象は、本願においては「サウンドイベント」と総称される。サウンドイベントには2つの型があり、音節および衝撃音である。音節は、音素と楽音とがある。音素は、人間の音声における単音に特徴的な一過性サウンドであり、人間の音声の音節を検出および特定するのに特に有用となりうる。楽音は、楽器によって作られる個々の音である。楽音および音素は共通の性質を有するので、これらは本願においては「音節」と総称される。音節は、通常、以下のような性質を有する。すなわち、おおよそ少なくとも50msから約200ms、典型的には約150msの有限の期間であること、約33msの立ち上がり時間であること、通常、せいぜい0.2〜0.5ms毎に1回ほどの頻度で生じるものであること、および音量(振幅)が低い場合も高い場合もあることである。これとは異なり、衝撃音は、ドラムの打音または音声における摩擦音および破裂音などといった、極めて短期間の一過性現象である。衝撃音は、通常、以下のような性質を有する。すなわち、約5ms〜約50msという短期間であること、約1ms〜10msの立ち上がり時間であること、および音量が高いことである。
音場におけるサウンドを検出するには、その生成が生か再生かを問わず、通常、音場が1つの入力または「入力チャンネル」で生成されればよい。しかしながら、サウンドを特定するには、通常、音場が少なくとも2つの入力または入力チャンネルで生成される必要がある。サウンドを特定するための原型は、自然な聞き取りであり、サウンドの方位角は、2つの耳で表される2つの入力チャンネル間における到着時間差によって主に検出される。電子的手段によってサウンドを特定する場合には、サウンド源の方位角は、2つ以上の入力チャンネルによって生成された信号間の振幅および位相関係によって主に決定される。通常、これらの入力チャンネルにおける方向性サウンドの方位角を説明するために、サウンド源の方向は、各対応するチャンネル対(それぞれ、「チャンネル対」)間の角度によって説明される。サウンドが2つのチャンネルだけで生成される場合には、サウンドの方向は、当該チャンネル対の角、通常は右/左角「Ir」によって与えられる。サウンドが4つのチャンネルで生成される場合には、サウンドの方向は、各チャンネル対の角、通常は、右/左角Irおよび前/後角「cs」によって与えられる。例えば、音場が2つのチャンネルで生成される場合には、音場におけるサウンドの平均方向は、Irだけによって与えられる。この場合、Irの値は、−45度から約45度の範囲となり、−45度は、音場が左側入力チャンネルから発生していることを示し、45度は、音場が右側入力チャンネルから発生していることを示し、0度は、音場が右側および左側入力チャンネルのちょうど真ん中の位置(この位置は、多くの場合「中央」と称される)から発生していることを示す。
しかしながら、サラウンドサウンドシステムなどのように、音場が2つのチャンネル対で生成される場合には、第2の方向性成分を特定する。さらに、音場が1つのチャンネルついで生成する場合にも、第2の方向性成分を特定してもよい。なぜならば、あるチャンネル対から追加のチャンネル対を導出することは通常可能であるからである。Irによって方向を特定するのに加えて、csによって方向を特定する。csの値も、−45度から約45度の範囲となり、Ir=0度およびcs=45度は、音場が中央入力チャンネルからのみ発生していることを示し、Ir=0度およびcs=−45度は、音場が後部入力チャンネルからのみ発生していることを示す。同様に、Ir=−45度およびcs=0度は、音場が左から発生していることを示し、Ir=45度およびcs=0度は、音場が右から発生していることを示す。さらに、Ir=−22.5度およびcs=−22.5度は、音場が左後部から発生していることを示し、Ir=22.5度およびcs=−22.5度は、音場が右後部から発生していることを示す。
記録済みサウンドの再生に用いられる、これらの角度を決定するための既知の技術がある。一般的に、この既知の技術は、入力チャンネル対のうちの1つの入力チャンネルの信号の振幅を、当該入力チャンネル対のうちの対応する入力チャンネルの信号の振幅と(通常、左を右と、または中心をサラウンドと)比較することによって、サウンドの意図した方向を決定する。より特定的には、振幅比を用いて、一般的に「通常指向角」、すなわちOSAと称されるものを、入力チャンネル対毎に決定する。OSAを得るためには、入力チャンネル対の各チャンネルにおける電圧信号と、整流化済みの電圧の対数とを取得する。一方の入力チャンネルの整流化済みの電圧の対数を、入力チャンネル対のもう一方の入力チャンネルの整流化済みの電圧の対数から差し引くことによって、入力チャンネル対の電圧比の対数に等しい信号を生成し、それを大きさ領域に再変換すると、通常指向角となる。サラウンド再生システムにおいて、この決定は、マトリックスデコーダと呼ばれる装置によってたいてい行われる。
都合の悪いことに、この既知の技術は、音場全体を単一のサウンドだけを含むかのようにして扱っている。なぜならば、各入力チャンネルにおける相対的な電圧強度に従って、音場全体の方向を決定しているからである。したがって、方向性のある多数の個々のサウンドでは、適切に特定されないであろう。音場を多数のサウンドの複雑な組み合わせとして扱うためには、方向性のある一過性サウンド(サウンドイベント)を分離してその方向を別個に決定できるフィルタを考案する試みがなされている。しかしながら、このようなフィルタを設計する際に、基本的な問題に遭遇する。方向性のある一過性信号すべての変動を区別するのに十分なほどフィルタが高速化すると、残響および雑音のような非方向性の一過性信号の変動特性をも区別してしまうだろう。その結果、残響および雑音の高速な変動が、方向性の変化としてサウンドに再生されてしまい、再生サウンドの質を著しく劣化させる。その一方で、非方向性信号の変動特性を区別しないほどフィルタを低速化すると、フィルタは、一般的に低速すぎて、特定のサウンドイベント、特に衝撃音の変動を区別することができない。その結果、多くのサウンドイベントが、適切に特定されない。このようなフィルタは、どのように設計しても、一般的に、ある種の音楽に対してはうまく作用するものの、すべてに対してはうまくいかない。例えば、高速フィルタは、急速な変化に満ちた、複雑なポピュラー音楽に対してはうまく作用するものの、非常に反響するクラシック曲を再生する際は、誤った方向性変化(指向が大きすぎる)を反映したものとなってしまう。
所定の入力チャンネルにサウンドが記録されて、異なるチャンネル数にわたって再生される場合には、さらなる問題が生じる。例えば、サウンド記録再生技術には、ステレオおよびサラウンドという、2つの一般的な種類がある。ステレオ(2チャンネル)再生用に記録されたサウンドは、正面から発生されたと感じるように意図されている。サラウンド(2より大きい複数の入力チャンネル数であるが、一般的には、5または7つのチャンネル)再生用に記録されたサウンドは、まわり中、一般的には、後方からのサウンド再生に用いられる1または2つの入力チャンネルから発生されたと感じるように意図されている。ステレオ再生用にサウンドを記録するのに用いられる技術は、一般的に、サラウンド再生用にサウンドを記録するのに用いられる技術とは異なるものである。しかしながら、サラウンドシステムはあらゆる場所で用いられるものではないので、サラウンド再生用に記録されたサウンドは、一般的に、高品質のステレオ再生できることが必要となる。例えば、典型的な5チャンネルサラウンドシステムにおいて、中央のチャンネルのサウンドは、中央のチャンネル「c」に含まれるサウンドが左右の入力チャンネルに含まれるサウンドの合計に等しくなるように(c=l+r)、左右の入力チャンネルに符号化される。同様に、サラウンドチャンネルのサウンドは、サラウンドチャンネル「s」に含まれるサウンドが左右の入力チャンネルに含まれるサウンドの差に等しくなるように(s=l−r)、左右の入力チャンネルに符号化される。他の例では、サラウンド再生用にサウンドを記録するドルビーサウンド(登録商標)システムが、聴取者の背後(後ろ)からの再生を意図したサウンドに対して負の位相を付加する。この負の位相は、一般的には、ステレオ再生システムによって検出されず、聴取者には意識されない。しかしながら、負の位相は、後部入力チャンネルの関連サウンドを後に再生するサラウンド再生システムでは検出される。都合の悪いことに、多くのサウンドは、自然に負の位相を有しており、したがって、ステレオ形式で記録された場合であっても、サラウンド再生システムによる後部入力チャンネルでの再生は、不正確なものとなる。これでは、混乱が生じ、不自然になりかねない。
(概要)
サウンドイベントを音場に残ったものから区別することができる検出器、検出されたサウンドイベントの方向を個別に決定できる特定器、およびサウンドイベントの方向を音場における残りのサウンドとともに個別に決定できるサウンド特定器に対する需要がある。既知のサウンド検出およびシステムにおいて生じる多くの問題は、人間の聴覚機構においては生じないので、人間の聴覚機構の特性をモデル化して、上述の特徴を有するシステムを構築するために用いた。
人間の聴覚機構は、音場を個別のサウンドに細分化することによって音場のサウンドを特定し、個別のサウンドの方向を決定し、関連するサウンドをストリーム(特定の楽器のメロディラインまたは特定の話者からの会話の一下りなど)に組み立て直し、ストリーム内の個別のサウンドの平均方向に基づいて、ストリームの向きを決定する。音場を個別のサウンドに細分化する際に、人間の聴覚機構は、一過性サウンドを他のサウンドと区別し、サウンドイベントを非方向性の一過性現象と区別する機能を有する。
さらに、人間の聴覚機構は、たとえ背景信号があっても、開始検出および順応化という特性に、一過性現象を非一過性サウンドおよびサウンドイベントと区別することができる。開始検出は、人類神経学から生じたもので、サウンドの開始点と終了点を決定するほど高度に発達し、それにより、人間の聴覚機構がサウンドの立ち上がりおよび立ち下がり時間に対して特に敏感となっている。順応は、人間の聴覚機構が、定常サウンドの存在を徐々に無視することによって、一過性現象を定常サウンドと区別できるようにしている特性である。さらに、位置特定の目的のために、人間の聴覚機構は、サウンドの開始における特定の周波数および見かけの方向に大きく依存している。人間の聴覚機構が方向を決定するのに最も依存しているのは、約500Hzおよび約4000Hzの間の周波数である。この周波数バイアスは、主に外耳(耳介、耳甲介、および耳道)の周波数応答の結果であり、中耳の周波数伝送機能によるものである。人間の聴覚機構は、また、サウンドの他の部分において示されるような方向よりも、サウンドの立ち上がり時に示された方向に依存している。このような依存は、都合がよい。なぜならば、サウンドの立ち上がり時に示された方向は、反響が大きい環境においても、サウンドの反響または残響によって損なわれにくいからである。
個々のサウンドの方向を検出後、人間の聴覚機構は、関連するサウンドをストリームに組み立て直して、各ストリームの方向を別々に決定する。各ストリームの方向は、一般的には、ストリーム内のすべてのサウンドの平均的な方向となる。いずれにせよ、関連するサウンドをストリームに組み立て直して各ストリームの方向を決定する処理は、人間の聴覚機構によって無意識かつ自動的に行われる。
人間の聴覚機構の特性をモデル化して、音場におけるサウンドイベントの発生を示す信号を発生するサウンドイベント検出方法を考案した。このようなサウンドイベント検出方法は、サウンドイベントの発生を検出する開始検出特性を利用している。開始検出特性をモデル化して、サウンドイベントに典型的な始まりを識別し、この始まりを利用してトリガ信号を生成する。さらには、サウンドイベント検出方法は、順応特性を利用して、トリガ信号の精度を向上させてもよい。順応特性をモデル化して、定常サウンドの音場に対すして及ぼしかねない影響を徐々に低減させる。このよう影響は、音場で低減されて、差分信号を生じさせる。その後、開始検出モデルがこの差分信号を用いて、改良されたトリガ信号を発生させてもよい。また、サウンドイベント検出方法は、人間の聴覚機構にとって重要な周波数を強めることを含んでもよい。
また、人間の聴覚機構特性を利用して、背景信号がある状態で生じるサウンドイベントの位置を決定するためのサウンドイベント検出および特定方法を考案した。このようなサウンドイベント検出および特定方法は、トリガ信号がサウンドイベントが生じたことを示す場合にはいつでも、サウンドイベントの方向を示す少なくとも1つの指向角(差分指向角)を生成する。サウンドイベント検出および特定方法は、差分信号を用いて、各入力チャンネル対の各入力チャンネルにおける、定常サウンドを除去した後のサウンドイベントの相対的な電力を比較することによって、差分指向角を決定する。既知の方法において行われるような、各入力チャンネル対の各入力チャンネルにおける電圧の比較の代わりに、各入力チャンネル対の各入力チャンネルにおける電力を比較することによって、個々のサウンドイベントを識別しかつ別個に特定することができる。
人間の聴覚機構特性を利用して、音場内のすべてのサウンドの位置を決定してもよい。サウンドイベント検出および特定方法を、サウンドの意図した方向を決定するための既知の方法と組み合わせることによって、背景サウンドがある状態でどのようなサウンドが組み合わせてあっても個別のサウンドをより正確に特定するサウンド特定方法を開発した。サウンド特定方法は、音場をサウンドイベントと非サウンドイベントとに分割して、真の差分指向角または真の通常指向角で示されるサウンドイベントと、フィルタ後の通常指向角で示される非サウンドイベントとを特定する。これらの方法は、基本的には、非サウンドイベントを方向が個別に決定される個別サウンドとして扱う。サウンド特定方法、サウンドイベント検出および特定方法、ならびにサウンドイベント検出方法は、入力チャンネル対の数がいくつであっても、そこにおいて生成される音場のサウンドイベント型の数および組み合わせがどのようなものであっても、実施可能である。
人間の聴覚機構特性をモデル化して、背景信号がある状態でサウンドイベントを検出する電子回路を考案した。このようなサウンドイベント検出器を、特定の型のサウンドイベント検出の助けとなる様々な応用に用いてもよい。例えば、音節を検出するサウンドイベント検出器を、音声検出器の一部または音声認識または音声符号化システムの一部として用いてもよい。他の例では、音節を検出するサウンドイベント検出器を、マイクロフォンなどの音声増幅装置と共に用いてもよい。これにより、マイクロフォンは、スピーカから音節が検出されるまでオフにしておくことができ、スピーカが音を出さないときに、マイクロフォンが、所望しないサウンドおよびフィードバックをマイクロフォン自体を介して増幅しないようにする。サウンドイベント検出方法と同様に、サウンドイベント検出器は、開始検出特性および順応特性のモデルに基づき、サウンドイベントの発生を示す、パルスなどの何らかのフラグまたはマーカを含むトリガ信号を一般に生成する。
人間の聴覚機構特性をモデル化して、背景信号がある状態でサウンドイベントを検出および特定する電子回路を考案した。このようなサウンドイベント検出器および特定器は、サウンドイベント検出および特定方法と同様に、差分指向角または通常指向角で表される1つ以上の入力チャンネル対に関連して、サウンドイベントの方向を決定し、場合によっては、指向角の精度を検証する。サウンドイベント検出器および特定器の用途の一例としては、ステレオ/サラウンド検出器がある。ステレオ/サラウンド検出器は、音場が2つの入力チャンネルまたは2つ以上の入力チャンネルでの再生用であるかどうかを決定する。
人間の聴覚機構特性をモデル化して、背景信号がある状態でサウンドイベントを検出および特定する電子回路(「サウンドイベント検出器」と総称する)を考案した。サウンドイベント検出器を、特定の型のサウンドイベント検出の助けとなる様々な応用に用いてもよい。例えば、音節を検出するサウンドイベント検出器を、音声検出器の一部ならびに会話認識または会話符号化システムの一部として用いてもよい。他の例では、音節を検出するサウンドイベント検出器を、マイクロフォンなどの音声増幅装置と共に用いてもよい。これにより、マイクロフォンは、スピーカから音節が検出されるまでオフにしておくことができ、スピーカが音を出さないときに、マイクロフォンが、所望しないサウンドおよびフィードバックをマイクロフォン自体を介して増幅しないようにする。サウンドイベント検出器は、サウンドイベント検出方法と同様に、開始検出特性および順応特性のモデルに基づき、サウンドイベントの発生を示す、パルスなどの何らかのフラグまたはマーカを含むトリガ信号を一般に生成する。また、サウンドイベント検出方法と同様に、サウンドイベント検出器は、入力チャンネルの数がいくつであっても、そこにおいて生成される音場のサウンドイベント型の数および組み合わせがどのようなものであっても、実施可能である。
サウンドイベント検出方法、サウンドイベント検出および特定方法、サウンド特定方法は、サウンドイベント検出器、サウンドイベント検出器および特定器、ならびにサウンド特定器と同様に、サウンドイベント装置および/またはコンピュータが読み取り可能なソフトウェアコードで実施されてもよい。
本発明の他のシステム、方法、特徴および利点は、以下の図面および詳細な説明を考察することで、当業者に明らかであり、または明らかとなるであろう。そのような他のシステム、方法、特徴および利点は、本説明内に含まれ、本発明の範囲内に含まれ、および以下の請求項によって保護されることが意図されている。
本発明は、以下の図面および説明を参照して、いっそうよく理解されうる。図面における構成要素は、設計のためのものでは必ずしもなく、むしろ本発明の原理を説明することに重点を置いたものである。図面において、
(好ましい実施形態の詳細な説明)
開発したサウンド検出および特定システムならびにその方法および装置は、人間の聴覚機構の特性に基づいて、複雑な音場におけるサウンドイベントの方向を検出し、個別に決定する。耳、聴覚システム、脳の関連部位を含む人間の聴覚機構がモデルとして選ばれた基本的な理由は、2つある。第1は、人間の聴覚機構は、サウンドを検出し、既存のシステムの欠点を有することなく、極めて効果的にその方向を決定するからである。第2の理由は、人間の聴覚機構を模してモデル化されたシステムで生じる誤りは、一般的に、人間の聴覚機構によって生じるのと同様の誤りであり、このような誤りは聞き取れないようになっている。
人間の聴覚機構を研究し、サウンド検出および特定システムを構築するモデルとして用いた。周波数バイアス、開始検出特性、順応特性、および人間の聴覚機構の開始依存性をモデル化することによって、極めて効果的で高品質の方法を、定常サウンドがある状態でのサウンドイベントの検出、定常サウンドがある状態でのサウンドイベントの検出および特定、および音場においてのすべてのサウンドの検出および特定のために考案した。このような方法は、ソフトウェアおよびハードウェアで実施して、広範囲の応用に適用可能なプログラム、装置、およびより複雑なシステムを構築することもできる。
既存のサウンド検出および特定ステムが遭遇する問題の多くは、人間の聴覚機構では生じない。例えば、人である聴取者は、通常、残響の多い音楽では、音楽の急速な動きおよびその音源を認識できない。さらに、人間の聴覚機構は、音場を個別のサウンドに分解することによって、音場におけるサウンドを特定し、個別のサウンドの方向を決定し、関連するサウンドをストリーム(特定の楽器のメロディラインまたは特定の話者からの会話の一下りなど)に組み立て直し、ストリーム内の個別のサウンドの平均方向に基づいて、ストリームの向きを決定する。人間の聴覚機構が有する頑丈な性質によって、サウンドを区別して方向を決定する機能が強化され、たとえストリームにおけるサウンドの方向が正確に決定されるのは50%であっても、ストリーム全体の方向が正確に決定される可能性は高い。
音場を個別のサウンドに分解する際に、人間の聴覚機構は、一過性サウンドを他のサウンドと区別し、サウンドイベントを非方向性の一過性現象と区別する機能を有する。さらに、人間の聴覚機構は、背景信号がある状態でも、開始検出および順応に依存することによって、一過性現象を非一過性サウンドと区別し、サウンドイベントを他の一過性サウンドとを区別することができる。開始検出は、人類神経学から生じたもので、サウンドの開始点と終了点を決定するほど高度に発達し、それにより、人間の聴覚機構がサウンドの立ち上がりおよび立ち下がり時間に対して特に敏感となっている。順応は、人間の聴覚機構が、定常サウンドの存在を徐々に無視することによって、一過性現象を定常サウンドと区別できるようにしている特性である。開始検出および順応特性ならびにそれらの効果は、実験によって発見および実証済みである。ヘッドホンによる実験では、音の(方向を示すものとしての)方位角は、音が貸しまたは停止したときにのみ検出可能である。音が連続している場合には、その方向を決定するのは非常に難しくなる。さらに、新しいサウンドが定常音に吹かされる場合には、新たなサウンドの真の方向は容易に決定される。これは、人間の聴覚機構はサウンドの開始および終了を含む一過性成分に特に敏感であり、サウンドの開始および終了を用いて特定をしている(開始検出特性)ということを示している。また、これは、人間の聴覚機構は定常サウンドを無視して、特定には一般的に依拠していない(順応特性)ということを示している。さらにわかったことは、人間の聴覚機構が定常サウンドを徐々に無視する速度(順応速度)は、検出しようとするサウンドイベント型とは無関係であるということである。また、順応速度は、一定でなくてもよく、音響条件および会話の速さに適応してもよいということもわかった。しかしながら、順応速度の合理的平均値は約300msということがわかった。
さらに、位置特定の目的のために、人間の聴覚機構は、サウンドの開始における特定の周波数および見かけの方向に大きく依存している。人間の聴覚機構が方向を決定するのに最も依存しているのは、約500Hzおよび約4000Hzの間の周波数である。この周波数バイアスは、主に外耳(耳介、耳甲介、および耳道)の周波数応答の結果であり、中耳の周波数伝送機能によるものである。人間の聴覚機構は、また、サウンドの他の部分において示されるような方向よりも、サウンドの立ち上がり時に示された方向に依存している。このような依存は、都合がよい。なぜならば、サウンドの立ち上がり時に示された方向は、反響が大きい環境においても、サウンドの反響または残響によって損なわれにくいからである。
個々のサウンドの方向を検出後、人間の聴覚機構は、関連するサウンドをストリームに組み立て直して、各ストリームの方向を別々に決定する。各ストリームの方向は、一般的には、ストリーム内のすべてのサウンドの平均的な方向となる。多くの場合、サウンドは前景ストリームおよび背景ストリームに組み立て直される。一例として、前景ストリームは、会話によって成り立ち、背景ストリームは、会話源の周りで生じている環境サウンドによって成り立っていてもよい。いずれにせよ、関連するサウンドをストリームに組み立て直して各ストリームの方向を決定する処理は、人間の聴覚機構によって無意識かつ自動的に行われる。
人間の聴覚機構特性を適用することによって開発したシステムは、(a)音場内のサウンドイベントを検出する、(b)音場からサウンドイベントを検出および特定する、および(c)音場内のすべてのサウンドを特定する。このような方法、装置、およびシステムは、人間の聴覚機構特性を利用して、音場を個別のサウンドに分化し、個別のサウンドイベントを区別し、個別のサウンドイベントおよび他のサウンドの方向を決定する。個別のサウンドの方向を用いて音場を再生する場合は、関連サウンドをストリームに組み立てなおして各ストリームの方向を決定するのは、人間の聴覚機構に委ねられている。
(1.サウンドイベントを検出するための方法)
人間の聴覚機構特性をモデル化して、背景信号がある状態でサウンドイベントを検出するための方法(「サウンドイベント検出方法」と総称する)を考案した。サウンドイベント検出方法は、サウンドイベントの発生を示す、パルスなどのフラグまたはマーカを含む信号(本願において「トリガ信号」称する)を生成する。サウンドイベント検出方法は、入力チャンネルの数がいくつであっても、そこにおけるサウンドイベントの数および組み合わせがどのようなものであっても、検出を実施することができる。以下の説明では、複雑でないものから順にサウンドイベント検出方法を説明し、各サウンドイベント検出方法は、特に示さない限り、それに先立って説明した方法のステップを含むものとする。
単一の入力チャンネルにおいて生成された単一のサウンドイベント型のみを音場から検出する、背景信号がある状態でのサウンドイベント検出方法(「単一入力チャンネルおよび単一サウンドイベント型用サウンドイベント検出方法」)の一例を、図1に参照番号100で示す。単一入力チャンネルおよび単一サウンドイベント型用サウンドイベント検出方法100は、周波数バイアスをモデル化することによって、方向的に重要な周波数を強めること(104)と、順応性をモデル化することによって、分離することによってサウンドイベントを背景サウンドから分離すること(106)と、開始検出をモデル化することによって、サウンドイベントを検出すること(108)とを含む。
周波数強化方法を用いて、方向的に重要な周波数は、人間の聴覚機構の周波数バイアスをモデル化することによって強められる(104)。周波数強化方法は、各入力チャンネルの約500Hzおよび約4kHzの間の周波数を強めて、各入力チャンネルのフィルタ後の信号を生成することを含む。これらの周波数を強めるのは、方向を決定する際に、これらの周波数が人間の聴覚機構に最も影響を与えるからである。順応性をモデル化することによってサウンドイベントを背景サウンドから分離すること(106)は、一般的に、音場での入力電力の変化を調べることを含み、より詳細には図2に示されている。より特定的には、順応性をモデル化することによってサウンドイベントを背景サウンドから分離すること(106)(「順応方法」)は、入力チャンネルの電力エンベロープを決定すること(201)と、任意の定常サウンドにおける電力を決定すること(202)と、任意の定常サウンドにおける電力を入力チャンネルの電力エンベロープから差し引くこととを含む。入力チャンネルの電力エンベロープを決定すること(201)は、一般的に、入力チャンネルにおける電圧を二乗することを含む。音場は、それが生であろうと録音から生じようと、一般的に時間領域における電圧信号として表される。都合の悪いことに、電圧信号は付加特性を有していない。すなわち、1つの電圧信号の組み合わせから生じる電圧信号の大きさは、単に2つの電圧信号の振幅を単純に加算することによっては決定できない。しかしながら、電力信号には、付加特性がある。したがって、電圧信号を電力信号に変換することにより(一般的に、電圧信号を二乗することにより)、他の電力信号を差し引くことが可能な電力エンベロープが生じる。より滑らかな(変動の少ない)電力エンベロープを得るためには、検出しようとするサウンドイベントに特徴的でない電力エンベロープ内の変動を除去してもよい。例えば、音節を検出しようとする場合、33msよりも速い立ち上がり時間の変動は、電力エンベロープから除去される。
音場の任意の定常信号の電力を決定すること(202)は、音場の長期平均電力を決定することを含む。長期平均電力(本願において「順応信号」と称する)、検出しようとするサウンドイベントの立ち上がり時間に等しい時間の電力パワーを積分することによって決定してもよい。サウンドイベントが最大値(サウンドイベントの立ち上がりの最後)に達すると、順応信号は、人間の聴覚機構の順応速度に等しい速度(約300ms)で電力エンベロープから徐々に差し引かれ(204)、人間の聴覚機構がサウンドイベントがある状態で定常サウンドの効果を徐々に無視するやり方をモデル化する。順応性を制御するためには、順応信号は、常に電力エンベロープ以下にされる。したがって、サウンドイベントが終了して電力エンベロープが急速に降下すると、順応信号は、電力エンベロープに等しくなる。順応信号を信号電力の絶対値から差し引くと、「差分信号」となる。この差分信号は、正のパルスおよびその他の変動を含む。差分信号における各パルスは、サウンドイベントおよび他の変動が残響、ガウス雑音、および前景ストリームに現在存在しないであろう他の信号といった雑音によって生じることを示す。
順応方法が入力信号にどのように影響を与えるかを、図3に示す。図3の時間軸のグラフAは、音場のサンプル区間を示す。この区間は、音節300に特徴的である、様々な周波数のサウンド波の集まりを含む。この音節の大きさは、信号「V」の電圧である。電圧Vは、時間「t」とともに変化し、「D」という持続期間を有する。時間軸のグラフBは、電力信号に変換された(図2のステップ201)後のセグメント300であるパルス302を示す。パルス302は、信号の電力(「V」)を表す振幅を有し、また、持続期間Dを有する。時間軸のグラフCは、音節に特徴的でない立ち上がり時間での変動を除去した後のパルス302であるパルス304を示す。パルス304は、また、振幅Vを有し、約33msに等しい立ち上がり時間tを有する。時間軸のグラフDは、順応信号を差し引くことによって定常サウンドを順応化させた後のパルス304であるパルス306を示す。パルス306の立ち上がり時間は、パルス304に準ずる。しかしながら、音節が最大値に達した後(tの後)、同時に発生する定常信号の効果が、人間の聴覚機構の順応速度に等しい速度(約300ms)で、パルス306から除去される。サウンドイベントが終了すると、電力エンベロープV(パルス304)は急速に減少する。Vが順応信号「AccSig」よりも低くなろうとする時点で、AccSigはサウンドイベントの終了まで、Vに等しくなるようにされる。これにより、差分信号は0へと向かう。
図1を再び参照して、順応性をモデル化することによって背景サウンドからサウンドイベントを分離すると(106)、サウンドイベントは開始検出によって検出される(108)。開始検出をモデル化することは、サウンドイベントを差分信号に存在する雑音と区別することを含む。上述したように、差分信号は、急速に立ち上がる一連のパルスおよび雑音を含む。各パルスはサウンドイベントの発生を示し、雑音は、サウンドイベントの発生を誤って示す変動を含む。したがって、サウンドイベントを検出するためには、サウンドイベントは雑音と区別される必要がある。図4により詳細に示す開始検出のモデル化(108)は、音量効果を弱めることと、サウンドイベントを強めること(404)と、雑音を弱めること(406)、サウンドイベントを検出すること(408)とを含む。
ステップ404,406,および408を同時に遂行可能な方法としては、差分信号の雑音成分に含まれる短期平均電力(「短期平均高周波数電力」)によって、差分信号を調整することが挙げられる。一般的に自動利得制御に関連する手法(「自動利得方法」)を用いて短期平均高周波数電力を分離して、差分信号を分解するために用いる。短期平均高周波数電力の分離は、差分信号をフィルタリングして、検出しようとしているサウンドイベント型に特徴的な周波数よりも高い周波数の差分信号成分を取得し、かつ短期間に渡って高周波数部分を積分することによって行われる。この短期間は、音楽や音声速度によって異なってもよい。しかしながら、広範な様々な入力に関してうまくいくのは、約160msという値であることが実証された。
自動利得方法を用いて差分信号を正規化すると、目に見えてわかる効果と、それほど目に見えてわかるものではない効果という、2つの効果がある。第1の効果は、差分信号の変動の振幅(電力を表す)に関して差分信号を正規化することによって、差分信号に対する音量効果を弱めること(402)である。一般的に、サウンドイベントおよび雑音が大きな音ほど、大きな電力を含み、サウンドイベントおよび雑音が大きな音ほど、それほど大きくないものより、より強く調整される。これは自動利得制御方法の通常の機能である。
第2の効果は、検出しようとするサウンドイベント型に特徴的なもの(例えば、一般的に、音節は、約200ms毎に発生または反復する)よりも頻繁に生じる変動を弱めることによって、雑音を弱める(406)。一般的に、雑音による差分信号部分の変動は、サウンドイベントに典型的な変動よりも頻繁に生じる。このような雑音変動の急激な反復速度により、差分信号部分を分割する平均高周波電力が増加する。これにより、雑音を含む差分信号部分が弱められる。差分信号を正規化する第3の効果は、検出しようとするサウンドイベント型に特徴的な変動の頻度を決して越えないほどの頻度で発生または反復する変動を強めることによって、サウンドイベントを強めることである(404)。検出しようとするサウンドイベント型に典型的な変動の頻度以下の頻度で発生する変動を含む差分信号部分は、差分信号部分を分割する平均高周波電力が(雑音を含むものと比べて)低い。これにより、サウンドイベントが相対的に強められる。
雑音を弱めること(406)は、雑音による差分信号の変動の多くを除去することによってさらに達成してもよい。雑音による変動の中には、その立ち上がり時間やたの特性に従って識別して除去可能なものもある。例えば、検出しようとするサウンドイベント型の特徴的でない立ち上がり時間を有する変動は除去される。例えば、検出しようとするサウンドイベント型が音節であれば、33msよりも速い立ち上がり時間の音は除去される。他の例として、検出しようとするサウンドイベント型が衝撃音であれば、3.3msよりも速い立ち上がり時間の音は除去される。さらに、サウンドイベントに特徴的な頻度よりも高い頻度で生じる、ある種の雑音および残響などの振幅の低い一過性現象も、除去することができる。さらに、音場の電力レベルが過去のサウンドイベントよりも約10dB以上降下したときにはいつでも、同時に検出された一過性現象は雑音またはある種の他の非方向性一過性現象であるとみなすことができるので、そのような状況下で生じた一過性現象も除去することができる。ステップ402,404,および406の結果、差分信号内の変動の多くは除去されて、サウンドイベントの発生をそれぞれ示すパルスを含んだ、改良された差分信号が生成される。しかしながら、雑音はいくらか残ったままである。
したがって、サウンドイベントの発生を示すパルスのみを含むトリガ信号を生成するには、サウンドイベントを雑音から検出する必要がある(408)。なぜなら、この時点は、改良された差分信号の雑音による変動の多くは、サウンドイベントによって生じた変動と比べて振幅が低いので、閾値検出方法を用いて、閾値を越える振幅を有する変動を決定することによって、サウンドイベントを決定する(408)。閾値検出方法では、閾値を超えない変動を除去または無視して、トリガ信号を生成する。この方法の利点の1つは、トリガが完璧である必要はないということである。サウンドイベントによっては検出されないものもあり、雑音による変動がサウンドイベントの発生を誤って示すトリガ信号を生じさせる場合もあるという点で、サウンドイベント検出方法は、完璧なものではない。しかしながら、このような時折のエラーは問題ではない。なぜなら、サウンドイベント検出方法は、人間の聴覚機構を模してモデル化されており、人間の聴覚機構で生じる同様の型のエラーを生じさせるからである。したがって、その結果は、全く自然なものとして認識される。
雑音または残響に特徴的な低振幅の変動が検出されないように、閾値が選ばれる。閾値は、実験で決定された固定値であってもよい。しかしながら、閾値が音場の関数として変化すれば、より正確な結果が得られる。例えば、音場が多くのサウンドイベントを含む場合、一般的に、音場が少ないサウンドイベントを含む場合よりも閾値は低くなる。これにより、音場にあるサウンドイベントの数が多ければおおいほど、感度が高くすることができる。
代わりに、音場の性質に従って実験で決定された2つ以上の値から手入力で選択することもできる。例えば、音場が現代音楽またはポピュラー音楽のものである場合は、含まれるサウンドイベント数は典型的には多いので、低い閾値を選択でき、代わりに、音場がクラシック音楽のものである場合には、含まれるサウンドイベント数は典型的には少なく、残響が多いことがあるので、高い閾値を選択できる。代わりに、閾値を、所定の期間検出されたサウンドイベントの数の関数として選択することもできる。したがって、検出されるサウンドイベント数が少ない期間では閾値を高め、検出されるサウンドイベント数が多い期間では閾値を低くする。これにより、音場の関数として閾値の自動的かつ継続的な調節を行うことができ、より正確なトリガ信号を得られる。
任意のサウンドイベント検出方法は、衝撃音などの短期間におけるサウンドイベント(「短期サウンドイベント」)の検出時に特化して用いられる開始検出方法のみを行うことを含んでもよい。衝撃音などの短期サウンドイベントは、順応効果が認識される前に終了することが多い。したがって、サウンドイベント検出方法を簡素化して、入力信号(デシベル単位)に対して、直接、開始検出方法のみを行うことができる。開始検出方法のみを行うサウンドイベント検出方法(「短期サウンドイベント用サウンドイベント検出方法」)は、開始検出方法を行う前に、検出しようとする短期サウンドイベントに特徴的な立ち上がり時間よりも遅い立ち上がり時間の変動を除去することを含んでもよい。例えば、衝撃音が検出される場合に、約3msよりも遅い立ち上がり時間の入力信号の変動は除去される。
背景信号がある状態で単一のサウンドイベント型を検出す方法は、音場が2つ以上の入力チャンネルで生成される場合にも実施してよい(「複数入力チャンネルおよび単一サウンドイベント型用サウンドイベント検出方法」)。複数入力チャンネルおよび単一サウンドイベント型用サウンドイベント検出方法は、単一入力チャンネルおよび単一サウンドイベント型用のサウンドイベント検出方法を各入力チャンネルに対して並列的に行って、どのようなサウンドイベント型の発生も検出していることを示すトリガ信号を入力チャンネル毎に生成することを含んでもよい。
代わりに、複数入力チャンネルおよび単一サウンドイベント用サウンドイベント検出方法は、各チャンネル別々ではなく、チャンネル対でサウンドイベントを検出することを含んでもよい。一般的に、これは、あるチャンネルの順応化された信号を他のチャンネルの順応化された信号から差し引いて、「差分信号」を生成し、その後、この差分信号をトリガ信号の生成に用いることを含む。しばしば、差分信号は、ある入力チャンネル対のある入力チャンネルの順応信号を当該入力チャンネル対の他の入力チャンネルの順応信号から差し引くことによって生成される。例えば、入力チャンネル対は、左右チャンネル対および/または中央/サラウンド入力チャンネル対を含んでもよい。本願において、「入力チャンネル対」という用語は、2つの入力チャンネルのあらゆる組み合わせおよび入力チャンネルから導出可能なチャンネルを含む。1つ以上の入力チャンネルを用いてトリガ信号を導出する目的は、方向性信号に対象を定めることにある。例えば、電子的に録音された音楽や会話では、方向性信号は、入力チャンネル間の移送および振幅関係によって、他の非方向性信号と区別することができる。例えば、音場は、2つの入力チャンネル間(通常のステレオ)で生成されることが多い。これら2つの入力チャンネルから、4つの電力エンベロープを導出し、この4つの電力エンベロープを2つの電力エンベロープ対にまとめたら便利である。例えば、元の2つの入力チャンネルを、従来の「左」および「右」という名前で示し、結果生じた電力エンベロープを、「左電力」および「右電力」でそれぞれ示して、電力エンベロープ対を作成することもできる。残りの電力エンベロープ対は、「左+右電力」および「左−右電力」という2つの入力チャンネルの和および差から導出された電力エンベロープで構成されている。また、この対は、「中央電力」または「サラウンド電力」と称されることが多い。非方向性の信号は、これら2つのすべてを発生させて同時に立ち上げることをほとんど常に行う。差分信号を用いてトリガ信号を生成する場合に、非方向性の一過性現象は、差分信号の立ち上げを行わないのは、各入力チャンネルで同一だからである。これに対して、例えば左入力チャンネルのみのサウンドイベントなどの方向性信号は、「左電力」エンベロープの大きな変化を生じさせ、「右電力」エンベロープでは対応する増加は生じない。したがって、左および右の順応化された信号から生成された差分信号が大きく増加し、この変化を用いて、方向性信号を非方向性信号と優先的に区別するトリガを生成することができる。
チャンネル対でのサウンドイベントを検出することを含む、複数入力チャンネルおよび単一サウンドイベント用サウンドイベント検出方法500を、図5に示す。当該方法は、周波数バイアスをモデル化することによって、方向的に重要な周波数を強めること(504)、各入力チャンネルにおいて順応性をモデル化することによって、各入力チャンネルにおけるサウンドイベントを背景サウンドから分離すること(506)、および各入力チャンネル対において開始検出をモデル化することによって、各チャンネル対からサウンドイベントを検出することとを含む。周波数強化方法を用いて、方向的に重要な周波数を強める(504)。その後、順応方法を用いて、サウンドイベントを、各入力チャンネルにおいて背景信号から分離し(506)、入力チャンネル毎に差分信号を生成する。その後、入力チャンネル対毎に並行して行う交互開始検出方法と、チャンネル対毎の差分信号とを用いて、サウンドイベントを各入力チャンネル対から検出する(508)。
交互開始検出方法の詳細を図6に示す。この方法は、入力チャンネル対毎に差分信号を決定すること(601)と、各入力チャンネル対における音量効果を弱めること(602)と、各入力チャンネル対におけるサウンドイベントを強めること(604)と、各入力チンネル対における雑音を弱めること(606)と、各入力チャンネル対からサウンドイベントを検出すること(608)とを含んでもよい。したがって、複数入力チャンネル用サウンドイベント区別方法は、各入力チャンネル対の差分信号に対して行われるサウンドイベント区別方法と同じステップを含む。
差分信号の決定(601)は、ある入力チャンネル対の各入力チャンネルにおける差分信号間の差を決定し、この差を整流化することによって行われる。入力チャンネル対の入力チャンネル間の差は、入力チャンネル対のいずれかの入力チャンネルでサウンドイベントが発生したことを示す正および負のパルスの両方を含む。このパルスは、入力チャンネル対のうちのどちらの入力チャンネルが特定のサウンドイベントの電力の大半を反映するかによって、負にも正にもなる。したがって、この差を整流化して、正のパルスのみの差分信号を生成する。上述したように、差分信号は依然としてサウンドイベントを示して入るものの、両方の入力チャンネルに共通のサウンドイベントを示してはいない。したがって、差分信号は、個別の入力チャンネルの差分信号よりも信号体雑音比がよくなる。さらに、差分信号は、入力チャンネル対の両方の入力チャンネルで同一の信号を含んでいないので、一般的にすべての入力チャンネルにおいて同一である、雑音などの所定の非方向性信号を除去するのに役立つ。差分信号を入力チャンネル対毎に決定すると(601)、差分信号に対する音量効果を弱め(602)、サウンドイベントを強め(604)、自動利得方法を用いて差分信号における雑音を弱めて(606)、残存する一過性現象の存在を示す一連のパルスを生成する。その後、所定の閾値より大きいパルスがどれかを決定することによって、サウンドイベントを各入力チャンネルから検出する(608)。一般的に、ステップ602,604,および608は、残存する一過性現象を示すパルスがすべて正となるように、整流化ステップを含む。ステップ608の結果、サウンドイベント発生をを示す入力チャンネル毎の正のパルスを有するトリガ信号が生じる。このサウンドイベント検出方法は、複数の入力チャンネル対に対して実施してもよく、入力チャンネル対毎に本方法を行って、入力チャンネル対毎に別々のトリガ信号を生成してもよい。
複数入力チャンネルおよび単一サウンドイベント型用サウンドイベント検出方法は、複数のチャンネル対のサウンドイベント型を検出することを含んでもよい(「複数チャンネル対および単一サウンドイベント型用サウンドイベント検出方法」と総称する)。このような方法は、一般的に、1つ以上のチャンネル対または4つの電力エンベロープを導出できる単一チャンネル対に対して実施される交互開始検出方法を含んだ、複数チャンネルおよび単一サウンドイベント型用サウンドイベント検出方法を含む。
また、背景信号がある状態で1つ以上のサウンドイベントを検出するための方法は、音節および衝撃音などの複数のサウンドイベント型を単一の入力チャンネルから検出するように実施されてもよい(「単一入力チャンネルおよび複数サウンドイベント型用サウンドイベント検出方法」)。音節および衝撃音の両方を検出する、単一入力チャンネルおよび複数サウンドイベント型用サウンドイベント検出方法の一例を、図7に示す(この方法は、サウンドイベント型の数および組み合わせがどのようなものであっても、それを検出するように実施されてもよい)。図7に示す単一入力チャンネルおよび複数サウンドイベント用サウンドイベント検出方法例700は、基本的に、開始検出をモデル化することによって、方向的に重要な周波数を強めること(704)と、順応性をモデル化することによって、サウンドイベントを背景サウンドから分離すること(706)と、開始検出をモデル化することによって、音節を検出すること(708)と、開始検出をモデル化することによって、衝撃音を検出すること(712)とを含む。音節および衝撃音は同時に発生することが多いことを理解することが重要である。
方向的に重要な周波数の強化(704)は、周波数バイアス方法を用いて行われる。その後、順応方法を用いて、サウンドイベントを背景信号から分離して(706)、差分信号を生成する。結果を改善するために、順応方法は、音節に特徴的でない立ち上がり時間(約33msを超える時間)の電力エンベロープの変動を除去することを含んでもよい。その後、単一入力チャンネル用の開始検出方法(図4を参照)を用いて音節を検出し(710)、短期サウンドイベント用サウンドイベント検出方法を用いて衝撃音を検出する。図4に関連して説明したように、サウンドイベントの検出は、音量効果を弱めることと、サウンドイベントを強めることと、自動利得方法を用いて特定の変動を除去することによって雑音を弱めることと、閾値検出方法を用いてサウンドイベントを検出することとを含む。しかしながら、この場合、音節を検出する際には、差分信号を正規化するための短期高周波電力は、約167msを超えて決定された約30Hzを超える差分信号成分内の電力である。さらに、除去された変動は、33ms以下の立ち上がり時間の変動である。逆に、このような場合、衝撃音を検出する際には、単一短期サウンドイベント用サウンドイベント検出方法は、所定の周波数を除去することと、音量効果を弱めることと、サウンドイベントを強めることと、自動利得方法を用いて所定の変動を除去することによって雑音を弱めることと、閾値検出方法を用いてサウンドイベントを検出することとを含む。しかしながら、衝撃音を検出する際には、自動利得方法は、差分信号の代わりに入力信号(デシベル単位)を用いる。さらに、除去される変動は、約3m以下の立ち上がり時間の変動である。
また、背景信号がある状態で1つ以上のサウンドイベントを検出するための方法は、サウンドイベントの複数の型を複数の入力チャンネルで生成された音場で検出できるように実施されてもよい(「複数入力チャンネルおよび複数サウンドイベント用サウンドイベント検出方法」)。複数入力チャンネルおよび複数サウンドイベント用サウンドイベント検出方法は、音場の入力チャンネル毎に単一入力チャンネルおよび複数サウンドイベント型用サウンドイベント検出方法を並行して実施して、各入力チャンネルにおけるサウンドイベント毎にトリガ信号を生成することを含む。代わりに、図8に示すように、複数入力チャンネルおよび複数サウンドイベント用サウンドイベント検出方法800は、各サウンドイベントを各入力チャンネルからのみ検出して、それにより各入力チャンネル対におけるサウンドイベント型毎のトリガ信号を生成してもよい。図8の例では、この方法800を用いて、2つの入力チャンネル(右入力チャンネルおよび左入力チャンネル)における2つのサウンドイベント型(音節および衝撃音)を検出して、入力チャンネル対毎の2つのトリガ信号を生成し、第1のトリガ信号は音節の発生を示し、第2のトリガ信号は衝撃音の発生を示す。しかしながら、本方法は、入力チャンネルの数がいくつであっても、そこで生じるサウンドイベントの数がいくつであっても検出して、サウンドイベント毎のトリガ信号を入力チャンネル対毎に生成するように実施されてもよい。複数入力チャンネルおよび複数サウンドイベント用サウンドイベント検出方法800は、一般的に、左入力チャンネルの周波数バイアスをモデル化することによって、方向的に重要な周波数を強めること(802)と、右入力チャンネルの周波数バイアスをモデル化することによって、方向的に重要な周波数を強めること(804)と、左入力チャンネルの順応性をモデル化することによって、サウンドイベントを背景サウンドから分離すること(806)と、左入力チャンネルの順応性をモデル化することによって、サウンドイベントを背景サウンドから分離すること(808)と、開始検出をモデル化することによって、左右入力チャンネル対の衝撃音を検出すること(812)と、開始検出をモデル化することによって、左右入力チャンネル対の音節を検出すること(814)とを含む。
方向的に重要な周波数を左右入力チャンネルの両方で別々に強めること(それぞれ802および804)は、周波数バイアス方法によって行われる。その後、順応方法を用いて、背景サウンドからサウンドイベントを左右入力チャンネルの両方で別々に分離して(それぞれ806および810)、左右入力チャンネル用の差分信号をそれぞれ生成する。そして、両チャンネルの差分信号を用いて、開始検出をモデル化することによって音節を検出する(814)。音節の検出は、開始検出方法を用いて各入力チャンネルにおける音節を検出して、各チャンネルにおける音節の発生を示すトリガ信号を発生するようなものであってもよい。代わりに、音節の検出は、交互開始検出方法を用いて各チャンネル対における音節の発生を示す単一のトリガ信号を発生するようなものであってもよい。開始検出をモデル化することによって衝撃音を検出する(812)には、単一チャンネルおよび短期サウンドイベント用サウンドイベント検出方法を用いて、入力チャンネル毎の衝撃音の発生を示すトリガ信号を生成する。この場合、あらゆるサウンドイベント検出方法と同様に、トリガ信号を組み合わせて、少ない数のトリガ信号を生成してもよい。
複数チャンネルおよび複数サウンドイベント型用サウンドイベント検出方法は、複数のチャンネル対における1つ以上のサウンドイベント型を検出することを含んでもよい(「複数チャンネル対および複数サウンドイベント型用サウンドイベント検出方法」と総称する)。このような方法は、一般的に、1つ以上のチャンネル対または4つの電力エンベロープを導出できる単一チャンネル対に対して実施される交互開始検出方法を含んだ、複数チャンネル対および複数サウンドイベント型用サウンドイベント検出方法を含む。
(2.サウンドイベントを検出および特定するための方法)
人間の聴覚機構特性を利用して、背景信号がある状態で生じるサウンドイベントの位置を決定するための方法を考案した(「サウンドイベント検出および特定方法」と総称する)。前述したように、複数の入力チャンネル用のサウンドイベント検出方法は、サウンドイベントが発生する毎にそれを示すトリガ信号を生成するだけではなく、サウンドイベントの方向を決定できる差分信号をも生成する。サウンドイベント検出および特定方法は、このような差分信号を用いて、定常サウンドを除去した後の、各入力チャンネル対の各入力チャンネルにおけるサウンドイベントの相対電力を比較することによって、サウンドイベントの方向を決定する。既知の方法において行われているような、入力チャンネル対の各入力チャンネルにおける電圧を比較する代わりに、入力チャンネル対の各入力チャンネルにおけるサウンドイベントの電力を比較することによって、個々のサウンドを識別して別個に特定することができる。サウンドイベント検出および特定方法は、入力チャンネル対の数がいくつであっても、そこにおいて生成される音場のサウンドイベント型の数および組み合わせがどのようなものであっても、サウンドイベントの検出および特定を実施することができる。以下の説明では、複雑でないものから順にサウンドイベント検出および特定方法を説明し、各サウンドイベント検出および特定方法は、特に示さない限り、それに先立って説明した方法のステップを含むものとする。
単一入力チャンネル対および単一サウンドイベント型用サウンドイベント検出および特定方法を図9に示す。この単一入力チャンネル対および単一サウンドイベント型用サウンドイベント検出および特定方法900は、単一のサウンドイベント型を検出し、単一の入力チャンネル対に対するサウンドイベントを特定する。この方法900によって決定されるようなサウンドイベントの位置は、入力チャンネル対の入力チャンネル間の角度で与えられる(本願では、「真の差分指向角」または「真のDSA」と称する)。サウンドイベント検出および特定方法900は、一般的に、差分信号を生成して、入力チャンネル対の入力チャンネル毎に、サウンドイベントを入力チャンネル対から検出すること(904)と、最初のサウンドイベント方向を決定すること(906)と、真のDSAを切り離すこと(908)とを含む。、904および906は、まとめて、単一入力チャンネルおよび単一サウンドイベント型用DSA決定方法を規定する(901)。
差分信号は、入力チャンネル対の入力チャンネル毎に生成され、サウンドイベントの入力チャンネル対からの検出(904)は、単一入力チャンネル対および単一サウンドイベント型用サウンドイベント検出方法または単一入力チャンネル対および単一短期サウンドイベント型用サウンドイベント検出方法のうちで、検出しようとするサウンドイベント型に適したものを用いて行われる。その結果、単一のサウンドイベント型の発生を示すトリガ信号が当該入力チャンネル対用に生成され、差分信号が当該入力チャンネル対の入力チャンネル毎に生成される。トリガ信号が示すように、入力チャンネル対からサウンドイベントが検出されると(904)、初期方向決定方法を用いて、サウンドイベントの初期方向が決定される(906)。サウンドイベントが発生するときは差分信号も存在するので、初期方向決定方法は、入力チャンネル対の入力チャンネル毎の差分信号からサウンドイベントの方向を決定する。より特定的には、サウンドイベントが生じているとトリガ信号が示す場合には、入力チャンネル毎の差分信号はデシベルに変換されて、入力チャンネル毎のデシベル差分信号を生成する。そして、ある入力チャンネルのデシベル差分信号が、他の入力チャンネルからのデシベル差分信号から差し引かれて、デシベル比が生じる。このデシベル比は、既知の方法を用いて等価角となり、入力チャンネル対の入力チャンネル間にあるサウンドイベントの位置を示す「差分指向角」または「DSA」を生成する。
例えば、音節を検出しようとする場合、音節の概ね最初の20msから概ね最初の30msで示されるDSAを切り離すことによって、検出する音節の真の方向を取得し、その後、これを約200msの間、用いる(保持する)。他の例では、衝撃音を検出しようとする場合、衝撃音の概ね最初の3.3msから概ね5msで示されるDSAを切り離すことによって、衝撃音の真の方向を取得し、その後、これを約50msの間、用いる。しかしながら、衝撃音のような短期サウンドイベントの場合、初期方向決定方法を実施して、より正確な初期方向を取得してもよい。この初期方向決定方法は、トリガ信号の非常に短い区間(一般的に、約3ms)に生じたすべてのトリガを検出して、これらのパルスに関連するDSAを決定し、これらのDSAの短期平均を決定し、短期平均DSAを用いて、検出しようとしている短期サウンドイベント型の典型的な持続期間において、非常に短い区間で検出された短期サウンドイベントの方向を示す。例えば、衝撃音を検出しようとする場合、短期平均を次の約50msだけ用いる。サウンドイベントの立ち上がり時間の時間平均を方向の基準に用いるという考え方は、より長い持続期間のサウンドにも適用可能である。しかしながら、平均化にはより長い時間を用いるのが有用である。なぜならば、これらの信号の立ち上がり時間は一般的に長いからである。
サウンドイベント検出および特定方法は、複数の入力チャンネル対における単一のサウンドイベント型を検出および特定するのに実施されてもよい(「複数入力チャンネル対および単一サウンドイベント型用サウンドイベント特定方法」)。例えば、典型的なサラウンドサウンドシステムは、少なくとも左右入力チャンネル対および中央‐サラウンド入力チャンネル対とを含む。複数入力チャンネル対および単一サウンドイベント型用サウンドイベント特定方法では、任意のチャンネル対のトリガ信号がサウンドイベントの発生を示すときにはいつでも、チャンネル対毎の真のDSAを決定する。しかしながら、DSAを用いてサウンドイベントの方向を示すのは、DSAが正確な場合だけである。DSAが正確でない場合には、真のOSAが示す方向を用いる。
複数入力チャンネル対および単一サウンドイベント型用サウンドイベント特定方法の一例を、図10の参照符号1000で示す。この方法例は、単一入力チャンネル対および単一サウンドイベント用DSA決定方法を、入力チャンネル対毎に実行すること(「複数入力チャンネル対・単一サウンドイベント型用DSA決定方法」と総称する)(1051)と、チャンネル対毎に通常指向角を決定すること(1003)と、DSAが正確かどうかを決定すること(1010)と、DSAが正確でない場合、真のOSAを切り離して、検出しようとするサウンドイベント型の典型的な持続期間に、入力チャンネル毎に用いること(1014)と、DSAが正確な場合、真のDSAを切り離して、検出しようとするサウンドイベント型の典型的な持続期間に、真のDSAを入力チャンネル毎に用いること(1012)とを含む。
複数入力チャンネル対および単一サウンドイベント型用DSA決定方法1051は、各入力チャンネル対におけるサウンドイベントを検出して、チャンネル対の各チャンネル毎に差分信号を生成すること(1004)と、チャンネル対の入力チャンネル毎に最初のDSAを決定すること(1006)とを含む。各入力チャンネル対におけるサウンドイベントを検出して、チャンネル対の各チャンネル毎に差分信号を生成すること(1004)は、単一チャンネル対および単一サウンドイベント型用サウンドイベント検出方法、チャンネル対毎に並行して行うことを含む。チャンネル対の入力チャンネル毎に最初のDSAを決定すること(1006)は、初期方向決定方法をチャンネル対毎に並行して行うことを含む。チャンネル対毎にOSAを決定すること(1003)は、一般的に、既知の方法を用いて達成される。
DSAが正確かどうかを決定することは、サウンドイベントが発生しているとトリガ信号が示すときに、あるチャンネルでサウンドイベントが発生するとともに他のチャンネルでサウンドイベントが終了するかどうかを「背景信号チェック」を用いて決定することと、DSAのために得た値は互いに整合性があるかどうかを決定する「整合性チェック」を行うこととを含む。一般的に、ある入力チャンネル対が他の入力チャンネル対から導出される場合(例えば、中央‐サラウンド入力チャンネル対が左右入力チャンネル対から導出される場合)で、あるサウンドイベントの発生が、異なる方向の他のサウンドイベントの終了とちょうど同時である場合には、サウンドイベント検出および特定方法から正確な結果はもたらされない。これは、少なくとも2つの入力チャンネルの電力エンベロープが約3dB分、ほぼ同時に降下することによって特徴付けられる。この種の信号は、自然な環境では一般的ではないが、サウンド装置に用いられる多くの一般的なテスト信号ではよくあることであり、ポピュラー音楽では時折用いられる。しがたって、背景信号チェックによって、各入力チャンネルの電力エンベロープを検査して、そのうちの2つがほぼ同時に約3dB分降下する場合には、DSAは正確でないと考えられる。
整合性チェックによって、左右入力チャンネル対および中央‐サラウンド入力チャンネル対の真のサウンドイベント方向の絶対値の和が約45度未満かどうかを決定する。したがって、和が45度未満である場合には、定常信号が一定のままであったことを示しており、真のサウンドイベント方向によって示された方向は正確である。しかしながら、和が約45度以上である場合には、定常信号が一定のままでなかったことを示しており、真のサウンドイベント方向によって示された方向は不正確である。これに基づいて、整合性チェックにより、真のサウンドイベントが正確でないということがわかったときにはいつでも、エラーを示す信号(「エラー信号」)が生成される。
DSAが正確であるということがわかったときには、真のDSAは切り離されて、検出しようとしているサウンドイベントの典型的な持続期間に用いられる(1012)。例えば、音節を検出しようとしている場合、DSAをサウンドイベントの典型的な持続期間に用いる。他の例では、衝撃音を検出しようとしている場合、DSAを衝撃音の典型的な持続期間に用いる。しかしながら、DSAが正確でない場合、真のOSAを切り離して、検出しようとするサウンドイベント型の典型的な持続期間に用いる。真のOSAとは、検出しようとするサウンドイベント型の立ち上がり時間の間に生じるOSAのことである。
また、複数入力チャンネル対および単一サウンドイベント型サウンドイベント検出および特定方法は、順応調整方法を用いて、サウンドイベントの真の方向についてのエラーの発生を減少させる方法を含んでもよい。順応調整方法は、整合性チェックを用いて、順応信号の順応度を調整する。上述したように、順応信号は、人間の聴覚機構によって徐々に無視されるような、音場に存在する定常信号を表す。このような定常信号が無視される速度を、順応速度と称する。順応度は、順応信号(「AccSig」)によって規定される。順応調整方法は、、順応信号AccSigに調整係数Adjを乗算して、AccSigが以下の式によって規定されるようにする。
AccSig=AccSig(Adj) (1)
式中、Adjは、以下の式よって規定される。
Adj=l−α/50 (2)
式中、αは、おおよそ数秒という時間で整合性チェックによって決定されるエラーの数である。エラーの数を決定する正確な時間というのは、あまり重要ではない。Adjは、順応度を減少させて、順応信号を減少させ、定常信号をより遅い速度で無視されるようにするためのものである。これにより、検出される一過性現象が減少し、誤って特定される一過性現象の数が減少する。Adjが約0.998以上であれば、整合性チェックで示されるエラーの数は減少し、利用可能な結果が複数入力チャンネル対用サウンドイベント検出および特定方法によって得られることが、実験的に明らかとなっている。しかしながら、Adjが約0.998以下であれば、あまりに多くの一過性現象が検出されず、複数入力チャンネル対用サウンドイベント検出および特定方法は、利用可能な結果をもたらさない。
代わりに、複数入力チャンネル対および単一サウンドイベント型用サウンドイベント検出および特定方法は、エラーの数を用いて、エラー閾値調整方法の一部として、閾値を調整してもよい。エラー閾値調整方法は、整合性チェックによって決定されたエラーの数を、おおよそ数秒という所定の期間において決定し、この数を用いて閾値を調整する。エラーの数が増えれば、サウンドイベントが少なく検出されるように閾値を増加させる。したがって、閾値を、整合性チェックによって検出されたエラーの数に比例して、継続的に調整することができる。
また、サウンドイベント検出および特定方法は、単一の入力チャンネル対における複数のサウンドイベント型を検出および特定するように実施されてもよい(「単一入力チャンネル対および複数サウンドイベント型用サウンドイベント特定方法」)。図11は、2種類のサウンドイベント(音節と衝撃音)を検出および特定して、サウンドイベントが発生する度にその発生を示すDSAを生成するように実施されるサウンドイベント検出および特定方法1100を示す。しかしながら、この方法は、サウンドイベントの数および型がどのようなものであっても検出および特定するのと同様に実施されてもよい。単一入力チャンネル対および複数サウンドイベント型用サウンドイベント検出および特定方法1100は、一般的に、入力チャンネル対のための差分信号を生成すること(1104)と、入力チャンネル対から音節を検出すること(1106)と、入力チャンネル対から衝撃音を検出すること(1107)と、初期方向を決定すること(1108)と、検出されたサウンドイベントのために真のDSAを切り離す(1110)とを含む。ステップ1104,1106,1107,および1108は、まとめて、単一入力チャンネル対および複数サウンドイベント型用DSA決定方法を規定する(1101)。
入力チャンネル対のための差分信号を生成すること(1104)は、入力チャンネル毎に順応方法を実行することを含む。入力チャンネル対から音節を検出すること(1106)は、単一チャンネル対および単一サウンドイベント型用開始検出方法を実行して、チャンネル対で音節が発生したことを示すトリガ信号を生成することを含む。入力チャンネル対から衝撃音を検出すること(1107)は、チャンネル対のチャンネル毎に単一入力チャンネルおよび単一短期サウンドイベント型用サウンドイベント検出方法を並行して実行すること(結果生じた2つのトリガ信号は合成されて、チャンネル対で衝撃音が発生したことを示す単一のトリガ信号を形成してもよい)を含む。
その後、任意のトリガ信号が音節または衝撃音が検出されたことを示すと、初期方向が決定される(1108)。この時点で、初期方向決定を用いて、検出されたサウンドイベントの初期方向を決定する。この決定は、入力チャンネル対の各入力チャンネルの差分信号を用いて行われる。任意のトリガ信号がいずれかのサウンドイベントが生じていることを示すとき、差分信号を用いて真のDSAの生成を行う、真の方向を切り離す方法に従って、真のDSAが切り離される(1110)。そして、検出されたサウンドイベント型の典型的な持続期間に、真のDSAを用いる。例えば、音節を検出しようとする場合、DSAを音節のの典型的な持続期間に用いる。これに対して、衝撃音が検出された場合、DSAを衝撃音の典型的な持続期間に用いる。
また、サウンドイベント検出および特定方法は、複数の入力チャンネル対における複数のサウンドイベント型を検出および特定するように実施されてもよい(「複数入力チャンネル対および複数サウンドイベント型用サウンドイベント特定方法」)。複数入力チャンネル対および複数サウンドイベント型用サウンドイベント特定方法は、一般的に、単一入力チャンネル対および複数サウンドイベント型用サウンドイベント検出および特定方法を、入力チャンネル対毎に並行して実行することを含む。交互に、複数入力チャンネル対および複数サウンドイベント型用サウンドイベント特定方法は、サウンドイベントを検出することと、サウンドイベントのためにDSAを決定することと、DSAが正確かどうかを決定することと、DSAが正確でない場合にOSAを用いることを含んでもよい。DSAが正確でない場合にOSAを用いる、複数入力チャンネル対および複数サウンドイベント型用サウンドイベント特定方法の一例を、図12に示す。この例では、音節および衝撃音を2つのチャンネル対から検出する。しかしながら、この方法は、チャンネルの数がいくつであっても、そこにおける傷イベント型の数がいくつであっても、検出するように実施してもよい。
図12において、複数入力チャンネル対および複数サウンドイベント型用サウンドイベント特定方法1200は、入力チャンネル対のために差分信号を生成すること(1204)と、各入力チャンネル対から音節を検出すること(1206)と、各入力チャンネル対から衝撃音を検出すること(1207)と、チャンネル対毎に初期方向を決定すること(1208)、DSAが正確かどうかを決定すること(1210)と、DSAが正確である場合、DSAを切り離して、検出されたサウンドイベント型の典型的な持続期間に用いること(1212)と、DSAが正確でない場合、OSAを切り離して、検出されたサウンドイベント型の典型的な持続期間に用いること(1214)とを含む。ステップ1204,1206,1207,および1208は、まとめて、複数入力チャンネル対および複数サウンドイベント型用DSA決定方法を規定する(1201)。
入力チャンネル対のための差分信号の生成(1204)は、入力チャンネル毎に順応方法を並行して実施することを含む。各入力チャンネル対からの音節の検出(1206)は、単一のチャンネル対および単一のサウンドイベント型用の開始検出方法を並行して実施して、任意のチャンネル対で音節が発生していることを示すトリガ信号をチャンネル対毎に生成することを含む。各入力チャンネル対からの衝撃音の検出(1207)は、単一の入力チャンネルおよび単一の短期サウンドイベント用のサウンドイベント検出方法を、各チャンネル対の各チャンネルについて並行して実施して(チャンネル対毎に、結果生じた2つのトリガ信号を合成して、チャンネル対で衝撃音が発生していることを示す単一のトリガ信号を形成してもよい)。同時に、既知の方法を用いて、各チャンネル対においてOSAを決定する(1203)。
その後、任意のトリガ信号が音節または衝撃音が検出されることを示すと、チャンネル対毎に初期方向を決定する(1208)。この時点で、初期方向決定を用いて、検出されたサウンドイベントの初期方向を決定する。この決定は、入力チャンネル対の各入力チャンネルの差分信号を用いて行われる。その後、開始検出方法および/または整合性チェックを用いて、DSAが正確かどうかを決定する(1210)。DSAが正確であることがわかった場合、差分信号を用いて真のDSAを生成する、真の方向を切り離す方法に従って、真のDSAが切り離される(1210)。そして、音節の典型的な持続期間に、真のDSAを用いる。これに対して、衝撃音が検出された場合、DSAを衝撃音の典型的な持続期間に用いる。しかしながら、DSAが正確でないことがわかった場合、真のOSAを切り離して(1214)、真のOSAを生成する。その後、衝撃音の立ち上がり時間中のOSAから真のOSAを切り離して、衝撃音の典型的な持続期間に用いる。さらに、複数のチャンネル対および単一のサウンドイベント型用サウンドイベント検出および特定方法は、順応調整方法および/またはエラー閾値調節方法をさらに含んでもよい。
どのサウンドイベント検出および特定方法においても、任意のサウンドの方向を用いて、検出されたサウンドイベント型の典型的な持続期間の音場全体の方向を示す。しかしながら、典型的な継続期間中に後続のサウンドイベントが発生する場合、後続のサウンドが発生するとできるだけ早く、後続のサウンドイベントの方向を全入力チャンネルのために用いて、後続のサウンドイベントのサウンドイベント型の典型的な持続時間に継続して用いる。これは、一般的には、複数のサウンドイベント同士が重なる場合に、直近のサウンドイベントの方向が用いられるという意味である。
再生サウンドイベント検出および特定方法の適用例は、記録されたサウンドがステレオ(2チャンネル)再生が意図されていたか、またはサラウンド(2つ以上のチャンネル)再生が意図されていたかを決定する方法(「ステレオ/サラウンド検出方法」」)に含まれる。ステレオ/サラウンド検出方法は、一般的に、聴取者の背後での再生専用のサウンドイベントの数を決定し、この数が所定の値を超えているかどうかを決定する。このような方法は、聴取者の背後での再生専用のサウンドの指標となる負の位相を用いる既知の方法に対して有利である。なぜならば、負の位相を必然的に有する一過性現象は、間違って後ろ方向を示すことはないからである。
上述したように、サラウンド再生専用の音場は、聴取者の背後での再生専用のサウンドイベントを含む。したがって、ステレオ/サラウンド検出方法は、検出しようとしているサウンドイベント型毎に、単一入力チャンネル対用、中央‐サラウンド入力チャンネル対用サウンドイベント検出および特定方法を実施することと、関連する約0度から約−45度の(後ろ方向を示す)真の差分指向角でサウンドイベントの数を決定することとを含む。不正確な差分指向角によって生じたサラウンドが間違って指定されるのを避けるために、サラウンド検出方法は、また、後方再生用に検出されたのサウンドイベントの数が、規定した時期において所定の値を超えているかどうかを決定する。一般的には、約10sから15sの時間に検出される、後方再生専用のサウンドイベント数が僅かしかなければ(2または3程度)、音場または音場の特定の部分は、サラウンド再生専用と決定される。さらに、サウンドイベントの持続期間を決定して、所定の持続期間を超える持続期間のサウンドイベントのみを、背後再生専用のサウンドイベントとしてカウントしてもよい。例えば、約50ms未満程度といった、非常に短期間のサウンドイベントは、音場での意図された方向を正しく示さないことが多い。したがって、約50msを超える持続期間のサウンドイベントのみを、背後再生専用のサウンドイベントとしてカウントする。他の例では、約200msから約300msの持続期間のサウンドイベントのみを、背後再生専用のサウンドイベントとしてカウントする。
(3.サウンドを特定するための方法)
また、人間の聴覚機構特性を用いて、音場内のすべてのサウンドの位置を決定してもよい。サウンドイベント検出および特定方法を、サウンドの意図する方向を決定する既知の方法を組み合わせることによって、背景サウンドがある状態で、どのようなサウンドの組み合わせであっても、個々のサウンドをより正確に特定する方法を開発した(「サウンド特定方法」)。サウンドと九手方法は、音場をサウンドイベントと非サウンドイベントとに分割し、真の差分指向角または通常指向角で表すサウンドイベントと、フィルタ後の指向角で表す非サウンドイベントとを特定する。このような方法は、基本的には、非サウンドイベントを、方向を別途決定する別のサウンドとして扱う。サウンド特定方法は、サウンドイベント型の数や組み合わせがどのようなものであっても、サウンドイベント型を明確に特定して、残存のサウンドを特定するのに加えて、入力チャンネル対の数がいくつであっても、そこで生成される音場において特定を行う。以下の説明では、複雑でないものから順にサウンド特定方法を説明し、各サウンド特定方法は、特に示さない限り、それに先立って説明した方法のステップを含むものとする。
一般的に、すべてのサウンド特定方法において、フィルタ後のOSAを用いて音場の方向を示し、サウンドイベントが検出されると、真のDSAを用いる。複数のチャンネル対(または他のチャンネル対を生成可能な単一のチャンネル対)で生じる音場について実施されるサウンド特定方法では、DSAが正確であると決定された場合にのみ、真のDSAを用いてサウンドイベントの方向を示す。このような場合、DSAが正確だと判断されない場合、真のOSAを用いてサウンドイベントの方向を示す。さらに、どのような指向角の型(OSAまたはDSA)が選ばれても、音場のすべての入力チャンネルについてその型の指向角を用いる。例えば、雑音がある状態のサウンドイベントをたった1つの入力チャンネルから検出し、かつすべての入力チャンネルに雑音がある場合、DSA(サウンドイベントの方向を示す)を用いて(場合によっては、正確な場合にのみ用いる)、サウンドイベントの持続期間に、音場全体の方向を規定する。都合のよいことに、人間の聴覚機構は、一般的に、サウンドイベントを前方ストリームの一部として認識し、雑音を背景ストリームの一部として認識するので、サウンドイベントだけが移動したというように認識する。
単一の入力チャンネル対から単一のイベント型を検出するためのサウンド特定方法(「単一入力チャンネル対および単一サウンドイベント型」)を図13に示す。この方法は、一般的に、DSAおよびトリガ信号を決定すること(1302)と、OSAを決定すること(1306)と、どの方向を使用するかを決定すること(1304)とを含む。1302,1304,および1306は、一般的に、音場が感知される限り、同時並行的に実施される。
DSAおよびトリガ信号の決定(1302)は、一般的に、入力チャンネル対について単一のトリガ信号を生成する交互開始検出方法を含む、単一入力チャンネル対および単一サウンドイベントDSA決定方法を実施することによって達成される。パルスがトリガ信号内にある場合にのみサウンドイベントが生じるが、DSAは継続して決定される。代わりに、トリガ信号を継続的に決定して、DSAは、パルスがトリガ信号内にある場合にのみ決定されるようにしてもよい。OSAの決定(1306)は、一般的に、機知の方法を用いて継続的に行われる。どの方向を使用するかの決定(1304)は、基本的に、サウンドイベントが発生すると、検出されたサウンドイベント型に典型的な持続期間に真のDSAを用いると決定して、サウンドイベントの終了時にOSAを減衰することを含む。しかしながら、後続のサウンドイベントが随時発生する場合(たとえサウンドイベント中であっても)、後続のサウンドイベント型に典型的な持続時間に後続のサウンドイベントのDSAが用いられる。
どの方向を用いるかを決定する方法(「単一入力チャンネル対および単一サウンドイベント型用方向決定方法」)を図14に参照符号1304で示す。この方法は、一般的に、入力信号があるかどうかを決定すること(1402)と、入力信号がある場合に、サウンドイベントがあるかどうかを決定すること(1404)と、サウンドイベントがある場合に、検出されたサウンドイベント型の典型的な持続期間に現在の真のDSAを生成および選択すること(1406)と、典型的な持続期間が終了したかどうかを決定すること(1408)と、典型的な持続期間が終了していない場合に、後続のサウンドイベントが検出されるかどうかを決定すること(1410)と、後続のサウンドイベントが検出されない場合、典型的な持続期間が終了したかどうかの決定(1408)および後続のサウンドイベントが検出されたかどうかの決定(1410)を、1408で典型的な持続期間が終了と決定されるか、または1410で後続のサウンドイベントが検出されたと決定されるまで繰り返すことと、後続のサウンドイベントが検出された場合、現在のDSAを後続のサウンドイベントのそれで規定して、適宜1406,1408,1410,および1414を繰り返すことと、1408で典型的な持続期間が終了したと判断されると、1402から本方法全体を適宜繰り繰り返すことと、1404でサウンドイベントが検出されない場合、直前のサウンドイベントがあったかどうかを決定すること(1416)と、直前のサウンドイベントがない場合、フィルタ後のOSAを選択すること(1418)と、本方法全体を1402から適宜繰り返すことと、直前のサウンドイベントがある場合、フィルタ後のOSAを選択して真のDSAから減衰すること(1420)と、本方法全体を1402から適宜繰り返すことと、1402で入力信号が検出されなくなるまで本方法全体を適宜繰り返して、入力信号がなくなると、本方法を終了することとを含む。
入力信号があるかどうかの決定(1402)は、すべての入力チャンネルにおける音場の入力電力(「I」」)が約0より大きいかどうかを決定することを含む。さらに、すべての入力チャンネルにおいて、入力電力が以前のサウンドイベントから約30dB降下したかどうかを決定することを含む。降下していたら、入力信号が停止したと一般的に推定される。入力信号がある場合、トリガ信号を調査することによってサウンドイベントがあるかどうかを決定する(1404)。トリガ信号がパルスまたはサウンドイベントの発生を示す他のものを含んでいれば、サウンドイベントが存在する。逆に、トリガ信号がパルスまたはサウンドイベントの発生を示す他のものを含んでいなければ、サウンドイベントは存在しない。
サウンドイベントがある場合、真の方向の切り離し方法を用いて、現在の真のDSAを現在のDSAから生成し、検出しようとするサウンドイベント型の典型的な持続期間に選択する(1408)。上述したように、検出しようとするサウンドイベント型が音節の場合、サウンドイベントの典型的な持続期間は約50msから200ms(好ましくは、約150ms)であり、検出しようとするサウンドイベント型が衝撃音の場合、サウンドイベントの典型的な持続期間は約50msである。検出しようとするサウンドイベントが実際に終了したかどうかを問わず、典型的な持続期間にDSAを選択および使用する。しかしながら、典型的な持続期間中に、入力信号が傍受されて、正確なDSAを有する任意の後続のサウンドイベントが検出されるかどうかを決定する(1408および1410)。典型的な継続期間に中に後続のサウンドイベントが検出されると、現在のDSAは、後続のサウンドイベントのDSAに再規定され(1414)、再規定された現在のDSAを用いて、検出されたサウンドイベント型の典型的な持続期間用に選択される現在の真のDSAを生成し、1406,1408,1410,および1414を適宜繰り返す。しかしながら、典型的な持続期間中に後続のサウンドイベントが検出されない場合には(1408および1410)、1402から本方法全体を適宜繰り返す。
これに対して、1404でサウンドイベントがないと決定されると、直前のサウンドイベントがあるかどうかを決定する(1416)。直前のサウンドイベント典型的な持続期間がちょうど終了したサウンドイベント)がない場合、フィルタ後のOSAを選択するか、または常に選択され(1418)、処理を1402から適宜繰り返す。フィルタ後のOSAは、除去された特定の立ち上がり時間よりも速い立ち上がり時間の変動を有するOSAである。例えば、約300msよりも速い立ち上がり時間の変動が除去されてもよい。これにより、サウンドイベントがない場合に、OSAが急速な方向の変化を反映することを防止する。しかしながら、直前のサウンドイベント(典型的な持続時間がちょうど終了したサウンドイベント)があった場合には、OSAを選択して、直前のサウンドの真のDSAから減衰する(1420)。この減衰は、直前のサウンドイベントのDSAからOSAへの円滑な遷移を提供する効果がある。この円滑な遷移を提供するのに必要な減衰の長さは、直前のサウンドイベントのサウンドイベント型による。直前のサウンドイベントが音節である場合には、減衰は、一般的に、約300ms秒である。その後、処理は、1402で入力信号が終了したと判断されるまで、1402から適宜繰り返す。
場合によっては、特に非常に短期のサウンドイベントを特定しようとする場合には、方向選択方法が、短期サウンドイベントが典型的な持続期間の終了時に実際に終了したかを決定することと、短期サウンドイベントが実際には終了していなかった場合に、減衰なしでOSAをすぐに選択することとを含んでいれば、より正確な結果が得られる。そのような方法(「単一入力チャンネル対および短期サウンドイベント用方向選択方法」)を、図15の参照符号1500で示す。単一入力チャンネル対および短期サウンドイベント用方向選択方法は、一般的に、入力信号があるかどうかを決定すること(1502)と、入力信号がある場合に、短期サウンドイベントがあるかどうかを決定すること(1504)と、短期サウンドイベントがある場合に、検出された短期サウンドイベント型の典型的な持続期間に真のDSAを生成および選択すること(1506)と、典型的な持続期間が終了したかどうかを決定すること(1508)と、典型的な持続期間が終了していない場合に、後続の短期サウンドイベントが検出されるかどうかを決定すること(1510)と、後続の短期サウンドイベントが検出されない場合、典型的な持続期間が終了したかどうかの決定(1508)および後続の短期サウンドイベントが検出されたかどうかの決定を、1508で典型的な持続期間が終了と決定されるか、または1510で後続の短期サウンドイベントが検出されたと決定されるまで繰り返すことと、後続の短期サウンドイベントが検出された場合、現在のDSAを後続の短期サウンドイベントのそれで規定して(1512)、適宜1506,1508,1510,および1514を繰り返すことと、1508で典型的な持続期間が終了したと判断されると、1502から本方法全体を適宜繰り繰り返すことと、1504で短期サウンドイベントが検出されない場合、直前の短期サウンドイベントがあったかどうかを決定すること(1514)と、直前の短期サウンドイベントがなかった場合、フィルタ後のOSAを選択または選択し続けて(1516)、本方法全体を1502から適宜繰り返すことと、直前の短期サウンドイベントがある場合、直前の短期サウンドイベントが実際に終了したかどうかを決定すること(1518)と、直前の短期サウンドイベントが実際に終了した場合には、フィルタ後のOSAへ即座に移行すること(1520)と、直前の短期サウンドイベントが実際には終了していない場合には、フィルタ後のOSAを選択および減衰して、本方法全体を1522から適宜繰り返すことと、1502において入力信号が検出されなくなるまで、本方法全体を適宜繰り返すことと、入力信号がなくなると、処理を終了することとを含む。
この単一入力チャンネル対および短期サウンドイベント用方向選択方法は、上述した方向選択方法と実質上同一であるが、単一入力チャンネル対および短期サウンドイベント用方向選択方法は、短期サウンドイベントを検出するために実施される点が異なる。さらに、短期サウンドイベントの典型的な持続期間の終了時に(新たなサウンドイベントが発生していないまたは発生している最中ではないと仮定)、短期サウンドイベントが実際に終了したかどうかを決定し(1514)、短期サウンドイベントが実際に終了したどうかに基づき、フィルタ後のOSAを1520で即座に用いるか、1522の減衰後に用いる。この単一入力チャンネル対および短期サウンドイベント用方向選択方法は、チャンネル対の入力チャンネル毎に、単一チャンネル対および短期サウンドイベント用サウンドイベント検出方法を用いて、短期サウンドイベントを検出して、短期サウンドイベントが検出されたときにはいつでもそれを示すトリガ信号(または2つのトリガ信号)を生成するように実施することができる。
直前の短期サウンドイベントが実際に終了にしたかは、チャンネル対の各入力チャンネルの電力エンベロープおよび順応信号を比較することによって決定されてもよい。入力チャンネル対の任意の入力チャンネルにおいて入力電力エンベロープIが順応信号AccSigより大きい場合、短期サウンドイベントは実際には終了していないと決定する。したがって、フィルタ後のOSAは直前のサウンドイベントのDSAから減衰する。しかしながら、入力チャンネル対の各入力チャンネルにおいてIが順応信号AccSig以下である場合、短期サウンドイベントは実際に終了したと決定され、フィルタ後のOSAが即座に選択される(1522)。この円滑な遷移を提供するのに必要な減衰の長さは、検出しようとするサウンドイベント型による。例えば、直前のサウンドイベントが衝撃音である場合には、減衰に約5msかかる。
また、音場が1つ以上の入力チャンネル対を含む場合に、サウンド特定方法を用いて、音場におけるサウンドを特定してもよい(「複数入力チャンネル対および単一サウンドイベント型用サウンド特定方法」)。複数入力チャンネル対および単一サウンドイベント用サウンド特定方法は、単一入力チャンネル対および単一サウンドイベント型用サウンド特定方法と同一の基本ステップを含み、一般的に、OSAを決定することと、DSAおよびトリガ信号を決定することと、どの方向を使用するかを決定することとを含む。しかしながら、DSAおよびトリガ信号を決定するステップは、入力チャンネル対毎にDSAおよびトリガ信号を決定することを含み、交互開始検出方法を含む複数入力チャンネル対および単一サウンドイベント用DSA決定方法を実行することによって実施される。さらに、どの方向を使用するかを決定するステップ(「複数入力チャンネル対および単一サウンドイベント型用方向選択方法」)は、任意の入力チャンネル対からの差分信号、トリガ信号、およびDSAに応答することと、正確なDSAを有するサウンドイベントが任意の入力チャンネル対において検出される場合に、すべての入力チャンネル対のために真の差分指向角を生成および選択することとを含む。
複数チャンネル対および単一サウンドイベント型用方向選択方法を図16の参照符号1600でより詳細に示す。一般的に、この方向選択方法は、任意のトリガ信号がサウンドイベントの発生を示すとき、DSAが正確かどうかを決定することと、DSAが正確でない場合に、DSAの代わりに、検出しようとするサウンドイベント型の典型的な持続期間で真のOSAを用いることを含む。より特定的には、方向選択方法1600は、入力信号があるかどうかを決定すること(1602)と、入力信号がある場合に、サウンドイベントがあるかどうかを決定すること(1604)と、サウンドイベントがある場合に、現在の真のDSAが正確かどうかを決定すること(1606)と、現在の真のDSAが正確である場合に、検出しようとしているサウンドイベント型の典型的な持続期間に現在の真のDSAを生成して選択すること(1608)と、現在の真のDSAが正確でない場合に、検出しようとしているサウンドイベント型の典型的な持続期間に現在の真のOSAを生成して選択すること(1620)と、真のOSAまたはDSAが生成および選択されると、典型的な持続期間が終了したかどうかを決定すること(1610)と、典型的な持続期間が終了していない場合に、後続のサウンドイベントが検出されるかどうかを決定すること(1612)と、後続のサウンドイベントが検出されない場合、典型的な持続期間が終了したかどうかの決定(1610)および後続のサウンドイベントが検出されたかどうかの決定(1612)を、1610で典型的な持続期間が終了と決定されるか、または1612で後続のサウンドイベントが検出されたと決定されるまで繰り返すことと、後続のサウンドイベントが検出された場合、後続のサウンドイベントの真のDSAが正確かどうかを決定すること(1614)と、後続のサウンドイベントの真のDSAが正確である場合、現在のDSAを後続のサウンドイベントのそれで規定して(1616)、適宜1610,1612,1614,1616,および1618を繰り返すことと、1614で後続のサウンドイベントの真のDSAが正確でないと決定された場合、現在のフィルタ後のOSAを後続のサウンドイベントのそれで規定して(1618)、適宜1610,1612,1614,1616,および1618を繰り返すことと、1610で典型的な持続期間が終了したと判断されると、1602から本方法全体を適宜繰り繰り返すことと、1604でサウンドイベントが検出されない場合、直前のサウンドイベントがあったかどうかを決定すること(1622)と、直前のサウンドイベントがなかった場合、フィルタ後のOSAを選択または選択し続けて(1624)、本方法全体を1602から適宜繰り返すことと、直前のサウンドイベントがあった場合、フィルタ後のOSAを選択して真のDSAから減衰して(1626)、本方法全体を1602から適宜繰り返すことと、1602において入力信号が検出されなくなるまで、本方法全体を適宜繰り返すことと、入力信号がなくなると、処理を終了することとを含む。
入力信号があるかどうかの決定(1602)は、各チャンネル対の各入力チャンネルに入力信号があるかどうかを決定することを含む。サウンドイベントがあるかどうかの決定(1604)は、単一チャンネル対および単一サウンドイベント型用サウンドイベント検出方法をチャンネル対毎に実行して、サウンドイベントの発生を示すトリガ信号を対毎に生成することを含む。現在のDSAが正確かどうかの決定(1606)は、各入力チャンネル対からの現在のDSA(任意のトリガ信号がサウンドイベントの発生を示すときに決定されたDSA)が正確かどうかを、複数入力チャンネル対に対するDSAの正確性を決定する方法を用いて決定することを含む。複数入力チャンネル対に対するDSAの正確性を決定する方法を図17の参照符号1700に詳細に示し、この方法は、少なくとも2つの入力チャンネルにおいて、背景信号が約3dB以上降下したかどうかを決定すること(1702)と、少なくとも2つの入力チャンネルにおいて、背景信号が約3dB以上降下していない場合、すべての現在のDSAは整合性チェックを通るかどうかを決定すること(1704)とを含む。少なくとも2つの入力チャンネルにおいて、背景信号が約3dB以上降下したかどうかを決定することは、背景信号チェックをすべての入力チャンネルで行うことによって達成される。少なくとも2つの入力チャンネルにおいて、背景信号が約3dB以上降下した場合、DSAは正確でないと考えられる。しかしながら、少なくとも2つの入力チャンネルにおいて、背景信号が約3dB以上降下していない場合、上述のように整合性チェックが行われる。DSAが整合性チェックを通る場合、DSAは正確であると考えられる。
図16に示すように、DSAが正確であると考えられる場合、真の方向の切り離し方法を用いて、現在の真のDSAをチャンネル対毎に生成および選択する。しかしながら、DSAが正確でないと考えられる場合、現在の真のOSA(任意のトリガ信号が、現在のサウンドイベントが発生してことを示すときに決定されたOSA)をチャンネル対毎に生成および選択する(1620)。後続のサウンドイベントが典型的な持続期間中に検出されなければ、検出しようとするサウンドイベント型の典型的な持続期間に現在の真のOSAまたは現在の真のDSAのいずれかを用いる。1610において典型的な持続期間が終了していないと決定されている限り、後続のサウンドイベントが検出されるかどうかを決定する(1612)。後続のサウンドイベントが検出される場合、複数入力チャンネル対についてDSAの正確性を決定する方法を用いて、後続のサウンドイベントの真のDSAが正確かどうかを決定する(1614)。後続のサウンドイベントのDSAが正確であると決定される場合、後続のサウンドイベントのDSAが現在のDSAとなり(1616)、後続のサウンドイベントの方向を反映する。しかしながら、後続のサウンドイベントのDSAが正確でないと決定される場合、後続のサウンドのOSAが現在のOSAとなり(1618)、後続のサウンドイベントの方向を反映する。後続のサウンドイベントの典型的な持続期間が終了するまで、処理は1608または1620から適宜繰り返される。
任意の後続のサウンドが終了すると、1622において、直前のサウンドイベントがあったかどうかを決定する。直前のサウンドイベントがあった場合、フィルタ後のOSAが選択され、音場の方向は、DSAで示される方向からOSAで示される方向へ減衰する(1626)。しかしながら、直前のサウンドイベントがなかった場合、フィルタ後のOSAを用いるかまたは用い続ける(1624)。さらに、任意の複数チャンネル対および単一サウンドイベント型用サウンド特定方法は、整合性チェックを用いて、不正確なDSAの発生を、上述したような順応調整方法および/またはエラー閾値調整方法を用いて減少させることを含んでもよい。
場合によっては、特に非常に短期のサウンドイベントを特定しようとする場合には、方向選択方法が、短期サウンドイベントが典型的な持続期間の終了時に実際に終了したかを決定することと、短期サウンドイベントが実際には終了していなかった場合に、減衰なしでOSAをすぐに選択することとを含んでいれば、より正確な結果が得られる。そのような方法(「複数入力チャンネル対および短期サウンドイベント用方向選択方法」)を、図18の参照符号1800で示す。単一入力チャンネル対および短期サウンドイベント用方向選択方法は、一般的に、入力信号があるかどうかを決定すること(1802)と、入力信号がある場合に、短期サウンドイベントがあるかどうかを決定すること(1804)と、短期サウンドイベントがある場合に、現在の真のDSAが正確かどうかを決定すること(1806)と、現在の真のDSAが正確である場合に、検出しようとしている短期サウンドイベント型の典型的な持続期間に現在の真のDSAを生成して選択すること(1808)と、現在の真のDSAが正確でない場合に、検出しようとしている短期サウンドイベント型の典型的な持続期間に現在の真のOSAを生成して選択すること(1820)と、真のOSAまたはDSAが生成および選択されると、典型的な持続期間が終了したかどうかを決定すること(1810)と、典型的な持続期間が終了していない場合に、後続の短期サウンドイベントが検出されるかどうかを決定すること(1812)と、後続のサウンドイベントが検出されない場合、典型的な持続期間が終了したかどうかの決定(1810)および後続のサウンドイベントが検出されたかどうかの決定(1812)を、1810で典型的な持続期間が終了と決定されるか、または1812で後続のサウンドイベントが検出されたと決定されるまで繰り返すことと、後続のサウンドイベントが検出された場合、後続のサウンドイベントの真のDSAが正確かどうかを決定すること(1814)と、後続のサウンドイベントの真のDSAが正確である場合、現在のDSAを後続のサウンドイベントのそれで規定して(1816)、適宜1810,1812,1814,1816,および1818を繰り返すことと、1814で後続のサウンドイベントの真のDSAが正確でないと決定された場合、現在のOSAを後続のサウンドイベントのそれで規定して(1818)、適宜1810,1812,1814,1816,および1818を繰り返すことと、1810で典型的な持続期間が終了したと判断されると、1802から本方法全体を適宜繰り繰り返すことと、1804でサウンドイベントが検出されない場合、直前のサウンドイベントがあったかどうかを決定すること(1822)と、直前のサウンドイベントがなかった場合、フィルタ後のOSAを選択または選択し続けて(1824)、本方法全体を1802から適宜繰り返すことと、直前のサウンドイベントがあった場合、直前のサウンドイベントが実際に終了したかどうかを決定すること(1825)と、直前のサウンドイベントが実際に終了している場合、フィルタ後のOSAを選択して、真のDSAから即座に移行して(1826)、本方法全体を1802から適宜繰り返すことと、直前のサウンドイベントが実際には終了していない場合、フィルタ後のOSAを選択して減衰して(1828)、本方法全体を1802から適宜繰り返すことと、1802において入力信号が検出されなくなるまで、本方法全体を適宜繰り返すことと、入力信号がなくなると、処理を終了することとを含む。
この複数入力チャンネル対および短期サウンドイベント用方向選択方法は、上述した複数入力チャンネルおよび単一サウンドイベント型用方向選択方法と実質上同一であるが、複数入力チャンネル対および短期サウンドイベント用方向選択方法は、短期サウンドイベントを検出するために実施される点が異なる。さらに、短期サウンドイベントの典型的な持続期間の終了時に(新たなサウンドイベントが発生していないまたは発生している最中ではないと仮定)、短期サウンドイベントが実際に終了したかどうかを決定し(1825)、短期サウンドイベントが実際に終了したどうかに基づき、フィルタ後のOSAを1826で即座に用いるか、1828の減衰後に用いる。この複数入力チャンネル対および短期サウンドイベント用方向選択方法は、チャンネル対の入力チャンネル毎に、複数チャンネル対および単一短期サウンドイベント用サウンドイベント検出方法を用いて、短期サウンドイベントを検出して、短期サウンドイベントが検出されたときにはいつでもそれを示すトリガ信号(または2つのトリガ信号)を生成するように実施することができる。
直前の短期サウンドイベントが実際に終了にしたかは、入力電力エンベロープが任意の入力チャンネルの短期サウンドイベントについての順応信号より大きいかどうかを決定することによって決定される(1825)。入力電力エンベロープが任意の入力チャンネルの短期サウンドイベントについての順応信号より大きい場合、短期サウンドイベントは実際には終了していないと決定する。したがって、直前の短期サウンドイベントのDSAからフィルタ後のOSAへ減衰が起こる(1826)。しかしながら、各入力チャンネルにおいて、電力エンベロープが順応信号とほぼ同一である場合、短期サウンドイベントは実際に終了したと決定され、フィルタ後のOSAが即座に選択される(1828)。この円滑な遷移を提供するのに必要な減衰の長さは、検出しようとするサウンドイベント型による。例えば、直前のサウンドイベントが衝撃音である場合には、減衰に約5msかかる。
また、サウンド特定方法は、1つ以上のサウンドイベント型を区別することによって音場におけるサウンドを特定するために用いてもよい(「単一入力チャンネル対および複数サウンドイベント型用サウンド特定方法」)。単一入力チャンネル対および複数サウンドイベント型サウンド特定方法は、単一入力チャンネル対および単一サウンドイベント型サウンド特定方法と同一の基本ステップ同一の基本ステップを含み、一般的に、OSAを決定することと、DSAおよびトリガ信号を決定することと、どの方向を使用するかを決定することとを含む。しかしながら、DSAおよびトリガ信号の決定は、サウンドイベント型毎にDSAおよびトリガ信号を決定することを含み、交互開始検出方法を含む単一入力チャンネル対および複数サウンドイベント用DSA決定方法を実行することによって実施される。さらに、どの方向を使用するかの決定は、単一の入力チャンネル対(単一サウンドイベント型または短期サウンドイベントのいずれか)用の方向選択方法を、検出しようとするサウンドイベント型毎に並行して実行することを含む。しかしながら、任意のチャンネル対から任意の型のサウンドイベントが検出される度に、DSAが、実際に検出されたサウンドイベント型の典型的な持続期間に、各入力チャンネル対において用いられる。
また、サウンド特定方法は、1つ以上のサウンドイベント型を区別することによって、1つ以上の入力チャンネル対のある音場におけるサウンドを特定するために用いてもよい(「複数入力チャンネル対および複数サウンドイベント型用サウンド特定方法」)。複数入力チャンネル対および複数サウンドイベント型サウンド特定方法は、複数入力チャンネル対および単一サウンドイベント型サウンド特定方法と同一の基本ステップ同一の基本ステップを含み、一般的に、OSAを決定することと、DSAおよびトリガ信号をチャンネル対毎に決定することと、複数入力チャンネル対および単一サウンドイベント型用方向選択方法に従って、どの方向を使用するかを決定することとを含む。しかしながら、複数のサウンドイベントを検出するための方法では、DSAおよびトリガ信号のチャンネル対毎の決定は、各入力チャンネル対におけるサウンドイベント型毎のDSAおよびトリガ信号を決定することを含む。各入力チャンネル対におけるサウンドイベント型毎のDSAおよびトリガ信号の決定は、交互開始検出方法を含む複数入力チャンネル対および複数サウンドイベント型用DSA決定方法を実行することによって実施される。さらに、複数入力チャンネル対および複数サウンドイベント型用方向選択方法は、任意のサウンドイベント型からのトリガ信号に応答することと、正確なDSAを有するサウンドイベントが任意の入力チャンネル対から検出される場合に、すべての入力チャンネル対のために真の差分指向角を生成および選択すること、または、不正確なDSAを有する任意の型のサウンドイベントが任意のチャンネルから検出される場合に、全ての入力チャンネル対のために真のOSAを選択することとを含む。代わりに、複数入力チャンネル対および複数サウンドイベント型用サウンド特定方法は、上述の順応調整方法および/またはエラー閾値調整方法を用いることを含んでもよい。
このような方法でどの方向を利用するかを決めれば、簡素なサウンドイベントでもより複雑なサウンドイベントでもうまくゆく。例えば、ドラムの打音が顕著なポピュラー音楽を含む音場であって、音楽の大部分が前方(中央入力チャンネル)から発せられ、ドラムの打音は後方(サラウンド入力チャンネル)から発せられる音場を考える。音楽の方向は、フィルタ後のOSAによって規定され、中央入力チャンネルに特定される(音楽が他のサウンドイベントを含まないと仮定)。しかしながら、ドラムの打音が発生すると、本方法は、衝撃音を検出して、(DSAは正確であると仮定)真のDSAに示された方向を用いて、音場全体を後方へ移動させる。衝撃音の典型的な持続期間が終了すると、本方法は、ドラムの打音が実際に終了したかどうかを決定し、終了していれば、フィルタ後のOSAによって示された方向の利用に戻り、音場全体を中央入力チャンネルへ移動させる。方向がこのように決定されると、人間の聴覚機構は、音楽が移動していなければ、ドラムの打音は後方から、音楽は常に前方から発せられていると認識する。しかしながら、ドラムの打音の典型的な持続期間よりも長くDSAを用いるか、または典型的な持続期間の終了時には、ドラムの打音が典型的な持続期間の終了時以前に実際に終了していれば、減衰を利用して、フィルタ後のOSAに戻り、音楽を含む音場全体は公報に移動したように認識される。
より複雑な例としては、周囲雑音がある状態で、叫びのような非常に鋭いアタックを有する会話音を含む音場を考える。会話音は、衝撃音(アタック)および音節(叫びの残部)の両方を含むので、複雑である。叫びの開始は、インパルスとして検出され、現在の衝撃のDSAが正確であると仮定して、衝撃のDSAが衝撃音の典型的な持続期間に選択される。しかしながら、典型的な持続期間中であっても、その直後であっても、叫びの音節部分は検出され、音節のDSAが正確だと仮定すると、音節のDSAが選択されて、音節の典型的な持続期間に用いられる。音節が検出されるとき、過去に検出された衝撃音のDSAは、当該音節と同一であるため、方向の変化は生じない。したがって、叫びの鋭い開始で示される方向は、衝撃の性質に従って即座に取り込まれ、その方向が、音節の性質の時間特性に用いられる。
(4.サウンドイベント装置)
サウンドイベント検出方法、サウンドイベント検出および特定方法、サウンド特定方法、ならびにこれらの方法に含まれるあらゆる方法は、図19の参照符号1900に示すようなサウンドイベント装置で実施されてもよい。最適化装置1900は、一般的に、検出器1902を含み、また、インターフェイス部1904を含んでもよい。検出部1902は、メモリ装置1906に接続されたプロセッサ1908を含む。メモリ装置1908は、どのような種類の固定または着脱可能なデジタル記憶装置でもよく、(必要があれば)フロッピー(登録商標)ディスク、フロッピー(登録商標)ドライブ、CD‐ROMディスクおよびドライブ、光学ディスクおよびドライブ、ハードドライブ、RAM、ROM、ならびにデジタル情報を記憶する他の装置を含む。プロセッサ1908は、デジタル情報を処理するために用いられる装置であればどのような種類であってもよい。メモリ装置1906は、音場を記憶してもよく、サウンドイベント検出方法、サウンドイベント検出および特定方法、および任意のこれらの方法に含まれるあらゆる方法(「検出および/または特定方法」と総称する)のうちの少なくとも1つを記憶してもよい。プロセッサ信号1910による該当要求がプロセッサ1908からあると、メモリは検出および/または特定方法のうちの1つと、必要があれば音場とを、メモリ信号1912によってプロセッサ1908に伝達する。そして、プロセッサ1908は、検出および/または特定方法を実行する。
インターフェイス部1904は、一般的に、入力装置1914と、出力装置1916とを含む。出力装置1916は、プロセッサまたはメモリから人間もしくは他のプロセッサまたはメモリに対して情報を伝達することが可能な、映像、手動、音響、電子、または電磁気装置であればどのような種類であってもよい。出力装置の例としては、それに限定するものではないが、モニタ、スピーカ、液晶ディスプレイ、ネットワーク、バス、およびインターフェイスがある。入力装置1914は、人間もしくはプロセッサまたはメモリから別のプロセッサまたはメモリに対して情報を伝達することが可能な、映像、手動、音響、電子、または電磁気装置であればどのような種類であってもよい。出力装置の例としては、キーボード、マイクロフォン、音声認識システム、トラックボール、マウス、ネットワーク、バス、およびインターフェイスがある。代わりに、入出力装置1914および1916は、それぞれ、タッチパネル、コンピュータ、プロセッサ、またはネットワークを介してプロセッサに接続されたメモリなどの単独装置に含まれていてもよい。音場は、入力装置1914からプロセッサ1920を介してメモリ装置1918に伝達されてもよい。さらに、最適化されたモデルパラメータをプロセッサ1920から出力装置1916へ伝達してもよい。
(6.サウンドイベント検出器)
人間の聴覚機構特性をモデル化して、背景信号がある状態でサウンドイベントを検出する電子回路を考案した(「サウンドイベント検出器」と総称する)。サウンドイベント検出器を、特定の型のサウンドイベント検出の助けとなる様々な応用に用いてもよい。例えば、音節を検出するサウンドイベント検出器を、音声検出器の一部ならびに会話認識または会話符号化システムの一部として用いてもよい。他の例では、音節を検出するサウンドイベント検出器を、マイクロフォンなどの音声増幅装置と共に用いてもよい。これにより、マイクロフォンは、スピーカから音節が検出されるまでオフにしておくことができ、スピーカが音を出さないときに、マイクロフォンが、所望しないサウンドおよびフィードバックをマイクロフォン自体を介して増幅しないようにする。サウンドイベント検出器は、サウンドイベント検出方法と同様に、サウンドイベントの発生を示す、パルスなどの何らかのフラグまたはマーカを含むトリガ信号を一般に生成する。また、サウンドイベント検出方法と同様に、サウンドイベント検出器は、入力チャンネルの数がいくつであっても、そこにおいて生成される音場のサウンドイベント型の数および組み合わせがどのようなものであっても、実施可能である。以下の説明では、複雑でないものから順にサウンドイベント検出器を説明し、各サウンド検出器は、特に示さない限り、それに先立って説明したサウンドイベント検出器の構成要素を含むものとする。
単一の入力チャンネルでのみ生成した音場から単一の型のサウンドイベントを検出するサウンドイベント検出器(「単一入力チャンネルおよび単一サウンドイベント型用サウンドイベント検出器」)の一例を図20の参照符号2000で示す。しかしながら、サウンドイベント検出器および特定器は、入力チャンネル対の数がいくつであっても、そこから検出されるサウンドイベント型がいくつであっても、検出するように実施してもよい。本例では、音場全体を左入力チャンネルで生成している。音場全体が単一の入力チャンネルに含まれているので、この例において用いた「左」という語は方向的な意味を持たず、単に説明のために用いただけである。単一入力チャンネルおよび単一サウンドイベント型用サウンドイベント検出器1900は、周波数バイアスフィルタ2001と、単一入力チャンネル用順応回路2002と、単一入力チャンネル用トリガ生成回路2004とを含む。一般的に、単一入力チャンネル用順応回路2002は、音場を用いて、検出しようとするサウンドイベント型について左入力チャンネルでの差分信号「Lo」を生成し、単一入力チャンネル用トリガ生成回路2004は、順応信号Loを用いて、検出しようとするサウンドイベントが検出される度に、それを示すトリガ信号「Tl」を生成する。
周波数バイアスフィルタ2001は、約500Hz〜約4000Hzの音場における周波数を強めることによって、人間の聴覚機構の周波数バイアスをモデル化する。単一入力チャンネル用順応回路1702は、順応性をモデル化することによって、サウンドイベントを音場の背景信号から分離する。この回路2102を図21により詳細に示す。この回路は、一般的に、乗算器2102と、低域通過フィルタ2104と、順応信号回路2006とを含む。乗算器2002は、左入力チャンネルで生成された音場(「入力信号」)を電力信号「Lin」に変換する。入力信号は、一般的に電圧信号であり、一般的に、入力信号を二乗することによって電力信号に変換できる。結果生じた電力信号Linは、多くの変動を有しており、変動の中には、サウンドイベントを示すものもあり、雑音を示すものもある。そして、雑音による変動を減少させるためには、低域通過フィルタが、電力信号Lから約30ms早い立ち上がり時間の変動を除去して、フィルタ後の電力信号Lを生成する。この低域通過フィルタ2104は、どのようなものでもよく、例えば12dB/オクターブのロールオフのフィルタであってもよい。
フィルタ後の電力信号Lから、順応信号回路2106は順応信号(音場そのままの長期平均電力を表す)を生成して差し引き、差分信号Loを生成する。順応回路2106は、一般的に、演算増幅器2108と、抵抗器2114と、ダイオード2112と、コンデンサ2110とを含む。フィルタ後の電力信号Lは、演算増幅器2108の正端子に入力するか、または代わりに、2つの信号の差を決定可能な装置に入力する。フィルタ後の電力信号Lがサウンドイベントを含まない場合、コンデンサ2110が開路となり、フィルタ後の電力信号Lとほぼ同一の順応信号
Figure 0004744874
が生じ、ほぼゼロに等しい差分信号Loを生成する。
しかしながら、フィルタ後の電力信号Lがサウンドイベントを含む場合でも、フィルタ後の電力信号Lは、サウンドイベントの立ち上がり時間に従って、急速に上昇する。このLの急速な上昇により、差分信号Lo内に対応するスパイクが生じる。サウンドイベントの立ち上がり時間の後に、コンデンサ2110が帯電して、それにより、抵抗器2114およびコンデンサ2110によって規定された時定数に従って、順応信号
Figure 0004744874
が徐々に上昇する。この時定数は、一般的に、人間の聴覚機構の順応速度に等しいように作成され、約300msに実験的に決定される。
Figure 0004744874
は、コンデンサ21110の電圧(したがって、
Figure 0004744874
)がLと等しくなるか、またはサウンドイベントの減衰が終了または開始するまで、上昇し続ける。この上昇する
Figure 0004744874
をLから差し引くと、人間の聴覚機構の順応特性をモデル化するLo内の段階的な減衰となる。サウンドイベントが減衰すると、電力エンベロープLは、サウンドイベントのたち下がり時間に従って、急速に降下する。L
Figure 0004744874
の値に近づくにつれて、コンデンサ2110はダイオード2112を介して放電して、順応信号
Figure 0004744874
がフィルタ後の電力信号Lを超えないようにする。これにより、サウンドイベントの終了時に、Loに負のパルスを生成しないようにする。
差分信号Loは、したがって、検出しようとするサウンドイベント型に特徴的な上昇時間以下の上昇時間と、順応信号によって規定される下降時間とを有する一連の変動および/またはサウンドイベントの終了を含む。そして、単一入力チャンネル用トリガ生成回路1904(図19に示す)は、サウンドイベントを検出して、サウンドイベントが検出される度にパルスを含むトリガ信号Tl‘を生成する。単一入力チャンネル用トリガ生成回路1904は、図22により詳細に示されており、高域通過フィルタ2202と、正規化回路2206と、低域通過フィルタ2208とを含む。
トリガ生成回路1904の目的は、雑音によって生じた変動をできるだけ多く除去して、除去しなかったものを弱めることにある。サウンドイベント検出方法に関連して上述したように、これは、検出しようとするサウンドに特徴的な周波数よりも高い周波数を有する変動を除去して、差分信号の短期高周波電力で差分信号Loを正規化することによって達成される。正規化は、高域通過フィルタ2202と、正規化回路2206とを有する自動利得制御回路を用いて達成される。高域通過フィルタは、コンデンサ/抵抗器の対を含み、この対は、カットオフ周波数を、検出しようとするサウンドイベントに特徴的なものとして定義する。さらに、整流器(図示せず)を高域通過フィルタ2202および正規化回路2206の間に含めて、負のパルスまたは変動を整流化してもよい。積分器2210と、除算器2212とを含む正規化回路2206は、その後、Loの高周波成分を、積分器2210によって規定される短期間に渡って平均化する。積分器によって規定される短期間は、約160msに等しくてもよいが、この期間は、音場の種類の関数として調整されてもよい。除算器2212は、その後、平均化されたHFlでLoを除して、正規化された差分信号Nlを発生させる。さらに、整流器(図示せず)を正規化回路2206および低域通過フィルタ2208の間に含めて、負のパルスまたは変動を整流化してもよい。
正規化された差分信号Nlは、その後、低域通過フィルタ2208によってフィルタリングされて、検出しようとするサウンドイベントに特徴的な変動より高い周波数の変動を除去して、フィルタ後かつ正規化された差分信号Nl’を生じさせる。図示していないが、検出しようとするサウンドイベントに特徴的な変動より高い頻度の変動を検出および除去する回路であって少なくとも10dBの音場の減少が検出されたときに生じる変動を除去する回路を含ませることによって、Nl’からさらに雑音を除去できる。したがって、Nl’は、サウンドイベントの発生および雑音による変動を表す様々な振幅の一連のパルスを含む。
フィルタ後かつ正規化された差分信号Nl’にある雑音からサウンドイベントを検出するためには、閾値検出器2218が、閾値より大きな振幅を有するパルスのみを検出する。これは、サウンドイベントを示すパルスを雑音による変動と区別する助けとなる。閾値検出器の出力は、音場の単独の(左)入力チャンネルにおけるサウンドイベントの発生を一般的にパルスによって示す、トリガ信号「Tl」である。代わりに、単一入力チャンネルおよび単一サウンドイベント型用サウンドイベント検出器は、閾値調整回路を含んでもよい。閾値調整回路は、サウンドイベント検出器の感度を調節するために、閾値検出器の閾値を調整する。閾値検出器は、閾値を調節することもできるし、トリガ生成回路内の閾値検出器に接続された電圧源および可変抵抗器を含んでもよい。抵抗器の抵抗は、つまみ、スイッチ、または電圧源によって供給された電圧を閾値検出器に対して制御する装置であって、閾値検出器が閾値を定義するのに用いる装置によって、手動で制御されてもよい。代わりに、閾値検出器は、閾値の自動調節を提供し、かつ、トリガ生成回路の出力に接続されたカウンタと、カウンタおよびトリガ生成回路内の閾値検出器に接続された比較器とを含む。カウンタは、特定の期間に発生したサウンドイベントの数をカウントして、この数を比較器に伝達する。この特定の期間は、一般的には、約数秒程度である。その後、比較器は、サウンドイベントの数と反比例する電圧を生じさせ、この電圧を閾値検出器に伝達する。閾値検出器は、この電圧を用いて閾値を規定する。一般的に、サウンド検出器の感度がよくなるように、サウンドイベントの数が多い場合には、閾値を増加させる。
いずれのサウンドイベント検出器も、衝撃音などの短期サウンドイベントの検出に特化して利用される順応信号回路を含まなくてもよい。順応信号回路を含まないサウンドイベント検出器の一例を図23に示す。この短期サウンドイベント用サウンドイベント検出器2300は、周波数バイアスフィルタ2301と、リニア―dB変換器2302と、高域通過フィルタ2303と、単一チャンネル対用トリガ生成回路2304とを含む。周波数バイアスフィルタ2301は、入力信号の周波数を約500Hzから約4000Hzへ強めて、フィルタ後の入力信号を生成する。フィルタ後の入力信号は、その後、リニア―dB変換器2302によってデシベルに変換されて、デシベルフィルタ後の入力信号を発生させる。フィルタ後のデシベル入力信号は、今度は高域通過フィルタ2303によって再びフィルタリングされる。高域通過フィルタ2303は、検出しようとする短期サウンドイベントに特徴的な変動よりも遅い立ち上がり時間の変動を除去する。単一入力チャンネル対用トリガ生成回路2304は、この2回フィルタリングされたデシベル入力信号を用いて、短期サウンドイベントの発生を示すトリガ信号を生じさせる。代わりに、短期サウンドイベント用サウンドイベント検出器は、閾値調整回路を含んでもよい。
サウンドイベント検出器は、音場が2つ以上の入力チャンネルで生成される場合も実施されてもよい。2つの入力チャンネルで生成された音場から単一のサウンドイベント型を検出するサウンドイベント検出器(「複数入力チャンネルおよび単一サウンドイベント型用サウンドイベント検出器」)は、単一チャンネルおよびのためのサウンドイベント検出器と、入力チャンネル毎にトリガ信号を生成する各入力チャンネルの単一の入力チャンネル対を含む。代わりに、トリガ信号は合成されて、任意の入力チャンネルにおけるサウンドイベントの発生を示す単一のトリガチャンネルをを形成してもよい。代わりに、複数入力チャンネルおよび単一サウンドイベント型用サウンドイベント検出器は、複数のチャンネル対毎に差分信号からトリガ信号だけを生成するようにしてもよい。そのような複数入力チャンネルおよび単一サウンドイベント型用サウンドイベント検出器を、図24に示す。この例では、音場全体が、左入力チャンネルおよび右入力チャンネルを含む単一の入力チャンネル対を介して生成される。しかしながら、この方法は、入力チャンネルまたは入力チャンネル対の数がいくらであっても、適用可能である。
複数入力チャンネルおよび単一サウンドイベント型用サウンドイベント検出器2400は、単一入力チャンネル用第1の順応回路2402と、単一入力チャンネル用第2の順応回路2404と、単一入力チャンネル対用交互トリガ生成回路2406とを含む。第1および第2の順応回路2402、2404は、それぞれ、一般的に同一である。第1の順応回路2402は、左入力チャンネル信号(「Lin」)を用いて、左入力チャンネル用の差分信号を生成する(「左差分信号」または「Lo])。第2の順応回路2404は、右入力チャンネル信号(「Rin」)を用いて、右入力チャンネル用の差分信号を生成する(「右差分信号」または「Ro])。
単一入力チャンネル対用交互トリガ生成回路2406は、左右の差分信号両方を用いて、いずれかの入力チャンネルでサウンドイベントが発生していることを示すトリガ信号を生成する(「左右トリガ信号」または「Trl」」。単一入力チャンネル対用トリガ生成回路2406は図25により詳細に示されており、演算増幅器2501と、整流化された高域通過フィルタ2502と、整流化された正規化回路2506と、低域通過フィルタ2508と閾値検出器2510とを含む。(図22に示すような)単一入力チャンネル対用トリガ生成回路と同様であるものの、単一入力チャンネル対用トリガ生成回路2406は、左と右の差分信号(「左右差分信号」または「Lo‐Ro」)間の差分に等しい信号を生成する演算増幅器2501(または差分を決定することができる他の装置)をも含み、左右差分信号を用いて左右入力チャンネル対のためのトリガ信号(「左右トリガ信号」または「Tlr」)を生成する。この例では、左右差分信号は、RoをLoから差し引くことによって取得しているが、代わりに、LoをRoから差し引くことによって決定してもよい。左右差分信号Lo‐Roは、入力チャンネル対のいずれかの入力チャンネルにおけるサウンドイベントおよび雑音の発生を示した一連のパルスおよび他の変動を含む。しかしながら、両方の入力チャンネルで等しく生じるサウンドイベントは除去されるので、雑音による多くの変動は除去される。差分信号におけるパルスおよび変動は、左入力チャンネルまたは右入力チャンネルでの一過性現象の電力が大きいかどうかによって、正または負の振幅を有してもよい。
正のパルスのみを含むトリガ信号を生成するためには、第1の整流器2504を整流化された高域通過フィルタ2502に含め、第2の整流器を正規化回路2506に含める。整流化された高域通過フィルタ2502は、整流化された高域左右差分信号(「HFlr」)を生成する。この整流化された高域左右差分信号は、差分信号Lo‐Roを正規化するために正規化回路2506によって用いられ、その結果は、第2の整流器2507によって整流化されて、正規化された左右信号(「Nlr」)を生じさせる。低域通過フィルタ2508は、雑音による変動を、検出しようとするサウンドイベントに特徴的な立ち上がり時間よりも早い立ち上がり時間で除去して、フィルタ後の正規化された左右信号(「Nlr’」)を生成する。単一入力チャンネル用トリガ生成回路と同様に、検出しようとするサウンドイベントに特徴的な頻度よりも高い頻度で発生する変動を検出および除去する回路であって、かつ音場の少なくとも10dBの降下が検出されるときに生じる変動を除去する回路を含めることによって、Nlr’からさらに雑音(図示せず)を除去することができる。Nlr’は、したがって、残存雑音によるサウンドイベントおよび変動の発生を表す様々な振幅を有する一連のパルスを含む。閾値検出器2510は、その後、サウンドイベントを閾値より大きい振幅を有するパルスとして検出し、左右トリガ信号Tlrを生成する。このサウンドイベント検出器を、複数入力チャンネル対用に並行して繰り返して、入力チャンネル対毎のトリガ信号を生成してもよい。代わりに、この複数入力チャンネルおよび単一サウンドイベント用サウンドイベント検出器は、トリガ生成回路毎に閾値調整回路を含んでもよい。この交互トリガ生成回路を含む複数入力チャンネルおよび単一サウンドイベント用サウンドイベント検出器は、「単一入力チャンネル対および単一サウンドイベント型用サウンドイベント検出器」と称してもよい。さらに、複数入力チャンネル(または単一入力チャンネル対)および単一サウンドイベント用サウンドイベント検出器は、トリガ生成回路毎に閾値調整回路を含んでもよい。
また、サウンドイベント検出器は、1つ以上のサウンドイベントの型を検出するように実施されてもよい。この「単一入力チャンネルおよび複数サウンドイベント型用サウンドイベント検出器」は、一般的に、検出しようとするサウンドイベント型毎に並行に実施された単一入力チャンネルおよび単一サウンドイベント型用サウンドイベント検出器を含み、検出しようとするサウンドイベント型毎にトリガ信号を生成する。このような単一入力チャンネルおよび複数サウンドイベント型用サウンドイベント検出器の一例を図26の参照符号2600で示す。本例では、音場全体を左入力チャンネルで生成している。音場全体が単一の入力チャンネルに含まれているので、この例において用いたような「左」という語は方向的な意味を持たず、実際、入力チャンネルはどのような方向であってもよい。また、本例では、単一入力チャンネルおよび複数サウンドイベント型用サウンドイベント検出器2600は、音節および衝撃音を検出するように実施されている。しかしながら、サウンドイベントの数または組み合わせはどのようなものであっても検出されてもよい。
本例では、単一入力チャンネルおよび複数サウンドイベント型用サウンドイベント検出器2600は、一般的に、単一入力チャンネル用順応回路2602と、音節用に実施された単一入力チャンネル用トリガ生成回路2604と、衝撃音用に実施された単一入力チャンネルおよび単一短期サウンドイベント用サウンドイベント検出器2606とを含む。単一入力チャンネル用順応回路2602は、入力信号Linを用いて、差分信号を生成する。音節を検出するために実施された単一入力チャンネル用トリガ生成回路2604は、差分信号を用いて、音場の単独の入力チャンネル(左)における音節の発生を示すトリガ信号(「Tl(s)」)を生成する。音節を検出するために実施された単一入力チャンネル用トリガ生成回路2604は、フィルタ(図22参照)を含み、そのカットオフ周波数立ち上がり時間は約33msである。衝撃音を検出するために実施された単一入力チャンネル用トリガ生成回路2606は、入力信号Linを用いて、音場の単独の入力チャンネル(左)における衝撃音の発生を示すトリガ信号(「Tl(i)」)を生成する。衝撃音を検出するために実施された単一入力チャンネル用トリガ生成回路2606は、高域通過フィルタ(図22の2303参照)を含み、そのカットオフ周波数立ち上がり時間は約3msである。代わりに、複数入力チャンネルおよび単一サウンドイベント用サウンドイベント検出器は、トリガ生成回路毎に閾値調整回路を含んでもよい。
また、サウンドイベント検出器は、1つ以上のサウンドイベントの型を1つ以上の入力チャンネルから検出するように実施されてもよい。この「複数入力チャンネルおよび複数サウンドイベント型用サウンドイベント検出器」は、各入力チャンネル対におけるサウンドイベント型毎にトリガ信号を生成してもよい。代わりに、各チャンネル対におけるトリガ信号を、どのような方法を用いてもほぼ構わないが合成して、トリガ信号の数を減らしてもよい。そのような複数入力チャンネルおよび複数サウンドイベント型用サウンドイベント検出器の一例を図27の参照符号2700で示す。本例では、音場全体は左および右入力チャンネルで検出または再生のいずれかが行われている。しかしながら、本方法は、入力チャンネルの数および組み合わせがどのようなものであっても実施してよい。さらに、本例では、複数入力チャンネルおよび複数サウンドイベント型用サウンドイベント検出器は、音節および衝撃音を検出するように実施されている。しかしながら、サウンドイベントの数または組み合わせはどのようなものであっても検出されてもよい。
複数入力チャンネルおよび複数サウンドイベント型用サウンドイベント検出器2700は、一般的に、信号入力チャンネル用第1の順応回路2702と、信号入力チャンネル用第2の順応回路2706と、単一チャンネルおよび短期サウンドイベント用第1のサウンドイベント検出器2708と、単一入力チャンネル対用交互トリガ生成回路2710と、単一チャンネルおよび短期サウンドイベント用第2のサウンドイベント検出器2712とを含む。
単一チャンネル用第1および第2の順応回路2702および2703は、それぞれ同一である。単一チャンネル用第1の順応回路2702は、左入力チャンネルLoについての差分信号を生成する。単一チャンネル用第2の順応回路2703は、右入力チャンネルRoについての差分信号を生成する。単一入力チャンネル対用交互トリガ生成回路2718は、LoおよびRoを用いて、左右チャンネル対における恩瀬うの発生を示すトリガ信号Tlr(s)を生成する。単一入力チャンネル対用交互トリガ生成回路2718(より詳細は、図25の参照符号2406で示す)は、フィルタを含み、そのカットオフ立ち上がり時間は約33msに規定されている。単一チャンネルおよび単一短期サウンドイベント用第1および第2のサウンドイベント検出器2708および2712は、それぞれ、LinおよびRinを用いて、左と右の入力チャンネルにおける衝撃音の発生を示すトリガ信号を生成する。これらのトリガ信号を合成して、左右入力信号対におけるトリガ信号の発生を示す単一のトリガ信号を生成してもよい。単一チャンネルおよび単一短期サウンドイベント用第1および第2のサウンドイベント検出器2708および2712は、それぞれ、高域通過フィルタ(図23の2303を参照)を含み、そのカットオフ立ち上がり時間は約3msに規定されている。
代わりに、複数入力チャンネルおよび複数サウンドイベント型用サウンドイベント検出器は、各入力チャンネルにおいてサウンドイベント型毎に並行して実施された単一入力チャンネルおよび単一サウンドイベント用サウンドイベント検出器を含んでもよい。このサウンドイベント検出器は、各入力チャンネルにおいてサウンドイベント型毎のトリガ信号を生成する。代わりに、複数入力チャンネルおよび複数サウンドイベント型用サウンドイベント検出器は、入力チャンネル毎に並行して実施された単一入力チャンネルおよび複数サウンドイベント用サウンドイベント検出器を含んでもよい。この複数入力チャンネルおよび複数サウンドイベント用サウンドイベント検出器も、各入力チャンネルにおいてサウンドイベント型毎のトリガ信号を生成する。代わりに、任意の複数入力チャンネルおよび複数サウンドイベント用サウンドイベント検出器は、トリガ生成回路毎に閾値調整回路を含んでもよい。
(7.サウンドイベント検出器および特定器)
人間の聴覚機構特性をモデル化して、背景信号がある状態でサウンドイベントを検出および特定する電子回路を考案した(「サウンドイベント検出器および特定器」と総称する)。サウンドイベント検出器および特定器は、サウンドイベント検出および特定方法と同様に、1つ以上の入力チャンネルついに関するサウンドイベントの、差分指向角または通常指向角で表す方向を決定し、場合によっては、指向角の正確性を検証する。また、サウンドイベント検出および特定方法と同様に、サウンドイベント検出器および特定器は、入力チャンネルの数がいくつであっても、そこで生成される音場におけるサウンドイベント型の数および組み合わせがどのようなものであっても、それを検出するように実施可能である。以下の説明では、複雑でないものから順にサウンドイベント検出器および特定器を説明し、各サウンド検出器および特定器は、特に示さない限り、それに先立って説明したサウンドイベント検出器および特定器の構成要素を含むものとする。
単一の入力チャンネル対から単一のサウンドイベント型を検出するように実施されたサウンドイベント検出器および特定器の一例を図28に示す(「単一入力チャンネル対および単一サウンドイベント型用サウンドイベント検出器および特定器」)。本例では、右入力チャンネルおよび左入力チャンネルに関して、サウンドイベントを検出および特定する。しかしながら、この方法は、入力チャンネルのどのような組み合わせにでも適用可能であり、ここで左と右を用いたのは説明のためだけである。図28に示す単一入力チャンネル対および単一サウンドイベント型用サウンドイベント検出器および特定器2800は、一般的に、単一入力チャンネル対および単一サウンドイベント型用サウンドイベント検出器2804と、単一入力チャンネル対および単一サウンドイベント型用サウンドイベント特定器2806とを含む。
単一入力チャンネル対および単一サウンドイベント型用サウンドイベント検出器2804は、任意の複数入力チャンネル対および単一サウンドイベント用サウンドイベント検出器を含み、これは、単一の入力チャンネル対用のトリガ生成回路を含み、どのようなサウンドイベントを検出することもできるように実施されている。単一入力チャンネル対および単一サウンドイベント型用サウンドイベント検出器2804は、左入力チャンネルLinおよび右入力チャンネルRinを用いて、左入力チャンネル用差分信号Loと、右入力チャンネル用差分信号Roと、どのようなサウンドイベントを検出するのであっても、いずれかの入力チャンネルにおいてサウンドイベントが発生していること示すトリガ信号とを生成する。その後、単一入力チャンネル対および単一サウンドイベント型用サウンドイベント特定器2806は、Lo,Ro,およびTlrを用いて、左右の入力チャンネルについて検出されたサウンドイベントの方向を示す真の差分指向角を生成する。
単一入力チャンネル対および単一サウンドイベント型用サウンドイベント特定回路2806を図29に詳細に示し、この回路は、一般的に、DSA回路2904と、スイッチ2518と、抵抗器2906と、コンデンサ2908と、制御回路2910とを含む。DSA回路2904は、左順応信号Loおよび右順応信号Roを用いて、差分指向角dlrを決定する。DSA回路2904は、第1のリニア‐デシベル回路2912と、第2のリニア‐デシベル回路2914と、演算増幅器2916と、デシベル‐等価角回路2918トを含む。第1および第2のリニア‐デシベル回路2912および2914は、それぞれ、左と右の順応信号を電力信号からデシベル信号へ変換する。演算増幅器2916(または差分を決定できる任意の回路)は、左右のデシベル信号間の比率を、これら2つの信号の差を決定することによって決定する。そして、この比率は、デシベル‐等価角回路2918によって等価角に変換され、差分指向角dlrを生じさせる。
一般的に、制御回路2910、スイッチ2906、およびコンデンサ2908がサンプルホールド回路を形成し、したがって、同様の機能を行う任意の装置または回路によって置き換えることができる。一般的に、サウンドイベントが検出されると、制御回路2910は、スイッチ2906を閉じて、サウンドイベントの立ち上がり時間の間にコンデンサ2908にdlrを取り込ませて、サウンドイベント型の典型的な持続期間に真のDSA(「dlr’」)を生成する。より特定的には、制御回路2910は、トリガ信号Tlを受信して、スイッチ2906を制御する制御信号「con」を生成する。スイッチ2906は、2点スイッチであり、サウンドイベントが検出されない場合には、一般的に位置Cにある。位置Aのとき、スイッチ2906は閉じており、位置Bのとき、スイッチは開いており、位置Cのとき、スイッチ2906は接地している。サウンドイベントが生じている旨の指示をトリガ信号Tlrから受信すると、制御回路2910は、スイッチ2906に対する閉じる(位置Aへの移動)コマンドを「con」によって伝達する。応答して、スイッチ2906は閉じる。検出しようとするサウンドイベント型に典型的な立ち上がり時間の終了時に、制御回路2910は、スイッチ2906に対する開く(位置Bへの移動)コマンドをconによって伝達する。検出しようとするサウンドイベント型に典型的な立ち上がり時間の後で、制御回路2910は、スイッチ2906に対する接地(位置Cへの移動)コマンドを「con」によって伝達する。スイッチ2906が閉じている間(サウンドイベントの立ち上がり時間中)、左右差分指向角dlrはコンデンサ2908に取り込まれ、真のDSAdlr’を生じさせる。真のDSAは、サウンドイベントが実際に終了していなくても、サウンドイベントの典型的な持続期間の終了まで保持される。例えば、検出しようとするサウンドイベントが音節の場合、真のDSAは約50msから約200msの間、好ましくは約150ms後まで保持される。他の例では、検出しようとするサウンドイベントが衝撃音の場合、真のDSAは約50ms保持される。サウンドイベント型の典型的な持続期間の終了時点では、コンデンサはスイッチのCで接地されており、コンデンサ2908に保持された電圧、つまりdlr’はゼロとなる。コンデンサ2908は、検出しようとするサウンドイベントの立ち上がり時間中にdlrを十分に取り込むことができるように選ばれる。例えば、検出しようとするサウンドイベントが音節の場合、コンデンサは、dlrを20ms〜約30msで取り込むことができなくてはならない。他の例では、検出しようとするサウンドイベントが衝撃音の場合、コンデンサは、dlrを約5msで取り込むことができなくてはならない。
代わりに、単一入力チャンネル対および単一サウンドイベント型用サウンドイベント検出および特定回路を、衝撃音のような非常に短い期間のサウンドイベント用に最適化する。場合によっては、短期サウンドイベント用の正確なDSAを得るのは非常に困難なので、所定の期間(一般的には、約3ms)に生じるすべての短期サウンドイベントの方向の平均を、当該期間のすべての短期サウンドイベントの方向として用いるのが得策である。したがって、最適化された単一入力チャンネル対および単一サウンドイベント型用サウンドイベント検出および特定回路は、約3msという時間枠で検出されるすべてのサウンドイベントの平均DSAを決定するための回路をさらに含む。DSA平均回路は、一般的に、DSA回路2804およびスイッチ2906の間のサウンドイベント特定回路2806によって実施される。
また、サウンドイベント検出器および特定器は、複数の入力チャンネル対において生成される音場における単一のサウンドイベント型を検出するように実施されてもよい(「複数入力チャンネル対および単一サウンドイベント型用サウンドイベント検出器および特定器」)。左右入力チャンネル対(「LR入力チャンネル対」)の両方および中央‐サラウンド入力チャンネル対(「CS入力チャンネル対」)において単一のサウンドイベントを検出および特定するように実施された複数入力チャンネル対および単一サウンドイベント型用サウンドイベント検出器および特定器を図30の参照番号3000に示す。この検出器および特定器は、入力チャンネル対の土嚢様な組み合わせに対しても実施可能で、LR入力チャンネル対およびCS入力チャンネル対は一例としてのみ用いたものである。複数入力チャンネル対および単一サウンドイベント型用サウンドイベント検出器および特定器3000は、LR入力チャンネル対(dlr’)およびCS入力チャンネル対(dcs’)についての真の差分指向角を生成し、一般的には、単一入力チャンネル対および単一サウンドイベント用第1および第2のサウンドイベント検出器3010および3012と、複数入力チャンネル対および単一サウンドイベント型用サウンドイベント特定回路3014とを含む。
単一入力チャンネル対および単一サウンドイベント型用第1および第2のサウンドイベント検出器3010および3012は、両方とも、同じサウンドイベントを検出するように実施される。複数入力チャンネル用第1のサウンドイベント検出器3010は、左右の入力チャンネルの入力信号LinおよびRinを用いて、左差分信号Lo,右差分信号Ro,左電力エンベロープL,右電力エンベロープR、および左右トリガ信号Tlrを生成する。同様に、複数入力チャンネル用第2のサウンドイベント検出器3012は、中央とサラウンドの入力チャンネルの入力信号CinおよびRinを用いて、中央差分信号Co,サラウンド差分信号So,中央電力エンベロープC,サラウンド電力エンベロープS、および中央‐サラウンドトリガ信号Tcsを生成する。
複数入力チャンネル対および単一サウンドイベント型用サウンドイベント特定回路3014は、左差分信号Lo,右差分信号Ro,および左右トリガ信号Tlrを用いて、検出されたサウンドイベントの方向を示す角度であって、左右入力対についての真のOSAまたは真のDSAのいずれかに等しい角度(「左右サウンドイベント角度」または「d/lr’」)を生成し、中央差分信号Co,サラウンド差分信号So,および中央‐サラウンドトリガ信号Tcsを用いて、検出されたサウンドイベントの方向を示す角度であって、中央‐サラウンド入力対についての真のOSAまたは真のDSAのいずれかに等しい角度(「中央‐サラウンドサウンドイベント角度」または「d/cs’」)を生成する。さらに、回路3014は、すべての電力エンベロープdlr、dcsを用いて、DSAの正確性を検証する。複数入力チャンネル対および単一サウンドイベント型用サウンドイベント特定回路2614の詳細は図31に示されており、一般的に、第1のOSA回路3102と、第1のDSA回路3104と、第2のDSA回路3106と、第2のOSA回路3108と、検証回路3116と、制御回路3118と、第1の2点スイッチ3110と、第1の3点スイッチ3112と、第1のコンデンサ3114と、第2の2点スイッチ3120と、第2の3点スイッチ3122と、第2のコンデンサ3124とを含む。
d/lr’は、第1のOSA回路3102と、第1のDSA回路3104と、第1の2点スイッチ3110と、第1の3点スイッチ3112と、第1のコンデンサ3114とによって生成される。同様に、d/cs’は、第2のOSA回路3108と、第2のDSA回路3106と、第2の2点スイッチ3120と、第2の3点スイッチ3122と、第2のコンデンサ3124とによって生成される。第1および第2のOSA回路3102および3108は、既知の方法を用いて、Lin,Rin,Cin,およびSinをそれぞれ通常指向角「lr」および「cs」に変換する。制御回路3118、第1の3方向スイッチ3112、および第1のコンデンサ3114は第1のサンプルホールド回路を形成し、制御回路3118、第2の3方向スイッチ3122、および第2のコンデンサ3124は第2のサンプルホールド回路を形成する。第1および第2の3方向スイッチ3112および3122は、それぞれ、通常、サウンドイベントが検出されていない場合には位置Cにあり、サウンドイベントが検出された場合には各スイッチは閉じられ(位置Aへ移動)、検出しようとするサウンドイベント型の典型的な立ち上がり時間の終了時には開けられ(位置Bへ移動)、検出しようとするサウンドイベント型の典型的な持続期間終了時には接地(位置Cへ移動)するように、制御回路によって制御される。制御回路3118は、3方向スイッチ3112および3122へ伝達される制御信号「con」を生成する。制御信号は、サウンドイベントが入力チャンネル対のいずれかで検出されていることをトリガ信号(TlrまたはTcs)が示す度に、3方向スイッチ3112および3122を位置Aに移動する(またはそこに留まらせる)ようにする。その後、conは、サウンドイベントの立ち上がり時間の典型的な持続期間の終了時に、3方向スイッチ3112および3122を位置Bに移動させる。その後、conは、検出しようとするサウンドイベント型の典型的な持続期間の終了時に、3方向スイッチ3112および3122を位置Cに移動させる
2方向スイッチ3110および3120は、ともに、位置DおよびEを含む。サウンドイベントが検出されて、両方の2方向スイッチ3110および3120が位置Dにあるときは、チャンネル対毎のDSAを用いて、サウンドイベントの方向を示す。しかしながら、サウンドイベントが検出されて、両方の2方向スイッチ3110および3120が位置Eにあるときは、チャンネル対毎のOSAを用いて、サウンドイベントの方向を示す。検証回路3116は、サウンドイベント検出時にDSAが正確かどうかに従って、両方の2方向スイッチ3110および3120を検証信号「vs」によって制御する。トリガ信号(TlrまたはTcs)のいずれかがサウンドイベントの検出を示す場合には、検証回路は、電力エンベロープ(L,R,C,S)のうち少なくとも2つが少なくとも3dB以上降下したと決定する。少なくとも2つの電力エンベロープが前回のサウンドイベントから少なくとも3dB以上降下した場合には、検証回路は、両方の2方向スイッチ3110および3120に対してvsによって通信を行い、位置Eに移動または留まらせるようにする。しかしながら、少なくとも2つの電力エンベロープが少なくとも3dB以上降下していない場合には、検証回路は、両方の2方向スイッチ3110および3120に対してvsによって通信を行い、位置Dに移動または留まらせるようにする。
代わりに、サウンドイベント特定回路の検証回路3116は、整合性チェックを行うための回路(「整合性チェック回路」)を含む。整合性チェック回路は、両方のDSA回路に接続され、それぞれが生成した差分指向角を用いて、差分指向角の正確性をさらに決定する。整合性チェック回路は、任意のトリガ信号がサウンドイベントの検出を示すときにdlrおよびdcsの絶対値の和を決定するための既知の回路を用いて、その和が45度以下かどうかを決定する。和が45度以下である場合は、電力エンベロープの少なくとも2つが約3db以上降下しておらず、検証信号が両方の2方向スイッチ3110および3120に対して伝送されて、位置Dに移動させる。
さらに、順応度を調整するために、さらに回路を付加してもよく(「順応調整回路」)、整合性チェックの関数としての閾値を調整するために、さらに回路を付加してもよい(「エラー閾値回路」)。順応調整回路およびエラー閾値回路(図示せず)は、ともに整合性チェック回路に接続され、約数秒という期間に整合性チェックによって検出されたエラーの数をカウントするカウンタを含む。また、順応調整回路は、DSA回路3104および3102に含まれる一過性現象検出回路に順応信号を入力し、カウンタによってカウントされたエラーの数に従って調整される電圧源をさらに含む。エラーの数が多ければ、順応電圧源によって生じる電圧は上昇して、順応度を減少させる。対照的に、エラー閾値回路は、トリガ生成回路内の閾値検出部に接続され、カウンタによってカウントされたエラーの数に従って調整されるエラー電圧源をさらに含む。エラーの数が多ければ、エラー電圧源によって生じる電圧は上昇して、サウンドイベントが少なく検出されるように閾値電圧を上昇させる。
また、サウンドイベント検出器および特定器は、単一の入力チャンネル対において生成される音場から複数のサウンドイベント型を検出するように実施されてもよい(「単一入力チャンネル対および複数サウンドイベント型用サウンドイベント検出器および特定器」)。単一入力チャンネル対および複数サウンドイベント型用サウンドイベント検出器および特定器は、一般的に、検出しようとするサウンドイベント型毎に並行して実施されて入力チャンネル対におけるサウンドイベント型毎に差分指向角を生成する、単一入力チャンネルおよび単一サウンドイベント型用サウンドイベント検出器および特定器を含む。代わりに、単一入力チャンネル対および複数サウンドイベント型用サウンドイベント検出器および特定器は、サウンドイベント型毎に実施された単一チャンネル対および単一サウンドイベント型用サウンドイベント検出器と、検出しようとするすべてのサウンドイベントの型の方向を示す差分指向角を生成する、単一チャンネル対用単一チャンネル対および単一サウンドイベント型用サウンドイベント特定器とを含んでもよい。そのような単一入力チャンネル対および複数サウンドイベント型用サウンドイベント検出器および特定器の一例を図32に示す。
図32では、単一入力チャンネル対および複数サウンドイベント型用サウンドイベント検出器および特定器は、チャンネル対および単一サウンドイベント型用サウンドイベント検出器3202と、単一チャンネル対および短期サウンドイベント型用サウンドイベント検出器3204と、単一チャンネル対および単一サウンドイベント型用サウンドイベント特定器3206とを含む。単一チャンネル対および単一サウンドイベント型用サウンドイベント検出器3202は、音節を検出して左差分信号Lo,右差分信号Ro、および音節の発生を示す左右トリガ信号「Tlr(s)」を生成するように実施された、図24に示す複数チャンネルおよび単一サウンドイベント型用サウンドイベント検出器を含んでもよい。単一チャンネル対および短期サウンドイベント型用サウンドイベント検出器3204は、衝撃音を検出して、衝撃音の発生を示す(左トリガ信号および右トリガ信号の組み合わせとしての)左右トリガ信号「Tlr(i)」を生成するように実施された、図23に示す単一チャンネル対および短期サウンドイベント型用サウンドイベント検出器を含んでもよい。単一チャンネル対および単一サウンドイベント型用サウンドイベント特定器3206は、トリガ信号のいずれか(Tlr(s)またはTlr(i))がサウンドイベントの発生を示す度に、音節または衝撃音の方向を示す左右差分指向角を生成するように実施された、図29に示す単一チャンネル対および複数サウンドイベント型用サウンドイベント特定器を含んでもよい。このようなサウンドイベント検出器および特定器は、左右入力チャンネル対における音節および衝撃音を検出および特定するように実施されているが、所望するサウンドイベント型を検出するように実施され、かつ単一チャンネル対用サウンドイベント検出器によって生成された任意のトリガ信号に応答する単一チャンネル対および単一サウンドイベント型用サウンドイベント特定回路を有する、単一チャンネル対用サウンドイベント検出器を付加することによって、どのチャンネル対においても、そこにおけるサウンドイベント型の数がいくつであっても検出できるように実施可能である。
また、サウンドイベント検出器および特定器は、複数の入力チャンネル対において生成された音場における複数のサウンドイベント型を検出するように実施されてもよい(「複数入力チャンネル対および複数サウンドイベント型用サウンドイベント検出器および特定器」)。左右チャンネル対および中央‐サラウンドチャンネル対の両方における音節および衝撃音を検出する複数入力チャンネル対および複数サウンドイベント型用サウンドイベント検出器および特定器を図33に示す。この複数入力チャンネル対および複数サウンドイベント型用サウンドイベント検出器および特定器3300は、単一チャンネル対および単一短期サウンドイベント用第1および第2のサウンドイベント検出器3302および3308と、単一チャンネル対および単一サウンドイベント用第1および第2のサウンドイベント検出器3304および3306と、複数チャンネル対および単一サウンドイベント型用サウンドイベント特定回路3310とを含む。
単一チャンネル対および単一サウンドイベント用第1のサウンドイベント検出器3304は、音節を検出して左差分信号Lo,右差分信号Ro、および音節の発生を示す左右トリガ信号「Tlr(s)」を生成するように実施された、図24に示す複数チャンネルおよび単一サウンドイベント型用サウンドイベント検出器を含んでもよい。同様に、単一チャンネル対および単一サウンドイベント用第2のサウンドイベント検出器3306は、音節を検出して中央差分信号Co,サラウンド差分信号So、および音節の発生を示す中央‐サラウンドトリガ信号「Tcs(s)」を生成するように実施された、図24に示す複数チャンネルおよび単一サウンドイベント型用サウンドイベント検出器を含んでもよい。単一チャンネル対および短期サウンドイベント用第1のサウンドイベント検出器3302は、衝撃音を検出して、衝撃音の発生を示す(左トリガ信号および右トリガ信号の組み合わせとしての)左右トリガ信号「Tlr(i)」を生成するように実施された、図23に示す単一チャンネル対および単一短期サウンドイベント用サウンドイベント検出器を含んでもよい。同様に、単一チャンネル対および短期サウンドイベント用第2のサウンドイベント検出器3308は、衝撃音を検出して、衝撃音の発生を示す(中央トリガ信号およびサラウンドトリガ信号の組み合わせとしての)中央‐サラウンドトリガ信号「Tcs(i)」を生成するように実施された、図23に示す単一チャンネル対および単一短期サウンドイベント用サウンドイベント検出器を含んでもよい。複数チャンネル対および単一サウンドイベント型用サウンドイベント特定回路3310は、任意のトリガ信号(Tlr(s),Tlr(i),Tcs(s),またはTcs(i))がサウンドイベントの発生を示す度に、検出された音節または衝撃音の方向を示す左右サウンドイベント角度「d/lr’(s,i)」と、、任意のトリガ信号(Tlr(s),Tlr(i),Tcs(s),またはTcs(i))がサウンドイベントの発生を示す度に、検出された音節または衝撃音の方向を示す中央‐サラウンドサウンドイベント角度「d/cs’(s,i)」とを生成するように実施された、図31に示す複数チャンネル対および単一サウンドイベント型用サウンドイベント特定回路を含んでもよい。このサウンドイベント検出器および特定器は、左右および中央‐サラウンド入力チャンネル対における音節および衝撃音を検出および特定するように実施されているが、所望するチャンネル対から所望するサウンドイベント型を検出するように実施され、かつ単一チャンネル対用サウンドイベント検出器によって生成された任意のトリガ信号に応答する複数チャンネル対および単一サウンドイベント型用サウンドイベント特定回路を有する、単一チャンネル対用サウンドイベント検出器を付加することによって、チャンネル対の数においても、そこにおけるサウンドイベント型の数がいくつであっても検出できるように実施可能である。
さらに、任意の複数入力チャンネル対および複数サウンドイベント型用サウンドイベント検出器および特定器は、順応調整回路および/またはエラー閾値回路をさらに含んでもよい。順応調整回路およびエラー閾値回路(図示せず)は、ともに整合性チェック回路に接続され、約数秒という期間に整合性チェックによって検出されたエラーの数をカウントするカウンタを含む。また、順応調整回路は、DSA回路に含まれる一過性現象検出回路に順応信号を入力する。また、エラー閾値回路も、トリガ生成回路内の閾値検出部に接続され、カウンタによってカウントされたエラーの数に従って調整されるエラー電圧源をさらに含む。エラーの数が多ければ、エラー電圧源によって生じる電圧は上昇して、サウンドイベントが少なく検出されるように閾値電圧を上昇させる。
(8.サラウンド検出器)
サウンドイベント検出器および特定器は、ステレオ/サラウンド検出器として応用できる。ステレオ/サラウンド検出器は、音場が2つの入力チャンネル再生用か2つ以上の入力チャンネル再生用かを決定する。単一のサウンドイベント型を検出するように実施されたステレオ/サラウンド検出器3400(「単一のサウンドイベント型ステレオ/サラウンド検出器」)の一例は図34に示されており、単一入力チャンネル対および単一サウンドイベント型用サウンドイベント検出器および特定器3402と、検出器およびカウンタ3404とを含む。単一入力チャンネル対および単一サウンドイベント型用サウンドイベント検出器および特定器3402は、中央入力チャンネルCinおよびサラウンド入力チャンネルSinにおける信号を用いて、どのようなサウンドイベントを検出しようとしていても、その方向を反映する真の差分指向角dcs’を生成する。その後、閾値検出器およびカウンタ3404は、回数dcs’が約0度〜約−45度の範囲内に入るかどうかを決定する。数値が所定の値を超える場合には、閾値検出器およびカウンタ3404は、音場をサラウンド再生すべきことを示す信号sursigを生成する。逆に、数値が所定の値を超えない場合には、検出器およびカウンタ3404は、音場をステレオ再生すべきことを示す信号sursigを生成する。一般的に、約10s〜約15s程度の比較的長い期間に検出されたサウンドイベントの数は、約2つまたは3つ程度であり、検出器およびカウンタ3404は、音場をサラウンド再生すべきことを示す信号sursigを生成する。さらに、検出器およびカウンタは、サウンドイベントの持続期間を決定して、所定の値を超える持続期間のものだけを、後部からの再生すべきサウンドイベントとしてカウントしてもよい。一例として、約50ms未満の持続期間のサウンドイベントは、後部からの再生すべきサウンドイベントとしてカウントしない。他の例として、約200ms〜約300msの持続期間のサウンドイベントは、後部からの再生すべきサウンドイベントとしてカウントする。
代わりに、単一サウンドイベント型を検出するように実施されたステレオ/サラウンド検出器を図35の参照番号3500で示す。図35の例では、ステレオ/サラウンド検出器3500は、後部での再生を意図した音節および衝撃機能の数をカウントするように実施されている。しかしながら、カウントするサウンドイベントの型やその組み合わせはどのようなものであって実施可能である。検出器3500は、単一入力チャンネル対および単一サウンドイベント型用第1および第2のサウンドイベント検出器および特定器3502および3504と、検出器およびカウンタ3506とを含む。単一入力チャンネル対用第1のサウンドイベント検出器および特定器3502は、中央入力チャンネルCinにおける信号と、サラウンド入力チャンネルSinにおける信号とを用いて、音節の方向を反映する真の差分指向角dcs’(s)を生成する。同様に、単一入力チャンネル対用第2のサウンドイベント検出器および特定器3504は、中央入力チャンネルCinにおける信号と、サラウンド入力チャンネルSinにおける信号とを用いて、衝撃音の方向を反映する真の差分指向角dcs’(i)を生成する。その後、検出器およびカウンタ3506は、回数dcs’(s,i)が約0度〜約−45度の範囲内に入るかどうかを決定して、音場をステレオ再生またはサラウンド再生すべきことを示す信号sursig(s,i)を生成する。
(9.サウンド特定器)
人間の聴覚機構特性をモデル化して、背景信号がある状態でサウンドイベントを特定する電子回路を考案した(「サウンド特定器」と総称する)。サウンド特定器は、音場においてサウンドイベントと非サウンドイベントとを個別に検出および特定して、音場の方向を継続的に示す。このようなサウンド特定器は、録音されたサウンドの再生など、様々な応用分野で利用でき、特に、サウンドが定常サウンドと同時に発生するサウンドイベントを含む複雑な音場の一部である場合に利用できる。音場がサラウンド再生すべきであるがステレオ形式で記憶されている場合、サウンド特定器をマトリックスデコーダの一部として用いて、2つの入力チャンネル混成からサウンドの真の方向を導出することができる。また、サウンド特定器は、入力チャンネルの数がいくつであっても、そこで生成された音場におけるサウンドイベント型の数および組み合わせがどのようなものであっても、検出するように実施できる。以下の説明では、複雑でないものから順にサウンド特定器を説明し、各サウンド特定器は、特に示さない限り、それに先立って説明したサウンド特定器の構成要素を含むものとする。
単一の入力チャンネル対における単一のサウンドイベント型を別個に特定するサウンド特定器(「単一入力チャンネル対および単一サウンドイベント型用サウンド特定器」)の一例を図36に示す。単一入力チャンネル対および単一サウンドイベント型用サウンド特定器3600は、単一チャンネル対および単一サウンドイベント型用サウンドイベント検出器3602と、単一チャンネル対および単一サウンドイベント型用サウンド特定回路3604とを含む。単一チャンネル対および単一サウンドイベント型用サウンドイベント検出器3602は、検出しようとするサウンドイベントがどのようなものであっても検出および生成して左右の差分信号LoおよびRo、およびトリガ信号Tlrを生成するように実施された、図24に示す複数チャンネルおよび単一サウンドイベント型用サウンドイベント検出器を含んでもよい。サウンド特定回路3604は、Tlr,Lo,Ro,ならびに左右の入力チャンネルにおける信号LinおよびRinを用いて、通常指向角および差分指向角で表される、左右入力チャンネル対に対する音場の方向を示す指向角を生成する(本願においては、一般的に「包括指向角」と称し、左右入力チャンネル対に対する包括指向角を「clr」と称する)。
単一チャンネル対および単一サウンドイベント型用サウンド特定回路3604の詳細を図37に示す。この回路は、通常指向角(OSA)回路3702と、DSA回路3704と、制御回路3706と、第1のスイッチ3708と、抵抗器3710と、第2のスイッチ3712と、コンデンサ3714とを含む。単一チャンネル対および単一サウンドイベント型用サウンドイベント特定回路3604は、左右の差分信号LoおよびRoと、左右の入力信号LinおよびRinを用いて、左右包括指向角clr’を生成する。一般的に、サウンドイベントが検出されない場合は、clr’はOSAに等しくかつ従い、サウンドイベントが検出されている場合には、いつもDSAに従う。OSA回路3702は、LinおよびRinを用いて、通常指向角Irを決定する。DSA回路3704は、差分信号LoおよびRoを用いて、差分指向角を生成する。一般的に、制御回路3706、第1のスイッチ3708、抵抗器3710、およびコンデンサ3714は、サンプルホールド回路を形成し、したがって、同様の機能を行う任意の装置または回路によって置き換えることができる。
一般的に、サウンドイベントが検出されない場合、第1のスイッチ3708は開き、第2のスイッチ3712は閉じる。この状態で、抵抗器3710およびコンデンサ3714によって規定された割合で、clr’はlrに従う。しかしながら、サウンドイベントが検出される場合、制御回路3706は、第1のスイッチ3708を閉じさせ、clr’が検出しようとするサウンドイベント型の典型的な持続期間における真のDSAと等しくなるように、コンデンサ3712に対して、検出しようとするサウンドイベントの典型的な立ち上がり時間の間にdlrを取り込むようにさせる。より特定的には、制御回路3716は、トリガ信号Tlrを受信して、第1のスイッチ3708および第2のスイッチ3712を制御する制御信号「con」を生成する。Tlrがサウンドイベントの発生を示す場合、制御回路3716は、第1のスイッチ3708に対して、第1のスイッチ3708を閉じさせる閉コマンドを「con」によって伝達する。検出しようとするサウンドイベントの典型的な立ち上がり時間の終了時に、制御回路3716は、第1および第2のスイッチ3708および3712に対して、第1および第2のスイッチ3708および3712を開く開コマンドをconによって伝達する。検出しようとするサウンドイベントの典型的な持続期間の後、制御回路3716は、第2のスイッチ3712に対して、conによって閉じるコマンドを伝達する。第1のスイッチ3708が閉じている間(サウンドイベントの立ち上がり時間)、左右差分指向角dlrがコンデンサ3714によって取り込まれ、真のDSAdlr’を作成する。Clr’は真のDSAによって規定され、たとえサウンドイベントが実際に終了していなくても、サウンドイベントの典型的な持続期間の終了まで保持される。例えば、検出しようとするサウンドイベントが音節の場合、真のDSAは約50msから約200msの間、好ましくは約150ms後まで保持される。他の例では、検出しようとするサウンドイベントが衝撃音の場合、真のDSAは約50ms保持される。サウンドイベント型の典型的な持続期間の終了時点では、コンデンサ3714は、特定の比率でlrを反映するまで、帯電または放電する。コンデンサ3714および抵抗器3710は、特定の減衰比を生じさせるRC時定数を規定するように選ばれる。例えば、RC時定数は、約300msに等しくなるようにする。
代わりに、サウンド特定回路は、短期サウンドイベント用に特化して実施することもできる。上述したように、衝撃音のような短期サウンドイベントがDSAに従って特定される場合、短期サウンドイベントの典型的な持続期間の終了時にサウンドイベントが実際に終了したかどうかを決定して、サウンドイベントが終了していれば即座にOSAに切り替えれば、都合がよいことが多い。この機能を含むサウンドイベント特定回路の一例(本願では、「単一入力チャンネル対および短期サウンドイベント用サウンドイベント特定回路」と称する)を図38に示す。単一入力チャンネル対および短期サウンドイベント用サウンドイベント特定回路3800は、OSA回路3802と、DSA回路3804と、制御回路3808と、検出器3810と、第1のスイッチ3812と、第1の抵抗器3814と、第3のスイッチ3813と、第2の抵抗器3815と、コンデンサ3815とを含む。このサウンド特定回路3800は、左右包括指向角clr’を生成する。サウンドイベントが検出されない場合、clr’はフィルタ後のOSAに等しい(抵抗器3814およびコンデンサ3816によってフィルタ後はlr)。しかしながら、サウンドイベントが検出される場合、clr’は真のOSAまたは真のDSAのいずれかに等しい。単一入力チャンネル対および短期サウンドイベント用サウンドイベント特定回路は、一般的に、図37のサウンド特定回路と同様に振る舞うが、異なるのは、サウンドイベントが実際に終了したかどうかによって、サウンドイベントの終了時にclr’がlrに減衰するか、即座にIrとなるかが決まる点である。
制御回路3808がサウンドイベントの発生を示すトリガ信号を受信して、検出しようとするサウンドイベントの典型的な持続期間が終了したと決定した場合、上述した他の機能に加えて、制御回路は、検出器3810と通信して、サウンドイベントが実際に終了したかどうかを確立させる。検出器3810は、電力エンベロープを、チャンネル対の各入力チャンネルにおける順応信号を比較することによって、サウンドイベントが実際に終了したかどうかを決定する。入力電力エンベロープが入力チャンネル対のいずれかの入力チャンネルにおける順応信号より大きい場合には、検出器3810は、短期サウンドイベントが実際には終了していないと決定する。逆に、入力電力エンベロープが入力チャンネル対のいずれかの入力チャンネルにおける順応信号より大きくない場合には、検出器3810は、短期サウンドイベントが実際に終了したと決定する。制御回路3808がサウンドイベントが実際には終了していないと確立した場合には、第2のスイッチ3816に対して、conによって、閉じるよう指示する。第2のスイッチ3816が閉じると、clr’はフィルタ後のOSAへ特定の速度で流れる。したがって、コンデンサ3818および抵抗器3814は、RC時定数がほぼこの特定の速度(一般的には、300ms)に等しくなるように選ばれる。例えば、衝撃音を検出しようとする場合、コンデンサ3818および抵抗器3814のRC時定数は約5msである。しかしながら、制御回路3808がサウンドイベントが実際に終了したと確立する場合、第3のスイッチ3813に対して、conによって、閉じるよう指示する。第2のスイッチ3816が閉じると、clr’は即座にIrとなる。したがって、第2の抵抗器3815およびコンデンサ3818のRC時定数が第1の抵抗器3814およびコンデンサ3818のものよりもはるかに低くなるように(一般的には、10分の1未満)、第2の抵抗器3815は選ばれる。一般的には、第3のスイッチは、非常に短い期間閉じたままである(一般的に、約3ms〜約10ms)。この非常に短い期間が終了した後、制御回路3803は、clr’がフィルタ後のOSAとなるように、第3のスイッチ3813に対しては開くよう指示し、第2のスイッチ3816に対しては閉じるように指示する。さらに、単一入力チャンネル対および短期サウンドイベント用サウンドイベント特定回路は、DSA平均化回路をさらに含んでもよい。DSA平均化回路は、サウンドイベント特定回路3800内の、DSA回路3804およびスイッチ3812の間において実施されてもよい。
サウンド特定器は、複数の入力チャンネル対において生成された音場における単一のサウンドイベント型を検出するために実施されてもよい(「複数入力チャンネル対および単一サウンドイベント型用サウンド特定器」)。LR入力チャンネル対およびCS入力チャンネル対の両方における単一のサウンドイベントを検出および特定するように実施された、複数入力チャンネル対および単一サウンドイベント型用サウンド特定器の一例を図39の参照符号3900に示す。このサウンド特定器は、入力チャンネル対のどのような組み合わせにでも適用可能であり、この例でLR入力チャンネル対およびCS入力チャンネル対を用いたのは説明のためだけである。複数入力チャンネル対および単一サウンドイベント型用サウンド特定器3900は、LR入力チャンネル対についての包括指向角(「clr’」)およびCS入力チャンネル対について包括指向角(「ccs’」)を生成し、一般的に、単一入力チャンネル対および単一サウンドイベント型用第1および第2のサウンドイベント検出器3902および3904と、複数入力チャンネル対および単一サウンドイベント型用サウンド特定回路3906とを含む。
単一入力チャンネルおよび単一サウンドイベント型用第1および第2のサウンドイベント検出器3902および3904は、図24に示すような、同一のサウンドイベントを検出するように実施された複数入力チャンネルおよび単一サウンドイベント型用サウンドイベント検出器を含んでもよい。単一入力チャンネル用第1のサウンドイベント検出器3902は、Lin’およびRin’を用いて、左差分信号Lo,右差分信号Ro,および左右トリガ信号Tlrを生成する。同様に、単一入力チャンネル用第2のサウンドイベント検出器3904は、Cin’およびRin’を用いて、中央差分信号Co,サラウンド差分信号So,および中央‐サラウンドトリガ信号Tcsを生成する。
複数入力チャンネル対および単一サウンドイベント型用サウンド特定回路3906は、左差分信号Lo,右差分信号Ro,および左右トリガ信号を用いて、左右包括指向角clr’を生成し、中央差分信号Co,サラウンド差分信号So,および中央‐サラウンドトリガ信号Tcsを用いて、中央‐サラウンド包括指向角ccs’を生成する。さらに、回路3906は、全ての電力エンベロープdlrおよびdcsを用いて、DSAの正確性を検証する。この回路3906は、図40により詳細に示されており、一般的に、第1のOSA回路4002と、第1のDSA回路4004と、第2のDSA回路4006と、第2のOSA回路4008と、検証回路4020と、制御回路4022と、第1の2点スイッチ4010と、第1のスイッチ4012と、第1の抵抗器4014と、第1のコンデンサ4018と、第2のスイッチ4014と、第2の2点スイッチ4030と、第3のスイッチ4032と、第2のコンデンサ4038と、第4のスイッチ4036と、第2の抵抗器4034とを含む。
clr’は、第1のOSA回路4002と、第1のDSA回路4004と、第1の2点スイッチ4010と、第1のスイッチ4012と、第1の抵抗器4014と、第2のスイッチ4016と、第1のコンデンサ3114とによって生成される。同様に、d/cs’は、第2のOSA回路4008と、第2のDSA回路4006と、第2の2点スイッチ4030と、第3のスイッチ4032と、第2の抵抗器4034と、第2のコンデンサ4038とによって生成される。第1および第2のOSA回路4002および4008は、Lin,Rin,Cin,およびSinを、それぞれ通常指向角lrおよびcsに変換する。制御回路4022、第1のスイッチ4012、第2のスイッチ4016、および第1のコンデンサ4018は、第1のサンプルホールド回路を形成し、制御回路4022、第3のスイッチ4032、第4のスイッチ4034、第2の抵抗器4034、および第2のコンデンサ4038は、第2のサンプルホールド回路を形成する。第1および第3のスイッチ4012および4032はともに、サウンドイベントが検出されない場合は通常開いており、サウンドイベントが検出されると各スイッチが閉じ、検出しようとするサウンドイベント型の典型的な立ち上がり時間の終了時に開くように、制御回路によって制御されている。第2および第4のスイッチ4016および4036はともに、サウンドイベントが検出されない場合は通常閉じており、サウンドイベントが検出されるとき、ならびに検出しようとするサウンドイベント型の典型的な立ち上がり時間の終了時に各スイッチが開くように、制御回路によって制御されている。制御回路4022は、すべてのスイッチ4012,4016,および4032,4036に対して伝達される制御信号「con」を生成する。この制御信号により、トリガ信号のいずれか(TlrまたはTcs)が入力チャンネル対のどちらかでサウンドイベントが検出されたと示す場合に、第1および第2のスイッチ4012および4016は閉じられる(または閉じたままとなる)。その後、conは、サウンドイベントの立ち上がり時間の典型的な持続期間の終了時に、すべてのスイッチ4012,4016,および4032,4036を開かせる。
2方向スイッチ4010および4030はともに、位置DおよびEを含む。サウンドイベントが検出されて2方向スイッチ4010および4030がともに位置Dにある場合、各チャンネル対のDSAを用いて、サウンドイベントの方向を示す。しかしながら、サウンドイベントが検出されて2方向スイッチ4010および4020がともに位置Eにある場合、各チャンネル対のOSAを用いて、サウンドイベントの方向を示す。検証回路4020は、サウンドイベントが検出されると、DSAが正確かどうかに従って、2方向スイッチ4010および4020の両方を検証信号「vs」で制御する。トリガ信号のいずれか(TlrまたはTcs)がサウンドイベントが検出されたと示す場合に、検証回路は、電力エンベロープ(L,R,C,S)のうち少なくとも2つが少なくとも3dB以上降下したかどうかを決定する。電力エンベロープのうち少なくとも2つが以前のサウンドイベントから少なくとも3dB以上降下した場合、検証回路は、2方向スイッチ4010および4020の両方に対して、vsによって、位置Eに移動または留まらせる。しかしながら、電力エンベロープのうち少なくとも2つが以前のサウンドイベントから少なくとも3dB以上降下していな場合、検証回路は、2方向スイッチ4010および4020の両方に対して、vsによって、位置Dに移動または留まらせる。
代わりに、サウンドイベント特定回路の検証回路4020は、整合性チェック回路を含む。整合性チェック回路は、両方のDSA回路に接続され、それぞれで生成された差分指向角を用いて、上述のように、差分指向角の正確性をさらに決定する。さらに、複数サウンドイベント型および単一サウンド型用サウンド特定器は、順応調整回路および/またはエラー閾値調節回路をさらに含んでもよい。
代わりに、複数入力チャンネル対および単一サウンドイベント型用サウンド特定回路は、衝撃音のような短期サウンドイベント用に特化して実施することもできる。上述したように、短期サウンドイベントを特定する場合、検出しようとするサウンドイベント型の典型的な持続期間の終了時にサウンドイベントが実際に終了したかどうかを決定して、サウンドイベントが終了していれば即座にOSAに切り替えれば、都合がよいことが多い。そのような複数入力チャンネル対および短期サウンドイベント用サウンド特定回路の一例を図41に参照符号4100で示す。この複数入力チャンネル対および短期サウンドイベント用サウンド特定回路4100は、一般的に、第1のOSA回路4102と、第1のDSA回路4104と、第2のDSA回路4106と、第2のOSA回路4108と、検証回路4120と、制御回路4122と、検出器4124と、第1の2点スイッチ4110と、第1のスイッチ4112と、第1の抵抗器4114と、第1のコンデンサ4118と、第2のスイッチ4116と、第2の2点スイッチ4130と、第3のスイッチ4132と、第2のコンデンサ4138と、第4のスイッチ4136と、第2の抵抗器4134と、第5のスイッチ4113と、第3の抵抗器4115と、第6のスイッチ4133と、第4の抵抗器4135とを含む。このサウンド特定回路4100は、左右包括指向角を生成する。サウンドイベントが検出されない場合、clr’はフィルタ後のOSAに等しい(第1の抵抗器4114および第1のコンデンサ4118によってフィルタ後はlr)。サウンドイベントが検出される場合、clr’は左右チャンネル対の真のOSAまたは真のDSAのいずれかに等しい。このサウンド特定回路4100は、中央‐サラウンド包括指向ccs’も生成する。サウンドイベントが検出されない場合、clr’はフィルタ後のOSAに等しい。サウンドイベントが検出される場合、clr’は中央‐サラウンドチャンネル対の真のOSAまたは真のDSAのいずれかに等しい。複数チャンネル対および単一短期サウンドイベント用サウンド特定回路は、一般的に、図40の複数チャンネル対および単一サウンドイベント型用サウンド特定回路と同様に振る舞うが、異なるのは、サウンドイベントが実際に終了したかどうかによって、サウンドイベントの終了時にclr’がフィルタ後のOSAに減衰するか、即座にフィルタ後のOSAとなるかが決まる点である。
制御回路4122がサウンドイベントの発生を示すトリガ信号を受信して、検出しようとするサウンドイベントの典型的な持続期間が終了したと決定した場合、上述した他の機能に加えて、制御回路は、検出器4124と通信して、サウンドイベントが実際に終了したかどうかを確立させる。検出器4122は、電力エンベロープを、チャンネル対の各入力チャンネルにおける順応信号を比較することによって、サウンドイベントが実際に終了したかどうかを決定する。入力電力エンベロープが入力チャンネル対のいずれかの入力チャンネルにおける順応信号より大きい場合には、検出器4122は、短期サウンドイベントが実際には終了していないと決定する。逆に、入力電力エンベロープが入力チャンネル対のいずれかの入力チャンネルにおける順応信号より大きくない場合には、検出器4124は、短期サウンドイベントが実際に終了したと決定する。制御回路4122がサウンドイベントが実際には終了していないと確立した場合には、第2および第4のスイッチ4116および4136に対して、conによって、閉じるよう指示する。第2のスイッチ4116および第4のスイッチ4136が閉じると、clr’は左右のフィルタ後のOSAへ特定の速度で流れ(第1の抵抗器4114および第1のコンデンサ4118でフィルタ後はIr)、ccs’は中央‐サラウンドのフィルタ後のOSAへ特定の速度で流れる(第2の抵抗器4136および第2のコンデンサ4138でフィルタ後はcs)。したがって、第1および第2のコンデンサ4118および4138ならびに第1および第2の抵抗器4114および4134は、RC時定数がほぼ特定の速度に等しくなるように選ばれる。例えば、衝撃音を検出しようとする場合、コンデンサ4118および抵抗器4114のRC時定数ならびにコンデンサ4138および抵抗器4134のRC時定数は約5msである。
しかしながら、制御回路4112がサウンドイベントが実際に終了したと確立する場合、第5および第6のスイッチ4113および4133に対して、conによって、閉じるよう指示する。第5および第6のスイッチ4113および4133が閉じると、clr’およびccs’は、それぞれ即座にIrおよびcsとなる。したがって、第3の抵抗器4115および第1のコンデンサ4118のRC時定数ならびに第4の抵抗器4135および第2のコンデンサ4138のRC時定数は、ともに非常に低くなる。このようなRC時定数は、第1の抵抗器4114および第1のコンデンサ4118のRC時定数ならびに第2の抵抗器4134および第2のコンデンサ4138のRC時定数よりもおおよそ少なくとも10分の1未満であってもよい。第5および第6のスイッチ4113および4133は、短い期間閉じたままである。この短い期間は約3ms〜約10msであってもよい。この短い期間が終了した後、制御回路4122は、clr’およびccs’がフィルタ後のOSAとなるように、第5および第6のスイッチ4113および4133に対しては開くよう指示し、第2および第4のスイッチ4166および4136に対しては閉じるように指示する。さらに、複数入力チャンネル対および短期サウンドイベント用サウンドイベント特定回路は、第1および第2のDSA平均化回路をさらに含んでもよい。第1のDSA平均化回路は、サウンドイベント特定回路4100内の、第1のDSA回路4104および第1の2点スイッチ4110の間において実施されてもよい。同様に、第2のDSA平均化回路は、サウンドイベント特定回路4100内の、第2のDSA回路4106および第2の2点スイッチ4130の間において実施されてもよい。
代わりに、複数入力チャンネル対および単一短期サウンドイベント型用サウンド特定回路4100の検証回路は、整合性チェック回路を含む。
整合性チェック回路は、両方のDSA回路に接続され、それぞれで生成された差分指向角を用いて、上述のように、差分指向角の正確性をさらに決定する。さらに、複数サウンドイベント型および単一サウンド型用サウンド特定器は、順応調整回路および/またはエラー閾値調節回路をさらに含んでもよい。
サウンド特定回路は、単一の入力チャンネル対において生成される音場から複数のサウンドイベント型を検出するように実施されてもよい(「単一入力チャンネル対および複数サウンドイベント型用サウンド特定回路」)。左右入力チャンネル対における音節および衝撃音を検出および特定するように実施された単一入力チャンネル対および複数サウンドイベント型用サウンド検出器および特定器を図42の参照符号4200で示す(しかしながら、この特定器は、あらゆる入力チャンネル対に対してサウンドイベント型の組み合わせがどのようなものであっても検出するように実施されてもよい)。単一入力チャンネル対および複数サウンドイベント型用サウンド検出器および特定器4200は、一般的に、単一入力チャンネルおよび単一サウンドイベント型用サウンドイベント検出器4202と、単一チャンネルおよび単一短期サウンドイベント装置用サウンドイベント検出器4206と、単一入力チャンネル対および複数サウンドイベント型用サウンド特定回路4204とを含む。
単一入力チャンネル対および単数サウンドイベント型用サウンドイベント検出器4202は、図24に示すような、音節を検出するように実施された複数チャンネルおよび単数サウンドイベント型用サウンドイベント検出器を含んで、左差分信号Lo,右差分信号Ro,および音節の発生を示す左右トリガ信号Tlr(s)を生成してもよい。単一チャンネル対および単一短期サウンドイベント型用サウンドイベント検出器4206は、衝撃音を検出して、衝撃音の発生を示す(左トリガ信号および右トリガ信号の組み合わせとしての)左右トリガ信号「Tlr(i)」を生成するように実施された、図23に示す単一チャンネル対および単一短期サウンドイベント用サウンドイベント検出器を含んでもよい。単一入力チャンネル対および単数サウンドイベント型用サウンド特定回路4204は、トリガ信号のいずれか(Tlr(s)またはTlr(i))がサウンドイベントの発生を示す度に、検出された音節または衝撃音の方向を示す左右差分指向角を生成するように実施された、図37に示すような単一チャンネル対および複数サウンドイベント型用サウンド特定回路を含んでもよい。このサウンド特定器は、左右入力チャンネル対における音節および衝撃音を検出および特定するように実施されているが、所望するサウンドイベント型を検出するように実施され、かつ単一チャンネル対用サウンドイベント検出器によって生成された任意のトリガ信号に応答する単一チャンネル対および単一サウンドイベント型用サウンド特定回路を有する、単一チャンネル対用サウンドイベント検出器を付加することによって、チャンネル対の数においても、そこにおけるサウンドイベント型の数がいくつであっても検出できるように実施可能である。
サウンド特定器は、複数の入力チャンネル対において生成された音場から複数のサウンドイベント型を検出するように実施されてもよい(「複数入力チャンネル対および複数サウンドイベント型用サウンド特定器」)。左右入力チャンネル対および中央‐サラウンド入力チャンネル対における音節および衝撃音を特に特定する、複数入力チャンネル対および複数サウンドイベント型用サウンド特定器の一例を図43に示す(しかしながら、複数入力チャンネル対および複数サウンドイベント型用サウンド特定器は、入力チャンネル対の数がいくつであっても、そこにおけるサウンドイベントの組み合わせがどのようなものであっても検出するように実施されてもよい)。複数入力チャンネル対および複数サウンドイベント型用サウンド特定器4300は、単一チャンネル対および単一短期サウンドイベント用第1および第2のサウンドイベント検出器4308および4306と、単一チャンネル対および単一サウンドイベント型用第1および第2のサウンドイベント検出器4302および4303と、複数チャンネル対および単数サウンドイベント型用サウンドイベント特定回路4310とを含む。
単一チャンネル対および単一サウンドイベント型用第1のサウンドイベント検出器4302は、図24に示すような、音節を検出するように実施された複数チャンネルおよび単数サウンドイベント型用サウンドイベント検出器を含んで、中央差分信号Co,サラウンド差分信号So,および音節の発生を示す中央‐サラウンドトリガ信号Tcs(s)を生成してもよい。単一チャンネル対および短期サウンドイベント型用第1のサウンドイベント検出器4308は、衝撃音を検出して、衝撃音の発生を示す(左トリガ信号および右トリガ信号の組み合わせとしての)左右トリガ信号Tlr(i)を生成するように実施された、図23に示す単一チャンネル対および単一短期サウンドイベント用サウンドイベント検出器を含んでもよい。同様に、単一チャンネル対および短期サウンドイベント型用第2のサウンドイベント検出器4306は、衝撃音を検出して、衝撃音の発生を示す(中央トリガ信号およびサラウンドトリガ信号の組み合わせとしての)中央‐サラウンドトリガ信号Tcs(i)を生成するように実施された、図23に示す単一チャンネル対および単一短期サウンドイベント用サウンドイベント検出器を含んでもよい。複数チャンネル対および単数サウンドイベント型用サウンド特定回路4310は、任意のトリガ信号(Tlr(s),Tlr(i),Tcs(s),またはTcs(i))がサウンドイベントの発生を示す度に、検出された音節または衝撃音の方向を示す左右サウンドイベント角度「clr’(s,i)」と、任意のトリガ信号(Tlr(s),Tlr(i),Tcs(s),またはTcs(i))がサウンドイベントの発生を示す度に、検出された音節または衝撃音の方向を示す中央‐サラウンドサウンドイベント角度「ccs(s,i)」とを生成するように実施された、図40に示す複数チャンネル対および単一サウンドイベント型用サウンドイベント特定回路を含んでもよい。このサウンド特定器は、左右および中央‐サラウンド入力チャンネル対における音節および衝撃音を検出および特定するように実施されているが、所望するチャンネル対から所望するサウンドイベント型を検出するように実施され、かつ単一チャンネル対用サウンドイベント検出器によって生成された任意のトリガ信号に応答する複数チャンネル対および単一サウンドイベント型用サウンド特定回路4310を有する、単一チャンネル対用サウンドイベント検出器を単に付加することによって、チャンネル対の数においても、そこにおけるサウンドイベント型の数がいくつであっても検出できるように実施可能である。
さらに、任意の複数入力チャンネル対および複数サウンドイベント型用サウンドイベント検出器および特定器は、順応調整回路および/またはエラー閾値回路をさらに含んでもよい。順応調整回路およびエラー閾値回路(図示せず)は、ともに整合性チェック回路に接続され、約数秒という期間に整合性チェックによって検出されたエラーの数をカウントするカウンタを含む。また、順応調整回路は、DSA回路に含まれる一過性現象検出回路に順応信号を入力する。また、エラー閾値回路も、トリガ生成回路内の閾値検出部に接続され、カウンタによってカウントされたエラーの数に従って調整されるエラー電圧源をさらに含む。エラーの数が多ければ、エラー電圧源によって生じる電圧は上昇して、サウンドイベントが少なく検出されるように閾値電圧を上昇させる。
(10.ソフトウェア)
サウンドイベント検出方法、サウンドイベント検出および特定方法、およびサウンドイベント特定方法、ならびに任意のこれらの方法に含まれる方法は、コンピュータが読み取り可能なソフトウェアコードを含む。これらのアルゴリズムは、合わせて実施されてもよいし、独立して実行されてもよい。このようなコードは、プロセッサ、メモリ装置、または他のコンピュータが読み取り可能な記憶媒体に格納されてもよい。代わりに、ソフトウェアコードは、コンピュータが読み取り可能な電子または光信号に符号化されてもよい。コードは、オブジェクトコードまたは本願で説明した機能を記述または制御する他のあらゆるコードであってもよい。コンピュータが読み取り可能な記憶媒体は、フロッピー(登録商標)ディスクのような磁気記憶ディスク、CD−ROMのような光学式ディスク、半導体メモリ、またはプログラムコードまたは関連データを格納する他のどのような物理的オブジェクトであってもよい。
本発明の様々な実施形態を説明したが、本発明の範囲内においてさらに多くの実施形態および実現が可能であることは当業者には明白であろう。したがって、本発明は、添付の請求項およびその均等物に照らして限定される以外、限定されない。
図1は、単一入力チャンネルおよび単一サウンドイベント型用サウンドイベント検出方法のフローチャートである。 図2は、順応方法のフローチャートである。 図3は、一過性現象の開始が識別され、一過性現象が背景音から分離される前、最中、および後の音場のサンプル部分についての一連の時間領域のグラフである。 図4は、単一入力チャンネル用開始検出方法のフローチャートである。 図5は、複数入力チャンネル用サウンドイベント検出方法のフローチャートである。 図6は、複数入力チャンネル用開始検出方法のフローチャートである。 図7は、単一入力チャンネルおよび複数サウンドイベント型用サウンドイベント検出方法のフローチャートである。 図8は、複数入力チャンネルおよび複数サウンドイベント型用サウンドイベント検出方法のフローチャートである。 図9は、単一入力チャンネル対および単一サウンドイベント型用サウンドイベント検出および特定方法のフローチャートである。 図10は、複数入力チャンネル対および単一サウンドイベント型用サウンドイベント検出および特定方法のフローチャートである。 図11は、複数入力チャンネル対および単一サウンドイベント型用サウンドイベント検出および特定方法のフローチャートである。 図12は、単一入力チャンネル対および複数サウンドイベント型用サウンドイベント検出および特定方法のフローチャートである。 図13は、サウンド特定方法のフローチャートである。 図14は、単一入力チャンネル対および単一サウンドイベント型用方向選択方法のフローチャートである。 図15は、単一入力チャンネル対および単一短期サウンドイベント用方向選択方法のフローチャートである。 図16は、複数入力チャンネル対および単一サウンドイベント型用方向選択方法のフローチャートである。 図17は、差分指向角決定方法のフローチャートである。 図18は、複数入力チャンネル対および単一短期サウンドイベント用方向選択方法のフローチャートである。 図19は、サウンドイベント装置のブロック図である。 図20は、単一入力チャンネルおよび単一サウンドイベント型用サウンドイベント検出器のブロック図である。 図21は、単一入力チャンネル用順応回路の回路図である。 図22は、単一入力チャンネル用トリガ生成回路の回路図である。 図23は、単一入力チャンネルおよび短期サウンドイベント用サウンドイベント検出器の回路図である。 図24は、複数入力チャンネルおよび単一サウンドイベント型用サウンドイベント検出器のブロック図である。 図25は、複数入力チャンネル対用交互トリガ生成回路の回路図である。 図26は、単一入力チャンネルおよび複数サウンドイベント型用サウンドイベント検出器のブロック図である。 図27は、複数入力チャンネルおよび複数サウンドイベント型用サウンドイベント検出器のブロック図である。 図28は、単一入力チャンネル対および単一サウンドイベント型用サウンドイベント検出器のブロック図である。 図29は、単一入力チャンネル対および単一サウンドイベント型用サウンドイベント特定回路の回路図である。 図30は、複数入力チャネル対および単一サウンドイベント型用サウンドイベント検出器および特定器のブロック図である。 図31は、複数入力チャンネル対および単一サウンドイベント型用サウンドイベント特定回路の回路図である。 図32は、単一入力チャンネル対および複数サウンドイベント型用サウンドイベント検出器および特定器のブロック図である。 図33は、複数入力チャンネル対および複数サウンドイベント型用サウンドイベント検出器および特定器のブロック図である。 図34は、単一サウンドイベント型用ステレオ/サラウンド検出器のブロック図である。 図35は、複数サウンドイベント型用ステレオ/サラウンド検出器のブロック図である。 図36は、単一入力チャンネル対および単一サウンドイベント型用サウンド特定器のブロック図である。 図37は、単一入力チャンネル対および単一サウンドイベント型用サウンド特定回路の回路図である。 図38は、単一入力チャンネル対および短期サウンドイベント用サウンド特定回路の回路図である。 図39は、複数入力チャンネル対および単一サウンドイベント型用サウンド特定器のブロック図である。 図40は、複数入力チャンネル対および単一サウンドイベント型用サウンド特定回路の回路図である。 図41は、単一入力チャンネル対および複数サウンドイベント型用サウンド特定回路のブロック図である。 図42は、単一入力チャンネル対および複数サウンドイベント型用サウンド特定器のブロック図である。 図43は、複数入力チャンネル対および複数サウンドイベント型用サウンド特定器のブロック図である。

Claims (25)

  1. 雑音を含むサウンドにおいてサウンドイベントを検出する方法であって、該サウンドは、第1のオーディオチャンネルおよび第2のオーディオチャンネル内にあり、
    該方法は、
    背景サウンドからサウンドイベントを分離することであって、該分離することは、該第1のオーディオチャンネルにおける電力の変化に基づいて第1の差分信号を決定することと、該第2のオーディオチャンネルにおける電力の変化に基づいて第2の差分信号を決定することと、該第2の差分信号から該第1の差分信号を減算することにより、第1の入力オーディオチャンネルと第2の入力オーディオチャンネルとの対において差分信号を決定することとによって行われる、ことと、
    トリガ信号を生成するために、該第1の入力オーディオチャンネルと該第2の入力オーディオチャンネルとの対における該差分信号においてサウンドイベントと該雑音とを区別することによって、サウンドイベントを検出することと、
    該サウンドイベントを検出するために該トリガ信号を解析することと
    を含む、方法。
  2. 前記第1の差分信号を決定することは、
    前記第1のオーディオチャンネルにおける電力エンベロープを決定することと、
    前記第1のオーディオチャンネルにおける少なくとも1つの定常サウンドの電力を決定することと、
    前記第1のオーディオチャンネルにおける電力エンベロープから、該少なくとも1つの定常サウンドの電力を減算することと
    を含む、請求項に記載の方法。
  3. 前記第1のオーディオチャンネルにおける電力エンベロープを決定することは、該第1のオーディオチャンネル上で電圧信号を2乗することを含む、請求項に記載の方法。
  4. 検出される前記サウンドイベントは、サウンドイベントを含み、
    前記方法は、検出される該サウンドイベントに特徴的でない電力エンベロープにおける変動を取り除くことをさらに含む、請求項に記載の方法。
  5. 前記サウンドイベントは、音節を含み、
    該音節のサウンドイベントは、所定の音節立ち上がり時間を有し、
    検出される該サウンドイベントに特徴的でない電力エンベロープにおける変動を取り除くことは、該所定の音節立ち上がり時間よりも速い所定の立ち上がり時間を有する電力エンベロープから変動を取り除くことを含む、請求項に記載の方法。
  6. 前記サウンドイベントは、複数のサウンドイベントのうちの1つを含み、各サウンドイベントは、該サウンドイベントの少なくとも1つの特性に基づいて、バックグラウンド雑音から区別される、請求項に記載の方法。
  7. 前記複数のサウンドイベントは、音節とインパルスサウンドとを含む、請求項に記載の方法。
  8. 電力を決定することは、所定の期間にわたる音場の平均電力を決定することを含む、請求項に記載の方法。
  9. 前記所定の期間にわたる音場の平均電力を決定することは、該所定の期間にわたって前記電力エンベロープを積分することを含む、請求項に記載の方法。
  10. 検出される前記サウンドイベントは、所定のサウンドイベントの立ち上がり時間を有するサウンドイベントを含み、
    前記電力エンベロープを積分することは、該所定のサウンドイベントの立ち上がり時間にわたって前記電力エンベロープを積分することを含む、請求項に記載の方法。
  11. 前記第1のオーディオチャンネルにおける電力エンベロープから前記少なくとも1つの定常サウンドの電力を減算することは、前記サウンドイベントがその最大値に到達した後に、前記電力エンベロープから前記決定された平均電力を減算することを含む、請求項10に記載の方法。
  12. 前記少なくとも1つの定常サウンドの電力は、人の聴覚機構の順応レートにほぼ等しいレートで、前記第1のオーディオチャンネルにおける電力エンベロープから減算される、請求項11に記載の方法。
  13. 前記少なくとも1つの定常サウンドの電力は、常に、前記電力エンベロープ以下になるように強制される、請求項12に記載の方法。
  14. 前記差分信号を決定することは、
    前記第1のオーディオチャンネルにおける第1の電力エンベロープを決定することと、
    前記第2のオーディオチャンネルにおける第2の電力エンベロープを決定することと、
    該第1の電力エンベロープと該第2の電力エンベロープとの和として、第3の電力エンベロープを決定することと、
    該第1の電力エンベロープと該第2の電力エンベロープとの差として、第4の電力エンベロープを決定することと、
    該第1の電力エンベロープと、該第2の電力エンベロープと、該第3の電力エンベロープと、該第4の電力エンベロープとを解析することにより、該信号が指向性のある一過性成分を含むのか、指向性のない一過性成分を含むのかを決定することと
    を含む、請求項に記載の方法。
  15. 前記サウンドイベントと雑音とを区別することは、前記差分信号と前記信号の平均高周波電力とを比較することを含む、請求項に記載の方法。
  16. 前記差分信号と前記信号の平均高周波電力とを比較することは、該差分信号を該平均高周波電力で除算することを含む、請求項15に記載の方法。
  17. 前記サウンドイベントは、特徴的な周波数を有するサウンドイベントを含み、
    前記平均高周波電力を決定することは、
    前記差分信号をフィルタリングすることにより、検出される該サウンドイベントの該特徴的な周波数よりも高い周波数を有する該差分信号の高周波成分を得ることと、
    該高周波成分を所定の時間にわたって積分することと
    を含む、請求項15に記載の方法。
  18. 前記サウンドイベントを検出するために前記トリガ信号を解析することは、該トリガ信号と所定のしきい値とを比較することを含む、請求項1に記載の方法。
  19. 前記サウンドイベントを検出するための前記所定のしきい値は、前記複数のオーディオチャンネルのうちの少なくとも1つにおけるサウンドイベントの数の関数として変動する、請求項18に記載の方法。
  20. 雑音を含むサウンドにおいてサウンドイベントを検出するサウンドイベント検出器であって、該サウンドは、第1のオーディオチャンネルおよび第2のオーディオチャンネル内にあり、
    該サウンドイベント検出器は、
    背景サウンドからサウンドイベントを分離する順応性モデルであって、該分離することは、該第1のオーディオチャンネルにおける電力の変化に基づいて第1の差分信号を決定することと、該第2のオーディオチャンネルにおける電力の変化に基づいて第2の差分信号を決定することと、該第2の差分信号から該第1の差分信号を減算することにより、第1の入力オーディオチャンネルと第2の入力オーディオチャンネルとの対において差分信号を決定することとによって行われる、順応性モデルと、
    トリガ信号を生成するために、該第1の入力オーディオチャンネルと該第2の入力オーディオチャンネルとの対における該差分信号において該サウンドイベントと該雑音とを区別することによって、サウンドイベントを検出する開始検出モデルと、
    該サウンドイベントを検出するために該トリガ信号を解析する解析器と
    を含む、サウンドイベント検出器。
  21. 第1の差分信号を決定することは、
    前記第1のオーディオチャンネルにおける電力エンベロープを決定することと、
    該第1のオーディオチャンネルにおける少なくとも1つの定常サウンドの電力を決定することと、
    該第1のオーディオチャンネルにおける電力エンベロープから、該少なくとも1つの定常サウンドの電力を減算することと
    を含む、請求項20に記載のサウンドイベント検出器。
  22. 前記順応性モデルは、
    前記第1のオーディオチャンネルにおける第1の電力エンベロープを決定することと、
    前記第2のオーディオチャンネルにおける第2の電力エンベロープを決定することと、
    該第1の電力エンベロープと該第2の電力エンベロープとの和として、第3の電力エンベロープを決定することと、
    該第1の電力エンベロープと該第2の電力エンベロープとの差として、第4の電力エンベロープを決定することと、
    該第1の電力エンベロープと、該第2の電力エンベロープと、該第3の電力エンベロープと、該第4の電力エンベロープとを解析することにより、該信号が指向性のある一過性成分を含むのか、指向性のない一過性成分を含むのかを決定することと
    によって前記差分信号を決定する、請求項20に記載のサウンドイベント検出器。
  23. 前記順応性モデルは、前記差分信号と前記信号の平均高周波電力とを比較することによって、前記サウンドイベントと前記雑音とを区別する、請求項20に記載のサウンドイベント検出器。
  24. 前記順応性モデルが前記差分信号と前記信号の平均高周波電力とを比較することは、該差分信号を該平均高周波電力で除算することを含む、請求項23に記載のサウンドイベント検出器。
  25. 前記サウンドイベントは、特徴的な周波数を有するサウンドイベントを含み、
    前記順応性モデルは、
    前記差分信号をフィルタリングすることにより、検出される前記サウンドイベントの特徴的な周波数よりも高い周波数を有する該差分信号の高周波成分を得ることと、
    該高周波成分を所定の時間にわたって積分することと
    によって、該平均高周波電力を決定する、請求項23に記載のサウンドイベント検出器。
JP2004501891A 2002-05-03 2003-05-02 サウンドの検出および特定システム Expired - Lifetime JP4744874B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US37755802P 2002-05-03 2002-05-03
US60/377,558 2002-05-03
PCT/US2003/013685 WO2003093775A2 (en) 2002-05-03 2003-05-02 Sound detection and localization system

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2010208638A Division JP2011022602A (ja) 2002-05-03 2010-09-16 サウンドの検出および特定システム

Publications (3)

Publication Number Publication Date
JP2005539413A JP2005539413A (ja) 2005-12-22
JP2005539413A5 JP2005539413A5 (ja) 2006-06-22
JP4744874B2 true JP4744874B2 (ja) 2011-08-10

Family

ID=29401529

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2004501891A Expired - Lifetime JP4744874B2 (ja) 2002-05-03 2003-05-02 サウンドの検出および特定システム
JP2010208638A Withdrawn JP2011022602A (ja) 2002-05-03 2010-09-16 サウンドの検出および特定システム

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2010208638A Withdrawn JP2011022602A (ja) 2002-05-03 2010-09-16 サウンドの検出および特定システム

Country Status (8)

Country Link
US (4) US7492908B2 (ja)
EP (1) EP1585947B1 (ja)
JP (2) JP4744874B2 (ja)
KR (1) KR101047194B1 (ja)
CN (1) CN1830009B (ja)
AU (1) AU2003265935A1 (ja)
CA (2) CA2483609C (ja)
WO (1) WO2003093775A2 (ja)

Families Citing this family (52)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7908077B2 (en) 2003-06-10 2011-03-15 Itt Manufacturing Enterprises, Inc. Land use compatibility planning software
US7889133B2 (en) 1999-03-05 2011-02-15 Itt Manufacturing Enterprises, Inc. Multilateration enhancements for noise and operations management
US7667647B2 (en) 1999-03-05 2010-02-23 Era Systems Corporation Extension of aircraft tracking and positive identification from movement areas into non-movement areas
US7782256B2 (en) 1999-03-05 2010-08-24 Era Systems Corporation Enhanced passive coherent location techniques to track and identify UAVs, UCAVs, MAVs, and other objects
US7777675B2 (en) 1999-03-05 2010-08-17 Era Systems Corporation Deployable passive broadband aircraft tracking
US8446321B2 (en) 1999-03-05 2013-05-21 Omnipol A.S. Deployable intelligence and tracking system for homeland security and search and rescue
US7739167B2 (en) 1999-03-05 2010-06-15 Era Systems Corporation Automated management of airport revenues
US8203486B1 (en) 1999-03-05 2012-06-19 Omnipol A.S. Transmitter independent techniques to extend the performance of passive coherent location
US7570214B2 (en) 1999-03-05 2009-08-04 Era Systems, Inc. Method and apparatus for ADS-B validation, active and passive multilateration, and elliptical surviellance
US6804565B2 (en) * 2001-05-07 2004-10-12 Harman International Industries, Incorporated Data-driven software architecture for digital sound processing and equalization
US7451006B2 (en) * 2001-05-07 2008-11-11 Harman International Industries, Incorporated Sound processing system using distortion limiting techniques
KR100548899B1 (ko) * 2001-05-11 2006-02-02 교세라 가부시키가이샤 휴대용 통신 단말기, 무선 데이터 통신 네트워크 시스템, 무선 통신 장치와 그 방법, 및 통신 방식 전환 방법
EP1585947B1 (en) * 2002-05-03 2020-01-01 Harman International Industries, Incorporated Sound detection and localization system
US7443987B2 (en) * 2002-05-03 2008-10-28 Harman International Industries, Incorporated Discrete surround audio system for home and automotive listening
US20050108024A1 (en) * 2003-11-13 2005-05-19 Fawcett John Jr. Systems and methods for retrieving data
CA2592099A1 (en) 2004-12-22 2006-06-29 Nucleonics, Inc. Conserved hbv and hcv sequences useful for gene silencing
US8036402B2 (en) * 2005-12-15 2011-10-11 Harman International Industries, Incorporated Distortion compensation
ES2617546T3 (es) * 2006-02-23 2017-06-19 Togewa Holding Ag Sistema de conmutación y método correspondiente para la unidifusión o multidifusión de transmisiones de flujo de datos de extremo a extremo y/o multimedia entre nodos de red
JP4786384B2 (ja) * 2006-03-27 2011-10-05 株式会社東芝 音声処理装置、音声処理方法および音声処理プログラム
US7965227B2 (en) 2006-05-08 2011-06-21 Era Systems, Inc. Aircraft tracking using low cost tagging as a discriminator
JP4867516B2 (ja) * 2006-08-01 2012-02-01 ヤマハ株式会社 音声会議システム
ATE484761T1 (de) * 2007-01-16 2010-10-15 Harman Becker Automotive Sys Vorrichtung und verfahren zum verfolgen von surround kopfhörern unter verwendung von audiosignalen unterhalb der maskierten hörschwelle
US8908873B2 (en) * 2007-03-21 2014-12-09 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Method and apparatus for conversion between multi-channel audio formats
US9015051B2 (en) * 2007-03-21 2015-04-21 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Reconstruction of audio channels with direction parameters indicating direction of origin
CN100505837C (zh) * 2007-05-10 2009-06-24 华为技术有限公司 一种控制图像采集装置进行目标定位的系统及方法
US8050414B2 (en) * 2008-10-16 2011-11-01 Gas Technology Institute Robust pipe-strike pulse detector
US8045738B2 (en) * 2008-10-31 2011-10-25 Zounds Hearing, Inc. System for managing feedback
WO2011139772A1 (en) * 2010-04-27 2011-11-10 James Fairey Sound wave modification
TWI403304B (zh) 2010-08-27 2013-08-01 Ind Tech Res Inst 隨身語能偵知方法及其裝置
US9111526B2 (en) 2010-10-25 2015-08-18 Qualcomm Incorporated Systems, method, apparatus, and computer-readable media for decomposition of a multichannel music signal
CN102592597B (zh) * 2011-01-17 2014-08-13 鸿富锦精密工业(深圳)有限公司 电子装置及音频数据的版权保护方法
US9143571B2 (en) * 2011-03-04 2015-09-22 Qualcomm Incorporated Method and apparatus for identifying mobile devices in similar sound environment
US8723656B2 (en) 2011-03-04 2014-05-13 Blackberry Limited Human audible localization for sound emitting devices
JP5994470B2 (ja) * 2012-08-08 2016-09-21 株式会社Jvcケンウッド 音源方向検出装置、音源方向検出方法、音源方向検出プログラム
DE102013207149A1 (de) * 2013-04-19 2014-11-06 Siemens Medical Instruments Pte. Ltd. Steuerung der Effektstärke eines binauralen direktionalen Mikrofons
KR102195897B1 (ko) * 2013-06-05 2020-12-28 삼성전자주식회사 음향 사건 검출 장치, 그 동작 방법 및 그 동작 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터 판독 가능 기록 매체
US9747899B2 (en) 2013-06-27 2017-08-29 Amazon Technologies, Inc. Detecting self-generated wake expressions
CN103531202B (zh) * 2013-10-14 2015-10-28 无锡儒安科技有限公司 分布式检测声音事件并选取相同事件点的方法
US9672727B1 (en) * 2013-11-05 2017-06-06 Alarm.Com Incorporated Handling duress input
US9478229B2 (en) 2013-12-10 2016-10-25 Massachusetts Institute Of Technology Methods and apparatus for recording impulsive sounds
US10134416B2 (en) * 2015-05-11 2018-11-20 Microsoft Technology Licensing, Llc Privacy-preserving energy-efficient speakers for personal sound
US9977645B2 (en) * 2015-10-01 2018-05-22 Moodelizer Ab Dynamic modification of audio content
US10134422B2 (en) 2015-12-01 2018-11-20 Qualcomm Incorporated Determining audio event based on location information
EP3434024B1 (en) 2016-04-21 2023-08-02 Hewlett-Packard Development Company, L.P. Electronic device microphone listening modes
WO2017192200A1 (en) * 2016-05-05 2017-11-09 The Research Foundation For The State Unversity Of New York Compositions for treating periodontitis and dental calculus accumulation
US10264999B2 (en) 2016-09-07 2019-04-23 Massachusetts Institute Of Technology High fidelity systems, apparatus, and methods for collecting noise exposure data
EP3324406A1 (en) * 2016-11-17 2018-05-23 Fraunhofer Gesellschaft zur Förderung der Angewand Apparatus and method for decomposing an audio signal using a variable threshold
EP3324407A1 (en) 2016-11-17 2018-05-23 Fraunhofer Gesellschaft zur Förderung der Angewand Apparatus and method for decomposing an audio signal using a ratio as a separation characteristic
CN106814670A (zh) * 2017-03-22 2017-06-09 重庆高略联信智能技术有限公司 一种河道采砂智能监管方法及系统
CN108806711A (zh) * 2018-08-07 2018-11-13 吴思 一种提取方法及装置
US10811032B2 (en) * 2018-12-19 2020-10-20 Cirrus Logic, Inc. Data aided method for robust direction of arrival (DOA) estimation in the presence of spatially-coherent noise interferers
TWI728632B (zh) * 2019-12-31 2021-05-21 財團法人工業技術研究院 特定音源的定位方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000032434A (ja) * 1998-07-08 2000-01-28 Victor Co Of Japan Ltd 撮像装置
JP2000132177A (ja) * 1998-10-20 2000-05-12 Canon Inc 音声処理装置及び方法

Family Cites Families (119)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3845572A (en) * 1972-08-02 1974-11-05 Singer Co Modular vehicle trainer sound system having a plurality of separately controllable sound generators and a polyphonic speaker array
US4251688A (en) * 1979-01-15 1981-02-17 Ana Maria Furner Audio-digital processing system for demultiplexing stereophonic/quadriphonic input audio signals into 4-to-72 output audio signals
JPS56132804A (en) 1980-03-22 1981-10-17 Sharp Corp Operational tone quality control circuit
JPS60107998A (ja) * 1983-11-16 1985-06-13 Nissan Motor Co Ltd 車両用音響装置
US4704728A (en) 1984-12-31 1987-11-03 Peter Scheiber Signal re-distribution, decoding and processing in accordance with amplitude, phase, and other characteristics
US4941177A (en) 1985-03-07 1990-07-10 Dolby Laboratories Licensing Corporation Variable matrix decoder
US4799260A (en) 1985-03-07 1989-01-17 Dolby Laboratories Licensing Corporation Variable matrix decoder
US5046098A (en) 1985-03-07 1991-09-03 Dolby Laboratories Licensing Corporation Variable matrix decoder with three output channels
JPS621441U (ja) * 1985-06-20 1987-01-07
US4759066A (en) 1987-05-27 1988-07-19 Polk Investment Corporation Sound system with isolation of dimensional sub-speakers
US4972482A (en) 1987-09-18 1990-11-20 Sanyo Electric Co., Ltd. Fm stereo demodulator
US4829299A (en) * 1987-09-25 1989-05-09 Dolby Laboratories Licensing Corporation Adaptive-filter single-bit digital encoder and decoder and adaptation control circuit responsive to bit-stream loading
US5189703A (en) 1988-01-06 1993-02-23 Lucasarts Entertainment Company Timbre correction units for use in sound systems
US4862502A (en) * 1988-01-06 1989-08-29 Lexicon, Inc. Sound reproduction
US4932059A (en) 1988-01-11 1990-06-05 Fosgate Inc. Variable matrix decoder for periphonic reproduction of sound
JPH0256600A (ja) * 1988-08-23 1990-02-26 Ricoh Co Ltd 音声ダイヤリング方式
JPH0623119Y2 (ja) 1989-01-24 1994-06-15 パイオニア株式会社 サラウンド方式ステレオ再生装置
US5146507A (en) * 1989-02-23 1992-09-08 Yamaha Corporation Audio reproduction characteristics control device
US5109419A (en) * 1990-05-18 1992-04-28 Lexicon, Inc. Electroacoustic system
US5666424A (en) 1990-06-08 1997-09-09 Harman International Industries, Inc. Six-axis surround sound processor with automatic balancing and calibration
US5504819A (en) * 1990-06-08 1996-04-02 Harman International Industries, Inc. Surround sound processor with improved control voltage generator
US5428687A (en) 1990-06-08 1995-06-27 James W. Fosgate Control voltage generator multiplier and one-shot for integrated surround sound processor
US5625696A (en) * 1990-06-08 1997-04-29 Harman International Industries, Inc. Six-axis surround sound processor with improved matrix and cancellation control
US5339363A (en) * 1990-06-08 1994-08-16 Fosgate James W Apparatus for enhancing monophonic audio signals using phase shifters
US5295189A (en) 1990-06-08 1994-03-15 Fosgate James W Control voltage generator for surround sound processor
US5172415A (en) 1990-06-08 1992-12-15 Fosgate James W Surround processor
KR920004817Y1 (ko) * 1990-08-14 1992-07-20 삼성전자 주식회사 음성다중방식의 공용수신장치
JP3118023B2 (ja) * 1990-08-15 2000-12-18 株式会社リコー 音声区間検出方式及び音声認識装置
US5119422A (en) * 1990-10-01 1992-06-02 Price David A Optimal sonic separator and multi-channel forward imaging system
KR100228688B1 (ko) 1991-01-08 1999-11-01 쥬더 에드 에이. 다차원 음장용 인코우더/디코우더
US5274740A (en) 1991-01-08 1993-12-28 Dolby Laboratories Licensing Corporation Decoder for variable number of channel presentation of multidimensional sound fields
US5136650A (en) 1991-01-09 1992-08-04 Lexicon, Inc. Sound reproduction
KR970000147B1 (ko) 1991-01-31 1997-01-04 삼성전자 주식회사 다중음성기록재생시스템
US5594800A (en) * 1991-02-15 1997-01-14 Trifield Productions Limited Sound reproduction system having a matrix converter
JPH06276599A (ja) * 1991-07-26 1994-09-30 Gijutsu Kenkyu Kumiai Iryo Fukushi Kiki Kenkyusho 衝撃音抑圧装置
US5161197A (en) 1991-11-04 1992-11-03 Lexicon, Inc. Acoustic analysis
US5199075A (en) * 1991-11-14 1993-03-30 Fosgate James W Surround sound loudspeakers and processor
JPH05191899A (ja) 1992-01-16 1993-07-30 Pioneer Electron Corp ステレオサラウンド装置
WO1994010816A1 (en) * 1992-10-29 1994-05-11 Wisconsin Alumni Research Foundation Methods and apparatus for producing directional sound
US5319713A (en) 1992-11-12 1994-06-07 Rocktron Corporation Multi dimensional sound circuit
US5333201A (en) * 1992-11-12 1994-07-26 Rocktron Corporation Multi dimensional sound circuit
US5357574A (en) 1992-12-14 1994-10-18 Ford Motor Company Coherent signal generation in digital radio receiver
DE69424888T2 (de) * 1993-01-22 2001-02-15 Koninkl Philips Electronics Nv Digitale Dreikanalübertragung von linken und rechten Stereosignalen und von einem Mittelsignal
CA2112171C (en) * 1993-02-25 2003-10-21 Bradley Anderson Ballard Dsp-based vehicle equalization design system
US5748749A (en) * 1993-03-24 1998-05-05 Noise Cancellation Technologies, Inc. Active noise cancelling muffler
ES2165370T3 (es) * 1993-06-22 2002-03-16 Thomson Brandt Gmbh Metodo para obtener una matriz decodificadora multicanal.
JP3626492B2 (ja) * 1993-07-07 2005-03-09 ポリコム・インコーポレイテッド 会話の品質向上のための背景雑音の低減
US5463424A (en) 1993-08-03 1995-10-31 Dolby Laboratories Licensing Corporation Multi-channel transmitter/receiver system providing matrix-decoding compatible signals
US5386473A (en) * 1994-01-21 1995-01-31 Harrison; Robert W. Passive surround sound circuit
US5497425A (en) * 1994-03-07 1996-03-05 Rapoport; Robert J. Multi channel surround sound simulation device
US5717765A (en) 1994-03-07 1998-02-10 Sony Corporation Theater sound system with upper surround channels
US6144747A (en) 1997-04-02 2000-11-07 Sonics Associates, Inc. Head mounted surround sound system
US5561737A (en) 1994-05-09 1996-10-01 Lucent Technologies Inc. Voice actuated switching system
CA2149680A1 (en) * 1994-06-30 1995-12-31 John Charles Baumhauer Jr. Direction finder
US5626643A (en) * 1994-09-26 1997-05-06 Owens-Corning Fiberglas Technology Inc. Contact drying of fibers to form composite strands
US5638452A (en) * 1995-04-21 1997-06-10 Rocktron Corporation Expandable multi-dimensional sound circuit
US5761313A (en) 1995-06-30 1998-06-02 Philips Electronics North America Corp. Circuit for improving the stereo image separation of a stereo signal
KR0128064Y1 (ko) 1995-08-18 1998-11-02 김광호 서브우퍼신호 합성기능을 가지는 서라운드 음향신호 재생장치
JP2956545B2 (ja) * 1995-08-28 1999-10-04 ヤマハ株式会社 音場制御装置
US5930370A (en) 1995-09-07 1999-07-27 Rep Investment Limited Liability In-home theater surround sound speaker system
US5708719A (en) 1995-09-07 1998-01-13 Rep Investment Limited Liability Company In-home theater surround sound speaker system
US6118876A (en) * 1995-09-07 2000-09-12 Rep Investment Limited Liability Company Surround sound speaker system for improved spatial effects
KR0174084B1 (ko) * 1995-09-25 1999-04-01 이준 Mpeg-2 다채널 오디오 복호화기의 역변환기
US5798818A (en) * 1995-10-17 1998-08-25 Sony Corporation Configurable cinema sound system
US5642423A (en) 1995-11-22 1997-06-24 Sony Corporation Digital surround sound processor
US5956674A (en) * 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
US5771295A (en) * 1995-12-26 1998-06-23 Rocktron Corporation 5-2-5 matrix system
US5841993A (en) 1996-01-02 1998-11-24 Ho; Lawrence Surround sound system for personal computer for interfacing surround sound with personal computer
US5727068A (en) * 1996-03-01 1998-03-10 Cinema Group, Ltd. Matrix decoding method and apparatus
DE59611450D1 (de) * 1996-05-17 2008-01-03 Micronas Gmbh Raumklangsystem
US5850455A (en) 1996-06-18 1998-12-15 Extreme Audio Reality, Inc. Discrete dynamic positioning of audio signals in a 360° environment
US5796844A (en) 1996-07-19 1998-08-18 Lexicon Multichannel active matrix sound reproduction with maximum lateral separation
US5870480A (en) 1996-07-19 1999-02-09 Lexicon Multichannel active matrix encoder and decoder with maximum lateral separation
US6697491B1 (en) * 1996-07-19 2004-02-24 Harman International Industries, Incorporated 5-2-5 matrix encoder and decoder system
FI105522B (fi) 1996-08-06 2000-08-31 Sample Rate Systems Oy Järjestely kotiteatteri- tai muussa äänentoistolaitteistossa
US6144474A (en) 1996-10-21 2000-11-07 Fujitsu Limited Optical transmission system including optical repeaters with selectively enabled gain equalizers contained therein and including an add/drop apparatus with a plurality of individually selectable filters
DE19651308C2 (de) 1996-12-10 1998-10-22 Becker Gmbh Audio-Soundsystem für ein Kraftfahrzeug
US6711266B1 (en) * 1997-02-07 2004-03-23 Bose Corporation Surround sound channel encoding and decoding
US6038324A (en) * 1997-02-21 2000-03-14 Ambourn; Paul R. Automotive surround sound circuit background of the invention
US5862228A (en) * 1997-02-21 1999-01-19 Dolby Laboratories Licensing Corporation Audio matrix encoding
JP3663461B2 (ja) 1997-03-13 2005-06-22 スリーエス テック カンパニー リミテッド 周波数選択的空間感向上システム
US6973200B1 (en) * 1997-04-22 2005-12-06 Canon Kabushiki Kaisha Image processing apparatus, image processing method, and storage medium
US6198826B1 (en) * 1997-05-19 2001-03-06 Qsound Labs, Inc. Qsound surround synthesis from stereo
JP4478220B2 (ja) * 1997-05-29 2010-06-09 ソニー株式会社 音場補正回路
US5983087A (en) 1997-06-26 1999-11-09 Delco Electronics Corporation Distributed digital signal processing for vehicle audio systems
US6108584A (en) * 1997-07-09 2000-08-22 Sony Corporation Multichannel digital audio decoding method and apparatus
US6141597A (en) * 1997-09-08 2000-10-31 Picturetel Corporation Audio processor
JP3906533B2 (ja) 1997-11-04 2007-04-18 ヤマハ株式会社 擬似ステレオ回路
US6683962B1 (en) * 1997-12-23 2004-01-27 Harman International Industries, Incorporated Method and system for driving speakers with a 90 degree phase shift
US6624873B1 (en) * 1998-05-05 2003-09-23 Dolby Laboratories Licensing Corporation Matrix-encoded surround-sound channels in a discrete digital sound format
JP4151110B2 (ja) 1998-05-14 2008-09-17 ソニー株式会社 オーディオ信号処理装置およびオーディオ信号再生装置
EP0980064A1 (de) * 1998-06-26 2000-02-16 Ascom AG Verfahren zur Durchführung einer maschinengestützten Beurteilung der Uebertragungsqualität von Audiosignalen
JP3781902B2 (ja) * 1998-07-01 2006-06-07 株式会社リコー 音像定位制御装置および音像定位制御方式
JP3484988B2 (ja) 1998-09-22 2004-01-06 ヤマハ株式会社 演奏情報編集方法および演奏情報編集プログラムを記録した記録媒体
FI113935B (fi) * 1998-09-25 2004-06-30 Nokia Corp Menetelmä äänitason kalibroimiseksi monikanavaisessa äänentoistojärjestelmässä ja monikanavainen äänentoistojärjestelmä
US6453047B1 (en) 1998-09-28 2002-09-17 Creative Technology Ltd Matrix encoding system with improved behavior frequency
US6590983B1 (en) * 1998-10-13 2003-07-08 Srs Labs, Inc. Apparatus and method for synthesizing pseudo-stereophonic outputs from a monophonic input
GB2342830B (en) * 1998-10-15 2002-10-30 Central Research Lab Ltd A method of synthesising a three dimensional sound-field
US6556685B1 (en) * 1998-11-06 2003-04-29 Harman Music Group Companding noise reduction system with simultaneous encode and decode
US6442277B1 (en) * 1998-12-22 2002-08-27 Texas Instruments Incorporated Method and apparatus for loudspeaker presentation for positional 3D sound
US6694027B1 (en) * 1999-03-09 2004-02-17 Smart Devices, Inc. Discrete multi-channel/5-2-5 matrix system
JP4610087B2 (ja) * 1999-04-07 2011-01-12 ドルビー・ラボラトリーズ・ライセンシング・コーポレーション 損失のない符号化・復号へのマトリックス改良
US6539357B1 (en) * 1999-04-29 2003-03-25 Agere Systems Inc. Technique for parametric coding of a signal containing information
JP2001028799A (ja) 1999-05-10 2001-01-30 Sony Corp 車載用音響再生装置
US6442278B1 (en) 1999-06-15 2002-08-27 Hearing Enhancement Company, Llc Voice-to-remaining audio (VRA) interactive center channel downmix
KR100809310B1 (ko) 2000-07-19 2008-03-04 코닌클리케 필립스 일렉트로닉스 엔.브이. 스테레오 서라운드 및/또는 오디오 센터 신호를 구동하기 위한 다중-채널 스테레오 컨버터
US7236838B2 (en) * 2000-08-29 2007-06-26 Matsushita Electric Industrial Co., Ltd. Signal processing apparatus, signal processing method, program and recording medium
JP4264686B2 (ja) 2000-09-14 2009-05-20 ソニー株式会社 車載用音響再生装置
US7457422B2 (en) * 2000-11-29 2008-11-25 Ford Global Technologies, Llc Method and implementation for detecting and characterizing audible transients in noise
DE10110422A1 (de) * 2001-03-05 2002-09-19 Harman Becker Automotive Sys Verfahren zur Steuerung eines mehrkanaligen Tonwiedergabesystems und mehrkanaliges Tonwiedergabesystem
WO2002091799A2 (en) * 2001-05-03 2002-11-14 Harman International Industries, Incorporated System for transitioning from stereo to simulated surround sound
US7177432B2 (en) * 2001-05-07 2007-02-13 Harman International Industries, Incorporated Sound processing system with degraded signal optimization
US6804565B2 (en) * 2001-05-07 2004-10-12 Harman International Industries, Incorporated Data-driven software architecture for digital sound processing and equalization
US7451006B2 (en) * 2001-05-07 2008-11-11 Harman International Industries, Incorporated Sound processing system using distortion limiting techniques
US7447321B2 (en) * 2001-05-07 2008-11-04 Harman International Industries, Incorporated Sound processing system for configuration of audio signals in a vehicle
EP1585947B1 (en) * 2002-05-03 2020-01-01 Harman International Industries, Incorporated Sound detection and localization system
US20040086130A1 (en) * 2002-05-03 2004-05-06 Eid Bradley F. Multi-channel sound processing systems
US7764805B2 (en) * 2003-06-02 2010-07-27 Fujitsu Ten Limited Apparatus for generating surround signal from two-channel stereo signal
US20050063551A1 (en) * 2003-09-18 2005-03-24 Yiou-Wen Cheng Multi-channel surround sound expansion method

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000032434A (ja) * 1998-07-08 2000-01-28 Victor Co Of Japan Ltd 撮像装置
JP2000132177A (ja) * 1998-10-20 2000-05-12 Canon Inc 音声処理装置及び方法

Also Published As

Publication number Publication date
JP2005539413A (ja) 2005-12-22
US7499553B2 (en) 2009-03-03
AU2003265935A8 (en) 2003-11-17
AU2003265935A1 (en) 2003-11-17
US20040005065A1 (en) 2004-01-08
US20040005064A1 (en) 2004-01-08
EP1585947A4 (en) 2011-04-27
WO2003093775A3 (en) 2006-03-30
EP1585947B1 (en) 2020-01-01
US7492908B2 (en) 2009-02-17
CN1830009A (zh) 2006-09-06
JP2011022602A (ja) 2011-02-03
KR101047194B1 (ko) 2011-07-06
US20040022392A1 (en) 2004-02-05
US7567676B2 (en) 2009-07-28
CA2483609C (en) 2012-09-18
EP1585947A2 (en) 2005-10-19
US20040179697A1 (en) 2004-09-16
CN1830009B (zh) 2010-05-05
CA2773294C (en) 2013-03-12
CA2773294A1 (en) 2003-11-13
CA2483609A1 (en) 2003-11-13
WO2003093775A2 (en) 2003-11-13
KR20040105252A (ko) 2004-12-14

Similar Documents

Publication Publication Date Title
JP4744874B2 (ja) サウンドの検出および特定システム
Ratnam et al. Blind estimation of reverberation time
US11050399B2 (en) Ambient sound activated device
JP4952698B2 (ja) 音声処理装置、音声処理方法およびプログラム
KR101669302B1 (ko) 제어 장치
US9269367B2 (en) Processing audio signals during a communication event
US9037458B2 (en) Systems, methods, apparatus, and computer-readable media for spatially selective audio augmentation
US11115762B2 (en) Hearing device for own voice detection and method of operating a hearing device
US20100185308A1 (en) Sound Signal Processing Device And Playback Device
CN108235181B (zh) 在音频处理装置中降噪的方法
KR20170031796A (ko) 볼륨 레벨러 제어기 및 제어 방법
WO2008156941A1 (en) Sound discrimination method and apparatus
EP3757993A1 (en) Pre-processing for automatic speech recognition
KR100992656B1 (ko) 음향 및 비음향 센서를 이용한 유성음 및 무성음 감지시스템 및 방법
KR101073632B1 (ko) 반향 환경에서의 영교차 기반 다음원 국지화 방법 및 장치
KR20220104693A (ko) 라이브 스피치 검출
JPH0736487A (ja) 音声信号処理装置
EP4305620A1 (en) Dereverberation based on media type
Vesa Estimation of reverberation time from binaural signals without using controlled excitation
EP4158625A1 (en) A own voice detector of a hearing device
EP4278350A1 (en) Detection and enhancement of speech in binaural recordings
Vesa Jälkikaiunta-ajan estimointi binauraalisesta signaalista ilman tunnettua herätettä

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060501

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060501

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090302

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090602

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100525

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20100825

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20100901

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100916

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110506

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110511

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140520

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 4744874

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term