以下、本発明を図示する実施形態に基づいて説明する。
<<< §1. 本発明に係る快音化装置の基本構成 >>>
ここでは、本発明に係る快音化装置の基本構成を説明する。本発明は、ヒトの聴覚の生理学的特性を利用して、騒音を軽減させる原理に基づくものであり、騒音とは別な音波を発生させるという点では、能動消音法(ANC:Active Noise Control)と類似した手法を採る。そこで、まず、従来から利用されている能動消音法の基本原理を図を参照して説明する。
図1は、従来の能動消音法による騒音軽減化の基本原理を示す図である。ここでは、説明の便宜上、騒音源10として、ヘアードライヤーを用いた例で説明を行う。図示のとおり、騒音源10となるヘアードライヤーからは騒音信号N(音波)が周囲に伝播されることになる。古くから行われてきた受動消音法では、この騒音源10の筐体に吸音材などを付加して外部に騒音が伝達されるのを防ぐ対策を施すことになるが、筐体がかさばり、低音部の消音効果が弱いという欠点があることは既に述べたとおりである。
そこで、能動消音法では、この騒音信号Nを打ち消す成分をもった別な音波(位相反転信号I)を故意に発生させ、騒音信号Nに位相反転信号Iをぶつけることにより、両者を物理的に消滅させる手法を採る。もっとも、現実的には、従来の能動消音法を用いて図示のような構成で消音を行うことは不可能であり、ヘアードライヤーをダクト内に閉じ込めて、騒音波が所定方向にしか進行しないような制御を行うなど、非実用的な実験環境でないと騒音を打ち消すことはできない(後述する図2の構成をとる場合も同様である)。
図1に示す例の場合、騒音収録マイク20によって、騒音源10の近傍で騒音信号Nを収録して電気信号に変換し、これを信号遅延部30で所定時間だけ遅延させ、位相反転部40で位相反転させた上で、スピーカ50から出力する。信号遅延部30では、騒音源10から、騒音信号Nと位相反転信号Iとの衝突位置までの音波の伝搬距離Lに相当する音波の伝搬時間に相当する時間差だけ信号を遅延させる処理を行う(電気信号の伝搬時間は、音波の伝搬時間に比べて非常に小さいので無視する)。
位相反転信号Iが、騒音信号Nに対して、正確に位相反転した同一音圧レベルの信号であれば、理論的には、騒音信号Nを完全に打ち消すことができる。しかしながら、実際には、騒音信号Nに完全に同期した信号を取り出し、正確な位相反転信号Iを生成し、タイミングを正確に合わせて衝突させることは極めて困難である。そのため、図の右方に示すとおり、打ち消されずに残った残存信号Rが観測されることになる。このように、騒音信号Nを低減させる効果は得られるものの、完全に消し去ることはできない。
図2は、図1に示す能動消音法に、更にフィードバック制御を加えた方法の基本原理を示す図である。この例では、残存信号Rを収録するための誤差収録マイク60を更に設け、誤差帰還部70によって残存信号Rを電気信号として採取し、これを位相反転部45に対してフィードバック信号として帰還させている。位相反転部45は、この残存信号Rの振幅が零になるように、位相反転信号Iに対するフィードバック制御を行う機能を有する。
このようなフィードバック制御を行うことにより、騒音信号Nを更に低減させることが可能であるが、実際には、騒音信号Nを完全に打ち消すことはできない。また、図には、騒音信号Nが右方向にのみ伝搬した図が示されているが、実際には、騒音源10からは騒音信号Nが音波として四方八方に広がってゆくことになるので、これらすべての音波を物理的に消滅させることは不可能である。
結局、従来の能動消音法では、空間上の特定位置についてのみ騒音の低減が図れるだけであり、騒音低減の効果に指向性があるという問題がある。また、高音部の消音効果が弱い欠点もある。更に、位相反転処理やそのフィードバック制御をリアルタイムで高速に行うためには、DSPなどの高価な信号処理回路が必要になり、コストがかかるという経済的な問題も生じる。このため、現状では、ダクト、自動車内、ヘッドフォンなど、騒音方向を制御可能な閉鎖的な音響空間での実用化が行われているにすぎない。
さて、本発明に係る騒音源の快音化方法は、騒音とは別な音波を発生させる点において上記能動消音法と類似する。しかしながら、騒音そのものを物理的に減衰させるわけではなく、ヒトの聴覚の生理学的特性を利用して、人間が聴覚として捉える騒音を感覚上軽減させる手法を採る。
図3は、本発明の基本的実施形態に係る快音化装置の基本構成を示すブロック図である。ここでも、騒音源10として、ヘアードライヤーを用いた例が示されている。この実施形態に係る快音化装置は、オーディオ信号供給部100とオーディオ出力部200とによって構成されている。オーディオ信号供給部100は、図示のとおり、コンテンツ格納部110,イコライザ120,フィルタ格納部130,コンテンツ再生部140を有するデジタルユニットであり、内部の処理はすべてデジタル演算によって行われる。ただ、コンテンツ再生部140の出力段には、D/A変換器が組み込まれており、音圧レベルが調整されたアナログ再生信号が出力される。オーディオ出力部200は、図示のとおり、オーディオアンプ210とスピーカ220とを有するアナログユニットであり、コンテンツ再生部140から出力されたアナログ再生信号を音波として出力する機能を有する。
コンテンツ格納部110内には、オーディオ信号を発生させるためのコンテンツCがオーディオデジタルデータの形で格納されている。ここでは、人間の歌声を再生するためのオーディオデジタルデータが、コンテンツCとして格納されている場合を例にとって、以下の説明を行うことにする。コンテンツ格納部110に格納されているコンテンツCは、オーディオ信号A(オーディオデジタルデータ)として読み出され、イコライザ120によって周波数特性の調整が行われる。ここでは、こうして周波数特性が調整された信号(オーディオデジタルデータ)を調整オーディオ信号A*と呼び、この調整オーディオ信号A*によって構成されるコンテンツを調整コンテンツC*と呼ぶことにする。コンテンツ再生部140は、この調整コンテンツC*を再生して、アナログオーディオ信号の形で調整オーディオ信号A*を出力する機能を果たす。この調整オーディオ信号A*は、オーディオアンプ210で増幅され、スピーカ220によって音波の形の調整オーディオ信号A*として出力される。
結局、人間の耳80には、騒音源10が発生する騒音信号Nと、スピーカ220から出力される調整オーディオ信号A*との双方が、音波として伝搬される。調整オーディオ信号A*は、騒音信号Nを物理的に打ち消す性質をもった音波ではないので、物理的な観点からは、騒音信号Nを減衰させるどころか、騒音信号Nに加えて、更に調整オーディオ信号A*が加わることになり、人間の耳80に与えられる音波のエネルギー量は、かえって増加することになる。それにもかかわらず、騒音の快音化が行われるのは、調整オーディオ信号A*が騒音信号Nに対するマスキング効果を有しているためである。
ここで言うマスキングとは、一般に、「スペクトルマスキング」として知られているヒトの聴覚の生理学的特性に起因して生じる現象であり、人間の耳に入ってきた音波の中に特定周波数の強い信号成分が存在する場合、その近傍の周波数をもつ弱い信号成分がかき消されてしまい(マスクされてしまい)、人間の感覚上、聞こえなくなってしまう現象である。以下、この「スペクトルマスキング」の現象について、§2で詳述する
<<< §2. スペクトルマスキングの基本原理 >>>
図4は、スペクトルマスキングの基本原理を示すグラフである。図示のグラフは、特定の周波数fa(この例の場合、fa=1kHz)をもつ狭帯域の強い音波A(図の太線成分)が存在する場合に、人間の感覚上、この音波Aによって、近隣の周波数をもつ弱い音波がマスクされてしまう現象を示している。図示のマスキングカーブMは、音波Aによるマスキング効果を受ける周波数と音量レベルとの関係を示すグラフである。このマスキングカーブMは、図示のとおり、音波Aを中心周波数として右側に裾の尾が膨らんだ左右非対称なカーブになることが知られており、高帯域側、すなわち、図の周波数faよりも右側のカーブの裾野の広がりが、低帯域側、すなわち、図の周波数faよりも左側のカーブの裾野の広がりよりも大きくなる。
このマスキングカーブMより音量レベルの小さい周波数成分をもった他の音波成分は、音波Aのマスキング効果により聞こえなくなってしまう。具体的には、図示の例の場合、周波数faをもつ強い音波Aが存在すると、近隣の周波数fbをもつ弱い音波B(図の太線成分)が同時に存在していたとしても、人間の感覚上、音波Bは聞こえなくなってしまう。マスキングカーブM以下の音量レベルをもった他の周波数成分の音も同様に聞こえなくなる。これに対して、周波数fcをもつ中程度の強度の音波C(図の太線成分)は、音量レベルがマスキングカーブMを越えているため、音波Aとともに、別な音として聞こえることになる。
このマスキングカーブMは、バンドエリミネーションフィルタ(帯域除去フィルタ)の特性カーブのような形状をしており、狭帯域の強い音波Aの存在は、人間の聴覚に対して、マスキングカーブMのような周波数特性をもったバンドエリミネーションフィルタ(マスキングカーブM内の成分を遮蔽するフィルタ)としての機能を果たすことになる。ここで、マスキングカーブMの幅(たとえば、半値幅)は、臨界帯域幅ξ(fa)と呼ばれている。マスキングカーブMの正確な形状は、音波Aの周波数faに依存して変化することが知られており、また、音波Aの強度によっても変化するとされている。したがって、臨界帯域幅ξ(fa)も、周波数faの値によって異なる(一般に、周波数faが低いと幅は小さくなり、周波数faが高いと幅が広くなる)。
このスペクトルマスキングの現象は、非線形で複雑な現象と考えられており、詳細な解析は今後の研究に委ねられるものであるが、このような現象が生じる根本的原因は、ヒトの耳の構造にあるとされている。図5は、ヒトの聴覚にスペクトルマスキングという生理学的特性が生じる原因を説明するための聴覚系の構造図である。図示のとおり、ヒトの耳の内部は、外耳道、鼓膜、耳小骨、前庭窓を経て蝸牛に至る構造を有する。蝸牛は、音波を周波数分解する機能をもった管状の器官で、実際には渦巻状に巻かれた状態となっているが、図では説明の便宜上、この渦巻を伸ばした状態が示されている。
蝸牛の内部は、基底膜によって上下2つの部分に分けられており、蝸牛に到達した音波は、この基底膜を振動させながら、蝸牛入口(図の左側)から奥(図の右側)へと進行してゆく。基底膜上には多数の神経細胞が並んでおり、基底膜の振動は、この神経細胞を興奮させ、脳への信号伝達を誘発する。ここで、基底膜の位置と当該位置を振動させる音の周波数との間には相関関係があり、高い周波数の音は入口近くの基底膜を振動させ、低い周波数の音は奥に位置する基底膜を振動させる傾向がある。これは、音波の波長が周波数に逆比例するため、波長が長い低音は奥まで進行しないと、基底膜を共振させて音波の振動を伝達することができないのに対し、波長が短い高音は入口付近で基底膜が共振してしまい、ここで奥まで伝達させるエネルギーが消滅してしまうためである。
結局、入口近くの神経細胞は、高い周波数の音による振動によって興奮し、奥の神経細胞は、低い周波数の音による振動によって興奮するため、興奮した神経細胞の位置が、耳に入ってきた音の高低を示すことになる。したがって、脳は、入口近くの神経細胞からの信号を高い音と感じ、奥の神経細胞からの信号を低い音と感じることになる。このように、蝸牛は、入ってきた音の周波数を分解して検出する機能を有している。
ただ、基底膜は蝸牛の入口近くから奥へと物理的に連続した膜であるため、ある1点のみが振動するわけではなく、蝸牛の入口近くから当該振動点まで弱いながら一緒に振動することになり、更にその振動は当該振動点から若干奥側にも伝達する。たとえば、1kHzの音が耳に入ってきたとしても、基底膜の1kHzに対応した1点のみが振動するわけではなく、蝸牛の入口近くから当該振動点まで弱いながら一緒に振動することになり、その振動エネルギーは当該振動点に近づくにつれ大きくなる。そして、当該振動点で最大になり、それより奥側に進むにつれ減衰してゆき、これらの広範囲の組織に分布した神経細胞が興奮することになる。すなわち、1kHzに対応した振動点を中心に、蝸牛の入口方向に向かってなだらかに減衰し、蝸牛の奥方向に向かって急峻に減衰する特性を示す。この特性により図4の左右非対称なカーブの根拠を説明できるが、最近の研究では、ちょうど1kHzの点は実は最大ではなく数十dB下側に位置し、その前後の数十Hzずれた2箇所がピークになることが明らかになった。すなわち、図4のカーブMを周波数方向に拡大してゆくと、ピーク点は2つに分かれる二峰性を示す。したがって、ちょうど1kHzの音はマスクされにくく、それより高音側または低音側に若干ずれた音がマスクされやすいという意味であるが、本願発明では、この点については考慮する必要はない。
図4に示すマスキングカーブMは、1kHzの狭帯域音波Aによって興奮する神経細胞の分布に対応するものである。すなわち、耳の中に1kHz(周波数fa)の狭帯域音波Aが入ってくると、このマスキングカーブMに示すように、1kHzに対応する位置を中心として一定範囲の基底膜がそれぞれ振動を生じ(振幅は、中心から周囲にゆくに従って減少する)、この範囲に分布している神経細胞がそれぞれ興奮して、振幅に応じて信号を脳に伝達することになる。このような状態では、新たな狭帯域音波B(周波数fb:カーブM以下の音量)が加わったとしても、周波数fbに対応する位置の神経細胞は既に興奮状態となっているため、新たに加わった音波Bに基づく付加的な信号が脳に伝達されることはない。すなわち、カーブM以下の音量をもった音波Bは音波Aによってマスクされてしまい、人間の感覚上、音波Bの音は認識されないことになる。
一方、音波Aが存在する状態で、別な音波C(周波数fc:カーブMを超える音量)が新たに加わった場合は、周波数fcに対応する位置の振幅が増加するため、既に興奮状態となっている神経細胞から、より大きな信号が脳に伝達されることになる。このため、脳は、音波Aに加えて、音波Cの存在を認識できる。結局、カーブMを超える音量をもった音波Cであれば、音波Aによってマスクされることはなく、人間の感覚上、音波Aとともに認識されることになる。
これがスペクトルマスキングの基本原理である。要するに、物理的には3つの音波A,B,Cが存在していたとしても、ヒトの聴覚の生理学的特性により、音波AのマスキングカーブMの傘下に入ってしまった弱い音波Bは、人間の感覚上、聞こえなくなってしまうことになる。
本発明の基本原理は、このようなスペクトルマスキングの現象を利用して、騒音が脳によって認識されないようにする点にある。そのためには、図3に示すように、騒音信号Nに対して調整オーディオ信号A*を付加し、この調整オーディオ信号A*によるスペクトルマスキング効果によって、騒音信号Nが脳に認識されないようにすればよい。図4のグラフに示す例の場合、騒音信号Nの主成分が音波B(周波数fb)であれば、音波A(周波数fa)を含む調整オーディオ信号A*を付加することにより、騒音はマスクされる。
図3に示す快音化装置において、コンテンツ格納部110内に用意されているコンテンツCは、オーディオ源としてオーディオ信号Aを発生させる機能を有している。前述したとおり、ここで述べる実施形態の場合、人間の歌声を再生するためのオーディオデジタルデータを、コンテンツCとして用意しているが、もちろん、コンテンツCは人間の歌声に限らず、様々な楽器音やシンセサイザーによる音楽でもかまわない。また、浜辺の波の音、雨音、虫の声など、様々な音を収録したオーディオデジタルデータをコンテンツCとして利用することができる。
ただ、このコンテンツCに含まれている音は、騒音をマスクする音として人間に提示されることになるので、聴いて不快な音であっては本末転倒である。そのような意味で、本発明では、騒音源10が発生する音を「騒音」、その物理的もしくは電気的な信号を「騒音信号N」と呼び、コンテンツ格納部110を「オーディオ源」、コンテンツCを再生することによって得られる音を「オーディオ」、その物理的もしくは電気的な信号を「オーディオ信号A」と呼んで区別している。
ところで、特定の音が心地よいか否かの基準は、人間の個人差によって異なるため、ある人間にとっての「騒音」は、別な人間にとっての「快音」になるケースもあろう。したがって、一般的には「騒音」,「快音」の定義は、主観的なものであり、ある音が「騒音」か「快音」かを客観的な基準で定義することはできない。ただ、本発明では、便宜上、「スペクトルマスキング効果」を利用してマスクされる対象となる音、すなわち、人間の脳に認識させたくない音を「騒音」と呼び、この「騒音」をマスクするために加える音、すなわち、人間の脳に認識させるために用意した音を「オーディオ」と呼ぶことにする。もちろん、「騒音」を単に「第1の音」と呼び、「オーディオ」を単に「第2の音」と呼んでもかまわないが、本願では、理解を容易にする便宜上、「騒音」,「オーディオ」という文言を用いることにする。
さて、上述したように、コンテンツCには、任意のオーディオを利用することが可能であるが、図3に示されるような改変を加えるため、楽曲の著作権を侵害しないように留意する必要がある。自者が著作権をもつ楽曲や著作権放棄された楽曲であれば問題ないが、たとえば、市販のCDに収録されている歌や楽曲のデータや、インターネット経由でダウンロードした歌や楽曲のデータは、通常、第三者が著作権や著作隣接権を保持しているため、そのまま利用することはできず、事前に著作権者から楽曲の編集使用に関する許諾を受けておく必要がある。もちろん、このような任意のコンテンツCを再生して得られるオーディオ信号Aの周波数特性は様々であり、特定の騒音源10が発生する騒音信号Nをマスクするという点において、必ずしも適した周波数特性を有しているわけではない。
そこで、図3に示す装置ではイコライザ120を設け、オーディオ信号Aの周波数特性を調整し、騒音信号Nをマスクするのに適した周波数特性を有する調整オーディオ信号A*に変換する処理を行っている。すなわち、イコライザ120は、コンテンツCを再生することにより得られるオーディオ信号Aを、フィルタ格納部130に格納されているフィルタ関数F(f)で定義される周波数フィルタに通すことにより、周波数成分が調整された調整オーディオ信号A*を出力する機能を果たす。前述したとおり、実際には、このオーディオ信号供給部100の内部で行われる処理は、デジタル処理であり、デジタルデータとしてのオーディオ信号Aが、デジタルデータとしての調整オーディオ信号A*に変換されることになる。
ここで、変換後の調整オーディオ信号A*が、騒音信号Nをマスクするのに適した周波数特性を有した信号になるのは、フィルタ関数F(f)が、そのような周波数特性の調整機能を有しているためである。すなわち、フィルタ格納部130に格納されているフィルタ関数F(f)は、コンテンツ格納部110内に用意されている特定のコンテンツCを再生することによって得られるオーディオ信号Aの周波数特性を、特定の騒音源10(図示の例の場合、特定のヘアードライヤー)が発生する騒音信号Nをマスクするのに適した周波数特性に変換する処理を行うのに特化したフィルタ関数になっている。別言すれば、フィルタ格納部130内に格納されているフィルタ関数F(f)は、特定の騒音源10が発生する騒音信号Nを、特定のコンテンツCを用いて快音化(マスク)するために特別に用意されたフィルタ関数であり、騒音源10やコンテンツC(オーディオ源)が異なる場合には、別なフィルタ関数を用意する必要がある。このような機能をもったフィルタ関数F(f)を作成する具体的な方法は、§3で詳述する。
<<< §3. 本発明に係る快音化方法およびその基本原理 >>>
ここでは、図6の流れ図に基づいて、本発明に係る快音化方法の基本手順とその基本原理を説明する。この快音化方法は、騒音源が発生する騒音に対して快音化を図る方法であり、図示のとおり、前半の準備段階と後半の快音化段階とによって構成されている。準備段階は、フィルタ関数F(f)を作成するための段階である。§2で述べたとおり、図3に示す装置において、フィルタ格納部130内に格納されているフィルタ関数F(f)は、特定の騒音源10が発生する騒音信号Nを、特定のコンテンツCを用いて快音化(マスク)するために特別に用意されたフィルタ関数であり、図6前半の準備段階は、このフィルタ関数F(f)を用意するための処理を行う。一方、図6後半の快音化段階は、準備段階で用意されたフィルタ関数F(f)を用いて、調整オーディオ信号A*を生成し、これをスピーカから出力して騒音信号Nに対するマスキングを行う処理である。
前半の準備段階は、騒音信号採取段階S1,騒音スペクトル算出段階S2,オーディオ信号採取段階S3,オーディオスペクトル算出段階S4,スペクトル除算段階S5によって構成される。
ステップS1の騒音信号採取段階は、特定の騒音源10が発生する騒音信号Nを採取する段階である。たとえば、図3に示す例の場合、騒音源10となるヘアードライヤーの近傍に騒音収録マイクを配置し、ヘアードライヤーの動作音を録音すればよい。録音した騒音は、デジタルデータの形式で保存しておくようにする。
続くステップS2の騒音スペクトル算出段階は、ステップS1で採取した騒音信号Nの所定時間(サンプル期間)内の平均周波数分布に基づいて騒音スペクトルNav(f)を求める処理を行う段階である。たとえば、10秒間とか、5分間というように、予め平均をとるサンプル期間を定めておき、採取した騒音信号Nをフーリエ変換することにより得られるスペクトルの当該サンプル期間に関する平均を求める処理を行えばよい(符号「av」は、このようなサンプル期間における平均であることを示す)。サンプル期間は、騒音の時間変動周期を考慮して適宜決定すればよい。たとえば、ヘアードライヤーが騒音源である場合は、通常、さほどの騒音変動はみられないので、10秒間程度のサンプル期間を設定しておけば十分である。ただし、ヘアードライヤーの送風モードは温風・冷風・強風など複数用意されている場合があり、送風モードごとに騒音信号Nの特性が異なるため、送風モードを変化させた場合は、図6の一連の準備段階をやり直す必要がある。実際には、予め各送風モードに対応した複数のフィルタ関数を準備しておくという運用方法をとることもできる。
図7(a) は、このようにして得られた騒音スペクトルNav(f)の一例を示すグラフであり、横軸に周波数f、縦軸に個々の周波数fに対応するエネルギー値が示されている。このように、任意のオーディオ信号について、所定時間内の平均フーリエ変換スペクトルを算出する技術は、古くから行われている公知の技術であり、ここでは具体的な演算処理についての説明は省略する。
一方、ステップS3のオーディオ信号採取段階は、オーディオ源が発生するオーディオ信号Aを採取する段階である。このオーディオ信号Aの採取も、騒音信号Nの採取と同様に、マイクによる収録作業で行うことも可能であるが、実際には、オーディオ源から直接採取する方法をとるのが好ましい。すなわち、オーディオ源として、オーディオデジタルデータの形式で提供されたコンテンツを用いるのであれば、当該オーディオデジタルデータをそのままオーディオ信号Aを示すデータとして読み込めばよい。また、オーディオ源として、アナログ録音テープを用いる場合は、アナログ信号をデジタル信号に変換して取り込めばよい。
続くステップS4のオーディオスペクトル算出段階は、ステップS3で採取したオーディオ信号Aの所定時間(サンプル期間)内の平均周波数分布に基づいてオーディオスペクトルAav(f)を求める処理を行う段階である。ここでも、3分間とか、5分間というように、予め平均をとるサンプル期間を定めておき、採取したオーディオ信号Aをフーリエ変換することにより得られるスペクトルの当該サンプル期間に関する平均を求める処理を行えばよい(ここでも、符号「av」は、サンプル期間における平均であることを示す)。サンプル期間は、オーディオ信号の時間変動周期を考慮して適宜決定すればよい。たとえば、オーディオ源として、再生時間3分間の楽曲からなるコンテンツを用いる場合であれば、当該コンテンツの再生時間、すなわち、3分間をサンプル期間として設定すればよい。もちろん、サンプル期間は必ずしもコンテンツの再生時間に一致させる必要はないので、たとえば、楽曲の特定部分のみをサンプル期間に設定して平均を求めるようにしてもかまわない。
図7(b) は、このようにして得られたオーディオスペクトルAav(f)の一例を示すグラフである。なお、ステップS1,S2の処理と、ステップS3,4の処理とは、順序を入れ替えてもかまわない。すなわち、先にステップS3,4を実行してオーディオスペクトルAav(f)を求め、その後で、ステップS1,2を実行して騒音スペクトルNav(f)を求めるようにしてもかまわない。
ステップS5のスペクトル除算段階は、ステップS2で算出した騒音スペクトルNav(f)をステップS4で算出したオーディオスペクトルAav(f)で除する除算演算により、除算スペクトルF(f)を算出する段階である。すなわち、除算スペクトルF(f)は、F(f)=Nav(f)/Aav(f)で与えられる。図7(c) は、このようにして得られた除算スペクトルF(f)の一例を示すグラフであり、横軸に周波数f、縦軸に重みが示されている(この図7(c) のグラフは、説明の便宜のために作成したグラフであるため、正確な除算結果を示すものではない)。縦軸の「重み」は、エネルギー値をエネルギー値で除した値であるため無名数になる。
なお、実際には、ステップS2およびS4で行われるフーリエ変換処理は、デジタル演算によって行われる処理であるため、得られる騒音スペクトルNav(f)およびオーディオスペクトルAav(f)は、いずれも周波数f軸上に設定された離散的な周波数について、それぞれエネルギー値を示すデータの集合によって構成されている。具体的には、ここに示す実施形態の場合、f=0〜22.05kHzという周波数軸上の範囲(可聴域の周波数範囲)に2048個の離散的な周波数を設定し、これら各周波数についてそれぞれエネルギー値を算出するフーリエ変換処理を行う。結局、騒音スペクトルNav(f)およびオーディオスペクトルAav(f)の実体は、これら2048通りの離散的な周波数について、それぞれエネルギー値を対応づけたデータの集合ということになる。
したがって、ステップS5のスペクトル除算段階も、実際には、これら離散的な周波数値のそれぞれについて実行される。具体的には、第j番目の周波数についての騒音スペクトルNav(j)の値を、第j番目の周波数についてのオーディオスペクトルAav(j)の値で除することにより、第j番目の周波数についての除算スペクトルF(j)の値が得られる。すなわち、F(j)=Nav(j)/Aav(j)なる演算を、j=1〜2048についてそれぞれ実行すればよい。
なお、騒音信号では稀であるが、オーディオ信号や音楽信号においては、可聴域の周波数範囲について、オーディオスペクトルAav(j)が零に近い値になることが頻繁に発生し、Aav(j)=0であると、数学的に除算を行うことができない。そこで、スペクトル除算段階S5で、除数が零になる周波数については、商を所定の有限値とするように予め定めておけばよい。
もっとも、実用上は、F(j)=Nav(j)/Aav(j)なる演算を行うにあたり、商F(j)の最小値および最大値を予め設定しておき、商が最小値未満となる周波数については商を最小値に置き換え、除数が零になる周波数もしくは商が最大値を超える周波数については商を最大値に置き換えるようにすれば、最終的に得られる除算スペクトルF(f)の重みの値を、最小値〜最大値の間に分布させることができるので、後半の快音化段階を実行する上で好都合である。
こうして除算スペクトルF(f)が得られたら、前半の準備段階は完了である。この前半の準備段階(騒音信号採取段階S1,騒音スペクトル算出段階S2,オーディオ信号採取段階S3,オーディオスペクトル算出段階S4,スペクトル除算段階S5)は、実際には、コンピュータに専用の処理プログラムを組み込み、これを実行させることにより行うことができる。続く後半の快音化段階では、得られた除算スペクトルF(f)を、フィルタ関数として用いて、オーディオ信号Aの周波数特性を調整する処理が行われる。
すなわち、ステップS6のイコライズ処理段階では、オーディオ源が発生するオーディオ信号Aを、除算スペクトルF(f)をフィルタ関数とする周波数フィルタに通すことにより、周波数成分が調整された調整オーディオ信号A*を得る処理が行われる。このイコライズ処理は、一般的なオーディオ機器で広く行われている周波数特性の調整処理であり、簡単に言えば、処理前のオーディオ信号Aの瞬時のスペクトルA(f)に、フィルタ関数F(f)を乗じることにより得られる積のスペクトルが、処理後の調整オーディオ信号A*の瞬時のスペクトルA*(f)となるような処理と言うことができる。図3に示す快音化装置の場合、イコライザ120によって当該処理が実行される。なお、このイコライズ処理の具体的な手順は、§5で説明する。
最後のステップS7のオーディオ出力段階では、調整オーディオ信号A*を騒音源の近傍もしくは任意の場所に配置されたスピーカから音波として出力する処理が行われる。図3に示す快音化装置の場合、オーディオ出力部200によって当該処理が実行される。なお、このとき、音波の形の調整オーディオ信号A*は、騒音に対するマスキング効果が生じる所定以上の音量レベルで出力する必要がある。
図3に示す快音化装置において、調整オーディオ信号A*を所定の音量でスピーカ220から出力すると、騒音源10が発生する騒音信号Nに対して有効なマスキング効果が生じる理由は、次のような説明により容易に理解できよう。
上述したとおり、ステップS6のイコライズ処理により得られる調整オーディオ信号A*の瞬時のスペクトルA*(f)は、オーディオ信号Aの瞬時のスペクトルA(f)に、フィルタ関数F(f)を乗じたものになる。したがって、図8に示すように、
A*(f)=A(f)×F(f) 式(1)
である。ここで、フィルタ関数F(f)は、ステップS5で得られた除算スペクトルであるから、式(1)を書き直すと、図8に示すように、
A*(f)=A(f)×Nav(f)/Aav(f) 式(2)
である。
ところで、A(f)は、オーディオ源が発生するオーディオ信号Aの瞬時(ここに示す実施形態の場合、§5で述べる1フレームの長さ、すなわち、4096/44100秒間)の周波数スペクトルであるのに対して、Aav(f)は、前述したように、ステップS4におけるサンプル期間(楽曲からなるコンテンツの再生時間、たとえば、3分間)における平均的な周波数スペクトルである。したがって、平均スペクトルAav(f)と瞬時スペクトルA(f)とは、当然、異なるスペクトルになるが、瞬時スペクトルA(f)を所定のサンプル期間だけ採取して平均をとったものが平均スペクトルAav(f)であるから、両者は、ある程度類似する周波数スペクトルと言うことができる。
そこで、いま、仮に、A(f)=Aav(f)であるとすれば、図8に示すとおり、式(2)は、
A*(f)=Nav(f) 式(3)
のように変形される。この式(3)は、図3において、スピーカ220から出力される調整オーディオ信号A*の瞬時スペクトルが、騒音源10の発生する騒音信号Nの平均スペクトルNav(f)に一致することを意味する。
一方、騒音源10が発生する騒音信号Nの瞬時の周波数スペクトルN(f)と、その平均的な周波数スペクトルである騒音スペクトルNav(f)とについても、同様の関係が成り立ち、両者は、ある程度類似する周波数スペクトルになる。特に、ヘアードライヤーのようなモータを使った電気製品の場合、騒音信号Nの周波数特性は時間にかかわらずほぼ一定であるため、瞬時スペクトルN(f)は平均スペクトルNav(f)にかなり近くなる。
そこで、騒音についても、同様に、N(f)=Nav(f)であると仮定すれば、図8に示すとおり、式(3)は、更に、
A*(f)=N(f) 式(4)
のように変形される。この式(4)は、図3において、スピーカ220から出力される調整オーディオ信号A*の瞬時スペクトルが、騒音源10の発生する騒音信号Nの瞬時スペクトルN(f)に一致することを意味する。
結局、このような一致が常に得られるという仮定をおくと、調整オーディオ信号A*の音量レベルを、騒音信号Nの音量レベルよりも若干大きくなるように設定すれば、§2で述べたスペクトルマスキングの原理により、騒音信号Nは調整オーディオ信号A*によって完全にマスキングされてしまい、人間の聴覚上は聞こえないことになる。
もちろん、実際には、A(f)=Aav(f),N(f)=Nav(f)という仮定は必ずしも成り立つわけではないので、上記式(3),(4)は一般的には成り立たない。ただ、個々の瞬時スペクトルA(f)をサンプル期間だけ平均したものがAav(f)であるから、瞬時スペクトルA(f)は、平均スペクトルAav(f)を基準として変動するものと考えられる。同様に、個々の瞬時スペクトルN(f)をサンプル期間だけ平均したものがNav(f)であるから、瞬時スペクトルN(f)は、平均スペクトルNav(f)を基準として変動するものと考えられる。
したがって、上記式(4)は成り立たないまでも、スペクトルA*(f)は、スペクトルN(f)に、ある程度近似したものになる。別言すれば、イコライズ処理を施す前のオーディオ信号Aの瞬時スペクトルA(f)に比べれば、イコライズ処理後の調整オーディオ信号A*の瞬時スペクトルA*(f)は、騒音信号Nの瞬時スペクトルN(f)により近似していることになる。
図4のマスキングカーブMを見れば明らかなように、スペクトルマスキングの現象は、ある程度の周波数幅をもって生じる現象であるから、調整オーディオ信号A*の瞬時スペクトルA*(f)が、騒音信号Nの瞬時スペクトルN(f)に対して若干ずれを生じていたとしても、調整オーディオ信号A*の音量レベルが騒音信号Nの音量レベルよりも大きく設定されていれば、調整オーディオ信号A*によるスペクトルマスキング効果が、騒音信号Nに対して及ぶことになり、人間の感覚上、騒音信号Nを聞こえにくくする効果が得られることになる。これが本発明の基本原理であり、調整オーディオ信号A*によって、騒音信号Nに対するマスキングが可能になる理由である。
なお、調整オーディオ信号A*の音量レベルを、騒音信号Nの音量レベルよりも大きく設定するには、オーディオ出力段階S7で、騒音源10が発生する騒音信号Nの音量を測定し、その測定結果に基づいて調整オーディオ信号A*の音量を調整するのが好ましい。もっとも、図示した例のように、騒音源10が特定のヘアードライヤーであることが予めわかっている場合には、当該特定のヘアードライヤーが発生する騒音信号Nの音量レベルを予め測定しておき、オーディオ出力段階S7では、当該音量レベルよりも大きな音量レベルで、調整オーディオ信号A*がスピーカ220から出力されるようにすればよい。
<<< §4. 本発明に係る快音化装置の具体的構成例 >>>
本発明に係る快音化装置は、図3に示すとおり、騒音源10が発生する騒音に対して快音化を図る機能を有しており、オーディオ信号供給部100とオーディオ出力部200とによって構成されている。
ここで、オーディオ信号供給部100は、オーディオ信号を発生させるためのコンテンツCを格納したコンテンツ格納部110と、所定のフィルタ関数F(f)を格納したフィルタ格納部130と、コンテンツCの周波数特性(具体的には、コンテンツCを再生することにより得られるオーディオ信号Aの周波数特性)をフィルタ関数F(f)を用いて調整して調整コンテンツC*(具体的には、調整オーディオ信号A*を再生するためのオーディオデジタルデータ)を生成するイコライザ120と、この調整コンテンツC*を再生するコンテンツ再生部140と、を有する。これらの各構成要素はデジタル信号を処理するデバイスによって構成され、オーディオ信号供給部100は、全体としてデジタルユニットを構成する。ただ、コンテンツ再生部140は、調整コンテンツC*の再生信号(調整オーディオ信号A*)をアナログオーディオ信号としてオーディオ出力部200に対して出力する機能を有する。
なお、コンテンツ再生部140には、必要に応じて、外部から与えられた再生停止指示に基づいて、調整コンテンツC*の再生を停止する機能をもたせておくことができる。ユーザは、調整コンテンツC*の再生による騒音低減が不要と考えたときには、コンテンツ再生部140に対して再生停止指示を与えればよい。もちろん、コンテンツ再生部140は、ユーザから再生開始指示が与えられた場合、再び調整コンテンツC*の再生を開始できる。このとき、再生停止を行った時点で、コンテンツ上の再生停止位置を記憶する機能を設けておけば、再生開始指示が与えられたときに、当該再生停止位置から続きを再生することが可能になる。
一方、オーディオ出力部200は、オーディオアンプ210とスピーカ220とを有し、コンテンツ再生部140で再生された音(アナログオーディオ信号)をスピーカから出力する機能を果たすアナログユニットである。結局、デジタルユニット100は、オーディオデジタルデータからなる調整コンテンツC*を再生することにより得られるアナログオーディオ信号を、このアナログユニットに対して供給する役割を果たすことになる。
なお、コンテンツC(あるいは調整コンテンツC*)は、実際には、オーディオデジタルデータの集合体であり、再生することによってオーディオ信号A(あるいは調整オーディオ信号A*)生じることになるので、発明の技術思想という観点では、コンテンツとオーディオ信号の実体は表裏一体のものである。そこで、本願では、デジタルデータの集合体として捉えた場合に、「コンテンツC」あるいは「調整コンテンツC*」という用語を用い、デジタルもしくはアナログの信号として捉えた場合に、「オーディオ信号A」あるいは「調整オーディオ信号A*」という用語を用いることにする。なお、スピーカ220から出力される音波についても、「調整オーディオ信号A*」と呼ぶことにする。
この快音化装置の重要な特徴は、フィルタ格納部130内に格納されているフィルタ関数F(f)の周波数特性である。実際、この図3に示されている快音化装置の構成は、フィルタ関数F(f)が固有の特徴を有しているという点を除いて、公知のイコライズ機能付きデジタル音響機器と類似した構成になる。ただ、従来の一般的な音響機器で用いられているイコライザは、調整可能な粒度が粗いため、そのままでは本発明におけるイコライザ120に代用することはできない。すなわち、本発明では、従来の一般的な音響機器で用いられている「TONE」調整機能に比べて、より高精度なフィルタ処理機能が要求される。
たとえば、「TONE」調整つまみを有する市販のCDプレーヤーの場合、装填されたCD媒体がコンテンツ格納部110に該当し、「TONE」調整処理を行う部分がイコライザ120およびフィルタ格納部130に該当し、「TONE」調整処理後のオーディオデジタルデータに基づいて、アナログオーディオ信号を出力する部分がコンテンツ再生部140に該当する。IC音楽プレーヤの場合は、コンテンツ格納部110が、オーディオデジタルデータを格納したメモリに変わるだけである。ただ、実用上は、上述したとおり、「TONE」調整機能付きのCDプレーヤーのイコライザ機能をそのまま代用して本発明に係る快音化装置を構成することはできない。
この快音化装置の特徴は、フィルタ格納部130に格納されているフィルタ関数F(f)が、特定の騒音源10(この例の場合、特定のヘアードライヤー)が発生する騒音と特定のコンテンツCとの組み合わせに基づいて生成された固有のフィルタ関数になっている点にある。すなわち、このフィルタ関数F(f)は、§3で述べたフィルタ関数の生成方法(図6の流れ図に示す準備段階S1〜S5)によって生成されたものであり、「騒音源10が発生する騒音信号Nの所定時間内の平均周波数分布を示す騒音スペクトルNav(f)」を、「コンテンツCを再生することにより発生するオーディオ信号Aの所定時間内の平均周波数分布を示すオーディオスペクトルAav(f)」で除する除算演算を行うことにより得られるスペクトルとなっている。このようなフィルタ関数F(f)を用いたイコライズ処理によって得られる調整オーディオ信号A*が、騒音信号Nに対してスペクトルマスキングを行う効果を有する理由は、既に§3で説明したとおりである。
結局、この図3に示す快音化装置(ユニット100&200)は、特定のヘアードライヤー(騒音源10)が発生する騒音を快音化するために特化した装置ということになり、このヘアードライヤーと組み合わせて利用することが前提になる。
図9(a) は、この快音化装置の利用形態の一例を示す正面図である。図の左側には騒音源10(ヘアードライヤー)が示され、右側には、本発明に係る快音化装置(ユニット100&200)が示されている。この快音化装置は、一般的なCDプレーヤーの形態をしており、装填されたCD媒体がコンテンツCとして機能する。もちろん、内蔵されているイコライザ120が周波数特性の調整に利用するフィルタ関数F(f)は、Nav(f)/Aav(f)なる除算で得られたものである。
このように、快音化装置(ユニット100&200)を騒音源10(ヘアードライヤー)の近傍に配置すれば、ユーザに対して、騒音信号Nとともに調整オーディオ信号A*を聞かせることができる。ここで、調整オーディオ信号A*の音量レベルが騒音信号Nの音量レベルよりも若干大きくなるように調整すれば、騒音信号Nはマスクされ、人間の感覚上、聞こえにくくなる。
実際、人間に対して、騒音信号Nとともにオーディオ信号A(イコライズ処理を行う前の信号)を聞かせた場合と、騒音信号Nとともに調整オーディオ信号A*(イコライズ処理後の信号)を聞かせた場合とを比較してみると、音量レベルが同一であるにもかかわらず、前者の場合は、騒音に混じってコンテンツC(歌声)の再生音が聞こえる感じがするのに対して、後者の場合は、明らかに騒音の音量レベルが低下しているような錯覚が生じ、コンテンツC(歌声)の再生音が支配的に感じられる。このように、物理的には、騒音にオーディオが加わるため、音波のエネルギー量自体は増加することになるが、ヒトの聴覚の生理学的特性によって騒音がマスキングされるため、生理的に聴取される音はオーディオが主成分となり、騒音源を効果的に快音化することが可能になる。
このような快音化の方法をとれば、受動消音法のように、騒音源に吸音材などを付加する必要はなく、また、従来の能動消音法のように、高価なリアルタイム信号処理回路も必要ないので、比較的安価な費用で効果的な騒音対策を講じることが可能になる。実際、図9(a) に示す実施形態の場合、快音化装置(ユニット100&200)は、市販のCDプレーヤーやIC音楽プレーヤーのイコライザの部分に、固有のフィルタ関数F(f)として機能するデジタルデータを組み込むことにより構成することができるため、製造コストは極めて安価である。また、本発明に係る快音化方法は、位相反転波によって騒音を物理的に打ち消すわけではないので、指向性が問われることもなく、室内/室外を問わず、種々の音響空間における騒音を、効果的にかつ低コストで快音化することができる。
図9(b) は、本発明に係る快音化装置の別な構成例を示す正面図である。上述したとおり、図3に示す快音化装置(ユニット100&200)は、特定のヘアードライヤー(騒音源10)が発生する騒音を快音化するために特化した装置である。もちろん、発生する騒音の周波数特性が類似した別な装置と組み合わせて利用した場合でも、それなりの快音化効果は期待できるが、基本的には、内蔵するフィルタ関数F(f)を作成する際に用いた騒音信号Nを発生させる騒音源10と組み合わせて利用するのが前提となる。
そこで、図9(b) に示す実施形態では、快音化装置(ユニット100&200)を1つの筐体に収容し、この筐体を、騒音源10であるヘアードライヤーに装着して利用できるようにしている。図示の例では、ヘアードライヤー10の握り部の下端に、着脱アダプター300を利用して、快音化装置の筐体を装着している。筐体内には、図3に示す装置のデジタルユニット100とアナログユニット200の双方が組み込まれており、筐体内のスピーカ220から調整オーディオ信号A*が音波として出力されることになる。
もちろん、ユニット100とユニット200との双方をヘアードライヤー10に装着する代わりに、一方だけを装着し、他方を別体として近傍に配置してもかまわない。たとえば、デジタルユニット100のみをヘアードライヤー10に装着し、アナログユニット200は室内に設置しておき、再生した調整オーディオ信号A*をデジタルユニット100からアナログユニット200に対して無線送信するような形態をとることも可能である。あるいは逆に、デジタルユニット100を室内に設置しておき、アナログユニット200をヘアードライヤー10に装着し、調整オーディオ信号A*を無線送信するような形態も可能である。要するに、図3に示す快音化装置の一部もしくは全部の構成要素を騒音源10に装着するための着脱アダプタ300を設けておけばよい。
図9(c) は、本発明に係る快音化装置の更に別な構成例を示す正面図である。この例では、図3に示す快音化装置(ユニット100&200)が、騒音源10であるヘアードライヤーの内部に組み込まれている。図示の例では、ヘアードライヤー10の握り部に内蔵する形態をとっている。したがって、調整オーディオ信号A*は、この握り部に内蔵されたスピーカ220から出力される。必要に応じて、握り部には、音波を通すための孔部を形成しておくとよい。
この図9(c) に示す実施形態は、ユーザの立場から見れば、音楽再生機能付のヘアードライヤーということになる。内蔵された快音化装置の電源を、ヘアードライヤーの電源と連動させておけば、ユーザがヘアードライヤーのスイッチをONにすると、同時に音楽(調整オーディオ信号A*)が流れる。しかも、当該音楽は、ヘアードライヤーが発生させる騒音を聴覚的に低減させる作用を有していることになる。
もちろん、図9(b) に示す実施形態で説明したように、ユニット100とユニット200との双方をヘアードライヤー10に内蔵する代わりに、一方だけを内蔵し、他方を別体として近傍に配置してもかまわない(図9(b) に示す例と同様に、調整オーディオ信号A*を無線送信する形態をとればよい)。要するに、図3に示す快音化装置(ユニット100&200)の一部もしくは全部の構成要素が騒音源10に内蔵されているようにすればよい。
また、ここでは、騒音源10として、ヘアードライヤーを用いた例を示したが、本発明に係る快音化装置は、電気掃除機、電気シェーバー、エアコン、扇風機、冷蔵庫など、様々な電気製品(電力により駆動する機器)に組み込むことが可能である。この場合も、快音化装置の電源を電気製品の電源に連動させておけば、ユーザにとっての使い勝手が良くなる。要するに、本発明に係る快音化装置の一部もしくは全部の構成要素を電気製品に組み込むようにし、組み込んだ快音化装置の構成要素となるイコライザ120が、当該電気製品自身が発生する騒音信号Nを用いて作成されたフィルタ関数F(f)を用いて周波数特性の調整を行うようにすればよい。
<<< §5. 一般的なイコライズ処理 >>>
ここでは、図3に示す快音化装置のイコライザ120が実行するイコライズ処理、すなわち、図6の流れ図におけるステップS6の処理の具体的な手順を説明する。このイコライズ処理は、コンテンツCの再生信号であるオーディオ信号Aについて、フィルタ関数F(f)を通すことにより周波数特性の調整を行い、調整オーディオ信号A*を得る処理である。このような周波数特性の調整処理は、様々なオーディオ機器や、コンピュータ用のオーディオ再生用プログラムにおいて広く行われている公知の処理であるが、ここでは、本発明の実施に適した具体的なイコライズ処理の一例を簡単に説明しておく。
図10は、図6のイコライズ処理段階(ステップS6)のより詳細な手順を示す流れ図である。まず、ステップS61において、時間軸上にそれぞれ所定時間幅をもった複数のフレームを設定し、第k番目のフレームについて、当該フレーム内部のオーディオ信号A(k)を切り出す処理が実行される。図11は、このステップS61で行われるフレーム抽出処理を例示する図である。図の上段に示されている波形は、オーディオ信号Aの波形であり、横軸に時間t、縦軸に振幅をとって示すものである。
ここで述べる方法では、この時間軸t上に所定の時間幅Tをもった複数のフレームを設定している。波形図の先頭部分に示されている矩形の内部は、時間幅Tをもった第1番目のフレームによって切り出されるオーディオ信号A(1)を示している。また、ここで述べる方法では、時間幅Tをもったフレームを、時間軸上で順にT/2ずつずらして配置することにより複数のフレームを設定している。図11の下段には、このようにして配置されたフレームによって切り出される各オーディオ信号A(1)の区間を示している。図示のとおり、第1フレーム内のオーディオ信号A(1)の区間に対して、第2フレーム内のオーディオ信号A(2)の区間は半ピッチ「T/2」だけずれており、第2フレーム内のオーディオ信号A(2)の区間に対して、第3フレーム内のオーディオ信号A(3)の区間は半ピッチ「T/2」だけずれており、... 以下、同様である。
この例では、時間幅T=4096/44100秒に設定している。これは、もとのコンテンツC(オーディオ信号A)が、44.1kHzでサンプリングしたオーディオデジタルデータから構成されており、1フレームに4096個分のサンプルが含まれるように時間幅Tを設定したためである。
また、各フレームからオーディオ信号Aを切り出す際には、いわゆるハニング窓を設定している。このハニング窓は、図12に示すようなハニング関数W(t)で定義されるものであり、各フレームから切り出されたオーディオ信号Aには、このハニング関数W(t)が乗ぜられる。すなわち、各フレームから切り出した信号に対して、
W(t)=0.5−0.5・cos(2πt/T)
なるハニング関数(但し、0≦t≦T)が乗算される。このような関数で定義されるハニング窓は、図12に示すように、時間幅Tをもったフレームの左右両端では0、中央位置では1をとる関数(図の上下両カーブの垂直方向の距離)である。
すなわち、フレームの左端(t=0)ではW(0)=0,フレームの右端(t=T)ではW(T)=0となり、フレーム中央(t=T/2)ではW(T/2)=1になる。1フレーム内の4096個分のサンプルのうち、第i番目のサンプルの振幅値には、ハニング関数W(i)が乗算されることになる(ここで、i/4096=t/T)。
こうしてハニング窓を設定した第k番目のフレームからオーディオ信号A(k)(ハニング関数を乗じたもの)を切り出す処理が完了したら、続いて、ステップS62において、このオーディオ信号A(k)に対してフーリエ変換を行い、フーリエ変換スペクトルA(k,f)を求める。ここで、「A(k,f)」は、第k番目のフレームについてのフーリエ変換スペクトルを示し、値A(k,f)は、第k番目のフレーム内のオーディオ信号(ハニング関数により変形されたもの)に含まれる所定周波数fの複素強度値を示している(エネルギー値は、この複素強度値の2乗和になる)。
前述したとおり、ここで述べる実施形態の場合、f=0〜22.05kHzという可聴域の周波数範囲に2048個の離散的な周波数を設定し、これら各周波数についてそれぞれエネルギー値を算出する処理を行っている。なお、実際には、フーリエ変換の演算は、実数部と虚数部とに分けて行われるので、ここでは、第k番目のフレームについての実数部のフーリエ変換スペクトルを「Re(A(k,f))」とし、虚数部のフーリエ変換スペクトルを「Im(A(k,f))」とする。
図13は、このイコライズ処理の基本概念を示すグラフ群である。図13(a) は、第k番目のフレームから切り出したオーディオ信号A(k)の波形を示す。図12に示すハニング関数を乗じたため、左右両端へゆくほど振幅は減少している。上述したステップS62のフーリエ変換処理により、図13(b) に示すような実数部のフーリエ変換スペクトルRe(A(k,f))と、虚数部のフーリエ変換スペクトルIm(A(k,f))とが得られる。各周波数fの実際のエネルギー値は、実数部と虚数部とを合成した複素振幅の形で与えられる。
続くステップS63では、ステップS62で求められたフーリエ変換スペクトルA(k,f)にフィルタ関数F(f)を乗算して、積のスペクトルA*(k,f)を求める処理が行われる。すなわち、A*(k,f)=F(f)×A(k,f)となる。実際には、実数部と虚数部とに分けた演算が行われ、実数部Re(A(k,f))にフィルタ関数F(f)を乗じることにより調整実数部Re(A*(k,f))を求め、虚数部Im(A(k,f))にフィルタ関数F(f)を乗じることにより調整虚数部Im(A*(k,f))を求める演算が実行される。図13(b) 〜(d) には、このような実数部と虚数部とに分けた乗算処理が示されている。
次のステップS64では、図13(d) に示す調整実数部Re(A*(k,f))および調整虚数部Im(A*(k,f))に対して逆フーリエ変換処理を施すことにより、当該フレーム内の調整オーディオ信号A*(k)を求める処理が行われる。図13(e) は、こうして得られた調整オーディオ信号A*(k)を示す。
図13(a) ,(e) は、時間軸上の信号振幅を示すものであるのに対して、図13(b) 〜(d) は、周波数軸上の信号強度を示すものである。結局、ここで行われたイコライズ処理は、時間次元の信号をフーリエ変換によって周波数次元の信号に変換し、この周波数次元において、フィルタ関数F(f)を乗じた後、逆フーリエ変換によって時間次元の信号に再変換する処理ということができる。すなわち、オーディオ信号A(k)の周波数特性に対して、周波数次元においてフィルタ関数F(f)を乗じる処理が行われたことになり、得られる調整オーディオ信号A*(k)の周波数特性は、フィルタ関数F(f)に応じて調整されたものになる。
なお、図13(e) に示す調整オーディオ信号A*(k)は、あくまでも第k番目のフレームについての信号であるため、最終的には、複数のフレームについての信号を合成する処理が必要になる。ステップS65の処理は、このようなフレーム単位の信号を合成する処理であり、第(k−1)番目のフレームまでの合成結果に、第k番目のフレームの調整オーディオ信号A*(k)を合成する処理になる。
以上の処理が、ステップS66,S67を経て繰り返される。すなわち、k=1,2,3,... とkを1ずつ更新しながら、各フレームについて同様の処理が繰り返され、全フレームについての処理が完了すれば、イコライズ処理は終了である。説明の便宜上、第k番目のフレームについての調整オーディオ信号A*(k)を単位調整オーディオ信号と呼ぶことにすれば、k=1,2,3,... と各フレームについて同じ処理を順次繰り返して行い、時間軸上で、各フレームについての単位調整オーディオ信号A*(k)を合成することにより調整オーディオ信号A*が得られることになる。
なお、個々のフレームについての合成処理は、逆フーリエ変換処理により得られた各フレームについての単位調整オーディオ信号A*(k)を、時間軸上の各フレームに対応する位置に配置して振幅を単純に加算することにより行うことができる。たとえば、ステップS65において、第(k−1)番目のフレームまでの合成結果に、第k番目のフレームについての単位調整オーディオ信号A*(k)を合成する処理は、前者の波形と後者の波形が互いにT/2だけずれているので、時間軸上でT/2だけオーバーラップさせながら、振幅同士を単純に加算すればよい。
このように、単純な加算により単位調整オーディオ信号A*(k)の合成が可能になるのは、ステップS61でフレームから信号を切り出す際に、図12に示すようなハニング関数を乗じているためである。このハニング関数W(t)では、任意のtについて、W(t)+W(t+T/2)=1が成立するので、第(k−1)番目のフレームについての単位調整オーディオ信号A*(k−1)と、第k番目のフレームについての単位調整オーディオ信号A*(k)とを時間軸上でT/2だけずらして加算すると、ハニング関数W(t)を乗じる前の振幅に対応した振幅値が得られることになる。
<<< §6. 快音化方法の変形例 >>>
続いて、ここでは、§3で述べた本発明に係る快音化方法についての変形例をいくつか述べることにする。
<6−1:臨界帯域補正処理>
ここで述べる臨界帯域補正処理は、図6のステップS2「騒音スペクトル算出段階」で算出された騒音スペクトルNav(f)に対して施す補正処理である。図14は、この臨界帯域補正処理の基本概念を示すグラフである。図14(a) は、ステップS2で算出された騒音スペクトルNav(f)、すなわち、騒音源10が発生する騒音信号Nの周波数スペクトルを所定のサンプル期間だけ平均したグラフを示している(図7(a) と同じグラフ)。この臨界帯域補正処理は、図6のステップS2に続いて、ステップS20として実行すべき処理であり、騒音スペクトルNav(f)の周波数特性を若干補正して、補正騒音スペクトルN′av(f)を求める処理である。
このように、騒音スペクトルNav(f)に対して補正処理を施して補正騒音スペクトルN′av(f)を求める騒音スペクトル補正段階を更に付加し、ステップS5のスペクトル除算段階で、騒音スペクトルNav(f)の代わりに、補正騒音スペクトルN′av(f)を用いた除算を行うと、スペクトルマスキングの効果を更に向上させることができる。これまで述べてきた基本的な実施形態では、ステップS5のスペクトル除算段階で、「F(f)=Nav(f)/Aav(f)」という除算が行われているが、ここで述べる臨界帯域補正処理を付加した変形例の場合、図14(c) に示すとおり、騒音スペクトルNav(f)の代わりに、補正騒音スペクトルN′av(f)を用いた除算「F(f)=Nav′(f)/Aav(f)」が行われる。
図15は、この臨界帯域補正処理の手順を示す流れ図である。既に述べたとおり、ここに示す実施形態の場合、騒音スペクトルNav(f)は、f=0〜22.05kHzという周波数軸上の範囲に合計m個(具体的には、m=2048)の離散的な周波数を設定し、これら各周波数についてそれぞれエネルギー値を対応づけたものである。そこで、ここでは、この離散的な周波数を示すパラメータとしてjを定め、j=1〜mまで、各周波数について同じ処理を繰り返し行うことにする。
はじめに、ステップS21で、パラメータjを初期値1に設定し、以下の手順をjを1ずつ更新しながら繰り返し実行することにする。まず、ステップS22において、騒音スペクトルNav(f)の第j番目の周波数f(j)について、周波数軸上で当該周波数f(j)を含む所定の参照幅ξ(f(j))の範囲内に入る他の周波数についての各エネルギー値をサンプル値として抽出する処理を行う。
たとえば、図16に示す例は、第j番目の周波数f(j)について、当該周波数f(j)を中心として、グラフの左側に5つのサンプル、右側に5つのサンプル、合計10サンプルが抽出されるような参照幅ξ(f(j))を設定した例である。この場合、第j番目の周波数f(j)について、他の周波数f(j−5)〜f(j−1)およびf(j+1)〜f(j+5)の各エネルギー値がサンプル値として抽出されることになる。
続くステップS23では、こうして抽出したサンプル値の最大値Emax が決定される。図16に示す例の場合、周波数f(j−3)のエネルギー値が10個のサンプル値の中で最大の値Emax をとる。そして、ステップS24で、「Emax >Nav(f(j))」なる条件判断が行われ、条件が成立すれば、ステップS25において、Nav(f(j))をEmax に置き換える処理が行われる。条件不成立の場合は、ステップS25の処理は行われない。図16に示す例の場合、「Emax >Nav(f(j))」なる条件が成立するため、周波数f(j)についての元のエネルギー値Nav(f(j))は、新たなエネルギー値Emax に置き換えられることになる(「×」印から「○」印への置き換え)。
このようなステップS22〜S25の処理が、ステップS26,S27を経て、パラメータjを1ずつ更新させながら、j=mに到達するまで繰り返し実行されることになる。なお、ステップS22においてサンプル値として抽出される値は、ステップS25による置き換え処理が行われる前の元の騒音スペクトルNav(f)のエネルギー値であり、図16に示す例の場合、後のプロセスで周波数f(j)についてのサンプル値として抽出される値は、「○」で示す値Emax ではなく、置き換え前の「×」で示す値になる。
結局、この臨界帯域補正処理の本質は、周波数f(j)を含む所定の参照幅ξ(f(j))の範囲内に入る他の周波数についての各エネルギー値をサンプル値として抽出し、「もとの騒音スペクトルNav(f)の周波数f(j)のエネルギー値Nav(f(j))」と「抽出したサンプル値の最大値Emax 」とを比較し、Emax >Nav(f(j))の場合には、Nav(f(j))をEmax に置き換える処理を、j=1〜mのそれぞれについて実行する処理ということになる。
このような臨界帯域補正処理を施した補正騒音スペクトルN′av(f)を用いた除算「F(f)=Nav′(f)/Aav(f)」により、フィルタ関数F(f)を定めるようにすると、図4のマスキングカーブMに依存したスペクトルマスキングがより効果的に機能するようになる。これは、図16における「×」印から「○」印への置き換えが、結果的に、図4のマスキングカーブにおける音波Aの音量レベルを上げることになるため、その近隣の周波数(図16におけるf(j−3)に対応する周波数)に、比較的音量レベルの大きな騒音成分が存在し、かつ近隣の周波数f(j−3)に対応するオーディオ信号Aの成分が零に近く、フィルタ関数F(j)を乗じても近隣の周波数f(j−3)の音量レベルを上げるように調整することができない場合にも、代わりに近隣に位置する当該周波数f(j)によるマスキング効果が期待できるようにするためである。
このような理由を踏まえると、周波数f(j)についての参照幅ξ(f(j))は、図4に示すマスキングカーブMに基づいて決定すべき数値であることがわかる。すなわち、図16の例において、周波数f(j)のエネルギー値を「×」印から「○」印へ置き換える臨界帯域補正を行い、調整オーディオ信号A*の周波数f(j)の成分のエネルギー値を増加させ、当該成分によって、周波数f(j−3)の騒音成分をマスキングできるような工夫を施したとしても、周波数f(j−3)が周波数f(i)についてのマスキングカーブMの傘下に入らなければ、マスキング効果は奏功しない。
したがって、この臨界帯域補正処理を行う場合、周波数fについての参照幅ξとして、周波数fの音をマスカー音とするスペクトルマスキングカーブの臨界帯域幅ξ(f)を設定するのが好ましい。前述したとおり、マスキングカーブの臨界帯域幅ξ(f)は周波数fに依存して変化する値であるが、図17に示すように、E. Zwickerによって、周波数fの単位をHzとして、
ξ(f)=25+75(1.0+1.4(f/1000)2)0.69
なる近似式が成り立つことが報告されている(E. Zwicker and E. Terhardt, "Analytical expressions for critical-band rate and critical bandwidth as a function of frequency", Journal of Acoustical Society of America, Vol. 68, no. 5, pp.1523-1525, November 1980/辻川美沙貴、森勢将雅、西浦敬信:「聴覚マスキングに基づく高周波雑音の快音化法の基礎的検討」、日本音響学会・2010年春季研究発表会・講演論文集、1-R-19, pp.631-632, March 2010)。
このE. Zwickerの近時式によれば、たとえば、f=1000Hzの場合、臨界帯域幅ξ(1000)≒162Hzとなる。そこで、図16に示す例において、周波数f(j)=1000Hzであれば、図4に示すとおり、マスキングカーブMのピークが低音側にずれた左右非対称形状であることを考慮し、たとえば、1000Hzを中心として右側に偏った幅をとり、左側の幅を臨界帯域幅の20%、右側の幅を臨界帯域幅の80%と設定し、968Hz〜1129Hzの範囲を参照幅ξ(f(j))とすればよい。
<6−2:フィルタ平滑化処理>
ここで述べるフィルタ平滑化処理は、図6のステップS5「スペクトル除算段階」で算出された除算スペクトル(フィルタ関数)F(f)に対して施す補正処理である。図18は、このフィルタ平滑化処理の基本概念を示すグラフである。図18(a) は、ステップS5で算出された除算スペクトルF(f)、すなわち、これまでの実施形態において、イコライザ処理にフィルタ関数として用いていたグラフを示している(図7(c) と同じグラフ)。このフィルタ平滑化処理は、図6のステップS5に続いて、ステップS50として実行すべき処理であり、除算スペクトルF(f)の周波数特性を若干補正して、補正除算スペクトルF′(f)を求める処理である。
ここで、除算スペクトルF(f)に対して平滑化を施す理由は次のとおりである。まず、除算に用いる2つのスペクトルNav(f),Aav(f)は、いずれも周波数方向に連続した特性を有するが、除算を行うことによって周波数方向の連続性が維持できず、零に近い値で割り算する箇所など、周波数方向に不連続点(微分係数が無限大になる点)が発生してしまう。このため、得られた除算スペクトルF(f)をそのままフィルタ関数としてオーディオ信号Aのスペクトルに乗算すると、不連続点の箇所でスパイクノイズが重畳されたり、オーディオ信号Aに歪みが発生してしまい、鑑賞に耐えない再生音になる可能性がある。前述した臨界帯域補正は、割り算の分子側のスペクトルNav(f)を平滑化する作用もあるが、このフィルタ平滑化処理を行うことにより、除算スペクトルF(f)が周波数方向に連続した関数になるように、すなわち、すべての周波数の箇所において微分係数が有限値になるように補正を施すことができる。
このように、除算スペクトルF(f)に対して補正処理を施して補正除算スペクトルF′(f)を求める除算スペクトル補正段階を更に付加し、ステップS6のイコライズ処理段階で、補正除算スペクトルF′(f)をフィルタ関数とする周波数フィルタを用意し、オーディオ信号Aを当該フィルタに通して調整オーディオ信号A*を得るようにすれば、より品質の高い調整オーディオ信号A*を得ることができる。特に、除算スペクトルF(f)に対して平滑化を行うことにより補正除算スペクトルF′(f)を求める処理は、音楽コンテンツに基づいて品質の高い調整オーディオ信号A*を得る上で効果的である。
たとえば、図18(a) に示す除算スペクトル(フィルタ関数)F(f)には、4つの大きなピークが存在する。このような特性をもったフィルタ関数を用いてイコライズ処理を行うと、もとのオーディオ信号に歪みが生じやすい。特に、音楽コンテンツに対して、このようなフィルタ関数を用いたイコライズ処理を加えた場合、再生された音楽に歪みが生じ、聞いた場合に違和感が生じることがある。
そこで、図18に示す例のように、フィルタ平滑化処理を行い、図18(b) に示すような補正除算スペクトルF′(f)を求め、これをフィルタ関数として用いたイコライズ処理を行うようにする。図18(b) に示すスペクトルF′(f)は、図18(a) に示すスペクトルF(f)に比べて、4つの大きなピークが緩慢になり、全体的になだらかなカーブを描くグラフになっている。このため、音楽コンテンツに対して、スペクトルF′(f)を用いたイコライズ処理を加えても、歪みの少ない再生音が得られる。
もちろん、平滑化の程度が大きければ大きいほど、本発明の基本原理から外れた調整オーディオ信号A*が得られることになるので、騒音成分をマスキングする効果は低下する。したがって、実用上は、再生音の歪み除去と騒音に対するマスキング効果との兼ね合いをみながら、平滑化の程度を定めるようにすればよい。
このような平滑化処理の技術自体は、様々な分野で広く利用されており、具体的な手法も様々である。ここでは、最も単純な方法を1つだけ例示しておく。いま、図18(a) に示すように、第j番目の周波数f(j)に着目する。そして、この周波数f(j)を中心として、所定の平滑幅Uを定める。平滑幅Uが大きければ大きいほど、平滑化の程度も大きくなる。そして、この平滑幅Uの範囲内に含まれている周波数の重みの平均値を算出し、周波数f(j)についての重みの値を、算出した平均値に置き換える処理を行う。同様の処理を、個々の周波数値について行えば、図18(b) に示すような平滑化されたグラフが得られる。
<6−3:白色ノイズ付加処理>
ここで述べる白色ノイズ付加処理は、図6のステップS6「イコライズ処理段階」においてイコライズ処理の対象となるオーディオ信号Aに対して施す補正処理であり、その基本概念は、オーディオ源が発生するオーディオ信号Aに対して補正処理を施して補正オーディオ信号A′を求めるオーディオ信号補正段階を行い、イコライズ処理段階S6で、オーディオ信号Aの代わりに、補正オーディオ信号A′をフィルタに通すことにより調整オーディオ信号A*を得ることにある。
イコライズ処理前にオーディオ信号Aに対して補正処理を施しておく理由は、オーディオ信号Aは、時系列に変動するため特定の周波数成分が零に近い値になる場合もあり、その際、フィルタ関数を乗算した結果も零に近い値となり、所望のマスキング効果が得られなくなってしまうためである。図13に示されているとおり、イコライズ処理段階で、フレーム単位のオーディオ信号A(図13(a) )はフーリエ変換され、実数部Re(A(k,f))および虚数部Im(A(k,f))というスペクトルが生成される(図13(b) )。そして、これらの各スペクトルにそれぞれフィルタ関数F(f)を乗算することにより(図13(c) )、調整実数部Re(A*(k,f))および調整虚数部Im(A*(k,f))が生成され(図13(d) )、更に逆フーリエ変換を経て、フレーム単位の調整オーディオ信号A*が得られる(図13(e) )。
ここで、図13(b) に示す実数部Re(A(k,f))および虚数部Im(A(k,f))という周波数スペクトルの一部の特定周波数について欠けが生じており、当該特定周波数のエネルギー値が零であった場合を考えよう。この場合、図13(d) に示す調整実数部Re(A*(k,f))および調整虚数部Im(A*(k,f))の当該特定周波数のエネルギー値は、フィルタ関数F(f)の重みがどれだけ大きな値であっても、零との積になるため、やはり零になる。すなわち、当該特定周波数についてのフィルタ関数F(f)の重みが非常に大きな値であっても、逆フーリエ変換後に得られる調整オーディオ信号A*には、当該特定周波数成分が欠けた状態となり、騒音に対する十分なマスキングを行うことができなくなる。
このような弊害を避けるためには、予めオーディオ信号Aに生じている周波数成分の欠けを補填する補正処理を行っておくのが好ましい。周波数成分の欠けを補填する補正処理として、最も単純な処理が、白色ノイズ付加処理である。すなわち、予めオーディオ信号Aに白色ノイズを付加する補正を行い、補正オーディオ信号A′を求め、この補正オーディオ信号A′に対してイコライズ処理を行うようにすれば、最終的に得られる調整オーディオ信号A*に、特定周波数成分の欠けが生じることを防ぐことができる。
図19は、この白色ノイズ付加処理の基本概念を示すグラフである。図19(a) は、図10に示すイコライズ処理のステップS62によって求められたフーリエ変換スペクトルのグラフである。実際には、図13(b) に示すとおり、実数部Re(A(k,f))および虚数部Im(A(k,f))という2つのスペクトルが生成される。この白色ノイズ付加処理は、図10のステップS62に続いて、ステップS62−2として実行すべき処理であり、フーリエ変換処理によって得られる実数部Re(A(k,f))および虚数部Im(A(k,f))に対して、白色ノイズを付加することにより、補正実数部Re(A′(k,f))および補正虚数部Im(A′(k,f))を求める処理である。
図10のステップS63では、実数部Re(A(k,f))の代わりに、補正実数部Re(A′(k,f))に対してフィルタ関数F(t)を乗じることにより調整実数部Re(A*(k,f))を求め、虚数部Im(A(k,f))の代わりに、補正虚数部Im(A′(k,f))に対してフィルタ関数F(t)を乗じることにより調整虚数部Im(A*(k,f))を求めることになる。白色ノイズの付加により、補正実数部Re(A′(k,f))および補正虚数部Im(A′(k,f))には、特定周波数成分の欠けが存在しないため、逆フーリエ変換によって最終的に得られる調整オーディオ信号A*にも、特定周波数成分の欠けが生じることはない。
白色ノイズ付加処理の具体的な手法としては、実数部Re(A(k,f))および虚数部Im(A(k,f))について、所定の設定値E0未満のエネルギー値をとる所定範囲内の周波数については、エネルギー値を設定値E0に変更する処理を行えばよい。図19(b) に示す例では、下限周波数fLおよび上限周波数fHを設定し、周波数fL〜fHの範囲について、設定値E0未満のエネルギー値をとる場合に、エネルギー値を設定値E0に変更する処理を行っている。したがって、補正実数部Re(A′(k,f))および補正虚数部Im(A′(k,f))の周波数fL〜fHの範囲についてのエネルギー値は必ずE0以上になり、もとのオーディオ信号に特定周波数成分の欠けがあったとしても、当該欠けは補填されることになる。
<6−4:変形例に係る快音化方法の手順>
図20は、§6で述べた本発明の変形例に係る快音化方法の基本手順を示す流れ図である。この手順には、これまで述べた臨界帯域補正処理、フィルタ平滑化処理、白色ノイズ付加処理というすべての補正処理が盛り込まれている。
すなわち、図20に示す流れ図は、基本的には、図6の流れ図に沿ったものであるが、ステップS2の後に、ステップS20として、騒音スペクトル補正段階(臨界帯域補正処理:図14〜図17参照)が付加され、ステップS5の後に、ステップS50として、除算スペクトル補正段階(フィルタ平滑化処理:図18参照)が付加され、ステップS6内に(図10のステップS62の後に)、ステップS62−2として、オーディオ信号補正段階(白色ノイズ付加処理:図19参照)が付加されている。
<<< §7. 快音化装置の変形例 >>>
本発明の基本的実施形態に係る快音化装置については、既に、図3を参照しながら説明した。ここでは、この基本的実施形態に対するいくつかの変形例を図21〜図27を参照しながら説明する。なお、以下の変形例の説明では、先行して説明した実施形態と同一の構成要素については同一符号を付して説明を省略することとし、主として、新たに付加された構成要素あるいは改変された構成要素についての説明を行うことにする。
<7−1:複数コンテンツの利用>
図21に示す第1の変形例は、図3に示す基本的実施形態に、更に、コンテンツ&フィルタ入力部106、コンテンツ選択部115、音圧レベル調整部145を付加し、コンテンツ格納部110内に複数のコンテンツCを格納し、フィルタ格納部130内に複数のフィルタ関数F(f)を格納したものである。図21に示すオーディオ信号供給部100Aは、上記特徴を有するデジタルユニットということになる。
図3に示す基本的実施形態では、コンテンツ格納部110内に単一のコンテンツCのみしか用意されておらず、常に同一のコンテンツCに基づく調整オーディオ信号A*が再生されることになるので、ユーザが飽きを感じる可能性がある。そこで、実用上は、図21に示す変形例のように、コンテンツ格納部110内に複数n通りのコンテンツが格納できるようにしておくのが好ましい。
ただ、複数n通りのコンテンツを用意した場合、フィルタ関数も各コンテンツに対応して用意しておく必要がある。本発明の原理上、フィルタ関数は、特定の騒音信号Nを、特定のオーディオ信号A(コンテンツC)によってマスクするのに適した固有の周波数特性をもった固有の関数になるので、再生対象となるコンテンツごとにそれぞれ異なるフィルタ関数を用意する必要がある。そこで、フィルタ格納部130内には、複数n通りのコンテンツのそれぞれに対応した合計n通りのフィルタ関数が格納されている。
複数n通りのコンテンツのうち、再生対象となる第i番目(i=1〜n)のコンテンツを選択するために、コンテンツ選択部115が設けられている。コンテンツ選択部115による選択方法は、自動選択でもよいし、外部からの選択操作に基づく手動選択でもよい。自動選択の場合は、複数n通りのコンテンツを順番に選択してゆく方法をとることもできるし、ランダムに任意のコンテンツを選択してゆく方法をとることもできる。手動選択の場合は、ユーザの選択操作などの外部入力によって指定された特定のコンテンツを選択すればよい。
こうして、コンテンツ選択部115によって第i番目のコンテンツが選択されると、選択されたコンテンツCがイコライザ120へ読み出される。イコライザ120は、この第i番目のコンテンツCについての調整コンテンツC*を生成するために、これに対応した第i番目のフィルタ関数F(f)をフィルタ格納部130から読み出し、周波数特性の調整を行う。コンテンツ再生部140は、この選択された第i番目のコンテンツCに対応する調整コンテンツC*を再生し、アナログオーディオ信号をオーディオ出力部200に対して出力する。
このように、コンテンツ格納部110内に複数のコンテンツを格納するようにし、コンテンツ選択部115によって選択して再生することができるようにしておけば、ユーザを飽きさせることなく、騒音に対する快音化が可能になる。しかも、個々のコンテンツを再生する際には、それぞれ対応したフィルタ関数を用いたイコライズ処理が行われるため、いずれのコンテンツを選択しても、十分な快音化効果が得られる。
この第1の変形例には、更に、コンテンツ&フィルタ入力部106が設けられており、外部から与えられる新たなコンテンツCおよびフィルタ関数F(f)の組み合わせを入力し、それぞれコンテンツ格納部110およびフィルタ格納部130に格納する機能を果たす。この機能により、デジタルユニット100A内に、新しいコンテンツCと、当該コンテンツCに対するイコライズ処理を行うために用いる新しいフィルタ関数F(f)とを追加することが可能になる。もちろん、必要に応じて、コンテンツ&フィルタ入力部106に、コンテンツ格納部110内の不要なコンテンツと、フィルタ格納部130内の不要なフィルタ関数とを消去する機能をもたせておいてもよい。
コンテンツ&フィルタ入力部106が外部からコンテンツCおよびフィルタ関数F(f)の組み合わせを取り込むための具体的な方法としては、CD,DVD,ICカードなどの情報記録媒体から読み込む方法、インターネットを利用してWeb配信で受ける方法、ラジオ放送などを利用してダウンロードする方法など、様々な方法を採用することができる。たとえば、図9(c) に示す例の場合、本発明に係る快音化装置はヘアードライヤー10に内蔵されているが、コンテンツ&フィルタ入力部106としてラジオチューナーを組み込んだ装置を用い、ラジオ放送を利用してダウンロードする方法を採用すれば、外部に対する配線などは不要になる。
図21に示す第1の変形例には、更に、音圧レベル調整部145が設けられている。この音圧レベル調整部145は、外部からの手動設定操作に基づいて、コンテンツ再生部140によって再生される調整コンテンツC*の再生音圧レベルを調整する機能を有する。調整コンテンツC*を再生することによって得られる調整オーディオ信号A*が、騒音信号Nに対するマスキング効果を奏するためには、図4に示すスペクトルマスキングの原理に応じた所定の音量でスピーカ220から出力される必要がある。この変形例では、この再生音圧レベルの調整操作をユーザの手に委ねている。ユーザは、手動設定操作により、騒音が低減したと感じる適当な音圧レベルに調整を行えばよい。
図9(b) や図9(c) に示す例のように、快音化の対象となる騒音源10が特定のヘアードライヤーであることが決まっており、しかも快音化装置が当該ヘアードライヤーに装着もしくは内蔵されている場合は、騒音源10が発生する騒音の音圧レベルも予想でき、当該騒音をマスクするために必要な調整オーディオ信号A*の音圧レベルも予想できるので、音圧レベル調整部145を設けなくても、適切な音圧レベルで調整オーディオ信号A*をスピーカ220から出力することができよう。しかしながら、図9(a) に示す例のように、騒音源10とは別体の快音化装置を、騒音源10の近傍に配置して利用する形態の場合は、両者の位置関係によって、適切な音圧レベルは変わってくる。このような利用形態では、音圧レベル調整部145を設けておくのが好ましい。
<7−2:音圧レベルの自動調整>
図22に示す第2の変形例は、図21に示す第1の変形例に、更に、騒音信号採取部150、音圧レベル検出部160、電源制御部170、そして騒音収録マイク230を付加したものである。図22に示すオーディオ信号供給部100Bは、上記特徴を有するデジタルユニットということになる。
騒音信号採取部150は、騒音源10が発生する騒音信号Nを採取する構成要素であり、実際には、騒音源10の近傍に設置された騒音収録マイク230が集音した騒音信号Nを電気信号として取り込む構成要素である。一方、音圧レベル検出部160は、騒音信号採取部150が採取した騒音信号Nの音圧レベルを検出する構成要素であり、検出した騒音の音圧レベルは音圧レベル調整部145に報告される。音圧レベル調整部145は、音圧レベル検出部160が検出した騒音の音圧レベルに基づいて、コンテンツ再生部140によって再生される調整コンテンツの再生音圧レベルを調整する。
結局、この第2の変形例に係るデジタルユニット100Bは、騒音源10が発生する騒音信号Nの音圧レベルをリアルタイムで実測する機能を有しており、この実測値に基づいて、調整オーディオ信号A*の音圧レベルを自動調整することができる。このため、騒音源10が発生する騒音信号Nの音圧レベルが変化するようなケースでも、調整オーディオ信号A*の音圧レベルが騒音をマスクするのに適したレベルになるように自動調整することが可能になる。
たとえば、「温風/冷風」のモード切替や、「LO/HIGH」のモード切替があるヘアードライヤーの場合、動作モードによって発生する騒音の音圧レベルが変化することになる。動作モードが同じでも、周囲の温度や湿度によって、騒音の音圧レベルが変化するようなケースもあろう。図22に示す第2の変形例では、このようなケースにも柔軟に対応することが可能である。具体的には、図9(b) や図9(c) に示す例のように、快音化装置が騒音源10となるヘアードライヤーに装着もしくは内蔵されている場合、騒音収録マイク230も同様に所定箇所に装着もしくは内蔵されるようにしておけば、音圧レベル検出部160により、騒音源10が発生する騒音の絶対的な音圧レベルを検出することができるので、当該騒音をマスクするために必要な調整オーディオ信号A*の音圧レベルを正確に予測して自動設定することが可能になる。
ここに示す第2の変形例のもうひとつの特徴は、電源制御部170の機能である。この電源制御部170は、デジタルユニット100B内の各構成要素および必要に応じてアナログユニット200内の各構成要素に対して、動作に必要な所定の電源を供給する基本機能を有しており、外部からのON/OFF操作により、各構成要素への電源供給を行ったり、これを停止したりする。すなわち、ユーザが電源制御部170に対してON操作を行うと、各構成要素への電源供給が行われ、この快音化装置は動作を開始する。一方、OFF操作を行うと、各構成要素への電源供給が停止され、この快音化装置は動作を停止する。
この電源制御部170は、更に、外部からON操作が行われているにもかかわらず、この快音化装置を節電のための休止モードへ移行させる機能も有している。すなわち、図22に示されているとおり、電源制御部170には、音圧レベル検出部160から騒音の音圧レベルの検出値が与えられており、音圧レベル検出部160が検出した音圧レベルが所定のしきい値未満である状態が所定時間継続した場合には、騒音信号採取部150および音圧レベル検出部160を除く構成要素に対する電源供給を停止する休止モードへと移行し、音圧レベルが所定のしきい値を越えた場合に当該休止モードを解除する制御を実行する。
すなわち、騒音収録マイク230を用いてリアルタイムで収録した騒音信号Nの音圧レベルが所定のしきい値未満となり、そのような状態が所定時間継続した場合には、電源制御部170によって、もはや騒音に対する快音化対策は不要との判断がなされ、節電が可能な休止モードへと自動的に移行することになる。この休止モードでも、騒音信号採取部150および音圧レベル検出部160には電源供給がなされているので(もちろん、電源制御部170には、OFF操作が行われるまで、常に電源供給が行われている)、騒音信号Nの音圧レベルは、休止モード中もリアルタイムで検出され続ける。したがって、音圧レベルが所定のしきい値を越えた場合には、休止モードを解除する制御を行うことができる。
なお、休止モード中は、騒音信号採取部150および音圧レベル検出部160を除く構成要素すべてに対する電源供給を必ずしも停止する必要はなく、電力消費の大きい一部の構成要素に対する電源供給のみを停止するようにしてもかまわない。
上述した「休止モード」は、リアルタイムで検出した騒音信号Nの音圧レベルに基づいて設定されるモードであるが、電源制御部170には、騒音源10の稼働状態に基づいて「待機モード」へ移行する機能も備わっている。
すなわち、ヘアードライヤーなどの電気機器は、電力によって稼働する装置であり、そのような装置の稼働状態は、電気的にモニタすることが可能である。特に、図9(b) ,(c) に示すように、騒音源10が電力によって稼働する装置であり、かつ、快音化装置を当該騒音源10に装着もしくは内蔵して用いる利用形態をとる場合は、騒音源10から電源制御部170まで電気信号を伝達するための信号線を引けば(図22において、騒音源10から電源制御部170まで引かれた矢印が、この信号線を示している)、電源制御部170は、当該電気信号に基づいて、騒音源10の稼働状態をモニタすることが可能になる。したがって、電源制御部170は、そのモニタ結果に基づいて、待機モードへの移行制御を行うことができる。
具体的には、電源制御部170は、モニタの結果、騒音源10が稼働停止状態にある場合には、電源制御部170以外の構成要素に対する電源供給を停止する待機モードへと移行し、騒音源10が稼働状態にある場合には、待機モードを解除する制御を行うことができる。結局、図22に示す変形例では、ヘアードライヤー10が稼働状態にある場合は、各構成要素への電源供給が行われるが、ヘアードライヤー10が稼働停止状態になると、電源制御部170以外の各構成要素への電源供給が停止し、節電を行うことができる。
なお、待機モード中は、電源制御部170を除く構成要素に対する電源供給を必ずしもすべて停止する必要はなく、電力消費の大きい一部の構成要素に対する電源供給のみを停止するようにしてもかまわない。
結局、図22に示す変形例に係る快音化装置(ユニット100Bとユニット200)では、休止モードおよび待機モードのいずれかのモードに移行した場合には、一部の構成要素に対する電源供給が停止し、調整オーディオ信号A*の出力が停止することになる。その結果、騒音の音量が小さいときには、装置を休止モードとして電力を節約することができ、騒音源が稼働していないときには、待機モードに移行して電力を節約することができる。
<7−3:フィルタ関数の作成機能>
図23に示す第3の変形例は、図3に示す基本的実施形態に、更に、騒音信号採取部150、フィルタ作成部180、そして騒音収録マイク230を付加したものである。図23に示すオーディオ信号供給部100Cは、上記特徴を有するデジタルユニットということになる。
騒音信号採取部150は、上述した第2の変形例でも用いられていた構成要素であり、騒音源10の近傍に設置された騒音収録マイク230が集音した騒音信号Nを電気信号として取り込む構成要素である。この第3の変形例の重要な特徴は、フィルタ作成部180によるフィルタ作成機能である。すなわち、フィルタ作成部180は、コンテンツ格納部110に格納されているコンテンツCと、騒音信号採取部150が採取した騒音信号Nとに基づいて、フィルタ関数F(f)を作成する機能を有している。こうして作成されたフィルタ関数F(f)は、フィルタ格納部130へ格納される。
コンテンツCと騒音信号Nとに基づいて、フィルタ関数F(f)を作成する具体的な方法は、既に§3あるいは§6で述べたとおりである。これまで述べてきた快音化装置の実施形態は、装置内部にフィルタ関数を作成する機能を有していないため、予め外部でフィルタ関数を作成しておき、これをフィルタ格納部130に格納する必要があった。これに対して、図23に示す第3の変形例では、フィルタ作成部180が、騒音源10の発生する騒音信号Nの周波数特性と、コンテンツ格納部110に格納されているコンテンツCの周波数特性とを解析し、コンテンツCに基づく再生音によって騒音信号Nをマスクするために適したフィルタ関数F(f)を自動的に作成する機能を有している。
この変形例の利点は、対応可能な騒音源が特定の騒音源に限定されず、どのような騒音源に対しても臨機応変に対応できる点である。たとえば、図23に示す例の場合、騒音源10は特定のヘアードライヤーであり、フィルタ格納部130内に予め格納されているフィルタ関数F(f)は、この特定のヘアードライヤーが発生する騒音を、特定のコンテンツCを用いてマスクするために有用な固有のフィルタ関数である。したがって、騒音源が異なった場合、当該フィルタ関数F(f)をそのまま利用することはできない。しかしながら、そのような場合でも、フィルタ作成部180によって、新たな騒音源に適したフィルタ関数を作成することが可能なので、そのような新たに作成したフィルタ関数を用いた対応が可能になる。
たとえば、新たな騒音源10として、電気掃除機が出現したものとしよう。この場合、フィルタ作成部180は、図6の流れ図に示されている準備段階(ステップS1〜S5)の処理を実行し、新たなフィルタ関数F(f)を算出する。すなわち、騒音信号採取部150によって、当該電気掃除機が発生する騒音信号Nを所定のサンプル期間だけ採取し(ステップS1)、その時間平均スペクトルとして、騒音スペクトルNav(f)を算出する(ステップS2)。一方、コンテンツ格納部110に格納されているコンテンツCから、オーディオ信号Aを採取し(ステップS3)、その時間平均スペクトルとして、オーディオスペクトルAav(f)を算出する(ステップS4)。最後に、Nav(f)/Aav(f)なる除算を行いフィルタ関数F(f)を算出する(ステップS5)。
こうして新たに算出したフィルタ関数F(f)は、電気掃除機が発生する騒音を、特定のコンテンツCを用いてマスクするために有用な固有のフィルタ関数である。したがって、この新たなフィルタ関数F(f)をフィルタ格納部130に格納し、イコライザ120によるイコライズ処理に利用すれば、電気掃除機が発生する騒音を効果的にマスク可能な調整オーディオ信号A*を得ることができる。もちろん、新たなフィルタ関数F(f)を算出する際には、必要に応じて、図20の流れ図に示されている臨界帯域補正処理(ステップS20)、フィルタ平滑化処理(ステップS50)を行ってもかまわない。
なお、フィルタ作成部180が、新たなフィルタ関数F(f)を作成する処理を行う際に、ユーザが、フィルタ関数の有効周波数範囲を設定できるようにしておくと、用途に適したフィルタ関数を作成することが可能になる。たとえば、騒音に含まれる人間の声だけをマスキングしたいような場合、人間の声の主たる周波数領域である300〜3400Hzという有効周波数範囲の指定を行えばよい。フィルタ作成部180が、この周波数範囲内についてのみ有効なフィルタ関数を作成すれば(別言すれば、当該範囲外の周波数については重みが1となるフィルタ関数を作成すれば)、イコライズ処理では、当該範囲外の周波数成分についての変動は生じないので、当該範囲外の周波数成分についてマスキング効果を向上させる作用は生じないことになる。したがって、300〜3400Hzという周波数帯域を主とする人間の声だけを選択的にマスキングするようなことも可能になる。
図24に示す第4の変形例は、図23に示す第3の変形例に、更に、コンテンツ入力部116、コンテンツ選択部115、音圧レベル調整部145、音圧レベル検出部160、電源制御部170を付加し、コンテンツ格納部110内に複数のコンテンツCを格納し、フィルタ格納部130内に複数のフィルタ関数F(f)を格納したものである。図24に示すオーディオ信号供給部100Dは、上記特徴を有するデジタルユニットということになる。
図23に示す第3の変形例では、コンテンツ格納部110内に単一のコンテンツCのみしか用意されていなかったが、図24に示す第4の変形例では、コンテンツ格納部110内に複数n通りのコンテンツが格納でき、コンテンツ選択部115によって、任意のコンテンツを選択して再生に供することができる。このような複数n個のコンテンツの取り扱いに関しては、図21に示す第1の変形例と全く同様である。
この第4の変形例には、コンテンツ入力部116が設けられており、外部から与えられた新たなコンテンツCを入力し、コンテンツ格納部110に格納する機能を果たす。この機能により、デジタルユニット100D内に、新しいコンテンツCを追加することが可能になる。もちろん、必要に応じて、コンテンツ入力部116に、コンテンツ格納部110内の不要なコンテンツを消去する機能をもたせておいてもよい。
コンテンツ入力部116が外部からコンテンツCを取り込むための具体的な方法としては、第1の変形例と同様に、CD,DVD,ICカードなどの情報記録媒体から読み込む方法、インターネットを利用してWeb配信で受ける方法、ラジオ放送などを利用してダウンロードする方法など、様々な方法を採用することができる。しかも、この第4の変形例は、フィルタ作成機能を有しているため、外部から新たなコンテンツCを取り込んだ場合でも、当該コンテンツCに対応するフィルタ関数を一緒に取り込む必要はない。
すなわち、コンテンツ選択部115によって、コンテンツ格納部110内に格納されている複数のコンテンツのうち、新たに外部から取り込まれた新規コンテンツCが初めて選択された場合、フィルタ作成部180が、当該新規コンテンツCと騒音信号採取部150が採取した騒音信号Nとに基づいて、新たなフィルタ関数を作成し、作成したフィルタ関数を当該新たなコンテンツに対応するフィルタ関数としてフィルタ格納部130に格納する処理を行うことができる。
一方、イコライザ120は、当該新規コンテンツCについての調整コンテンツC*を生成する際に、上記プロセスで新たに作成されたフィルタ関数を用いて周波数特性の調整を行えばよい。そうすれば、コンテンツ再生部140から出力される調整オーディオ信号A*は、新たに外部から取り込まれた新規コンテンツCに基づく再生音でありながら、騒音源10が発生する騒音信号Nを効果的にマスクすることができる。
このように、この第4の変形例では、外部から取り込んだ任意のコンテンツCを利用することができ、しかも内部でフィルタ関数を作成することができるため、コンテンツの入手プロセスは極めて広範になる。すなわち、外部からコンテンツCを取り込む際に、フィルタ関数を一緒に取り込む必要がないので、現在、一般のユーザがコンテンツ入手に利用している様々なルート(たとえば、CDなどの媒体購入、Web経由のダウンロード、テレビやラジオ放送の録音、ライブ演奏の録音など)により、新たなコンテンツの取り込みが可能になる。
なお、騒音信号採取部150が採取した騒音信号Nの音圧レベルを、音圧レベル検出部160によって検出し、音圧レベル調整部145が、この検出した音圧レベルに基づいて、コンテンツ再生部140によって再生される調整コンテンツC*の再生音圧レベルを調整する機能を有する点、音圧レベル検出部160が検出した音圧レベルに基づいて、電源制御部170が休止モードへの移行制御を行って節電を行う点、電源制御部170が、騒音源10の稼働状態をモニタして待機モードへの移行制御を行って節電を行う点については、先行して述べた変形例と全く同様である。
<7−4:イコライザの省略>
図25に示す第5の変形例は、図3に示す基本的実施形態をより単純化したものである。すなわち、図25に示すオーディオ信号供給部100Eは、調整コンテンツ格納部190とコンテンツ再生部140とによる単純な構成をとっており、イコライザ120やフィルタ格納部130という構成要素は省略されている。
すなわち、この第5の変形例に係る快音化装置では、イコライズ処理を行う必要はない。これは、調整コンテンツ格納部190内に、外部の装置で予めイコライズ処理を完了した調整コンテンツC*が収容されているためである。すなわち、外部の装置において、予め、オーディオ信号を発生させる元のコンテンツに対して、騒音源10が発生する騒音を快音化する固有の周波数特性をもつような調整を施すイコライズ処理を行い、このイコライズ処理の結果として得られた調整コンテンツC*を、調整コンテンツ格納部190に格納しておくのである。要するに、図3に示す装置において、イコライザ120から出力される調整コンテンツC*を、図25に示す装置における調整コンテンツ格納部190内に格納しておくことになる。
結局、調整コンテンツ格納部190内に格納されている調整コンテンツC*は、「騒音源10が発生する騒音信号Nの所定時間内の平均周波数分布を示す騒音スペクトルNav(f)」を、「元のコンテンツを再生することにより発生するオーディオ信号Aの所定時間内の平均周波数分布を示すオーディオスペクトルAav(f)」で除する除算演算を行うことにより得られるスペクトルをフィルタ関数として、元のコンテンツの周波数特性を調整することにより得られたコンテンツということになる。したがって、コンテンツ再生部140によって、当該調整コンテンツC*を再生し、スピーカ220から再生音を出力すれば、スピーカ220から音波として出力される調整オーディオ信号A*は、図3に示す快音化装置から音波として出力される調整オーディオ信号A*と全く同一のものになり、騒音信号Nをマスクする効果を有する。
この第5の変形例は、特に、図9(b) や図9(c) に示す例のように、快音化装置を特定の騒音源に装着もしくは内蔵して利用する場合に最適である。
図26に示す第6の変形例は、図25に示す第5の変形例に、更に、調整コンテンツ入力部196、コンテンツ選択部195、音圧レベル調整部145を付加し、コンテンツ格納部190内に複数の調整コンテンツC*を格納したものである。図26に示すオーディオ信号供給部100Fは、上記特徴を有するデジタルユニットということになる。
図25に示す第5の変形例では、調整コンテンツ格納部190内に単一の調整コンテンツC*のみしか用意されていなかったが、図26に示す第6の変形例では、調整コンテンツ格納部190内に複数n通りの調整コンテンツが格納でき、コンテンツ選択部195によって、任意の調整コンテンツを選択して再生に供することができる。このような複数n個の調整コンテンツの取り扱いに関しては、これまで述べてきた先行する変形例における複数コンテンツの取り扱いと同様である。
また、この第6の変形例には、調整コンテンツ入力部196が設けられており、外部から与えられた新たな調整コンテンツC*を入力し、調整コンテンツ格納部190に格納する機能を果たす。この機能により、デジタルユニット100F内に、新しい調整コンテンツC*を追加することが可能になる。もちろん、必要に応じて、調整コンテンツ入力部196に、調整コンテンツ格納部190内の不要な調整コンテンツを消去する機能をもたせておいてもよい。
調整コンテンツ入力部196が外部から調整コンテンツC*を取り込むための具体的な方法としては、先行する変形例で述べたような様々な方法が考えられる。ただ、コンテンツCが汎用性のある一般的なデジタルコンテンツであるのに対して、調整コンテンツC*は、特定の騒音源10が発生する騒音をマスクするのに適した固有の周波数特性をもつようにイコライズ処理された固有のコンテンツである。したがって、入手経路は、そのような固有のコンテンツの配布元に限定されることになる。
図26に示す第6の変形例には、更に、音圧レベル調整部145が設けられている。この音圧レベル調整部145は、外部からの手動設定操作に基づいて、コンテンツ再生部140によって再生される調整コンテンツC*の再生音圧レベルを調整する機能を有する。
図27に示す第7の変形例は、図26に示す第6の変形例に、更に、騒音信号採取部150、音圧レベル検出部160、電源制御部170、そして騒音収録マイク230を付加したものである。図27に示すオーディオ信号供給部100Gは、上記特徴を有するデジタルユニットということになる。
ここで、騒音信号採取部150が採取した騒音信号Nの音圧レベルを、音圧レベル検出部160によって検出し、音圧レベル調整部145が、この検出した音圧レベルに基づいて、コンテンツ再生部140によって再生される調整コンテンツC*の再生音圧レベルを調整する機能を有する点、音圧レベル検出部160が検出した音圧レベルに基づいて、電源制御部170が休止モードへの移行制御を行って節電を行う点、電源制御部170が、騒音源10の稼働状態をモニタして待機モードへの移行制御を行って節電を行う点については、先行して述べた変形例と全く同様である。
<<< §8. 具体的な実験結果 >>>
最後に、本発明に係る快音化方法を、3種類の騒音源について実施した具体的な実験結果を掲載しておく。
図28および図29は、電気掃除機を騒音源とした実験結果を示すグラフである。すなわち、図28(a) の上段には、電気掃除機が発生する騒音信号Nの波形が示されており、下段には、マスキングに用いる歌声のコンテンツを再生することにより得られるオーディオ信号Aの波形が示されている。いずれも横軸は時間軸、縦軸は振幅軸である。また、図28(b) の上段は、図28(a) の上段に示されている騒音信号Nの時間平均フーリエ変換スペクトルNav(f)、図28(b) の下段は、図28(a) の下段に示されているオーディオ信号Aの時間平均フーリエ変換スペクトルAav(f)である。いずれも横軸は周波数軸、縦軸はエネルギー値である。そして、図28(c) は、図28(b) に示す2つのスペクトルの除算「Nav(f)/Aav(f)」によって得られたフィルタ関数である。
一方、図29(a) の上段には、図28(a) の上段と全く同じ騒音信号Nの波形が示されている。これに対して、図29(a) の下段には、図28(a) の下段に示されているオーディオ信号Aに対して、図28(c) に示すフィルタ関数を用いたイコライズ処理を施すことにより得られた調整オーディオ信号A*の波形が示されている。このグラフでも、横軸は時間軸、縦軸は振幅軸である。この波形図では、オーディオ信号Aと調整オーディオ信号A*との相違は明確には認識できないが、フーリエ変換スペクトルで比べると、その相違がはっきりする。
すなわち、図29(b) の上段には、図28(b) の上段と全く同じ騒音スペクトルNav(f)が示されている。これに対して、図29(b) の下段には、図29(a) の下段に示されている調整オーディオ信号A*の時間平均フーリエ変換スペクトルA*av(f)が示されている。いずれも横軸は周波数軸、縦軸はエネルギー値である。
ここで、図28(b) の下段(オーディオスペクトルAav(f))と、図29(b) の下段(調整オーディオスペクトルA*av(f))とを比較すると、図29(b) の下段に矢印で示した部分のスペクトルに盛り上がりが生じていることがわかる。しかも、この盛り上がりを生じている位置は、図29(b) の上段に示す騒音スペクトルNav(f)のピークに近い位置になっている。これは、調整オーディオ信号A*含まれている矢印で示したスペクトルの盛り上がり成分によって、騒音信号Nのピーク成分がマスキングされることを示している。実際、人間の耳で確認したところ、騒音信号Nに対する顕著なマスキング効果が認識できた。
図30および図31は、電気シェーバーを騒音源として、同様の実験を行った結果を示すグラフである。やはり、図30(b) の下段のスペクトルAav(f)と図31(b) の下段のスペクトルA*av(f)とを比較すると、後者では、矢印で示した部分のスペクトルに盛り上がりが生じており、やはり人間の耳で確認したところ、騒音信号Nに対する顕著なマスキング効果が検知できた。
図32および図33は、ヘアードライヤーを騒音源として、同様の実験を行った結果を示すグラフである。やはり、図32(b) の下段のスペクトルAav(f)と図33(b) の下段のスペクトルA*av(f)とを比較すると、後者では、矢印で示した部分のスペクトルに盛り上がりが生じており、人間の耳で確認したところ、同様に、騒音信号Nに対する顕著なマスキング効果が検知できた。