JP3913775B2 - 録音及び再生システム - Google Patents

録音及び再生システム Download PDF

Info

Publication number
JP3913775B2
JP3913775B2 JP50789196A JP50789196A JP3913775B2 JP 3913775 B2 JP3913775 B2 JP 3913775B2 JP 50789196 A JP50789196 A JP 50789196A JP 50789196 A JP50789196 A JP 50789196A JP 3913775 B2 JP3913775 B2 JP 3913775B2
Authority
JP
Japan
Prior art keywords
filter
listener
sound source
signal
matrix
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP50789196A
Other languages
English (en)
Other versions
JPH10509565A (ja
Inventor
フェリープ オーデュナ−バスタマンテ
オール キルケビ
晴夫 濱田
フィリップ アーサー ネルソン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Adaptive Audio Ltd
Original Assignee
Adaptive Audio Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Adaptive Audio Ltd filed Critical Adaptive Audio Ltd
Publication of JPH10509565A publication Critical patent/JPH10509565A/ja
Application granted granted Critical
Publication of JP3913775B2 publication Critical patent/JP3913775B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • H04S1/002Non-adaptive circuits, e.g. manually adjustable or static, for enhancing the sound image or the spatial distribution
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • H04S1/007Two-channel systems in which the audio signals are in digital form
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/002Non-adaptive circuits, e.g. manually adjustable or static, for enhancing the sound image or the spatial distribution
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • H04S1/002Non-adaptive circuits, e.g. manually adjustable or static, for enhancing the sound image or the spatial distribution
    • H04S1/005For headphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/01Enhancing the perception of the sound image or of the spatial distribution using head related transfer functions [HRTF's] or equivalents thereof, e.g. interaural time difference [ITD] or interaural level difference [ILD]

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Stereophonic System (AREA)

Description

序論
発明は音の収音と再生のための新しい手段を提案する。ここに述べられる手段は一般に多チャンネルディジタル信号処理技術に基づいており、これは、2つかあるいはそれ以上のラウドスピーカを用い、通常の多チャンネル再生方式による音場再生のための収音手段を改善することに直接に採用することができる。使用された技術は、多数のラウドスピーカによって再生するために一般に録音された音声信号の処理にも拡張することができ、また特別なときは録音された音声信号は単一チャンネルでもあり得る。
それらの信号の再生を改善するために、録音された音声信号を処理するという再生過程で、ディジタルフィルタが使用されるということに関する一般的なアプローチは参考文献「1,2」で記述されている。不充分な位置に設置されたラウドスピーカによる既存の2チャネル録音の音声再生を補正するためにこれらの技術を利用することについては、参考文献「3,4」に記述された。その後者において、‘仮想’ラウドスピーカ配置の考えは紹介された。
再生信号と‘所望’の信号における時間平均された自乗誤差の和が最小であることを保証するために、再生の際、録音された信号に対して作用するために、信号処理系ではフィルタが使用された。所望の信号は今度は、音場の音源によって特定された明確な位置に作り出されるものとして特定された。フィルタの動作によって、再生信号は所望の信号と良好に一致し、これにより、受聴者のなかに‘仮想’音源の位置から発生する音のイリュージョンが作られる。
本発明は再び仮想音源の考えを利用する。本発明の目的は、2つ(またはそれ以上)のラウドスピーカを介して再生するための録音手段を提供するものであり、それによって、実際のラウドスピーカの位置からは隔たった特定の空間位置から到来する音のイリュージョンを受聴者に対して作り出す。
再生におけるこの目的を達成するための技術を最初に記述したのはAtal&Schroeder「5」であり、彼らは‘2つだけのラウドスピーカによって任意に位置に配置された音像’を作り出すための手段を提案した。‘擬似音源トランスレータ’と名付けられた彼らの発明のなかで、Atal&Schroederはまた、2つのラウドスピーカに入力するのに先だって、単一(チャンネル)の信号を操作するためにフィルタネットワークを用いた。
本発明における1つの局面によって、我々は複数のラウドスピーカによる再生のための収音手段、もしくは複数のラウドスピーカによる再生のための音声処理に関する手段を提案しており、そのなかで再生されるいくつかの音は受聴者に対して仮想音源から発生されているがごとく現れ、ラウドスピーカに供給するための信号を録音したり処理するためにフィルタ手段(H)を用いて成り立っており、フィルタ手段(H)はフィルタ設計の過程で作られるものであり、そのフィルタ設計過程とは以下のように特徴づけられる:
(a)収音したものをラウドスピーカを介して再生する際、意図される位置の受聴者に対して再生される信号(w)と、意図される位置における所望の信号(d)との間の誤差を最小にするように用いられる技術で、そのなかで、
(b)受聴者に対して再生される前記所望の信号(d)は、仮想音源の所望の位置での音源によって前記の意図される位置の受聴者の耳元(あるいは受聴者の領域)において作り出されるであろう信号(あるいは推定信号)で定義される。
好ましくは、所望信号は、仮想音源の前記所望の位置と再生音場における特定位置、すなわち受聴者の耳元、あるいは頭部の領域、との間の伝達関数であるフィルタ(A)の形式で明確に記述されることが望ましい。
伝達関数を導出する方法は様々であるが、しかし、好ましくは伝達関数は実音源への入力と受聴者の‘頭部伝達関数’(Head Related Transfer Functions, HRTF)の影響をモデル化するために用いるダミーヘッドの耳元(あるいは頭部の領域)におけるマイクロフォンからの出力との間のまず第一に実施される測定によって導出される。
最小自乗法は、意図される受聴者の位置における再生信号と所望の信号との時間平均誤差を最小にするように採用される。
また、最小自乗法は時間領域よりはむしろ周波数領域において採用される。
トランスデューサ関数は、実際の受聴者による測定か、または解析上、あるいは経験的に得られる頭部伝達関数(HRTF)のモデルによって導出される。
好ましくは、再生のためにラウドスピーカに入力するに先だって仮想音源を処理するために使用されるフィルタは‘クロストークキャンセル’のマトリックスと共に所望の信号を特定する伝達関数を表しているディジタルフィルタの畳み込みによって導出される。単一の逆フィルタ設計手順(数値計算的に集中している)のみが必要とされる。
発明の最初の局面のとおりに手法を利用した結果は、2つのラウドスピーカのみを使用した場合に、受聴者は音像が、受聴者の耳を含む平面上のほとんどすべて位置にある任意の場所に配置された仮想音源から到来するように知覚する。しかしながら、(受聴者の前方である)この平面の前方の円弧において、仮想音源をおくことが特に効果的であるようにシステムは開発された。
受聴者の後方に2つの追加されたラウドスピーカを使用することにより、受聴者の横方向、あるいは後方に仮想音源を創成することが可能となる。
発明の1つの利用法は、より向上した2チャンネルの音声収音を行うための手段を提供することである。前述したすべてのフィルタ設計の過程は、それ以上の必要な処理をすることはなく後に続く2つのラウドスピーカを介するトランスミッションに対してそのまま使用できる2つの収音信号を発生するために実行することができる。
従って、この発明の2番目の局面は、従来の多チャンネル音場再生方式をとおして収音された音声を再生することを可能にする、マルチチャンネルの収音の手段を提案供することであり、その手段は前述のフィルタ設計手順を利用する。
収音された音声は、コンパクトディスクやアナログ、あるいはディジタルオーディオテープ、その他いかなる適当な通常の媒体に録音されることが可能であることは明確である。
重畳により、異なる楽器、ボーカルに属性を与える目的で、異なる複数の位置に仮想音源を配置させて、このような録音は実施される。従って、2つのラウドスピーカによる再生のための録音のプロダクションが向上する。
以下の図を参照しながら、例によって、この発明の様々な具体的側面について記述していく。
図1は仮想音源配置のための信号処理を、(a)に概要図解で、(b)にそのブロック図で示しており、
図2にクロストークキャンセルフィルターの設計行列を示す。コスト関数
Figure 0003913775
を最小にするようなフィルターHx11'Hx21'Hx12とHx22が最小二乗法に基づいて設計される。これは、再生信号である
Figure 0003913775
が非常によい近似であることを確証する。従って、w1(n)とw2(n)は、それぞれ信号u1(n)とu2(n)が単純に遅延をもったもとのであり、
図3はラウドスピーカの位置補正問題のアウトラインを図(a)に示しており(b)ではブロックダイアグラムを表している。u1(n)とu2(n)は、従来のステレオで録音された信号を示すことに留意する。
つまりディジタルフィルタA11,A21,A12とA22は‘理想的’に配置された仮想音源に対する入力から受聴者までの伝達関数を示しており
図4は仮想音源の等化領域に対する主観評価を行った際のレイアウトである。仮想音源は受聴者に対面する対のスピーカを介して模擬されている。黒いカーテンは音源が実際どこにあるか分からないようにするために用いられた。スクリーンの外に描かれた円には異なる角度の定位のために仮想と付加的な実音源が置かれる距離がマークされており、
図5は無響室における電気音響システムのインパルス応答を示しており、
a)はLchのスピーカから左耳、b)はLchのスピーカから右耳、c)はRchのスピーカから左耳、d)はRchのスピーカから右耳までの応答であり、
図6は無響室で測定したクロストークキャンセル用のフィルタ行列におけるインパルス応答を示しており、a)h11(n)、b)h21(n),c)h12(n),d)h22(n)によって示されており、
図7は無響室内での電気音響システムのインパルス応答とクロストーク相殺用の逆フィルタを畳み込んだ結果を表しており、
図8と図9は共に無響室内で音声信号に対する、a)仮想音源と、b)実音源の定位実験の結果をを表しており、
図10はリスニングルームでのインパルス応答を表し:a)Lchスピーカから左耳までの系、b)Lchスピーカから右耳までの系、c)Rchスピーカから左耳までの系、d)Rchスピーカから右耳までの系であり、
図11はリスニングルーム内において用いられたクロストークキャンセルフィルタのインパルス応答を示しており、a)h11(n),b)h21(n),c)h21(n),d)h22(n),によって表され、
図12はリスニングルームでの電気音響系のインパルス応答とクロストーク相殺用逆フィルタを畳み込んだ結果を表しており、
図13と図14は共にリスニングルームでの音声信号に対する、a)仮想音源と、b)実音源の定位実験の結果を表しており、
図15は車室内での主観評価に用いられたスピーカとダミーヘッドマイクロフォンとのレイアウトを示しており、a)頭上視界、b)側面視界であり、
図16は車室内の運転者席(左側運転車)に配置されたダミーヘッドマイクロフォンの両耳と前面に置かれた対のスピーカ間のインパルス応答を実測したものであり、
図17は車室内におけるクロストークキャンセルフィルタのインパルス応答を示しており、
図18はクロストークキャンセルフィルタの入力からダミーヘッドの耳元のマイクロフォンまでのインパルス応答を表している。これらの結果は図17で示した逆フィルタと図16での車室内でのインパルス応答を畳み込んだ結果であり、
図19は車室内実験における仮想音源配置に関する主観評価を示しており、
図20は逆システムと所望の特性のフィルタデータベースを用いた無響室内での主観評価を表している。±45度と±135度の音源が仮想音源を生成するに当たって用いられている。実音源は165度、-150度、135度を除いた上述の全ての角度に配置された。仮想音源は135、150、-165度を除いた上述のすべての音源位置に配置された。音源はKemarモデルのダミーヘッドマイクロフォンの中心から2.2m離れた円上に配置され、
図21は仮想音源を生成するために音声信号(スピーチ)や4つの音源を用いた無響室内での定位実験の結果を表しており、a)仮想音源の結果、b)実音源の結果である。
2つのラウドスピーカを用いた単一仮想音源再生のための信号処理技術
離散時間信号u(n)は、受聴者に対して我々が配置させたい任意の位置での仮想音源信号を定義する。信号D1(z)とD2(z)は仮想音源によって生じる受聴者の耳元での信号である。ディジタルフィルタA1(z)と′A2(z)は、配置された仮想音源から受聴者の耳元までの伝達特性を定義する。Z変換の領域において、
Figure 0003913775
これらの伝達関数は高品質なラウドスピーカへの入力(またはラウドスピーカの位置に設置された高品質のマイクロフォンにより測定された音圧)とダミーヘッドの耳元に配置された高品質のマイクロフォンの出力との間の伝達関数を測定することで導出することができる。このような実験手段は無響条件下において仮想音源位置の範囲で実行される。これにより、仮想音源位置の範囲を網羅した頭部伝達関数(HRTF)のデータベースが導出される。別の方法としては、このデータベースは分析的、経験的なHRTFのモデルを使うことによって得ることもできる。
図1に戻って、信号V1(n)とV2(n)は再生の際用いられているラウドスピーカへの入力を定義する。これらの信号は収音信号を形成している。スピーカから受聴者の耳までの伝達過程において、収音信号はC11(z),C12(z),C21(z)とC22(z)を要素とする電気音響伝達関数行列を経て伝搬する。これらの伝達関数は信号v1(n)及びv2(n)と受聴者の耳元で再生された信号w1(n)及びw2(n)とを関係づける。そこでz領域では(2)の様に書き記すことができる。
Figure 0003913775
伝達特性A1(z)、A2(z)などと同様に、無響室において2つのラウドスピーカへの入力とダミーヘッドの両耳のマイクロフォンの出力との伝達関数を測定することにより、伝達関数、C11(z),C12(z),C21(z)とC22(z)を導出することができる。
さらに付記するとこれらの伝達関数を示すために他の技術を用いる場合もある。収音に適切な信号処理過程を導出することで、これらの伝達関数を示すのに用いられるフィルタは、収音されたものが再生される場合に起こるような伝達関数の良好な標本であることが保証される必要があることは明らかである。
伝達特性C11(z),C21(z),C12(z)とC22(z)が今、理想的に表記できたと仮定すると、その際仮想音源信号u(n)を操作する逆フィルタH1(z)とH2(z)を導出することが可能となる。これにより2つのラウドスピーカ再生のために準備の整った録音されるべき信号v1(n)及びv2(n)の生成が可能となるフィルタ係数(ただし有限長インパルス応答ィジタルフィルタと仮定される)を設計するにあったって我々は最小自乗法を用いている。これについては参考文献「1、2、3、4」に概要が述べられている。これらのフィルター設計手順は十分に参考文献「1,2,3,4」で記述されているので、ここでは繰り返さない。しかしながら、最小自乗法によるアプローチは(3)式で与えられるコスト関数Jを最小とするような最適なフィルタ係数を得るために用いられていることを強調しておく。
Figure 0003913775
ここで、E[]は期待値演算子である。この最小自乗法に基づいた設計手法は誤差信号
Figure 0003913775
つまり所望の信号d1(n)とd2(n)と再生された信号w1(n)とw2(n)の差違で定量化される値を時間平均された自乗平均の意味で小さくすることができることを付記しておく。いくつかの条件下で逆問題を改善する意味で、式(3)で示したコスト関数に新たに別の項を加えることは有用である。この項はフィルタH1(z)とH2(z)で用いられている係数の絶対値の自乗によって与えられる。この設計手法は参考文献「3,4」でより詳しく述べられている。
しかしながら収音技術として有用であるためには、要求されるそれぞれの仮想音源に対して逆フィルタを設計することは不可欠である。フィルタ設計手法はとても冗長なため(特に高音質における高い周波数においては)、それぞれの位置に対応するフィルタを設計するには大変時間を消費する。
ここに述べる他の技術は逆フィルタのマトリックスを使って、スピーカ1から受聴者の耳2とスピーカ2から受聴者の耳1への‘クロストーク’を最小とすることを保証するフィルタ設計法である。ここでもまた、参考文献「1,2」で記述されているこの‘クロストーク相殺用’の行列を設計するために最小自乗技術が使われている。この手法は(図2に示されている)式(4)が良好な近似であることを保証するために用いられている。
Figure 0003913775
ここで、zはΔサンプルのモデリングディレイを意味する。ひとたび、フィルタ行列Hx11(z),Hx12(z),Hx21(z)とHx22(z)が最小自乗法に基づいて設計されれば、フィルタH1(z)とH2(z)は、要求される仮想音源のそれぞれの位置に対応する所望信号を特定するのに用いられるフィルタA1(z)とA2(z)のそれぞれのペアーへと容易に導出される。これは式(4)を用いた事実に基づいており、我々はつぎの近似を行うことができる。
Figure 0003913775
従って我々は、フィルタH1(z)とH2(z)を
Figure 0003913775
から導出し、式(7)を導くことができる.
Figure 0003913775
再生信号は式(8)によって与えられるため、
Figure 0003913775
それに従い式(6)からH1(z)とH2(z)は与えられ再生信号は式(9)となる.
Figure 0003913775
言い換えれば、再生信号はΔサンプル分の遅延を付加した所望の信号と同等の良好な近似を有していることになる.この付加的な遅延を別にすれば、信号を再生する目的と合致している。仮想音源に着目した信号の再生に帰着する。
従って、はじめにクロストーク相殺用のフィルタを設計することで、フィルタH1(z)とH2(z)は、与えられた仮想音源の特性を有しているフィルタA1(z)とA2(z)のインパルス応答とクロストーク相殺用フィルタマトリックスの適切な要素のインパルス応答との単純に畳み込みの結果設計される。
インパルス応答は小文字を用いて以下のように表される.
Figure 0003913775
ここで記号*は畳み込みを意味する.
これらのインパルス応答を得るために必要とされる数値計算は、係数h1(n)とh2(n)がH1(z)とH2(z)の最適設計の最小自乗問題を解くことによって得るのに必要な数値計算と比較して大幅にその量が軽減される。
3.ラウドスピーカ配置の補正システムへのフィルタ設計手順の拡張
先に概説したフィルタ設計手順は、この発明に従って、ラウドスピーカの配置補正のための逆フィルタ設計を支援することに利用することができる。これらについては参考文献「3」と「4」で詳細に述べられている。この場合、目的は簡易的に録音された2チャンネルの信号を操作するようなフィルタマトリックスの設計となる。フィルタは従来のステレオ録音された信号が、受聴者の耳元で”仮想音源”として最良な再生となるよう設計される。このシステムに関するブロックダイアグラムを図3に示す。再び我々は、式(4)を用いて式(12)の様に表す。
Figure 0003913775
従って、逆フィルタ行列は次式に従い、
Figure 0003913775
さらにフィルタの設計手法は初めにクロストーク相殺用のフィルタ行列を設計することで単純化される。これは先に述べた同じ理由から説明することができる。しかしながら、この場合については再生信号が式(14)によって与えられ、
Figure 0003913775
さらに、式(13)にしたがって設計された逆フィルタにより、次式が得られる。
Figure 0003913775
再生された信号は所望の信号が単純に遅延されたものとなりスピーカ配置補正システムの目的と合致する。
4.多チャンネルスピーカ再生方式への技術の拡張
上述された仮想音源配置に関してのアプローチは2つ以上のスピーカを用いた音場再生システムとして容易に拡張することができる。L個のラウドスピーカが再生に用いられると仮定する。受聴者の頭部の領域において、M個の位置に生成される所望の信号を明示すると仮定し、これらは仮想音源の位置とダミーヘッド(あるいは分析的、経験的に明示されるもの)の頭部の位置(あるいは領域)の間の伝達関数のM次のベクトルを測定することにより導出される。
我々は以下に与えられるようにベクトルを定義した。
Figure 0003913775
また所望の信号のベクトルは
Figure 0003913775
(頭部の領域において)M個の位置のでの再生信号のベクトルと、式(18)に示すスピーカに対する入力信号とを関連づけるところの伝達特性を測定ないし明細する。
Figure 0003913775
ここでw(z)とy(z)は以下で与えられるように定義される。
Figure 0003913775
さらに、C(z)が以下の行列で与えられる
Figure 0003913775
その際、逆フィルタベクトルは(22)式によって明示される。
Figure 0003913775
M>Lの時、逆フィルタは参考文献「1,2」で示された技術により導出され、このことからコスト関数を最小とするような最適なFIRフィルタ係数が得られる。
Figure 0003913775
ここで、em(n)は所望の信号dm(n)とDHMがあるところのでの再生信号zm(n)との誤差を表している。
これは、しかしながら、強力な数値計算を必要とする作業である。
しかし、もし測定ポイントMがラウドスピーカの数Mと同じ分だけ用意されたならば、我々は上述した内容での効率的なフィルタ設計法を用いることができる。まずはじめに次式で示す良好な近似を与えるL×Lの逆フィルタについて定義したことを留意する。
Figure 0003913775
ここで、Iは単位行列である。この関係を用いれば近似(25)が得られる
Figure 0003913775
その際逆フィルタベクトルは
Figure 0003913775
となりさらに
Figure 0003913775
そして再生信号はつぎのように与えられるため、
Figure 0003913775
次式が誘導できる。
Figure 0003913775
M=Lの際における再生信号は所望の信号に単純に遅延をもうけたものと等化である。
この手順はクロストーク相殺フィルタHx(z)の設計に依存する。これは聴取者頭部の領域でM=Lポイントにおいて作り出された信号がこれらの信号の単に遅延しているものになることを保証するために信号u(z)のLベクトルに作用するマトリックスHx(z)として定義される。換言すれば、クロストーク・キャンセレーション・フィルタを設計するために使われた所望信号はつぎで与えられ、
Figure 0003913775
さらにこの場合の再生信号は次式で与えられる。
Figure 0003913775
行列Hx(z)は、広範囲にわたって参考文献「1,2,3,4」で記述されている技術を利用して設計される。
5.周波数領域フィルタ設計技術
前述の参考文献「1-4」で参照されている時間領域における最小自乗法による逆フィルタ設計法に加えて、逆フィルタを周波数領域で設計することは同じく可能である。これは特にクロストークキャンセル行列を設計する場合、とりわけ多数のラウドスピーカを利用して行う再生においてはより効果的である。しかし、もし周波数領域による設計を効率よく行うためには多くの手順を必要とする。まず初めに、逆フィルタの実現不能性の問題が、時間領域におけるそれと同様にモデリングディレイの最適な選択という点において考慮されなければならない。次にインバーションの不良条件に関する問題であり、これは周波数領域において行う場合に明確に考慮に入れられなければならない。これは時間領域において最小自乗解を求めるために適応アルゴリズムが使われるとき、本質的に避けられる。
周波数領域における設計の技法は、可能な不良条件問題を例証する単一チャンネルでの例を使って最も容易に説明される。もし、われわれが仮に電気音響的な伝送系C(z)を有する時、逆フィルタC(z)を設計することは、単純に1/C(z)を算出することである。明らかに、もしC(z)が最小位相(1つかそれ以上の零点をz-平面の単位円の外側に有する時)ではない場合は、1/C(z)はその後の過程に不安定である。(C(z)の零点は1/C(z)極であり、単位円の外側にあるため)しかし、前向き時間での1/C(z)の不安定な応答は後ろ向き時間における安定な応答であると解釈される。すなわち、1/C(z)は安定であるが非因果なインパルス応答を有するといえる。非因果なインパルス応答に関する問題はモデリングディレイを加味することで部分的には補正することができる。それにより、正の時間における方向のΔサンプルにより逆フィルタのインパルス応答を効果的にシフトすることで、原則としてz/C(z)からH(z)を算出する。しかしながら、もしC(z)の零点の1つか単位円の外側にあり、単位円に近接している時、逆の時間におけるインパルス応答の減衰は遅いであろう(極は僅かに押さえられている)。これは、ゼロより小さい時間の値として生じる“理想的な”逆フィルタのインパルス応答において十分なエネルギーを有するという結果となる。同様に、もし単位円の中のC(z)の零点の1つが単位円に近接している場合、前向き時間でのインパルス応答の減衰は遅く、また要求される逆フィルタは、非常に長いインパルス応答を前向き時間において有する。この問題を軽減するのを補助するための技術として、逆フィルタの設計を“組織化(regularise)”するために新たにパラメータが提案される。これにより、逆フィルタの極は操作され、そして単位円から離れていく。従って、正と負の時間において逆フィルタのインパルス応答は短縮される。
この議論は、ある特定の例題を考えることで、単一チャンネルの場合について明確に説明される。我々は誤差信号(所望の信号と再生信号の差違)のフーリエ交換の自乗絶対値を最小し、さらにこれに付加して逆フィルタからの出力信号のフーリエ交換の自乗絶対値に比例する項をもつコスト関数を定義する。我々は次のコスト関数を
Figure 0003913775
を最小にするように探索する。ここで、βがレギュラリゼーションパラメータであり、インバージョンを行う逆フィルタで用いる”努力(effort)”の項を重みづける。この式で使われたフーリエ変換はz=eの代入を行った前に使われたz-変換に関連している。すなわち、例えば、D(e)はZ変換D(z)をもつ所望の信号のフーリエ変換を表している。所望の信号と逆フィルタの出力信号はそれぞれD(e)=e-jωΔU(e)とV(e)=H(e)U(e)によって逆フィルタへの入力信号(仮想音源信号)と関連しているので、コスト関数はつぎのようにまとめられる。
Figure 0003913775
この2次の評価関数を最小にする逆フィルタのフーリエ変換は容易に示すことができる(参考文献[6]の付録を参照)。
Figure 0003913775
ここで上付添字*は共役複素数を示す。我々は、この式のZ変換についてz=eを代入することで示すことができる。故に|C(e)|2は、C*(e)C(e)=C(e-jω)C(e)と表されるので、Z変換は
Figure 0003913775
ここで、例えば、aが実数の場合において、C(z)=1+az-1で示される伝達関数のインバージョンを考えてみる。これはz=-aにおいて単一の零をもち、|a|>1(すなわち零点が単位円の外側にある)の時に、最小位相となる。上で定義した評価関数を最小にする最適な逆フィルタはつぎで与えられる。
Figure 0003913775
この式の分母を展開して、つぎのように書くことができる。
Figure 0003913775
ここで、p1とp2は逆フィルタの極である。これらは次式によって与えられる。
Figure 0003913775
システムの零点がインバートされて単位円の近傍に横たわっている場合は特に興味のあるケースである。このような場合、逆フィルタは非常に長いレスポンスを有する。つまり概括的にいえば、逆フィルタの極は周波数領域における大きな応答と時間領域における長いインパルス応答とに対応しながら単位円に近接するであろう。図解によって、C(z)の零点がa=1+εにある時を仮定してみると、ここでεは、レギュラライゼーションパラメータβと同じ次数の小さなパラメータであるが、最初の近似の次数定める式(38)の級数展開に従うと、逆フィルタの極はつぎのように与えられる。
Figure 0003913775
ここで、次数βとεの項は無視されている。本式は逆フィルタが2つの極を有し、その1つは単位円の内側、もう1つは外側にあることを示す。明らかにβが増加する時、極は単位円から遠くへ移動し、逆フィルタのインパルス応答の継続長はより小さくなる。実際、逆フィルタのZ変換の表現の部分分数展開は、我々はつぎのように書けることを示している。
Figure 0003913775
極であるp1とp2は式(30)によって与えられる。二項展開により、我々はつぎのように書くことができ、
Figure 0003913775
さらに、対応する逆Z変換は数列1,p,p2,p3,…によって与えられる。従って、極
Figure 0003913775
は時間増加と共に減衰する数列を与え、減衰の割合は
Figure 0003913775
の値によって決定される。しかしながら、極
Figure 0003913775
は時間増加に伴って成長する数列に対応することとなる。つまり、極が単位円の外側にあることが、インパルス応答を不安定にするのに寄与している。それにもかかわらず、上に強調されるように、前向きの時間におけるこの不安定な応答は後ろ向きの時間においては安定であるという2つの解釈を有する。以下のことによって最も容易にその有効性を確認することができる。つまり、z/(z-p)は(-z/p)/(1-(z/p))としてまた表すことができ、二項式展開を引き続いて用いることで次式を示すことができる。
Figure 0003913775
従って、
Figure 0003913775
の値は後ろ向き時間における数列の減衰を決定し、より大きな値はより迅速な減衰をもたらす。レギュラライゼーションパラメータβの利用により、以下のことが保証される。すなわち、たとえシステムの零点が単位円に非常に近接してインバートされた場合でも、逆フィルタのインパルス応答は十分迅速に減衰する。最後に、式(40)のzがすべてのインパルス応答にΔサンプルの遅延を与えることを記述しておく。それで、もし十分に大きいβの値が選択されるなら、逆向きの時間における逆フィルタの応答はΔサンプルの中で、無視することのできる値に減衰する。これは逆フィルタの因果性を保証する。
この逆フィルタのインパルス応答の所要時間の抑制は、フィルタの設計を周波数領域で行う場合に、非常に重要である。技術の基本はDiscrete Fourier Transform(DFT)と、高速フーリエ変換(Fast Fourier Transform)(FFT)アルゴリズムを使った高速な処理をよりどころとしている。適切な変換及び逆変換はつぎのように表される。
Figure 0003913775
ここで、数列f(n)がF(k)によって与えられる対応するDFTを有する。この際、kは変換が行われる周波数の不連続性を意味するインデックスとして用いられる。最初にインバートされるシステムのインパルス応答c(n)を測定し、次にFFTアルゴリズムを使うことによってDFT C(k)を計算する。逆フィルタの周波数応答は次式から算出される。
Figure 0003913775
上に明記される逆変換の関係を利用して、対応するインパルス応答は算出される。逆フィルタのインパルス応答が、その周期において、DFTや逆DFTの計算の際に用いられるNサンプルの”基本周期”よりも短いということは、計算のこの段階において、非常に重要となる。もしこのインパルス応答の周期がこの値より大きい場合、その計算は誤った結果ををもたらすであろう。これはもちろん扱われている信号は周期的であるというDFTを使う際に暗黙のうちにたてられる仮定によるものである。
実際にこの計算を行うための過程は以下のように要約されることができる。
我々は逆フィルタh(n)のフィルタ係数の数をNhで示し、インパルス応答c(n)の所要時間をNcで表す。Nhは2の乗数でなければならない(2,4,8,16,32,...)。またNhは2Ncより大きくなければならない。これらは因果性FIR逆フィルタh(n)を算出するために必要な手順である。
1.c(n)の零付加法(zero-padding)を利用することによって、インバートされる伝達経路におけるインパルス応答の周期はNhサンプルであることが保証される。例えば、もしNc=256でNh=1024である場合、768個のゼロが元のインパルス応答c(n)に加えられる。
2.ゼロを加えられた数列c(n)のDFTの計算結果はNhの等間隔なポイントの周波数応答C(k)となる。
3.式C*(k)/(C*(k)C(k)+β)からNh周波数の逆フィルタの周波数応答を算出
実際は最初を計算することはただ必要なだけである実際はこの式の最初の(Nh/2)+1個の値を計算することだけが必要となる。何故なら、実際の数列のDFTは対称であるためである。
4.式C*(k)/(C*(k)C(k)+β)の逆DFTの計算
5.逆DFTの1番目と2番目の半分を交換することによるh(n)の探索 例えば、逆DFTが数列{1,2,3,4,5,6,7,8}である場合、
h(n)={5,6,7,8, 1,2,3,4}となる。
この操作(処理)はNh/2+1のモデリングディレイを実行している。
モデリングディレイはそれ故に、逆フィルタのインパルス応答の長さの半分に選択される。
多チャンネルケースへのこの技術の拡張は簡単である。まず次式で表されるコスト関数を最小にする逆フィルタの行列を求める。
Figure 0003913775
ここでe(e)はベクトル誤差信号(すなわち、所望信号と再生信号の間の差違で定義される信号のベクトル)のフーリエ変換のベクトルであり、v(e)は、逆フィルタ行列の出力信号のフーリエ変換のベクトルである。コスト関数を最小にするような逆フィルタのマトリックスは次式で与えられる。(解析の詳細は参考文献「7」を参照)
Figure 0003913775
Iが単位マトリックスである場合、所望の信号の行列はΔサンプルで遅延された収音信号の行列であると仮定されている。ここで、レギュラーライゼーションパラメータβは多チャンネルケースでも、また単一チャンネルケースでも同一の役割をはたし、これを利用することはインバートされるマトリックスは良好な条件であることを保証し、また、これはこの解の大変に重要な特徴である。逆フィルタ行列を計算するためのステップは次のように要約される。
1.インパルス応答の周期はNhサンプルであることを保証するために行われるC(n)の要素の零付加法(zero-padding)を利用して、すべての電気音響的な伝送経路のインパルス応答を測定する。
2.零付加されたインパルス応答のDFTsを計算する。Nh等間隔を配置されたポイントにおける周波数応答C(k)を、結果として得る。
3.式[CH(k)C(k)+βI]-1C(k)からNh周波数において逆フィルタの周波数応答を計算する。実際は、この行列でそれぞれの要素の最初の値Nh/2+1を計算することのみが必要である。これは実際のsequenceのFFTは対称であるという特性に原因を帰する。この式はラウドスピーカのチャンネル数や再生音場での測定の数に関わらず、採用することができる。何故ならβ>0の場合、行列
CH(k)C(k)+βIは正則ではないからである。
4.この式の逆DFTsの行列を計算する。
5.逆DFTの行列のそれぞれの要素の逆FFTにおいて第1番目と2番目の半分を交換することにより、逆フィルタのインパルス応答を探す。この操作は(Nh/2)+1サンプルのモデリング遅延を実行する。
6.2つのスピーカシステムに関する主観評価実験
6.1 これまでの実験に関するレビュー
所定の空間に位置している音源のイリュージョンを受聴者に対して作り出すことは、長い間(今まで)音響技術者の目標であった。ラウドスピーカ間のどこかに位置する”幻影(ファントム)”あるいは”仮想”音源により作り出される音像であるイリュージョンを受聴者に対して作り出すために、1対のラウドスピーカに入力される信号を操作す過程に比較的にシンプルな信号処理の技術が利用できることは長い間認識されてきた「8」。これらの技術は通常のステレオフォニックの基礎を形成し、心理音響的な基礎は”音像定位の足し合わせ”というカテゴリ下においてBlauert「9」によって報告された。すなわち、受聴者に対して適切に配置された1対のラウドスピーカへの2つの入力信号間に単純に振幅差(あるいは時間差)を与えることで、仮想音源のイメージの位置を2つのラウドスピーカ間で移動させることができるというものである。更に洗練された信号処理についてはAtalとSchroeder「5」によって報告された。(彼らは一般にはその発明によって知られている)しかしながら、それ以前にBauer[10]によってダミーヘッド録音の再生という状況のなかで類似した手順が研究されていた。AtalとSchroederは、”定位ネットワーク(localisation network)”という装置を考案した。それは1対のラウドスピーカに入力される前の信号(これは仮想音源に関連している)を操作するものである。上述されたように、技術の原理は仮想音源信号を1対のフィルタを介して処理することであり、上述されたように、技術の原理は仮想音源信号を1対のフィルタを介して処理することであり、そのフィルタは受聴者の耳元に作り出された信号が、仮想音源の所望の位置に選択されて作り出された信号とが十分に等化であることを保証するために設計された。AtalとSchroederは、提案し採用したフィルタ設計手順において、仮想音源によって受聴者の両耳において作り出された信号は単純に周波数に依存しない利得と時間遅延にのみ関係していると仮定した。そして、この周波数に関して独立な受聴者の両耳での信号間の差違は、音響空間上での仮想音源の位置に依存していると仮定した。これらの仮定は分析的に扱いやすい定位ネットワークのデザインをもたらし、そのパラメータは外見上は異なった仮想音源配置を提供するために変えることができた。この技術の包括的な主観的な評価は、この発明者によっては実施されなかったが、「5」によると、この方法は水平面上に±60度以下の方位角で位置する(つまり、典型的なインテンシティーステレオにて包括される位置角度±30度の範囲の外側「9」)仮想音源のイリュージョンを受聴者に対して作り出すのに十分に効果的であることが報告された。しかしながら、±60度を越えると音像定位はその周波数依存性を増すので、はっきりとは定義されにくくなる。
Schroeder他「11」は、後にこの方法をダミーヘッド録音のラウドスピーカ再生に採用した。この場合、ダミーヘッドの耳元で収音された信号は、フィルタネットワークを通して処理される。このフィルタネットワークによって、1対のラウドスピーカにより受聴者の耳元で実質上は同様の信号が再生されることが保証される。このネットワークによって、右のラウドスピーカと左の耳の間、あるいはその逆において、クロストークがキャンセルされることが保証される。そして、主観実験は実施されなかったが、仮想音源は横方向のすべて、または受聴者の後方にさえ、その音像を作り出すことができると報告された。
一方、同じタイプのシステム、すなわちクロストークキャンセルのためのプロセスを経て、1対のラウドスピーカから再生されるダミーヘッド録音であるが、これにおける主観評価実験の結果がDamaske and Mellert[12]によって報告された。その中で、彼らは″TRADIS″(ステレオによる全方向情報の再生)技術と名付けた。水平面並びに水直面の両方向における定位実験の結果は、明らかに技術の効果を証明する。近年、浜田ら「13」は、このアプローチの本質はデジタルでクロストークキャンセルネットワークを利用し、これをOrthoStereophonic System(OSS)と呼んだ。まずダミーヘッドの耳元で作り出された信号を収音し、続いて1対のラウドスピーカによる伝送系の前段の2×2のディジタルフィルタマトリックスを介してその信号を処理することによって生成された仮想音源について、主観評価実験はその定位の十分な正確さを示した。Neu他「14」とUrbach他「15」によって、ダミーヘッドの両耳の位置において収音された信号を処理するためのクロストークキャンセルシステムのディジタルでの実行についての一歩進んだ主観評価実験が実施され、その結果が報告された。
ここでも良好な結果が見られた。特に水平面における仮想音源の位置についてそれは顕著である。仮想音響信号を作り出すための一般的なアプローチについては、Cooper and Bauck[16]によって議論された。その中で彼らは”トランスオーラル・ステレオ”の技術について述べ、また多数の受聴者のための再生システムの一般化についても議論した「17」。トランスオーラル・ステレオについてはMoller[18]and by Kotorynski[19].によっても報告がなされた。
これらすべての著者によって利用されたフィルタ設計手順は、ラウドスピーカへの入力から無響室において受聴者の両耳の位置で再生された信号とを関連づける4つの頭部伝達関数(HTRFs)の測定あるいは分析的な叙述の形式によるクロストークキャンセルネットワークを構成するフィルタの導出を含んでいる。
クロストークキャンセルマトリックスは4つのHRTFsのマトリックスの逆である。AtalとSchroeder「5」によって認識されたように、もしHRTFの成分が最小位相でない時、このinversionは非現実的なクロストークキャンセルマトリックスを構築するというリスクを負っている。HRTFの成分が最小位相でない場合に(例えば、部屋の表面による屈折などによって「20」)、上述されたフィルタ設計手順を利用することで、このフィルタ問題は処理することができる。これにより、音場再生における問題が非常に一般化した形で体系づけられる(収音と再生信号の多チャンネル化を説明するような)。またクロストークキャンセルフィルタの設計において、最小自乗法を時間領域及び周波数領域のどちらにも適用する。
ここでは、仮想音源イメージシステムにおける主観評価実験の結果を示す。このシステムは、水平面上に置かれた(再生された)仮想音源のイリュージョンを受聴者に対して作り出すことができ、さらに様々な音響空間(環境)下においても効果的な再生能力を有することが観測された。しかしながら、上述されたようにAtalとSchroederの最初の意図に戻り、つまり信号処理技術を用いて単一の信号が1つの仮想音源に対応するように処理を施し、ダミーヘッド録音をあまりはっきりとは使用しないということである。しかし我々は暗黙にダミーヘッドを用い、ラウドスピーカ入力とダミーヘッドの両耳出力の間の伝達関数の測定によるセットを用いることとする。このダミーヘッドのHRTFsのデータベースは、空間上の規定された位置にある仮想音源によって、ダミーヘッドの両耳の位置に再生された信号を生成するために仮想音源信号にフィルタをかける際に用いられる。これらの2つの信号はクロストーク相殺用のフィルタにかけらる。このフィルタはイメージが求められる音響空間において同じダミーヘッドの両耳の位置で、これら2つの信号の再生を保証する。無響室、(IEC仕様に建てられた)リスニングルーム、並びに車室内にて受聴者に対して行われた主観評価実験の結果を示す。主観評価実験に関する詳細についてはD.Englerの修士論文[21]、及びF.Orduna-Bustamanteの博士号論文[22]を参照する。
上述された信号処理技術の概念は様々な音響空間において仮想の音響イメージを首尾良く生成するための優れた基礎を提供する。
6.2. 無響条件の下の実験
図4は無響室内にて実施される実験のためのクロストークキャンセルフィルタHx(z)を設計するために用いられた音源とダミーヘッドの幾何学的な配置を示す。使用されたラウドスピーカは(KEF Type C35 SP3093であり、KEMAR DB 4004 artificial head and torsoがダミーヘッドとして使用された。これは明らかにHRTFデータベースをコンパイルする際に使用されたものと同等のものである。このデータベースは、無響室内にてダミーヘッドから半径2[m]にラウドスピーカを設置し、ラウドスピーカへの入力とダミーヘッドマイクロフォンの出力の間のインパルス応答を測定した。ダミーヘッドの水平面内の円弧上に10度毎にラウドスピーカの位置を移動して、データベースの測定は実施された。インパルス応答は、MLSSAシステムを使用して決定された。このMLSSAは線形システムのインパルス応答を決定するためにMLSを適用する[23]。HRTFは72kHzのサンプルレートにおいて測定され、結果の応答は48[kHz]にダウンサンプルされた。同様の技術はマトリックスC(z)の成分を測定する際にも採用された。このC(z)は再生用の2つのラウドスピーカへの入力信号とダミーヘッドマイクロフォンの出力を関連づけるものである。図(Figure)5は行列C(z)の成分(要素)に対応しているインパルス応答の結果をを示す。図6に時間領域における最小自乗法により前述の手順[1-4]を用いて設計したクロストークキャンセルフィルタHx(z)の成分に対応したインパルス応答を示す。これらのインパルス応答は48kHzの標本化レートにおいて測定された。最終的に、図7がマトリックスC(z)とマトリックスHx(z)を畳み込んだ結果である。これは、十分に効果的ななクロストークの抑圧を示し、積Hx(z)C(z)の対角線上の要素のみが重要であり、その良好な近似である式(4)は満足された。選択されたモデリングディレイは150サンプルであったことをここに示す。
上に記述されるように、クロストークキャンセルフィルタを設計した後、所望の信号d1(n)とd2(n)を対応する選ばれた仮想音源の位置に再生するために、種々の仮想音源信号u(n)を処理するためにHRTFデータベースは用いられた。
これらはクロストークキャンセルフィルタを通って、ラウドスピーカの入力信号となった。クロストークキャンセルフィルタを設計した時にダミーヘッドが設置されていた場所と受聴者の頭部の位置がラウドスピーカの位置に対して、可能な限り同じ位置であるように受聴者は席に着いた。受聴者の周りには音響学上透過なスクリーン(図4参照)が設けられ、その内側に水平面(この平面はラウドスピーカの中心と受聴者の耳の位置を含む)に沿って10度毎の間隔でマーカーがセットされた。受聴者は正面0度に対応するマークを真っ直ぐに向いているように要求され、ラウドスピーカはスクリーンの後方に受聴者に対して対称に左右方位角±30度の位置に配置された。仮想音源の呈示の終了後(すなわち入力信号u(n)と与えられる仮想音源の位置に対応するフィルタA1(z)とA2(z)の選択の組み合わせ)、受聴者は仮想音源の位置についてその角度を決定した。受聴者は、仮想音源の角度の決定を下すまでは正面を向いているように指示され、その後、(もし必要ならば)彼らの選択した仮想音源の位置に最も近いマークをスクリーン上から選び出すために頭部を回転させてもよい。受聴者の頭部の動きは物理的には、制限されなかった。
与えられた位置での仮想音源のイリュージョンを作り出すことにおける、このシステムの効果を直接評価するために、実際のラウドスピーカを用いた聴感実験も試みられた。ラウドスピーカは受聴者の周りの半径2[m]の円上の様々な位置に配置された。仮想音源を評価した実験のそれぞれのセットについて、同様の実験が実音源を用いても行われた。各被験者は実音源と仮想音源の両方の試験音のセットを呈示された。試験時間は典型的なセッションの場合で約50分間であり、まず実音源が被験者に呈示された。2日間のインターバルを空けて、仮想音源についての聴感実験が各被験者毎に実施された。
実音源と仮想音源として入力された信号u(n)はスピーチ、1/3オクターブ帯域
制限されたランダムノイズ(中心周波数250Hz,1kHz,4kHz)と250Hz,1kHz,4kHzの純音で構成された。実施されたすべての実験について表1にまとめる。実音源と仮想音源の両方において、異なった方位角に位置する呈示は3つの角度の”セット”に分けられた。これらは表1に示されている。”Set 0”は前後両方向における角度で構成されているのに対し、”Set 1”と”Set 2”は水平面の前半分の角度のみを含んでいる。表1で明記される各実験で、所定のセットからの角度は特定なシーケンスで呈示された。例えば、シーケンス「OA」が"Set 0"からの角度をある特定の順番で呈示することを示している。一方、シーケンス"1A"は"Set 1"からの別の角度の呈示のシーケンスである。実験に用いられた特定のシーケンスを表2に示す。所定のシーケンスでの角度の呈示の順番は、被験者が試験音の順番から学習ができないようにランダムに選択された。加えて、主観評価において呈示の順番に起因するところのいかなるバイアスをも最小にするために、それぞれのシーケンスは逆からの順番でも呈示された。つまり、シーケンス「1Ar」はシーケンス「1A」を逆の順番で呈示した場合を示す。表1で明記される実験のそれぞれについて3人の被験者が実験に参加し、合計12人の被験者がこの実験を受けた。被験者はすべて20代で正常な聴覚を有する。被験者はほぼ男女が半数づつで、3人で構成される被験者のグループに少なくとも1人は女性が含まれるように配慮した。この主観的な実験についての詳細はD.Engler[21]に報告されている。
システムのパフォーマンスにおいて最も配慮された点は、受聴者の後方に配置された仮想音源のイリュージョンを確かに作り出すことは一般には不可能だということである。これは図8に示される結果によって明らかである。図8は実音源と仮想音源の音像定位の比較について示したものである。
図において、正方形の1辺の長さは所定の応答角(回答角)が特定の”呈示角”に対して記録された回数に直接比例している。つまり、被験者がその音源は所定の角度の位置に定位したと回答することで、与えられた試験音にに対して応答した回数である。図8に示されている結果により(これはスピーチ信号による実験結果)、実音源の音像定位はその位置が受聴者の後方にあっても十分に正確であるが、受聴者の後方に作り出された仮想音源に関しては大変しばしばそれらと等しい前方の角度の位置に”反転”される。例えば、150度の呈示角が、受聴者に対しては30度の応答角をもたらすことである。スピーチを実音源として受聴した場合、このような”前後混同”は非常に希であるが、その他の信号が受聴された場合、特に純音の場合(これらの試験のデータについては参考文献[21]を参照することを勧める)には、この前後誤判定は顕著に見られる。
このシステムが受聴者の前方に仮想音源の確かなイリュージョンを作り出す能力を有することが図9よりいっそう明らかである。これは、とりわけ±60°の範囲で顕著である。しかし、時折被験者はこの角度の範囲でも前後方向に関して混乱している。±60°の外側の範囲で、被験者は音像を呈示された角度よりやや前方に音像定位する傾向にある。(すなわち、90度の呈示角の音像は60°,70°また80°に知覚される)。これは中心周波数をそれぞれ250Hz,1kHz 4kHzとした1/3オクターブで帯域制限された白色雑音を音源とした際の実験結果より、はっきりと観測できる。時折、前後方向の誤判定が見られるが、このデータは基本的にシステムの効果にはある種の周波数依存性があることを示している。4kHzのデータを見る[21]と、仮想音源のイメージは受聴者の横方向の本来意図される位置より前方に音源が定位されている時に、大きな程度でイメージが前方に知覚されているのが見て取れる。純音による実験結果[21]は、1/3のオクターブバンドの白色雑音の結果と比較してかなりデータ間にばらつきが見られるが、それでも前後判定に関して類似した傾向を示した。
6.3 リスニングルームにおける実験
IEC規格に基づいて建てられたリスニングルームにおいて、無響室にて実施されたのと同様の評価実験を行った。ラウドスピーカ、受聴者とスクリーンの幾何学的な配置は図4に示されたそれと全く同一であった。しかしながら、インバートされる電気音響系の応答は明らかに異なり、その応答を図10に示す。
図5と比較すると、ラウドスピーカに入力される信号はリスニングルームの表面(壁、床等)に起因して、ダミーヘッドの両耳に十分に強い反射を連続してもたらす。図11がクロストークキャンセルフィルタ(ここで再び、時間領域において最小自乗法により設計された[1-4])のインパルス応答であり、図12は図10に示す測定されたインパルス応答との畳込みの結果である。再び、フィルタ設計手順はシステムを逆畳み込みして、十分なネットワークの応答を積C(z)Hx(z)の対角線上の項のみから得ることができるという点で、非常に効果的である。
上述したように無響条件の下で行われた実験と同一の手順で実施された。表1に挙げられたすべての試験(表2で分類されたシーケンスを用いて)はリスニングルーム内において繰り返された。しかしながら、12人の被験者は異なったグループに分けられた。しかしながら、12人の被験者は異なったグループに分けられたが、実音源と仮想音源の定位に関してあくまでも同一の実験手順による主観評価実験が実行された。再び、被験者は20代の正常は聴覚を有する男女であり、男女同人数である。
図13は仮想音源イメージシステムの有効性と、受聴者が実際のスピーチ音源を音像定位する能力を比較した結果を示す。再び、システムは受聴者の後方に確かなイメージを作り出すことができない、ほとんどすべての仮想音源再生においてそのイメージはそれらの”鏡像の位置”である前方に知覚される。図13はスピーチ音源による実験結果であり、結果がここには示されてないが、その他の種類の信号(純音や1/3オクターブバンド雑音)を実音源とした時の音像定位はスピーチ音源に比べて正確さに欠け、十分な数の前後誤判定が見られる[21]。
ここで再び、システムは受聴者の前方、特に±60°の範囲において、正確に定位されるイメージを再生するのに非常に効果的であった。図14はこの実験結果であり、無響室内にて実施された同様の実験で観測されたもの(図9)に比べて前後の誤判定が少ないことを示している。図14はまた、このシステムが受聴者の両側において仮想音源の前方のイメージを生成する傾向にあることも示している。この傾向は1/3のオクターブバンド雑音を音源とした実験によっても観測された。特に4kHzの中心周波数を有した音源の場合にこの傾向は顕著であった。また、250Hzの音源による実験結果から、この周波数においてはリスニングルームで受聴した場合の方が無響室内での実験に比べてその被験者の応答にばらつきがあることも興味深い挙動である。Engler[21]による追加のデータは、反響(reverberant)な音響空間下での純音の受聴はその定位においては一般に大変に不十分であることを示す。1kHzと4kHzによる実験結果から、そのばらつきは無響室内で実行された実験の結果と類似しているが、250Hzの場合にはそのばらつきはの程度は無響室内にくらべて非常に大きい。
6.4 車室内の実験
最後により冒険的な試みとして、確かな音源を再生するためのシステムの能力について検討するために、いくつかの簡易な実験を自動車の車室内にて行った。車は左ハンドルの”イスズI-MarkXS”であり、既存ののオーディオシステムのラウドスピーカを受聴者に信号を呈示する際に使用した。これらは自動車のダッシュボードの外側に下向きに水平面に対して45度の角度を有して取り付けられ。既存ののオーディオシステムのラウドスピーカを受聴者に信号を呈示する際に使用した。これらは自動車のダッシュボードの外側に下向きに水平面に対して45度の角度を有して取り付けられ。図15におおよその実験のレイアウトを示す。ラウドスピーカは受聴者の両耳を含む水平面の下に上手く配置された。ダミーヘッドがクロストークキャンセルフィルタの設計に用いたダミーヘッド、および受聴者は自動車の左側にあるドライバーシートの同じ位置に配置された。
ラウドスピーカと自動車の車室内の間のインパルス応答は、クロストークキャンセルフィルタの設計は使用できるフィルタ係数の数に限界があるために困難であり、満足に逆システムを設計することも困難であることを証明した。自動車後方のトランクに無響材質のくさびを挿入し、車内のインテリアを覆うことでこの状況を緩和するためのいくつかの試みを実行した。電気音響系の伝達関数のマトリックスを含んだインパルス応答は図16に示される。これらのインパルス応答の形状や周期は、明らかに無響室やリスニングルームにおけるものとは異なっており、インパルス応答の中に直接波の後に到来する本質的なエネルギーが存在する。これはもちろん、受聴者に近接して非常に強い反射をもつ自動車のインテリアの表面の特性によるものである。クロストーク相殺フィルタは同様に非常に長い所要時間を有し、これらのインパルス応答は図17で示される。これらは時間領域技術[1-4]を使うことによって再び設計された。インパルス応答のトランケーションにより、上述されたケースに比べてインバージョンの効果は低減する。これは逆畳み込みされたシステムの伝達関数の周波数分析によってより詳細に確認することができる。逆畳み込みされたシステムの対応するインパルス応答を図18に示す。これより、クロストークの相殺はその困難性にも関わらず、基本的には効果的に行われていることが確認できる。
ここで考慮されている環境では実音源と仮想音源の両方について実験を行い、比較することは不可能なので、実験は仮想音源のみにつちえ実施された。上に記述された実験により、スピーチ信号を仮想音源とした時に、このシステムは最も効果的であったので、スピーチ信号のみを実験で使用した。本質的には、前述された実験と同様な手順に従って、これらの実験は実施され、被験者は直接正面を向くように指示され、仮想音源の位置の角度を決定し、そして車の外側の水平面上に配置されたマーカから対応する角度wを選択した。
位置角度の判定に加えて、被験者は仮想音源が水平面に対して”上方”、”下方”、あるいは”同じ高さ”のいずれであるか、その”エレベーション”についても回答した。この単純な実験はは、前の実験と異なり、信号を再生するために使用されたラウドスピーカが水平面からかなり下がった位置に設置されていたことを考慮して加えられた。受聴者の両耳における所望の信号は水平面内の仮想音源であった。合計12人の正常な聴覚をもった被験者がこの実験に参加した。これらの被験者は無響室やリスニングルームで行われた実験とは異なった。合計で38個のランダムに抽出された位置角度を有する仮想音源がそれぞれの被験者に呈示された。
その定位実験の結果を図19に示す。スピーチ信号を用い、先だって行われた2つの条件下での実験に比べてデータのばらつきは大きいが、大変類似した傾向もデータから見られた。例えば、中央に位置したイメージは確実に中央に定位するが、受聴者の横方向に置かれた仮想音源は”前方イメージ”となる傾向がある。また、前方イメージとは矛盾するいくつかの結果も見られる。つまり、比較的多数の実験において、受聴者の横方向に(60〜90度と-60〜-90の間に)呈示された仮想音源はすべて正確に90度と-90度の位置に定位した。これらの結果は実際は”前後の混同”から推定され、自動車の外側に設置されたマーカーの列から選択されうる位置角度の一番端(まつり±90°度)に位置することが可能である。
上昇テストの結果より、回答不能だったデータも無視はできないが、平均して被験者は仮想音源が水平面上にあると判定したことがわかる。十分な数の被験者が彼らの左側に定位した仮想音源について、水平面の下に位置すると回答したことは、比較的広い角度で被験者の下に置かれた左側のラウドスピーカについて考慮するとあまり驚くべき結果ではない。振り返ってみて、この上昇テストは、被験者が正中面方向のレンジを利用しながら仮想音源のエレベーションについて回答すれば、よりよい検討が可能であったと思われる。このデータから明確なことは、しかしながら、被験者が首尾一貫して仮想音源が水平面の下の位置をにあると判断(回答)しなかったことである。
6.5 議論
上記の実験の結果は、記述された信号処理技術は受聴者の前方の水平面上に±60°以上の範囲で仮想音源のイメージを確実に作り出すのに大変効果的な手段であることを明示する。さらに、これは様々な環境下(Acoustic property)において、ほとんどそれら音響環境の複合性に係わりなく達成され得る。この技術は正常な聴覚を有する被験者に対して一貫して効果的であることが証明され、クロストークキャンセルフィルタはその音場には依存するが、各受聴者それぞれについて設計されないといったことは強調されるべきである。
ある特定の傾向はデータを通して、繰り返し見られた。例えば、システムは被験者の後方に仮想音源を作り出すことはできず、これらの呈示は一般にはそれら音像の鏡像が受聴者の前方に知覚された。受聴者の横方向に呈示された仮想音源は、そのイメージか前方によるという傾向があり、それらは水平面上の本来意図される位置よりも前方に知覚される。
従って、受聴者に対して横方向に仮想音源を確実に定位させることは困難であるが、しかしそれでも±60°の外側の範囲に位置する仮想音源を生成することは可能であることが見いだされた。
7.多チャンネルラウドスピーカを使った水平面の後方半分への音像の生成
上に記述された2チャネルの仮想音源イメージシステムは多数の受聴者に対してその前方にイメージを生成するのに非常に効果的なシステムであり、受聴者の横、ならびに後方にイメージを作り出すための可能性について開発を進めることは明らかに重要である。参考文献[11-15]で報告されているように、過去のいくつかの実験のように、2つのラウドスピーカで受聴者の前方にそれら仮想音源を再生することは可能なことである。しかしながら、それら過去の研究は無響室内で実施され、音源としてダミーヘッド録音によるソースを使用していた。クロストークキャンセルフィルタの設計において十分な配慮と注意を払うことにより、任意の環境下において、2つのラウドスピーカのみを用いて同様の効果を得られる可能性が高い。これは、各受聴者のHRTFについてその詳細を考慮に入れるというように、個別の基準の上に達成されなければらならい。例えば、受聴者の両耳(鼓膜)での2つの信号を正確にヘッドフォンを用いて呈示することによって、任意の位置にイメージを作り出すことは可能であり、そのイメージは受聴者の後方や、あるいはその上方にさえ再生され得るであろう[24,25]。しかしながらその研究の中で、正確な信号を呈示することを保証するためには、(外耳道の応答も含んだ)各個人それぞれののHRTFを用いて逆システムを設計しなければならなかった。これはまた、ヘッドフォン再生において、受聴者は”頭の内側”に作り出されたイメージを知覚することがよく知られているために、このシステムによるイメージが受聴者の頭の外側に作り出されることを保証する必要があった。最終的に、側面と後方へイメージを作り出すための、これまでの方法は一般に頭部の回転に非常に敏感である。ここで記述されるシステムについて実験に基づいた詳細な研究は行われなかったが、このシステムによって生成されたイメージは頭部の回転に対して比較的敏感でないことが見い出されており、仮に頭部が大きく回転されて(例えば60度)そのイメージか破壊された場合も、受聴者がその頭部を本来の位置に戻すと、すぐにそのイメージもそれらがあるべき位置に定位するであろう。さらに、少しの回転に対しては(例えば30度以下)、イメージの位置は非常に安定していることがわかった。
従って、多数の受聴者に対して、そのの側面と後方に確実なイメージを作り出し、しかも受聴者の頭部の回転に対して敏感でないようなシステムを構築することは、非常に興味深い。また、様々な環境下(acoustic environment)でこれを達成することが可能であることは同様に重要である。それを実現するために、ここで、上述された2チャンネルでの技術の多チャンネル一般化に基づいた新たな方法についてその概要を述べる。技術の本質は、受聴者の後方に追加のラウドスピーカを設置し、セクション4で記述された方法にて設計された逆フィルタ列を介して、仮想音源信号を処理することである。これは、2つの音源を用いたシステムに対しては十分に有効であったフィルタ設計の技術が、多チャンネル、または任意の数のラウドスピーカによるシステムに対してどのように一般化されることができるかを示す。したがって、再生に用いられるいかなる個数の音源においても、クロストークキャンセルマトリックスを構築し、これと仮想音源により作り出されるであろう信号を特定するインパルス応答のマトリックスを畳み込むことができる。明らかに、より多数のチャネルが選択されれば、再生音場においてより多くのポイントで所望の信号は複製される。概括的に話をして、それ故に、もし多くのラウドスピーカが再生のために用いられれば、受聴者へのイリュージョンはより確実となることが期待される。しかしながら、この挑戦は最小の個数のラウドスピーカで受聴者の側面と後方に仮想音源の確実なイリュージョンを作り出そうとするものである。これを実用化するにあたって、都合が良く効率的な手段は、つまり2つのラウドスピーカを前方に、後2つを後方に設置する方法であることが見出された。この構成はQuadraphonic音場再生を用いることと同様の効果をもたらす。しかしながら、このシステムにおける信号処理に関しては、Quadraphonic音場再生におけるそれらの本来の手法とは全く異なっていることをここに強調する。初期におけるこれらのシステムは、信号は従来のステレオ再生に使われる通常の音源とする通常の方式と同様の一般的な方式を用いることにより、確実なイメージを生成することができなかったため、一般的な受容を獲得できなかった。つまり、音源となる信号はしばしば、イメージの所望の位置に依存するように異なった振幅を有した信号をラウドスピーカに与えてやることで容易に決定される。Blauertはいくつかの簡単な信号処理手法について議論している[9]。従って、ここで記述される信号処理手法は、従来のステレオ方式を改善するのと同様の方法で、クワドラフォニック(quadraphonic)システムの上に改善を施されるものである。すなわち、信号処理は受聴者の両耳の領域で、所望の仮想音源の振幅と位相の両方を調整する。
さらに、ここで記述された特別なアプローチでは、受聴者の両耳の領域での再生音場における音の到来方向と、所望の音場での仮想音源のそれとをぴったりと合わせることを保証することが可能である。これは我々が、その位置において仮想音源信号の非常に正確な再生を保証しようと試みているポイントを、受聴者の頭部の領域で注意深く選択することで達成される。それらのポイントとは、つまり、クロストークキャンセルフィルタを設計する際に用いる応答が測定されるポイントである。明らかに、受聴者頭部の領域においてそのポイントに関して多くの組み合わせが存在するが、受聴者の頭部に対して片側に非常に近接した2点を、反対側にさらに2点をこれも近接して選ぶ方法が、最も効果的であることが理解された。これは図20に示される。参考文献[7]で記述された研究では、音場を収音するために過去に用いられていた音の波長に比較してコンパクトなマイクロフォンの集合を囲むようにいくつかのラウドスピーカが用いられ、収音された信号が最適な逆フィルタによって処理される場合、原音場における指向特性はそのマイクロフォン群の領域において良好に再生されることが報告されている。この原理はここでは、受聴者の後方へ仮想音源をシミュレーションすることは、受聴者の後方に設置されたラウドスピーカに寄与するところが非常に大きいということを保証するために用いられる。同様に、もし受聴者の前方へ仮想音源を再生することが要求されるなら、信号処理の手法は、この音場再生は受聴者の前方に設置されたラウドスピーカによって支配されているということを保証する。
このアプローチを最も都合のよい状態で実行するには、上述された2チャンネルの場合と類似した方法で、ダミーヘッドを用いるのがよい。しかしながら、この場合、受聴者の頭部が意図される位置に場合のみならず、わずかに回転している状況も考慮したうえで、ダミーヘッドマイクロフォンの位置において、非常に正確な再生を保証するためにクロストークキャンセルフィルタは設計される。4つのラウドスピーカの入力信号と受聴者の頭部領域での4つの位置の関係であることろの4×4のマトリックスC(z)を定義するために、合計で4つの測定の位置が与えられる。4×4のクロストークキャンセルフィルタ行列Hx(z)は上述の式(24)を満足するように設計される。これは再び参考文献[1-4]で記述された時間領域での技術、あるいはセクション5で記述された周波数領域での技術によって成し遂げられる。明らかに、この原理は多数のラウドスピーカを用いた再生方式や、またダミーヘッドの表面上、あるいは近傍に追加されたマイクロフォンの利用に拡張されることが可能である。さらに、多チャンネルのクロストークキャンセルフィルタ行列を設計するためには、ダミーヘッドマイクロフォンの利用は必ずしも必要ではなく、回転楕円な散乱物体の表面上に取り付けられたマイクロフォンアレイの利用も可能であろう。もちろん、各受聴者の頭部の近傍に配置されたマイクロフォンを利用することも可能であろう。最後に、受聴者の頭部の領域において所望の仮想音源の信号を特定し、クロストークキャンセルフィルタ行列を設計するために、解析的、数学的、あるいは経験的なHRTFのモデルを用いて、逆フィルタを設計することは有用であろう。
しかし、4つのラウドスピーカによる仮想音源再生システムを設計する上で、ダミーヘッドを回転させるという単純な技術は、実用上大変効果的であることが証明されている。図20に示すようにダミーヘッドを±5度ずつ回転させて行われた測定(つまり、まずダミーヘッドを両耳から+5度回転した状態で測定は実施され、次に-5度に回転して測定された。)の結果を用いて設計されたシステムに関する聴感実験が、無響室内にて実施された。この場合、逆システムを構成するための行列C(z)を定義するために過去の測定で得られたHRTFのデータベースを利用して(つまり、再生における実際の電気音響系はインバートされていない)、クロストークキャンセルフィルタは設計された。これらの実験により、上述された2チャンネル再生システムにおいて観測された前後誤判定の問題はこのシステムでは軽減されることが結果より明らかになった。図21はスピーチ音源による実験結果である。仮想音源のイメージが確実に受聴者の側面、および後方に受聴者の側面、および後方に再生されていることが見て取れる。頭部がより大きな角度で回転された場合(例えば±15度)についても実験が行われたが、あまり良好な結果は得られなかった。受聴者の頭部近傍の片側に配置されたマイクロフォン間の距離は、対象とする音のうちで最も高い周波数をもつ音の波長より短くなければならないことに起因すると思われる。このような間隔を置くことは、仮想音源の到来方向を正確に再生することを保証する[7]であろう。ダミーヘッドが10度回転する場合、マイクロフォン間の距離は直線で1[cm]離れていなければならないことをここに記しておく。これは、16[kHz]までの周波数帯域において確実な再生が得られることを明示している。回転角度が小さくなれば、この帯域は広がると思われる。より大きな頭部の回転に関しては、十分な周波数帯域での確実な再生は期待できない。最後に、ここで述べたきた実験では、セクション5で記述した周波数領域での逆システム設計技術使われたことを記しておく。式(47)を用いてクロストークキャンセルフィルタを算出する際に、パラメータβを用いてインバージョンを一般化することが特に重要であることが解った。βの値はカット&トライによって抽出されるが、伴うコンピューテーションの速度と効率の点において考慮する際には、それほど困難ではない。反復フィルタ設計手順を設けることによってパラメータβの選択を自動化することも可能である。
参考文献
1.P.A.Nelson, S.J. EIIiott and I.M. Stothers(1989),国際特許申請No. PCT/GB89/00773(Published as WO90/00851),"Improved Reproduction of Pre-Recorded Music."(英語)
2.P.A.Nelson,H.Hamada and S.J.EIIiott(1992),IEEE Transaciton on Signal Processing vol.40,pp 1621-1632,"Adaptive inverse filters for stereophonic sound reproduction."(英語)
3.P.A.Nelson,F.Orduna-Bustamante and H.Hamada(1993),国際特許申請、No.PCT/GB93/01402(Published as WO94/01981),"Adaptive Audio Systems and Sound Reproduction Systems."(Short title:Loudspeaker Position Compensation)(英語)
4.P.A.Nelson,F.Orduna-Bustamante and H.Hamada(1992),Proceedings of the Audio Engineering Society U.K. Conference on Digital Signal processing, London, pp154-174,"Multichannel signal Processing techniques in the reproduction of sound."(英語)
5.B.S.Atal and M.R.(1962),米国特許No.3, 236, 949, "Apparent Sound Source Translator."(英語)
6.P.A.Nelson and S.J. EIIiott(1992),Academic Press, London,"Active control of sound".(英語)
7.P.A.Nelson(1994),Journal of Sound and Vibration, vol 177,pp447-477,"Active control of acoustic fields and the reproduction of sound".(英語)
8.A.D.Blumlein(1931),英国特許No.394325,"Improvements in and relating to sound-transmission,sound-recording and sound-reproducing systems".(英語)
9.J.Blauert(1983),MIT Press,Cambridge Mass,"Spatial Hearing".(英語)
10.B.B.Bauer(1961),オーディオ技術学会誌、vol 9,pp148-151,"Stereophonic earphones and binaural loudspeakers".(英語)
11.M.R.Schroeder,D.Gottlob and K.F.Siebrasse(1974),アメリカ音響学会誌、vol 56,pp1195-1201,"Comparative study of Europeanconcert halls:correlation of subjective preference with geometric and acoustic parameters"(英語)
12.P.Damaske and V.Mellert(1969),Acustica,vol 22,pp153-162,"Sound reproduction of the upper semi-space with directional fidelityusing two loudspeakers"(独語)
13.浜田、池庄子、小椋、三浦(1985)、日本音響学会誌、vol6(3)、pp143-154."Relation between physical characteristics of orthostereophonic system and horizontal plane localisation".
14.G.Neu,E.Mommertz and A.Schmitz(1992),Acustica, vol 76,pp183-192,"Investigations on true directional sound reproduction by playing head-referred recordings over two loudspeakers:Part I"(独語)
15.G.Urbach,E.Mommertz and A.Schmitz(1992),Acustica,vol 77,pp153-161,"Investigations on the directional scattering of soundreflections from the playback of head-referred recordings over two loudspeakers:Part II"(独語)
16.D.H.Cooper and J.L.Bauck(1989).オーディオ技術学会誌、vol 37,pp3-19,"Prospects for transaural recording".(英語)
17.D.H.Cooper and J.L.Bauck(1992).オーディオ技術学会第93回コンベンション発表、サンフランシスコ、"Generalised transaural stereo".(英語)
18.H.Mollcr(1989).オーディオ技術学会誌、vol 37,pp3O-33,"Reproduction of artificial-head recordings through loudspeakers".(英語)
19.K.Kotorynski(1990).オーディオ技術学会第91回コンベンション発表、ロサンジェルス、"Digital binaural stereo conversion and crosstalk cancelling".(英語)
20.S.T.Neely and J.B.Allen(1979).アメリカ音響学会誌,vol 66,pp165-169,"Invertibility of a room impulse response".(英語)
21.D.Engler(1995).修士論文、サウスハンプトン大学、英国、"Subjective testing of a localisation system".
22.F.Orduna-Bustamante(1995).博士論文、サウスハンプトン大学、英国、"Digital signal processing for multi-channel sound reproduction".
23.D.D.Rife and-J.Kistler J.Vanderkooy,1989アメリカ音響学会誌、vol 37(6),"Transfer function measurement with maximum length sequences"
24.F.L.Wightman and D.J.Kistler(1989)アメリカ音響学会誌、vol85(2),pp858-867,"Headphone simulation of free-field listening.1:Stimulus synthesis".
25.F.L.Wightman and D.J.Kistler(1989)アメリカ音響学会誌、vol85(2),pp868-878,"Headphone simulation of free-field listening.2:Psychophysical validation".

Claims (15)

  1. 再生されるいくつかの音が受聴者にはラウドスピーカから離間した仮想音源から発されているかのように聞こえる、複数のラウドスピーカによる再生のための音声処理方法であって、該方法では、ラウドスピーカに供給される信号を処理するためにフィルタ手段を用い、該フィルタ手段が、以下の2つのフィルタ設計ステップ、すなわち、
    a)前記仮想音源の所望の位置と、再生音場における特定位置である受聴者の耳元又は受聴者の頭部領域との間の伝達関数をフィルタ(A)の形式で明確に記述することと、
    b)前記伝達関数フィルタ(A)を、ラウドスピーカの入力と前記特定位置との間の電気音響伝達経路又は経路群(C)をインバートするために使用されるクロストークキャンセル用フィルタ(Hx)の行列と共に畳み込むことと
    を含み、
    前記クロストークキャンセル用フィルタ(H x )の行列が、多チャンネルシステム用のフィルタ設計ステップにおいて作成され、該作成には、
    a)要素C(n)の行列を使用して全ての電気音響経路群のインパルス応答を測定すること、及び、要素C(n)の零付加法を利用して確実にインパルス応答の持続長がN h サンプルになるようにすることと、
    b)N h の等間隔なポイントにおける周波数応答C(k)の行列を得るために、零を付加されたインパルス応答のDFTを算出することと、
    c)“H”はエルミート転置行列演算子、“I”は単位行列、βはレギュラライゼーションパラメータを意味する、式[C H (k)C(k)+βI] -1 C(k)からN h 周波数におけるフィルタの周波数応答を算出することと、
    d)前記式の逆DFTの行列を算出することと、
    e)逆DFTの行列の各要素の逆FFTの前半分及び後半分を交換することによりフィルタのインパルス応答を算出し、(N h /2)+1サンプルのモデリングディレイを実行することと
    が含まれることを特徴とする方法。
  2. インパルス応答h(n)を有する単一チャンネル逆フィルタを作成するために、周波数領域において最小自乗法が適用され、該最小自乗法が、
    a)単一の電気音響伝達経路の、N h をフィルタh(n)におけるフィルタ係数の数、N c をインパルス応答c(n)の継続長とし、N h が2の階乗(2、4、8、16、32....)でありかつN h が2Ncより大きい値でなければならず、
    b)C(n)の零付加法を利用してインバートされる伝達経路のインパルス応答の継続長がN h サンプルに確実になるようにし、
    c)N h の等間隔なポイントにおける周波数応答C(k)を得るために、零を付加された数列c(n)のDFT(離散型フーリエ変換)を算出し、
    d)式C * (k)/(C * (k)C(k)+β)からN h 周波数におけるフィルタの周波数応答を算出し、
    e)βをレギュラライゼーションパラメータとした場合の式C * (k)/(C * (k)C(k)+β)の逆DFTを算出し、
    f)この逆DFTの前半分及び後半分を交換することによりh(n)を算出することとを含むフィルタ設計ステップを採用することを特徴とする、請求項1に記載の方法。
  3. 前記フィルタA及び/又はCの伝達関数が、まず、実音源への入力と、受聴者の「頭部伝達関数」(HRTF)の効果をモデル化するために使用されるダミーヘッドの耳元での(又はその領域における)マイクロフォンからの出力との間で測定を行うことにより導出されることを特徴とする、請求項1又は2に記載の方法。
  4. 最小自乗法が、受聴者の意図される位置で再生された信号(w)と所望の信号(d)との間の時間平均誤差を最小にするために採用されることを特徴とする、請求項1ないし3のいずれかに記載の方法。
  5. 前記伝達関数が、まず、実際の受聴者に測定を行うことにより導出されることを特徴とする、請求項1ないし4のいずれかに記載の方法。
  6. 前記伝達関数が、受聴者の頭部伝達関数(HRTF)の分析的な又は経験的なモデルを使用することにより導出されることを特徴とする、請求項1ないし4のいずれかに記載の方法。
  7. 2つのラウドスピーカのみが使用され、実音源が受聴者の耳の面の前方に位置するように伝達関数フィルタ設計ステップを定めることを特徴とする、請求項1ないし6のいずれかに記載の方法。
  8. 2つのラウドスピーカが受聴者の正面で使用され、少なくとも1つのラウドスピーカが受聴者の後方に使用されることを特徴とする、請求項1ないし6のいずれかに記載の方法。
  9. 受聴者の後方に2つのラウドスピーカがあることを特徴とする、請求項8に記載の方法。
  10. 伝達関数フィルタ設計ステップが、仮想音源の所望の位置と、受聴者の耳に近接する4つの特定位置である一方の耳に近接する2つの位置及び他方の耳に近接する2つの位置との間の伝達関数を決定することを含むことを特徴とする、請求項8又は9に記載の方法。
  11. 耳の位置にマイクロフォンを備えたダミーヘッドが、前記伝達関数を測定するのに使用されて、該ダミーヘッドが、各耳に近接する前記2つの位置を提供するためにわずかな角度で回転され、4つのラウドスピーカの入力信号を受聴者の頭部領域の4つの位置に関連させる4×4行列C(z)が決定されることを特徴とする、請求項10に記載の方法。
  12. 多チャンネル音再生システムを通して録音再生することによりその後再生可能な多チャンネル録音を生成する方法であって、請求項1−11のいずれかに請求された畳み込みフィルタ設計ステップを使用した方法。
  13. 複数のラウドスピーカと、ラウドスピーカへの入力前に記録された信号に作用するように配置されたフィルタ手段とを備え、該フィルタ手段が請求項1−11のいずれかに請求された畳み込みフィルタ設計ステップを使用して作成されている音再生システム。
  14. 音を再生するためのオーディオシステムを備え、該オーディオシステムが請求項1−12のいずれかに請求された方法により作成されたフィルタ手段を使用するラウドスピーカを採用している自動車。
  15. 前記フィルタ手段を用いることで処理された信号を録音処理する、請求項1に記載の方法。
JP50789196A 1994-08-25 1995-08-24 録音及び再生システム Expired - Fee Related JP3913775B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
GB9417185A GB9417185D0 (en) 1994-08-25 1994-08-25 Sounds recording and reproduction systems
GB9417185.7 1994-08-25
PCT/GB1995/002005 WO1996006515A1 (en) 1994-08-25 1995-08-24 Sound recording and reproduction systems

Publications (2)

Publication Number Publication Date
JPH10509565A JPH10509565A (ja) 1998-09-14
JP3913775B2 true JP3913775B2 (ja) 2007-05-09

Family

ID=10760398

Family Applications (1)

Application Number Title Priority Date Filing Date
JP50789196A Expired - Fee Related JP3913775B2 (ja) 1994-08-25 1995-08-24 録音及び再生システム

Country Status (7)

Country Link
US (1) US5862227A (ja)
EP (1) EP0776592B1 (ja)
JP (1) JP3913775B2 (ja)
AU (1) AU3350495A (ja)
DE (1) DE69525163T2 (ja)
GB (1) GB9417185D0 (ja)
WO (1) WO1996006515A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20170094436A (ko) * 2015-02-18 2017-08-17 후아웨이 테크놀러지 컴퍼니 리미티드 오디오 신호를 필터링하기 위한 오디오 신호 처리 장치 및 방법

Families Citing this family (58)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5801063A (en) * 1995-05-09 1998-09-01 Grandics; Peter Device and process for the biospecific removal of heparin
GB9603236D0 (en) * 1996-02-16 1996-04-17 Adaptive Audio Ltd Sound recording and reproduction systems
EP0917709B1 (en) * 1996-07-30 2000-06-07 BRITISH TELECOMMUNICATIONS public limited company Speech coding
JP3900208B2 (ja) * 1997-02-06 2007-04-04 ソニー株式会社 音響再生方式および音声信号処理装置
US5862228A (en) * 1997-02-21 1999-01-19 Dolby Laboratories Licensing Corporation Audio matrix encoding
US6449368B1 (en) * 1997-03-14 2002-09-10 Dolby Laboratories Licensing Corporation Multidirectional audio decoding
US6173061B1 (en) * 1997-06-23 2001-01-09 Harman International Industries, Inc. Steering of monaural sources of sound using head related transfer functions
JP3513850B2 (ja) * 1997-11-18 2004-03-31 オンキヨー株式会社 音像定位処理装置および方法
DE19847689B4 (de) * 1998-10-15 2013-07-11 Samsung Electronics Co., Ltd. Vorrichtung und Verfahren zur dreidimensionalen Tonwiedergabe
US6574339B1 (en) * 1998-10-20 2003-06-03 Samsung Electronics Co., Ltd. Three-dimensional sound reproducing apparatus for multiple listeners and method thereof
US7113609B1 (en) 1999-06-04 2006-09-26 Zoran Corporation Virtual multichannel speaker system
KR100416757B1 (ko) * 1999-06-10 2004-01-31 삼성전자주식회사 위치 조절이 가능한 가상 음상을 이용한 스피커 재생용 다채널오디오 재생 장치 및 방법
JP2001057699A (ja) * 1999-06-11 2001-02-27 Pioneer Electronic Corp オーディオ装置
AU2001287404A1 (en) * 2000-08-17 2002-02-25 Bob & Andy's Crazy Enterprises Inc. Surround sound system
US6928168B2 (en) 2001-01-19 2005-08-09 Nokia Corporation Transparent stereo widening algorithm for loudspeakers
US7457425B2 (en) * 2001-02-09 2008-11-25 Thx Ltd. Vehicle sound system
US7254239B2 (en) 2001-02-09 2007-08-07 Thx Ltd. Sound system and method of sound reproduction
US7433483B2 (en) 2001-02-09 2008-10-07 Thx Ltd. Narrow profile speaker configurations and systems
TWI230024B (en) * 2001-12-18 2005-03-21 Dolby Lab Licensing Corp Method and audio apparatus for improving spatial perception of multiple sound channels when reproduced by two loudspeakers
US7116788B1 (en) * 2002-01-17 2006-10-03 Conexant Systems, Inc. Efficient head related transfer function filter generation
EP1370115B1 (en) * 2002-06-07 2009-07-15 Panasonic Corporation Sound image control system
FI118370B (fi) * 2002-11-22 2007-10-15 Nokia Corp Stereolaajennusverkon ulostulon ekvalisointi
EP1685554A1 (en) * 2003-10-09 2006-08-02 TEAC America, Inc. Method, apparatus, and system for synthesizing an audio performance using convolution at multiple sample rates
JP2005198251A (ja) * 2003-12-29 2005-07-21 Korea Electronics Telecommun 球体を用いた3次元オーディオ信号処理システム及びその方法
KR100644617B1 (ko) * 2004-06-16 2006-11-10 삼성전자주식회사 7.1 채널 오디오 재생 방법 및 장치
FR2874757B1 (fr) * 2004-09-02 2006-11-10 Helita Soc Par Actions Simplif Methode d'evaluation de l'etendue de la zone de protection conferee par un dispositif de capture de coup de foudre
EP1825713B1 (en) * 2004-11-22 2012-10-17 Bang & Olufsen A/S A method and apparatus for multichannel upmixing and downmixing
KR100608024B1 (ko) * 2004-11-26 2006-08-02 삼성전자주식회사 다중 채널 오디오 입력 신호를 2채널 출력으로 재생하기위한 장치 및 방법과 이를 수행하기 위한 프로그램이기록된 기록매체
JP4988716B2 (ja) 2005-05-26 2012-08-01 エルジー エレクトロニクス インコーポレイティド オーディオ信号のデコーディング方法及び装置
US8577686B2 (en) 2005-05-26 2013-11-05 Lg Electronics Inc. Method and apparatus for decoding an audio signal
KR20080086548A (ko) * 2006-01-19 2008-09-25 엘지전자 주식회사 미디어 신호 처리 방법 및 장치
EP1984913A4 (en) * 2006-02-07 2011-01-12 Lg Electronics Inc DEVICE AND METHOD FOR CODING / DECODING A SIGNAL
WO2007101958A2 (fr) * 2006-03-09 2007-09-13 France Telecom Optimisation d'une spatialisation sonore binaurale a partir d'un encodage multicanal
EP1858296A1 (en) * 2006-05-17 2007-11-21 SonicEmotion AG Method and system for producing a binaural impression using loudspeakers
US8036767B2 (en) 2006-09-20 2011-10-11 Harman International Industries, Incorporated System for extracting and changing the reverberant content of an audio input signal
KR101238361B1 (ko) * 2007-10-15 2013-02-28 삼성전자주식회사 어레이 스피커 시스템에서 근접장 효과를 보상하는 방법 및장치
US20090123523A1 (en) * 2007-11-13 2009-05-14 G. Coopersmith Llc Pharmaceutical delivery system
JP5520456B2 (ja) * 2008-06-26 2014-06-11 株式会社エー・アール・アイ バイノーラル収音再生システム
US8213637B2 (en) * 2009-05-28 2012-07-03 Dirac Research Ab Sound field control in multiple listening regions
ATE537667T1 (de) 2009-05-28 2011-12-15 Dirac Res Ab Schallfeldsteuerung mit mehreren hörbereichen
US9100766B2 (en) * 2009-10-05 2015-08-04 Harman International Industries, Inc. Multichannel audio system having audio channel compensation
CA2774415C (en) * 2009-10-05 2017-09-05 Harman International Industries, Incorporated System for spatial extraction of audio signals
US9107021B2 (en) * 2010-04-30 2015-08-11 Microsoft Technology Licensing, Llc Audio spatialization using reflective room model
JP5514050B2 (ja) * 2010-09-07 2014-06-04 日本放送協会 伝達関数調整装置、伝達関数調整プログラムおよび伝達関数調整方法
CH703771A2 (de) * 2010-09-10 2012-03-15 Stormingswiss Gmbh Vorrichtung und Verfahren zur zeitlichen Auswertung und Optimierung von stereophonen oder pseudostereophonen Signalen.
US9578440B2 (en) * 2010-11-15 2017-02-21 The Regents Of The University Of California Method for controlling a speaker array to provide spatialized, localized, and binaural virtual surround sound
JP5787128B2 (ja) * 2010-12-16 2015-09-30 ソニー株式会社 音響システム、音響信号処理装置および方法、並びに、プログラム
TWI498014B (zh) * 2012-07-11 2015-08-21 Univ Nat Cheng Kung 建立最佳化揚聲器聲場之方法
RU2680423C2 (ru) 2013-03-13 2019-02-21 ТиЭйчИкс ЛТД Акустическая система узкого профиля
DK2863654T3 (en) * 2013-10-17 2018-10-22 Oticon As Method for reproducing an acoustic sound field
JP6135542B2 (ja) * 2014-02-17 2017-05-31 株式会社デンソー 立体音響装置
US9749769B2 (en) 2014-07-30 2017-08-29 Sony Corporation Method, device and system
EP3227888B1 (en) * 2014-12-03 2018-10-31 Reinet S.A.R.L. Non linear filter with group delay at pre-response frequency for high res audio .
RU2679211C1 (ru) * 2015-02-16 2019-02-06 Хуавэй Текнолоджиз Ко., Лтд. Устройство обработки аудиосигнала и способ снижения перекрестных помех аудиосигнала
TWI554943B (zh) * 2015-08-17 2016-10-21 李鵬 音訊處理方法及其系統
EP3297298B1 (en) * 2016-09-19 2020-05-06 A-Volute Method for reproducing spatially distributed sounds
CN111295896B (zh) * 2017-10-30 2021-05-18 杜比实验室特许公司 在扬声器的任意集合上的基于对象的音频的虚拟渲染
JP7115353B2 (ja) 2019-02-14 2022-08-09 株式会社Jvcケンウッド 処理装置、処理方法、再生方法、及びプログラム

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0434691B1 (en) * 1988-07-08 1995-03-22 Adaptive Audio Limited Improvements in or relating to sound reproduction systems
JPH03171900A (ja) * 1989-11-29 1991-07-25 Pioneer Electron Corp 狭空間用音場補正装置
DE69319456T2 (de) * 1992-01-30 1999-03-25 Matsushita Electric Ind Co Ltd Schallfeldsteuerungssystem
DE69325025T2 (de) * 1992-07-06 1999-12-30 Adaptive Audio Ltd Adaptive audiosysteme und tonwiedergabesysteme
US5404406A (en) * 1992-11-30 1995-04-04 Victor Company Of Japan, Ltd. Method for controlling localization of sound image
US5521981A (en) * 1994-01-06 1996-05-28 Gehring; Louis S. Sound positioner

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20170094436A (ko) * 2015-02-18 2017-08-17 후아웨이 테크놀러지 컴퍼니 리미티드 오디오 신호를 필터링하기 위한 오디오 신호 처리 장치 및 방법
US10123144B2 (en) 2015-02-18 2018-11-06 Huawei Technologies Co., Ltd. Audio signal processing apparatus and method for filtering an audio signal
KR101964107B1 (ko) * 2015-02-18 2019-04-01 후아웨이 테크놀러지 컴퍼니 리미티드 오디오 신호를 필터링하기 위한 오디오 신호 처리 장치 및 방법

Also Published As

Publication number Publication date
JPH10509565A (ja) 1998-09-14
DE69525163D1 (de) 2002-03-14
AU3350495A (en) 1996-03-14
WO1996006515A1 (en) 1996-02-29
US5862227A (en) 1999-01-19
EP0776592A1 (en) 1997-06-04
DE69525163T2 (de) 2002-08-22
EP0776592B1 (en) 2002-01-23
GB9417185D0 (en) 1994-10-12

Similar Documents

Publication Publication Date Title
JP3913775B2 (ja) 録音及び再生システム
JP4364326B2 (ja) 複数の聴取者用3次元音響再生装置及びその方法
JP4508295B2 (ja) 収音及び再生システム
JP3657120B2 (ja) 左,右両耳用のオーディオ信号を音像定位させるための処理方法
Gardner Transaural 3-D audio
US5982903A (en) Method for construction of transfer function table for virtual sound localization, memory with the transfer function table recorded therein, and acoustic signal editing scheme using the transfer function table
KR100647338B1 (ko) 최적 청취 영역 확장 방법 및 그 장치
KR20040004548A (ko) 3차원 소리 환경을 모사하기 위한 방법과 시스템
JP5611970B2 (ja) オーディオ信号を変換するためのコンバータ及び方法
JP3217342B2 (ja) ステレオフオニツクなバイノーラル録音または再生方式
JP2005198251A (ja) 球体を用いた3次元オーディオ信号処理システム及びその方法
US9872121B1 (en) Method and system of processing 5.1-channel signals for stereo replay using binaural corner impulse response
Kahana et al. A multiple microphone recording technique for the generation of virtual acoustic images
JPH09191500A (ja) 仮想音像定位用伝達関数表作成方法、その伝達関数表を記録した記憶媒体及びそれを用いた音響信号編集方法
Gardner Spatial audio reproduction: Towards individualized binaural sound
JP3374425B2 (ja) 音響装置
JP2001346298A (ja) バイノーラル再生装置及び音源評価支援方法
JP2000333297A (ja) 立体音生成装置、立体音生成方法及び立体音を記録した媒体
KR100275779B1 (ko) 5채널 오디오 데이터를 2채널로 변환하여 헤드폰으로 재생하는 장치 및 방법
Jot et al. Binaural concert hall simulation in real time
JPH02200000A (ja) ヘッドフォン受聴システム
Mickiewicz et al. Spatialization of sound recordings using intensity impulse responses
US20230370797A1 (en) Sound reproduction with multiple order hrtf between left and right ears
Tan Binaural recording methods with analysis on inter-aural time, level, and phase differences
KR100626672B1 (ko) 구체를 이용한 3차원 오디오 신호 처리 시스템 및 그 방법

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040407

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060328

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20060626

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20060814

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060928

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070116

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070201

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110209

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees