JP2005530432A - 部屋における拡声器からの音声のデジタル等化方法、および、この方法の使用法 - Google Patents

部屋における拡声器からの音声のデジタル等化方法、および、この方法の使用法 Download PDF

Info

Publication number
JP2005530432A
JP2005530432A JP2004514386A JP2004514386A JP2005530432A JP 2005530432 A JP2005530432 A JP 2005530432A JP 2004514386 A JP2004514386 A JP 2004514386A JP 2004514386 A JP2004514386 A JP 2004514386A JP 2005530432 A JP2005530432 A JP 2005530432A
Authority
JP
Japan
Prior art keywords
algorithm
room
correction
frequency
output
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2004514386A
Other languages
English (en)
Inventor
ヨハンセン,ラース・ゴットフリート
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
EQUTECH APS
Original Assignee
EQUTECH APS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by EQUTECH APS filed Critical EQUTECH APS
Publication of JP2005530432A publication Critical patent/JP2005530432A/ja
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S5/00Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation 
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/301Automatic calibration of stereophonic sound system, e.g. with test microphone
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/307Frequency adjustment, e.g. tone control

Abstract

ある部屋に置かれた拡声器からの音声をデジタル等化する方法であって、ユーザが音声を知覚する方法に影響を及ぼすさまざまな音響特性を有する上記部屋は、マイクロホンによって1つ以上のインパルス応答を測定することによって、部屋のある部分で補正され、上記インパルス応答は、少なくとも2つの平行な周波数帯域補正アルゴリズムおよび後処理アルゴリズムにおいて処理される。選択肢として、前補正アルゴリズムは、前処理アルゴリズムおよび周波数帯域幅補正フィルタの間で結合することができる。前補正アルゴリズムは、無響室における理想的な条件の下で、測定された拡声器の特徴を表わす入力および/または反射減衰アルゴリズムからのパラメータを受信するようにされる。後処理アルゴリズムから、最終的なフィルタパラメータは記憶され、拡声器を拡声器が置かれた実際の部屋の音響動作に与える増幅器に接続されたソースからの音声を補正するために用いられる。部屋におけるいかなるパラメータも変更された場合、新しいフィルタパラメータを設定するために、本発明に従った補正方法を繰返すことができる。

Description

本発明は、結合した拡声器/部屋の伝達関数を有する、部屋に置かれた拡声器からの音声をデジタル等化する方法に関するものであり、上記方法は、部屋にマイクロホンを置くステップと、増幅器を通して拡声器から1つ以上のパルスを発するステップと、所望の聴取位置におけるインパルス応答を測定するステップと、上記方法とを含む。
さらに、本発明はこの方法の使用法に関する。
音声再生における高忠実度
拡声器は100年前に考案されたものであるため、音声再生における目的は徐々に変化し、さらに野心的なものとなっている。音声再生の歴史のごく初期において、現実的な技術上の目標は、音量レベル、増幅、音響効率等に関するものであった。今日、これらの課題はもはや我々にとって現実的な技術的課題ではない。努力が進められ、それは20世紀の後半において音声再生の質に関するものとなった。
ステレオ録音技術が1950年代初期に導入されて、(より多くの人がステレオラジオ蓄音機を入手できるようになった)とき、実際の事象に関する再生性質への関心が大きく高まった。過去約40年の間に、高忠実度は、少なくとも家庭用のオーディオシステムを扱うときに、音声再生において必要不可欠な条件となった。今日、最終的な目的は透明な再生システム、すなわち物理的、電気的または音響上の性質により、元の信号にいかなる可聴特性も追加しないシステムを製造することである。しかしながら、技術的な観点から、これは非常に明確な目標ではない。
高忠実度という用語は、再生システム全体を含み、再生された音声がどの程度実際の事象と一致するかを表わすものである。音声再生の連鎖におけるほとんどの要素によって音声が低下し、それに加えて再生された事象は、通常実際の事象を厳密に複製したものとはかなりかけ離れている(図1.1を参照)。以下ではどこで高忠実度が損害を受けやすいかを列挙する。
・記録技術および処理
・記録された情報/信号の記憶
・記憶された情報の電気信号への変換
・信号(アナログ/デジタル)の変換
・増幅技術
・電気信号から音響信号への変換器(拡声器/ヘッドホン)
・音声再生の部屋
従来の2つのチャネル記録技術は、一貫した態様で実際の事象をとらえるまでに発達し(録音の設定および新しいマルチチャネルシステムの標準に関しては現在でも議論が続いている)、デジタル技術は初期の問題を解決したように思われる。同様に、今日の増幅器は、最終的な透明性に近付くように構成することができる。しかしながら、先行技術の真空管増幅器を用いて再生された40年前のアナログLP記録が、少なくとも主観的な質の観点から、今日の技術で達成されるものに匹敵する性能を提供するのは、示唆に富むものである。
結論として、透明な高忠実度の音声再生に向けての次の大きな一歩は、音響分野におい
て、すなわち増幅された電気信号がいかにして音声に変換され、音圧が聞き手の耳に到達する前にいかに環境によって影響されるか、においてとられることになるであろう。したがって、再生された音声をさらに向上させるためには、拡声器および部屋に焦点を置かなければならない。
どのシステムの構成要素が再生された音声に最大限に影響を与え、どれが顕著な影響を及ぼさないかに関する多くの偏見が存在する。このような態度および考えには技術的な測定によって確認されたものもあるが、そうでないものもある。一般的に主観的な聴取の観点によって合意されたものもあり(おそらくシステム測定を通して確認することはできないだろうが)、非常に個人的なものもある。しかしながら、元来、ブラインドリスニングテスト(被験者はどの操作が行なわれたのかを知らない)を行なったときに、大半の人は個人的な好みとは関係なく、均一の方法でさまざまな特徴を評価することができることがわかっている。
再生の透明性に関して、唯一適切に参照できるのは実際の事象であるため、大半の人々が魅力的と思うものは、実際の事象に参加しているという錯覚および感覚、すなわち「そこにいる」という感覚を作り出す再生音である。将来的に測定および適切な解釈を実証することができるかもしれないが、よい錯覚とあまりそうでないものとを分ける特徴、決定的な評価は、おそらく常に主観的なものに基づくはずである。
試聴室の影響
音声が、電気から音響への変換として拡声器で生成されるときに、音声が聴取者の耳に届く前の最後の伝送路は試聴室を通る。部屋は囲まれており、音声は拡声器からほとんどすべての方向に発せられるため、この最後の音響伝送路は知覚される音声に大きな影響を及ぼす。部屋は音声再生のために十分に最適化され得るが、それは常に独自の音響特性を事象にもたらす。これは実際の事象の錯覚にとって有益であるかもしれないが、そうでないかもしれず、通常有益ではない。
室内音響の影響のない音声再生の事象を想像することは魅力的なことである。このようなことは、たとえば自由音場で得られるが、平均的な聴取状況に適合しない。別の方法で、無響室、(拡声器からの直接の音声のみが試聴者の耳に届く(反響は全くない)ように設計された部屋)を用いることができる。この解決法も平均的な家の試聴部屋において実現可能ではない。このような部屋が物理的に含意するものは、住宅建設における標準的な技術に全く適合しない。結論として、この条件がたとえ実現可能なものであったとしても、それが実際に望まれることなのかどうかが問題となる。
代わりに、ほぼ理想的な音響特性の補償を行なうことが1つのアプローチとして挙げられる。音響特性の一部は、壁、床または天井に取り付けられた受動減衰材料を用いることによって変えることができるか、または吸収装置を用いることができる。音響を補償する別の方法は、通常電力増幅器の直前に再生システムに設置された電気イコライザを用いることである。このようなイコライザは、再生された音声の周波数振幅の内容を変えることができるが、本質的に過渡信号の再生成に関する周波数の位相特徴も変える。一般的に、これは室内音響を補正しようとするときに1組の悪い特性をもたらすことが多い。したがって、高忠実度の観点から、従来のイコライザは十分ではなく(または望ましいものではなく)、より高度な技術と取って代わる必要がある。
デジタル電子工学による室内音響補正
デジタル技術は、より進歩したイコライザ、またはより広い意味では補正システムの可能性を提供する。信号プロセッサ(DSP)を用いるデジタル電子技術によって、理想的な観点から目標となり得るものを実現することがかなり容易になる。本質的に、問題を明
確に示し、適切な解のアルゴリズムを考案し、かつこれらを1つ(またはそれ以上の)DSPにおいてプログラムすることによって、従来のアナログイコライザと比較してより多くの自由度が与えられる。
しかしながら、このようなアプローチでは、室内音響特性の詳細な情報が要求される。あいにく、同じ部屋で、音響特性の一部は、拡声器および受け手(聴取者または測定マイクロホン)の物理的な位置に依存してかなり変化する。この現象は、ポイント・ツー・ポイント感度シナリオと呼ばれる。したがって、それが1つの物理的な地点でしか適切に作用しないのであれば、すぐに、現実的な補正システムを設計することは見込みのないことと思われる。幸いにも以下で明らかにされるような共通の特徴もある。
したがって、特有の状況ではデジタル技術および数学が(部屋の非常に限られた空間、実際には地点において)非常に正確な室内音響補正の可能性を与え得るが、現実的に物理的に考えると、この可能性を利用することができないことがわかる。補正が、部屋全体でなくとも、より広い空間に適用されることが必須である。
実用的な補正システムの概念
部屋補正システムに対する第1の基本的な要求は、当然のことながら、主観的に知覚された音声再生の質を幾分か改善させることであり、第2の要求は、その使用が簡単でなければならないということである。実用的な補正システムの高レベルの仕様を以下に示すことができる。
・スタンドアローンシステム、外部コンピュータの必要なし
・マルチチャネル機能
・適度なハードウェアの複雑さ、たとえば良好なマルチフォーマットデコーダ(MP3,DTS,Dolby ProLogic等のそれに匹敵するもの
・好ましくは30秒未満のオフラインでの動作時間
・聴取位置のまわりの適度な空間、たとえば1m2における客観的および主観的な改善、部屋の他の部分に危険な人工物がないこと。
システムの動作はできるだけ簡単でなければならない。ユーザは好ましい位置に、またはおそらく比較的互いに近接した多くの位置にマイクロホンを置き、システムが室内音響情報を獲得するようにする。次に、このシステムは各々のチャネルにつき正確な補正アルゴリズムを計算する(図1.2(左)を参照)。ここで、このアルゴリズムは記憶されて、図1.2(右)に示されるように、信号入力が、前置増幅器を通して信号源から補正システムに与えられる。最後に、補正された信号は電力増幅器および拡声器に与えられる。この設定は前置フィルタリング補正と呼ばれる。なぜなら信号は実際には、室内音響による後の変換に対処するために、事前に電子的に修正されるからである。
室内音響および室内音響情報の獲得の概要
拡声器から来る所与の時点で受信された音声は、より多くの要素からなる。最初に到達するのは、ソースからの直接音であり、その後で多重のおよび変更されたバージョンの音声の集合が現われる。これらの音声は、1つ以上の境界面または内部要素にぶつかり、それによって反射され(図2.1を参照)、そこから離れると、遅延され、減衰される可能性が高い。なぜならほとんどすべての材料はある端数αだけ音声エネルギを吸収するからである。図2.1で、音声は拡声器から発せられ、かつマイクロホンによって受信されるビームとして示されている。この考えは、いかなる部屋の寸法よりもかなり小さい波長についてのみ有効であるため、反射を低い周波数の現象と関連付けることは一般的ではない。7つの反射ビーム、すなわち第1のオーダの最初の4つ(1つ目の反射)、第2のオーダの1つ(2つ目の反射)、および第3のオーダの2つ(3つ目の反射)が示されている
。時間が経過すると、反射数が増加するため、マイクロホンで受信された音声は徐々に、異なる送信経路を通って進む音声ビームの無限和として考えることができる。
3つの部分に分かれるインパルス応答
図2.2では、試聴室からの100msの任意のインパルス応答測定が示されており、これは別々に注目すべき3つの部分からなると考えることができることが明らかである。
・直接音
・分離可能な反射
・反響テールとしても示される分離不可能な反射
ある時期のtstatでは、反射を分離するのが難しい。なぜなら反射は短い時間間隔tに非常に多く存在するからである。最大時間t0までの反射数De数がeq.2.1に示されている。統計的時間(または混合時間)と呼ばれる時間tstatはeq.2.2によって規定することができ、比率N/tはエコー密度を示し、この限界を超えると、インパルス応答を統計的な態様で扱うことがより適切になる。反響半径rreverbはeq.2.3で規定されており、これはソースからのどの距離で音場が拡散するかを示している。(家の試聴室のスピーカから約3mの距離の)通常の試聴状況の下で知覚された音響エネルギの大半は、反射ビームから来るものである。なぜならRreverbは典型的に0.5から1mであるからである。
Figure 2005530432
モード共振周波数
周波数領域分析は、インパルス応答の伝達関数の対照物と関連付けられることが多い。セクション2.2では、時間領域は、tstatよりも低い分離可能な反射部分、およびtstatを超える統計的な反響部分に大まかに分けられる。周波数領域においても同様に考えることができる。音声の波動性のために、部屋の寸法は、低い周波数で、ある波長について半波長の比較的小さな整数に等しいものとなる。したがって、平行な面の間で定在波が観察され、このような周波数について共振が生じる。
部屋の1つの寸法、たとえばIXが波長の2分の1と等しいとき、定在波は第1のオーダモード(nX=1)の部屋の共振を引き起こすといわれる(IXが2つの半波長に等しいときに、第2のオーダモード、nX=2が得られる)。定在波はまた2つ以上の平行な面の反射によって生じ、たとえばSXおよびSZ、ならびに完全な組をなす共振周波数(原則としてその数は無限である)は、矩形の形状で完全に反射する部屋に適用されるeq.2.4によって決定することができる。モードnX,nY,nZ(1,0,0;0,1,0;
0,0,1;1,1,0等)を結合することによって、図2.3(棒線)では5Hzの連続的な帯域幅におけるモード共振の合計数が示されている。滑らかな曲線は周波数の関数としてのモード反響の予測された数である。
Figure 2005530432
明らかに、周波数帯域における共振の数は周波数とともに増加し、ある点で、共振を互いから分離することはできない。これが起こったときに、さらなる分析のための統計的なアプローチが便利になる。これは時間領域反射について示されたものと非常に似た状況である。時間領域測定tstatに類似するものとして、シュローダー(Schroeder)はeq.2.5に示された測定を提案し、これを超えると統計的な分析が適切になる。これは、周波数のスペクトルをガウスホワイトノイズプロセスのそれによって近似化することができることを意味する。fschrを超えると、2つの共振Δ(fN)の間の距離は非常に狭くなるため、平均して少なくとも3つの共振が1つの共振の平均帯域幅(BfN)に含まれることになり、共振の分離がほとんど不可能になる。
Figure 2005530432
典型的な試聴室について、fschrは100から150Hzの範囲にあり、共振の平均帯域幅は4から5Hzとなり、周波数スペクトルの典型的なダイナミックレンジは±15dBとなる。図2.4には、インパルス応答の周波数振幅スペクトルが示されている。明らかに、共振は可視の不規則性をもたらし、少なくとも200Hzよりも低い周波数で、ピークを個々に指摘することができると考えられる(eq.2.5に従ったfschrは141Hzである)。
簡潔な観点における室内音響
拡声器および試聴者の位置によって部屋の共振周波数のパターンが変わることはないが、これらによって共振がどのように励起され、知覚されるかに影響が及ぼされるかを理解することが重要である。
図2.5のような図面を、個々に注目すべき時間周波数領域を明らかにし、分離するものとして描くことができる。左上角に、個々に指し示すことのできる分離可能な反射およびモード共振の領域がある。この領域は、おそらく人間の聴覚が最も耳障りな人工物と感じるものである。しかしながら、右下角で、時間および周波数領域の双方は、確率過程として示すことのできる分離不可能な要素によって占められている。すなわち室内音響特性のみに全体的に依存している。
時間および周波数の現象を特徴付け、モデル化するときに、部屋のサイズ(容量)に特に関心が寄せられる。なぜなら、これは結合された領域における限界の外形を示すからである。容量が増えるとtstatは上方に動き、fschrは下方に動き、逆もまた同様である。例示のために、大容量のコンサートホールにおける、部屋のモードおよび共振について述
べるのは全く関連性がないかもしれないが、実際には個々の反射数は大きい可能性がある。小さな部屋において、おそらく最初の2から4の反射のみを分離することができるが、その代わりに部屋の共振は個々に最大数百ヘルツまでを占めるかもしれない。
室内音響情報を獲得するおそらく最も明白な方法は、音声が部屋の位置1Psにおけるある十分に規定されたソースから発せられて、位置Prで受信されるまでの音声伝送路を考えることである。受信された音声を発せられた音声に関連付けると、厳密に部屋がどのようにPsからPrにかけて音声に影響を与えるのかを見出すことができる。この考察は妥当であると思われる。なぜならPsに位置付けられた拡声器およびPrの試聴者について扱っているからである。この考察は数学的な意味でポイント・ツー・ポイントシナリオと呼ばれる。もちろん拡声器から発せられた音声は(たとえばドライバユニット間の距離のために)空間における単一の位置から来るものではないため、ポイント・ツー・ポイントシナリオの現実世界での解釈は幾分か緩和されなければならない。それでも、受け手側において、受け手が単一のマイクロホンであるとすれば、Prを1つの地点と考えることが有効である(2つの耳を持つ人間の場合、この想定は明らかに当てはまらない)。
MLSSA音響測定システムは、このような伝送路情報を獲得することができる。拡声器を通して(ランダムなホワイトノイズシーケンスに似た)最大長シーケンスss(t)を発し、かつマイクロホンで所望の地点での音圧sr(t)を測定することによって、相互相関で伝送路インパルス応答hsr(t)を計算することができる。
インパルス応答は、理想的に、無限に短い持続時間および無限の帯域幅を有する完璧な音声インパルスd(t)がPsから発せられたときに、受信位置Prで何が起こったかを知らせる基準である。手を叩くことまたはピストルを発射することはこの理想的なインパルスに近づく。しかしながら、このような信号は雑音の影響を被りやすく、そのために相互相関技術が考案され、広く用いられている。実際に、インパルス応答hsr(t)は音声に影響を与える3つの項目、拡声器、部屋およびマイクロホンに関する情報を保持する。これらの項目の効果は分離されるかもしれないが、分離されないかもしれない。一般的に、マイクロホンの寄与は、その周波数帯域が通常所望のオーディオ帯域幅と比較して大きいために無視される。eq.2.6は、時間領域コンボルーションにおいて受信された信号sr(t)に寄与する個々のインパルス応答としての影響の項目を示している。ss(t)をd(t)に置き換えると、ただ全体のシステム(または伝送路)インパルス応答hsr(t)が得られるだけである。
Figure 2005530432
MLSSAは、完全な音圧を測定し、この作業における室内音響の獲得のために用いられる。これは、応答h(t)が実際にh(n)と示された一連のサンプルとして表わされることを意味する離散時間システムである。
インパルス応答および伝達関数
インパルス応答h(t)は、連続的な時間領域測定である。コンピュータベースの測定について、出力はもちろん別個のものである。
伝達関数は、インパルス応答に等しい周波数領域である。この関係はZ変換であり(eq.2.7を参照)、通常(実用的な目的のために)H(z)もサンプリングされて複雑
な値のH(z)の有限数を与える。ss(t)がd(t)の離散時間バージョンによって置き換えられ、マイクロホンからの非常に小さな影響を無視する、eq.2.6のZ変換はeq.2.8をもたらし、コンボルーションが乗算に変わる。
Figure 2005530432
アルゴリズム設計を補正するためのデジタル信号処理技術および伝達関数の分解およびヒルベルト変換
測定された室内インパルス応答h(n)のZ変換H(z)は、非パラメータ化されたにもかかわらず、eq.3.1のように一般化したデジタルIIRフィルタによってモデル化することができる。本質的に、一般化したシステムモデリングは、分子および分母双方の多項式を含む。分子におけるルートajは、単位円内部の伝達関数におけるゼロを表わし、bjは単位円外部のゼロである。それに応じて、ciは伝達関数の単位円の極の内部を示し、diは外部の極を示す。
Figure 2005530432
分解を通して、いかなる伝達関数H(z)も最小位相部分、全通過部分、および純粋な遅延(Hallpass(z)は遅延z-nを含むこともある)の積に分けることができる。最小位相部分は、すべての極、自然の「内部の」ゼロ(aj)、および振幅1/r(bj)で内部にマップされたいかなる「外部の」ゼロbj(これをb′jと呼ぶ)からなる。全通過部分は、元の「外部の」ゼロbjおよび人工的にもたらされたゼロb′jを取り消す極からなり、これらの極はa′jによって示される。H(z)のすべての可能な振幅情報は次にHmph(z)に保持され、一方で規定されたHallpass(z)の振幅は常に均一となる。伝達関数におけるこのようにして規定された最小位相および振幅は、明らかに互いに結び付けられる。最小位相システムおよび全通過システムの分離は、同形デコンボルーションを用いることによって達成することができる。応答h(n)の最小位相部分は、最初に複素ケプストラムを形成し、次にこの領域においていかなる因果関係も示さない情報を削除して、最後に図3.1のステップを用いて時間領域に逆戻りする逆算によって抽出することができる。
混合位相システムhmix(n)の逆転は本質的に不安定をもたらす。しかしながら、興味深いことに、不安定であるが因果関係のあるシステムは、安定しているが因果関係のないシステムの形態をとることもできるため、因果関係がないのを許可することによって、最大位相システムの補正が実際に可能になる。室内インパルス応答における過剰位相を、遅延を導入することによってさらに等化することができる。すべての過剰位相に対処する
ために、理想的には、このように課された因果関係は無限に長く続くべきであるが、これはもちろん不可能である。純粋な実用性の観点から、過剰位相の等化はさらに、補正の程度および許容することのできる遅延量の妥協である。好ましくは、ポイント・ツー・ポイントシナリオにおいてhmax(n)を等化するときに、補正遅延部分に人工物は存在しないが、再生システムがわずかでも変更されるときは常に、因果関係のない補正が人工物をもたらすことになる。人工物は、たとえば前エコーおよび/または前反響として聞こえるおそれがあり、これは極めて不快なものである。
パラメトリック伝達関数モデリング
パラメトリック法における伝達H(z)のモデリングは、特にH(z)における現象がパラメトリック化されたモデルをもたらす技術に十分に従っているときに、等化において有益となる可能性がある。一般的に、eq.3.2の開始点をとると、パラメータ化されたモデルは3つのカテゴリ、MA(移動平均)モデル、AR(自動回帰)モデル、ならびにARMA(MAおよびARの結合)モデルに分類される。移動平均モデルは、1つ以上のbjがゼロとは異なり、かつすべてのaiが0であり、分母多項式は存在せず、H(z)=B(z)であるというときに現れる。したがって、ゼロによるモデリングのみが可能である。なぜならゼロは周波数振幅スペクトルにおける弛みを示し、MAモデリングはおそらく共振をモデル化する最良の方法ではないからである。
Figure 2005530432
(定数b0は別として)B(z)多項式が係数bj=0を有するときに、H(z)は自己回帰関数H(z)=b0/A(z)である。ここで、振幅スペクトルでピークをもたらす分母のルートがある。これは我々が探しているものにむしろ近い。なぜならこれらのピークは、測定された伝達関数におけるモード共振ピークによく似ている可能性があるからである。自己回帰モデルを確立する1つの方法は線形予測によるものである。線形予測はH(z)=1/A(z)モデルと想定し、A(z)多項式係数aiを見つけて、モデルおよび測定の間の誤差が最小二乗(LS)の意味で最小化されるようにする。この手順は、たとえばインパルス応答h(n)の特定のサンプルを、以前のサンプルの線形結合として形成(または予測)することができることを想定している。
ARアプローチの1つの素晴らしい点は、直接的な逆等化フィルタ設計のためのモデルを用いるときに、等化フィルタG(z)がFIRフィルタになることである。FIRフィルタリングは移動平均に等しく、これは有限のインパルス応答を有し、本質的に安定している。ARモデリングは、我々が扱いたい測定された伝達関数における現象をとらえるその能力のために、および、それが単純で安定した最小位相逆フィルタを生じるために魅力的である。図3.2は、低い周波数の室内伝達関数のオーダ48LPCモデリングを示している。
スペクトルの逆転、平滑化および調整
いかなる修正も行なわない状態で、H(z)の純粋な逆転は、一般的にかなりの遅延を許容しなければ可能ではない。最小位相の等化のみを受入れることができれば、H(Z)を分解し、Hmpf(z)を逆転することができる。先述の理由により、これでもおそらく実用的な補正システムにおいては得策ではないであろうが、実行可能なアプローチとして
は、スペクトルを平滑化する、すなわち1/Nのオクターブ帯域において平均化を行なうことが挙げられる。このようにして、狭帯域の効果が平均化され、実際に時間領域スミアリングが課される。ここで平滑化されたH(z)の逆転スペクトルを見つけるのに問題はない。このような平滑化が行なわれるとき、いかなる位相情報も最初に失われる。しかしながら、ヒルベルト変換を用いることによって、平滑化された振幅部分から、完全に新しい位相部分を導き出し、かつ新しい複雑なフーリエ変換を構成することができる。時間領域に逆戻りし、かつ(平滑化によるわずかな因果関係の欠如に対処するのに必要な)小さな遅延を許可すると、平滑化された伝達関数に基づく最小位相イコライザが得られる。
平滑化が許されない場合(またはおそらく組合せにおいて)、逆転された伝達関数のいわゆる調整(regularisation)を行なうことができる。eq.3.3を参照すると、調整は、ζ定数によって決定された所望の量の弛み(ゼロ化)効果を抑えるため、逆転伝達関数G(z)は初期の弛みに対して等しいサイズのピークを被らない。これはARモデリングを用いるのではなく、スペクトル逆転によって低い周波数の等化を設計したいときに有利である可能性がある。それでも逆転は、H(z)の最小位相分解バージョンに基づかなければならない。
Figure 2005530432
周波数スケールの歪み
周波数の歪みは、周波数スケールへの注意を分配しなおす方法である。たとえば、最高位の詳細ではなく下位の周波数帯域幅の方に焦点を置くことができる。実際に、周波数の歪みは等角写像であり、離散時間システムにおける標準の遅延要素z-1は、eq.3.4の第1のオーダの全通過フィルタD(z)によって置き換えられる。
Figure 2005530432
したがって、H(z)の不均一解像周波数の表示が得られる。これは、対数のような周波数に依存した周波数解像度が見られる人間の聴覚機構を反映しようとするときに非常に有利である可能性がある。λを適切に(0.7から0.75で)選択すると、バークスケール(Bark scale)のそれに似た周波数スケールが生じる。ここで、インパルス応答を歪めることができ、等化フィルタは歪められた領域において決定することができ、等化フィルタ応答は(負のλを用いた同じ手順で)歪みを取除くことができる。しかしながら、欠点は、z-1の代わりに上述のD(z)を用いると、FIRフィルタがIIRフィルタに変るために、(特に大きなフィルタオーダについて)安定性が自動的に保証されず、等化フィルタは切り捨てなければならない(そうでなければ、実際に等化は歪んだ領域で行なわれる)無限のインパルス応答を有することである。これらのWFIRフィルタは、音響の適用例においてより十分な割当てのフィルタリング能力を示すことができる。
初期の反射減衰および拡散
室内のインパルス応答h(n)における初期の強い反射を減衰するための技術が開発されてきた。この技術は、位置感度の観点から憂慮すべきである反射をデコンボルブしよう
としないことによって資格を得ている。代わりに、これは各々の反射および反射の周りの小さなタイムスパンにおける他のものを減衰させる。このアルゴリズムは極度に複雑ではなく、室内音響補正枠組みに容易に組込むことができる。上記のセクションで記載された技術によって、周波数の領域の効果のみが直接対処され、この行為が時間領域においても正の効果をもたらすことを期待することができる。反射減衰アルゴリズムは、不快な時間領域の効果に対処する。アルゴリズムの形成には以下のステップが含まれ、これは実用的な観点から室内音響補正に対処する非常に新しい方法である。
・初期の反射を変換する長さtCのセグメントc(n)がh(n)から切り離される。
・c(n)の振幅スペクトルは平滑化され、G(z)を得る。
・G(z)が逆転され、g(n)に逆変換される
・g(n)は遅延tCAUSによってgCAUS(n)にコーザライズ(causalise)される。
・gCAUS(n)にスペシャルウインドウを掛ける。
反射減衰の代替として、第1の強い反射を分離可能な現象として聞き取れないものにするために、(同様に筆者が考案した新技術である)拡散フィルタを用いることができる。ホワイトノイズの(長さが数ミリ秒の)小さなシーケンスは、平均10%まで減じるように指数関数で重み付けされるが、これは測定されたインパルス応答によってコンボルブされる。初期の強い反射はそのうち不鮮明にされて、応答の初期の部分はより多くのエネルギを含むため、明瞭度指数は増加するが、DRはおそらく増加しない。なぜなら直接音は増幅されないからである。この状況は、互いに近接した比較的低い振幅の多くの反射を有する状況と似ている。実際に、その振幅はかなり高いが、小さな間隔のために、その個々の寄与はおそらく聞き取れないものになる。
過剰位相等化
allpass(n)は周波数振幅についての情報を保持しないため、これによって初期の応答をコンボルブすることができ、位相のみが変更される。実際に、eq.3.5に示されたコンボルーションを行なうことによって過剰位相を完全に除去することを示すことができる。したがって、h(n)の最小位相バージョンのみが残される。もちろん無限に長いシーケンスについて、eq.3.5を決定することができないため、因果関係の有限の長さを選ばなければならない。同様に、実用的な理由は、たとえばわずか数百ミリ秒の遅延をもたらすこのような制限が、結合されたオーディオ/ビジュアル再生における同期を破壊することを命じることができる。これは補正することのできる過剰位相の量を減じる。同様に前エコーおよび前反響の効果の危険性を最小化するために、因果関係はおそらくかなり小さいものに選択されるべきである。
Figure 2005530432
本発明の目的は、拡声器が置かれる部屋の音響パラメータに関する拡声器の動作を改善することである。
この目的は、以下のステップを特徴とする請求項1の導入部分で規定された方法によって達成され、上記以下のステップは、
a)測定されたインパルス応答をアルゴリズムによって前処理し、重み付けするステップと、
b)前処理アルゴリズムからの出力をアルゴリズムによって分割し、クロスオーバーフィルタおよびダウンサンプリングを用いて少なくとも2つの周波数帯域に適合させるステップと、
c)帯域分割アルゴリズムからの出力を、少なくとも2つの周波数帯域補正フィルタアルゴリズムに与えるステップと、
d)帯域補正フィルタアルゴリズムからの出力を、遅延および振幅調整設計アルゴリズムに与えるステップと、
e)調整アルゴリズムからの出力を後処理アルゴリズムに与えるステップと、
f)後処理アルゴリズムからの出力を記憶し、これを用いて、増幅器に与えられる音源をリアルタイムで等化するステップとを含む。
請求項2で述べられるように、前処理アルゴリズムからの出力は、典型的に3つの周波数帯域に分割され、上記3つの帯域幅は、それぞれ低、中、および高周波の帯域であり、周波数領域における音響動作のある局面に属する、より適合性のある補正idが得られる。
請求項3で述べられるように、前処理アルゴリズムからの出力が、前補正アルゴリズムにおける入力として用いられるのが好都合であり、上記前補正アルゴリズムは、聴取位置で受信された音声へのある音響上の影響を示す1つ以上の選択的な回路からの出力を受信するようにされた少なくとも1つ以上の入力を有し、上記前補正アルゴリズムは、周波数帯域補正フィルタ設計アルゴリズムに与えられる出力を有する。このようにして、たとえば請求項4で、選択的な回路のうちの1つが無響室の理想的な条件下で拡声器から測定されたパラメータを表わすと述べられるように、または請求項5で、選択的な回路のうちの1つが音響心理状況から得られたパラメータを表わすと述べられるように、全体的な等化を、部屋における物理的なパラメータだけでなく、他のパラメータに適合させることができる。
実験では、この方法が行なわれた場合、さらに良好な等化が得られることがわかり、請求項6で概説されるように、最初の30msにおいて、測定されたインパルス応答における反射が、インパルス応答の残りよりも強く減衰される。
等化プロセスを終了するときに処理されたすべての信号が適時に正常であることを保証するために、請求項7で述べられるように、調整アルゴリズムは帯域フィルタからの出力を同期させるための調整機能を含むか、または請求項8で述べられるように、調整アルゴリズムがスケーリングおよび合計の機能性をさらに含むことが有利である。
最後に、請求項9で述べるように、補正は聴取者がいる部屋のある部分に関して行なわれ、ユーザがどのくらい適切に等化を望むのかを選択することができる。すなわち、ユーザが非常に高い精度を望む場合、部屋のうち等化が最適である非常に小さな部分または領域を選択しなければならず、逆もまた同様である。
上述のように、本発明は使用法に関する。
この使用法は請求項10で規定される。
以下で、本発明は添付の図面と関連してより明確に説明される。
図4.1では、拡声器/部屋の補正設計のために設けられた枠組みの概略図が示されている。主な機能は、前処理、帯域分割、3つの帯域補正および後処理であり、これらの基礎的要素の内容は以下のセクションで詳細に説明される。室内音響補正設計枠組みは、すべてのパラメータにおいて柔軟性を与えるように設けられている。設計枠組みは、単一の伝達経路インパルス応答における補正の開始点となるが、これはより多くの応答の加重平均によって構成され得る。かなりのピークが生じる低い周波数の範囲において、およそ2Hzの周波数解像度が十分であるが、FIRフィルタを用いて直接実現すると、この解像度を得るにはおよそ22,000フィルタ係数が必要となる。今日これは標準的な信号プロセッサにとって非常に重い。しかしながら、高い解像度は、低い周波数で要求されるにすぎないため、帯域分割およびダウンサンプリング技術で始めるのは明白である。3つの帯域の補正設計への要求を緩和するか、または特定の時間領域補正を課すために、初期応答を補助的な機能によって修正することができる(セクション4.6を参照)。
第1のステップにおいて、最初の入力応答は、測定されたインパルス応答から得られる。最初の応答は、単一の測定に基づく可能性がある、またはより多くのインパルス応答h(n)を、帯域幅全体内のまたは好ましければある周波数fc_avrgより少し低いところで任意の重量を用いて(単に基準化されたサンプルごとの加算として)平均化し得る。これによって、平滑化された応答の入力が、高い周波数での位置感度を回避するもしくは減じるか、または低い周波数の共振から知覚された効果を暗黙のうちに良好に評価することができる。組合せも可能である。すなわちfc_avrgより下であれば、入力応答は多重ソースから単一の受け手の位置への応答の平均とすることができ、fc_avrgを超えれば単一の測定が支配する。重要なのは、一度に1つの伝送チャネルの補正を設計することである。
初期の入力応答は次に、室内音響および心理音響地点等の専用の周波数に依存した補正を可能にする3つの帯域に分割される。帯域の分割は、これらのクロスオーバーフィルタからのいかなる可聴効果も最小にするために、線形位相のFIRフィルタを用いる。4つの周波数、すなわち低いおよび高い遮断周波数、ならびに2つのクロスオーバー周波数を入力しなければならない。部屋のシュローダー周波数の近隣における低いクロスオーバー周波数、および位置感度がアジェンダを設定するところよりも6から7倍高い、上方のクロスオーバー周波数を選択することが適切である。高い帯域幅について、初期のサンプリング速度が維持されるが、便宜上の理由および電力処理への配慮のため、中間のおよび低い帯域はクロスオーバー周波数よりも3倍から4倍の速度で再びサンプリングされる。
3つの帯域幅の各々において、等化にされた応答の持続時間(サンプルの長さ)を設定することができるため、周波数解像度の減少による本質的な平滑化が課される。この平滑化は有利なものとなる可能性があり、応答の持続時間を短くすることによって電力を処理する必要性が確実に減じられる。周波数が高ければ、より短い応答が必要であると考えるのにはわけがある。
低い周波数チャネルは、典型的に約150Hzのおおよそシュローダー周波数に制限され、1kHzよりも低いサンプリング周波数を指す。この場合、2Hzの周波数の解像度は典型的にフィルタの500タップ未満を必要とする。頑強な逆転フィルタの設計方法は入力応答のARモデル(すべての極)に基づくことができる。逆転フィルタは、セクション3で短く説明されたLPC技術に基づき、オーダは可変である。この補償方法は以下のために魅力的である。
・これは特にピークを抑えるように機能する。
・等化フィルタはすべて0、1である。−安定性が常に保証される。
・等化フィルタは自動的に最小位相である。
同様に組み込まれた等化フィルタを生成する別の方法は、複雑なスペクトルを逆転させるだけである。しかしながら、ここでピークを同じ振幅の弛みよりも重くさせるために、スペクトルは逆転の前に調整される。この方法は、(振幅スペクトルが用いられさえすれば)最小位相フィルタを保証せず、これは頑強性に関していえばLPC方法よりも劣る傾向がある。最後に、2つの振幅関連方法のいずれかとともに、入力応答におけるいかなる量の過剰位相も、過剰位相応答の長さに等しい遅延を犠牲にして、過剰位相応答のミラーコンボルーションを用いて補償することができる。
上述のように、低いクロスオーバー周波数は、およそシュローダー周波数で選択すべきであり、位置感度はすでにfschrの数倍の問題であるため、約0.5から1バークの解像度のフィルタバンクを通した平滑化は心理音響によって引き出される可能性がある。500Hzよりも上の周波数の範囲において、この解像度はおよそ1/6から1/3オクターブに対応する。バークスケールは、(音色を含む)人間の音声認識の方に関連している。中間の周波数帯域幅において、以下の選択が実現される。
・ARモデリングおよびLPC技術による逆転フィルタ設計
・最小位相振幅スペクトル逆転
・事前の平滑化
・事前の歪み
・反射拡散
最後の選択肢は、応答を、短い(5ms)の指数で重み付けされたホワイトノイズ応答でコンボルブすることによって初期の強い反射の可聴性を減じる方法である。この「拡散」フィルタは、分離可能な反射を幾分曖昧にする傾向があるが、反響の時間および透明度のためには役立たない。やはり、ARモデルオーダは、(1オクターブから1/24オクターブの)平滑化要素、および使用可能であれば中間帯域の低い部分の方に注目するのを可能にする歪み要素のように可変である。
高い周波数の範囲で、等化は好ましくは1/6から1/3オクターブの帯域幅における音色バランスの補正に減じられるべきである。なお、心理音響的に引き出されたバーク周波数スケールは1/3オクターブに近く、500Hzよりも高い。FIRフィルタの適用は、フィルタ応答の長さを制限するのに用いられたウィンドウによってもたらされた周波数の平滑化を課す。高い周波数帯域幅において、以下の選択肢が実現される。
・最小位相振幅スペクトル逆転
・事前の平滑化
・反射拡散
中間の周波数帯域と同様に、反射拡散はここでも使用可能であり、目標機能の3つの代替案が利用可能である。1つは平坦な周波数スペクトルを有し、2つはわずかに衰退するスペクトル(それぞれ10個あたり4dBおよび7dBである)。ARモデリング方法はこの帯域幅にはあまり適していない。なぜならこれはピークに過度の焦点を当てるが、狭い帯域の等化は必要とされない、またはここでは望まれないからである。3つの帯域イコライザ全体の機能ブロックが図4.4に示されている。
補正性能を向上させるために、もう2つの選択肢が利用可能である。(使用可能であれ
ば)双方の選択肢は、初期の応答を3つの帯域イコライザに変更するため、3つの等化フィルタは変更された応答に対して動作し、3つの帯域イコライザの出力は再び補正されなければならない。周波数領域へ進みかつ3つの帯域イコライザの機能性をブラインド逆転(もちろんそうではない)に簡略化すると、概念は図4.3に示されたようになる。補正された入力伝達関数H(z)は、途中で何が起ころうとも1/H(z)で終了しなければならない。R(z)と示された補助的な選択肢を表わす線形動作は、結果として逆転の後で適用しなければならない。
3つの帯域イコライザは周波数領域において主に作用するが、入力応答における個々の反射を制御するためには、時間領域において動作する必要がある。扱われた反射シーケンスは切断され、周波数は変換され、反射の過度に感度の高い修正を回避するために、逆転の前に調整または平滑化される。この修正されたデコンボルーション技術によって、最大30msの応答が、反射減衰フィルタによって6から12dBほど減衰される。位置感度の問題のために、および最初の15から30msでエネルギを有さない応答の疑わしい主観的な質のために、反射パターンを完全に取り消すことは望ましくない。調整および平滑化の双方は(遅延をもたらす)後の因果関係を要求し、最後に反射減衰フィルタは、特に高い周波数での完全な取り消しを減じるために、その動作を帯域100から1000Hzに制限するようにフィルタリングされた帯域通過である(図4.4を参照)。反射減衰アルゴリズムがセクション3でより詳細に記載されている。
何らかの理由で、拡声器を予め等化し、かつたとえば拡声器の特定の修正が望まれるときに入力の室内応答全体に対して動作するアルゴリズムにおける等化フィルタを含むことが有利であるかもしれない。拡声器を等化する4つの方法が提案される(図4.4を参照)。
図4.5では、補正システムの2つの可能な構成、等化フィルタが測定された応答に基づいて設計され記憶される「オフライン」の構成、および、電力信号が、ダウンサンプリングされ、記憶されたフィルタに基づいて補正され、再びサンプリングされ、追加されて最終的な補正信号を形成する「オンライン」のリアルタイムの構成が示されている。「オフライン」の構成において、各々の帯域における補正設計の後で、補正フィルタは基準化され、もたらされる可能性のある遅延のために時間調整され、最後にフィルタバンクに記憶される。同様に、3つのフィルタは、最初のレートまで再びサンプリングされ、主に評価目的のために1つのFIRフィルタに集約される。フェードアウトウインドウが(評価目的のために)用いられ、補正された応答が250Hzから5kHzの帯域において最初の応答と同じエネルギを有するように基準化される。
室内音響イコライザの性能の例
帯域分割/ダウンサンプリングへの応答入力が、150Hzよりも低い2つの応答(ステレオスピーカおよび1つの測定地点)の均一の重さにされた合計として合成され、150Hzよりも高くなると平均化は行なわれない。この平均化は、2つの拡声器の位置によって別々に引き起こされるものではなく、一般的な共振現象をよりうまく捉えるためにもたらされる。しかしながら、個々の伝達関数の正確さがわずかに低い補正はコストである。最後に、応答はその合計のエネルギが1に等しくなるまで基準化される。
3つの帯域イコライザのクロスオーバー周波数は、それぞれ150Hzおよび900Hzに設定された。シュローダー周波数は95Hzであるため、150Hzよりも高いと、個々の共振現象が見つかるはずであり、900Hzは、高感度であるために高い周波数に適用できない中間の周波数帯域補正のために選択される。実際に、700Hzから1.5kHzのいかなるクロスオーバー周波数もおそらく十分である。しかしながら、上述のように選択された特定のアルゴリズムのクロスオーバーは900Hzであることがわかった
。最低のおよび最高の補正周波数は、それぞれ25Hzおよび22kHzに設定される。ダウンサンプリングは、1.5のクロスオーバー周波数で新しいナイキスト周波数(これらは422Hzから2430Hzである)を与えるために行なわれ、これは144から25のダウンサンプリング要素に等しい。
クロスオーバーフィルタは、全線形位相FIRフィルタであり、オーダは、理想的なインパルスのダウンサンプリングされた帯域を追加するときに基準から選択され、この結果はフィルタリングされていない理想的なインパルスにできるだけ近くしなければならない。また、(双方のクロスオーバ周波数のための)LPおよびHPフィルタの傾斜はおよそ同じでなければならない。これは18,28および18の低減フィルタオーダ(タップ)、および28、84および560の高域フィルタオーダをもたらす。
低い周波数帯域において、伝達関数を示すAR(自己回帰)モデルを計算するように選択される。このモデル、1/A(z)は、極のみからなるため、モード共振ピークをよく示している。ARモデルは、線形予測コーディング(LPC)によって見つけられ、A(z)多項式における係数の数は、24秒オーダの極の効果に似た48に設定される。24のこのような極は、最大150Hzの分離可能な共振をモデル化するのに十分であると想定(および検証)されている。A(z)多項式をFIR等化フィルタとして用いると、伝達関数における自然の弛みに望ましくなくもエネルギを入れることなく、伝達関数における特徴的なピークが除去される。このピーク減衰を通したエネルギの損失を補償するために、低い帯域幅全体が1.5dBに増幅される。低帯域において、等化は、2Hzの本質的な平滑化を生じる500msの入力応答全体に対して動作する。
中間帯域において、入力応答の最初の150msのみが用いられ、(これは、実際に望ましい7Hzの最大周波数解像度を課す。なぜならここでは、低帯域と同じくらい狭い帯域幅のピークの現象に注意を払いたくないからである)同様にここではARモデリング技術が用いられる。セクション3に記載されるように、周波数歪み技術を用いると、低い周波数により焦点を当てることが可能になり、0.72の歪み要素を用いると、LPC数学は、400Hzよりも高い周波数より150から400Hzの帯域に注意を払う。周波数が増加すると、AR極によって容易にモデル化される伝達関数現象も小さくなる、すなわちARモデリングおよび周波数の歪みを組み合わせるのに十分なわけがあるかもしれない。
高い周波数の帯域幅は、20Hzの周波数解像度を生じる最初の50msを扱う(これは、ここでは比較的広帯域の等化のみが行なわれるべきであるということにうまく適合する)。この帯域幅において、直接のスペクトル逆転が適用されるが、逆転の前に、入力応答スペクトルは1オクターブの4分の1にさらに平滑化される。この平滑化によっていかなる位相情報も除去されるが、ヒルベルト変換関係を用いて復元される。逆転の後で、スペクトルは部屋のインパルス応答における自然の高い周波数の減衰に似たわずかに減衰する関数(1kHzから10kHzの−4dB)によって重み付けられ、最後に時間領域FIRフィルタに戻される。
図5.1ではアルゴリズムの性能が示されている。灰色のグラフは、補正設計枠組みおよびそのスペクトルへの応答入力を示し、黒い曲線はそれぞれ補正されたインパルス応答およびスペクトルを示している。特にスペクトルグラフでは、補正効果が容易に見られる。
ここで、反射減衰機能が調査される。入力応答は再び、平均化された低い周波数の位置であるが、今では3つの帯域イコライザの前に、反射減衰機能が使用可能にされる。最初の10msにつき、反射は約8dBに減じるように設定される(しかしながらセクション
3に記載されるように完全には除去されない)、これは図5.2に明らかに示されている。3つの帯域イコライザを通して拡張された(反射が減衰された)応答は、結果として生じる周波数振幅スペクトルにそれほど影響を与えない(図5.3を参照)。これは依然として良好であり、まさに非常に期待に沿った初期のアルゴリズムのようである。なぜなら同じアルゴリズムパラメータが用いられ、出力応答が補正設計枠組みに従うように反射減衰フィルタとともに後で補正されるからである。
補正設計枠組みの代替使用
このアルゴリズムの目的は、主観的な性能が問題でないときは常に、設計枠組みを、非常に正確な補正を考え出すように構成することができることを示すことである。聴取位置または低い周波数の拡声器の位置のいずれのためにも、入力応答に対して平均化は行なわれない。すべての3つの帯域について、処理された応答の長さは500msである。低いおよび中間の帯域幅の双方において、非常に詳細なARモデリングが、120の係数を用いた低帯域において用いられる。中間帯域において、平滑化および事前の歪みも行なわれず、288ものLPCの係数が用いられる。また、高帯域において平滑化および減衰目標機能が省略される。したがって、信号処理の観点から、3つの帯域で生じる行為は、LPC係数の数が大きいために(制御されかつ頑強な態様においてのみの)合計スペクトル逆転のそれにおおよそ似ている。しかしながらそれは最小位相の方法でも生じる。スペクトル逆転は、過剰位相からわずかに離れており、このためより高い精度に調整された3帯域の技術が用いられる。目的の性能は図5.4に示されるように顕著なものである。
補正設計枠組みは拡声器のみを等化するようにうまく適合される。無響測定スピーカは、室内補正の設置において用いられたのと同じ、補正アルゴリズムの最適化されたパラメータに従っている。図5.5および5.6は、補正の前および後の累積したスペクトルの減衰を示している。この等化は双方の領域において非常に顕著である。
原則として実際の音声事象が、記憶された後でいかに与えられるべきかを示す図である。 (左)は、イコライザを設計する方法について、(右)はイコライザが用いられる方法についての簡略化されたブロック図である。 部屋における拡声器によって発せられた音声からの反射を示す例を示す図である。 聴取室からのインパルス応答測定を示す図である。 5Hzの帯域幅におけるモード共振を示す曲線を示す図である。 低い周波数の振幅スペクトルを示す図である。 個々に注目すべき時間周波数領域を説明する図である。 時間領域関数が変換され逆転される図である。 低い周波数の部屋の伝達関数のオーダ48LPCモデリングを示す図である。 本発明に従って用いられるさまざまなアルゴリズムを示すブロック図である。 図4.1に従ったフィルタの詳細なブロック図である。 図4.1のアルゴリズムで用いられた図表伝達関数を示す図である。 図4.1に従った2つの選択的なブロックの詳細なブロック図である。 本発明に従った2つの可能な構成の補正システムのブロック図である。 本発明に従ったアルゴリズムの性能を示すDFT振幅スペクトルを示す図である。 反射減衰機能が使用可能にされた補正アルゴリズムを示す図である。 反射減衰機能の使用の下で補正アルゴリズムの性能を示すDFT振幅スペクトルを示す図である。 本発明に従ったイコライザの最適化された性能のDTF振幅スペクトルを示す図である。 拡声器の補正の前の累積スペクトル減衰を示す図である。 補正の後の累積スペクトル減衰を示す図である。

Claims (10)

  1. 結合された拡声器/部屋の伝達関数を有する部屋に置かれた拡声器からの音声をデジタル等化する方法であって、前記方法は、部屋にマイクロホンを置くステップと、増幅器を通して拡声器から1つ以上のパルスを発するステップと、所望の聴取位置におけるインパルス応答を測定するステップとを含み、前記方法は以下のステップを特徴とし、前記以下のステップは、
    a)測定されたインパルス応答をアルゴリズムによって前処理し、重み付けするステップと、
    b)前処理アルゴリズムからの出力をアルゴリズムによって分割し、クロスオーバーフィルタおよびダウンサンプリングを用いて少なくとも2つの周波数帯域に適合させるステップと、
    c)帯域分割アルゴリズムからの出力を、少なくとも2つの周波数帯域補正フィルタ設計アルゴリズムに与えるステップと、
    d)帯域補正フィルタ設計アルゴリズムからの出力を、遅延および振幅調整アルゴリズムに与えるステップと、
    e)調整アルゴリズムからの出力を後処理アルゴリズムに与えるステップと、
    f)後処理アルゴリズムからの出力を記憶し、これを用いて、増幅器に与えられる音源をリアルタイムで等化するステップとを含む、方法。
  2. 前処理アルゴリズムからの出力は、典型的に3つの周波数帯域に分割され、前記3つの帯域は、それぞれ低、中および高周波数帯域であることを特徴とする、請求項1に記載の方法。
  3. 前処理アルゴリズムからの出力は、前補正アルゴリズムにおける入力として用いられ、前記前補正アルゴリズムは、聴取位置で受信された音声へのある音響上の影響を示す1つ以上の選択的な回路からの出力を受信するようにされた少なくとも1つ以上の入力を有し、前記前補正アルゴリズムは、周波数帯域補正フィルタ設計アルゴリズムに与えられる出力を有することを特徴とする、請求項1または2に記載の方法。
  4. 選択的な回路のうちの1つは、無響室の理想的な条件下で拡声器から測定されたパラメータを表わすことを特徴とする、請求項3に記載の方法。
  5. 選択的な回路のうちの1つは、音響心理状況から得られたパラメータを表わすことを特徴とする、請求項3または4に記載の方法。
  6. 最初の30msにおいて、測定されたインパルス応答における反射は、インパルス応答の残りよりも強く減衰されることを特徴とする、請求項2から5に記載の方法。
  7. 調整アルゴリズムは、帯域フィルタからの出力を同期させるための調整機能を含むことを特徴とする、請求項1から6に記載の方法。
  8. 調整アルゴリズムは、スケーリングおよび合計の機能性をさらに含むことを特徴とする、請求項1から7に記載の方法。
  9. 補正は聴取者がいる部屋のある部分に関して行なわれることを特徴とする、請求項1から8に記載の方法。
  10. スピーカのマルチチャネルの設定における、請求項1から9に記載の方法の使用法。
JP2004514386A 2002-06-12 2003-06-12 部屋における拡声器からの音声のデジタル等化方法、および、この方法の使用法 Withdrawn JP2005530432A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DKPA200200888 2002-06-12
PCT/DK2003/000390 WO2003107719A1 (en) 2002-06-12 2003-06-12 Method of digital equalisation of a sound from loudspeakers in rooms and use of the method

Publications (1)

Publication Number Publication Date
JP2005530432A true JP2005530432A (ja) 2005-10-06

Family

ID=29724341

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004514386A Withdrawn JP2005530432A (ja) 2002-06-12 2003-06-12 部屋における拡声器からの音声のデジタル等化方法、および、この方法の使用法

Country Status (7)

Country Link
US (1) US20050157891A1 (ja)
EP (1) EP1516514A1 (ja)
JP (1) JP2005530432A (ja)
KR (1) KR20050026928A (ja)
CN (1) CN1659927A (ja)
AU (1) AU2003232175A1 (ja)
WO (1) WO2003107719A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014517596A (ja) * 2011-05-09 2014-07-17 ディーティーエス・インコーポレイテッド 多チャンネルオーディオのための室内特徴付け及び補正

Families Citing this family (52)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004002192A1 (en) * 2002-06-21 2003-12-31 University Of Southern California System and method for automatic room acoustic correction
US7567675B2 (en) * 2002-06-21 2009-07-28 Audyssey Laboratories, Inc. System and method for automatic multiple listener room acoustic correction with low filter orders
DE60327052D1 (de) * 2003-05-06 2009-05-20 Harman Becker Automotive Sys Verarbeitungssystem für Stereo Audiosignale
EP1775996A4 (en) * 2004-06-30 2011-08-10 Pioneer Corp REVERB-SETTING DEVICE, REVERB-SETTING METHOD, REVERB-SETTING PROGRAM, RECORDING MEDIUM CONTAINING THE PROGRAM, AND SOUND FIELD CORRECTION SYSTEM
US8627213B1 (en) * 2004-08-10 2014-01-07 Hewlett-Packard Development Company, L.P. Chat room system to provide binaural sound at a user location
US7826626B2 (en) * 2004-09-07 2010-11-02 Audyssey Laboratories, Inc. Cross-over frequency selection and optimization of response around cross-over
US7720237B2 (en) * 2004-09-07 2010-05-18 Audyssey Laboratories, Inc. Phase equalization for multi-channel loudspeaker-room responses
US9008331B2 (en) * 2004-12-30 2015-04-14 Harman International Industries, Incorporated Equalization system to improve the quality of bass sounds within a listening area
US8355510B2 (en) * 2004-12-30 2013-01-15 Harman International Industries, Incorporated Reduced latency low frequency equalization system
EP1722360B1 (en) * 2005-05-13 2014-03-19 Harman Becker Automotive Systems GmbH Audio enhancement system and method
EP1740016B1 (en) * 2005-06-28 2010-02-24 AKG Acoustics GmbH Method for the simulation of a room impression and/or sound impression
FR2890280A1 (fr) * 2005-08-26 2007-03-02 Elsi Ingenierie Sarl Procede de filtrage numerique et de compensation pour lineariser la courbe de reponse d'une enceinte acoustique et moyens mis en oeuvre
FI20051294A0 (fi) * 2005-12-19 2005-12-19 Noveltech Solutions Oy Signaalinkäsittely
US8121312B2 (en) * 2006-03-14 2012-02-21 Harman International Industries, Incorporated Wide-band equalization system
US20110311065A1 (en) * 2006-03-14 2011-12-22 Harman International Industries, Incorporated Extraction of channels from multichannel signals utilizing stimulus
KR20080071804A (ko) * 2007-01-31 2008-08-05 삼성전자주식회사 오디오 신호 인코딩 장치 및 방법, 그리고 오디오 신호디코딩 장치 및 방법
US8363853B2 (en) * 2007-02-23 2013-01-29 Audyssey Laboratories, Inc. Room acoustic response modeling and equalization with linear predictive coding and parametric filters
JP2009128559A (ja) * 2007-11-22 2009-06-11 Casio Comput Co Ltd 残響効果付加装置
TWI465122B (zh) * 2009-01-30 2014-12-11 Dolby Lab Licensing Corp 自帶狀脈衝響應資料測定反向濾波器之方法
US8401685B2 (en) * 2009-04-01 2013-03-19 Azat Fuatovich Zakirov Method for reproducing an audio recording with the simulation of the acoustic characteristics of the recording condition
JP5451188B2 (ja) * 2009-06-02 2014-03-26 キヤノン株式会社 定在波検出装置およびその制御方法
CN106454675B (zh) * 2009-08-03 2020-02-07 图象公司 用于监视电影院扬声器以及对质量问题进行补偿的系统和方法
JP5387478B2 (ja) * 2010-03-29 2014-01-15 ソニー株式会社 音声再生装置及び音声再生方法
EP2986034B1 (en) * 2010-05-06 2017-05-31 Dolby Laboratories Licensing Corporation Audio system equalization for portable media playback devices
JP4886881B2 (ja) * 2010-06-30 2012-02-29 株式会社東芝 音響補正装置、音響出力装置、及び音響補正方法
US8705764B2 (en) 2010-10-28 2014-04-22 Audyssey Laboratories, Inc. Audio content enhancement using bandwidth extension techniques
CN102592606B (zh) * 2012-03-23 2013-07-31 福建师范大学福清分校 一种补偿小空间听音声环境的均衡信号处理方法
EP2830063A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method and computer program for decoding an encoded audio signal
WO2015010865A1 (en) 2013-07-22 2015-01-29 Harman Becker Automotive Systems Gmbh Automatic timbre control
EP3025516B1 (en) 2013-07-22 2020-11-04 Harman Becker Automotive Systems GmbH Automatic timbre, loudness and equalization control
US20160241984A1 (en) * 2013-10-29 2016-08-18 Koninklijke Philips N.V. Method and apparatus for generating drive signals for loudspeakers
FI20136088L (fi) * 2013-11-06 2015-05-07 Genelec Oy Menetelmä ja laite ekvalisointiasetusten tallentamiseksi aktiivikaiuttimeen
EP2930957B1 (en) * 2014-04-07 2021-02-17 Harman Becker Automotive Systems GmbH Sound wave field generation
FI129335B (en) * 2015-09-02 2021-12-15 Genelec Oy Acoustic room mode control
EP3739903A3 (en) * 2015-10-08 2021-03-03 Bang & Olufsen A/S Active room compensation in loudspeaker system
KR102481486B1 (ko) * 2015-12-04 2022-12-27 삼성전자주식회사 오디오 제공 방법 및 그 장치
US10354638B2 (en) 2016-03-01 2019-07-16 Guardian Glass, LLC Acoustic wall assembly having active noise-disruptive properties, and/or method of making and/or using the same
US10134379B2 (en) 2016-03-01 2018-11-20 Guardian Glass, LLC Acoustic wall assembly having double-wall configuration and passive noise-disruptive properties, and/or method of making and/or using the same
US11128973B2 (en) 2016-06-03 2021-09-21 Dolby Laboratories Licensing Corporation Pre-process correction and enhancement for immersive audio greeting card
US10075789B2 (en) * 2016-10-11 2018-09-11 Dts, Inc. Gain phase equalization (GPEQ) filter and tuning methods for asymmetric transaural audio reproduction
US10304473B2 (en) 2017-03-15 2019-05-28 Guardian Glass, LLC Speech privacy system and/or associated method
US10373626B2 (en) 2017-03-15 2019-08-06 Guardian Glass, LLC Speech privacy system and/or associated method
US10726855B2 (en) 2017-03-15 2020-07-28 Guardian Glass, Llc. Speech privacy system and/or associated method
US20180268840A1 (en) * 2017-03-15 2018-09-20 Guardian Glass, LLC Speech privacy system and/or associated method
US10523171B2 (en) * 2018-02-06 2019-12-31 Sony Interactive Entertainment Inc. Method for dynamic sound equalization
CN109584892A (zh) * 2018-11-29 2019-04-05 网易(杭州)网络有限公司 音效模拟方法、装置、介质及电子设备
CN109889955B (zh) * 2019-01-28 2021-01-12 中科上声(苏州)电子有限公司 一种车内声场的鲁棒性自动均衡方法和系统
US11950082B2 (en) 2019-08-16 2024-04-02 Dolby Laboratories Licensing Corporation Method and apparatus for audio processing
US10976543B1 (en) * 2019-09-04 2021-04-13 Facebook Technologies, Llc Personalized equalization of audio output using visual markers for scale and orientation disambiguation
CN114287137A (zh) * 2019-09-20 2022-04-05 哈曼国际工业有限公司 基于高斯分布和k最近邻算法的房间校准
CN111580078B (zh) * 2020-04-14 2022-09-09 哈尔滨工程大学 基于融合模态闪烁指数的单水听器目标识别方法
EP4002889A1 (en) 2020-11-20 2022-05-25 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method for determining a sound field

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB9026906D0 (en) * 1990-12-11 1991-01-30 B & W Loudspeakers Compensating filters
US5404397A (en) * 1992-04-16 1995-04-04 U.S. Phillips Corporation Conference system with automatic speaker detection and speaker unit
US5774562A (en) * 1996-03-25 1998-06-30 Nippon Telegraph And Telephone Corp. Method and apparatus for dereverberation
KR0185021B1 (ko) * 1996-11-20 1999-04-15 한국전기통신공사 다채널 음향시스템의 자동 조절장치 및 그 방법
WO1999033323A1 (en) * 1997-12-19 1999-07-01 Conexant Systems, Inc. Method and apparatus for multi-way conference calling with a full-duplex speakerphone and a digital wireless communication terface
JP3537674B2 (ja) * 1998-09-30 2004-06-14 パイオニア株式会社 オーディオシステム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014517596A (ja) * 2011-05-09 2014-07-17 ディーティーエス・インコーポレイテッド 多チャンネルオーディオのための室内特徴付け及び補正

Also Published As

Publication number Publication date
CN1659927A (zh) 2005-08-24
WO2003107719A1 (en) 2003-12-24
EP1516514A1 (en) 2005-03-23
KR20050026928A (ko) 2005-03-16
AU2003232175A1 (en) 2003-12-31
US20050157891A1 (en) 2005-07-21

Similar Documents

Publication Publication Date Title
JP2005530432A (ja) 部屋における拡声器からの音声のデジタル等化方法、および、この方法の使用法
US8971551B2 (en) Virtual bass synthesis using harmonic transposition
KR100312636B1 (ko) 보상필터
RU2666316C2 (ru) Аппарат и способ улучшения аудиосигнала, система улучшения звука
US8077880B2 (en) Combined multirate-based and fir-based filtering technique for room acoustic equalization
US11611828B2 (en) Systems and methods for improving audio virtualization
EP2629552B1 (en) Audio surround processing system
JP6832968B2 (ja) クロストーク処理の方法
JP3505085B2 (ja) オーディオ装置
US9076425B2 (en) Apparatus and method for reducing digital noise of audio signal
JPH11503882A (ja) 複雑性を低減したイメージングフィルタを用いた3次元仮想オーディオ表現
WO2014060204A1 (en) System and method for reducing latency in transposer-based virtual bass systems
WO2017183462A1 (ja) 信号処理装置
US20160269850A1 (en) Sound spatialization with room effect, optimized in terms of complexity
Pihlajamäki Multi-resolution short-time fourier transform implementation of directional audio coding
JP2012100117A (ja) 音響処理装置及び方法
US11950089B2 (en) Perceptual bass extension with loudness management and artificial intelligence (AI)
Norcross Evaluation and alternative regularization of audio equalization techniques
Pihlajamäki Directional Audio Coding-menetelmän toteutus käyttäen monitarkkuuksista lyhytaikaista Fourier-muunnosta
Korhola Perceptual study of loudspeaker crossover filters
Puikkonen Development of an Adaptive Equalization Algorithm Using Acoustic Energy Density

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20060905