JP2010539833A - 高精度を有するコンポーネント信号を決定するための装置および方法 - Google Patents

高精度を有するコンポーネント信号を決定するための装置および方法 Download PDF

Info

Publication number
JP2010539833A
JP2010539833A JP2010525225A JP2010525225A JP2010539833A JP 2010539833 A JP2010539833 A JP 2010539833A JP 2010525225 A JP2010525225 A JP 2010525225A JP 2010525225 A JP2010525225 A JP 2010525225A JP 2010539833 A JP2010539833 A JP 2010539833A
Authority
JP
Japan
Prior art keywords
delay
filter
value
wfs
interpolation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2010525225A
Other languages
English (en)
Other versions
JP5132776B2 (ja
Inventor
アンドレーアス フランク
サンドラ ブリックス
トーマス スポラー
Original Assignee
フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ filed Critical フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ
Publication of JP2010539833A publication Critical patent/JP2010539833A/ja
Application granted granted Critical
Publication of JP5132776B2 publication Critical patent/JP5132776B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • H04R5/04Circuit arrangements, e.g. for selective connection of amplifier inputs/outputs to loudspeakers, for loudspeaker detection, or for adaptation of settings to personal preferences or hearing impairments
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/13Application of wave-field synthesis in stereophonic audio systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Stereophonic System (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)

Abstract

WFSシステム(200)のためのコンポーネント信号(115)を決定するための装置は、WFSパラメータを提供するための手段(150)、WFSパラメータ補間器(160)、および音声信号処理手段(170)を含む。提供するための手段(150)は、前記音声サンプリング周波数よりも小さいパラメータ・サンプリング周波数での音源位置(135)を使用すると共に、およびスピーカ位置(145)を使用すると共に、コンポーネント信号(115)のためのWFSパラメータを提供する。WFSパラメータ補間器(160)は、前記パラメータ・サンプリング周波数よりも高いパラメータ補間周波数に存在する補間されたWFSパラメータ(165)を生成するために、WFSパラメータ(155)を補間し、補間されたWFSパラメータ(165)は、前記音声サンプリング周波数により特定されるよりも高い精度のレベルを有する補間された小数値を有する。音声信号処理手段(170)は、コンポーネント信号(115)が精度のより高いレベルで処理されている状態において得られるように、音声信号(125)に前記補間された微小な値を適用するように構成される。
【選択図】図1

Description

本発明は、WFS(波面合成システム)のための高精度を有するコンポーネント信号を決定するための装置およびその方法に関するものであって、特に、波面合成レンダリングまたは再生のための遅延補間に対する効率的アルゴリズムに関する。
波面合成は、デルフト工科大学で開発された複雑な音声場面の空間的なレンダリングのための音声再生方法である。音声再生の大部分の既存の方法とは異なり、空間的に的確なレンダリングが、小さい領域に制限されず、広いレンダリング領域全体に延長される。WFSは、音声の数理物理学(すなわち、ホイエンスおよびキルヒホッフ−ヘルムホルツ積分)に基づく。
通常は、WFS再生システムは、多数のスピーカ(いわゆる、2次的音源)から構成される。スピーカ信号は、遅延され、スケーリングされた入力信号から形成される。通常、多くの音声オブジェクト(1次音源)が、WFSの場面において使用されるので、非常に多くのこの種の動作が、スピーカ信号を生成するために必要である。これは、波面合成のために高いレベルの計算能力を必要とする原因となる。
上述の効果に加えて、WFSは、現実的に移動音源の画像化の可能性を提供する。この特徴は、多くのWFSシステムで利用され、例えば、映画館、仮想現実アプリケーションまたはライブの利用のために非常に重要である。
しかしながら、移動音源をレンダリングすることは、静的な音源の場合において生じない一連の特徴的なエラーの原因となる。WFSレンダリングシステムの信号処理は、レンダリング品質において、重要な影響を有する。
主要目的は、WFSの手段によって移動音源をレンダリングするための信号処理アルゴリズムを開発することである。これに関連して、アルゴリズムのリアルタイム処理能力は、重要な前提条件である。アルゴリズムを評価するための最も重要な基準は、知覚される音声品質のオブジェクトである。
既に言われているように、WFSは、処理リソースに関して高コストである音声再生の方法である。中でも、これは、WFSの準備において使用される多数のスピーカのためであり、そして、WFS場面において使用される仮想音源の数がしばしば多いという事実のためである。このため、開発されるアルゴリズムの効率は、顕著な重要性である。
重要な問題は、品質向上が、開発されるアルゴリズムによって成し遂げられることになるかということである。信号処理アルゴリズムの品質に依存して、干渉する方法を感じさせるか信号処理のアーティファクトをマスクするWFSによって生じる他のアーティファクトを考慮する一方、これは、特に正確である。したがって、焦点は、特性が、さまざまなパラメータ(例えば、補間指示、フィルタ長さ等)を介してスケーラブルであるアルゴリズムを開発することである。極端な例として、これは、レンダリングエラーが最適化された条件(他のいかなるアーティファクトの切捨て)の下における知覚の閾値の下にあるアルゴリズムを含む。要求される品質、他のアーティファクトの顕著性および利用可能なリソースに依存して、最適なトレードオフがわかる。
一連の基準および値のレンジは、アルゴリズムを設計することを容易にすることを明示する。それらは、以下を含む。
(a)信頼性のある音源の速さ。通常、ランダムな音源速度を有する仮想音源がサポートされる。しかしながら、速度が増加するにつれて、ドップラーシフトの影響が増加する。加えて、WFSにおいて使用される多くの物理法則は、音速以下の速度に当てはまるだけである。したがって、以下の許容できる範囲は、音源速度Vsrcに対して有用であると考慮される範囲として特定される。
Figure 2010539833
これに関連して、cは媒体の音速である。したがって、基準状態の下で、音源の許容速度は、約172m/sまたは619km/hになる。
(b)周波数範囲。全体の音声周波数範囲、すなわち、

20Hz≦f≦20kHz (1)

が、周波数fに対するレンダリング範囲として仮定される。
達成される遮断周波数の上限値および品質の選択が、アルゴリズムの資源要求に決定的な影響を及ぼす点に留意する必要がある。
(c)サンプリング周波数。サンプリングレートの選択は、設計されるアルゴリズムにおいて大きな影響を及ぼす。一方では、ナイキスト周波数から関係する周波数範囲の距離が減少するにつれて、大部分の遅延補間アルゴリズムのエラーは、鋭く増加する。また、この範囲が多くのフィルタ設計手順において、いわゆる無関係の帯域として使用されるので、音声周波数範囲の遮断周波数の上限値とナイキスト周波数との間の範囲がより狭くなるにつれて、アルゴリズムによって要求される多くのフィルタの長さは、鋭く増加する。
したがって、サンプリング周波数における変化は、使用されるフィルタおよび他のパラメータの広範囲な適応を必要とすることができ、したがって、特殊なアルゴリズムのパフォーマンスおよび適合性に決定的に影響を与えることができる。
標準機能として、専門の音声技術における共有システムは、48kHzのサンプリングレートで作動される。したがって、このサンプリング周波数は、以下のように仮定する。
(d)目的のハードウェア。開発されるアルゴリズムが、通常、使用するハードウェアから独立している場合であっても、目的のプラットホームを特定することは、さまざまな理由のために有用である。
(i)使用されるCPUの構造(例えば、並列作業をサポートしている)は、アルゴリズムの設計に影響を及ぼす。
(ii)使用されるメモリのサイズおよび構造は、アルゴリズムの設計に関して、設計の決定に影響を及ぼす。
(iii)性能要件を特定するために、目的のハードウェアの効率の目安が必要である。
現在、および予見できる将来におけるシステムは、大部分がPC技術に基づいている(であろう)ので、以下の特性が仮定される。
・現行のデスクトップまたはワークステーションの構成部品は、x86技術に基づく。
・特別なハードウェアの利用ではない。
・性能の浮動小数点の機能性を有するプロセッサ
・比較的大きな作業メモリ
・一般的なSIMD命令セット(例えば、SSE)のサポート
波面合成における音声信号処理のアルゴリズムは、様々なカテゴリに分けることができる。
(1)WFSパラメータを算出すること。
WFS合成オペレータを適用することによって、スケーリング値および遅延値が、音源およびスピーカの各組合せのために決定される。この算出は、比較的低い周波数で実行される。これらのノードとの間に、スケーリング値および遅延値は、単純な方法によって補間される。従って、パフォーマンスに対する影響は、比較的小さい。
(2)フィルタリングすること。WFSオペレータを実施するために、3dBのエッジの険しさを有するローパスフィルタを使用しているフィルタリングが必要である。加えて、レンダリング条件への適応が実行される。この適応は、音源またはスピーカに依存している。しかしながら、フィルタ動作が入力および/または出力信号につき一度だけ実行されるので、それぞれ、性能要件は通常、適切である。加えて、現在のWFSシステムにおいて、この動作は、専用の演算ユニットに実行される。
(3)WFSスケーリングすること。WFS畳み込みとしばしば誤って呼ばれるこの動作は、遅延ラインに格納される入力信号に合成オペレータによって算出される遅延を適用して、また、合成オペレータによって算出されるスケーリングを有するこの信号をスケーリングする。この動作は、仮想音源およびスピーカの各組合せのために実行される。スピーカ信号は、問題となっているスピーカのためのスケーリングされた入力信号の全てを合計することによって形成される。
WFSスケーリングが音声サンプルごとと同様に仮想音源およびスピーカの組合せごとに実行されるので、個々の動作がかなり低い複雑さを有する場合であっても、それはWFSシステムの資源要求の主命題を形成する。
WFSの周知のレンダリングエラー(アーティファクト)に加えて、さらに、一連の特徴的なエラーが、移動音源と共に発生する。以下のエラーが確認される:
(A)櫛形フィルタ効果(空間エイリアシング)。空間エイリアシングは、レンダリングの静的音源から公知となり、エリアジング周波数より上に、干渉縞は、音源位置および周波数に依存し、ならびに追加的に高く上げるおよび鋭く押し下げることによって新しく作り出される。仮想音源の変化の場合には、このパターンは、動的に変化して、このように、移動していない観測者のための時間に依存する周波数ひずみを生じる。
(B)遅延時間の非遵守。WFSパラメータを算出するために、音源の現在位置が使われる。しかしながら、正確なレンダリングのために、明白な位置は、送信された現在影響を与えている音からである。しかしながら、これは、ドップラーシフトが、適度な速度に対して比較的小さく、大部分のWFSアプリケーションにおいて妨げているとして知られていないようである。
(C)ドップラー広がり(Doppler spread)。異なる相対速度のため、移動音源は、2次的音源によって発される信号において、さまざまなドップラー周波数につながる。前記のドップラー周波数は、聞き取り位置での仮想音源の周波数スペクトルの広がりにおいて、それ自身が発生する。このエラーは、WFS理論によって説明することはできず、現在の研究対象である。
(D)補間を遅延させることになっている音声障害。WFSスケーリングのために、ランダムな量によって遅延される入力信号が必要である。そして、それは、時間内のランダムな位置だけに存在する別々のサンプルから算出される。この目的のために使用するアルゴリズムは、品質に関して強く異なって、しばしば、妨げるものとして知られているアーティファクトを生じる。
自然なドップラー効果(すなわち、移動音源の周波数シフト)は、ここのアーティファクトとして分類されない。それは、WFSシステムによってレンダリングされることが主要な音場の特性であるからである。にもかかわらず、それは、多くのアプリケーションで望まれていない。
時間内のランダムな位置での時間で離散的にサンプリングされた信号の値を決定する動作は、遅延補間または非整数遅延補間と呼ばれる。
この目的で、複雑さおよび補間の品質に関して強く異なる多数のアルゴリズムが開発された。通常、非整数遅延アルゴリズムは、それらの入力としての時間−離散信号およびそれらの出力としての遅延信号の近似を有する離散フィルタとして行われる。
非整数遅延補間アルゴリズムは、さまざまな基準によって分類される:
(I)フィルタ構造。FD(fractional delay:非整数遅延)フィルタは、FIR(finite impulse response:有限インパルス応答)として、およびIIR(infinite impulse response:無限インパルス応答)フィルタとして行うことができる。
FIRフィルタは、一般に、フィルタ係数およびこのような算術演算の増加を必要とし、更に、それらは常にランダムな非整数遅延のための振幅誤差を生じる。しかしながら、それらは常に安定である、そして、多くの設計過程がある。そして、それは多くの閉じられた、非反復的な設計過程を含む。
IIRフィルタは、オール・パス・フィルタとして実施することができる。そして、それは正確に一定のおよび、このように、FDフィルタに対して理想的である振幅応答特性を提示する。しかしながら、FIRフィルタの場合ほど正確にIIRフィルタの位相に影響することは可能でない。IIR−FDフィルタのための大部分の設計法は反復的である、そして、したがって、それらは可変遅延を有するリアルタイムアプリケーションに対して適していない。唯一の例外は、シランフィルタ(Thiran filter)である。それは、係数のための明確な公式が存在する。IIRフィルタを実施するために、それは、以前の出力の値を格納することを常に必要とする。これはWFS再生システムの実施にとって好ましくない。なぜなら、多数の以前の出力信号は、管理されなければならないからである。加えて、内部状態の利用は、可変遅延のためのIIRフィルタの適合性を減らす。なぜなら、内部状態は、おそらく現在の非整数遅延と異なる非整数遅延のために算出されるからである。これは、一時的現象と呼ばれる出力信号における干渉に至る。
これらの理由により、FIRフィルタだけは、WFS再生システムの利用のために研究される。
(II)固定のおよび可変非整数遅延。いったん、それらの係数が設計されると、FDフィルタは、特定の遅延値に対してのみ有効である。設計動作は、新しい値ごとに再び実行されなければならない。この設計動作の負担に依存して、方法は、可変遅延を有するリアルタイム動作のための度合いを変化させることに適している。
可変非整数遅延(VFD)のための方法は、係数の算出およびフィルタの算出を組合せ、従って、遅延値におけるリアルタイム変化に対して、非常に適している。それらは、可変のディジタルフィルタの改良型である。
(III)非同期サンプリングレート変換。WFSにおいて、連続的に、可変遅延が必要である。線形に2次的音源へ移動する仮想音源の再生において、例えば、遅延は、時間の線形関数である。この動作は、非同期サンプリングレート変換と分類される。非同期サンプリングレート変換のための方法は、典型的には、可変非整数遅延アルゴリズムに基づいて行う。しかしながら、加えて、それらは、解決されることになっているいくつかの課題、例えば、画像化およびエイリアシングのアーティファクトを抑制する必要性を提示する。
Figure 2010539833
所望の遅延値dを整数値dintおよび小数部分dfracに分解することによって、ランダムな遅延は、非整数遅延フィルタを用いて生じる。これに関連して、dintによる遅延が入力信号におけるインデックスシフトによって実施される。
しかしながら、理想の動作範囲に従うことは、遅延の極小値を結果として得る。そして、それは、因果関係に従うために下回ってはいけない。従って、遅延補間(特に長いフィルタ長を有する高品質のアルゴリズム)のための方法は、システム待ち時間の増加を必要とする。しかしながら、前記のシステム待ち時間は、かなり負担の処理のために20…50のサンプルのマグニチュードのオーダーを上回らない。しかしながら、これは、通常、システムによって決定される典型的なWFSレンダリングシステムの他の待ち時間と比較して低い。
遅延補間の必要性は、以下の考慮すべき問題に起因する:
WFSの手段によって移動音源の合成において、音声信号に適応される遅延は、時間的に変化する。WFSレンダリングシステムの信号処理(レンダリング)は、時間−離散方法において実行される;従って、音源信号は、指定されたサンプリング時間において存在するだけである。複数のサンプリング間隔によって時間−離散信号の遅延は、効率的な方法で可能であり、信号インデックスをシフトすることによって実行される。2つのサンプリング点の間に位置する時間−離散信号の値にアクセスすることは、遅延補間または非整数遅延と呼ばれる。この目的で、品質およびパフォーマンスに関して強く異なる特殊なアルゴリズムが必要とされる。非整数遅延アルゴリズムが設けられる。
移動音源のWFSにおいて、必要な遅延時間は動的に変化して、そしてランダムな値を採用することができる。通常、異なる遅延値がスピーカ信号ごとに必要である。従って、使用されるアルゴリズムは、ランダムな可変遅延をサポートしなければならない。
最も近い複数のサンプリング間隔の遅延を丸めることは、十分に良い結果を統計上のWFS音源に提供する一方、この方法は、移動音源に対する際立った干渉を結果として得る。
波面合成のために、遅延補間は、仮想音源およびスピーカの各組合せのために必要になる。高いレンダリング品質を必要とする遅延補間の複雑さに関連して、高品質のリアルタイムの実施は、実行可能ではない。
移動音源の遅延補間の必要性は、Edwin Verheijen(エドウィン・ヘルハイエン)著「波面合成による音響再生(Sound reproduction by wave field synthesis)」,博士論文,106pp−110pp,デルフト工科大学,1997年において記載されている。しかしながら、単純な(標準的な)遅延補間の方法だけは、アルゴリズムを実現するために利用される。
マライエ・バールマン(Marije Baalman),シモン・シャンピーヤー(Simon Schmpijer),トーベン・ホーン(Torben Hohn),シロ・コッホ(Thilo Koch),ダニエル・プリュー(Daniel Plewe)およびエディ・モンド(Eddie Mond)ら著「サウンダを有する大規模の波面合成システムの生成」,第5回国際リナックス・オーディオ・カンファレンスの国際会議,ドイツ,ベルリン,1997年3月において、移動仮想音源を有するサンプリングレート変換の必要性が指摘されている。アルゴリズムは、ブレゼンハム・アルゴリズム(Bresenham algorithm)を基礎として概説される。しかしながら、これは、整数計算に基づく、ラスターレンダリング装置においてプロットされた線のための図形データ処理のアルゴリズムである。従って、現実のサンプリングレート変換の補間ではなく、最も近い整数サンプルインデックスに対するノードの丸めであると仮定される。
遅延補間のためのさまざまな単純な方法は、WFSレンダラにおいて実施される。使用されるクラス階層によって、方法は、単に置き換えられる。遅延補間に加えて、遅延(さらにスケールの中で)のWFSパラメータの時間的補間は、サンプリングレート変換の品質への影響を有する。従来のレンダラ構造において、これらのパラメータは、固定のラスタ(現在の32音声サンプルの周波数で)の範囲内においてのみ更新される。
以下のアルゴリズムが実施される:
−整数遅延(IntegerDelay)。この最初のアルゴリズム。いかなる遅延補間法(すなわち、遅延値は、最も近い複数のサンプリング間隔に丸められる)もサポートしない。遅延およびスケーリング・パラメータは、現在の32サンプルのラスターの範囲内で更新される。このアルゴリズムは、最適化されたアセンブラの改良型において実施され、全てのWFS場面のリアルタイム・レンダリングに適している。にもかかわらず、この動作は、レンダラの範囲内で必要とされる計算負荷の主な部分を利用する。
−バッファごとの遅延線形(BufferwiseDelayLinear)。WFSパラメータは、粗いラスター(注釈:バッファごと(bufferwise))の範囲内で適応される。遅延信号自体は、線形補間を基礎として遅延補間によって算出される。実施は、アセンブラのサポートにより実行され、全てのWFS場面において使用されるため、パフォーマンスに関して適切である。このアルゴリズムは、デフォルト設定として現在使用される。
−サンプルごとの遅延線形(SamplewiseDelayLinear)。この方法において、スケーリングおよび遅延値は、サンプルごと(注釈:サンプルごと(samplewise))に補間される。遅延補間は、線形補間(すなわち、1次ラグランジュ補間)によって再度実行される。この方法は、以前の方法より明らかに高負担である。そして、これに加えて、C++のリファレンス実装においてのみ存在する。従って、現実の複雑なWFS場面において使用されることには適していない。
−サンプルごとの遅延体積(SamplewiseDelayCubic)。ここで、スケーリングおよび遅延は、サンプルに正確である方法で補間される。遅延補間は、3次(すなわち立方)ラグランジュ補間器を使用して実行される。また、この方法は、リファレンス実装として存在し、少数の音源だけに適しているのみである。
Edwin Verheijen(エドウィン・ヘルハイエン)著「波面合成による音響再生(Sound reproduction by wave field synthesis)」,博士論文,106pp−110pp,デルフト工科大学,1997年 マライエ・バールマン(Marije Baalman),シモン・シャンピーヤー(Simon Schmpijer),トーベン・ホーン(Torben Hohn),シロ・コッホ(Thilo Koch),ダニエル・プリュー(Daniel Plewe)およびエディ・モンド(Eddie Mond)ら著「サウンダを有す大規模の波面合成システムの生成」,第5回国際リナックス・オーディオ・カンファレンスの国際会議,ドイツ,ベルリン,1997年3月
この先行技術を根幹として、本発明の目的は、明らかに増加した精度を有するコンポーネント信号を決定する波面合成システムのための装置および方法を提供することである。
この目的は、請求項1に記載の装置、および請求項17または請求項18に記載の方法によって達成される。
本願発明の中心的な考えは、改良された補間が達成されるように、仮想音源に属している音声信号が、前処理に従属するという点で、最初に比較的高品質のコンポーネント信号が達成されるということである。前記前処理は、WFSパラメータから独立している。このように、コンポーネント信号は、より高い精度を有しており、コンポーネント信号が仮想音源により生成され、スピーカ信号のためのコンポーネント信号を表す。加えて、本願発明は、例えば、低いパラメータ・サンプリング周波数で決定される遅延またはスケーリング値のようなWFSパラメータの改良された補間を含む。
このように、本発明の実施例は、スピーカの配列を構成しているWFSシステムのためのコンポーネント信号を決定するための装置を提供することであり、スピーカ位置を考慮するとともに、仮想音源に基づくスピーカのためのコンポーネント信号を算出するために、WFSシステムは、仮想音源に関連しており、音声サンプリング周波数でサンプリングされる離散信号として存在する音声信号を利用するように構成される。そして、音源位置は、仮想音源に関連している。本発明の装置は、音源位置を使用するとともに、およびスピーカ位置を使用するとともに、コンポーネント信号のためのWFSパラメータを提供するための手段を構成する。パラメータは、音声サンプリング周波数より小さいパラメータ・サンプリング周波数で決定される。さらに、本装置は、パラメータ・サンプリング周波数より高いパラメータ補間周波数で存在する補間されたWFSパラメータを生じるためにWFSパラメータを補間するためのWFSパラメータ補間器を含む。補間されたWFSパラメータは、音声サンプリング周波数によって特定されるよりも高い精度のレベルを有する補間された小数値を有する。最後に、すなわち、コンポーネント信号が、精度のより高いレベルで処理された状態において得られるように、装置は、補間された小数値を音声信号に適用するように構成された音声信号処理手段を構成する。
従って、問題の解決方法の考えは、全体のアルゴリズムの複雑さが冗長性を利用することによって減じているという事実に基づく。これに関連して、遅延補間アルゴリズムは、a)中間の値を算出するための部分、およびb)最終結果を算出するための効率的なアルゴリズム、に更に分割されるように、分割される。
WFSレンダリングシステムの構造は、以下の通り有効に使用される:各最初の音源に対して、全てのスピーカのための出力信号が、遅延補間の手段によって算出される。このように、前処理は、最初の音源ごとにもたらされる。この前処理が実際の遅延から独立していることが確実にされる。この場合、一旦データが前処理されるならば、それがスピーカ信号の全てのために使用される。
この原理を実装する実施例は、例えば、2つの方法によって記載される。
(i)方法1:下位次数の遅延補間を有するオーバーサンプリングの組合せ。
この方法では、入力信号が、遅延ラインに入力信号を格納するより前に、より高いサンプリングレートに、オーバーサンプリングの手段によって変換される。これは、例えば、多相方法によって効率的に実行される。対応するより高い「アップサンプリングされた」値の数は、遅延ラインに格納される。
出力信号を生成するために、所望の遅延は、オーバーサンプリング比率によって乗算される。この値が、遅延ラインにアクセスするために使われる。低次数の補間アルゴリズム(例えば多項式補間)によって、遅延ラインの値から、最終結果が決定される。アルゴリズムは、システムの元の低クロックレートで実行される。
単一の遅延補間動作のための多項式補間を有するオーバーサンプリングを結合することは、WFSにおけるアプリケーションに対しては新規である。従って、パフォーマンスの著しい増加は、オーバーサンプリングにより生成された信号の複数の利用によりWFSにおいて実現される。
(ii)方法2:補間のためのファロー構造の利用。
ファロー構造は、連続的に変わりやすい可変遅延のための可変ディジタルフィルタである。それはP個のサブフィルタのセットを構成する。入力信号は、前記の各サブフィルタによってフィルタされ、P個の異なる出力を提供する。cP出力信号は、dにおける多項式を評価することから生じ、dは、所望の遅延の微小な一部であり、そして、サブフィルタcPの出力は、多項式の係数を形成する。
示唆されるアルゴリズムは、前処理として、入力信号の各サンプルのためのサブフィルタの出力を生成する。これらのP値は、遅延ラインに書き込まれる。出力信号の生成は、遅延ラインにおけるP値をアクセスすることによって、および多項式を評価することによってもたらされる。この効果的な動作は、各スピーカに対して実行される。
これらの実施例では、音声信号処理手段は、方法(i)および/または(ii)を実行するように構成される。
さらなる実施例の態様において、オーバーサンプリングが所望の精度のレベルを確実にするオーバーサンプリングレートまで実行されるように、音声信号処理手段は、音声信号の前記オーバーサンプリングを実行するように構成される。これは、結果として、第2の補間ステップが冗長になるという効果を有する。
本発明の実施例は、特に、波面合成の背景の範囲内において音声技術および音響技術に対して有利であるWFS遅延補間を記載する。なぜなら、聞き取り可能なアーティファクトの明らかに改良された抑制が達成されるからである。改良は、特に、非整数遅延および非同期サンプリングレート変換の利用における改良された遅延補間によって達成される。従って、近づく。
以下に、本発明の好適な実施形態が添付図面を参照してより詳細に説明される。
図1は、本発明の実施例による装置の概略図を示す。 図2は、3次ラグランジュ補間器のための周波数応答を示す。 図3は、7次ラグランジュ補間器のための連続パルス応答を示す。 図4は、さまざまな次数のラグランジュ補間器のための最悪の場合の振幅応答特性を示す。 図5は、WFS信号処理を有するWFSレンダラを示す。 図6aは、振幅および遅延補間のための表現を示す。 図6bは、振幅および遅延補間のための表現を示す。 図6cは、振幅および遅延補間のための表現を示す。 図7は、ラグランジュ補間としてオーバーサンプリングおよび同時読取りによる遅延補間を示す。 図8は、オーバーサンプリング(ベースバンドのみのための移行帯域指定の)のための反画像化フィルタの仕様を示す。 図9は、オーバーサンプリングのための反画像化フィルタおよび移行帯域の画像のためのいわゆる「無関心である」領域の仕様を示す。 図10は、ファロー構造を基礎として同時読取りを有する遅延補間を示す。 図11は、波面合成モジュールおよび実証領域のスピーカ配列を備える波面合成システムの基本的なブロック図を示す。
続く説明に関して、異なる実施例において、同一であるかまたは同一の動きを有する機能要素には同じ参照番号が付されている、従って、前記機能要素の説明が下で示される各種実施形態において交換可能な点に、留意する必要がある。
本発明が詳細に対処される前に、波面合成システムの基本的な構造が、図11を参照して示される。波面合成システムは、デモンストレーション域702に関して配置されるスピーカ配列700を有する。具体的には、図11(それは360度配列である)に示されるスピーカ配列は、4つの配列側700a、700b、700cおよび700dから構成される。デモンストレーション域702が映画劇場である場合、例えば、正面/後部または右/左の仕様に関して、映画スクリーンがサブ配列700cも配置されるデモンストレーション域702の同じ側にあると仮定される。この場合、この場合、着席する観衆のメンバーは、デモンストレーション域702のいわゆる最適点Pで、前方、すなわちスクリーンに向かう方向を見ている。そして、サブ配列700aは前記視聴者の後側に位置し、サブ配列700dは前記視聴者の左側に位置し、そして、サブ配列700bは前記視聴者の右側に位置する。各スピーカ配列は、多くの異なる個々のスピーカ708から構成される。そして、各スピーカ配列は、図11に図示的に示されるのみのデータバス712を介して波面合成モジュール710によって提供される専用のスピーカ信号を使用して制御される。例えば、デモンストレーション域702(すなわち、スピーカ情報(LS情報))、そして、場合により、他のデータと共に関連してスピーカのタイプおよび位置に関する情報を使用すると共に、波面合成モジュールは、個々のスピーカ708のためのスピーカ信号を算出するために構成され、各ケースにおける前記スピーカ信号は、周知の波面合成アルゴリズムに従って、仮想音源に対する音声信号から導出される。仮想音源は、それらに関連した位置情報を追加的に有する。加えて、波面合成モジュールは、さらに、例えば、デモンストレーション域等の音響特性に関する情報から含む入力を得ることもできる。
図1は、本発明の実施例に従う装置を示す。仮想音源に属している音源位置135およびスピーカ位置145は、WFSパラメータを提供するための手段150に入力される。WFSパラメータを提供するための手段150は、さらなる入力を任意に含むことができる。ここで、他のデータ190が読み込まれてもよい。他のデータ190は、例えば、部屋の音響特性および他の場面データを含む。パラメータ・サンプリング周波数で、提供するための手段150は、WFSパラメータ補間器に読み込まれるWFSパラメータ155を決定する。一度補間が実行されると、補間されたWFSパラメータは、音声信号処理手段170に提供される。音声信号処理手段170は、さらに、音声信号125に対する入力、およびコンポーネント信号115に対する出力を含む。各仮想音源は、それ自身が有する音声信号を提供し、それは、様々なスピーカのためのコンポーネント信号に処理される。
図2は、WFS信号処理210およびWFSパラメータ算出220を含むWFSシステム200を示す。WFSパラメータ算出220は、N個の音源信号に関する場面データ225に対する入力を含み、例えば、N個の信号音源(仮想音源)およびM個のスピーカがWFSシステムに対して利用できると仮定すると、WFSパラメータ算出220は、N×M個のパラメータ値(スケーリングおよび遅延値)を算出する。これらのパラメータは、WFS信号処理210に出力される。WFS信号処理210は、WFS遅延・スケーリング手段212、合計するための手段214、および遅延ライン216を含む。遅延ライン216は、通常、バッファリングのための手段として実装され、例えば、循環バッファによって実装される。
N×Mパラメータは、WFS遅延・スケーリング手段212により読み込まれる。WFS遅延・スケーリング手段212は、さらに、遅延ライン216から音声信号を読む。WFS遅延・スケーリング手段212は、特定のインデックスを有する音声信号をアクセスすることによって、音声信号に対応するための遅延を選択することができるように、遅延ライン216における音声信号は特定の遅延に対応するインデックスを含み、ポインタの手段217によってアクセスされる。このように、インデックスは、遅延ライン216におけるデータに対応するアドレスまたはアドレス指定として同時に供給する。
遅延ライン216は、N個の音源信号から音声入力データを得る。音声入力データは、その時間的シーケンスに従って遅延ライン216において格納される。対応する遅延ライン216のインデックスにアクセスすることによって、WFS遅延・スケーリング手段212は、このように、所望の(算出された)遅延値(インデックス)を有する音声信号を読み出すことができる。加えて、WFS遅延・スケーリング手段212は、合計するための手段214に対応しているコンポーネント信号115を出力し、合計するための手段214は、そこからM個のスピーカのためのスピーカ信号を生成するために、対応しているN個の仮想音源のコンポーネント信号115を合計する。スピーカ信号は、音響出力240で提供される。
従って、実施例は、WFSレンダリングシステム200の音声信号処理に関する。このレンダリングシステムは、入力データとして、WFSの音源(仮想音源)の音声信号、音源をカウントしているインデックス変数n、および音源の数を表しているNを含む。概して、このデータは、オーディオプレーヤー、場合によっては、プレフィルタ等のような他のシステム構成要素から生じる。更なる入力パラメータとして、振幅(スケーリング)および遅延値がWFSパラメータ算出ブロック220によって、音源およびスピーカの各組合せ(インデックス変数:m、ナンバー:M)のために提供される。これは、概して、マトリックスとして実行され、音源nおよびスピーカmのための対応している値は、以下において遅延(n,m)およびスケーリング(n,m)として参照される。
音声信号は、最初に、将来のランダムアクセス(すなわち可変の遅延値を有する)を可能にするために、遅延ライン216に格納される。
実施例の中心となる要素は、ブロック「WFS遅延・スケーリング」212である。前記ブロックは、時々、WFS畳み込みとしても参照される;しかしながら、信号処理という意味における実際の畳み込みではない。したがって、その表現は、通常、避けられる。ここで、出力信号(コンポーネント信号115)は、音源およびスピーカの各組合せ(n,m)のために作り出される。
遅延(n,m)−遅延値は、信号y(n,m)のために、音源nのための遅延ライン216から読み出される。この値は、振幅スケール(n,m)によって乗算される。
最後に、全ての音源n=1,…,Nの信号y(n,m)は、スピーカによる付加的なスピーカであり、このように、各スピーカy(m)に対して制御信号を形成する。

Y(m)=y(1,m)+y(2,m)+…+y(N,m)
この算出は、スピーカ信号の各サンプルのために実行される。
静止した音源がかかわる限りにおいては、発明の方法および/または装置は、実際にはあまり重要ではない。遅延値が丸められた場合、合成された波面は理論的に定義された理想的な場合から逸れるが、偏差は、かなり小さいにもかかわらず、例えば、空間的なエイリアシングのような実際に生じる他の偏差によって完全にマスキングされる。しかしながら、実用的なリアルタイム実装のために、現在、非移動および移動音源との間を区別することはあまり役立たない。各場合において、算出は、一般的な場合のための、すなわち、移動音源のためのアルゴリズムを使用して実行されるべきである。
アルゴリズムは、特に、移動音源に対して関心がある。しかし、エラーは、単にサンプルが「吸収され」または二重に使用される場合だけで生じるわけではない。むしろ、ランダムなノードでのサンプル信号の近似が常にエラーを生じる。ノード間の近似のための方法は、非整数遅延補間とも呼ばれる。
同じことが、出力信号の周波数およびフェーズ・エラーにおいて、他との間でそれ自身に感じさせる。これらのエラーが時間的に変化し(移動音源の場合のように)、例えば、周波数範囲における振幅および周波数変調のように、ならびに全く復号のエラー・スペクトルとして示されるように、(しばしば明らかに聞き取り可能な)様々な影響が生じる。
この種のエラーも、補間法の利用において発生する。−ここで、決定的であることは、使用される方法の品質である。しかしながら、品質は、典型的には、演算時の消費量に関係している。
1つの可能性はサンプルの正確な削除および挿入である。しかしながら、それが、より高品質の結果を必ずしも提供するというわけではない。
演算時の消費量を比較的に低く保つ一方、それに応じて、WFS信号処理を構築することによって非常に高品質の遅延補間法の利用を可能にすることが本発明の中心的な問題である。
本発明の実施例において、ポイントは、特に、音源の移動に対処せず、この場合、対応して生成されたサンプルによって生じるエラーを回避しようとすることではない。信号処理は、音源位置についてのいくつかの情報、(移動音源の場合の時間的な変化をする)遅延および振幅値さえも必要としない。これは、本発明が、遅延補間の高品質の方法を使用することによってエラーを減少させるように機能することによる。
前述したように、高品質の遅延補間法を使用することが高い値のコンポーネント信号にとって重要である。評価目的のために、非公式の聴覚器官試験が実行され、再生システムの範囲内のレンダリング品質における遅延補間の影響が評価される。
レンダリングは、現在のWFSリアルタイム・レンダリングシステムで実行される。ここで、遅延補間の様々な方法が使用される。記載されているアルゴリズムは、遅延補間のために使用される。
研究される場面は、幾何学的に単純なプレ算出される運動経路の個々の移動音源である。この目的を達成するために、レンダリングシステムの現在のオーサリングおよびレンダリング・アプリケーションが場面プレーヤとして使用される。加えて、場面プレーヤおよび品質におけるネットワークの伝送特性の影響を評価するために、いかなる外部場面プレーヤなしに固定された動作のプログラム化された経路を生成する、適用されるレンダラが使用される。
使用される音源信号は、単純な、主に音色の信号である。なぜなら、前記信号については、遅延補間のアーティファクトの増加した知覚できることが仮定されるからである。エイリアシングのいかなる影響ならびに遅延補間のアーティファクトおよびエイリアシング干渉の相互の影響の両方なしに知覚できることを評価するために、それは、システムの空間的なエイリアシングの下および上の両方で前記信号を使用する。
以下の移動経路が、研究される:
1.配列まわりの点音源の円運動。例えば、パニング・アルゴリズムのスイッチング、または振幅の算出における変化による付加的な誤差を回避するために配列の外側に十分な距離に常に位置するように、半径が選択される。dddフラグは、遅延変化率を増加させるために起動する。
2.配列まわりの平面波の円運動。通常の方向は、配列の中心の方向に常に向く。他の境界条件は、以前の試みの類推により選択される。
3.再度、配列の正面および背面の方の点音源の線形運動。運動の方向の反転は、パルスのような干渉を回避するために、不意に生じることはなく、目標の速度に達するとすぐに、均一の運動へ音源移行まで(例えば線形の)加速動作によって生じる。dd1フラグは、振幅の変化によりいかなる影響も防止するために停止すべきである。
4.配列中心に対する通常の方向を有する平面波の線形運動。平面波の基準点の運動は、以前の試みのように生ずる。dddフラグが起動する。この試みの目的は、できる限り移動音源の他のアーティファクトから遅延補間のレンダリングエラーを分離することである:平面波の基準点は、音源信号に対して時間的基準を提供するために役立つのみである。このように、シフトは、全ての2次的音源信号に対して均一なサンプリングレート変換を作成する。レンダリング(スピーカ重みのスケーリング、2次的音源のドップラーシフト、エイリアシング混信パターンの顕著さ)の他のパラメータは、そのシフトにおる影響は受けないままである。
知覚される品質は、数人の被験者によって、非公式および主観的に評価される。
以下の問題が、聞き入れられる:
・どのような影響が、WFSレンダリングの知覚される品質を有する遅延補間アルゴリズムであるか。
・どの特性干渉が、遅延補間にさかのぼることができ、そして、特にどの状況までさかのぼることができるか。
・遅延補間の品質から開始することでは、それ以上知覚を改善できない。
非整数遅延アルゴリズムの品質を評価することの様々な基準は、以下に示される。
それらの適用可能性に関して、前記基準はさらに展開され、新規な方法によって補われる。それらは、設計および最適化の方法の目標として使用される、アルゴリズムの品質を判断するために、および品質基準を特定するためにいずれも役に立つ。
特定の非整数遅延のために設計されたFDフィルタは、離散システムを分析する共通の方法を使用することによって研究される。これに関連するのは、例えば、複雑な周波数応答、振幅応答、位相応答、位相遅延、および群遅延のような評価基準である。
理想的な非整数遅延要素は、振幅1を有する振幅応答特性を有する。定位相と同様の線形位相および所望の遅延に対応する群遅延がある。対応している基準は、dの様々な値のために評価されなければならない。
図3は、一例として、様々な遅延値dのための3次ラグランジュ補間器の振幅応答特性および位相遅延を示す。図3aは、規格化された周波数における振幅の依存を表し、そして、図3bは、規格化された周波数における位相遅延の依存を表す。dの様々な値に対する様々なグラフは、図3aおよび図3bのそれぞれに示される。一例として、図3aは、d=0;0.1;0.2;…;0.5に対する値を示す。一例として、図3bは、d=0;0.1;0.2;…;1に対する値を示す。
周波数応答の手段による評価は、時間不変性のシステムに対してのみ役立ち、従って、非整数遅延パラメータにおける時間依存変化に適用できない。補間された信号のこれらの変化の影響を研究するために、信号対雑音比(SNR)またはTHD+N(前高調波歪み+ノイズ)のような理想的な補間信号と実際の補間信号との差の基準が使用される。THD+N基準が遅延補間アルゴリズムを評価するために使用される。THD+Nを決定するために、テスト信号(該して正弦波振動)が定義された遅延曲線によって補間され、そして、結果は、分析的に生成された、予想される出力信号と比較される。使用される遅延曲線は、概して線形変化である。
主観的な評価は、個々のチャネルおよびWFSセットアップいずれにおいても生ずる。これには、上で概説される非公式の聴覚試験のような類似の状況を使用することを含む。
加えて、客観的測定方法の利用は、知覚される信号(特に、PEAQ(perceptual evaluation of audio quality:音声品質の知覚評価))を評価するために考慮される。これに関連して、主観的に決定された知覚品質および客観的品質の基準を有するかなり良好に適合することが確立される。にもかかわらず、例えば、PEAQテストが他の応用分野(音声符合化)のために設計され、パラメータ化されるので、更なる研究の結果さえ批判的である。
図4は、離散的に可変のFDフィルタから作り出されるこの種の連続パルス応答の一例を示す。具体的には、7次ラグランジュ補間器のための連続パルス応答が示され、信号の振幅は、ノードt=0,±1,±2,±3,±4に対する時間の関数として決定される。最大値(パルスのノード)はt=0となるように時間が規格化される。より少なくか、またはより大きくなるようなt値のために、振幅はゼロになる傾向がある。
連続的な可変非整数遅延フィルタの連続パルス応答が、この種の構造の挙動を記載するために使用される。離散パルス応答は、dの多くの値を決定され、そして(擬似)連続パルス応答に結合されるという点で、記述の連続形成が生成される。この記述の形成を使用することによって、例えば、エイリアシングの抑制および画像化要素のような、非同期のサンプリングレート変換にための利用におけるFDフィルタの挙動は、他のものの間で研究される。
この記述から、品質の基準は、可変の遅延補間アルゴリズムのために導出される。これに基づいて、この種の可変フィルタの品質が特に連続パルス応答の特性に影響を与えることによって作用するかどうかを調べることができる。
高品質のコンポーネント信号を提供することが可能であるために、要件の多くは、遅延補間のためのアルゴリズムに置かれる。
以下に、適切な方法に置かれるいくつかの要件が定義される。
・補間の高品質は、全ての音声再生範囲の全域にわたって達成される。アルゴリズムおよびパラメータ化のいずれもが、人間の聴覚能力をそれら自身に正しく判断させ、WFS伝送システムが選択された範囲内における他のエラーのためにもはやエラーは知覚されない。
・非整数遅延のランダム値およびランダム変化率が可能になる(特定の最大音源速度のフレームワーク範囲内において)。
・非整数遅延における安定した変化は、干渉(一時的現象)をもたらさない。
・モジュールの方式におけるレンダラユニットの範囲内における方法を実施することは、可能でなければならない。
・全てのWFS場面のリアルタイムのパフォーマンスがハードウェアに関して経済的に受け入れられる消費量(少なくとも評価する能力)によって実現されるような効率的な方法で実行可能でなければならない。
上で述べられたように、移動音源のレンダリングのために必要である遅延時間における変化は、音声信号の非同期サンプリングレート変換を結果として得る。その過程において発生するエイリアシングおよび画像化効果の抑制は、サンプリングレート変換の実装において解決される最大の問題である。変換係数が位置する大きな範囲は、WFSにおけるアプリケーションのためのさらに複雑にしている要因である。従って、方法は、ベースバンドに反映するこの種の周波数を抑制する観点から、それらの特性に関して研究することになっている。非整数遅延アルゴリズムがどのようにエイリアスおよび画像要素のそれらの抑制に関して研究されることができるかが、分析される。設計されたアルゴリズムは、それに基づいて適応される。
波面合成のために、遅延補間は、仮想音源およびスピーカの各組合せのために必要になる。それは、高いレンダリング品質を達成するために必要である遅延補間の複雑さと関連して、リアルタイム高品質の実装は、実行可能でない。
ラグランジュ補間は、非整数遅延補間のために最も広範囲にわたる方法のうちの1つである−大部分のアプリケーションに対してテストされる第1のアルゴリズムとして、それは、最も好ましいアルゴリズムのうちの1つであって、念頭に浮かぶ。ラグランジュ補間は、多項式補間の概念に基づく。N次の方法のために、それは探される場所を囲んでいるN+1のノードを通して実行される次数Nの多項式が算出される。
ラグランジュ補間は、最大限度の平坦度の条件を満たす。これは、近似およびその第1のNの偏差のエラーが選択可能な周波数ω(実際には、ωは、0であるようにほぼ選択されるだけである)で消滅することを意味する。このように、ラグランジュ補間器は、低周波で非常に小さいエラーを提示する。しかしながら、それらの挙動は、比較的高い周波数でより有利でない。
図5は、異なる次数のラグランジュ補間器のためのいわゆる最悪の場合の振幅応答特性を示す。示される内容は規格化された周波数(ω/ω0、遮断周波数としてω0)に対する依存する振幅である。そして、ラグランジュ補間器が次数N=1、3、7、および13に対して示される。たとえ、補間次数を上昇させても、高周波の品質は、改善されるのが遅い。
これらの特性がラグランジュ補間をWFSのアプリケーションのための理想に届かないようにさせる場合であっても、この補間法が記載のこれらの不利な点を提示しない比較的複合のアルゴリズムの基本要素として用いることができる。
Figure 2010539833
この公式の直接適用のために、O(N2)動作は、N+1の係数を算出するために必要である。
図6aないし6cは、振幅応答特性および遅延補間dの表現を示す。
例えば、図6aは、時間tの関数として、音声信号の振幅Aを示す。音声信号のサンプリングは、時間t10,t11,t12,…,t20,t21等で生じる。このように、サンプリングレートは、1/(t10−t11)によって定義される(一方、一定のサンプリングレートを仮定すれば)。明らかに下位の周波数で、遅延値は、再計算される。図6aに示されているように、実施例において、時間t10、t20およびt30の遅延値が算出され、そして、遅延値d1は時間t10で算出され、遅延値d2は時間t20で算出され、そして、遅延値d3は時間t30で算出される。遅延値が再計算される時のポイントは変化する;例えば、新しい遅延値は32クロックごとに生成されてもよく、1000クロック以上が、新しい遅延値の算出の間に通過することができる。遅延値の間に、遅延値は、個々のクロックのために補間される。
図6bには、遅延値dの補間がどのように実行されることができるかの一例を示す。これに関連して、さまざまな補間法が可能である。最も単純な補間は、線形補間(1次ラグランジュ補間)である。より良好な補間は高次多項式(高次ラグランジュ補間)に基づく。そして、対応する算出がより多くの演算時間を消費する。図6bは、遅延値d1がどのように時間t10で導入されるか、遅延値d2がどのように時間t20で導入されるか、そして、遅延値d3がどのように時間t30に存在するか示す。これに関連して、例えば、遅延値d13が時間t13に存在するという点で、補間は結果として得られる。補間は、時間t10、t20、t30でのノードが補間された曲線の一部として発生するように選択される。
再び、図6cは時間tの関数として、音声信号の振幅Aを示す。そして、間隔がt12およびt14の間で表される。補間によって得られた時間t13での遅延値d13は、t13とtaの時間間隔で、遅延値d13によってシフトされる振幅を結果として得る。本実施例では、それに応じて、シフトは、特定の実施例のみ、または他の実施例で異なる時間におけるより小さい値の方に向けられる。d13が小数部分を有するならば、taは、サンプリング時間にはない。換言すれば、A2へのアクセスはクロックタイムで発生する必要は無く、本発明によって解決される、近似(例えば、丸め)は上記の課題に至る。
上記に記載されるように、2つの方法は、特に、本発明に従って使用される:
(i)方法1:オーバーサンプリングを下位遅延補間と結合すること、そして、
(ii)方法2:補間のためのファロー構造を使用すること。
まず、方法1が更に詳細に記載される。
一定の(大部分は有理数)要因によってサンプリングレートを変える方法は、広範囲にわたる。前記方法は、同期サンプリングレート変換とも呼ばれる。しかしながら、この種の方法を用いて、一定の出力時間のための出力信号を生成することが可能なだけである。加えて、入出力率の比率がほぼ不合理である(すなわち、非常にかなりの最小公倍数から成る)場合、方法は非常に高コストになる。
これらの理由により、同期サンプリングレート変換を非整数遅延補間のための方法と結合することは、本発明に従って示唆される。
サンプリングレートを増加する方法を用いて非整数遅延を実装すること、および最も近いサンプリング時間を丸めることは、通常、好都合であると考慮されない。なぜなら、それは、目的にかなった信号雑音比のため極めて高いオーバーサンプリング率を前提とするからである。
従って、2つのステージから成る方法が示唆された:第1の段階は、固定された整数因数Lによる同期サンプリングレート変換を含む。前記変換は、アップサンプリング(各入力値のあと、L−1のゼロ・サンプルを挿入する)の手段、および画像スペクトルを回避するために次のローパスフィルタによって実行される。この動作は、多相フィルタによって効率的に実行される。
第2の段階は、オーバーサンプルされた値の間の非整数遅延補間を含む。前記補間は、係数が直接算出される下位の可変非整数遅延フィルタを用いて実行される。これに関連して、役立つことは、ラグランジュ補間器(上記を参照)を使用することである。
この目的を達成するために、線形補間は、多相フィルタバンクの出力との間で実行される。主要目的は、ほぼ無理性的な(「不相応な」)サンプリングレート比のために必要であるメモリおよび演算能力の要件を減らすことである。
下位の非整数遅延フィルタを使用する、および元のサンプリングレートに次のダウンサンプリングする、因数2によるアップサンプリングの結合に基づく「広帯域の非整数遅延要素」を導くことも可能である。多相構造としての実装によって、算出は、2つの独立した分岐(偶数のタップおよび奇数のタップ)に分けられる。その結果、アップサンプラおよびダウンサンプラは、個別に実行される必要はない。加えて、非整数遅延要素は、オーバーサンプルされたレートの代わりにベースバンドの周波数で実装される。品質が単に微小なフィルタ(ラグランジュ補間)と比較して改善される1つの理由は、可変非整数遅延フィルタが増加したサンプリングレートのためのナイキスト周波数の半分まで動作するということだけである。
これは、ラグランジュ補間フィルタの最大平坦プロパティに貢献する。なぜなら、それらは、低周波数での非常に小さいエラーを提示するからである。比較的高い周波数で発生しているこのエラーは、フィルタの次数を増加させることによって減少させるのみである。それは、係数の算出およびフィルタリングのために動作する効果に対応する増加と関係している。
広帯域の非整数遅延フィルタの原理は、反画像化フィルタのための効果的な実現として、ハーフバンドフィルタと結合される。可変非整数遅延要素は専用の構造に基づいて設計されてもよい。それの中で、いわゆるファロー構造(下を参照)は重要である。
非同期サンプリングレート変換(DAAU−デジタル非同期サンプリングレート変換:digital asynchronous sampling rate converterまたはGASRC=一般化された非同期サンプリングレート変換:generalized asynchronous sampling rate conversion)を記載しているモデルは、同期サンプリングレート変換(オーバーサンプリング、または合理的なサンプリングレート変換)を構成する。続く複製するシステムによって、DA/AD変換は、典型的に可変非整数遅延フィルタによって実現される。
しかしながら、同期オーバーサンプリングおよび可変の遅延補間の組合せは、音声技術において比較的広範囲にわたる。これはおそらく、この分野で使用される方法が、大部分は同期サンプリングレート変換から展開したという事実に起因する。そして、それは、いくつかの段階自体から構成するようにしばしば設計されている。
特殊なケースは、フィルタ設計方法である。ここで、フィルタ係数のための明確な、効果的な演算規格がある。それらは、数値解析において使用される補間法に基づく。ラグランジュ補間に基づく非整数遅延アルゴリズムは、最も広く広まっている。この方法を活用して、可変非整数遅延は、比較的効率的な方法で実装される。加えて、他の補間法(例えば、スプライン関数)に基づいてもいる。しかしながら、それらは、信号処理アルゴリズム(特に音声アプリケーション)で使用するのに適していない。
直接フィルタ係数を算出することに基づく非整数遅延補間のこの種の方法と比較するとき、可変部分のフィルタ次数の有効な減少は、演算時の消費量の有効な減少を可能にする。
波面合成のアプリケーションのために提示される方法の特定の効果は、オーバーサンプリング動作の要求が各入力信号につき1回実行されるということであるが、この動作の結果が、このレンダラ装置によって算出される全てのスピーカ信号のために使用される。このように、それに応じてより高い演算時の消費量は、全ての音声レンダリング範囲全体にエラーを低く保つために、オーバーサンプリングに専念する。出力信号ごとに個別に実行されなければならない可変非整数遅延フィルタは、必要な下位のフィルタの次数のために、より効率的に実行される。また、明示的に算出係数(すなわち、とりわけ、ラグランジュFDフィルタ)、すなわち、高い周波数でのそれらのプアーな行動を有するFDフィルタの決定的に不利な点のうちの1つは、それらが非常に低い周波数範囲の中で作動することを必要とするだけであるという事実によって補償される。
WFSレンダリングシステムにおいて、本発明によれば、提案されるアルゴリズムは、以下の通りに行う:
・離散の音声データの形で存在する音源信号は、整数因数Lを有してオーバーサンプルされる。これは、オーバーサンプルされた信号における入力スペクトルの反復を回避するために、各ケースにおける2つの入力信号の間のL−1ゼロ・サンプルを挿入すること、および反画像化フィルタを使用して、ローパスフィルタを実行することによって、達成される。この動作は、多相技術を用いて効率的に実現される。
・オーバーサンプルされた値は、通常、環状バッファとして実装される遅延ライン216に書き込まれる。遅延ライン216のキャパシティが、従来のアルゴリズムと比較したとき、因子Lによって増加する点に留意する必要がある。これは、メモリおよび演算の複雑さの間のトレードオフを表す。そして、そのトレードオフは、ここで設計されたアルゴリズムのために選択される。
・遅延ラインを読み出すために、遅延の所望の値は、オーバーサンプリングレートによって乗算される。非整数の部分を分離することによって、小数部分dfracと同様に整数インデックスdintが得られる。可変FDフィルタの最適の動作範囲が0≦dfrac≦1から外れる場合、(N−1)/2≦dfrac≦(N+1)/2が、例えば、ラグランジュ補間に適用されるように、この動作が適応される。整数部分が、補間のノードを得るために、遅延ラインにアクセスするためのインデックスとして使用される。ラグランジュ補間のフィルタ係数は、dfracから決定される。補間された出力信号は、算出されたフィルタ係数を有するノードを畳み込むことによって結果として得る。この動作は、スピーカ信ごとに繰り返される。
図7は、本発明の第1の実施例に従うオーバーサンプリングの手段による遅延補間の特定の表現を示す。そして、同時読み取りが、ラグランジュ補間によって実行される。本実施例において、離散の音声信号データxs(音源215からの)は、サンプリング手段236内におけるオーバーサンプリングの手段によってオーバーサンプリングされる。そして、遅延ライン216において、時間順にしたがって、その後格納される。このように、サンプルは、遅延ライン216の各メモリを結果として得る。前記サンプルは、時間tmであらかじめ定められた位置において結果として得る(図6aを参照)。遅延ライン216における対応するオーバーサンプルされた値は、WFS遅延・スケーリング手段212によって読み出される。ポインタ217は、遅延値に従うサンプルを読み出す。これは、すなわち、わずかな遅延を有するより多くのカレントデータに対応する図7の左側のポイントの矢印217、およびより高い先行(すなわち、大きな遅延)を有する音声データまたはサンプルに対応する図7の右側のポイントの矢印217を意味する。しかしながら、遅延ライン216のインデックスによれば、遅延値の整数部分のみが検出される。そして、小数(有理数)部分に対応する補間が、非整数遅延フィルタ222において行われる。非整数遅延フィルタ222の出力は、コンポーネント信号115を出力する。コンポーネント信号115(yi)は、可変の仮想音源xsのためにその後合計され、そして、対応するスピーカ(スピーカ信号)に出力される。
フィルタは、アプリケーションの実行時の外側で静的に設計される。このように、フィルタ設計に置かれる効率要件は、無関係である;高性能ツールおよび最適化手法を使用することは可能である。
Figure 2010539833
実現可能なローパスフィルタを設計するために、付加的な自由度を特定することにとって有益である。これは、定義している移行帯域または無関係な帯域によって全てにおいて行われる。ここで、規格は、周波数応答に関して提供されていない。これらの移行帯域は、上記の特定の音声周波数帯域によって定義される。移行帯域の幅は、所望のストップバンド減衰を達成するために必要なフィルタ長さのために決定的である。2fc≦f≦2(fs−fc)の帯域の移行帯域が結果として得られる。fcは、所望の上限のカットオフ周波数であり、そして、fsは、非オーバーサンプルされた信号のサンプリング周波数である。
図8は、オーバーサンプリングのための反画像化フィルタの周波数応答の規格を示す。移行帯域31は、ベースバンドに対してのみ特定される。
図9は、オーバーサンプリングのための反画像化フィルタの規格を示す。いわゆる、無関係な領域も、移行帯域310の画像310a、310b、310cのために決定される。付加的な無関係な帯域は、元の移行帯域の画像で定義される。
しかしながら、オーバーサンプリングのみが、非同期のサンプリングレート変換の第1ステージとして役立ち、そして、この変換が、周波数コンテンツのシフトを必要とするので、画像化および/またはエイリアシングのコンポーネントを可聴周波数帯域にシフトすることを回避するために、極めて注目される。
反画像化フィルタは、ほぼ単独で線形位相フィルタとして設計される。位相エラーは、この点で絶対に回避すべきである、なぜなら、目標とされた方法の入力信号の位相に影響することが遅延補間の目的だからである。しかしながら、多相システムとしての実現のために、線形フェーズドネス(linear−phasedness)は、サブフィルタに適応されない。その結果、複雑さにおいて対応する節約は、利益を得ることができない。
プロトタイプフィルタを設計するために、周知のフィルタ設計の方法が使用される。特に、リプル法(Matlabにおいて:firls)と同様の最小二乗法(また、ミニマックスまたはチェビシェフ最適化を参照,Matrab関数:firpm)が特に関連する。firpmのアプリケーションについて、比較的かなりのフィルタ長(Npp>256)については、しばしば収束が発生しない点に留意する必要がある。しかしながら、これは、使用するツール(ここでは,Matlab)の値計算法に起因するだけであり、対応する実装によって無効になる。
オーバーサンプルされた信号は、各場合におけるL−1ゼロ・サンプルの挿入によって形成されるので、因数Lによる増幅は、元の信号振幅が維持されるように発生する。この因数によるフィルタ係数によって乗算されることにより、いかなる付加的な演算時の消費量なしでも可能である。
ラグランジュ補間のような遅延補間の直接法とは異なり、結合されたアルゴリズムは、品質および複雑さを決定する様々に総合に従属するパラメータを含む。とりわけ、それらは以下を含む:
(a)プロトタイプフィルタのNppのフィルタ長。パフォーマンスに影響を及ぼすと同時に、反画像化フィルタリングの品質を決定する。しかしながら、フィルタリングは、各入力信号につき1回のみ使用されるので、パフォーマンスに対する影響は、比較的小さい。プロトタイプフィルタの長さは、遅延補間に起因するシステム待ち時間をも直接的に決定する。
(b)オーバーサンプリング比L。Lは、遅延ライン216の必要なキャパシティ(必要なメモリ)を決定する。最新のアーキテクチャーにおいて、これは、キャッシュの場所を介して、パフォーマンスにおいてインパクトを有する。加えて、Lが増加すると、所望のフィルタの品質を達成するために必要なフィルタ長も影響を受ける。なぜなら、Lの多相サブフィルタが必要であり、移行帯域幅は、Lが増加すると減少するからである。
(c)周波数帯域をレンダリングすること。周波数帯域のレンダリングは、フィルタの移行帯域の幅を決定し、このように、所望のフィルタ品質を達成するために必要なフィルタ長に影響する。
(d)補間次数N。パフォーマンスおよび品質に対する最も広範囲にわたる影響は、可変非整数遅延の補間器の次数によって発揮する。そして、それは、ラグランジュ補間器として典型的に実装される。その次数は、フィルタの係数およびそれ自身の畳み込みを得るために必要な演算時の消費量を決定する。Nも、畳み込みのために必要である遅延ライン216から値の数を決定し、そして、このように、必要なメモリ帯域幅も特定する。可変補間が、入力信号および出力信号の各結合のために必要であるので、Nは、パフォーマンスにおいて最大の影響を及ぼす。
これらのパラメータの中で、品質およびパフォーマンスの態様に関してのアプリケーションのそれぞれの目的の理想の組合せが見つけられる。この目的を達成するために、アルゴリズムの様々な段階の相互関係は、分析され、シミュレーションの手段によって検証される。
以下の考慮すべき問題が、配慮されるべきである:
・オーバーサンプリングレートLは、適度に選択され、2および8の間の比率は上回らない。
・可変補間は、下位の次数を上回らない(最大は3を目的としている)。同時に、奇数の補間次数が使用される。なぜなら、次数は、正真正銘のラグランジュ補間の挙動から類推することにより、明らかにより深刻なエラーを有する。
フィルタを分析するために、等価な静的フィルタは、現実の入力信号を有するシミュレーションを加えて分析する。この目的のために、固定された非整数遅延のために、ラグランジュ補間に関係するプロトタイプフィルタのフィルタ係数が決定され、対応するラグランジュ重みによって乗算され、必要なインデックスシフトを実行した後に合計される。このように、アルゴリズムは、マルチレート処理の特殊性を監視する必要性のない4セクション(周波数応答、位相遅延、連続的パルス応答)において記載されている基準に関して分析される。
従って、等価な静的FDフィルタを決定するためのアルゴリズムが実装される。これについての問題を含むことは、相当する値dの全てを得るためのフィルタ長の規格のみである。なぜなら、等価のフィルタは、dの依存において、入力信号の様々なサンプルにアクセスするからである。
補間フィルタによって決定される静的遅延は、補間次数におけるのと同様に、多相のプロトタイプフィルタの位相遅延において、オーバーサンプリングLの次数に依存している。プロトタイプフィルタが線形位相である場合、以下のシステム遅延が結果として得られる:
Figure 2010539833
提示されるアルゴリズムは、実用的なおよび比較的実現しやすい遅延補間を改良する方法を構成する。係数の方向算出から構成される遅延補間のための方法と比較した更なる性能要件は、非常に低い。これは、特に比較的高い周波数で、レンダリングエラーの明確な減少と矛盾する。ラグランジュ補間のような直接法とは異なり、合理的な消費量で、全ての音声レンダリング帯域にわたり知覚できるアーティファクトを含まないレンダリングを実現することが可能である。方法のパフォーマンスのために決定的であることは、整数および非整数遅延を効率的に得て、ラグランジュ係数を算出し、そして、フィルタリングを実行することである。
パフォーマンスの決定パラメータを決定するために使用される設計ツールは、比較的シンプルに保たれる。L,NppおよびNは、外部の制約に基づいて、または実験によって決定される。おそらく、付加的な無関係な領域を生かす一方、プロトタイプフィルタのフィルタ設計は、ローパスフィルタのための標準方法を使用して実行される。
次は、(補間のためのファロー構造を使用する)代わりの方法を表す方法2の詳細な説明である。
ファロー構造は、可変非整数遅延を実装するための可変フィルタ構造である。それは、FIRフィルタに基づき、挙動が付加的なパラメータを介して制御されえる構造である。ファロー構造のために、遅延の小数部分が、制御可能な遅延を撮像するために、パラメータとして使用される。それが、それについてそれぞれに開発された場合であっても、ファロー構造は、可変ディジタルフィルタの事例である。
Figure 2010539833
Figure 2010539833
このように、ファロー構造の出力は、dの多項式として実現される。多項式の係数は、FIR構造におけるM個の固定されたサブフィルタCm(z)の出力である。多項式の評価は、ホーナースキームを適用することによって、効率的に実現される。
固定されたサブフィルタCm(z)の出力信号は、特定の、非整数倍の有理数の遅延dから独立している。冗長な算出を有効に生かすために、上に導入されるスキームによれば、これらの値は、2次音源の全てのための出力信号を評価するために使用される中間結果として、それ自身を添える。
それに基づく本発明は以下のように構成される:
・各入力信号は、M個のサブフィルタと並列に畳み込まれる。
・サブフィルタの出力値は、遅延ライン216に含められる(いずれの場合においてもサンプリング時間に対して結合される)。
・遅延出力信号を決定するために、遅延の整数部分は決定される、そして、遅延ライン216における所望のデータのインデックスはそこから決定される。
・この位置のサブフィルタ出力が、d(非整数倍の有理数の遅延部分)の多項式補間の係数として読み出され、使用される。
・多項式補間の結果は、所望の遅延入力値である。最後の3つのステップは、出力信号ごとに繰り返される。
図10は図式的にこのアルゴリズムを示す。そして、それは以下の通りに要約される。同時読取りは、ファロー構造に基づいて実行され、そして、音声信号xsのデータが遅延ライン216に入力される。しかしながら、本実施例において、入力されるそれ自身は音声データではないが、その代わりに、係数cpがファロー構造(サブフィルタ237)の出力値239として算出され、それらの時間順に従う遅延ライン216において格納される。以前表された実施例とは異なる(図7を参照)。以前のケースでもあったように、遅延216へのアクセスが、矢印217によって実行され、位置は、次に遅延dの整数部分よって選択される。ファロー構造の対応するci係数を読み出すことによって、対応する(遅延)スピーカ信号yiは、遅延値における指数級数、または、遅延値(多項式補間のための手段250において)の小数(非整数)部分の手段によってそこから算出される。
ファロー構造のアプリケーションは、係数cnmを決定するための特定の設計方法にくくられない。例えば、以下のエラー積分が最小となる。
Figure 2010539833
これは、最小二乗法の最適化問題に対応する。
最小二乗または重みつき最小二乗法の基準に基づくさまざまな方法が可能である。前記方法は、所望の周波数帯域全体の方法の平均二乗誤差および制御パラメータdの定義範囲を最小化することを意図する。重みつき最小二乗法(WLS)において、重み関数は、組み込み領域におけるエラーに荷重をかけることを可能にするように、付加的に定義される。WLSに基づいて、相互に作用する方法は、例えば、最大エラーを最小化するために、エラーは、組み込み領域のある領域において特に影響される。大部分のWLS法は、プアーな数値的条件を示す。これは、不適当な方法のためではなく、フィルタ設計において移行帯域(無関係な領域)の使用から結果として得る。従って、これらの方法について、比較的短いサブフィルタの長さNおよび比較的下位の多項式の次数Mのファロー構造のみが設計される。なぜなら、そうでなければ、数の不安定性は、パラメータの正確さを制限するか、または、方法の収束を抑制するからである。
設計法の他のクラスは、可変非整数遅延フィルタの動作範囲における最大エラーを最小化することを目的とする。所望の周波数帯域および制御パラメータdのための許容帯域によって補われる領域は、動作範囲として定義される。この種の最適化は、大部分が、ミニマックスまたはチェビシェフ最適化と呼ばれる。
制御パラメータなしの従来の線形位相FIRフィルタのために、チェビシェフ近似、例えば、remez交換アルゴリズム(remez exchange algorithm)、またはそれに基づくパークス・マクラレンアルゴリズム(Parks−McClellan algorithm)のための効率的なアルゴリズムがある。前記アルゴリズムは、ランダムな複素周波数応答に適応するために拡大され、そして、従って、位相応答のために、非整数遅延がフィルタされる。
通常、チェビシェフまたはミニマックス最適化問題は、線形最適化の方法によって、一般的に解決される。これらの方法は、remez交換アルゴリズムに基づくそれらよりもより負担が桁違いに大きい。しかしながら、それらは、直接的に公式化し、ファロー構造のサブフィルタのための設計問題を解決することを可能にする。加えて、前記方法は、同等また不等の条件の形式で付加的な第2の条件の公式化を可能にする。これは、非同期サンプリングレート・コンバータを設計するために非常に重要な特徴であると考慮される。
ファロー構造のためのミニマックスの設計のための方法は、限られた最適化(第2の条件が示されることを可能にする最適化手法は、条件付きの最適化と呼ばれる)のためのアルゴリズムに基づく。ファロー構造のための前記設計手法の特徴は、個別の規格が、振幅および位相エラーに対して明白であるということである。例えば、許容できる最大振幅エラーを特定すると共に、最大の位相エラーは最小化される。例えば、振幅および位相エラーのための正確な公差仕様と共に、対応するエラーから結果として得られ、これは、フィルタ構造の特定のアプリケーションの最適化のための強力なツールを表す。
Figure 2010539833
加えて、ファロー構造を設計する様々な他の方法が可能である。1つの方法は、特異値分解に基づき、そして、それに基づく、実装の効果的な構造も開発されている。この方法は、WLS法と比較して、高いフィルタ設計の精度のレベルを提供し、減少されたフィルタの複雑さを示すが、第2の条件と特定するか、または振幅および位相エラーの境界に影響することを特定する可能性を提供しない。
更なる方法は、特有のフィルタに基づく。このアプローチは、文献において今までのところ追跡されていなかったので、いかなる特定の実装および評価なしにパフォーマンスについていかなる記述も製作することは可能ではないが、それはSVD法と類似していなければならない。
フィルタ設計の第1の目標は、理想の非整数遅延からの偏差を最小化することである。これに関連して、最大エラーまたは(重みつき)平均誤差が最小化される。使用される方法に依存して、複雑なエラーまたは位相および振幅の応答は、個別に特定される。
最適化条件を準備することにおける重要な因子は、興味がある周波数帯域の選択である。
関連した連続パルス応答(上記を参照)の形は、品質および非同期サンプリングレート変換の知覚できる品質に大きい影響を及ぼす。従って、直接の連続パルス応答に関連した第2の条件の利用が研究される。このように、例えば、連続的な要件が特定される。
多くの遅延補間アプリケーションにおいてされる要求は、補間状態を観察することである。前記補間状態は、個別のノードでの補間を必要としており、すなわち、サンプルの値を導入する。同等の条件の形で第2の条件の定義を許容する設計法において、この要件は、直接公式化される。ラグランジュ補間器のファロー実装は、ラグランジュ補間の定義のためにこの要件を満たす。従って、一般の非同期サンプリングレート変換の補間条件、特に、WFSの状況における利点は、むしろ低いとして分類されることである。特定のノードの正確な補間より重要なことは、一般的に小さいエラーであり、小さい最大偏差および/またはできるだけ一様な誤差曲線である。
ファロー構造は、遅延補間のための非常に高いパフォーマンスのフィルタ構造を表す。波面合成のアプリケーションのために、評価動作と同様に音源信号につき前処理へのアルゴリズムの効率的な分割が実装される。
ファロー構造の係数のために、達成可能な複雑さおよび品質を計算する観点から異なる多くの異なる設計法がある。これらの他に、直接、または、間接的に所望のフィルタの特性に関している付加的な制約が多くの方法で定義される。最適パラメータ化がわかる前に、この設計の自由は、様々な方法および第2の条件を評価するためのより大きな調査支出を結果として得る。しかしながら、所望の方法は、高精度を有する規格に適している。これは、非常に同一の良質な要件を有するフィルタ複雑さの減少を可能と思われる。
ファロー構造に基づくWFSのためのアルゴリズムは、効率的に実装される。一方では、修正されたファロー構造の線形位相のサブフィルタから結果として得る複雑さの減少は、プレフィルタリングにおいて利用される。他方では、多項式の評価としての予め算出された係数の評価は、ホーナースキームに基づいて非常に効率的な方法で可能である。
このフィルタ構造の大きな効果は、目標とされた設計を可能にする閉じた設計法の存在でもある。
実装および最適化の更なる可能性は、以下の通りに要約されることができる。
実施例は、主に波面合成のアプリケーションのための遅延補間のための新規なアルゴリズムの開発について述べる。これらのアルゴリズムが通常、いかなる特有の実装および目標のプラットホームから独立しているけれども、実装の態様はこの点で考慮にないままにはできない。これは、ここで記載されているアルゴリズムが、明らかにWFS再生システムの全体のパフォーマンスで最も大きな部分を構成するという事実に起因する。従って、実装の以下の態様は、その中に、アルゴリズム的複雑さ(例えば、漸近的な複雑さまたは動作の数)に加えて考慮される:
(i)並列性(Parallelizability)。これに関連して、とりわけ、命令レベルの並列性が考慮される。なぜなら、大部分の最新のプロセッサはSIMD命令を提供するからである。
(ii)命令への依存。アルゴリズムの部分的な結果の依存の強度のおよび長期の関係は、効率的なコードの編集を複雑にし、そして最新のプロセッサの効率を低下させる。
(iii)条件付きコード。状況の区別は、実装の効率を低下させて、維持するため、そして、評価を受けるために問題を含みもする。
(iv)コードおよびデータ場所。遅延補間はWFS信号処理アルゴリズムの最深部のループの範囲内で起こるので、コンパクトコードは比較的重要である。加えて、データアクセスのためのキャッシュ・ミスの数も、パフォーマンスに影響する。
(v)メモリ帯域幅およびメモリアクセス・パターン。メモリアクセス、それらの配布およびアラインメントの数は、パフォーマンスにしばしば重要な影響を及ぼす。
標準のPCの構成が、近いおよび中期将来におけるレンダリングシステムのレンダリング装置のために使用されるので、現在のPCのプラットホームが実装の根拠として使用される。しかしながら、このように、得られた大部分の所見が基礎をなす概念が大部分類似しているという事実のためこのように他のシステムのアーキテクチャーにも関連すると仮定される。
上記において導入されたプレフィルタリングは、多相動作として効率的に実行される。これには、アップサンプリングされた出力信号に同時に、多重化する手段によって、異なるサブフィルタ(それの出力は結合される)であるLを有する入力データを畳み込むことを含む。フィルタリングは、FFTに基づいて線形畳み込みまたは高速畳み込みの手段によって生じる。FFTの手段による実装のために、入力データのフーリエ変換が、1回だけ生じる必要があり、それからサブフィルタを有する同時の畳み込みのために、数回、使使用されるのみである。しかしながら、使用する比較的短いサブフィルタ長のために、フーリエ変換の手段による畳み込みが直接の実装と比較して、効果を伴うかどうかは、慎重に考慮されることになっている。例えば、長さ192のパークス−マクレラン・アルゴリズム(Matlabの関数でfirpm)によって設計されるローパスフィルタは、150dB以上のストップバンド減衰を有する。これは、48のサブフィルタ長さに対応する;フィルタは、数値的に安定な方法で、それより長くもはや設計されない。いずれにせよ、サブフィルタ動作の結果は、介在方法における出力データストリームに挿入されなければならない。例えば、インテルIPPライブラリから、効率的にこの種のフィルタ動作を実装する1つの可能性は、多相またはマルチレートフィルタリングのためのライブラリ関数を使用することにある。
ファロー構造に基づくアルゴリズムの前処理は、マルチレート処理のためのこの種のライブラリ関数の手段によって、効率的に実行される。これに関連して、サブフィルタは、インタリーブの手段によって、プロトタイプフィルタに結合されなければならない。関数の出力値は、インタリーブされた出力値を表す。しかしながら、修正されたファロー構造に従って設計されたサブフィルタの線形に段階的であることは、フィルタリングのための動作の数を減らすために有効に使用される。しかしながら、これに関連して、専用の実装が必要であることは、非常に起こり得る。
遅延パラメータの時間離散化が非同期遅延補間のためのFDアルゴリズムの達成可能な品質に決定的な影響を及ぼすということが証明されている。従って、設計されるアルゴリズムの全ては、遅延パラメータ(サンプルに正確と呼ばれる)のサンプルごとに算出される値を処理する。前記値は、2つのノードとの間に線形補間の手段によって算出される。仮定は、公式の聴覚試験によってサポートされ、この補間次数は十分に明確である。
非整数遅延アルゴリズムは、整数部および非整数倍の有理数の部分に再分割される所望の遅延を必要とする。修正されたファロー構造のために、範囲(0…1)は強制的ではないが、範囲は、例えば、ラグランジュ補間において、(−1/2…1/2)または[(N−1)/2…(N+1)/2]となるようにも選択される。しかしながら、これは、単位作業については何も変えない。サンプルに正確であるパラメータ補間について、この動作は、基本の遅延補間ごとに実行され、従って、パフォーマンスに重要な影響を及ぼす。従って、効率的な実装が非常に重要である。
WFSの音声信号処理は、各音声サンプル並びに音源信号およびスピーカの組合せのための遅延動作および遅延された値のスケーリングにおいて存在する。効率的な実装のために、これらの動作は、一緒に実行される。これらの動作が個別に実行される場合は、パフォーマンスの重要な減少が、パラメータ移行、付加的な制御フロー並びに劣化コードおよびデータ位置のために必要な消費量の結果として予期される。
従って、それは、スケーリングファクター(これは、ノードとの間に線形補間によって典型的に達成される)の生成および補間された値のスケーリングをWFS畳み込みの実装に組み込むことを必要とする。
一旦方法が実装されると、それらは測定値および主観的評価によって評価されることになっている。
加えて、これ以上品質が増加しない方向で品質の度合いが達成されないことからも推定される。なぜなら、実装は、WFSシステム全体の他のエラー音源によってマスクされるからである。達成されるオブジェクトおよび主観的な品質は、それのために必要な消費と比較されることになっている。
最終的な考えにおいて、波面合成レンダリングシステムの信号処理の現在の概念は、以下の通りに記載される。
遅延補間、すなわちランダムな遅延値による入力値の遅延がレンダリングの品質およびシステム全体のパフォーマンスに関して、決定的な影響を有することが明らかとなっている。
必要な遅延補間の動作の数が極めて大きいため、そして、前記動作の複雑さで比較的高水準もののために、非整数遅延補間のための周知のアルゴリズムのアプリケーションは、リソースに関して経済的に合理的な消費で実現されない。
従って、一方では、良好な主観的な認識のために必要であるアルゴリズムおよびこれらのフィルタの特性の徹底的な分析は、最小限の消費量で十分な品質を保証するために必要である。他方では、WFSアルゴリズムの全体の構造は、それに基づいて、方法の全体の複雑さを著しく低減する方法を開発するために研究することになっている。これに関連して、処理構造は、遅延補間アルゴリズムを前処理段階および前処理されたデータへの多重アクセスに分けることによって、演算時の消費量の著しい低減を可能にすることが確認されている。2つのアルゴリズムは、この概念に基づいて設計されている:
1.オーバーサンプリングされた遅延ライン216および低次数のラグランジュ補間器によってこれらの値に対するアクセスに基づく方法は、わずかに演算時の消費量の増加のみを必要とする一方、ピュアな低次数のラグランジュ補間と比較して明らかに増加するレンダリング品質を可能にする。この方法は、比較的パラメータ化して、実施しやすいが、特に、補間の品質に影響することの可能性がないことを提供し、閉ざされない設計方法を提示する。
2.更なるアルゴリズムは、ファロー構造に基づいており、多大な設計の自由、例えば、フィルタ係数を設計するための最適化手法の多数のアプリケーションを提供する。さらなる調査および実装の消費量は、特により多くの効率的実装のためのポテンシャルと同様に補間の特性に影響する可能性で相殺される。
実現において、両方の方法は、品質およびパフォーマンスの観点から実装することができ、比較される。トレードオフは、これらの態様の間において見出される。WFS再生システムの全体のレンダリング品質における改良された遅延補間の影響は、他の周知のレンダリングエラーの影響の下で研究される。これに関連して、改良が全体のシステムにおいて達成される補間品質のレベルは、明確に述べられる。
1つの目標は、許容範囲にある消費量での他のWFSアーティファクトにより生じるマスキング効果さえもない、いかなる知覚可能な干渉も生成しない遅延補間の品質を達成する設計方法にある。このように、遅延補間がWFSレンダリングの品質に負の影響を及ぼさないようなレンダリングシステムの将来の改良のためにも確保される。
現在のドキュメントの拡張として可能であるいくつかのトピックスは、以下で提示される。
WFSレンダリングシステムを実施する場合、フィルタ動作はほとんどの場合、入力および/または出力信号のために提供される。例えば、前置フィルタステージは、WFSシステムにおいて使用される。これらは、WFSオペレータの理論から結果として得る3dBの効果を達成するために、そして、レンダリングスペースへスピーカに依存しない周波数応答の適応を達成するために、各入力信号に適用される静的フィルタである。
この種のフィルタ動作をオーバーサンプリング反画像化フィルタと結合することは、通常、可能である。これに関連して、プロトタイプフィルタが一度設計される;システムの実行時で、1つのフィルタ動作は、両方の機能性を実現するためにのみ必要である。
同様に、ファロー・サブフィルタを有するランダムな静的および音源に依存しないフィルタ動作の組合せが実現される。これに関連して、定義済みの振幅応答特性に対するフィルタバンクの直接の適合と同様に標準方法を使用して設計されるファロー・フィルタバンクの両方の乗算が可能である。
前記位相遅れが1つのフィルタ・コンポーネントだけで必要である場合、両方のフィルタも結合することが(特に線形の段階的な)フィルタによって生じるシステムの位相遅れを低減する可能性を提供する。
従って、ここで示される遅延動作方法のために必要なフィルタ動作を有する従来のWFSファイルの組合せがどのように役立つかが研究される。これに関連して、分離のために必要な明確な演算負担とフィルタ動作の組合せの実行とが比較される。加えて、将来の更なる開発(例えば、音源位置に依存しているプレフィルタリング、出力信号のスピーカに特有のフィルタリング)のために提供されるWFS信号処理における変更が順守される。
サンプルに正確である遅延パラメータの補間が高品質の遅延補間のために不可欠であることが分かっている。スケーリング・パラメータは、同じ時間的分解能で補間された。このパラメータの比較的粗い離散化によって動作するレンダリングの印象に対する影響が、研究される。しかしながら、ステップサイズにおいて対応する増加が、全体のアルゴリズムのパフォーマンスにおける小さい増加だけを求める理由を与える点に留意する必要がある。
加えて、遅延補間のための効果的な信号処理が調査されている。このように、実装されるサンプリングレート変換が、移動する仮想音源のドップラー効果をシミュレーションする。更に、多くのアプリケーションにおいて、ドップラー広がり(Doppler spread)によって生じる周波数シフトは望まれていない。ここで実装されている高品質の遅延補間のための方法のため、ドップラー効果が、それが今までよりも顕著となることが考えられる。従って、将来の調査プロジェクトは、移動音源のレンダリングの場合におけるドップラー効果のための補償し、またはその強さを制御するために、研究されるアルゴリズムを構成する。しかしながら、ここで示された遅延補間のためのアルゴリズムにおいて、最低レベルで、これらの方法も基礎となる。
このように、例えば、波面合成レンダリングシステムで利用されることができる場合、実施例は、高品質の方法の実装を遅延補間に対して提供する。実施例は、波面合成再生システムに対してもアルゴリズムの更なる開発を提供する。これに関連して、遅延補間の方法が特に述べられる。なぜなら、前記方法は音源を動かすことのレンダリングの品質において大きい影響を及ぼすからである。全体のレンダリングシステムのパフォーマンスにおけるこれらのアルゴリズムの品質の要件および高い影響のために、波面合成のための新規な信号処理アルゴリズムが必要である。上記において詳細に説明されたように、このように、特に、精度のより高いレベルを有する補間された小数値を考慮することが可能である。この精度のより高いレベルは、これ自身に明らかに改良された聴覚印象の感覚を印象付ける。上述されていたように、特に、移動音源で発生するアーティファクトは、精度のレベルの増加のためにほとんど聞こえない。
特に、実施例は、前記要件を満たし、そして、開発され、実装されおよび分析された2つの効率的な方法を記載する。
特に、要件に依存して、本方法は、ソフトウェアでも実施することができることに留意されたい。本実施は、電子的に読み出し可能な制御信号を記憶するデジタル記憶媒体、特にディスクまたはCDを使用して行うことができ、対応する方法が行われるようなプログラム可能なコンピュータシステムと共に動作する。したがって、一般的に、本発明は、機械読み出し可能な担体上に記憶されたプログラムコードを伴うコンピュータ・プログラム製品であって、プログラムコードは、コンピュータ・プログラム製品がコンピュータ上で実行する場合に、進歩的な本方法を行うために動作する。したがって、言い換えれば、進歩的な本方法は、コンピュータ・プログラムがコンピュータ上で実行する場合に、本方法を行うためのプログラムコードを有するコンピュータ・プログラムであるとして実現される。

Claims (21)

  1. スピーカの配列を構成するWFSシステム(200)のためのコンポーネント信号(115)を決定するための装置であって、スピーカ位置(145)を考慮すると共に、仮想音源に基づく前記スピーカのためのコンポーネント信号(115)を算出するために、前記WFSシステム(200)は、前記仮想音源に関連し、および音声サンプリング周波数でのサンプリングされた離散信号として存在する音声信号(125)並びに前記仮想音源に関連する音源位置(135)を有効に利用するために構成され、前記装置は、
    前記音声サンプリング周波数より小さいパラメータ・サンプリング周波数での前記音源位置(135)を使用すると共に、および前記スピーカ位置(145)を使用すると共に、コンポーネント信号(115)のためにWFSパラメータを提供するための手段(150)と、
    前記パラメータ・サンプリング周波数よりも高いパラメータ補間周波数に存在する補間されたWFSパラメータ(165)を生成するように、前記WFSパラメータ(155)を補間するためのWFSパラメータ補間器(160)であって、前記補間されたWFSパラメータ(165)は、前記音声サンプリング周波数によって特定されるよりも高い精度レベルを有する補間された小数値を有する、WFSパラメータ補間器と、
    前記コンポーネント信号(115)が精度のより高いレベルで処理された状態において得られるように、前記補間された小数値を前記音声信号(125)に適用するために構成される音声信号処理手段(170)と
    を含む、装置。
  2. 前記補間されたWFSパラメータ(165)は、遅延値であって、前記補間された小数値は、前記音声信号(125)のサンプル間隔の小数部分を定義する遅延を表す遅延値であり、
    前記音声信号処理手段(170)は、対応する非整数遅延を有するコンポーネント信号(115)を算出するために構成される、請求項1に記載の装置。
  3. 前記音声信号処理手段(170)は、さらに、変更された音声信号を得るために、前記音声信号を変更するための手段と、
    前記変更された音声信号をバッファリングするための手段(216)であって、前記バッファリングするための手段(216)は、各インデックスが前記音声信号(125)の既知の時間値に対応するように、インデックスによって前記変更された音声信号を格納するために構成される、バッファリングするための手段と、
    前記コンポーネント信号(115)を生成するための手段(212)であって、前記生成するための手段(212)は、特定のインデックスに属している前記変更された音声信号から前記コンポーネント信号(115)を生成するために構成され、それは、遅延値から決定された前記特定のインデックスのために実行可能であり、それは、前記音源位置(135)および前記スピーカ位置(145)から決定された前記遅延値のために実行可能である、生成するための手段と
    を含む、請求項1に記載の装置。
  4. 前記音声信号処理手段(170)は、合計するための手段(514)を含み、そして、前記合計するための手段(514)は、前記コンポーネント信号(115)を合計するため、および前記スピーカの配列に対して音声出力(240)でのそれらを提供するように構成される、請求項1ないし請求項3にいずれかに記載の装置。
  5. 前記音声信号処理手段(170)は、さらに、オーバーサンプリングをするための手段(236)を含み、前記オーバーサンプリングするための手段(236)は、前記音声信号(115)をオーバーサンプリングするために構成される、請求項1ないし請求項4のいずれかに記載の装置。
  6. 前記オーバーサンプリングするための手段(236)は、既知のオーバーサンプリング値(L)を有するオーバーサンプリングを実行するために構成される、請求項5に記載の装置。
  7. 前記オーバーサンプリング値(L)は、2および8の間である、請求項6に記載の装置。
  8. 前記オーバーサンプリングするための手段は、多相フィルタを含む、請求項5ないし請求項7のいずれかに記載の装置。
  9. 前記音声信号処理手段(170)は、さらに、遅延フィルタ(222)を含み、前記遅延フィルタ(222)は、前記バッファリングするための手段(216)からの値を読み出し、および既知の次数を有する非整数遅延補間を実行するために構成され、
    前記値は、特定のインデックス、およびそれに隣接した値を含み、前記特定のインデックスは、前記遅延値の整数部分に対応し、前記遅延フィルタ(222)は、コンポーネント信号(115)を生成する、請求項3ないし請求項8のいずれかに記載の装置。
  10. 前記非整数遅延補間の前記既知の次数は奇数であり、前記既知の次数は、3以下または7以下である、請求項9に記載の装置。
  11. 前記遅延フィルタ(222)は、ラグランジュ補間器を含む、請求項9または請求項10に記載の装置。
  12. 前記音声信号処理手段(170)は、さらに、プレフィルタリング・ステージを含み、前記プレフィルタリング・ステージは、レンダリングスペースへのスピーカに依存しない周波数応答の適応を実行するために構成され、前記プレフィルタリング・ステージは、前記オーバーサンプリングするための手段(236)を含む、請求項5ないし請求項11のいずれかに記載の装置。
  13. 前記音声信号処理手段(170)は、さらに、サブフィルタ(237)を含み、前記サブフィルタ(237)は、音声信号(115)をフィルタするために、そして、前記サブフィルタ(237)の出力値を前記バッファリングするための手段(216)に格納するために構成される、請求項1ないし請求項4のいずれかに記載の装置。
  14. 前記サブフィルタ(237)は、ファロー構造を形成する、請求項13に記載の装置。
  15. 前記音声信号処理手段(170)は、さらに、多項式補間のための手段(250)を含み、前記多項式補間のための手段(250)は、前記遅延値の非整数倍の有理数の部分および前記サブフィルタ(237)の前記出力値から前記コンポーネント信号(115)を決定するために構成される、請求項13または請求項14に記載の装置。
  16. 前記ファロー構造は、係数(cmn)によって決定され、前記係数(cmn)は、エラー積分を最小化する、請求項14または請求項15に記載の装置。
  17. 前記サブフィルタ(237)は、音源に依存しないフィルタ動作を実行するために構成される、請求項13ないし請求項16のいずれかに記載の装置。
  18. スピーカの配列を構成するWFSシステム(200)のためのコンポーネント信号(115)を決定する方法であって、スピーカ位置(145)を考慮すると共に、仮想音源に基づく前記スピーカのためのコンポーネント信号(115)を算出するために、前記WFSシステム(200)は、前記仮想音源に関連し、および音声サンプリング周波数でのサンプリングされた離散信号として存在する音声信号(125)並びに前記仮想音源に関連する音源位置(135)を有効に利用するために構成され、前記方法は、
    前記音源位置(135)を使用すると共に、そして前記スピーカ位置(145)を使用すると共に前記コンポーネント信号(115)のための遅延値を決定するステップであって、前記遅延値は、整数部分と小数部分とを含む、遅延値を決定するステップと、
    既知のオーバーサンプリング値(L)を有する前記音声信号(125)をオーバーサンプリングするステップと、
    バッファリングするための手段(216)において前記オーバーサンプリングされた値を格納するステップであって、前記整数部分は、インデックスとして扱われる、格納するステップと、
    前記インデックスにバッファリングするための手段(216)からオーバーサンプリングされた値を読み出すステップと、
    前記遅延値の前記小数部分を有するコンポーネント信号(115)を得るために、前記オーバーサンプリングされた値を補間するステップであって、前記オーバーサンプリングされた値は、ノードとして扱われる、補間するステップと
    を含む、方法。
  19. スピーカの配列を構成するWFSシステム(200)のためのコンポーネント信号(115)を決定する方法であって、スピーカ位置(145)を考慮すると共に、仮想音源に基づく前記スピーカのためのコンポーネント信号(115)を算出するために、前記WFSシステム(200)は、前記仮想音源に関連し、および音声サンプリング周波数でのサンプリングされた離散信号として存在する音声信号(125)並びに前記仮想音源に関連する音源位置(135)を有効に利用するために構成され、前記方法は、
    前記音源位置(135)を使用すると共に、そして前記スピーカ位置(145)を使用すると共に前記コンポーネント信号(115)のための遅延値を決定するステップであって、前記遅延値は、整数部分と小数部分とを含む、遅延値を決定するステップと、
    サブフィルタ(237)に前記音声信号(125)を処理するステップであって、各サブフィルタ(237)は、出力信号(239)を生成する、処理するステップと、
    バッファリングするための手段(216)において前記サブフィルタ(237)の前記出力信号(239)を格納するステップと、
    前記遅延値の前記整数部分に体操する位置から前記出力値(239)を読み出すステップと、
    前記遅延値および前記サブフィルタ(237)の前記出力値(239)の前記小数部分からコンポーネント信号(115)を得るために、多項式を評価することによって補間された値を決定するステップと、
    を含む、方法。
  20. 前記補間するステップは、ファロー構造の手段によって実行される、請求項19に記載の方法。
  21. コンピュータに、請求項18ないし請求項20のいずれかに記載の方法を実行させるためのプログラム。
JP2010525225A 2007-09-19 2008-09-03 高精度を有するコンポーネント信号を決定するための装置および方法 Active JP5132776B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
DE102007044687 2007-09-19
DE102007044687.1 2007-09-19
DE102007059597A DE102007059597A1 (de) 2007-09-19 2007-12-11 Eine Vorrichtung und ein Verfahren zur Ermittlung eines Komponentensignals in hoher Genauigkeit
DE102007059597.4 2007-12-11
PCT/EP2008/007201 WO2009036883A1 (de) 2007-09-19 2008-09-03 Eine vorrichtung und ein verfahren zur ermittlung eines komponentensignals in hoher genauigkeit

Publications (2)

Publication Number Publication Date
JP2010539833A true JP2010539833A (ja) 2010-12-16
JP5132776B2 JP5132776B2 (ja) 2013-01-30

Family

ID=40384478

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010525225A Active JP5132776B2 (ja) 2007-09-19 2008-09-03 高精度を有するコンポーネント信号を決定するための装置および方法

Country Status (7)

Country Link
US (2) US8526623B2 (ja)
EP (1) EP2189010B1 (ja)
JP (1) JP5132776B2 (ja)
KR (1) KR101119254B1 (ja)
CN (1) CN101868984B (ja)
DE (1) DE102007059597A1 (ja)
WO (1) WO2009036883A1 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012526458A (ja) * 2009-05-05 2012-10-25 アナログ ディヴァイスィズ インク ファロー構造に基づくコンテンツ適応スケーラ
JP2015507421A (ja) * 2012-01-13 2015-03-05 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン 周波数ドメインにおける遅延を使用しながら複数のラウドスピーカのためのラウドスピーカ信号を計算する装置及び方法
JP2016042735A (ja) * 2010-10-21 2016-03-31 アコースティック・スリーディー・ホールディングス・リミテッド 音響学的拡散発生器
JP2016534667A (ja) * 2013-09-11 2016-11-04 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 複数の拡声器信号を非相関にする装置及び方法
WO2023127225A1 (ja) * 2021-12-28 2023-07-06 アルプスアルパイン株式会社 フィルタ設計方法、及び、iir型全域通過フィルタ

Families Citing this family (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102004057500B3 (de) 2004-11-29 2006-06-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zur Ansteuerung einer Beschallungsanlage und Beschallungsanlage
US20090077149A1 (en) * 2007-09-14 2009-03-19 Texas Instruments Incorporated Asynchronous sampling rate conversion
US8515052B2 (en) 2007-12-17 2013-08-20 Wai Wu Parallel signal processing system and method
EP2261896B1 (en) * 2008-07-29 2017-12-06 Yamaha Corporation Performance-related information output device, system provided with performance-related information output device, and electronic musical instrument
WO2010013754A1 (ja) * 2008-07-30 2010-02-04 ヤマハ株式会社 オーディオ信号処理装置、オーディオ信号処理システム、およびオーディオ信号処理方法
EP2457390A1 (de) * 2009-07-22 2012-05-30 Storming Swiss Sàrl Vorrichtung und verfahren zur optimierung stereophoner oder pseudostereophoner audiosignale
US8507704B2 (en) 2009-09-08 2013-08-13 Air Products And Chemicals, Inc. Liquid composition containing aminoether for deposition of metal-containing films
JP5782677B2 (ja) 2010-03-31 2015-09-24 ヤマハ株式会社 コンテンツ再生装置および音声処理システム
EP2573761B1 (en) 2011-09-25 2018-02-14 Yamaha Corporation Displaying content in relation to music reproduction by means of information processing apparatus independent of music reproduction apparatus
KR20130093783A (ko) 2011-12-30 2013-08-23 한국전자통신연구원 오디오 객체 전송 장치 및 방법
JP5494677B2 (ja) 2012-01-06 2014-05-21 ヤマハ株式会社 演奏装置及び演奏プログラム
CN102711015B (zh) * 2012-05-29 2015-03-25 苏州上声电子有限公司 基于二次剩余序列组合的扬声器阵列声场控制方法和装置
US9736609B2 (en) * 2013-02-07 2017-08-15 Qualcomm Incorporated Determining renderers for spherical harmonic coefficients
JP6216553B2 (ja) * 2013-06-27 2017-10-18 クラリオン株式会社 伝搬遅延補正装置及び伝搬遅延補正方法
US10679407B2 (en) 2014-06-27 2020-06-09 The University Of North Carolina At Chapel Hill Methods, systems, and computer readable media for modeling interactive diffuse reflections and higher-order diffraction in virtual environment scenes
US9977644B2 (en) * 2014-07-29 2018-05-22 The University Of North Carolina At Chapel Hill Methods, systems, and computer readable media for conducting interactive sound propagation and rendering for a plurality of sound sources in a virtual environment scene
US9571265B2 (en) * 2015-07-10 2017-02-14 Tempo Semicondutor, Inc. Sample rate converter with sample and hold
DE102015214950A1 (de) * 2015-08-05 2017-02-09 Innovationszentrum für Telekommunikationstechnik GmbH IZT Vorrichtung zum Verändern einer Abtastrate, System umfassend eine Vorrichtung zum Verändern einer Abtastrate und Verfahren zum Verändern einer Abtastrate
US20170064651A1 (en) * 2015-08-28 2017-03-02 Alex Volkov Synchronization of audio streams and sampling rate for wireless communication
KR101691367B1 (ko) * 2015-10-23 2016-12-30 조선대학교산학협력단 M채널 TI-ADCs에서 미스매치에 대한 디지털 후면 교정 방법 및 그 장치
US9497561B1 (en) * 2016-05-27 2016-11-15 Mass Fidelity Inc. Wave field synthesis by synthesizing spatial transfer function over listening region
US9980078B2 (en) 2016-10-14 2018-05-22 Nokia Technologies Oy Audio object modification in free-viewpoint rendering
US11096004B2 (en) 2017-01-23 2021-08-17 Nokia Technologies Oy Spatial audio rendering point extension
US10248744B2 (en) 2017-02-16 2019-04-02 The University Of North Carolina At Chapel Hill Methods, systems, and computer readable media for acoustic classification and optimization for multi-modal rendering of real-world scenes
US10531219B2 (en) * 2017-03-20 2020-01-07 Nokia Technologies Oy Smooth rendering of overlapping audio-object interactions
US11074036B2 (en) 2017-05-05 2021-07-27 Nokia Technologies Oy Metadata-free audio-object interactions
US10165386B2 (en) 2017-05-16 2018-12-25 Nokia Technologies Oy VR audio superzoom
US11395087B2 (en) 2017-09-29 2022-07-19 Nokia Technologies Oy Level-based audio-object interactions
EP3704875B1 (en) * 2017-10-30 2023-05-31 Dolby Laboratories Licensing Corporation Virtual rendering of object based audio over an arbitrary set of loudspeakers
US10542368B2 (en) 2018-03-27 2020-01-21 Nokia Technologies Oy Audio content modification for playback audio
EP3900284B1 (en) * 2018-12-17 2023-11-08 U-blox AG Estimating one or more characteristics of a communications channel
CN109889185B (zh) * 2019-02-28 2023-03-28 深圳信息职业技术学院 一种信号插值滤波方法及插值滤波器
KR20220118989A (ko) * 2019-12-23 2022-08-26 주식회사 아도반테스토 복수의 입력 샘플에 기초하여 복수의 출력 샘플을 제공하기 위한 신호 처리 장치 및 복수의 입력 샘플에 기초하여 복수의 출력 샘플을 제공하는 방법
CN111950186A (zh) * 2020-08-20 2020-11-17 沈阳师范大学 一种无理分数阶系统的有理化方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003520358A (ja) * 2000-01-10 2003-07-02 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 多相フィルタを兼ね備えた連続可変型遅延フィルタを用いた画像の補間及び間引き
JP2004172703A (ja) * 2002-11-18 2004-06-17 Sony Corp 信号処理方法および信号処理装置
JP2004363696A (ja) * 2003-06-02 2004-12-24 Yamaha Corp アレースピーカーシステム

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5274708A (en) * 1992-06-01 1993-12-28 Fusan Labs, Inc. Digital stereo sound enhancement unit and method
EP1562403B1 (en) 2002-11-15 2012-06-13 Sony Corporation Audio signal processing method and processing device
DE10321980B4 (de) * 2003-05-15 2005-10-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Berechnen eines diskreten Werts einer Komponente in einem Lautsprechersignal
DE10355146A1 (de) 2003-11-26 2005-07-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen eines Tieftonkanals
DE102005033239A1 (de) * 2005-07-15 2007-01-25 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Steuern einer Mehrzahl von Lautsprechern mittels einer graphischen Benutzerschnittstelle

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003520358A (ja) * 2000-01-10 2003-07-02 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 多相フィルタを兼ね備えた連続可変型遅延フィルタを用いた画像の補間及び間引き
JP2004172703A (ja) * 2002-11-18 2004-06-17 Sony Corp 信号処理方法および信号処理装置
JP2004363696A (ja) * 2003-06-02 2004-12-24 Yamaha Corp アレースピーカーシステム

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012526458A (ja) * 2009-05-05 2012-10-25 アナログ ディヴァイスィズ インク ファロー構造に基づくコンテンツ適応スケーラ
JP2016042735A (ja) * 2010-10-21 2016-03-31 アコースティック・スリーディー・ホールディングス・リミテッド 音響学的拡散発生器
JP2015507421A (ja) * 2012-01-13 2015-03-05 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン 周波数ドメインにおける遅延を使用しながら複数のラウドスピーカのためのラウドスピーカ信号を計算する装置及び方法
JP2016106459A (ja) * 2012-01-13 2016-06-16 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン 周波数ドメインにおける遅延を使用しながら複数のラウドスピーカのためのラウドスピーカ信号を計算する装置及び方法
US9666203B2 (en) 2012-01-13 2017-05-30 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Device and method for calculating loudspeaker signals for a plurality of loudspeakers while using a delay in the frequency domain
US10347268B2 (en) 2012-01-13 2019-07-09 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Device and method for calculating loudspeaker signals for a plurality of loudspeakers while using a delay in the frequency domain
JP2016534667A (ja) * 2013-09-11 2016-11-04 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 複数の拡声器信号を非相関にする装置及び方法
US9807534B2 (en) 2013-09-11 2017-10-31 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Device and method for decorrelating loudspeaker signals
WO2023127225A1 (ja) * 2021-12-28 2023-07-06 アルプスアルパイン株式会社 フィルタ設計方法、及び、iir型全域通過フィルタ

Also Published As

Publication number Publication date
DE102007059597A1 (de) 2009-04-02
JP5132776B2 (ja) 2013-01-30
US20130243203A1 (en) 2013-09-19
EP2189010A1 (de) 2010-05-26
EP2189010B1 (de) 2013-10-16
KR101119254B1 (ko) 2012-03-16
CN101868984B (zh) 2013-11-20
US8526623B2 (en) 2013-09-03
WO2009036883A1 (de) 2009-03-26
KR20100063071A (ko) 2010-06-10
CN101868984A (zh) 2010-10-20
US20100208905A1 (en) 2010-08-19
US8605910B2 (en) 2013-12-10

Similar Documents

Publication Publication Date Title
JP5132776B2 (ja) 高精度を有するコンポーネント信号を決定するための装置および方法
JP6934979B2 (ja) オーディオ再生のためのオーディオ音場表現をレンダリングするための方法および装置
Swanson Signal processing for intelligent sensor systems with MATLAB
US7711552B2 (en) Efficient filtering with a complex modulated filterbank
JP5285626B2 (ja) 音声空間化及び環境シミュレーション
US7102547B2 (en) Method of near-unity fractional sampling rate alteration for high fidelity digital audio
JP6425097B2 (ja) 周波数帯域拡大装置および方法、並びにプログラム
KR20120063514A (ko) 오디오 신호를 처리하기 위한 방법 및 장치
JP5816072B2 (ja) バーチャルサラウンドレンダリングのためのスピーカアレイ
JP2007011305A (ja) ルームインプレッションおよび/またはサウンドインプレッションのシミュレーションの方法
Franck Efficient algorithms for arbitrary sample rate conversion with application to wave field synthesis
JP2019047478A (ja) 音響信号処理装置、音響信号処理方法および音響信号処理プログラム
GB2473266A (en) An improved filter bank
EP2907324B1 (en) System and method for reducing latency in transposer-based virtual bass systems
Ziemer Wave field synthesis
KR101637407B1 (ko) 부가적인 출력 채널들을 제공하기 위하여 스테레오 출력 신호를 발생시키기 위한 장치와 방법 및 컴퓨터 프로그램
CN110267163B (zh) 一种定向声音虚拟低频增强方法、系统、介质和设备
Hahn et al. Cylindrical radial filter design with application to local wave field synthesis
Støfringsdal et al. Conversion of discretely sampled sound field data to auralization formats
US20170270939A1 (en) Efficient Sample Rate Conversion
KR20230035232A (ko) 오디오 신호 처리 방법, 디바이스 및 저장 매체
JP4364598B2 (ja) フィルタ処理装置,フィルタ処理方法及びそのプログラム
US10224062B1 (en) Sample rate conversion with pitch-based interpolation filters
Franck et al. Efficient delay interpolation for wave field synthesis
Arend et al. Efficient binaural rendering of spherical microphone array data by linear filtering

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20111207

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111213

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20120307

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20120314

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120611

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20121010

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20121106

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20151116

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 5132776

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250