JP2017513052A - 周波数領域で信号を処理する装置および方法 - Google Patents

周波数領域で信号を処理する装置および方法 Download PDF

Info

Publication number
JP2017513052A
JP2017513052A JP2016557289A JP2016557289A JP2017513052A JP 2017513052 A JP2017513052 A JP 2017513052A JP 2016557289 A JP2016557289 A JP 2016557289A JP 2016557289 A JP2016557289 A JP 2016557289A JP 2017513052 A JP2017513052 A JP 2017513052A
Authority
JP
Japan
Prior art keywords
signal
frequency domain
filter
window function
time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2016557289A
Other languages
English (en)
Other versions
JP6423446B2 (ja
Inventor
フランク,アンドレアス
Original Assignee
フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン filed Critical フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン
Publication of JP2017513052A publication Critical patent/JP2017513052A/ja
Application granted granted Critical
Publication of JP6423446B2 publication Critical patent/JP6423446B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/307Frequency adjustment, e.g. tone control
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/002Non-adaptive circuits, e.g. manually adjustable or static, for enhancing the sound image or the spatial distribution
    • H04S3/004For headphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/01Multi-channel, i.e. more than two input channels, sound reproduction with two speakers wherein the multi-channel information is substantially preserved
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/01Enhancing the perception of the sound image or of the spatial distribution using head related transfer functions [HRTF's] or equivalents thereof, e.g. interaural time difference [ITD] or interaural level difference [ILD]

Abstract

【課題】【解決手段】信号処理のための装置であり、離散周波数領域表示で存在する信号を、フィルタ済信号(123)を得るためのフィルタ特性を有するフィルタ(122)によりフィルタリングし、得られたフィルタ済信号(123)またはそのフィルタ済信号から導出された信号(302)に、窓処理済信号を得るための周波数領域窓関数(124,124a,124b,124c)を提供して、周波数領域窓関数の周波数領域窓係数に、フィルタ済信号(123)またはフィルタ済信号から導出された信号(302)のスペクトル値を乗算し、得られた乗算結果を合算するプロセッサ段(120)を備える。さらに、処理済信号を得るために、窓処理済信号(125)または窓処理済信号を用いて定義される信号を時間領域に変換する変換器(130)を備える。【選択図】図1

Description

本発明は、信号処理に関し、特に、周波数領域でのオーディオ信号の処理に関する。
信号処理の多くの分野では、フィルタ特性を実行時に変化させなければならない。しばしば、スイッチングによる干渉(例えば、信号路の断絶、オーディオ信号の場合であれば可聴クリックアーチファクト)を防止するため、穏やかで滑らかな遷移が必要である。これは、フィルタ係数を連続的に内挿するか、あるいは2つのフィルタにより同時に信号をフィルタリングし、その後、フィルタされた信号を徐々にクロスフェードするか、のいずれかにより実現される。どちらの方法でも同じ結果となる。この機能を以下、「クロスフェーディング」という。
信号処理の多くの分野では、フィルタ特性を実行時に変化させなければならない。しばしば、スイッチングによる干渉(例えば、信号路の断絶、オーディオ信号の場合であれば可聴クリックアーチファクト)を防止するため、穏やかで滑らかな遷移が必要である。これは、フィルタ係数を連続的に内挿するか、あるいは2つのフィルタにより同時に信号をフィルタリングし、その後、フィルタされた信号を徐々にクロスフェードするか、のいずれかにより実現される。どちらの方法でも同じ結果となる。この機能を以下、「クロスフェーディング」という。
線形畳み込みともいうFIRフィルタによるフィルタリングを行う場合、性能の大幅な改善が、高速畳み込みアルゴリズムを使用することにより達成される。これらの方法は、周波数ドメインで演算し、ブロック単位を基本として演算する。周波数ドメインの畳み込みアルゴリズム、例えばオーバーラップ加算およびオーバーラップ保存(特に非特許文献8,9)は、入力信号を区分化(パーティション化)するがフィルタは区分化せず、その結果、大きなFFT(高速フーリエ変換)を使用し、フィルタリング時の待ち時間が大きくなる。区分化畳み込みアルゴリズムは、均等(非特許文献10,11)あるいは不均等(非特許文献12,13,20)のいずれかに区分化し、フィルタ(またはそのインパルス応答)もより小さいセグメントに分割する。周波数ドメイン畳み込みを、それらの区分化された部分(パーティション)、対応する遅延、および結果の結合に適用することにより、使用されるFFTのサイズ、待ち時間および複雑性の間の良好なトレードオフが達成される。
しかしながら、高速畳み込みの全ての方法に共通して、緩やかなフィルタのクロスフェーディングに組み合わせることが非常に困難である。これは、それらのアルゴリズムの演算がブロック毎のモードであることによる。その一方で、遷移の場合に生じるような異なるフィルタの中間値の挿入は、計算負荷を大幅に増大させるかもしれない。その理由は、それらの内挿されたフィルタ群は、それぞれ最初に、高速畳み込みアルゴズムに適用するための、適切な形態に変換されなければならないからである(これは通常、セグメント分け、ゼロ埋め、およびFFT演算を必要とする)。「滑らか」なクロスフェーディングのため、これらの演算は、かなり頻繁に行わなければならず、そのため、高速畳み込みの性能優位を大きく減らしてしまう。
これまで示された解決は、両耳合成の分野で特に見られる。非特許文献5では、FIRフィルタのフィルタ係数を内挿し、その後に時間ドメインで畳み込みを行っている(この文献において、フィルタ係数の緩やかな交換は“commutation”と呼ばれている)。非特許文献14は、2つの高速畳み込み演算を適用してFIRフィルタ間のクロスフェーディングを行い、その後に時間ドメインのクロスフェーディングを行うことを開示している。非特許文献16では、フィルタ係数の交換を、不均一区分畳み込みアルゴリズムで処理している。このように、区分けれたインパルス応答ブロック(緩やかなクロスフェーディングを目的として)に対して、クロスフェーディングと交換の双方の対策が考えられている。
アルゴリズムの観点から(異なる応用ではあるが)、非特許文献18に開示された方法は、FFTにより得られたスペクトルの後平滑化のためのもので、ここで説明する解決にかなり近い。ここでは、特別の時間領域窓(例えばハンまたはハミング窓のような余弦タイプの)を適用することが、3要素だけの周波数領域窓関数を使用する周波数領域の畳み込みにより実現される。信号のクロスフェーディングまたはフェーディングイン、フェーディングアウトは、ここでは、その適用形態のため、提供されない。さらに、非特許文献18に開示された方法は、DPSで知られる窓に基づく固定3要素周波数領域窓を基本としており、所定の窓関数への近似の複雑さと品質を調整するため、柔軟性は示されていない(さらにその結果、疎結合窓関数に対する設計方法も示されていない)。その一方、非特許文献18は、オーバーラップ保存方法を用いることで、時間領域窓関数のいくつかの部分に対するデフォールトを決定しない可能性も考慮していない。
両耳合成は、ヘッドホンを介した複雑な音響シーンのリアルな再生を可能にし、多くの分野、例えば没入型通信(非特許文献1)、聴覚ディスプレイ(非特許文献2)、仮想現実(非特許文献3)あるいは拡張現実(非特許文献4)に応用される。動的音響シーンのレンダリングは、聴者の動的な頭の動きを考慮した場合、局所的品質、現実性および両耳合成のもっともらしさを大幅に改善するが、レンダリングに関する計算の複雑さも増してしまう。局所的な正確さおよび自然さを改善するための別の通常用いられる方法は、物空間的な反射および残響の効果を加えるものである(例えば非特許文献1,5)。これは、例えば、各サウンド・オブジェクトに対する多数の離散的反射の計算と、それらの付加的サウンド・オブジェトとしてのレンダリングとにより行われる。再度言及するが、そのような技術は、両耳レンダリングの複雑さを大幅に増加させる。これは、両耳合成のための効率の良い信号処理技術の重要性を強調する。
動的両耳合成システムの一般的な信号の流れを図4に示す。サウンド・オブジェクトの信号は、両耳の頭部伝達関数(HRTF:head−related transfer function)によりフィルタリングされる。これらの寄与の総和が左右の耳の信号を提供し、ヘッドホンにより再生される。HRTFは、音源から鼓膜への音の伝達をマッピングし、相対的位置に依存して、方位角、仰角およびある制限内での距離に依存して、変化する(非特許文献6)。したがって、動的音響シーンは、時間的に変化するHRTFを用いてフィルタリングされる。一般に、相互に関連するが別々の2つの技術が、そのような時間的に変化するフィを実現するために必要である。すなわち、HRTF内挿と、フィルタ・クロスフェーディングである。ここでは、内挿が、ある音源位置に対してHRTFを決定するものとする。音源位置は、通常、方位角および仰角で示される。HRTFは通常は有限空間解像度のデータベースで提供される(例えば非特許文献7)ので、これは、HRTFの適切な部分集合の選択と、それらのフィルタ間の内挿とを含む(非特許文献3,6)。フィルタ・クロスフェーディングは、非特許文献5では”commutation”と呼ばれ、ある遷移時間に渡って分布して、内挿可能なHRTF間の、滑らかな遷移を可能にする。そのような緩やかな偏移は、例えばクリック雑音などの可聴信号欠陥を防ぐために必要である。本明細書は、クロスフェーディング・プロセスに焦点を当てる。
従来の大量のサウンド・オブジェクトにより、HRTFによる音源信号のフィルタリングは、両耳合成の複雑さに大幅に影響する。この複雑さを削減する適切な方法を、オーバーラップ加算またはオーバーラップ保存(非特許文献8,9)のような周波数領域(FD)畳み込み技術、あるいは区分け畳み込み(partitioned convolution)アルゴリズム(例えば引用文献10から13)に適用する。全てのFD畳み込み方法に共通の欠点は、フィルタ係数の交換、またはフィルタ間の緩やかな遷移がより強く制限され、通常は時間領域フィルタ間のクロスフェーディングより高い計算の複雑性が必要となることである。一方で、これは、これらの方法の演算のブロックを基礎とするモードが原因である。その一方、フィルタを周波数領域表現に変換する必要があることが、頻繁なフィルタ変化に伴う性能の大幅な悪化を引き起こす。したがって、フィルタ・クロスフェーディングに対する典型的な解決は、異なるフィルタを用いる2つのFD畳み込みプロセスと、それに続く時間領域での出力のクロスフェーディングとを含む。
V.R. Algazi und R. 0. Duda, "Headphone−based spatial sound,"IEEE Signal Processing Mag., Vol. 28, No. 1, pp. 33−42, Jan. 2011. R. Nicol, Binaural Technology, ser. AES Monographs. New York, NY: AES, 2010. D. N. Zotkin, R. Duraiswami, und L. S. Davis, "Rendering localized spatial audio in a virtual auditory space," IEEE Trans. Multimedia, Vol. 6, No. 4, pp. 553−564, Aug. 2004. A. Haermae, J. Jakka, M. Tikander, et al., "Augmented reality audio for mobile and wearable appliances," J. Audio Eng. Soc., Vol. 52, No. 6, pp. 618−639, June 2004. J.−M. Jot, V. Larcher und 0. Warusfel , "Digital signal processing issues in the context of binaural and transaural stereophony," in AES 98th Convention, Paris, France, Feb. 1995. H. Gamper, "Head−related transfer function interpolation in azimuth, elevation and distance," J. Acoust. Soc. Am., Vol. 134, No. 6, EL547−EL553, Dec. 2013. V. Algazi, R. Duda, D. Thompson , et al., "The CIPIC HRTF database," in Proc. IEEE Workshop Applications Signal Processing to Audio and Acoustics, New Paltz, NY, Oct. 2001, pp. 99−102. T. G. Stockham Jr., "High−speed convolution and correlation," in Proc. Spring Joint Computer Conf., Boston, MA, Apr. 1966, pp. 229−233. A. V. Oppenheim und R. W. Schafer, Discrete−Time Signal Processing, 3th edition, Upper Saddle River, NJ: Pearson, 2010. B. D. Kulp, "Digital equalization using Fourier transform techniques," in AES 85th Convention, Los Angeles, CA, Nov. 1988. F. Wefers und M. Vorlaender, "Optimal filter partitions for real−time FIR filtering using uniformly partitioned FFT−based convolution in the frequency−domain," in Proc. 14. Int. Conf. Digital Audio Effects, Paris, France, Sept. 2011, pp. 155− 161. W. G. Gardner, "Efficient convolution without input−output delay," J. Audio Eng. Soc., Vol. 43, No. 3, pp. 127−136, March 1995. G. Garcia, "Optimal filter partition for efficient convolution with short input/output delay," in 113th AES Convention, Los Angeles, CA, Oct. 2002. C. Tsakostas und A. Floros, "Real−time spatial representation of moving sound sources," in AES 123th Convention, New York, NY, Oct. 2007. J. 0. Smith III, Introduction to Digital Filters with Audio Applications. W3K Publishing, 2007. [Online]. available: http://ccrma.stanford.edu/−jos/filters/. C. Mueller−Tomfelde, "Time−varying filter in non−uniform block convolution," in Proc. COST G−6 Conf. Digital Audio Effects (DAFX−01), Limerick, Ireland, Dec. 2001. J. 0. Smith III, Mathematics of the Discrete Fourier Transform (DFT). W3K Publishing, 2007. [Online]. available: http://ccrma.stanford.edu/−jos/mdft/mdft.html. R. G. Lyons, Understanding Digital Signal Processing, 3rd ed. Upper Saddle River, NJ: Pearson, 2011. M.C. Grant und S.P. Boyed, "Graph implementations for nonsmooth convex programs," in Recent Advances in Learning and Control, V. Blondel, S. Boyd, und H. Kimura, Eds., London, UK: Springer, 2008, pp. 95−110. F. Wefers und M. Vorlaender."Optimal Filter Partitions for Non−Uniformly Partitioned Convolution". In: Proc. AES 45th Int. Conf. Espoo, Finland, March 2012, pp. 324−332.
本発明の目的は、周波数領域での信号の処理のより効率のよいコンセプトを可能とすることにある。
この目的は、請求項1に係る信号処理装置、請求項22に係る信号処理方法、あるは請求項23に係るコンピュータプログラムにより達成される。
本発明は、周波数領域での処理がどのような方法でも行われるときに特に、時間領域で実際に行われるべき窓処理、すなわち時間領域シーケンスによる要素毎の乗算、例えばクロスフェーディング、利得調整その他の信号処理もまた、周波数領域表現で行うことができるという発見に基づいている。すなわち、そのような実領域での窓掛けは、周波数領域で畳み込みにより、そして例えば巡回畳み込みにより行われるべきである、ということに注意する必要がある。これは、時間領域での畳込みを周波数領域での乗算に置き替えることで実行される区分け畳み込みアルゴリズムに関連して、特に利点がある。このようなアルゴリズム、および他の応用においても、時間周波数変換アルゴリズムおよび逆周波数時間領域変換アルゴリズムは複雑であり、周波数領域窓関数を使用する周波数領域での畳み込みは、複雑性を正当化する。特に、別の方法であれば時間領域窓処理、例えばクロスフェーディングあるいは利得変更、を行うために多くの周波数時間変換が必要となるマルチチャンネル応用では、本発明によると、実際に提供される信号処理を時間領域で行うよりも、区分け畳み込みアルゴリズムによりどのようにでも選択される領域である周波数領域で行う方が、大きな利点がある。ここで要求される周波数領域の巡回(「循環」あるいは「周期」ともいう)畳み込みは、適切な周波数領域窓関数を適用するとき、複雑性の問題はない。なぜなら、多数の周波数時間領域変換アルゴリズムが蓄積されているからである。
多数の必要となる時間領域窓処理関数は、周波数領域表現が僅かな非零係数しか含まないような窓関数により容易に近似できる。これは、巡回畳み込みが効率的に実行されることで、追加的周波数時間領域変換を省くことによる利益が、周波数領域での循環畳み込みのコストを超えることを意味する。本発明の望ましい実施形態では、フェーディングイン、フェーディングアウト、クロスフェーディングあるいは音量の変化を処理し、複雑さの大幅な削減が、時間領域窓関数を周波数領域に近似するだけで、すなわち係数の数を周波数領域で例えば18以下に制限するだけで、かなりの程度に達成される。効率のさらなる増加が、周波数領域窓関数の構造を使用することによる、巡回畳み込みための効率的な計算ルールにより達成される。一方で、これを、対応する実時間窓関数の実数値性から得られる窓関数の共役対称構造に適用する。他方で、周波数領域窓関数の各係数が純粋な実数(以下、「純実数」という)であるか、あるいは純虚数である場合、巡回畳み込み総和の加数をより有効に計算することができる。
定利得クロスフェーディングを用いる場合、すなわちフェーディングイン関数およびフェーディングアウト関数の和が各時点で「1」の場合、巡回畳み込みの複雑さはさらに削減される。その理由は、周波数領域フィルタ関数を用いる単一の畳み込みだけを計算すればよく、さもなければ、2つのフィルタ済信号の差だけを生成すれば良いからである。
実施形態においては、単一の信号が、単一の信号フィルタのみでフィルタリングされて、例えば周波数領域での音量または利得の変化を達成するために、周波数領域窓を適用する。
定利得クロスフェーディング、すなわち一定利得のクロスフェーディングを目的とする別の実施形態では、最初に、1つの同じ入力信号を2つの異なるフィルタでフィルタリングすることにより生成された2つのフィルタ出力信号の差を計算し、続いて、その差信号を周波数領域窓関数で処理する。
本発明のさらに別の実施形態では、空間周波数領域窓を有する各フィルタ出力信号が巡回畳み込みされ、その後、周波数領域の典型的なクロスフェーディングの結果を得るために、畳み込み出力信号が加算される。2つの別々な周波数領域窓を用いるとき、フィルタ入力信号もまた異なる。これとは別に、これを、単一信号と、例えば複数の並列チャネルに拡張される利得変化関数とを用いる例に拡張し、周波数領域での信号の結合を信号再変換と共に用いることもできる。
本発明の特に好ましい実施形態では、各周波数領域表現に対して必要な時間領域窓関数が近似されるだけである。これは、周波数領域窓関数係数の数を例えば少なくとも18、極端な場合には2に削減するために用いられる。したがって、それらの周波数領域窓関数の時間領域への再変換において、結果は、実際に必要な窓関数から導かれる。しかしながら、クロスフェーディング、音量変更、フェーディングアウト、フェーディングインまたは他の信号処理への適用において特に、本発明は、問題が無いか、主観的な聴覚的印象では干渉が無いか、あるいはわずかしか無く、このため、主観的な聴覚的印象の問題は、あったとしても、効率が非常に改善されることを考慮すると、十分に許容できるものであることがわかる。
本発明の望ましい実施形態について、添付図面を参照して以下に詳細に説明する。
周波数領域窓関数およびフィルタにより周波数領域で信号を処理する装置を示す。 2つのフィルタおよび2つの周波数領域窓関数により周波数領域で信号を処理する装置を示す。 2つのフィルタと1つの周波数領域窓関数で信号を処理する装置を示す。 動的両耳合成システムの信号フローを示す。 定利得クロスフェーディングの例として、線形クロスフェーディングに対する時間領域窓関数を示す。 任意の種類の利得変化の例として、線形利得変化のための時間領域窓関数を示す。 周波数領域窓係数に対する窓設計例を示す。 異なる周波数領域窓係数に対する窓設計例を示す。 さらに異なる周波数領域窓係数に対する窓設計例を示す。 さらに異なる周波数領域窓係数に対する窓設計例を示す。 さらに異なる周波数領域窓係数に対する窓設計例を示す。 さらに異なる周波数領域窓係数に対する窓設計例を示す。 図6Aに示す窓に対する周波数領域フィルタ係数の数値のチャートを示す。 図6Bに示す窓に対する周波数領域フィルタ係数の数値のチャートを示す。 図6Cに示す窓に対する周波数領域フィルタ係数の数値のチャートを示す。 図6Dに示す窓に対する周波数領域フィルタ係数の数値のチャートを示す。 図6Eに示す窓に対する周波数領域フィルタ係数の数値のチャートを示す。 図6Fに示す窓に対する周波数領域フィルタ係数の数値のチャートを示す。 異なる周波数領域窓関数に対する近似による設計エラーのチャートを示す。 フィルタ・クロスフェーディングを伴う周波数領域畳み込みアルゴリズムの複雑さを示すチャートであり、出力標本当たりの多数の命令を示す。 フィルタ・クロスフェーディングを伴う周波数領域畳み込みアルゴリズムの複雑さを示すチャートであり、出力標本当たりの多数の命令を示す。 フィルタ・クロスフェーディングを伴う周波数領域畳み込みアルゴリズムの複雑さを示すチャートであり、出力標本当たりの多数の命令を示す。 フィルタ・クロスフェーディングを伴う周波数領域畳み込みアルゴリズムの複雑さを示すチャートであり、出力標本当たりの多数の命令を示す。 従来のイヤホン信号処理を実現するための構成を図4と同様に示す。 本発明の実施形態に係るイヤホン信号処理を示す。 利得変化関数を用いて周波数領域の信号を提供する装置を示す。
図1は離散時間信号を周波数領域で処理する装置を示す。入力信号100は、時間領域に存在し、時間周波数変換器110に供給される。時間周波数変換器110の出力信号は、次に、プロセッサ段120に供給される。プロセッサ段120は、フィルタ122および周波数領域窓関数提供手段124を有する。周波数領域窓関数提供手段124の出力信号123は、次に、直接または処理後、例えば他の対応する同等に処理された信号と結合した後に、周波数時間変換手段、すなわち周波数時間変換器130に供給される。本発明の望ましい実施形態では、時間周波数変換器110および周波数時間変換器130は、高速畳み込み用に設計される。高速畳み込みは、例えば、オーバーラップ加算畳み込みアルゴリズム、オーバーラップ保存畳み込みシグゴリズム、あるいはいずれかの区分け畳み込みアルゴリズムである。このような区分け畳み込みアルゴリズムは、オーバーラップ保存またはオーバーラップ加算のような区分けされていない周波数領域変換アルゴリズムの直接適用が、それらのアルゴリズムにより生じる遅れ、または使用されるFFTのサイズのような他の実用上の理由から、正当化できない場合に使用される。このとき、対応する区分けが、対応する畳込みアルゴリズムに依存して、実行される。このとき、対応するフィルタリングが、ブロック122に示すように、インパルス応答の区分け周波数領域表現を用いて、変換済入力信号の乗算および総和により、時間領域の線形畳み込みが避けられるように、実行される。
周波数領域表現は、信号のブロック単位の区分けを基本としていることを指摘しておく。これは、時間および周波数領域で離散的である周波数領域表現の特性から黙示的に生じる。
上述のように、区分け畳み込みアルゴリズムの顕著な例は、オーバーラップ加算法であり、そこでは、入力信号が最初に重なりのないシーケンスに区分けされ、ある数のゼロが補充される。この後、個々の重なりのないゼロ詰めされたシーケンスの離散フーリエ変換およびフィルタリング行われる。次に、変換された重なりのないシーケンスのフィルタのインパルス応答のフーリエ変換による乗算が、いくつかの零標本により補充されて、実行される。続いて、このシーケンスは逆FFTにより時間領域に戻され、結果の出力信号が、重ね合わせおよび加算により再構築される。零詰めは、時間領域での巡回畳み込みに相当する周波数線領域の乗算を用いる時間領域の線形畳み込みを実現するために必要である。重ね合わせは、線形畳み込みの結果が常に元のシーケンスより長く、そのため各周波数領域乗算の結果が出力信号の一以上の区分け部分(パーティション)に影響するということの結果である。
別な方法、すなわちオーバーラップ保存方法(例えば非特許文献9)では、入力信号の重なり合うセグメントが形成され、離散フーリエ変換、例えばFFT、により周波数領域に変換される。これらのシーケンスは、要素ごとに、多数の零標本で満たされたフィルタのインパルス応答が乗算され、周波数領域に変換される。この乗算の結果は、逆離散フーリエ変換により時間領域に再変換される。巡回畳み込みの効果を避けるため、固定数の標本が各再構成ブロックから廃棄される。出力信号は、残りのシーケンスを結合することにより形成される。
図1を参照すると、プロセッサ段120は、このため、周波数領域表現で存在する信号を、フィルタ済信号123を得るためのフィルタ特性を有するフィルタによりフィルタリングするように構成されている。
フィルタ済信号またはこのフィルタ済信号から導出された信号は次に、窓処理済信号125を得るための周波数領域窓関数124に供給される。ここで、この供給は、周波数領域窓関数の周波数領域窓関数係数に、乗算結果を得るためのフィルタ済信号のスペクトル値の乗算と、乗算結果の合算とを含み、これは周波数領域で演算する。好ましくは、供給は、周波数領域窓関数の周波数領域窓関数係数のフィルタ済信号のスペクトル値との巡回(循環)畳み込みを含む。次に、変換器130は、窓処理済信号またはこの窓処理済信号を用いて定義された信号を、例えば132の処理済信号を得るために、時間領域に変換する。
フィルタ済信号から導出された信号を得るための処理は、信号の全ての可能な修正、特に、合算、差計算あるいは線形結合の形成に適用できる。一例を図3の信号フローに示すが、ここでは、「フィルタ済信号から導出された信号」が、2つのフィルタ済信号の差からなる。
図2は、プロセッサ段の他の実施形態を示す。この実施形態では、時間周波数変換器110が、図1の例と同様に実装される。特に、プロセッサ段120は、時間領域信号100から導出された周波数領域信号をフィルタリングするフィルタ122aを備え、このフィルタ122aは、その出力でフィルタ済信号を得るため、第1のフィルタ特性H1を有する。これに加え、プロセッサ段は、ブロック110の出力で周波数領域信号をフィルタ122bによりフィルタリングする構成であり、このフィルタ122bは、フィルタ済第2信号を得るため、第2のフィルタ特性H2を有する。さらに、プロセッサ段は、第1の窓処理済信号を得るため、第1のフィルタ済信号に第1の周波数領域窓関数124aを提供するように構成され、第2の窓処理済信号を得るため、第2のフィルタ済信号に第2の周波数領域窓関数124bを提供するように構成される。2つの窓処理済信号は、この後、結合器200により結合される。結合器200から出力される結合された周波数領域信号は、この後、例えば図1に示されるように、変換器130により時間領域信号に変換される。
図3は、プロセッサ段の他の実施形態を示す。この実施形態では、時間領域信号100から導出された周波数領域信号105が、フィルタ120aによりフィルタリングされる。このフィルタ120aは、第1のフィルタ済信号を得るため、第1のフィルタ特性H1を有する。これに加え、周波数領域信号103は、フィルタ122bによりフィルタリングされる。このフィルタ122bは、第2のフィルタ済信号を得るため、第2のフィルタ特性H2を有する。差信号302が、第1および第2のフィルタ済信号から、結合器300により形成される。この差信号302は、次に、周波数領域窓関数提供手段124cに供給される。窓関数の提供は、差信号のスペクトル係数の周波数窓関数の係数との巡回畳み込みとして実現される。窓処理済出力信号は、この後、ブロック122aの出力の第1のフィルタ済信号と、結合器200で結合される。したがって、図3の結合器200の出力の結果は、2つの周波数領域窓関数が定利得クロスフェーディング関数の場合、すなわち、周波数領域窓関数124aおよび124bの時間領域表現が、それらの和がどの時間でも「1」となるように、互いに相補的である場合に、図2の結合器200の出力と同じ信号となる。この状況は、例えば、図5Aに示すように、周波数領域窓関数124aが時間領域における減少傾斜に相当し、周波数領域窓関数124bが時間領域における増加傾斜を示す(あるいはその逆)場合に、満たされる。
どのような開始値および最終値を有する「標準窓」を用いる定利得クロスフェーディングに対しても、図11に示すように、合算(300)の前に、線形因子(sまたは(e−s))により、信号の拡大縮小(スケーリング)を行うことが望ましい。合算の前に適切な拡大縮小を行うことで、結合器は、単純な加算の代わりに、線形結合を行うことができる。他の実施形態でも同様に実施できる。
さらに、フェーディングインまたはフェーディングアウトまたはクロスフェーディングは、特別の実装要求に応じて、1または複数のブロックで行うことができる。
本発明の好ましい実施形態において、時間領域信号は、例えば種々の処理の後にラウドスピーカまたはイヤホンに送信される音源信号のような、オーディオ信号である。また、これとは別に、オーディオ信号は、例えばマイクロホンアレイの受信信号でもよい。さらなる実施形態では、信号は、オーディオ信号ではなく、ベースバンドまたは中間周波数バンドに復調された後に得られるような、すなわち、伝送距離の観点から、無線通信または光通信に使用されるような、情報信号である。したがって、本発明は、時間的に変化するフィルタを用い、そのようなフィルタの畳み込みを周波数領域で実行する全ての分野で有用であり、有効である。
本発明の好ましい実施形態では、周波数領域窓関数は、単に所望の時間領域窓関数を近似するように構成される。しかしながら、ある近似は、主観的な印象に関して簡単に容認され、計算の複雑さを大幅に節約する結果が得られることが判明した。特に、窓係数の数が18以下であることが好ましく、さらには15以下、8以下、4以下、3以下、あるいは極端な場合には2であることが望ましい。しかしながら、最小数の2周波数領域窓係数が使用される。
1つの実施形態において、プロセッサ段は、周波数領域窓の非零係数が部分的に、あるいは完全に、純実数であるか、あるいは純虚数であるように選択されるように構成される。さらに、関数を提供する周波数領域窓関数は、畳み込み加算のより有効な評価を達成するために、巡回畳み込み加算を計算するとき、個々の非零周波数領域窓係数の純実数または純虚数特性を使用するように構成される。
1つの実施形態において、プロセッサ段は、最大数の非零周波数領域窓係数を使用するように構成される。ここで、最小周波数に対する、すなわち最も低いビンに対する周波数領域窓係数は、実数である。さらに、偶数ビンまたは指標に対する周波数領域窓係数は純虚数であり、奇数指標または奇数ビンに対する周波数領域窓係数は純実数である。
本発明の望ましい実施形態では、図9および特に図10を参照して説明するように、それらの間でクロスフェーディングが行われる第1のフィルタ特性および第2のフィルタ特性は、異なる位置に対する頭部伝達関数(HRTF)であり、実時間信号は対応する異なる位置の音源のオーディ信号である。
さらに、図10に示すように、マルチチャンネル処理シナリオを使用することが好ましい。このマルチチャンネル処理シナリオでは、周波数領域域内の複数の音源信号がクロスフェーディングし、続いて、最終的な加算信号を信号変換により時間軸に再変換するためだけに、クロスフェーディングした信号が周波数領域で加算される。ここで、図9を参照し、比較のため、図10を参照する。特に、600,602および604で示される異なる音源SRC1からSRCMが、図4に401,402および403で示すと同様の、個々のオーディオ源を示す。音源信号は、時間周波数変換器606,608および610により、周波数領域に変換される。時間周波数変換器606,608および610は、図9および図10では、同等の構成であるとする。図10はまた、図2によるクロスフェーディングアルゴリズム(2循環畳み込み)を含む。これはまた、図3の改善された定利得クロスフェーディングを使用することもできる。
上述したように、音源401から403は移動し、例えばイヤホン信号713を得るために現在の音源の位置に対して要求される頭部伝達関数は、音源の移動により各音源に対して変化する。図4に示すように、音源位置によりアドレス指定されるデータベースが設けられる。このとき、HRTFは、音源位置に対してデータベースから得られ、あるいは、音源位置に対する正確なHRTFが無いときには、2つの隣接する位置に対する2つのHRTFを取得し、それらを内挿する。アーチファクトの生じない演算を達成するため、オーディオ信号は、時間周波数変換器606の後、第1の時点における第1の位置に対して定義された第1のフィルタ関数による周波数領域での乗算によりフィルタされる。さらに、同じオーディオ信号が、第2のフィルタにより(フィルタの伝達関数の乗算により)フィルタされる。ここで、第2のフィルタ613は、後の第2の時点における第2の位置に対して定義される。アーチファクトの無い変換を得るため、クロスフェーディングを行う。すなわち、時間フィルタ関数706,707で示したように、第1の信号612の出力信号を連続的にフェードアウトさせ、同時に、第1のフィルタ613の出力信号をフェードインさせる。そして、フィルタ612,613の出力における信号は、IFFTブロック700,701に示すように、時間領域に変換され、その後、クロスフェーディングが実行され、窓処理の出力における信号が加算される。加算は音源毎に行われ、全ての音源の対応するクロスフェード信号は、その後、最終的にイヤホン信号713を得るため、加算器712で、時間領域で加算される。
同様の処理が、ブロック614,615,702,703,708,709および616,617,704,705,710,711により示すように、他の音源に対しても行われる。
本発明では、図9の2M個のIFFTブロック700から705に代えて、単一のIFFTブロックだけで、あるいは単一のIFFFT演算630だけで実行する。周波数領域窓関数620,621あるいは622,623あるいは624,625を用いるフェーティングイン/フェードアウトあるいはクロスフェーディングが、従来と同様に、周波数領域で実行される。畳み込みの結果は、加算器626,627,628および629によりそれぞれ加算される。全ての加算を、加算器626,627,628と加算器629とのカスケードではなく、直接に行うこともできる。
これは、2M−1個のIFFTが節約できることを意味する。その一方で、周波数領域での巡回畳み込みの複雑さがいくらか増加する可能性がある。ただし、その複雑さは、有効な窓近似により大幅に削減される。これについては既にもベタが、以下でさらに詳しく説明する。
本発明は、その実施形態において、クロスフェーディング、すなわち2つのフィルタ済信号の間の滑らで緩やかな遷移、を周波数領域で直接に実行のための、進歩した方法に関する。これは、オーバーラップ保存アルゴリズムおよび区分け畳み込みのアルゴリズムを使用して演算する。これを各HRTFフィルタ処理に別個に適用する場合、出力標本当たり1個の逆FFT処理を節約し、結果として、複雑さを大幅に削減する。しかしながら、示唆されたFDクロスフェーディング方法を、両耳合成システムの信号フローの再構築と組み合わせることで、さらに強い促進が可能である。周波数領域のコンポーネント信号の合算を実行するとき、単一の逆FFTだけが、各出力信号(耳信号)に対して要求される。
以下の節では、示唆されるFDクロスフェーディングのために基本となる2つの技術、高速周波数領域畳み込み、および時間領域クロスフェーディングの呼称の全体像を提供(および定義)する。
高速畳み込み技術
高速変換に頼る畳み込み技術は、周波数領域での乗算と時間領域での巡回畳み込みとの等価性と、離散フーリエ変換(DFT)を実現する高速フーリエ変換(FFT)アルゴリズムの可能性とを利用する。オーバーラップ加算またはオーバーラップ保存アルゴリズム(非特許文献8,9)は、入力信号をブロックに分割し、周波数領域乗算を線形時間領域畳み込みに変換する。しかしながら、効率のため、オーバーラップ加算およびオーバーラップ保存は、大きなFFTサイズを必要とし、長い処理待ち時間を必要とする。
区分け畳み込みアルゴリズムは、これらの不利を削減し、計算の複雑性、使用されるFFTサイズおよび待ち時間の間の調整を行うことができる。この目的のため、インパルス応答h(n)が、均一(非特許文献10,11)または不均一(非特許文献12,13)のいずれかのブロックに区分けされ、FD畳み込み(通常はオーバーラップ保存)が各区分け部分に適用される。結果は、フィルタ済出力を得るため、相応に遅延して加算される。再利用変換演算および周波数領域遅延線(FDL)(非特許文献11,13)としてのデータ構造が、線形畳み込みの有効な実現を可能とする。
HRTFフィルタで通常に使用されるインパルス応答長(概略200−1000)を用いて、通常、均一区分け畳み込みが最も効率が良い。したがって、本明細書は、この技術に焦点を当てる。しかしながら、同様のことを、非均一区分け畳み込みに適用することは、複雑なことではない。その理由は、示唆されるFDクロスフェーディングアルゴリズムは、使用される区分けサイズのそれぞれに個別に適用できるからである。オーバーラップ保存アルゴリズムは、1つだけの区分け部分の均一区分けFD畳み込みの極端な場合であると考えることができる。したがって、示唆されるFDクロスフェーディングはまた、非区分け畳み込みに適用可能である。
均一区分け畳み込み方法は、長さNのインパルス応答h[n]を、それぞれM値のP=ROUND[N/M]個のブロックに分割する(ROUND[ ]は丸めを表す)。ここで、長さLのシーケンスhp[n],p=0,…,P−1を生成するため、零を詰める。これらが変換され、DFTベクトルH[p,k]を形成する。
Figure 2017513052
式(1)横方向のカッコで示される零の数は、L−Mである。
入力信号x[n]は、長さLで連続するブロック間にB個の標本が先行する重なり合うブロックx[m,n]に分割される。
Figure 2017513052
周波数領域出力信号Y[m,k]は、H[p,k]とX[m,k]の畳み込みにより形成される。
Figure 2017513052
ここで、“・”は、複素ベクトルの乗算を示す。逆DFTにより、長さLの時間領域ブロックが得られる。
Figure 2017513052
各出力ブロックy[m,n]に対して、最後のB標本を使用して、出力信号y[n]のm番目のブロックを形成する。
Figure 2017513052
出力信号の時間領域の折り返し雑音(エイリアス)は、以下を適用する場合には予防される(非特機文献9,11)。
Figure 2017513052
区分け畳み込みのための適切な選択はL=2Bであり(例えば非特許文献12,13)、以下では、標準DFTサイズとして参照し、NおよびBの実際の組み合わせのために高い効率を得ることができる。
B標本からなる各出力ブロックに対して、均一区分け畳み込みのためのアルゴリズムは、FFTおよび逆FFT、P個のベクトル乗算およびP−1個のベクトル加算を必要とする。実数値の時間領域信号に対しては、FFTおよび逆FFTが、おおよそpLlog2(L)の実数値操作を必要とする。ここで、pはハードウェア依存定数であり、典型的な値はp=2.5(非特許文献12)およびp=3(非特許文献13)である。実信号に対するベクトルX[m,k],H[p,k]およびY[m,k]とフィルタとが共役対称であるので、これらは、一義的に、ROUND[(L+1)/2]個の複素数値で表すことができる。共役対称ベクトルの加算または乗算のための演算の数は、それに応じて削減される。スカラー複素加算および乗算は、それぞれ2および6の実数値演算により実行されるので、式(6)のブロック畳み込みは、ROUND[(L+1)/2](6P+2(P−1))の計算命令を必要とする。したがって、B個の標本を畳み込むための全体の複雑さは、2pLlog2(L)+ROUND[(L+1)/2]6P+2(P−1)となる。
時間領域のフィルタ・クロスフェーディング
時間的に変化するHRTFとのオーディオ信号の畳み込みは、フィルタ係数の間の滑らかな遷移を必要とする。その理由は、急激な変化は信号の不連続を引き起こし(非特許文献5,14)、それが可聴アーチファクト、例えばクリックあるいはジッパー雑音を引き起こすからである。公式には、長さNの2つの時間的に変化しないフィルタFIR h[n],h[n]の間の遷移は、時間的に変化する畳み込みの和として表すことができる(例えば非特許文献15)。
Figure 2017513052
ここで、時間的に変化するフィルタh[n,k]は、以下で時間領域窓として参照する2つの関数w[n]およびw[n]で重み付けされた2つのフィルタの総和である。
Figure 2017513052
図5Aは、そのような窓関数の一例を示す。近接したHRTF間での遷移に対しては一般にフィルタh[n],h[n]が強く相関しているが、そのような場合には、通常は定利得クロスフェーディングが採用される。これは、すべてのnに対する重みw[n]およびw[n]の和が1であることを意味する。この場合、これらの重みは、w[n]=w[n],w[n]=1−w[n]となる個別の窓関数w[n]により表すことができる。したがって、式(10)は、次の単一の乗算により見積もることができる。:
Figure 2017513052
内挿された時間的に変化するフィルタ係数との信号の畳み込みの代わりに、入力信号をh[n]およびh[n]でフィルタリングし、その後に窓w[n]およびw[n]を用いて重み付け加算することで、同じ信号を次のように得ることができる。
Figure 2017513052
式(11)と同様に、定利得クロスフェーディングを線形内挿により実現することもできる。
Figure 2017513052
式(11)および(13)による実現は比較的複雑であるが、式(13)はフィルタ係数が非常に頻繁に更新される場合、すなわちアーチファクトの無い滑らかな遷移が要求される場合には、幾分効率が良い。さらに、最後に述べた式は、フィルタ係数h[n,k]を直接には操作できない場合、例えば高速畳み込みを使用する場合に、用いることができる。FD畳み込みと出力クロスフェーディングを組み合わせる例は、例えば非特許文献14,16に示されている。
例えばFD畳み込み方法を組み合わせてブロックを基礎として演算するため、遷移の長さがブロックサイズBと同じであれば、式(13)を容易に適用することができる。しかしながら、より長い遷移周期に対しては、(a)フィルタ間の所望の遷移が線形関数(傾斜)に対応しており、(b)全遷移周期Bfullが元のブロックサイズBの整数倍である、という2つの状況が満たされる場合に、長さBの単一の窓w[n]を用いて効率的に、フィルタ済信号のクロスフェーディングを実施することができる。この場合、この遷移をM=Bfull/Bブロックに分割することができる。全遷移の各ブロックは、差信号y[n]−y[n]に、B個の標本内の1から10の線形遷移を実現する個々の窓関数w[n]を乗算することにより表される。y[n]およびy[n]との線形結合が、このブロックに対する出力信号として得られる。
Figure 2017513052
ここで、s=m/Mおよびe=(m+1)/M,m=0….M−1は、Mブロックにわたる遷移内のm番目のブロックに対する最初および最後の係数である。
時間領域クロスフェーディングの周波数領域表現
この節では、フィルタ済信号の周波数領域表現、例えば、最終時間領域出力のソフトクロスフェーディングを実現するための区分け畳み込みアルゴリズム内の式(5)のY[m,k]の表現、に基づいて演算を行うアルゴリズムについて記載する。ここでの主な動機付けは、効率を高めることである。その理由は、遷移が周波数領域で実現される場合には、出力クロスフェーディングに対して、逆FFTだけが必要とされるからである。
時間領域クロスフェーディングを周波数領域で表現するため、個々の信号x[n]への時間領域窓w[n]の要素単位の乗算を考える。
Figure 2017513052
これは、式(12)の出力クロスフェーディングの一部と考えることができる。完全なクロスフェーディングへの拡張、および複雑さのさらなる最適化については、「複雑さをさらに制限するための効率的な実装」の節で議論する。
式(15)の周波数領域表現は、非特許文献9,17の畳み込み原理の二重性から、次のようになる。
Figure 2017513052
ここで、丸に*で示す演算子は、2つの離散時間シーケンスの巡回畳み込みを示す。したがって、時間領域クロスフェーディングは、巡回FD畳み込みによって実現される。しかしながら、計算の観点からは、そのような周波数領域クロスフェーディングは興味をそそるものではない。一般に、長さLの2つのシーケンスの巡回畳み込みは、ほぼLの複素乗算および加算を必要とし、それは、逆FFTの節約による約O(LlogL)の潜在利益を遥かに超える。
しかしながら、周波数領域窓W[k]がわずかの非零係数しか含まないなら、FDクロスフェーディングは、従来の時間領域での実現より、より効率的になる。非零係数がわずかしかない窓関数をうまく適用することができるという最初のヒントは、非特許文献18により与えられる。非特許文献18では、時間領域のハンまたはハミング窓に相当する3つの係数からなる周波数領域シーケンスが、FFTスペクトルを滑らかにするために使用される。以下、どのようにして、そのような疎に占有された窓を、時間領域クロスフェーディング演算に用いるために、適切に成形するかを説明する。
周波数領域窓の設計
周波数領域窓W[k]に対する設計目的は、対応する時間領域シーケンスw[n]
Figure 2017513052
が、所望の窓関数w^[n]
Figure 2017513052
に所定の誤差ノルムで近似しているということである。文字の上の丸はそれが逆FFTの結果であることを表し、巡回畳み込みのアーチファクト(すなわち時間領域エイリアス)を含む可能性がある。w[n]とw^[n]とは、長さがLであり、一方、長さBの出力ブロックに対する時間領域窓w[n]の長さは、Bである。
区分け畳み込み方法(非特許文献8)に依存するオーバーラップ保存機構により、現在のブロックの窓処理時には、w[n]の最後のB個の値だけが実際に使用され、その一方、他の要素の寄与は廃棄される。この結果、FDクロスフェーディングアルゴリズムに対する所望の時間領域窓関数w^[n]と、従来の時間軸クロスフェーディングの窓w[n]とは、以下の関係を示す。
Figure 2017513052
これは、どのような制限も時間領域窓関数(数16)の最初のL−B個の係数には課されないことを意味する。すなわち、これらの係数は、どのような値をとっても、周波数領域クロスフェーディングの結果に影響しない。これらの自由度は、W[k]の設計時にも有利に利用できる。窓関数W[k]およびw[n]は、以下の逆DFTにより互いに関連付けられる。
Figure 2017513052
ここで、最初の因子Lは、式(16)の畳み込み原理の二重性畳から得られる。
実数値信号をクロスフェードするため、時間領域窓w[n]およびそれに伴いw[n]は、純実数である。これは、周波数領域窓が共役対称であることを意味する。
Figure 2017513052
この結果、W[k]は、例えばW[0],…ROUND[(L+1)/2]なるROUND[(L+1)/2]により一義的に定義される(数式では、ROUNF[ ]を[ ]の上部がない記号で表す)。これは、W[0]が純実数値であることを意味する。また、Lが偶数である場合、W[L/2]もまた純実数である。
W[k]をその実部および虚物により表すと、
Figure 2017513052
となり、オイラーの等式を用いて指数を三角関数で置き替えると、式(18)は、次のように表される。
Figure 2017513052
したがって、この式の最後の項W[L/2](−1)は、Lが偶数のときだけ、非零となる。基本関数を導入することにより、
Figure 2017513052
となり、w[n]は、コンパクトに、次のように表される。
Figure 2017513052
この形式は、W[k]の最適化に基づいた設定として、直接に使用できる。
W[k]の非零要素に関する制限(疎制約)について説明するため、以下の指標集合R,Iを導入する。
Figure 2017513052
Wr[k]の実数部は、指標kが集合Rに含まれているときのみ、非零となる。同じ関係が、Wi[k]の虚数部と集合Lの間に適用される。この関係を用い、W[k]の寄与非零成分の所定の集合に対する式(24)の時間領域窓は、以下のように表される。
Figure 2017513052
したがって、W[k]の設計は、最適問題として行列式形式で次のように示すことができる。
Figure 2017513052
ベクトルw^は、式(17)の所望の時間領域窓w^[n]の最後のB標本を示し、WはW[k]の非零成分のベクトルである。
Figure 2017513052
Gは基礎関数の行列であり。
Figure 2017513052

式(28)において、縦2本線で示す記号は誤差ノルムであり、最小二乗法に従う最小化のために例えばp=2に最小化され、チェビシェフ(ミニマックス)最適化のためにはp=∞として使用される。
この明細書では、凸最適化のためのソフトウェアパッケージであるCVX(非特許文献19)を使用して、最適化問題を定式化して解く。式(28)の問題は、以下のCVXプログラムで表される。
cvx_begin
variable W(Ncoeffs
minimize(norm((G*W−w^),p));
subject to <optional constraints>
cvx_end
この設定の使用は、複数の付加的制限によるそれぞれの適用要求に適合する。この例は、
・異なる値w[n]に対する同等制限または上限、下限、例えば、時間領域窓の開始または終了における滑らかさ要求を確実にする。
・w[n]の傾斜制限、例えば時間領域窓の発振挙動の回避、これは、連続する値w[n]の差に制限を加えことにより達成される。
設計例
時間領域窓長B=64、対応する標準FFTサイズL=2B=128の設計例により、設計方法の特徴および結果として得られる窓関数の性能をする。設計された時間領域窓は、1から0に線形傾斜で減少する。最初と最後の係数に対する不同等制限:
Figure 2017513052
は、遷移の開始と終了での不連続を防止する。しかしながら、設計実験は、非零係数の数が非常に少ない場合だけ、結果に影響する制限が有効になることを示している。
設計実験は、非零係数の異なる集合に対してLとLの誤差ノルムに対して行われ、ここで
Figure 2017513052
は、W[k]の非零成分の全体数を示す。結果の窓を図1に示し、この設計を図7gにまとめる。図6Aは、8複素係数全集合を用いた設計を示す。Wi[0]=0(非特許文献19)なので、K=15である。結果として得られた設計は、9.37・10−6および5.65・10−6のLおよびL誤差ノルム用いて、理想時間領域窓を非常によく近似する。8実係数だけを用いた設計を図6Bに示す。この図は、理想窓関数からの目に見えるずれを示している。これはまた、LおよびLの設計に対する誤差ノルム5.45・10−2および1.55・10−2から明らかになる。これとは対照的に、図6Cに示す設計は、K=8非零成分を表す。しかしながら、この設計は、8複素係数を用いた例の特性にほぼ達している。その理由は、非零値が実数成分および虚数成分の集合から特別に選択されているからである。
図6Dから図6Fは、非零成分の個数を減らしたが、その選択が適切に行われた設計例を示す。K=3と少なく個数でも、理想時間領域窓の比較的良好な近似が可能であることがわかる。K=2を用いた最終設計(図6F)は、理想線形遷移からの大きな逸脱が示されているが、フィルタのクロスフェーディングの多くの用途では許容可能である。その理由は、これが信号不連続の無い滑らかな遷移を提供しているからである。
複雑さをさらに制限するための効率的な実装
この節は、周波数領域クロスフェーディングアルゴリズムの2つの側面に対する最適化された実装を説明する。最初に、疎に占有された共役対称シーケンスの巡回畳み込みに対する効率的な実行を示す。次に、両耳合成で用いられるような定利得クロスフェーディングに対する最適化について記載する。
疎に占有されたシーケンスを用いる巡回畳み込み
2つの一般的シーケンスの巡回畳み込みは、次の畳み込み和により定義される。
Figure 2017513052
ここで、((k))=k mod Lは、指標剰余L(例えば非特許文献9に示されているような)である。この演算は、各エレメントY[k]に対し、L回の複素乗算とL−1回の複素加算とを必要とし、完全な畳み込みのためにさらに、L回の複素乗算とL(L−1)回の加算とを必要とする。
X[k]およびW[k]の共役対称とW[k]の疎占有とから、より効率的な表現
Figure 2017513052
ができる。
ここで、
Figure 2017513052
は、指標集合R,Jの統一から指標0を差し引いたものである。
畳み込み原理(非特許文献16)の双対表現から、Y[k]もまた共役対称である。したがって、ROUND[(L+1)/2]要素だけが、Y[k]を一義的に定義するために必要となる。Y(l)[k]を実数値および虚数値で表現するとき、その結果は、
Figure 2017513052
である。
中間値を計算することにより、
Figure 2017513052
式(36)は、効率的に、
Figure 2017513052
と見積もられる。
シーケンスY(l)[k]を見積もるには、4ROUND[(L+1)/2]の実数値乗算と2ROUND[(L+1)/2]の加算とを必要とする。したがって、この実装は、複素演算を用いて8ROUND[(L+1)/2]の実数値乗算と8ROUND[(L+1)/2]の加算とを必要とする式(35)の直接的な演算より効率的である。W[l]が純実数または純虚数である場合には、W[l]またはW[l]のいずれかが零に等しい。どちらの場合も、複雑さは、2ROUND[(L+1)/2]の実数値乗算と2ROUND[(L+1)/2]の加算とに削減される。
これらの複雑さに基づき、結果は、4K・ROUND[(L+1)/2]の実数値乗算と2(K−1)ROUND[(L+1)/2]の実数値加算、全体で(6K−2)ROUND[(L+1)/2]の演算の式(34)による巡回畳み込みの見積もりに対する全体的な複雑さである。式(32)で定義さるように、KはW[l]の非零係数の全体の総数を示す。したがって、上述の全体としての複雑さは、W[0]の実数値性と、一般的な複素数値W[l]の指標Iが、イッデックス集合RおよびJの双方に含まれるということとの、双方を考慮する。
このようにして、巡回畳み込みに寄与するシーケンスの共役対称は、複雑さに関して、大きな節約を可能とする。さらなる大きな削減が、純粋に実数または虚数のいずれかの窓係数により得られる。したがって、示唆される巡回畳み込みアルゴリズムは、例えば図6Aから図6Fに示した設計のような、疎占有周波数領域窓関数からの直接利益を引き出すことができる。
定利得クロスフェーディング
線形クロスフェーディングを含む定利得クロスフェーディングは、HRTF間の遷移に対して通常使用されるように、提示された周波数領域クロスフェーディングの概念のなかで、効率的に実装することができる。
一般的な周波数領域クロスフェーディングは、2つの入力信号のそれぞれの周波数窓との巡回畳み込みとそれに続く総和:
Figure 2017513052
により実装される。
定利得クロスフェーディングのためのより効率的な実装は、式(14)の時間領域クロスフェーディング関数の周波数領域への変換:
Figure 2017513052
により達成される。
ここで、Y[k]は、以下の差:
Figure 2017513052
である。
式(14)のように、この関数は、どのような初期値s、最終値eの間のクロスフェーディングも許容する。式(41)の実装の主な利点は、式(40)に比較して、クロスフェーディングアルゴリズムの最も複雑な部分を表現する巡回畳み込みを1つしか必要としないことである。
複雑さのさらなる削減は、式(34),(41)の巡回畳み込みスキームを融合することにより達成される。中央窓係数W[0]を含む項をクロスフェーディング関数と組み合わせることは、以下の結果:
Figure 2017513052
を有する。
このようにして、定利得クロスフェーディングの計算の複雑さは、4.1節で説明した疎占有された巡回畳み込み演算、サイズROUND[(L+1)/2]の2つのベクトル、2つの加算および窓係数W[k]を拡大縮小するための2K−1の乗算により決定れる。
図5Aと同様に、図5Bは、別の、例えば利得因子1から利得因子0.5への利得変更を表現する時間領域窓表現を示す。このような時間領域窓は、大まかには図5Aのフェードアウト窓w1に相当するが、ここではフェードインはない。図5Bの時間領域窓に対しても、効率的な周波数領域窓関数がある。このような関数は、図1,2および3のブロック124またはブロック124a,124b,124c内で使用することができる。
図5Bの時間領域窓のための周波数領域窓関数の表現は、図5Aの窓関数用の周波数領域表現から、拡大縮小により、あるいは対応する値の加算/減算により表現される。このため、新たな最適化は行われないが、例えば、周波数領域でのすべての利得変更のための対応する周波数領域窓関数を、図5Aを基礎とする、あるいは図6Aから6Fで定義されるような、既存の周波数領域窓関数から生成することができる。このようにして、利得の削減が、図5Bにより達成される。これとは別に、利得の増加は、対応する関数により達成される。このとき、図5Aの関数w2を、対応する拡大縮小および/または対応する例えば一定値の加算を行って、再び使用することができる。
図11は、利得変更のための信号処理構造の一例を示す。この例では、初期値および終了値が任意であり、単一で固定された周波数領域窓関数を使用する。ここで、Y[k]502は、利得変更の対称とするべき信号の周波数領域表現を表す。この信号は、例えば、入力信号の周波数領域でのフィルタリングにより生成される。しかしながら、そのようなフィルタリングは、絶対的に必要というわけではない。信号は、使用される周波数領域変換(以下では「変換器」という)に適合する表現で提示されていること、すなわち、周波数時間領域変換を適用して対応する時間領域信号y[n]を生成するものであること、だけが必要である。利得関数の経過は、信号ブロックの開始時の利得値s、信号ブロックの最後の利得因子e、および選択された周波数窓関数、これをここではW[k]とする、で決定される。一例として、その時間領域対応が1から0に減少する関数であるとする。利得変更は、図11にも示す以下の計算関数により実行される。
Figure 2017513052
信号y[k]には、巡回畳み込みにより、周波数領域窓関数w[k]が設けられる。この畳み込みの結果は、要素毎に第1の乗算器503でベクトルに値e−sを除算することにより拡大縮小される。巡回畳み込みの線形性により、この拡大縮小はまたは、畳み込みの前に、y[k]またはw[k]のいずれかに施してもよい。この表現の結果は、加算器500において、第2の乗算器504で初期利得値sにより拡大縮小された信号y[k]に加算され、周波数領域信号Y[k]となる。効率は、式(43)と同様に、中央窓係数W[0]を畳み込み和から切り離し、拡大縮小y[k]のときと同様に考慮することにより、さらに改善される。
Figure 2017513052
図7Aから7Fは、図6Aから6Fに時間領域で表現された周波数領域窓関数のフィルタ係数のチャートを示す。周波数領域窓関数は、疎に占有されているだけである。特に、図7Aは、周波数0に対応する窓関数の周波数表現のビン、すなわち0番目のビンが、0.5の値を有する周波数領域表現を示す。この実際の値「0.5」は、絶対に必要なものではない。0番目のビンが0.5とは、時間領域値の平均が0.5であり、これが1から0の平坦なクロスフェーディングに適用される。
最初の7個の周波数ビンは、このとき、対応する複素係数を有する。ここで、全ての他のより高次のビンは、0に等しい、またはほぼ重要性のない小さい値を示す。図7Aから7Fからの集合Rおよび値Iは、したがって、図6Aから6Fの時間領域に示された周波数窓関数の、スペクトル係数またはビンの、非零の実数部および虚数部の指標を表す。図7Eおよび7Fは、例えば、周波数関数の最初の3つのスペクトル係数の占有(図7E)、あるいは窓関数の最初の2つのスペクトル係数のみの占有にのみに関する。
複雑さの見積もり
この節では、示唆される周波数領域クロスフェーディングアルゴリズムの複雑さを、既知のフィルタ・クロスフェーディングの解決アプローチと比較する。周波数領域クロスフェーディング方法のためのフィルタ長N=512、ブロックサイズB=128および対応する標準DFTサイズL=256、M=8個の仮想音源、K=4個の非零係数のレンダリングシステムを、性能の評価のための基本とする。各パラメータを変化させ、その全体の複雑さへの影響を評価する。その結果を図8に示す。これは、個々のクロスフェードした信号の標本を計算するための乗算の数、すなわち、レンダリングシステム内の全体の演算数を音源数で割った値を示す。3つのアルゴリズム、(a)区分け畳み込みの後に時間領域クロスフェーディング、(b)各音源に対して別々に実行される示唆されるFDクロスフーディングアルゴリズム、および周波数領域で耳信号の合算、および(c)周波数領域での耳信号のFDクロスフーディングおよび合算、を考える。
図8Aは、フィルタ長Nの影響を示す。定ブロックサイズBに対して、複雑さは全てのアルゴリズで線形関数である。その理由は、Nが、ブロック畳み込みに起因する複雑さのみに影響する(非特許文献6)からであり、これは3つのアルゴリズムで同等である。それでもなお、示唆されるFDクロスフーディングアルゴリズムは、単一チャンネルの場合でさえ、時間領域解決アプローチに比較して、目に見える改善を示す。3番目のグラフに示すように、耳信号の周波数領域での合算は、複雑さにおいて、大幅な付加的削減結果、すなわち、N=512に対して標本当たりほぼ186からほぼ131という削減結果、をもたらす。
区分け畳み込みスキームのブロックサイズの影響を図8Bに示す。FDクロスフーディングがどの場合でも時間領域クロスフーディングより効率的である一方で、相対的利得は、ブロックサイズBの増加と共に増加する。これは、均一区分け畳み込みスキームの複雑さの特性に起因する。小さいブロックサイズに対して、複雑さは、ブロック畳み込みによるものが主となり(非特許文献6)、FTTおよびIFFT演算のコストは無視できる。IFFTの数の減少はFDクロスフェーディングの主な特徴であるので、その全ての効果は、十分に大きなブロックサイズに対してのみ目に見える。しかしながら、これは小さい欠点でしかない。その理由は、均一区分け畳み込みは、どのような場合でも、非常に小さいブロックサイズに対してより非効率になるからである(例えば非特許文献12、13)。拡大縮小の他の端で、ブロックサイズがフィルタ長(この例ではN=B=512)と等しい場合には、もっとも大きな改善が行われる。これは、非区分け高速畳み込みに対応する。したがって、オーバーラップ保存スキームに関連する示唆されるFDクロスフェーディングは、これにより生じる遅れ時間が許容できる場合に、有利に採用される。
複雑さのFD窓の粗占有への依存性、すなわち、周波数領域窓関数の値の非零の実数部および虚数部を図8Cに示す。時間領域クロスフェーディングに対して、性能の流れは一定で、そのような窓は使用されない。アルゴリズムのチャンネル毎の実装の場合、FDクロスフェーディングは、約7個までの非零成分に対して考えられる設定において、より効率的である。「周波数領域窓」の節で示したように、3から5値の窓は、通常、線形クロスフェーディングの非常に良い近似を可能としている。これは、これは、クロスフェーディングの正確さと複雑さとの実用上の妥協を許容し、多くの応用において、大きな加速となる。正確さまたは効率のさらに大きな増加は、耳信号の混合がまた周波数領域で実行される時にときに可能である。この場合、12係数までのFD窓において、FDクロスフェーディングが、時間領域の方法よりも効果がある。
図8Dは、再生された音響シーンのサイズ、すなわち音源の数の効果、の効果を全ての複雑さ上に示す。上述したうに、算術演算の計算された数は、計算された音源の数により正規化される。時間領域クロスフェーディングおよび単一チャンネルFDアルゴリズムに対して、複雑さはシーンサイズには依存しない。また、単一音源に対する多チャンネルFDアルゴリズムは、単一チャンネルFDクロスフェーディングと同一である。しかしながら、クロスフェードした音源信号の周波数領域での結合は、小さな、例えばM=2,…,8の音響シーンに対しても、効率の大幅な利益を得ることができる。より大きな音響シーンは単に、性能の小さな付加的利益があるだけである。この非対称制限は、全縦な複雑さにおいて、前方FFTおよびブロック畳み込み演算の影響によるものである。これは、逆FFT演算の数の削減によってはさらに削減することはできない。
実施形態は、周波数領域畳み込みとフィルタ済信号のクロスフェーディングとの組み合わせの効率的なアルゴリズムに関する。これは複数の周波数領域畳み込み技術特に、オーバーラップ保存および均一または不均一区分け畳み込み、に適用できる。また、これは、利得変化およびクロスフェーディングを含むフィルタ済オーディオ信号間の異なる種類の滑らかな遷移にも利用できる。例えば線形スィルタ遷移のような定利得クロスフェーディングは、動的両耳合成に通常必要とされ、複雑さにおいて、付加的な大きな削減を可能とする。新規なアルゴリズムは、少ない非零値のみからなる粗占有窓関数との周波数領域での巡回畳み込みに基づいている。さらに、そのような窓に対する柔軟な最適化を基礎とする設計方法を示す。設計例は、オーディオ応用において通常採用されるクロスフェーディングの振る舞いが、非常に粗に占有された窓関数により、非常に良く近似できることを確実にする。
示唆される実施形態は、2つの別々の畳み込みと時間領域クロスフェーディングに基づく従来の解決と比較して、性能の大幅な改善を示す。しかしながら、両耳応用のための周波数領域クロスフェーディングの可能性は、両耳再生システムの構造に統合される時にのみ使用される。この場合、新規なクロスフェーディンアルゴリズムは、周波数領域での処理の大きな部分の実行を可能とし、これにより、逆変換の数を大幅に削減できる。両耳合成のためのこの解決アプローチの利点を示した。この応用では、幾つかの音源の信号の周波数領域での混合の能力が、複雑さの大幅な削減を可能とする。それでもなお、示唆されるアルゴリズムは、両耳合成に限定されず、たぶん、高速畳み込みとオーディオ信号の時間的に変化する混合、特にマルチチャンネル応用との双方の技術を使用する他の利用目的にも適用できる。
本発明の他の実施形態を以下に示す。一般に、本発明の実施形態は、以下の点に関する。
(フィルタ済)信号y[n]の緩やかなフェードインまたはフェードアウトは、一般に、時間領域窓関数w[n]による信号の乗算として内挿される。
2つのフィルタ済信号(y[n]およびy[n])の間のクロスフェーディングは、したがって、信号への窓関数w[n]およびw[n]の乗算と、それに続く合算
Figure 2017513052
により表現される。
特別な種類のクロスフェーディングは、いわゆる定利得クロスフェーディングであり、各nに対する窓関数w[n]およびw[n]の和が1の値を有する。このタイプのクロスフェーディングは、多くの適用、特に混合すべき信号(またはフィルタ)が強く相関する場合に実用的である。この場合に、クロスフェーディングは、個々の窓関数w[n],w1[n]=w[n],w2[n]=1−w[n]により表現され、クロスフェード(1)は以下のように表現される。
Figure 2017513052
この方法の目的は、クロスフェーディングを周波数領域で直接に実行することであり、これにより、2つの完全な高速畳み込みを実行する時に結果として生じる複雑性を削減すことである。より正確には、これは、フィルタ済み信号を周波数領域でクロスフェードするとき、2つの逆FFTが必要なのではなく1つだけで良いことを意味する。
周波数領域でクロスフェードを引き出すため、個々の信号x[n]の時間領域窓関数w[n]による乗算だけが考慮される
Figure 2017513052
式(44)および(46)に対応するクロスフェードの拡張は、核心アルゴリズムを述べた後に、簡単に行われる(さらなる追加の性能利益を許す)。
周波数領域の要素毎の乗算、式(47)は、周波数領域での巡回(周期)畳み込みに相当する。
Figure 2017513052
ここで、DFT{}は離散フーリエ変換を示し、丸に*の演算子は、2つの有限な、すなわち通常は長さをLとする複素シーケンスの、巡回畳み込みを示す。
巡回畳み込みによる周波数領域での巡回畳み込みによるクロスフェーディングは、オーバーラップ保存、区分けおよび非均一区分け畳み込みのような、高速畳み込みアルゴリズムに集約することができる。したがって、これらの方法、例えばインパルス応答セグメントの零詰めおよび時間領域に再変換された信号の一部の廃棄(時間領域信号の巡回過畳み込み、時間領域のエイリアシングの防止)の特殊性をそれに応じて考慮すべきである。ここで、クロスフェーディングの長さは、畳み込みアルゴリズムまたはその乗算のブロックサイズであると判定される。
式(48)の畳み込みは、典型的に、式(47)の時間領域に置けるクロスフェーディングのより大幅に複雑である(複雑さ0(L))。したがって、周波数領域のシフトは、一般に、複雑さの顕著な増加を意味する。その理由は、付加的複雑さ0(L)が、FFT 0(LlogL)の節約による削減を大幅に超過するからである。加えて、式(44)の周波数領域対応での重み付け合算のような演算は、シーケンスが複素数値であるため、より費用がかかる。
実施形態は、非零係数のほとんど無い周波数領域窓関数W[k]を見つけている。非常に粗に占有された窓関数を用いて、周波数領域での巡回畳み込みは、付加的逆FFTの後に時間領域でクロスフェーディングを行うより大幅に効率的になる。
それを用いることにより、少数の係数を用いて、所望のクロスフェード特性の非常に良い近似が可能な、窓関数があることを示す。
最適な方法を導入し、その方法を用いて、最適な周波数領域窓W[k]が、所望の時間領域窓関数w^[n]と、周波数領域窓関数の実数および虚数の係数が零と異なるという必須事項とを見つける。
この最適化を用いて、オーバーラップ保存アルゴリズムの特性、およびそれに基づく均一および不均一区分け畳み込みアルゴリズムを、実用的な方法で、使用することができる。最後のB個の標本が、逆離散フーリエ変換w[n]
Figure 2017513052
で使用される。ここで、Bは、ブロックサイズすなわち区分け畳み込みアルゴリズムのブロック供給(B<L)である。再変換出力信号の最初のL−B個の値と、w[n]の最初のL−B個の値の乗算効果とが、畳み込みアルゴリズムによる時間領域のエイリアシングを防止するために、廃棄される。したがって、窓関数w[0]…w[L−B]は、クロスフェード結果を切り替えることなく、どのような値でもとることができる。この付加的な自由度は、少数の非零係数を用いる周波数領域窓W[k]の設計時に、大幅な利点をもたらす。
W[k]の設計および巡回畳み込みの周波数領域での効率的実装のとき、周波数領域窓の
対称共役構造を実用的に使用することができる。したがって、実用的には、W[k]の実部と虚部とを分離して考える。
このような周波数領域窓の別の設計を提示する(2、3および4個の非零係数を用いる他のもののなかで)。この設計は、純実数および純虚数係数の特定の、特別に選択された分布を含む。この発見は、厳密にいうと、ここで提供される窓設計(すなわち、例えば、所定の値LおよびBで、かつ設計されたクロスフェードの形態に対して)を適用したときのみ得られた。しかしながら、基調となる原則、例えば実および虚の非零部の有利な分布は、BおよびLの他の値にも適用できる。
実数および虚数の非零成分の分布は、高い特徴である。例えば図7Gの3番目の設計(8個の非零係数、指標集合R={0,1,3,5,7},I={2,4,6})に使用されるような分布が付加的の実験で見出され、実施形態の他のパラメータの組み合わせに対しても最適化できる。これは、周波数領域窓関数に対する特別の適切な設定は、指標0および全ての奇数指標を有する係数が純実数であり、偶数指標(2は始まる)を有する係数が純虚数であるというものであることを意味する。
2つの非零係数を有する窓関数(図7Gの最後の例,図6F)は、2つのフィルタまたは信号の間の滑らかな遷移を許容し、定利得クロスフェーディングのために使用できる。この窓関数み、余弦タイプの半側窓(例えばハン、またはハミング窓)を有する時間領域窓に相当する。この窓関数は、線形クロスフェードから比較的強く逸脱するが、比較的小さなフィルタの間のクリックのないクロスフェーディングだけが必要な多くの応用にすでに適用できる。
効率的な実装および異なる最適化は、粗占有共役対称窓関数W[k]を用いた巡回畳み込みの実装のために提示される(ここで考慮したように)。したがって、実および虚非零部の別々の考慮が性能利益を提供することが明らかになる。
定利得クロスフェードを実現するため、さらに最適化された計算ルールが導入される。
説明した発明は、幾つかの入力および出力を有するシステムを考慮するとき、さらに大幅に大きな性能利益を許容する。この場合、周波数領域でのクロスフェーディング(または使用される高速畳み込みアルゴリズムよりあらかじめ定められる信号表現)の実装により、全体の掲載のより大きな部分が周波数領域で行うことができ、これにより、全体の効率が大幅に増加する。
説明した本発明の効果は、計算の複雑さを削減であることである。したがって、クロスフェーディングの理想的なあらかじめ定められた形態に比較して、ある派生(これはしかし、その影響は非常に小さく、通常はそれが維持される)が許容できる。
効率のこの増加とは別に、このコンセプトは、クロスフェーディングの機能性を直接に周波数領域に統合できる。上述のように、クロスフェーディングを要素として使用するより大きな信号処理アルゴリズムを再構築し、効率を向上させることができる。全信号処理のより大きな部分が、例えば、周波数領域表現で実行され、これにより、信号を変換(例えば時間領域への再変換)するための複雑さを大幅に削減する。
一般に、実施形態は、ある最小長のフィルタを有するFIR畳み込みを必要とし(約16から50個の係数から始まるハードウェアに依存して)、このフィルタ係数が、フィルタ係数が実時間のどのような信号処理アーチファクトも無しに交換される、多くの応用において使用できる。
オーディオ分野での2つの分野の応用が特に重要であるとみなされる。
両耳合成
音響シーンをヘッドホンを介して再生する場合、音響オブジェクトの信号は、両耳の頭部伝達関数(HRTF)によりフィルタされ、ヘッドホンで再生される信号は、対応する成分信号の合算により形成される。HRTFは音源と聴者との相対的位置に依存し、このため、移動する音源または頭の移動に伴って交換される。フィルタ・クロスフェーディングの要求は、例えば非特許文献5、14に公知である。
ビーム形成のための可変ディジタル・フィルタ・カーネル
実時間で制御可能な直接パターンを用いるビーム形成応用(ラウドスピーカ用およびマイクロホンアレイ用の双方)は、可変ディジタル・フィルタ構造を必要とし、これを用いてアレイ処理き特性を連続的に調整できる。これにより、パターンの変化がどのような干渉(例えばクリックアーチファクト、過渡)も生じないことを確実にする。高速畳み込みにより可変フィルタを実装する場合に、ここで記載した本発明は、有利な方法で適用される。
特に、この実装において、周波数領域信号はオーディオ信号である。第1のフィルタ特性は、音響変換器配列内のある音響変換器(マイクロホンまたはラウドスピーカ)用のフィルタ用である。これは、第1の時点における所望の第1の方向性パターンを、第2の変換器配列の他の音響変換器と組み合わせて形成するのに適している。第2のフィルタ特性は、音響変換器配列内の他の音響変換器(マイクロホンまたはラウドスピーカ)用のフィルタを記載する。これは、第2の時点における所望の第2の方向性パターンを、変換器配列の他の音響変換器と組み合わせて、周波数領域窓関数を使用して方向パターンが時間的に変化するように、形成するのに適している。
他の応用は、幾つかのオーディオ信号の使用に関し、そのフィルタされクロスフェードした周波数領域表現は、逆フーリエ変換の前に結合される。これは、異なる信号を有する幾つかのオーディオビームを、ラウドスピーカを介して同時に放射すること、あるいは1つのマイクロホン配列内の個々のマイクロホン信号の合算に関連する。
以上説明した本発明は、幾つかの入力および出力を有するシステム(マルチ入力、マルチ出力、MIMO)で、例えば、幾つかのクロスフェードが同時に行われる、あるいは幾つかのクロスフェードした信号が組み合わされてさらに処理されル時に、特に便利に適用できる。この場合、全ての計算(または、使用されたオーバーラップ保存または区分け畳み込みアルゴリズムによりあらかじめ定られた信号表現)の大部分を周波数領域で実行することか可能である。合算、信号の混合その他のさらなる演算の推移により、時間領域への再変換のための複雑さ大きく削減され、これにより、全体としての効率はしばしば、著しく改善される。そのようなシステムの例は、上述したように、複雑なオーディオシーンのための両耳レンダリング、あるいは、異なる信号パターンおよび変換器(マイクロホンまたはラウドスピーカ)のための信号を変化するフィルタでフィルタリングして互いに組み合わせるビーム形成応用、である。
幾つかの側面を装置の観点から説明したが、これらの側面は対応する方法の記述により、装置のブロックまたは要素が対応する方法ステップまたは方法ステップの特徴に対応するように表現できる。同様に、ここで方法ステップで説明した側面はまた、対応する装置の対応するブロックまたは詳細または特徴の記述で表現することができる。全ての方法ステップの一部または全てが、マイクロプロセッサ、プログラム可能コンピュータまたは電子回路などのハードウェア装置により(またはそのような装置を用いて)実行できる。幾つかの実施形態では、最も重要な方法ステップの幾らかを、そのような装置で実行することができる。
実装要求により、本発明の実施形態は、ハードウェアまたはソフトウェアにより実装される。実装は、ディジタル記憶メディアを用いることにより実行され、例えば、フレキシブルディスク、DVD,ブルーレイディスク(登録商標),CD,ROM,PROM,EPROM,EEPROM(登録商標)またはFLASHメモリ,ハードドライブ、または他の、プログラム可能なコンピュータシステムと協調する、または協調動作可能で、各方法を実行する制御信号を蓄えることができる、電子的に読み出し可能な、磁気または光学メモリを用いて実行される。したがって、ディジタル蓄積メディアは、コンピュータ読み取り可能である。
本発明による幾つかの実施形態は、電子的に読み取り可能な制御信号を含むデータ担体を含み、このデータ担体は、プログラム可能なコンピュータシステムと協調して、ここで説明した方法の1つを実行することができる。
一般に、本発明の実施形態は、プログラムコードを有するプログラム製品として実装され、このプログラムコードは、コンピュータ上でこのプログラムコードを実行するとき、この方法の1つを実行するように動作する。
一般に、本発明の実施形態は、プログラムコードを有するプログラム製品として実装され、このプログラムコードは、コンピュータ上でこのプログラムコードを実行するとき、この方法の1つを実行するように動作する。
他の実施形態は、ここで説明した方法の1つを実行するためのコンピュータプログラムを含む。このコンピュータプログラムは、機械読み取り可能担体に蓄積される。言い換えると、本発明の方法の実施形態は、したがって、このコンピュータプログラムをコンピュータ上で実行させたときに、ここで説明した方法の1つ実行するためのプログラムコードを含む。
本発明方法のさらなる実施形態は、したがって、データ担体(すなわちディジタル記憶媒体あるいはコンピュータ読み取り可能な媒体)であり、そこに記録された、ここで説明した方法のひとつを実行するためのコンピュータプログラムを含む。
本発明方法のさらなる実施形態は、したがって、ここで説明した方法のひとつを実行するためのコンピュータプログラムを表現するデータストリームまたは信号シーケンスである。このデータストリームまたは信号シーケンスは、例えば、インターネットのようなデータ通信接続を介して伝送されるように構成される。
さらなる実施形態は、ここで説明した方法の実行に適するように構成された処理手段、例えばコンピュータあるいはプログラマブル論理素子を備える。
さらなる実施形態は、ここで説明した方法のひとつを実行するコンピュータプログラムがインストールされているコンピュータを備える。
本発明のさらなる実施形態は、ここで説明した方法の少なくともひとつを実行するコンピュータプログラムを伝送する構成の装置またはシステムを備える。この伝送は、電気的または光学的に行われる。受信機は、例えば、コンピュータ、携帯装置、メモリ装置などで良い。装置またはシステムは、例えば、コンピュータプログラムを受信機に送信するファイルサーバを備える。
幾つかの実施形態において、プログラマブル論理装置(例えばフィールドプログラマブル・ゲートアレイ、EPGA)を使用して、ここで説明した方法の一部または全ての機能を実行することができる。幾つかの実施形態では、フィールドプログラマブル・ゲートアレイは、ここで説明した方法のひとつを実行するため、マイクロプロセッサと協働することができる。一般に、幾つかの実施形態では、方法は何らかのハードウェア装置で実行されることが好ましい。これは、コンピュータプロセッサ(CPU)のような汎用ハードウェアでも良く、ASICのようなこの方法に特化したハードウェアでも良い。
上述の実施形態は、単に、本発明の基本を示したものである。ここで詳細に説明した構成の修正または変更は、他の当業者には容易である。したがって、本発明は、添付の特許請求の範囲によってのみ限定されることを意図しており、ここで示した実施形態の記述および説明によって示された特性の詳細により限定されることを意図したものではない。

Claims (24)

  1. 離散時間信号を処理する装置であって、
    離散周波数領域表示で存在する信号を、フィルタ済信号(123)を得るためのフィルタ特性を有するフィルタ(122)によりフィルタリングし、得られたフィルタ済信号(123)またはそのフィルタ済信号から導出された信号(302)に、窓処理済信号を得るための周波数領域窓関数(124,124a,124b,124c)を提供して、前記周波数領域窓関数の周波数領域窓係数に、前記フィルタ済信号(123)または前記フィルタ済信号から導出された信号(302)のスペクトル値を乗算し、得られた乗算結果を合算するプロセッサ段(120)と、
    処理済信号を得るために、前記窓処理済信号(125)または前記窓処理済信号を用いて定義される信号を時間領域に変換する変換器(130)と
    を備える離散時間信号処理装置。
  2. 請求項1に記載の装置において、
    前記プロセッサ段はさらに、周波数領域に存在する信号を、追加的フィルタ済信号を得るための追加的フィルタ特性を有する追加的フィルタ(122b)によりフィルタリングし、前記追加的フィルタ済信号に、追加的窓処理済信号を得るために追加的周波数領域窓関数を提供し、前記窓処理済信号と前記追加的窓処理済信号とを組み合わせる(200)構成である
    装置。
  3. 請求項1に記載の装置において、
    前記プロセッサ段(120)は、
    周波数領域表示で存在する信号を、追加的フィルタ特性を有する追加的フィルタ(122b)によりフィルタリングし、
    前記フィルタ済信号および前記追加フィルタ済信号から組み合わせ信号(302)を形成(300)し、
    この組み合わせ信号に、窓処理済組み合わせ信号を得るために前記周波数領域窓関数(124c)を提供し、
    前記窓処理済組み合わせ信号に前記フィルタ済信号または前記追加的フィルタ済信号を組み合わせる(200)
    構成である
    装置。
  4. 請求項1から3のいずか1項に記載の装置において、
    前記時間領域信号は、オーディオ信号であり、前記周波数領域に存在する信号は、周波数領域に変換されたオーディオ信号である
    装置。
  5. 請求項1から4のいずか1項に記載の装置において、
    前記フィルタは、第1の時点で要求フィルタ特性を有し、前記追加的フィルタは、時間的に後の第2の時点で要求フィルタ特性を有し、
    前記第1周波数領域窓関数は、時間領域におけるフェードアウト関数に近似しており、前記第2周波数窓関数は、時間領域におけるフェードイン関数に近似している
    装置。
  6. 請求項1から5のいずれか1項に記載の装置において、前記周波数領域窓関数または前記追加的周波数領域窓関数は、高々15または高々8個の非零係数を有する装置。
  7. 請求項1から6のいずれか1項に記載の装置において、
    前記プロセッサ段(120)は、非零周波数領域窓関数係数の最大の数を使用する構成であり、
    等しい部分の指標に関連する偶数指標の周波数領域窓関数係数は純粋に虚数であり、
    等しい部分の指標に関連する奇数指標の周波数領域窓関数係数は純粋に実数である
    装置。
  8. 請求項1から7のいずれか1項に記載の装置において、前記プロセッサ段(120)は
    Figure 2017513052
    を用いて周波数領域窓関数の提供を実行するように構成され、
    ここで、Y(l)[k]は、
    Figure 2017513052
    により計算され、
    ここで、kは周波数指標、lは整数指標、Cは指標の集合であり、指標lは、Iが非零のときには集合Cに含まれ、周波数窓関数W[l]の係数は非零であり、W[l]は周波数領域窓関数の係数の実部であり、W[l]は周波数領域窓関数の係数の虚部であり、X[k,l]およびX[k,l]は、
    Figure 2017513052
    により計算され、
    ここで、((k))はK mod Lであり、LはFFTブロックの長さであり、X[k]は周波数領域で表現される信号のスペクトル係数である
    装置。
  9. 請求項8に記載の装置において、
    前記窓関数W[l]の値が実数の場合、Y(l)[k]は、
    Figure 2017513052
    のルールに従って計算され、
    前記窓関数W[l]の値が純虚数の場合、Y(l)[k]は、
    Figure 2017513052
    のルールに従って計算される
    装置。
  10. 請求項1から9のいずれか1項に記載の装置において、
    前記フィルタ特性または前記追加的フィルタ特性は異なる位置に対するHRTFフィルタであり、周波数領域表現で提供される前記信号は、異なる位置の音源に対するオーディオ信号である
    装置。
  11. 請求項1から10のいずれか1項に記載の装置において、
    前記信号をオーバーラップ加算、オーバーラップ保存または区分け畳み込みアルゴリズムでの使用に適した周波数領域表現に変換する変換器(110)をさらに備え、
    前記窓処理済信号または前記窓処理済信号を用いて決定された信号を周波数領域に変換する前記変換器(130)は、オーバーラップ加算アルゴリズム、オーバーラップ保存アルゴリズム、または区分け畳み込みアルゴリズムを用いて演算する構成である
    装置。
  12. 請求項1から11のいずれか1項に記載の装置において、
    前記時間領域信号は第1の音源を表現し、
    前記追加的時間領域信号は第2の音源を表現し、
    前記第1の音源用の前記フィルタは第1の特性を実現し、前記第1の音源用の前記追加的スフィルタは、第2の特性を実現し、
    前記プロセッサ段(120)は、前記第2の音源に対して第3のフィルタ(614)および第4のフィルタ(615)を用いて演算するように付加的に構成され、前記第3のフィルタは第2の音源の第1の時点における第1の特性を表現する第3のフィルタ特性を有し、前記第4のフィルタ(615)は第2の音源の第2の時点における第2の特性に相当する第4のフィルタ特性を有し、
    前記プロセッサ段はさらに、追加的周波数領域窓関数(621)を用いて第2の窓処理済信号を決定し、第3の周波数領域窓関数(622)を用いて第3の窓処理済信号を決定し、第4の周波数領域窓関数(623)を用いて第4の窓処理済信号を決定するため、前記第1の窓処理済信号を前記周波数領域窓関数(620)を用いて計算する構成であり、
    組み合わせ信号を得るため前記窓処理信号を組み合わせ(626,627,629)@
    前記変換器(630)は、前記組み合わせ信号を時間領域に変換する構成である
    装置。
  13. 請求項12に記載の装置において、前記第1の音源の前記第1の時点における前記第1の特性は第1の位置であり、前記第1の音源の前記第2の時点における前記第2の特性は異なる第2の位置であり、前記第2の音源の前記第1の時点における前記第1の特性は第1の位置であり、前記第2の音源の前記第2の時点における前記第2の特性は異なる第2の位置である装置。
  14. 請求項1から13のいずれか1項に記載の装置において、前記プロセッサ段(120)は、前記周波数領域窓関数として、時間領域でフェードアウト関数(w(1))となる関数を使用し、前記追加的周波数領域窓関数として、時間領域でフェードイン関数(w(2))となる関数を使用する構成である装置。
  15. 請求項14に記載の装置において、前記プロセッサ段(120)は、前記周波数領域窓関数および前記追加的周波数領域窓関数を使用して、少なくとも定利得特性を近似し、各離散時間点における前記第1および第2の窓関数の和が1または少なくとも1の近似となる構成である装置。
  16. 請求項3に記載の装置において、
    前記プロセッサ段(120)は、前記窓処理済信号と前記追加的窓処理済信号との差を前記組み合わせ信号として形成し、前記窓処理済組み合わせ信号を前記追加的フィルタ済信号に組み合わせる(200)構成であり、
    前記変換器(130)は、前記組み合わせ信号または前記組み合わせ信号に加えて追加的信号を含む信号を時間領域に変換する構成である
    装置。
  17. 請求項1から16のいずれか1項に記載の装置において、前記プロセッサ段(120)は、前記周波数領域フィルタ特性、前記追加的周波数領域フィルタ特性、またはさらに別の周波数領域フィルタ特性として、時間領域のフェードイン関数、フェードアウト関数またはクロスフェーディング関数、あるいは利得変更関数を表現する特性を用いる構成である装置。
  18. 請求項1から17のいずれか1項に記載の装置において、前記変換器(130)は、離散した値の一部のみを使用し、他の部分を廃棄する構成であり、廃棄される部分はL−Bの離散した値を含み、Lは離散フーリエ変換の離散した値の全体数であり、Bはブロックサイズまたは区分け畳み込みアルゴリズムのブロックフィードであり、前記周波数領域フィルタ特性、追加的周波数領域フィルタ特性、あるいはさらに追加的な周波数領域フィルタ特性の時間長は、ブロックサイズまたはブロックサイズの倍数に等しい、装置。
  19. 請求項1から18のいずれか1項に記載の装置において、
    周波数波数領域に存在する前記信号は、第1の時点において第1の位置にあり、第2の時点において第2の位置(500)にある音源のオーディオ信号であり、
    追加的周波数領域信号が、第1の時点において第1の位置にあり、第2の時点において第2の位置にある追加的音源(602)のオーディオ信号であり、
    前記プロセッサ段(120)は、各オーディ信号に対して第1のフィルタ特性および第2のフィルタ特性を使用する構成であって、前記第1のフィルタ特性は前記第1の位置に対するHRTF関数であり、前記第2のフィルタ特性は前記第2の位置に対するHRTF関数であり、
    前記プロセッサ段(120)は、各オーディオ信号に対して、2つの周波数領域窓関数(620,621または622,623)または単一の周波数領域窓関数(124c)を使用する構成であり、
    前記プロセッサ段(120)は、付加的に、信号を周波数領域で組み合わせる(626,627,628,629)構成であり、
    前記変換器(130,630)は、イヤホン信号(713)を得るため、組み合わせられた信号を時間領域に変換する構成である
    装置。
  20. 請求項1から8、10から17のいずれか1項に記載の装置において、前記周波数領域信号はオーディオ信号であり、前記第1のフィルタ特性は、音響変換配列内の、前記音響変換器配列内の他の音響変換器との組み合わせにより第1の時点における所望の第1の方向性パターンを実現するのに適したひとつの音響変換器(マイクロホンまたはラウドスピーカ)のためのフィルタの特性であり、前記第2のフィルタ特性は、音響変換配列内の、前記音響変換器配列内の他の音響変換器との組み合わせにより第1の時点における所望の第2の方向性パターンを、その方向性パターンが、周波数領域窓関数、前記追加的周波数領域窓関数を用いるクロスフェーディングにより、時間的に変化するように実現するのに適したひとつの音響変換器(マイクロホンまたはラウドスピーカ)のためのフィルタの特性である、装置。
  21. 請求項1から19のいずれか1項に記載の装置において、
    前記周波数領域窓は時間的に増加または時間的に減少する利得関数を含み、
    前記プロセッサ段は、前記窓処理された信号と前記フィルタ済信号とを結合器により結合する構成であり、
    前記結合器は、
    前記窓処理済信号に第1の値(e−s)を乗算する第1の乗算器(503)と、
    前記フィルタ済信号に第2の値(s)を乗算する第2の乗算器(504)と、
    前記乗算器の出力信号を加算する加算器(500)と
    を有する、
    装置。
  22. 請求項20に記載の装置において、前記第1の値は、信号ブロックの開始時における前記周波数領域窓関数の利得値と、前記信号ブロックの終了時における前記周波数領域窓関数の利得値との差であり、前記第2の値は、前記信号ブロックの前記開始時における前記周波数領域窓関数の前記利得値である、装置。
  23. 離散時間信号を処理する方法であって、
    離散周波数領域表示で存在する信号を、フィルタ済信号(123)を得るためのフィルタ特性を有するフィルタ(122)によりフィルタリングし、
    得られたフィルタ済信号(123)またはそのフィルタ済信号から導出された信号(302)に、窓処理済信号を得るための周波数領域窓関数(124,124a,124b,124c)を提供して、前記周波数領域窓関数の周波数領域窓係数に、前記フィルタ済信号(123)または前記フィルタ済信号から導出された信号(302)のスペクトル値を乗算し、得られた乗算結果を合算し、
    処理済信号を得るために、前記窓処理済信号(125)または前記窓処理済信号を用いて定義される信号を時間領域に変換する(130)
    離散時間信号処理方法。
  24. コンピュータまたはプロセッサ上で実行させたときに請求項22に記載の方法を実行するためのプログラムコードを含むコンピュータプログラム。
JP2016557289A 2014-03-14 2015-03-11 周波数領域で信号を処理する装置および方法 Expired - Fee Related JP6423446B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
EP14159922 2014-03-14
EP14159922.5 2014-03-14
DE102014214143.5A DE102014214143B4 (de) 2014-03-14 2014-07-21 Vorrichtung und Verfahren zum Verarbeiten eines Signals im Frequenzbereich
DE102014214143.5 2014-07-21
PCT/EP2015/055094 WO2015135999A1 (de) 2014-03-14 2015-03-11 Vorrichtung und verfahren zum verarbeiten eines signals im frequenzbereich

Publications (2)

Publication Number Publication Date
JP2017513052A true JP2017513052A (ja) 2017-05-25
JP6423446B2 JP6423446B2 (ja) 2018-11-14

Family

ID=54010249

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016557289A Expired - Fee Related JP6423446B2 (ja) 2014-03-14 2015-03-11 周波数領域で信号を処理する装置および方法

Country Status (7)

Country Link
US (2) US10187741B2 (ja)
EP (1) EP3117631B1 (ja)
JP (1) JP6423446B2 (ja)
CN (1) CN106465033B (ja)
DE (1) DE102014214143B4 (ja)
HK (1) HK1232367A1 (ja)
WO (1) WO2015135999A1 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019097047A (ja) * 2017-11-24 2019-06-20 沖電気工業株式会社 フィルタリング装置及びフィルタリング装置のテーブル作成方法
WO2022130917A1 (ja) * 2020-12-14 2022-06-23 国立大学法人東海国立大学機構 信号較正装置、信号較正方法およびプログラム
JP7461020B2 (ja) 2020-02-17 2024-04-03 株式会社オーディオテクニカ 音声信号処理装置、音声信号処理システム、音声信号処理方法、およびプログラム

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10805757B2 (en) 2015-12-31 2020-10-13 Creative Technology Ltd Method for generating a customized/personalized head related transfer function
SG10201800147XA (en) 2018-01-05 2019-08-27 Creative Tech Ltd A system and a processing method for customizing audio experience
SG10201510822YA (en) 2015-12-31 2017-07-28 Creative Tech Ltd A method for generating a customized/personalized head related transfer function
US10224058B2 (en) 2016-09-07 2019-03-05 Google Llc Enhanced multi-channel acoustic models
WO2019079323A1 (en) * 2017-10-17 2019-04-25 California Institute Of Technology UNDERGROUND IMAGING OF DIELECTRIC STRUCTURES AND EMPTYES BY NARROW-BAND ELECTROMAGNETIC RESONANT DIFFUSION
US11049507B2 (en) 2017-10-25 2021-06-29 Gracenote, Inc. Methods, apparatus, and articles of manufacture to identify sources of network streaming services
US10629213B2 (en) 2017-10-25 2020-04-21 The Nielsen Company (Us), Llc Methods and apparatus to perform windowed sliding transforms
US10726852B2 (en) * 2018-02-19 2020-07-28 The Nielsen Company (Us), Llc Methods and apparatus to perform windowed sliding transforms
US10733998B2 (en) 2017-10-25 2020-08-04 The Nielsen Company (Us), Llc Methods, apparatus and articles of manufacture to identify sources of network streaming services
US10390171B2 (en) 2018-01-07 2019-08-20 Creative Technology Ltd Method for generating customized spatial audio with head tracking
EP3783912B1 (en) 2018-04-17 2023-08-23 The University of Electro-Communications Mixing device, mixing method, and mixing program
US11222649B2 (en) 2018-04-19 2022-01-11 The University Of Electro-Communications Mixing apparatus, mixing method, and non-transitory computer-readable recording medium
US11516581B2 (en) 2018-04-19 2022-11-29 The University Of Electro-Communications Information processing device, mixing device using the same, and latency reduction method
US11418903B2 (en) 2018-12-07 2022-08-16 Creative Technology Ltd Spatial repositioning of multiple audio streams
US10966046B2 (en) * 2018-12-07 2021-03-30 Creative Technology Ltd Spatial repositioning of multiple audio streams
CN110611522B (zh) * 2019-09-20 2021-05-04 广东石油化工学院 一种利用多正则优化理论的plc信号重构方法和系统
JP7147804B2 (ja) * 2020-03-25 2022-10-05 カシオ計算機株式会社 効果付与装置、方法、およびプログラム
CN113300992B (zh) * 2021-05-25 2023-01-10 Oppo广东移动通信有限公司 电子设备的滤波方法、滤波装置、存储介质及电子设备
CN113659962A (zh) * 2021-08-03 2021-11-16 青岛迈金智能科技有限公司 一种盘爪踏频计及用于盘爪踏频计的参数优化方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6895095B1 (en) * 1998-04-03 2005-05-17 Daimlerchrysler Ag Method of eliminating interference in a microphone
JP2009533910A (ja) * 2006-04-12 2009-09-17 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ アンビエンス信号を生成するための装置および方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3805929B2 (ja) * 1999-07-05 2006-08-09 パイオニア株式会社 情報記録装置及び情報記録方法
ATE352124T1 (de) * 2000-08-21 2007-02-15 Koninkl Philips Electronics Nv Adaptives frequency domain filter mit partitionierten blöcken
JP4199144B2 (ja) * 2004-03-11 2008-12-17 株式会社東芝 ウェイト関数生成装置、参照信号生成装置、送信信号生成装置、信号処理装置及びアンテナ装置
US8036903B2 (en) * 2006-10-18 2011-10-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Analysis filterbank, synthesis filterbank, encoder, de-coder, mixer and conferencing system
CA2727415A1 (en) * 2008-06-10 2009-12-17 Uti Limited Partnership Signal processing with fast s-transforms
US20130332498A1 (en) * 2012-05-21 2013-12-12 Stmicroelectronics, Inc. Method and apparatus for efficient frequency-domain implementation of time-varying filters

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6895095B1 (en) * 1998-04-03 2005-05-17 Daimlerchrysler Ag Method of eliminating interference in a microphone
JP2009533910A (ja) * 2006-04-12 2009-09-17 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ アンビエンス信号を生成するための装置および方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
CHRISTOS, TSAKOSTAS ET AL.: "Real-Time Spatial Representation of Moving Sound Sources", CONVENTION PAPER OF 123RD AES CONVENTION 123, JPN7017004053, 1 October 2007 (2007-10-01) *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019097047A (ja) * 2017-11-24 2019-06-20 沖電気工業株式会社 フィルタリング装置及びフィルタリング装置のテーブル作成方法
JP7461020B2 (ja) 2020-02-17 2024-04-03 株式会社オーディオテクニカ 音声信号処理装置、音声信号処理システム、音声信号処理方法、およびプログラム
WO2022130917A1 (ja) * 2020-12-14 2022-06-23 国立大学法人東海国立大学機構 信号較正装置、信号較正方法およびプログラム

Also Published As

Publication number Publication date
EP3117631B1 (de) 2020-06-03
JP6423446B2 (ja) 2018-11-14
CN106465033B (zh) 2020-11-06
CN106465033A (zh) 2017-02-22
HK1232367A1 (zh) 2018-01-05
US20170048641A1 (en) 2017-02-16
US10187741B2 (en) 2019-01-22
DE102014214143B4 (de) 2015-12-31
DE102014214143A1 (de) 2015-09-17
WO2015135999A1 (de) 2015-09-17
EP3117631A1 (de) 2017-01-18
US10257640B2 (en) 2019-04-09
US20180199145A1 (en) 2018-07-12

Similar Documents

Publication Publication Date Title
JP6423446B2 (ja) 周波数領域で信号を処理する装置および方法
JP5453222B2 (ja) 複素変調フィルタバンクを用いた効率的なフィルタリング
US20180048975A1 (en) Audio signal processing method and apparatus
JP6254142B2 (ja) 周波数ドメインにおける遅延を使用しながら複数のラウドスピーカのためのラウドスピーカ信号を計算する装置及び方法
WO2007110103A1 (en) Generation of spatial downmixes from parametric representations of multi channel signals
US9264838B2 (en) System and method for variable decorrelation of audio signals
US10593338B2 (en) Enhancement of spatial audio signals by modulated decorrelation
JP5908168B2 (ja) 低レイテンシーかつ低複雑さの位相シフト・ネットワーク
KR101637407B1 (ko) 부가적인 출력 채널들을 제공하기 위하여 스테레오 출력 신호를 발생시키기 위한 장치와 방법 및 컴퓨터 프로그램
JP2018537054A (ja) 多重空間位置におけるオーディオチャネル間の位相差の低減
JP7447798B2 (ja) 信号処理装置および方法、並びにプログラム
KR102156650B1 (ko) 복잡도 관점에서 최적화된 공간 효과를 갖는 사운드 공간화
Franck Efficient frequency-domain filter crossfading for fast convolution with application to binaural synthesis
KR20090033720A (ko) 메모리 관리 방법, 및 멀티 채널 데이터의 복호화 방법 및장치
JP6630599B2 (ja) アップミックス装置及びプログラム

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20171116

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20171212

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20180312

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180511

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180918

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20181018

R150 Certificate of patent or registration of utility model

Ref document number: 6423446

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees