JP2023506240A - 仮想音源と関連付けられた音声信号を発生させること - Google Patents

仮想音源と関連付けられた音声信号を発生させること Download PDF

Info

Publication number
JP2023506240A
JP2023506240A JP2022536511A JP2022536511A JP2023506240A JP 2023506240 A JP2023506240 A JP 2023506240A JP 2022536511 A JP2022536511 A JP 2022536511A JP 2022536511 A JP2022536511 A JP 2022536511A JP 2023506240 A JP2023506240 A JP 2023506240A
Authority
JP
Japan
Prior art keywords
audio signal
signal
modified
sound source
virtual
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2022536511A
Other languages
English (en)
Inventor
パウルス・オーメン
Original Assignee
リキッド・オキシゲン・(エルオーイクス)・ベー・フェー
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from NL2024434A external-priority patent/NL2024434B1/en
Application filed by リキッド・オキシゲン・(エルオーイクス)・ベー・フェー filed Critical リキッド・オキシゲン・(エルオーイクス)・ベー・フェー
Publication of JP2023506240A publication Critical patent/JP2023506240A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/302Electronic adaptation of stereophonic sound system to listener position or orientation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10KSOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
    • G10K15/00Acoustics not otherwise provided for
    • G10K15/08Arrangements for producing a reverberation or echo sound
    • G10K15/12Arrangements for producing a reverberation or echo sound using electronic time-delay networks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S5/00Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation 
    • H04S5/005Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation  of the pseudo five- or more-channel type, e.g. virtual surround
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/11Positioning of individual sound objects, e.g. moving airplane, within a sound field

Abstract

仮想音源と関連付けられた音声信号を発生させるための方法が開示される。上記方法は、入力音声信号x(t)を得るステップと、入力音声信号x(t)を修正して修正音声信号を得るステップとを含む。後者のステップは、信号遅延動作を行うステップを含む。任意選択で、入力音声信号を修正するステップは、信号反転動作および/または信号増幅もしくは減衰および/または信号フィードバック動作を含む。上記方法は、入力音声信号x(t)および修正音声信号の結合、例えば総和に基づいて音声信号y(t)を発生させるステップを更に含む。

Description

本開示は、仮想音源と関連付けられた音声信号を発生させるための方法およびシステムに関する。特に、入力音声信号x(t)が修正されて修正音声信号を得、かつ同修正が、信号遅延動作を行うことを含むような方法およびシステムに関する。入力音声信号x(t)および修正音声信号の結合、例えば総和に基づいて音声信号y(t)が発生される。
音声伝送器、すなわちスピーカを通した音の再生では、(録音された)音の本質的な空間情報の多くが失われる。それゆえに、スピーカを通した音の体験は、しばしば奥行きを欠いている(「平坦」に聞こえる)かつ次元性を欠いている(「ボックス内」で聞こえる)と感じられる。高さの能動知覚は、スピーカにわたる音体験から全く失われている。これらの条件は、環境における聴取者と音との間の本質的な分離を生じさせる。これは、観察者が音環境と物理的および感情的に十分に一体化することへの障害を生じさせ、一般にこれは、音体験をより受動的におよびより魅力的でなくする。
この問題の古典的な実証がVon Bekesyによって記載されており(Experiments in Hearing、1960)、「ボックス内」の音響効果は、スピーカの次元の減少とともに増加するようである。音響パワー、スペクトルバランスおよび知覚された空間次元と音量との間の関係に関する実験的研究において、Von Bekesyの被験者は、再生音源の次元が再生スピーカボックスの実際の形状を超えるや否や音源の相対次元形状を正しく示すことができなかった。スピーカの空間スペクトル特性が、音情報を伝送するときにメッセージ-メディア衝突をもたらすと結論し得る。我々は、再生音において音源の空間次元を認識できない。代わりに、我々はスピーカの特性を聞いている。
先行技術には、音源の次元情報を記録または計算する満足できる手法がない。音を出す物体の近接場情報は、マイクロホンによって正確に取得することができない、または理論的には物体の次元情報を取得するために圧力の無限格子および粒子速度トランスデューサを必要とするであろう。
次元情報の計算シミュレーションに関しては、波動方程式の解は、限られた量の基本的な幾何学形状におよび限られた周波数範囲に対して適用可能なだけである。上記問題の解析解の欠如を考えると、所望のデータを再現しようと試みるために、シミュレーションモデルは有限計算方法に訴えなければならない。このようにして収集され、そして畳込みまたは加算合成などの、FFT(高速フーリエ変換)を伴う技術を用いて再現されるデータは、複雑な計算および非常に大量のデータ処理を必要とし、したがって本質的にコンピュータ処理のために非常に集約的である。これは、そのような方法の適用を制限し、かつ情報を正確に再現できる音声再生システムにとっての問題を提起する。
それゆえ、当該技術において計算的に高価でない仮想音源と関連付けられた音声信号を発生させるための方法の必要性がある。
その目的で、仮想音源と関連付けられた音声信号を発生させるための方法が開示される。上記方法は、(i)入力音声信号x(t)を得るステップと、時間遅延を導入する信号遅延動作を使用して入力音声信号x(t)を修正して修正音声信号を得るステップと、入力音声信号x(t)の、あるいは入力音声信号x(t)の反転および/または減衰もしくは増幅されたものの、修正音声信号との結合、例えば総和に基づいて音声信号y(t)を発生させるステップとを含む。代替的に(ii)、上記方法は、入力音声信号x(t)を得るステップと、入力音声信号x(t)の修正されたものをそれ自体に再帰的に加える信号フィードバック動作に基づいて音声信号y(t)を発生させるステップであって、信号フィードバック動作が、時間遅延を導入する信号遅延動作および、任意選択で、信号反転動作を含む、ステップとを含む。
仮想音源が特定の大きさおよび形状を有するかつ/または特定の距離に配設されるかつ/または特定の高さもしくは深さに配設されると言われる場合、それは、観察者が発生された音声信号を聞くと、その特定の大きさおよび形状を有するかつ/あるいは上記特定の距離におよび/または上記特定の高さもしくは深さに配設される音源から音声信号が発していると知覚することとして理解されてよい。人間の聴覚は、上記したVon Bekesy実験によっても例示されるように、音を出す物体の次元と相関するスペクトル情報に非常に敏感である。人間の聴覚は、発音物体の特徴を主にその共鳴、すなわち1つまたは幾つかの基本周波数およびそれらの相関する高調波の増幅によって認識しており、そのような増幅は、物体または空間内でその特定の大きさおよび形状により発生する定在波から生じる。音声信号から、その結果的なスペクトルが意図された物体または空間の共鳴に酷似するというように、スペクトル情報を加減することによって、スピーカの空間スペクトル特性を少なくとも部分的に無効にし、そして音声信号のコヒーレントな空間射影をその大きさおよび形状を用いて生じさせることができる。出願人は、音源の次元ならびに観察者に対するその仮想距離、高さおよび深さに関する、そのような空間情報を、入力音声信号に対して比較的単純な動作を行うことによって、音声信号に加えることができることに気付いた。特に、出願人は、これらの単純な動作が、人間の聴覚器官の生理学により、音を出すスピーカの位置および次元以外の、或る位置および次元を有する音源から音声信号が来ていると観察者に知覚させるような特性を有する音声信号を発生させるのに十分であることを見出した。上記の方法は、入力音声信号にこの空間情報を加えるために個々の(帯域の)周波数および振幅をフィルタリングまたは合成することを必要としない。上記方法は、したがってそのような目的のためのFFT合成技術の必要性を回避し、このようにしてプロセスを単純化し、かつ必要とされる処理能力を相当に低減させる。
任意選択で、上記方法は、例えば発生された音声信号を1つまたは複数のスピーカによって再生させるために1つまたは複数のスピーカに発生された音声信号を提供することによって、発生された音声信号を再生するステップを含む。
発生された音声信号は、一旦スピーカシステムによって再生されると、スピーカが幾つ使用されるかにかかわらずかつスピーカに対する観察者の位置にかかわらず観察者による所望の知覚をもたらす。
2つ以上の信号の結合に基づいて発生されたと言われる信号は、これらの2つ以上の信号の結合、例えば総和でよい。
一例において、発生された音声信号は、それがスピーカシステムによって後になって再生できるようにコンピュータ可読媒体に記憶される。
音声信号はリアルタイムで発生でき、これは、入力音声信号が到来すると直ちに音声信号が発生されることとして理解されてよく、かつ/または特定の時間での入力音声信号のいかなる変化も3秒以内に、好ましくは0.5秒以内に、より好ましくは50ms以内に、最も好ましくは10ms以内に、発生された音声信号に反映されることとして理解されてよい。音声信号を発生させるための比較的単純な動作は、そのようなリアルタイム処理を許容する。任意選択で、発生された音声信号はリアルタイムで再生され、これは、音声信号が一旦発生されると、実質的な遅延なしで再生されることとして理解されてよい。
一実施形態において、仮想音源は形状を有する。そのような実施形態は、仮想音源の形状におけるそれぞれの仮想点と関連付けられた音声信号成分を発生させるステップを含む。このステップは、仮想音源の形状における第1の仮想点と関連付けられた第1の音声信号成分および仮想音源の形状における第2の仮想点と関連付けられた第2の音声信号成分を発生させることを含んでおり、(i)
第1の音声信号成分を発生させることは、第1の時間遅延を導入する第1の信号遅延動作を使用して入力音声信号を修正して修正された第1の音声信号成分を得るステップを含み、かつ入力音声信号の、または入力音声信号x(t)の反転および/もしくは減衰もしくは増幅されたものの、修正された第1の音声信号成分との結合、例えば総和に基づいて第1の音声信号成分を発生させるステップを含むか、あるいは(ii)
第1の音声信号成分を発生させることは、入力音声信号x(t)の修正されたものをそれ自体に再帰的に加えるフィードバックループを使用するステップであって、フィードバックループが、第1の時間遅延を導入する信号遅延動作および信号反転動作を含む、ステップを含む。更に、本実施形態において、(i)
第2の音声信号成分を発生させることは、第1の時間遅延と異なる第2の時間遅延を導入する第2の信号遅延動作を使用して入力音声信号を修正して修正された第2の音声信号成分を得るステップを含み、かつ入力音声信号の、または入力音声信号x(t)の反転および/もしくは減衰もしくは増幅されたものの、修正された第2の音声信号成分との結合、例えば総和に基づいて第2の音声信号成分を発生させるステップを含むか、あるいは(ii)
第2の音声信号成分を発生させることは、入力音声信号x(t)の修正されたものをそれ自体に再帰的に加えるフィードバックループを使用するステップであって、フィードバックループが、第2の時間遅延を導入する信号遅延動作および信号反転動作を含む、ステップを含む。
出願人は、本実施形態が、先行技術における場合のように、所望の結果を得るために、FFTアルゴリズムなどの複雑なアルゴリズム、個々の周波数帯域の加算合成または多数のバンドパスフィルタを必要とすることなく、単純な方式で入力音声信号x(t)に仮想音源の次元情報を加えることを許容することを見出した。
好ましくは、多くの3つ以上の仮想点が仮想音源の形状において定められてよい。任意数の仮想点が仮想音源の形状において定められてよい。これらの仮想点の各々に対して、音声信号成分が決定されてよい。音声信号成分の各決定は、次いでそれぞれの時間遅延を導入する信号遅延動作を使用して修正音声信号成分を決定することを含んでよい。各音声信号成分は、次いでその修正音声信号成分および入力音声信号の結合、例えば総和に基づいて決定されてよい。
修正音声信号成分の各決定は、信号反転動作および/または信号増幅もしくは減衰および/または信号フィードバック動作を行うことを更に含んでよい。本明細書において、好ましくは、信号フィードバック動作は最後に行われる。原則として、信号反転動作、増幅/減衰および信号遅延動作は任意の順に行われてよい。
仮想点は、仮想音源の形状において互いから等距離で配設されてよい。更に、仮想音源は、1次元形状、例えば1Dストリング、2次元形状、例えば2D板形状または3次元形状、例えば3D立方体などの、任意の形状を有してよい。
音声信号が遅延される時限は、一部の音声信号成分に対してゼロでよい。例示のために、仮想音源がストリングであれば、その振動が制限されるストリングのそれぞれの端部における2つの仮想点に対する時間遅延はゼロでよい。これは、図を参照しつつ以下に例示されることになる。
一実施形態において、上記方法は、仮想音源の形状におけるそれぞれの仮想点の仮想位置を表現する形状データを得るステップと、第1または第2の仮想点の仮想位置に基づいてそれぞれ第1または第2の時間遅延を決定するステップとを含む。したがって、異なる仮想点に対してそれぞれの音声信号成分を決定するためのそれぞれの時間遅延は、これらの仮想点のそれぞれの仮想位置に基づいて決定されてよい。
出願人は、本実施形態が、音波がどのように次元形状を通して伝搬するかを考慮に入れることを可能にし、これにより、その特定の形状を有する音源から発すると観察者によって知覚される音声信号を正確に発生させることを可能にすることを見出した。仮想点と関連付けられた発生された音声信号成分がスピーカを通して再生される、または複数スピーカにわたって分散されると、その結果は、仮想形状の基本共振周波数に従う調和比の対応する波長で信号成分がそれらのコヒーレンスを強化するので、空間における1つのコヒーレントな音源として知覚される。これは、その実際の出力部品、すなわちスピーカを検出する耳の機構を少なくとも部分的に無効にする。
好ましくは、音声入力信号の各時間遅延されたもののための時限は空間次元と時間との間の関係に従って決定され、その例は以下に図形記述において与えられる。
一実施形態において、発生されるべき音声信号y(t)は、観察者から距離を有する仮想音源と関連付けられる。本実施形態は、(i)時間遅延を導入する時間遅延動作および信号フィードバック動作を使用して入力音声信号を修正して第1の修正音声信号を得るステップと、(ii)入力音声信号x(t)および第1の修正音声信号の組み合わせに基づいて第2の修正音声信号を発生させるステップと、(iii)第2の修正音声信号に基づいて音声信号y(t)を発生させるステップであって、第2の修正音声信号を減衰させることを含み、かつ任意選択で、第2の時間遅延を導入する時間遅延動作を行うことを含む、ステップとを含む。
人間の聴覚は、主に聴覚刺激の全体の強度の変化および高から低周波数へ比例して速くなるエネルギーの散逸を検出して音源距離を認識する。出願人は、本実施形態が非常に単純かつ計算的に安価な方式で入力音声信号にそのような距離情報を加えることを許容することを見出した。
第2の導入された時間遅延は、観察者にドップラー効果をもたらすために使用されてよい。本実施形態は、信号における共振周波数の帯域幅を狭めるまたは広げるQ係数を制御することを更に許容する。この場合、知覚された共振周波数が可能な限り遠い仮想距離で無限に低いので、Q係数は、高から低周波数への可聴周波数範囲全体に及ぶ曲線の峻度に影響し、結果として信号における高周波散逸の意図された漸増になる。
好ましくは、第1の修正音声信号を得るために行われる時間遅延動作によって導入される時間遅延は0.00007秒より短く、好ましくは0.00005秒より短く、より好ましくは0.00002秒より短く、最も好ましくは約0.00001秒である。
第2の修正音声信号は、仮想音源の距離に依存して減衰されてよい。信号の減衰されたものがそれ自体に再帰的に加えられる、第1の修正音声信号を決定するために行われる信号フィードバック動作に関しては、上記距離に依存して信号減衰も好ましくは行われる。任意選択で、そのような実施形態は、減衰を自動的に適切に制御できるように仮想音源の距離を表現する距離データを得るステップを含む。本実施形態は、単に2、3の値を調整することによって観察者に向けておよび離れるように仮想音源を「移動させる」ことを許容する。
上記実施形態において、信号フィードバック動作は、信号、例えば上記時間遅延を導入する時間遅延動作を行った後に得られるような信号を減衰させ、そして減衰信号を同信号自体に再帰的に加えることを含む。そのような実施形態は、距離が大きいほど、信号フィードバック動作における減衰度が低くかつ第2の修正音声信号の減衰度が高いように、上記距離に依存して信号フィードバック動作における減衰度および第2の修正音声信号の減衰度を制御するステップを更に含んでよい。
一実施形態において、仮想音源は観察者から距離を有する。本実施形態は、入力音声信号の修正されたものをそれ自体に再帰的に加える信号フィードバック動作を使用して入力音声信号を修正して第1の修正音声信号を得るステップであって、フィードバック動作が、時間遅延を導入する信号遅延動作を含む、ステップと、第1の修正音声信号に基づいて音声信号y(t)を発生させるステップであって、信号減衰および任意選択で、第2の時間遅延を導入する時間遅延動作を含む、ステップとを含んでおり、任意選択で本実施形態は、第1の修正音声信号および第1の修正音声信号の時間遅延されたものの組み合わせに基づいて第2の修正音声信号を発生させ、そして第2の修正音声信号に基づいて、したがって第1の修正音声信号に基づいて音声信号y(t)を発生させるステップを更に含む。
導入された時間遅延についての上記考慮点は、本実施形態における減衰にも当てはまる。
一実施形態において、仮想音源が観察者から距離をおいて配設され、かつ第2の修正音声信号が距離に依存して減衰されており、入力音声信号を修正して第1の修正音声信号を得るステップは特定の信号減衰を含む。本実施形態は、距離が大きいほど、特定の信号減衰の減衰度が低くかつ第2の修正音声信号の減衰度が高いように、上記距離に依存して特定の信号減衰の減衰度および第2の修正音声信号の減衰度を制御するステップを含む。
一実施形態において、仮想音源と関連付けられる発生されるべき音声信号y(t)は、観察者より上の仮想高さに配設される。そのような実施形態において、上記方法は、(i)第3の修正音声信号を得るために信号反転動作、信号減衰動作、および時間遅延を導入する時間遅延動作を使用して入力音声信号x(t)を修正するステップと、(ii)入力音声信号および第3の修正音声信号の組み合わせ、例えば総和に基づいて音声信号を発生させるステップとを含む。
出願人は、本実施形態が、単純な方式で、或る高さに配設される仮想音源から到来する音声信号を発生させることを許容することを見出した。
本実施形態において、導入された時間遅延は、好ましくは、0.00007秒より短く、好ましくは0.00005秒より短く、より好ましくは0.00002秒より短く、最も好ましくは約0.00001秒である。
上記実施形態において、入力音声信号を修正して第3の修正音声信号を得るステップは、任意選択で信号フィードバック動作を行うステップを含む。特定の例において、このステップは、信号、例えば第3の修正音声信号を最終的に得るために行われる時間遅延動作、信号減衰動作および信号反転動作から生じた信号の減衰されたものをそれ自体に再帰的に加えるステップを含む。
一実施形態において、発生されるべき音声信号は、観察者より下の仮想深さに配設される仮想音源と関連付けられる。そのような実施形態は、第6の修正音声信号を得るために時間遅延を導入する時間遅延動作、信号減衰動作および信号フィードバック動作を使用して入力音声信号x(t)を修正するステップを含む。信号フィードバック動作を行うステップは、例えば、信号、例えば第6の修正音声信号を最終的に得るために行われる時間遅延動作および信号減衰動作から生じた信号の減衰されたものをそれ自体に再帰的に加えるステップを含む。本実施形態は、入力音声信号および第6の修正音声信号の組み合わせに基づいて音声信号を発生させるステップを更に含む。
一実施形態において、仮想音源は観察者より下の仮想深さに配設される。本実施形態は、入力音声信号の修正されたものをそれ自体に再帰的に加える信号フィードバック動作を使用して音声信号y(t)を発生させるステップであって、フィードバック動作が、時間遅延を導入する信号遅延動作および第1の信号減衰動作を含む、ステップを含む。
一実施形態において、仮想音源は観察者より下の仮想深さに配設される。本実施形態は、入力音声信号の修正されたものをそれ自体に再帰的に加える信号フィードバック動作を使用して入力音声信号を修正して第6の修正音声信号を得るステップであって、フィードバック動作が、時間遅延を導入する信号遅延動作および第1の信号減衰を含む、ステップと、第6の修正音声信号ならびに第6の修正音声信号の時間遅延され減衰されたものの組み合わせに基づいて音声信号を発生させるステップとを含む。
仮想音源が仮想深さに配設される上記実施形態において、導入された時間遅延は、好ましくは、0.00007秒より短く、好ましくは0.00005秒より短く、より好ましくは0.00002秒より短く、最も好ましくは約0.00001秒である。
一実施形態において、上記方法は、仮想音源の形状を示しかつ/または仮想音源の形状における仮想点のそれぞれの仮想位置を示しかつ/または仮想音源と観察者との間の距離を示しかつ/または仮想音源が観察者より上に配設される高さを示しかつ/または仮想音源が観察者より下に配設される深さを示すユーザ入力を受けるステップを含む。本実施形態は、ユーザが仮想音源に関するパラメータを入力することを許容し、これにより、これらのパラメータに従って音声信号を発生させることを許容する。本実施形態は、本明細書に記載されるパラメータの値を決定するステップと、これらの決定されたパラメータを使用して音声信号を発生させるステップとを含んでよい。
一実施形態において、上記方法は、
- 仮想音源の形状、
- 仮想音源の形状における仮想点のそれぞれの仮想位置、
- 仮想音源と観察者との間の距離、
- 仮想音源が観察者より上に配設される高さ、
- 仮想音源が観察者より下に配設される深さ
のうちの少なくとも1つをユーザが入力することを可能にするユーザインタフェースを生成するステップを含む。これは、ユーザが仮想音源に関するパラメータを容易に入力することを許容し、そのためユーザが仮想音源を容易に制御することを許容する。
本明細書に記載される方法はコンピュータ実装方法でよい。
本開示の1つの態様は、コンピュータ可読プログラムコードが具現化されたコンピュータ可読記憶媒体と、コンピュータ可読記憶媒体に結合されるプロセッサ、好ましくはマイクロプロセッサであって、コンピュータ可読プログラムコードを実行したことに応じて、仮想音源と関連付けられた音声信号を発生させるための本明細書に記載される方法のステップの1つまたは複数を行うように構成される、プロセッサとを備えるコンピュータに関する。
本開示の1つの態様は、少なくとも1つのソフトウェアコード部分を含むコンピュータプログラムもしくは一組のコンピュータプログラムまたは少なくとも1つのソフトウェアコード部分を記憶したコンピュータプログラム製品であって、ソフトウェアコード部分が、コンピュータシステムにおいて実行されると、仮想音源と関連付けられた音声信号を発生させるための本明細書に記載される方法のステップの1つまたは複数を実行するために構成される、コンピュータプログラムもしくは一組のコンピュータプログラムまたはコンピュータプログラム製品に関する。
本開示の1つの態様は、少なくとも1つのソフトウェアコード部分を記憶した非一時的コンピュータ可読記憶媒体であって、ソフトウェアコード部分が、コンピュータによって実行または処理されると、仮想音源と関連付けられた音声信号を発生させるための本明細書に記載される方法のステップの1つまたは複数を行うように構成される、非一時的コンピュータ可読記憶媒体に関する。
本開示の1つの態様は、本明細書に記載されるユーザインタフェースに関する。
当業者によって認められるであろうように、本発明の態様は、システム、方法またはコンピュータプログラム製品として具現化されてよい。したがって、本発明の態様は、完全にハードウェア実施形態、完全にソフトウェア実施形態(ファームウェア、常駐ソフトウェア、マイクロコード等を含む)、またはソフトウェアおよびハードウェア態様を組み合わせた実施形態の形態をとってよく、全て一般に「回路」、「モジュール」または「システム」と本明細書において称されてよい。本開示に記載される機能は、コンピュータのマイクロプロセッサによって実行されるアルゴリズムとして実装されてよい。更には、本発明の態様は、コンピュータ可読プログラムコードが具現化、例えば記憶された1つまたは複数のコンピュータ可読媒体で具現化されるコンピュータプログラム製品の形態をとってよい。
1つまたは複数のコンピュータ可読媒体の任意の組み合わせが利用されてよい。コンピュータ可読媒体はコンピュータ可読信号媒体またはコンピュータ可読記憶媒体でよい。コンピュータ可読記憶媒体は、例えば電子、磁気、光学、電磁、赤外線もしくは半導体システム、装置もしくはデバイス、または上記の任意の適切な組み合わせでよいが、これに限定されない。コンピュータ可読記憶媒体のより具体的な例(非網羅的な列挙)としては以下を含み得る。1つもしくは複数のワイヤを有する電気接続、ポータブルコンピュータディスケット、ハードディスク、ランダムアクセスメモリ(RAM)、リードオンリメモリ(ROM)、消去可能プログラマブル・リードオンリメモリ(EPROMまたはフラッシュメモリ)、光ファイバ、ポータブル・コンパクトディスク・リードオンリメモリ(CD-ROM)、光記憶デバイス、磁気記憶デバイス、または上記の任意の適切な組み合わせ。本文書の文脈では、コンピュータ可読記憶媒体は、命令実行システム、装置またはデバイスによる使用のための、またはそれに関するプログラムを含むまたは記憶することができる任意の有形媒体でよい。
コンピュータ可読信号媒体は、コンピュータ可読プログラムコードが、例えばベースバンドにまたは搬送波の一部として具現化される、伝搬されるデータ信号を含んでよい。そのような伝搬信号は、電磁、光学またはその任意の適切な組み合わせを含むがこれに限定されない、各種の形態のいずれかをとってよい。コンピュータ可読信号媒体は、コンピュータ可読記憶媒体でなく、かつ命令実行システム、装置もしくはデバイスによる使用のための、またはそれに関するプログラムを通信、伝搬または転送できる任意のコンピュータ可読媒体でよい。
コンピュータ可読媒体に具現化されるプログラムコードは、ワイヤレス、ワイヤライン、光ファイバ、ケーブル、RF等、または上記の任意の適切な組み合わせを含むがこれらに限定されない、任意の適当な媒体を使用して伝送されてよい。本発明の態様のための動作を実施するためのコンピュータプログラムコードは、Java(商標)、Scala、C++、Python等といった関数型またはオブジェクト指向プログラミング言語および「C」プログラミング言語または同様のプログラミング言語などの従来の手続き型プログラミング言語を含む、1つまたは複数のプログラミング言語の任意の組み合わせで書かれてよい。プログラムコードは、完全にユーザのコンピュータにおいて、部分的にユーザのコンピュータにおいて、スタンドアロンソフトウェアパッケージとして、部分的にユーザのコンピュータにおいてかつ部分的にリモートコンピュータにおいて、または完全にリモートコンピュータ、サーバもしくは仮想化サーバにおいて実行してよい。後者のシナリオでは、リモートコンピュータは、ローカルエリアネットワーク(LAN)もしくはワイドエリアネットワーク(WAN)を含む、任意の種類のネットワークを通じてユーザのコンピュータに接続されてよく、または外部コンピュータに接続がなされてよい(例えば、インターネットサービスプロバイダを使用してインターネットを通じて)。
本発明の態様が、本発明の実施形態に係る方法、装置(システム)およびコンピュータプログラム製品のフローチャート例および/またはブロック図を参照しつつ以下に記載される。フローチャート例および/またはブロック図の各ブロック、ならびにフローチャート例および/またはブロック図におけるブロックの組み合わせがコンピュータプログラム命令によって実装できることが理解されるであろう。これらのコンピュータプログラム命令は、命令が、コンピュータ、他のプログラマブルデータ処理装置または他のデバイスのプロセッサを介して実行し、フローチャートおよび/またはブロック図の1つまたは複数のブロックに特定される機能/動作を実装するための手段を生じさせるように、汎用コンピュータ、専用コンピュータまたは他のプログラマブルデータ処理装置のプロセッサ、特にマイクロプロセッサもしくは中央処理ユニット(CPU)またはグラフィック処理ユニット(GPU)に提供されてマシンを生成してよい。
これらのコンピュータプログラム命令は、コンピュータ可読媒体に記憶される命令が、フローチャートおよび/またはブロック図の1つまたは複数のブロックに特定される機能/動作を実装する命令を含む製品を生成するように、コンピュータ、他のプログラマブルデータ処理装置または他のデバイスに特定の方式で機能するように指図できるコンピュータ可読媒体に記憶されてもよい。
コンピュータプログラム命令は、コンピュータまたは他のプログラマブル装置において実行する命令が、フローチャートおよび/またはブロック図の1つまたは複数のブロックに特定される機能/動作を実装するためのプロセスを提供するように、コンピュータ、他のプログラマブルデータ処理装置または他のデバイスへロードされて、一連の動作ステップがコンピュータ、他のプログラマブル装置または他のデバイスにおいて行われてコンピュータ実装プロセスを生成させてもよい。
図におけるフローチャートおよびブロック図は、本発明の様々な実施形態に係るシステム、方法およびコンピュータプログラム製品の可能な実装のアーキテクチャ、機能および動作を例示する。この点で、フローチャートまたはブロック図における各ブロックは、モジュール、セグメントまたはコードの部分を表現してよく、それは特定された論理機能を実装するための1つまたは複数の実行可能命令を備える。一部の代替実装において、ブロックに示される機能が、図に示される順と異なって発生してよいことも留意されるべきである。例えば、連続して図示される2つのブロックが、実際には、実質的に並行して実行されてよく、またはブロックは、時に逆順に実行されてよく、関与する機能次第である。ブロック図および/またはフローチャート例の各ブロック、ならびにブロック図および/またはフローチャート例におけるブロックの組み合わせが、特定された機能もしくは動作を行う専用ハードウェアベースのシステム、または専用ハードウェアおよびコンピュータ命令の組み合わせによって実装できることも留意されるであろう。
本発明は、本発明に係る実施形態を概略的に図示する添付の図面を参照しつつ更に例示されることになる。本発明がこれらの具体的な実施形態にいかなる形であれ限定されないことが理解されるであろう。
図面に図示される例証的な実施形態の参照によって、本発明の態様がより詳細に説明されることになる。
一実施形態に係る方法およびシステムを例示する。 一実施形態に係る方法およびシステムを例示する。 一実施形態に係る方法およびシステムを例示する。 一実施形態に係る方法およびシステムを例示する。 一実施形態に係る方法およびシステムを例示する。 一実施形態に係る方法およびシステムを例示する。 一実施形態に係る方法およびシステムを例示する。 一実施形態に係る方法およびシステムを例示する。 一実施形態に係る方法およびシステムを例示する。 一実施形態に係る方法およびシステムを例示する。 一実施形態に係る方法および/またはシステムを使用して発生された音声信号のスペクトログラムを示す。 一実施形態に係る仮想音源、特にストリングとしての仮想音源形状を図示する。 実施形態に関与し得る入力音声信号および入力音声信号の信号反転、時間遅延されたものを概略的に示す。 音声信号に次元情報を加えるための方法を例示し、次元情報が仮想音源の形状に関する。 一実施形態に使用され得るパニングシステムを例示する。 2次元および3次元仮想音源を例示する。 実施形態に関与し得る入力信号およびこの信号の時間遅延されたものを示す。 板などの、2次元仮想音源と関連付けられた音声信号を発生させるための方法を例示する。 一実施形態に使用される、幾つかのパラメータがどのように決定され得るかを概略的に図示する。 図7Aの実施形態の代替である実施形態を例示する。 図7Aの実施形態の代替である実施形態を例示する。 仮想音源上のそれぞれの仮想点と関連付けられたそれぞれの音声信号成分のスペクトログラムを示す。 仮想音源上のそれぞれの仮想点と関連付けられたそれぞれの音声信号成分のスペクトログラムを示す。 一実施形態に係る観察者から距離をおいて配設される仮想音源の発生を例示する。 一実施形態に係る観察者から距離をおいて配設される仮想音源の発生を例示する。 図9Aの実施形態の代替実施形態を図示する。 図9Aの実施形態の代替実施形態を図示する。 図9Aの実施形態の代替実施形態を図示する。 それぞれの距離に配設される仮想音源と関連付けられたスペクトログラムを示す。 一実施形態に係る観察者より上の高さに配設される仮想音源の発生を例示する。 一実施形態に係る観察者より上の高さに配設される仮想音源の発生を例示する。 それぞれの高さに配設される仮想音源と関連付けられたスペクトログラムを示す。 一実施形態に係る観察者より下の深さに配設される仮想音源の発生を例示する。 一実施形態に係る観察者より下の深さに配設される仮想音源の発生を例示する。 図13Aの実施形態の代替実施形態を図示する。 図13Aの実施形態の代替実施形態を図示する。 図13Aの実施形態の代替実施形態を図示する。 図13Aの実施形態の代替実施形態を図示する。 或る形状を有し、或る位置に配設された仮想音源と関連付けられた音声信号の発生を例示する。 一実施形態に係るユーザインタフェースを例示する。 一実施形態に係るデータ処理システムを例示する。
音波は、環境についての、および環境内の音の観察者についての詳細情報を本質的に搬送する。本開示は、再生音源の次元の大きさおよび形状、観察者に向けたその相対距離、観察者より上のまたは下のその高さまたは深さ、ならびに音源が観察者に向けてまたは観察者から離れるように移動している場合その方向性に関する空間的にコヒーレントな特性を有すると知覚される、音波変換(空間波変換またはSWT)、音声信号を発生させるための方法を記載する。
概して、空間波変換は、デジタル音声信号(例えばデジタル録音)を入力とし、そして従来の音声再生システムで再生できる1つまたは複数の修正音声信号を出力として、コンピュータによって実行されるアルゴリズムである。代替的に、上記変換は、音声信号を発生させかつ/または処理するアナログ(非デジタル)手段にも当てはまり得る。修正音声信号を再生することで、再生音源の次元の大きさおよび形状(例えばあたかもバイオリンが物理的に存在するかのようにバイオリンの録音信号が聞こえる)ならびに観察者に関する音源の空間距離、高さおよび深さ(例えば聴取者からの特有の距離および上の高さまたは下の深さにバイオリンが聞こえる)の改善された知覚を観察者に与える一方で、音出力媒体、すなわちスピーカの物理的特性をマスキングする(すなわち、バイオリンは、あたかもそれがスピーカから到来しているかのようには聞こえない)ことになる。
図1Aは、一実施形態に係る方法および/またはシステムを描くフローチャートである。入力音声信号x(t)が得られる。入力音声信号x(t)はアナログまたはデジタルでよい。したがって、図1に図示される動作、すなわち動作4、6、8、10、12、14の各々は、アナログ回路部品またはデジタル回路部品によって行われてよい。図1のフローチャートは、適切なソフトウェアコードを実行するコンピュータによって行うことができる方法のステップを描くと理解されてもよい。
入力音声信号x(t)は、音が録音され、任意選択でデジタル信号へ変換された録音プロセスによって出力されたかもしれない。一例において、バイオリンなどの楽器がスタジオ内で録音されて、本明細書に記載される音声信号を発生させるための方法のために入力される音声信号を得た。
入力音声信号x(t)はその後修正されて修正音声信号を得る。信号修正は、信号遅延動作4および/または信号反転動作6および/または信号増幅もしくは減衰8および/または信号フィードバック動作10、12を含む。
信号遅延動作4は、遅延線などの周知の部品を使用して行われてよい。信号反転動作6は、入力信号x(t)が-x(t)へ変換されるように信号を反転させるとして理解されてよい。増幅または減衰8は線形増幅または減衰でよく、信号x(t)がa*x(t)へ変換されるように信号を定数係数aだけ増幅または減衰させるとして理解されてよい。
信号フィードバック動作は、信号をそれ自体の減衰されたものと再帰的に結合させることから成ると理解されてよい。これは、フィードバックループに位置する減衰動作12および結合動作10によって概略的に描かれる。減衰、すなわち図1Aにおける拡大定数bを減少させることで、ピーク強度を増加させかつ音のスペクトルにおける共振周波数の帯域幅、いわゆるQ係数を狭めてよい。これとともに、振動に対する異なる材料の応答を、それらの密度および剛性に基づいてシミュレートできる。例えば、金属物体の応答は、木から作られた同じ大きさおよび形状の物体より高いQ係数を生じさせるであろう。
結合動作10および14は、2つ以上の信号{x1(t), ..., xn(t)}を結合すると理解されてよい。入力信号は、次の通りに信号y(t)へ変換されてよい。
図1Aにおいて、音声信号y(t)は、入力音声信号x(t)および修正音声信号の結合、例えば総和に基づいて発生される。一例において、音声信号y(t)は、入力音声信号x(t)および修正音声信号を結合、例えば合計した結果である。
音声信号y(t)への入力音声信号x(t)の変換は、以降空間波変換(SWT)と称されてよい。
音声信号y(t)を発生させるための方法は、発生された音声信号の達成可能な解像度を制限し得る、高速フーリエ変換を伴う方法などの、有限計算方法を必要としない。したがって、本明細書に開示される方法は、高解像度音声信号を形成することを可能にする。本明細書において、高解像度とは、無限量の周波数成分に対してスペクトル修正した信号として理解されてよい。畳込みまたはシミュレーションモデルにおける場合のように、各個々の周波数成分に対して所望のスペクトル情報が計算および修正される必要があるのでなく、周波数成分の所望のスペクトル修正が単純な総和、すなわち特定の時間遅延、振幅および/または位相差を伴う2つの同一の音声信号の波干渉から生じるので、事実上無限の解像度が達成される。この動作は、結果として調和比の各周波数成分に対する位相および振幅差になり、すなわち共振によってもたらされるスペクトルパターンに対応する。本方法に妥当な時間遅延は典型的に0.00001~0.02秒の間であるが、より長い時間を排除するものではない。
発生された音声信号y(t)は、従来の音声出力媒体、例えば1つまたは複数のスピーカを通して観察者に提示されてよい。発生された音声信号は、音声出力媒体に出力される前に時間が遅延されかつ/または減衰されてよい。
図1B~図1Gは、他の実施形態に係る方法および/またはシステムを描くフローチャートを図示する。ここで、図1Bは、信号反転動作および信号減衰動作がフィードバック結合10の後に行われるという点で図1Aと異なる。
更に、図1Cおよび図1Dは、入力音声信号x(t)の修正されたものをそれ自体に再帰的に加える信号フィードバック動作に基づいて音声信号y(t)が発生されるそれぞれの実施形態を例示する。信号フィードバック動作は、時間遅延を導入する信号遅延動作および信号反転動作を含む。
ここで、図1Cは、信号フィードバック動作を使用して入力音声信号が修正されて、11によって示される修正音声信号を得る、実施形態を例示する。本実施形態において、音声信号y(t)は、この修正音声信号および、13によって示される、この修正音声信号の時間遅延、反転されたものの結合に基づいて発生される。図1Cに図示されるように、これは、結合器9にフィードバックされる信号を結合器10にも送ることによって達成されてよい。
図1Cおよび図1Dにおいて、信号フィードバック動作から生じる減衰関数は周波数から独立しており、それゆえにこれらの実施形態は、オールパスフィルタを構成すると理解されてよい。
図1Eの実施形態は、信号遅延動作、信号反転動作および減衰が信号フィードバック動作の一部として行われるという点で図1Aに図示されるものと異なる。図1Eの実施形態は、それが周波数に応じて減衰関数から成る調和パターンを生ずるという点で特に有利である。この減衰関数のため、信号における周波数が高いほど、低い周波数より高速に減衰する。
図1Fまたは図1Gの実施形態は、信号減衰が信号フィードバック動作の後または前に行われるそれぞれの実施形態を例示する。信号減衰がフロー図における任意の位置に配置されてよく、そして幾つかの信号減衰がフロー図におけるそれぞれの位置に存在してもよいことが認められるべきである。
図1H~図1Jは、音声信号y(t)が入力音声信号x(t)の反転および/または減衰もしくは増幅されたものならびに修正音声信号の結合10に基づいて発生され、修正音声信号が信号遅延動作および信号フィードバック動作を使用して得られる、それぞれの実施形態を例示する。
図1Hは、修正音声信号が入力音声信号の減衰されたものと結合される実施形態を例示し、図1Iは、修正音声信号が入力音声信号の反転されたものと結合される実施形態を例示し、そして図1Jは、修正音声信号が入力音声信号の反転、減衰されたものと結合される実施形態を例示する。
図1の実施形態が、例えば図4、図7および図14に図示される、より複雑な実施形態を構築するビルディングブロックとして使用できることが認められるべきである。したがって、これらのより複雑な実施形態が図1Aの実施形態をビルディングブロックとして使用するが、図1B~図1Jのそれぞれの実施形態のいずれがビルディングブロックとして使用されてもよい。これらの複雑な実施形態において、これらのビルディングブロックは、図1B~図1Jの実施形態のいずれでもよく、21によって示される。
図2(上)は、入力音声信号x(t)が白色雑音であり、時間遅延動作4による導入された時間遅延が約0.00001secであり、信号反転動作6が行われ、かつ信号フィードバック動作10、12が行われない場合の発生された音声信号のスペクトログラムを示す。
図2(中)は、入力音声信号x(t)が白色雑音であり、時間遅延動作4による導入された時間遅延が約0.00036secであり、信号反転動作6が行われ、かつ信号フィードバック動作10、12が行われない場合の発生された音声信号のスペクトログラムを示す。
図2(下)は、入力音声信号x(t)が白色雑音であり、時間遅延動作4による導入された時間遅延が約0.00073secであり、信号反転動作6が行われ、かつ信号フィードバック動作10、12が行われない場合の発生された音声信号のスペクトログラムを示す。
これらの図は、音声信号のスペクトルを、非常に単純な動作を使用して調和比に従って精密に修正できることを明らかにする。
図3Aは、ストリングの形態の仮想音源を例示する。幾つかの仮想点nがストリングの形状において定められており、本例では17の仮想点。点は、図示されるように互いから等距離でよい。各2つの粒子間に選ばれる一定の距離が、仮想音源が定められる解像度を決定する。
図4および図7は、特定の形状、例えば図3Aに図示されるストリング形状、図6に例示される板形状源または立方体源を有する音源から発すると知覚される音声信号を発生させるために使用されてよい方法および/またはシステムの実施形態を例示する。これらの実施形態において、本方法は、仮想音源の形状におけるそれぞれの仮想点と関連付けられた音声信号成分yn(t)を発生させるステップを含む。各音声信号成分yn(t)を発生させるステップは、時間遅延Δtnを導入する信号遅延動作を使用して入力音声信号を修正して修正音声信号成分を得るステップを含む。次いで、各音声信号成分yn(t)は、入力音声信号およびその修正音声信号成分の結合、例えば総和に基づいて発生される。好ましくは、上記結合から生じた各信号成分の振幅は、信号減衰素子191~19nによって、例えば-6dB減衰される。導入される時間遅延の少なくとも2つが互いと異なる。音声信号成分yn(t)は、発生された音声信号y(t)を共に構成すると理解されてよい。一例において、音声信号成分は結合されて音声信号を発生させる。しかしながら、別の例では、これらの音声信号成分は、各成分を複数のスピーカに個別に分配するパニングシステムに個別に送られる。音声信号成分が音声出力媒体を通して、例えば1つまたは複数のスピーカを通して同時に再生されると、結果的な音声信号は、特定の形状を有する音源から発していると観察者によって知覚されるであろう。
図4は、特にストリング、例えば図3Aに図示されるストリングとして成形された音源から発すると知覚される音声信号を発生させるための実施形態を例示する。したがって、図3Aを参照して、発生された音声信号成分y1(t)が点n=1と、音声信号成分y2(t)が点n=2と関連付けられている等。本実施形態において、入力音声信号への各修正は、修正音声信号成分を得るために、時間遅延Δtnの導入だけでなく、信号反転動作161~16nによって示されるように音声入力信号を反転させることも含む。修正音声信号成分は、張力下のストリングまたはドラムのスキンの場合など、その縁が自由に振動できない発音物体の場合、入力音声信号に関して反転される。全てのその縁が自由に振動する発音物体の場合には、修正音声信号成分のいずれも反転されず、好ましくは、図7を参照しつつ説明することになるように結果的な信号成分yn(t)にハイパスフィルタが加えられて音声信号の低周波を減衰させる。
任意選択で、上記修正は信号フィードバック動作181~18nも含むが、これは、音声信号に仮想音源の次元情報を加えるためには必要とされない。描かれた実施形態は、各音声信号成分yn(t)が入力音声信号x(t)および反転、時間遅延された入力音声信号の総和の結果でよいことを図示する。図4に時間遅延動作が信号反転動作16の前に行われることを図示するが、これは反対でもよい。
1メートル長のストリング形状の仮想音源に関しては、ストリング上の17の等距離に配設された仮想点に対する時間差は次の通りでよい:
Figure 2023506240000002
導入された時間遅延に対するこれらの値はΔtn=Lxn/vに従っており、式中、Lはストリングの長さを示し、xnは仮想点nに対する乗算係数を意味し、そしてvは媒体中の音速に関する。表内の値に対して、343m/sの値が使用されるが、これは摂氏20度で空気中を移動する音波の速さである。仮想点は、仮想音源の中心、例えばストリング、板または立方体の中心から仮想音源の縁に走る線分上に配設されると理解されてよい。そのため、仮想点は、線分を2つの部分、すなわち仮想音源の端と仮想点との間を走る線分の第1の部分および仮想点と仮想音源の中心との間を走る線分の第2の部分に分割すると理解されてよい。乗算係数は、線分の第1の部分の長さと線分の第2の部分の長さとの間の比率に等しくてよい。したがって、仮想点が音源の端に配設される場合、乗算係数はゼロであり、そして仮想点が仮想音源の中心に配設される場合、乗算係数は1である。したがって、これらの値により、ユーザは、発生された音声信号が長さ1メートルであるストリング形状の音源から発していると知覚するであろうが、一方スピーカは特定の方式で空間的に配置される必要はない。
一実施形態において、本方法は、仮想音源の形状におけるそれぞれの仮想点の仮想位置を表現する形状データを得るステップと、好ましくは上記の式に従って、それぞれの仮想点の仮想位置に基づいてそれぞれの時間遅延動作によって導入されるべき時間遅延を決定するステップとを含む。
図3Bは、点n=1、2、3にそれぞれ対する修正音声信号成分222、223および224を概略的に図示する。これらの音声信号成分は、音声入力信号20に関して反転され、かつそれぞれΔt2、Δt3、Δt4だけ時間遅延された。
ビルディングブロック21として図1Aの実施形態が使用されることを図4が示すが、それぞれの図1A~図1Jに図示される実施形態のいずれが使用されてもよい。
図5は、発生された音声信号、または発生された音声信号を共に形成する発生された音声信号成分を1つまたは複数のスピーカにパンできることを図示する。このパニングステップは、当該技術で公知の方法を使用して行われてよい。原則として、本明細書に開示される方法により、パニング法にかかわらずかつ音声信号を再生するためにスピーカが幾つ使用されるかにかかわらず、仮想音源の次元、距離、高さおよび深さに関する空間情報を音声信号に加えることができる。
一実施形態において、発生された音声信号成分の各々が、原則として、存在する全てのスピーカに送られてよい。しかしながら、使用されるパニング法に応じて、音声信号成分の一部がゼロ増幅でスピーカに送られてよい。これにより、実際上、そのようなスピーカはそのような音声信号成分を受信しない。これは、図5においてy1に関してはスピーカCおよびDに対して、y2に関してはスピーカAおよびDに対して、ならびにy3に関してはスピーカAに対して描かれる。典型的に、パニングシステムは、0と1との間の各スピーカへの各音声信号成分の離散増幅でスピーカに音声信号成分を提供することになる。
図6Aは、本方法がより複雑な形状を有する仮想音源に対して使用され得ることを例示するために仮想音源の更なる例を描く。発生された音声信号y(t)は、例えば板形状の音源24または立方体形状の音源26から発していると知覚されてよい。仮想点が仮想音源の形状において定められる。合計25の仮想点が、描かれた例における板形状の音源24上に定められた。
仮想音源は、一組の正多角形として成形されても、他に非対称、不規則または有機的に形成された形状でもよい。
図6Bは、仮想音源が2次元または3次元形状を有するときに使用され得る幾つかの修正音声信号成分を例示する。図は、全ての修正音声信号成分が時間遅延されてよく、そして全てのその縁が自由に振動する仮想音源に従って、修正音声信号成分のいずれも入力音声信号に関して反転されないことを図示する。
図7Aは、発生された音声信号y(t)が板として成形された音源から発すると観察者によって知覚される実施形態を例示するフローチャートである。再び、形状において定められる仮想点とそれぞれ関連付けられて、複数の音声信号成分yn(t)が決定される。本実施形態において、音声信号成分yn(t)の各決定は、修正音声信号成分を得るために、時間遅延Δtn.1を導入する信号遅延動作を使用して、任意選択で信号フィードバック動作30を使用して入力音声信号を修正することを含む。その後、入力音声信号および修正音声信号成分の結合32に基づいて第2の修正音声信号成分が発生される。第2の修正音声信号成分は、例えば約-6dB減衰されてよい(減衰素子34参照)。第2の修正音声信号成分は、第2の時間遅延を導入する信号遅延動作Δtn.2および任意選択で信号フィードバック動作36を使用して修正されて第3の修正音声信号成分を得てよい。次いで、第2および第3の修正音声信号成分の結合38に基づいて音声信号成分yn(t)が発生されてよい。任意選択で、音声信号成分yn(t)を発生させるこのステップは、例えば-6dBの減衰動作40、および/または板に発生する最低基本周波数未満の周波数を減衰させると理解されてよい、fnの遮断周波数を適用するハイパスフィルタ動作42を行うステップを含む。
本実施形態において、音声信号成分を決定するステップは、第1の修正音声信号成分および第3の修正音声信号成分を決定するステップを含む。第1または第3の修正音声信号成分を決定するステップは、それぞれ第1または第2の時間遅延動作および信号反転動作ならびに、任意選択で、第1または第2の信号フィードバック動作を使用することを含んでよい。
本例では、音声信号成分当たり2つの結合32および38が行われるが、しかしながら、3次元形状の音源など、より複雑な形状の仮想音源に関しては、音声信号成分当たり3つ以上の結合動作が行われる。これの一例が図14に図示される。
図7Aにおいて各yx(t)信号の発生のために2つのビルディングブロック21が直列に配置されることを図示するが、各yx(t)信号の発生のために、3つ、4つ、5つ、6つ以上など、3つ以上のビルディングブロック21も直列に配置できることが認められるべきである。
図7Bは、正方形板として成形される仮想音源50における各仮想点に対して、関連付けられた時間遅延および遮断周波数をどのように算出できるかを例示する。一例として、図7Bは、板として成形された仮想音源50における点n=7に対して、時間遅延および遮断周波数がどのように算出されるかを例示する。
第1のステップは、各仮想点に対して、以下の式に従って、上述の乗算係数xに対する3つの値、すなわちxA、xB、xCを決定することから成る:
Figure 2023506240000003
ここでRは、仮想音源50の2つ以上の縁が交わる頂点を通る円52の半径を意味する。本例では、Rは、正方形板50の外接円52の半径である。
更に、rn.A(図7Bにおける左の例示を参照)は、正方形54の頂点を通る円56の半径を意味しており、正方形54は、仮想音源50の中点と一致する中点を有する正方形でありかつその辺の1つに点n、本例では点7を有する。正方形54の辺は板50の縁と平行である。
rn.B(図7Bにおける中央の例示を参照)は、正方形58の頂点を通る円60の半径を意味しており、正方形58は、点nに最も近い頂点と一致する中点を有しかつ仮想板音源50の縁と平行である辺を有する。
rn.C(図7Bにおける右手側の例示を参照)は、板50の中点と正方形62の縁との間の最小距離を意味しており、正方形62は、仮想音源50の中点と一致する中点を有しかつその辺の1つに点nを有する。更に、正方形62は、板Aの少なくとも1つの対角線と垂直である辺を有する。本例では仮想音源が正方形であるので、正方形62は板50に関して45度傾けられる。
次のステップにおいて、関連付けられた時間遅延ΔtA、ΔtB、ΔtCがΔt=Ax/vに従って決定されるが、ΔtBは、xBが0.25以下である場合にのみ決定される。したがって、図6Aおよび図7Bに図示されるように25cm長の縁および25の仮想点を有する正方形板、ならびにv=500m/sに対して、xA、xB、xCおよびΔtA、ΔtB、ΔtCに対する値は次の通りである。
Figure 2023506240000004
示されるように、ΔtA、ΔtB、ΔtCの一部の値がゼロである、またはxB>0.25について決定されない。結果として、各仮想点nに対して、ΔtA、ΔtB、ΔtCに対する1つまたは2つの異なる非ゼロ値が存在する。これらの値は、次いでΔt1およびΔt2であると判定される。(以下の表を参照)。
各仮想点nに対するハイパスフィルタのための遮断周波数が決定されてよい
Figure 2023506240000005
したがって、その縁が自由に振動しかつその材料構造が均質である、625cm2の全表面面積Aの板形状を有する仮想音源に対して、Δtおよびfcに対する以下の値が使用されてよい。
Figure 2023506240000006
したがって、これらの値により、ユーザは、発生された音声信号が均質物質のかつ特定の大きさの板形状の音源から発していると知覚するであろうが、一方スピーカは特定の方式で空間的に配置される必要はない。
一実施形態において、本方法は、仮想音源の形状におけるそれぞれの仮想点の仮想位置を表現する形状データを得るステップと、それぞれの仮想点の仮想位置に基づいてそれぞれの時間遅延動作によって導入されるべき時間遅延を決定するステップとを含む。仮想音源が正方形板として成形される場合、時間遅延は、上記した式を使用して決定されてよい。
2D形状の場合と同様に、3D形状に関しては、形状において定められる仮想点と関連付けられた発生される音声信号成分yn(t)の一部または各々に対して2つ以上の修正音声信号成分が決定される。各仮想点に対して導入されるべき時間遅延に対する値はΔt=Vx/vに従っており、式中、Vは形状の体積であり、xは仮想点nに対して形状の中心および/または縁から点nまでの半径方向の長さrnに従う乗算係数を意味し、そしてvは媒体中の音速に関する。
各幾何形状および/または不均質物質もしくは材料条件の異材料に対して、形状の空間次元と各仮想点における時間差値との間の関係に従ってアルゴリズムの種々の変更が適用されてよい。
正多角形でなくかつ/または不規則に成形された形状の場合、発生される音声信号成分yn(t)の一部または各々に対して3つ以上の修正音声信号成分が得られてよい。
図7Cは、図7Aの実施形態の代替である実施形態を例示する。図7Aの実施形態が2つのビルディングブロック21を直列に図示するのに対して、図7Cの実施形態は、2つのビルディングブロック21を並列に配置できることを図示する。図7Cの実施形態における値ax,xは図7Aの実施形態における値ax,xと同じであり、そしてbx,xの値は図7Aの実施形態における値bx,xと同じである。
図7Cの実施形態は、各信号成分y1(t)に対して、bn.1およびbn.2の値を互いと独立して制御できるという点で特に有利である。
図7Cが各yx(t)信号の発生のために2つのビルディングブロック21が並列に配置されることを図示するが、各yx(t)信号の発生のために、3つ、4つ、5つ、6つ以上など、3つ以上のビルディングブロック21も並列に配置できることが認められるべきである。
図7Dは、図7Cの実施形態の代替である実施形態を例示する。図7Cの実施形態が2つのビルディングブロック21を並列に配置できることを図示するのに対して、図7Dは、2つの完全なビルディングブロックの代わりに、2つ以上の修正音声信号を、例えば3つ、4つ、5つ、6つ以上さえ、並列に音声入力信号から発生し、次いで合計し、任意選択で、各信号yx(t)を発生させるために音声入力信号と合計される前に、減衰動作で更に修正できることを図示する。図7Dの実施形態における値ax,xは、図7Aおよび図7Cの実施形態における値ax,xと同じである。図7Dは、それがビルディングブロックの配置内の信号経路の量を削減することによってより効果的な処理を可能にするという点で有利である。
図8は、図6Aに示される(上)音声信号成分y1(t)のスペクトログラムおよび(上から2番目)音声信号成分y6(t)のスペクトログラムおよび(中)音声信号成分y7(t)のスペクトログラムおよび(下から2番目)音声信号成分y11(t)のスペクトログラムおよび(下)音声信号成分y13(t)のスペクトログラムを示す。時間遅延に対する値および周波数遮断fcの値は上記表に見出され得る。
図9Aは、発生された音声信号が、観察者Oから水平距離離れるなど、距離をおいて配設される音源Sから発していると観察者によって知覚されるであろう本方法の一実施形態に係るフローチャートを図示する。水平距離は、知覚された仮想音源と観察者との間の距離として理解されてよく、ここで仮想音源は観察者の前に配設される。
本実施形態において、入力音声信号x(t)は、時間遅延を導入する時間遅延動作および信号フィードバック動作を使用して修正されて第1の修正音声信号を得る。次いで、入力音声信号x(t)および第1の修正音声信号の結合に基づいて第2の修正音声信号が発生される。音声信号y(t)は、第2の修正音声信号を減衰させることによって、および任意選択で図示される時間遅延動作を行うことによって発生される。
好ましくは、第1の修正音声信号を得るために行われる時間遅延動作によって導入される時間遅延は可能な限り短く、例えば0.00007秒より短く、好ましくは0.00005秒より短く、より好ましくは0.00002秒より短い。最も好ましくは、約0.00001秒である。96kHzのデジタルサンプルレートの場合には、時間遅延は0.00001秒でよい。
dの値とともに値cに依存して、観察者は、自分自身と仮想音源との間の種々の距離を知覚するであろう。本明細書において、三角形内、すなわち減衰または増幅動作内の値は、信号が乗算される定数を示すと理解されてよい。したがって、そのような値が1より大きければ、信号増幅が行われる。そのような値が1より小さければ、信号減衰が行われる。c=0およびd=1の場合には距離は知覚されることなく、そしてc=1およびd=0の場合には相対距離に対応して最大距離が知覚されることになり、音源は知覚できなくなり、したがって結果的な合計音声信号の出力は0(-inf dB)であろう。信号フィードバック動作を行って第1の修正音声信号を決定するために、dに対する値はd=1-cxとしてcに対する値に関連してよく、式中xに対する値は、高周波散逸曲線の峻度に影響する信号フィードバックの量に適用される1以下の乗算係数である。
一例において、本方法は、仮想音源の距離を表現する距離データを得るステップを含む。次いで、修正音声信号を得るために入力音声信号は仮想音源の距離に依存して減衰される。
Δt2によって示される任意選択の時間遅延は、仮想音源の移動と関連付けられたドップラー効果を生じさせることができる。Δt2はΔt2=L/vとして決定されてよく、式中、Lは音源Sと観察者Oとの間の距離であり、そしてvは媒体中の音速である。
図9C、図9Dおよび図9Eは、図9Aの実施形態の代替実施形態を例示する。本明細書において、c、dに対するおよび導入された時間遅延に対する値は、図9Bに図示されるのと同じである。
図9Cは、信号遅延動作が信号フィードバック動作において行われるという点で図9Aに図示される実施形態と異なる。
図9Dは、入力音声信号の修正されたもの13をそれ自体に再帰的に加える信号フィードバック動作を使用して入力音声信号を修正して第1の修正音声信号11を得るステップであって、フィードバック動作が、時間遅延を導入する信号遅延動作を含む、ステップを含む実施形態を例示する。本実施形態において、音声信号y(t)は第1の修正音声信号11に基づいて発生され、このステップは、信号減衰15および任意選択で、第2の時間遅延を導入する時間遅延動作を含む。
図9Eは、第1の修正音声信号11および第1の修正音声信号の時間遅延されたもの13の結合10に基づいて第2の修正音声信号17を発生させ、そして第2の修正音声信号に基づいて、したがって第1の修正音声信号に基づいて音声信号y(t)を発生させるステップを含む実施形態を例示する。
図10(上)は、c=0を適用した後の合計音声信号のスペクトログラムを示す。入力音声信号は白色雑音である。ここで、c=0である場合、修正は合計音声信号において見られない。
図10(中)は、c=0.5を適用した後の合計音声信号のスペクトログラムを示す。入力音声信号は白色雑音である。観察可能な結果は、-12dBの音量の減少および観察者と長さL上の音との間の知覚距離が増すにつれての高周波の緩やかな減衰であり、すなわち音の高周波ほど低周波より速く比例して散逸する。高周波散逸の曲率は、1より小さくかつ信号フィードバック振幅に乗算する値xを変化させることによって増減するであろう。
図10(下)は、c=0.99を適用した後の合計音声信号のスペクトログラムを示す。入力音声信号は白色雑音である。全体の音量は-32dB減少し、そして高周波散逸曲線の峻度は増し、出力音声信号をほとんど聞こえなくさせ、知覚された効果は、音が遠くでほぼ完全に散逸したかのようであった。
図11Aは、仮想音源Sが観察者Oより上の仮想高さHに配設される本方法の実施形態を例示するフローチャートを図示する(図11Bも参照)。ここで、第3の修正音声信号を得るために、入力音声信号x(t)は、信号反転動作、信号減衰動作および、時間遅延を導入する時間遅延動作を使用して修正される。次いで、音声信号は、入力音声信号および第3の修正音声信号の結合、例えば総和に基づいて発生される。
信号遅延動作、信号反転動作および信号減衰動作がいかなる順に行われてもよいことが認められるべきである。
入力音声信号x(t)は、好ましくは仮想音源が観察者より上に高く配設されるほど減衰度が低いように、高さに依存して減衰されて第3の修正音声信号を得てよい。これは、音源Sの高さが増すにつれてeに対する値が増加するという点で図11に図示される。
図11Aに描かれる導入された時間遅延は、好ましくは可能な限り短く、例えば0.00007秒より短く、好ましくは0.00005秒より短く、より好ましくは0.00002秒より短い。最も好ましくは96kHzのデジタルサンプルレートの場合には、時間遅延は0.00001秒でよい。
仮想音源が聴取者より上に配設される場合、入力音声信号を修正して第3の修正音声信号を得ることは、信号フィードバック動作を行うことを任意選択で含む。特定の例において、このステップは、信号、例えば第3の修正音声信号を最終的に得るために行われる時間遅延動作、信号減衰動作および信号反転動作から生じた信号の減衰されたものをそれ自体に再帰的に加えるステップを含む。信号フィードバック動作が行われる場合、値fはf=e*xに等しくてよく、式中xに対する値は、低周波散逸曲線の峻度に影響する信号フィードバックの量に適用される1未満の乗算係数である。値eを、好ましくは0~1間で変化させることによって、高さの知覚を、任意選択で同時に値fとともに、音声信号に加えることができる。ここで、e=0およびf=0は、高さが知覚されないことに相当し、そしてe=1およびf<1は、最大知覚高さ、すなわち音源がほとんど知覚できなくなった観察者より上の距離に相当する。
図12は、本発明の一実施形態に係る音声信号のスペクトルを描く。
図12(上)は、e=0を適用した後の合計音声信号のスペクトログラムを示す。入力音声信号は白色雑音である。ここで、e=0である場合、修正は合計音声信号において見られない。
図12(中)は、e=0.5を適用した後の合計音声信号のスペクトログラムを示す。入力音声信号は白色雑音である。観測可能な結果は、観察者Oより上の音源Sの知覚高さHが増すにつれての低周波の緩やかな減衰であり、すなわち音の低周波ほど値eの比例的増加とともに散逸する。低周波散逸の曲線の峻度は、1より小さくかつ信号フィードバック振幅fに乗算する値xを変化させることによって増減する。
図12(下)は、e=0.99を適用した後の合計音声信号のスペクトログラムを示す。入力音声信号は白色雑音である。高周波散逸曲線の峻度は増し、出力音声信号をf<12kHzにわたってほとんど聞こえなくさせ、知覚された効果は、音が知覚者の頭部より上に遠距離であるかのようであった。
図13Aは、仮想音源Sが観察者Oより下の仮想深さDに配設される本方法の実施形態を例示するフローチャートを図示する。(図13Bも参照)。本実施形態は、第6の修正音声信号を得るために時間遅延を導入する時間遅延動作、信号減衰および信号フィードバック動作を使用して入力音声信号x(t)を修正するステップを含む。描かれた実施形態において、信号フィードバック動作を行うステップは、信号、例えば第6の修正音声信号を最終的に得るために行われる時間遅延動作から生じた信号の減衰されたものをそれ自体に再帰的に加えるステップを含む。描かれた実施形態の場合、これは、hに対する値が非ゼロであることを意味する。好ましくは、再帰的に加えられる信号は、例えば仮想音源が観察者より下に低く配設されるほどこの減衰が低い(図13においてhに対する高い値に対応する)ように、観察者より下の深さに依存して減衰される。フィードバック動作の前の入力音声信号の減衰は、仮想音源が観察者より下に低く配設されるほど減衰が低い(図13においてgに対する高い値に対応する)ように行われてよい。次いで、音声信号y(t)は、入力音声信号および第6の修正音声信号の結合に基づいて発生される。
図13Aに描かれる導入された時間遅延は、好ましくは可能な限り短く、例えば0.00007秒より短く、好ましくは0.00005秒より短く、より好ましくは0.00002秒より短い。最も好ましくは96kHzのデジタルサンプルレートの場合には、時間遅延は0.00001秒でよい。
g=0およびh=0の場合には深さは知覚されることなく、ならびにg=1およびh=1の場合には音源Sと観察者Oとの間に最大深さが知覚されることになる。信号フィードバック動作を行って第3の修正音声信号を決定するために、hに対する値はh=g*xとしてgに対する値に関連してよく、式中xに対する値は、高周波散逸曲線の峻度に影響する、信号フィードバックの量に適用される1以下の乗算係数である。
図13C~図13Fは、仮想音源が観察者より下の仮想深さに配設される図13Aの実施形態の代替実施形態を図示する。qの値および信号遅延動作によって導入される時間遅延は、図13Aにおいてと同じでよい。
図13Cおよび図13Dは、修正音声信号を得るために、時間遅延を導入する時間遅延動作23、第1の信号減衰動作25および信号フィードバック動作を使用して入力音声信号x(t)を修正するステップと、入力音声信号およびこの修正音声信号の結合に基づいて音声信号を発生させるステップとを各々含む他の実施形態である。直ちに見て取ることができるように、図13Cおよび図13Dの実施形態は、信号遅延動作および信号減衰が信号フィードバック動作において行われてもまたは行われなくてもよいという点で図13Aの実施形態と異なる。
図13Eは、入力音声信号の修正されたものをそれ自体に再帰的に加える信号フィードバック動作を使用して音声信号y(t)を発生させるステップであって、フィードバック動作が、時間遅延を導入する信号遅延動作23および第1の信号減衰動作25を含む、ステップを含む実施形態を図示する。
図13Fは、信号フィードバック動作を使用して修正音声信号11が決定され、かつ音声信号y(t)が修正音声信号およびこの修正音声信号の時間遅延、減衰されたものの結合10に基づいて決定される実施形態を図示する。
図14は、本発明の一実施形態に係る音声信号を発生させるための方法およびシステムを描く。特に、図14は、空間波変換の複雑なフローチャートを描写する。入力信号x(t)に基づいて、幾つかの音声信号成分yn(t)が、例えば仮想音源の形状における各仮想点に対して1つ、決定される。各音声信号成分yn(t)は、ボックス70n内に示されるステップを行うことによって決定される。ボックス701に図示されるステップを行うことによって音声信号成分y1(t)が決定される。各ボックス70nにおいて、同様のステップが行われてよいとはいえ、他の値のパラメータを使用する。
図14は、特に本明細書に記載される幾つかの実施形態の組み合わせ例を例示する。ボックス72は図7Aの実施形態から成るが、しかしながら、図7Cまたは図7Dの実施形態から成ってもよい。ボックス74は、図9Aに例示される実施形態から成るが、しかしながら、実施形態9C、9D、9Eのいずれもボックス74に実装されてよいことが認められるべきである。ボックス76は、図11Aに例示される実施形態から成る。ボックス78は、図13Aに例示される実施形態から成るが、しかしながら、それぞれの図13C、図13D、図13Eおよび図13Fの実施形態のいずれもボックス78に実装されてよい。したがって、ボックス72の時間遅延動作によって導入される時間遅延は、図7A~図7Dを参照しつつ本明細書に記載された方法に従って決定されてよい。上記したように、ボックス72における信号反転動作は、仮想音源がその縁において自由に振動できない場合に行われるだけでよい。そのような場合、ハイパスフィルタ73は作動しない。仮想音源がその縁において自由に振動できる場合、ボックス72における信号反転動作は行われない。そのような場合、好ましくは、ハイパスフィルタは作動する。遮断周波数に対する値は、図7A~図7Dを参照しつつ記載された方法に従って決定されてよい。更に、ボックス74におけるパラメータcおよびdならびに時間遅延は、図9A~図9Eを参照しつつ記載されたように値が付けられおよび/または変更および/または決定されてよい。パラメータeおよびfは、図11Aおよび図11Bを参照しつつ記載されたように値が付けられおよび/または変更および/または決定されてよい。パラメータgおよびhは、図13A~図13Fを参照しつつ記載されたように値が付けられおよび/または変更および/または決定されてよい。
更に、ビルディングブロック21が図1B~図1Jに描かれるビルディングブロックのいずれでもよいことが認められるべきである。
描かれた実施形態において、音声信号成分を発生させるステップは、したがって、ボックス72によって示されるステップによって行われてよい、入力音声信号に次元情報を加えるステップ、ボックス74によって示されるステップによって行われてよい、距離情報を加えるステップ、およびボックス76によって示されるステップによって行われてよい、高さ情報を加えるステップ、またはボックス78によって示されるステップによって行われてよい、深さ情報を加えるステップを含む。更に、例えばボックス80に図示される追加の時間遅延を加えることによって、入力音声信号にドップラー効果が加えられてよい。
好ましくは、仮想音源が観察者より上または下に配設されるので、モジュール76または78の一方だけが行われる。モジュール76は、e=0を設定することによって作動しないようにすることができ、およびモジュール78は、g=0を設定することによって作動しないようにすることができる。
図15は、本発明の一実施形態に係るユーザインタフェース90を描く。本方法の一実施形態は、本明細書に記載されるユーザインタフェース90を生成するステップを含む。このユーザインタフェース90は、ユーザが仮想音源の形状、
- 仮想音源の形状における仮想点のそれぞれの仮想位置、
- 仮想音源と観察者との間の距離、
- 仮想音源が観察者より上に配設される高さ、
- 仮想音源が観察者より下に配設される深さ
を入力することを可能にする。
空間波変換の全ての機能動作は、フロントエンドユーザ特性、すなわち仮想空間における音の可聴操作に変換される。本発明の応用は、決してこの特定のインタフェース例のレイアウトに限定されず、かつシステム設計の多数の手法の対象でありかつ仮想空間において音源を成形および配設するための多数の制御レベルを伴うことができ、またいかなる特定のプラットフォーム、媒体またはビジュアルデザインおよびレイアウトにも限定されない。
描かれたユーザインタフェース90は、ユーザが入力受信を使用してチェーンの入力音声信号を制御することを可能にする入力モジュールを備える。入力受信は、共にチェーンの音声入力信号として結合される、他のチェーンまたは外部音声源から受信する、複数音声チャネルから成ってよい。ユーザインタフェースは、ユーザが、例えばゲインノブ92を使用することによって、各入力チャネルの増幅を制御することを可能にする。
ユーザインタフェース90は、ユーザがチェーンの合計された音声出力信号を他のチェーンへの音声入力信号としてルーティングすることを可能にする出力モジュールを更に備えてよい。
ユーザインタフェース90は、ユーザが、例えばドロップダウンメニュー96を用いて、その形状など、仮想音源に関するパラメータを入力すること、ならびに/または仮想音源が中空であるかもしくは中身があるか、および/もしくは仮想音源のスケールおよび/もしくはその次元、例えばそのデカルト次元および/もしくは回転および/もしくは分解能を入力することを可能にする仮想音源定義セクションを更に備えてよい。後者は、仮想表面積の単位当たり仮想点が幾つ決定されるかを示す。これは、ユーザが必要とされる計算の量を制御することを許容する。
回転に関するパラメータを入力するための入力手段は、次元x、yおよびzに対するエンドレス回転ノブとして提示されてよい。
ユーザインタフェース90は、ユーザが仮想音源の位置に関するパラメータを入力することを可能にする位置セクタを更に備えてよい。3次元空間における形状の位置は、直角座標+/-x,y,zで表されてよく、空間の仮想中心が0,0,0として示され、また内部に仮想物体を置いて動かすことができる可視3次元場として提示されてよい。この3次元制御場は、場の半径を調整することによって大きさが拡縮されてよい。
ユーザインタフェース90は、ユーザが、共振の帯域幅およびピークレベル、知覚距離、知覚高度、ドップラー効果などの様々なパラメータを制御することを可能にする属性セクション100を更に備えてよい。
ユーザインタフェース90は、ユーザが出力を制御することを可能にする出力セクション102を更に備えてよい。例えば、設定された量の音声出力チャネルに分配される各音声信号成分の離散増幅が制御されてよい。各スピーカのゲインは、i)仮想音源の形状のモデル化、ii)3次元空間における形状の回転およびiii)3次元空間における形状の位置によって自動制御されてよい。音声出力チャネルへの音声信号成分の分配のための方法は、スピーカ構成の種類に依存してよくかつ当該技術で公知の任意のそのような方法によって達成されてよい。
出力セクション102は、マスタレベルフェーダ104を備えてよい。
ユーザインタフェースを通して受け取られるユーザ入力は、本明細書に記載される方法に従ってパラメータに対する適切な値を決定するために使用されてよい。
図16は、一実施形態に係るデータ処理システムを例示するブロック図を描く。図16に図示されるように、データ処理システム1100は、システムバス1106を通じてメモリ要素1104に結合される少なくとも1つのプロセッサ1102を含んでよい。そのため、データ処理システムは、メモリ要素1104内にプログラムコードを記憶してよい。更に、プロセッサ1102は、システムバス1106を介してメモリ要素1104からアクセスされるプログラムコードを実行してよい。1つの態様において、データ処理システムは、プログラムコードを記憶および/または実行するのに適切であるコンピュータとして実装されてよい。しかしながら、データ処理システム1100が、本明細書内に記載される機能を行うことが可能であるプロセッサおよびメモリを含む任意のシステムの形態で実装されてよいことが認められるべきである。
メモリ要素1104は、例えばローカルメモリ1108などの1つまたは複数の物理メモリデバイスおよび1つまたは複数の大容量記憶デバイス1110を含んでよい。ローカルメモリは、一般にプログラムコードの実際の実行中に使用されるランダムアクセスメモリまたは他の非持続性メモリデバイスを指してよい。大容量記憶デバイスは、ハードドライブまたは他の持続性データ記憶デバイスとして実装されてよい。処理システム1100は、プログラムコードが実行中に大容量記憶デバイス1110から取り出されなければならない回数を低減させるために少なくとも一部のプログラムコードの一時記憶を提供する1つまたは複数のキャッシュメモリ(図示せず)も含んでよい。
入力デバイス1112および出力デバイス1114として描かれる入出力(I/O)デバイスを任意選択でデータ処理システムに結合できる。入力デバイスの例は、キーボード、マウスなどのポインティングデバイス等を含んでよいが、これに限定されない。出力デバイスの例は、モニタまたはディスプレイ、スピーカ等を含んでよいが、これに限定されない。入力および/または出力デバイスは、データ処理システムに直接にまたは介在I/Oコントローラを通して結合されてよい。
一実施形態において、入力および出力デバイスは、複合入出力デバイス(図16において入力デバイス1112および出力デバイス1114を囲む破線で例示される)として実装されてよい。そのような複合デバイスの一例がタッチ感応ディスプレイであり、時に「タッチスクリーンディスプレイ」または単に「タッチスクリーン」とも称される。そのような実施形態において、デバイスへの入力は、タッチスクリーンディスプレイ上のまたは近くの、例えばスタイラスまたはユーザの指などの物理的物体の移動によって提供されてよい。
ネットワークアダプタ1116もデータ処理システムに結合されて、それが介在プライベートまたはパブリックネットワークを通じて他のシステム、コンピュータシステム、リモートネットワークデバイスおよび/またはリモート記憶デバイスに結合されるようになることを可能にしてよい。ネットワークアダプタは、上記システム、デバイスおよび/またはネットワークによってデータ処理システム1100に送信されたデータを受信するためのデータレシーバ、ならびにデータ処理システム1100から上記システム、デバイスおよび/またはネットワークにデータを送信するためのデータトランスミッタを備えてよい。モデム、ケーブルモデムおよびイーサネットカードが、データ処理システム1100と使用されてよい異なる種類のネットワークアダプタの例である。
図16に描かれるように、メモリ要素1104はアプリケーション1118を記憶してよい。様々な実施形態において、アプリケーション1118は、ローカルメモリ1108に、1つもしくは複数の大容量記憶デバイス1110に、またはローカルメモリおよび大容量記憶デバイスとは別に記憶されてよい。データ処理システム1100が、アプリケーション1118の実行を容易にすることができるオペレーティングシステム(図16に図示されない)を更に実行してよいことが認められるべきである。アプリケーション1118は、実行可能プログラムコードの形態で実装されており、データ処理システム1100によって、例えばプロセッサ1102によって実行できる。アプリケーションを実行することに応じて、データ処理システム1100は、本明細書に記載される1つまたは複数の動作または方法のステップを行うように構成されてよい。
本発明の1つの態様において、データ処理システム1100は音声信号処理システムを表してよい。
本発明の様々な実施形態がコンピュータシステムで使用するためのプログラム製品として実装されてよく、プログラム製品のプログラムが実施形態の機能(本明細書に記載される方法を含む)を定める。1つの実施形態において、プログラムは各種の非一時的コンピュータ可読記憶媒体に収容することができるが、本明細書で使用される場合、表現「非一時的コンピュータ可読記憶媒体」は全てのコンピュータ可読媒体を含み、唯一の例外が一時的な、伝搬している信号である。別の実施形態において、プログラムは各種の一時的コンピュータ可読記憶媒体に収容することができる。例示的なコンピュータ可読記憶媒体は、(i)情報が持続的に記憶される書き込み可能でない記憶媒体(例えば、CD-ROMドライブによって読み取り可能なCD-ROMディスク、ROMチップまたは任意の種類のソリッドステート不揮発性半導体メモリなどのコンピュータ内のリードオンリメモリデバイス)、および(ii)変更可能な情報が記憶される書き込み可能記憶媒体(例えば、フラッシュメモリ、ディスケットドライブ内のフロッピーディスクもしくはハードディスクドライブまたは任意の種類のソリッドステートランダムアクセス半導体メモリ)を含むが、これらに限定されない。コンピュータプログラムは、本明細書に記載されるプロセッサ1102において実行されてよい。
本明細書で使用される技術用語は単に特定の実施形態を記載する目的であり、本発明を限定しているとは意図されない。本明細書で使用される場合、単数形「或る1つ(a)」、「或る1つ(an)」および「その1つ(the)」は、文脈が別途明示しない限り、複数形も含むと意図される。用語「備える(comprises)」および/または「備え(comprising)」は、本明細書で使用される場合、明言された特徴、整数、ステップ、動作、要素および/または部品の存在を特定するが、1つまたは複数の他の特徴、整数、ステップ、動作、要素、部品および/またはその群の存在または追加を排除しないことが更に理解されるであろう。
以下の請求項における全ての手段またはステップに加えて機能要素の対応する構造、材料、動作および等価物は、詳細に特許請求される他の特許請求要素と組み合わせて機能を行うための任意の構造、材料または動作を含むと意図される。本発明の実施形態の説明は例示の目的で提示されたが、網羅的であるとも、または開示された形態の実装例に限定されるとも意図されない。本発明の範囲および思想から逸脱することなく、多くの変更および変形が当業者にとって明らかであろう。実施形態は、本発明の原理および一部の実際的応用を最もよく説明するため、ならびに企図された特定の使用に適した様々な変更を伴う様々な実施形態に関して当業者が本発明を理解することを可能にするために選ばれて記載された。
4 信号遅延動作
6 信号反転動作
8 信号増幅もしくは減衰
10 結合動作
11 修正音声信号
12 減衰動作
10、12 信号フィードバック動作
13 修正されたもの
14 結合動作
15 信号減衰
161~16 n 信号反転動作
17 第2の修正音声信号
181~18n 信号フィードバック動作
191~19n 信号減衰素子
20 音声入力信号
21 ビルディングブロック
222、223および224 修正音声信号成分
23 時間遅延動作
24 板形状の音源
25 第1の信号減衰動作
26 立方体形状の音源
30 信号フィードバック動作
32 結合
34 減衰素子
36 信号フィードバック動作
38 結合
40 減衰動作
42 ハイパスフィルタ動作
50 仮想音源
52 円
54 正方形
56 円
58 正方形
60 円
62 正方形
70n ボックス
72 ボックス
73 ハイパスフィルタ
74 ボックス
76 ボックス
78 ボックス
80 ボックス
90 ユーザインタフェース
92 ゲインノブ
96 ドロップダウンメニュー
100 属性セクション
102 出力セクション
104 マスタレベルフェーダ
1100 データ処理システム
1102 プロセッサ
1104 メモリ要素
1106 システムバス
1108 ローカルメモリ
1110 大容量記憶デバイス
1112 入力デバイス
1114 出力デバイス
1116 ネットワークアダプタ
1118 アプリケーション
x(t) 入力音声信号
y(t) 発生された音声信号
yn(t) 音声信号成分

Claims (26)

  1. 仮想音源と関連付けられた音声信号y(t)を発生させるための方法であって、前記方法が(i)
    入力音声信号x(t)を得るステップと、
    時間遅延を導入する信号遅延動作を使用して前記入力音声信号x(t)を修正して修正音声信号を得るステップと、
    前記入力音声信号x(t)の、または前記入力音声信号x(t)の反転および/もしくは減衰もしくは増幅されたものの、前記修正音声信号との結合、例えば総和に基づいて前記音声信号y(t)を発生させるステップとを含むか、あるいは前記方法が(ii)
    入力音声信号x(t)を得るステップと、
    前記入力音声信号x(t)の修正されたものをそれ自体に再帰的に加える信号フィードバック動作に基づいて前記音声信号y(t)を発生させるステップであって、前記信号フィードバック動作が、時間遅延を導入する信号遅延動作および、任意選択で、信号反転動作を含む、ステップとを含む、方法。
  2. 前記仮想音源が形状を有し、前記方法が、
    前記仮想音源の形状におけるそれぞれの仮想点と関連付けられた音声信号成分を発生させるステップであって、前記仮想音源の形状における第1の仮想点と関連付けられた第1の音声信号成分および前記仮想音源の形状における第2の仮想点と関連付けられた第2の音声信号成分を発生させることを含む、ステップを含んでおり、(i)
    前記第1の音声信号成分を発生させることが、第1の時間遅延を導入する第1の信号遅延動作を使用して前記入力音声信号を修正して修正された第1の音声信号成分を得るステップを含み、かつ前記入力音声信号の、または前記入力音声信号x(t)の反転および/もしくは減衰もしくは増幅されたものの、前記修正された第1の音声信号成分との結合、例えば総和に基づいて前記第1の音声信号成分を発生させるステップを含むか、あるいは(ii)
    前記第1の音声信号成分を発生させることが、前記入力音声信号x(t)の修正されたものをそれ自体に再帰的に加えるフィードバックループを使用するステップであって、前記フィードバックループが、第1の時間遅延を導入する信号遅延動作および信号反転動作を含む、ステップを含み、かつ(i)
    前記第2の音声信号成分を発生させることが、前記第1の時間遅延と異なる第2の時間遅延を導入する第2の信号遅延動作を使用して前記入力音声信号を修正して修正された第2の音声信号成分を得るステップを含み、かつ前記入力音声信号の、または前記入力音声信号x(t)の反転および/もしくは減衰もしくは増幅されたものの、前記修正された第2の音声信号成分との結合、例えば総和に基づいて前記第2の音声信号成分を発生させるステップを含むか、あるいは(ii)
    前記第2の音声信号成分を発生させることが、前記入力音声信号x(t)の修正されたものをそれ自体に再帰的に加えるフィードバックループを使用するステップであって、前記フィードバックループが、第2の時間遅延を導入する信号遅延動作および信号反転動作を含む、ステップを含む、請求項1に記載の方法。
  3. 前記仮想音源の形状における前記それぞれの仮想点の仮想位置を表現する形状データを得るステップと、
    前記第1または第2の仮想点の前記仮想位置に基づいてそれぞれ前記第1または第2の時間遅延を決定するステップと
    を含む、請求項2に記載の方法。
  4. 前記仮想音源が観察者から距離を有し、前記方法が、
    時間遅延を導入する時間遅延動作および信号フィードバック動作を使用して前記入力音声信号を修正して第1の修正音声信号を得るステップと、
    前記入力音声信号x(t)および前記第1の修正音声信号の結合に基づいて第2の修正音声信号を発生させるステップと、
    前記第2の修正音声信号に基づいて前記音声信号y(t)を発生させるステップであって、前記第2の修正音声信号を減衰させることを含み、かつ任意選択で、第2の時間遅延を導入する時間遅延動作を行うことを含む、ステップとを含む、請求項1から3の一項または複数項に記載の方法。
  5. 前記仮想音源が観察者から距離を有し、前記方法が、
    前記入力音声信号の修正されたものをそれ自体に再帰的に加える信号フィードバック動作を使用して前記入力音声信号を修正して第1の修正音声信号を得るステップであって、前記フィードバック動作が、時間遅延を導入する信号遅延動作を含む、ステップと、
    前記第1の修正音声信号に基づいて前記音声信号y(t)を発生させるステップであって、信号減衰および任意選択で、第2の時間遅延を導入する時間遅延動作を含む、ステップとを含み、任意選択で前記方法が、
    前記第1の修正音声信号および前記第1の修正音声信号の時間遅延されたものの結合に基づいて第2の修正音声信号を発生させ、前記第2の修正音声信号に基づいて、したがって前記第1の修正音声信号に基づいて前記音声信号y(t)を発生させるステップを更に含む、請求項1から3の一項または複数項に記載の方法。
  6. 前記導入された時間遅延が0.00007秒より短く、好ましくは0.00005秒より短く、より好ましくは0.00002秒より短く、最も好ましくは約0.00001秒である、請求項4または5に記載の方法。
  7. 前記仮想音源の距離に依存して前記第2の修正音声信号を減衰させるステップを含む、請求項4から6のいずれか一項に記載の方法。
  8. 前記信号フィードバック動作が、信号、例えば前記時間遅延を導入する前記時間遅延動作を行った後に得られるような前記信号を減衰させ、前記減衰された信号を前記信号自体に再帰的に加えることを含み、前記方法が、
    前記距離が大きいほど、前記信号フィードバック動作における減衰度が低くかつ前記第2の修正音声信号の減衰度が高いように、前記距離に依存して前記信号フィードバック動作における前記減衰度および前記第2の修正音声信号の前記減衰度を制御するステップを更に含む、請求項7に記載の方法。
  9. 前記入力音声信号を修正して前記第1の修正音声信号を得るステップが、特定の信号減衰を含み、前記方法が、
    前記距離が大きいほど、前記特定の信号減衰の減衰度が低くかつ前記第2の修正音声信号の減衰度が高いように、前記距離に依存して前記特定の信号減衰の前記減衰度および前記第2の修正音声信号の前記減衰度を制御するステップを含む、請求項7に記載の方法。
  10. 前記仮想音源が、観察者より上の仮想高さに配設され、前記方法が、
    第3の修正音声信号を得るために信号反転動作、信号減衰動作、および時間遅延を導入する時間遅延動作を使用して前記入力音声信号x(t)を修正するステップと、
    前記入力音声信号および前記第3の修正音声信号の結合に基づいて前記音声信号を発生させるステップとを含む、請求項1から9の一項または複数項に記載の方法。
  11. 前記第3の修正音声信号を得るために前記入力音声信号を修正するステップが、信号フィードバック動作を行うステップを含む、請求項10に記載の方法。
  12. 前記第3の修正音声信号を得るための前記信号減衰動作が前記仮想音源の前記高さに依存して行われる、請求項10または11に記載の方法。
  13. 前記信号減衰動作が、前記仮想音源が前記観察者より上に高く配設されるほど、前記減衰度が低いように行われる、請求項12に記載の方法。
  14. 前記第3の修正音声信号を得るために導入される前記時間遅延が0.00007秒より短く、好ましくは0.00005秒より短く、より好ましくは0.00002秒より短く、最も好ましくは約0.00001秒である、請求項10から13の一項または複数項に記載の方法。
  15. 前記仮想音源が観察者より下の仮想深さに配設され、前記方法が、
    第6の修正音声信号を得るために時間遅延を導入する時間遅延動作、第1の信号減衰動作および信号フィードバック動作を使用して前記入力音声信号x(t)を修正するステップと、
    前記入力音声信号および前記第6の修正音声信号の結合に基づいて前記音声信号を発生させるステップとを含む、請求項1から9の一項または複数項に記載の方法。
  16. 前記仮想音源が観察者より下の仮想深さに配設され、前記方法が、
    前記入力音声信号の修正されたものをそれ自体に再帰的に加える信号フィードバック動作を使用して前記音声信号y(t)を発生させるステップであって、前記フィードバック動作が、時間遅延を導入する信号遅延動作および第1の信号減衰動作を含む、ステップを含む、請求項1から9の一項または複数項に記載の方法。
  17. 前記仮想音源が観察者より下の仮想深さに配設され、前記方法が、
    前記入力音声信号の修正されたものをそれ自体に再帰的に加える信号フィードバック動作を使用して前記入力音声信号を修正して第6の修正音声信号を得るステップであって、前記フィードバック動作が、時間遅延を導入する信号遅延動作および第1の信号減衰を含む、ステップと、
    前記第6の修正音声信号ならびに前記第6の修正音声信号の時間遅延され減衰されたものの結合に基づいて前記音声信号を発生させるステップとを含む、請求項1から9の一項または複数項に記載の方法。
  18. 前記第6の修正音声信号を得るための前記導入された時間遅延が0.00007秒より短く、好ましくは0.00005秒より短く、より好ましくは0.00002秒より短く、最も好ましくは約0.00001秒である、請求項15から17のいずれか一項に記載の方法。
  19. 前記信号フィードバック動作を行うステップが、信号、例えば前記第6の修正音声信号を最終的に得るために行われる前記時間遅延動作および減衰動作から生じた前記信号の減衰されたものをそれ自体に再帰的に加えるステップを含む、請求項15から18の一項または複数項に記載の方法。
  20. 前記第1の信号減衰動作が前記観察者より下の前記仮想音源の前記深さに依存して行われる、請求項15から19のいずれか一項に記載の方法。
  21. 前記第1の信号減衰動作が、前記仮想音源が前記観察者より下に低く配設されるほど、前記減衰が低いように行われる、請求項20に記載の方法。
  22. - 前記仮想音源の形状を示し、かつ/または
    - 前記仮想音源の形状における仮想点のそれぞれの仮想位置を示し、かつ/または
    - 前記仮想音源と前記観察者との間の前記距離を示し、かつ/または
    - 前記仮想音源が前記観察者より上に配設される前記高さを示し、かつ/または
    - 前記仮想音源が前記観察者より下に配設される前記深さを示す
    ユーザ入力を受けるステップを更に含む、請求項1から21の一項または複数項に記載の方法。
  23. - 前記仮想音源の形状、
    - 前記仮想音源の形状における仮想点のそれぞれの仮想位置、
    - 前記仮想音源と前記観察者との間の前記距離、
    - 前記仮想音源が前記観察者より上に配設される前記高さ、
    - 前記仮想音源が前記観察者より下に配設される前記深さ
    のうちの少なくとも1つをユーザが入力することを可能にするユーザインタフェースを生成するステップを更に含む、請求項1から22の一項または複数項に記載の方法。
  24. コンピュータ可読プログラムコードが具現化されたコンピュータ可読記憶媒体と、
    前記コンピュータ可読記憶媒体に結合されるプロセッサ、好ましくはマイクロプロセッサであって、前記コンピュータ可読プログラムコードを実行したことに応じて、請求項1から23の一項または複数項に記載の方法を行うように構成される、プロセッサと
    を備えるコンピュータ。
  25. 少なくとも1つのソフトウェアコード部分を含むコンピュータプログラムもしくは一組のコンピュータプログラムまたは少なくとも1つのソフトウェアコード部分を記憶したコンピュータプログラム製品であって、前記ソフトウェアコード部分が、コンピュータシステムにおいて実行されると、請求項1から23の一項または複数項に記載の方法を実行するために構成される、コンピュータプログラムもしくは一組のコンピュータプログラムまたはコンピュータプログラム製品。
  26. 少なくとも1つのソフトウェアコード部分を記憶した非一時的コンピュータ可読記憶媒体であって、前記ソフトウェアコード部分が、コンピュータによって実行または処理されると、請求項1から23の一項または複数項に記載の方法を行うように構成される、非一時的コンピュータ可読記憶媒体。
JP2022536511A 2019-12-12 2020-12-10 仮想音源と関連付けられた音声信号を発生させること Pending JP2023506240A (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
NL2024434 2019-12-12
NL2024434A NL2024434B1 (en) 2019-12-12 2019-12-12 Generating an audio signal associated with a virtual sound source
NL2025950 2020-06-30
NL2025950 2020-06-30
PCT/NL2020/050774 WO2021118352A1 (en) 2019-12-12 2020-12-10 Generating an audio signal associated with a virtual sound source

Publications (1)

Publication Number Publication Date
JP2023506240A true JP2023506240A (ja) 2023-02-15

Family

ID=74046105

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022536511A Pending JP2023506240A (ja) 2019-12-12 2020-12-10 仮想音源と関連付けられた音声信号を発生させること

Country Status (6)

Country Link
US (1) US20230017323A1 (ja)
EP (1) EP4074078A1 (ja)
JP (1) JP2023506240A (ja)
CN (1) CN114946199A (ja)
CA (1) CA3164476A1 (ja)
WO (1) WO2021118352A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2022378526A1 (en) * 2021-11-01 2024-05-02 Telefonaktiebolaget Lm Ericsson (Publ) Rendering of audio elements

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030007648A1 (en) * 2001-04-27 2003-01-09 Christopher Currell Virtual audio system and techniques
WO2004036548A1 (en) * 2002-10-14 2004-04-29 Thomson Licensing S.A. Method for coding and decoding the wideness of a sound source in an audio scene
EP1552724A4 (en) * 2002-10-15 2010-10-20 Korea Electronics Telecomm METHOD FOR GENERATING AND USING A 3D AUDIOSCENCE WITH EXTENDED EFFICIENCY OF SOUND SOURCE
KR20230144652A (ko) * 2013-03-28 2023-10-16 돌비 레버러토리즈 라이쎈싱 코오포레이션 임의적 라우드스피커 배치들로의 겉보기 크기를 갖는 오디오 오브젝트들의 렌더링
JP6786834B2 (ja) * 2016-03-23 2020-11-18 ヤマハ株式会社 音響処理装置、プログラムおよび音響処理方法
US20200126582A1 (en) * 2017-04-25 2020-04-23 Sony Corporation Signal processing device and method, and program

Also Published As

Publication number Publication date
WO2021118352A1 (en) 2021-06-17
CA3164476A1 (en) 2021-06-17
US20230017323A1 (en) 2023-01-19
EP4074078A1 (en) 2022-10-19
CN114946199A (zh) 2022-08-26

Similar Documents

Publication Publication Date Title
Shi et al. Development of parametric loudspeaker
WO2018008395A1 (ja) 音場形成装置および方法、並びにプログラム
Poletti et al. An approach to generating two zones of silence with application to personal sound systems
JP6246922B2 (ja) 音響信号処理方法
Zotter et al. A beamformer to play with wall reflections: The icosahedral loudspeaker
KR100813272B1 (ko) 스테레오 스피커를 이용한 저음 보강 장치 및 방법
JPWO2013057948A1 (ja) 音響レンダリング装置および音響レンダリング方法
US20230306953A1 (en) Method for generating a reverberation audio signal
CN108701461B (zh) 用于具有多个反射的声源的改进的立体混响编码器
JP2023506240A (ja) 仮想音源と関連付けられた音声信号を発生させること
JP6970366B2 (ja) 音像再現装置、音像再現方法及び音像再現プログラム
Rocchesso Spatial effects
JP7010231B2 (ja) 信号処理装置および方法、並びにプログラム
NL2024434B1 (en) Generating an audio signal associated with a virtual sound source
JP2013016984A (ja) フィルタ係数決定装置、局所再生装置、フィルタ係数決定方法、及びプログラム
Cook Sound production and modeling
Murphy et al. Digital waveguide mesh topologies in room acoustics modelling
Reis Short overview in parametric loudspeakers array technology and its implications in spatialization in electronic music
JP5705162B2 (ja) フィルタ係数決定装置、局所再生装置、フィルタ係数決定方法、及びプログラム
Vorländer et al. Virtual room acoustics
CN116320899B (zh) 一种发声方法、装置及设备
US20240135953A1 (en) Audio rendering method and electronic device performing the same
Jones Small room acoustics
Simionato Numerical Simulation of a Tube-Delay Audio Effect
JPH09244663A (ja) 過渡応答信号生成方法、音響再生方法及び装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20231206