JP2020527893A - ステレオ仮想バス拡張 - Google Patents

ステレオ仮想バス拡張 Download PDF

Info

Publication number
JP2020527893A
JP2020527893A JP2020501123A JP2020501123A JP2020527893A JP 2020527893 A JP2020527893 A JP 2020527893A JP 2020501123 A JP2020501123 A JP 2020501123A JP 2020501123 A JP2020501123 A JP 2020501123A JP 2020527893 A JP2020527893 A JP 2020527893A
Authority
JP
Japan
Prior art keywords
signal
channel
harmonic
frequency
ild
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2020501123A
Other languages
English (en)
Other versions
JP6968376B2 (ja
Inventor
イタイ ネオラン
イタイ ネオラン
アヒカム ラヴィ
アヒカム ラヴィ
Original Assignee
ウェイヴス オーディオ リミテッド
ウェイヴス オーディオ リミテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ウェイヴス オーディオ リミテッド, ウェイヴス オーディオ リミテッド filed Critical ウェイヴス オーディオ リミテッド
Publication of JP2020527893A publication Critical patent/JP2020527893A/ja
Application granted granted Critical
Publication of JP6968376B2 publication Critical patent/JP6968376B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/04Circuits for transducers, loudspeakers or microphones for correcting frequency response
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • H04R5/04Circuit arrangements, e.g. for selective connection of amplifier inputs/outputs to loudspeakers, for loudspeaker detection, or for adaptation of settings to personal preferences or hearing impairments
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/307Frequency adjustment, e.g. tone control
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2430/00Signal processing covered by H04R, not provided for in its groups
    • H04R2430/01Aspects of volume control, not necessarily automatic, in sound systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2430/00Signal processing covered by H04R, not provided for in its groups
    • H04R2430/03Synergistic effects of band splitting and sub-band processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/07Generation or adaptation of the Low Frequency Effect [LFE] channel, e.g. distribution or signal processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/01Enhancing the perception of the sound image or of the spatial distribution using head related transfer functions [HRTF's] or equivalents thereof, e.g. interaural time difference [ITD] or interaural level difference [ILD]

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Stereophonic System (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Tone Control, Compression And Expansion, Limiting Amplitude (AREA)

Abstract

マルチチャネルサウンド信号の方向性が維持される疑似低周波数音響心理的センセーションをリスナーに伝達する方法が提供され、本方法は、処理ユニットによって、サウンド信号から高周波数マルチチャネル信号及び低周波数マルチチャネル信号を生成するステップと、マルチチャネル高調波信号を生成するステップであって、マルチチャネル高調波信号の少なくとも1つのチャネル信号のラウドネスは、低周波数マルチチャネル信号における対応するチャネルのラウドネスにほぼ一致し、マルチチャネル高調波信号の少なくとも1つのチャネルペアの少なくとも1つの周波数の少なくとも1つの両耳間レベル差(ILD)は、低周波数マルチチャネル信号における対応するチャネルペアの対応する基本周波数のILDにほぼ一致する、ステップと、高調波マルチチャネル信号と高周波数マルチチャネル信号を合計して音響心理的代替信号を生じさせるステップと、を含む。【選択図】図1

Description

本発明は、一般的には、バスセンセーション(低音感覚)の音響心理的拡張に関し、詳細にはこのような拡張下での方向性及びステレオ画像の保存に関する。
関連出願の相互参照
本出願は、全体が引用により本明細書に組み入れられる、2017年7月23日に出願された米国仮出願第62/535,898号明細書「ステレオ仮想バス拡張」からの利益を主張するものである。
音響心理的オーディオ拡張の問題が従来の技術において認識されており、解決策を提供するために、例えば、以下のように、様々な技術が開発されてきた。
1.US patent: 5930373 A, “Method and system for enhancing quality of sound signal”.
2.Bai, Mingsian R., and Wan−Chi Lin. “Synthesis and implementation of virtual bass system with a phase−vocoder approach.” Journal of the Audio Engineering Society 54.11 (2006): 1077−1091.
3.US patent: 6134330 “Ultra bass”.
4.U. Zolzer, Ed., DAFX: Digital Audio Effects (Wiley, New York, 2002).
5.US patent: 8098835 B2, “Method and apparatus to enhance low frequency component of audio signal by calculating fundamental frequency of audio signal”.
6.Blauert, Jens. Spatial hearing: the psychophysics of human sound localization. MIT press, 1997.
7.Sanjaume, Jordi Bonada. Audio Time−Scale Modification in the Context of Professional Audio Post−production. Informatica i Comunicacio digital, Universitat Pompeu Fabra Barcelona. Barcelona, Spain, 2002.
音響心理的バス拡張は、家庭用電化製品製造者から強い関心を受け取っている。物理的制限及びコスト上の制約に起因して、ローエンドスピーカ及びヘッドフォンなどの製品は低品質のバス性能の影響を被ることが多い。
「ミッシングファンダメンタル」(欠落した基本周波数成分)として公知の音響心理的現象に基づく解決策が提案されてきており、これによって人間の聴覚システムは、そのより高い高調波に従って複素ス信号の基本周波数を知覚することができる。
ベース拡張の多くの方法がこの効果を活用して、基本的には低周波数で仮想ピッチを作成する。従って、オーディオ拡張の分野では、低周波数範囲全体を生成することなくオリジナル信号に高調波を追加することが一般的であり、これによってオーディエンスは、これらの周波数が生成されたサウンドに物理的に存在しなくても、又はスピーカ/ヘッドフォンが周波数を生成できない場合でも、基本周波数を知覚することができる。
音響心理的効果の別の幾つかの例が、米国特許第5,930,373号、「Ben−Tzur,D.他のThe Effect of MaxxBass Psychoacoustic Bass Enhancement on Loudspeaker Design、106th AES Convention, Munich, Germany, 1999」、「Woon S.Gan, Sen.M.Kuo, Chee W. Toh、Virtual bass for home entertainment, multimedia pc, game station and portable audio systems, IEEE Transactions on Consumer electronics, Vol. 47, No. 4, November 2001, page 787−794」、「http://www.srslabs.com/partners/aetech/trubass_theory.asp」、「http://vst−plugins.homemusician.net/instruments/virtual_bass_vbl.html」、「http://mp3.deepsound.net/plugins_dynamique.php」、及び「http://www.srs−store.com/store−plugins/mall/pdf/WOW%20XT%Plug−inmanual.pdf」に示されている。
上記に記載した参照は、本発明で開示される主題に適用することができる背景情報を教示している。従って、これらの刊行物の全内容は、追加又は代替の詳細、特徴及び/又は技術的背景の適切な教示に対して適切な場合に引用により本明細書に組み込まれる。
米国特許第5,930,373A明細書 米国特許第6,134,330号明細書 米国特許第8,098,835 B2明細書 米国特許第5,930,373号
Bai、Mingsian R.,及びWan−Chi Lin、「位相ボコーダー手法による仮想バスシステムの合成及び実装」、ジャーナル・オブ・オーディオ・エンジニアリングソサエティ 54.11(2006年):1077−1091 U.Zolzer,Ed.,DAFX:デジタルオーディオ効果(ウィリー,ニューヨーク、2002年) Blauert, Jens. Spatial hearing: the psychophysics of human sound localization. MIT press, 1997 Sanjaume, Jordi Bonada. Audio Time−Scale Modification in the Context of Professional Audio Post−production. Informatica i Comunicacio digital, Universitat Pompeu Fabra Barcelona. Barcelona, Spain, 2002 Ben−Tzur,D.他のThe Effect of MaxxBass Psychoacoustic Bass Enhancement on Loudspeaker Design、106th AES Convention, Munich, Germany, 1999 Woon S.Gan, Sen.M.Kuo, Chee W. Toh、Virtual bass for home entertainment, multimedia pc, game station and portable audio systems, IEEE Transactions on Consumer electronics, Vol. 47, No. 4, November 2001, page 787−794
仮想バス拡張の既存の方法は、基本バス周波数をそれよりも高い高調波で置き換えることが多い。このような方法は、一般的には、ステレオ入力オーディオチャネルの和など、ある種類のモノラル信号に基づく高調波を生成する。これらの高調波は、多くの場合、[1]に示すような非線形利得制御を介して、又は[3]及び[5]に示すような増幅器を介して制御される。この利得調整は、高調波信号の知覚されるラウドネスを入力基本周波数の知覚されるラウドネスによって等化することが意図されることが多い。
非モノラル入力信号(例えば、ステレオ、バイノーラル、サラウンド、その他)により、これらの方法は以下の問題の影響を被ることが多い。
1.破損したステレオ画像−信号にモノ高調波を追加することで、これらの高調波のステレオ画像を中心に向けてシフトさせることができる。このパニングは、例えば、特別な効果が方向性である(又は動いている)時の映画において、又は様々な位置にある一部の低周波数の楽器を包含するライブミュージックコンテンツにおいては極めて重要とすることができる。
2.バイノーラル信号における知覚される方向性の損失−例えば、低周波数でも両耳間レベル差(ILD)及び両耳間時間差(ITD)などの方向性のキューを人間の耳が感知することが、文献において示されている。従って、バイノーラル信号にモノ高調波を追加することは、オリジナルコンテンツのILD及びITDが知覚されないので、方向性の知覚が損なわれる。
ラウドスピーカの小さなサイズに起因して高調波が高周波数において生じるはずである場合、ステレオオーディオのステレオ画像において、及びバイノーラル信号における知覚される方向性において、高周波数における方向性キューが極めて重要であるので、これらの問題は、一部の消費者デバイスでかなり深刻になる可能性がある。
本発明で開示される主題の一部の実施形態の利点のなかでも、ステレオ画像をより維持できるバス拡張効果の提供は、バイノーラル信号の方向性知覚を維持することができ、ILD及びITDを含む方向性キューを維持することができる。
本発明で開示される主題の1つの態様によれば、マルチチャネルサウンド信号の方向性が維持される疑似低周波数音響心理的センセーションをリスナーに伝達する方法が提供され、本方法は、
処理ユニットによって、サウンド信号から高周波数マルチチャネル信号及び低周波数マルチチャネル信号を生成するステップであって、低周波数マルチチャネル信号は関心のある低周波数範囲にわたって広がる、ステップと、
処理ユニットによって、マルチチャネル高調波信号を生成するステップであって、マルチチャネル高調波信号の少なくとも1つのチャネル信号のラウドネスは、低周波数マルチチャネル信号における対応するチャネルのラウドネスにほぼ一致し、マルチチャネル高調波信号の少なくとも1つのチャネルペアの少なくとも1つの周波数の少なくとも1つの両耳間レベル差(ILD)が、低周波数マルチチャネル信号における対応するチャネルペアの対応する基本周波数のILDにほぼ一致する、ステップと、
処理ユニットによって、高調波マルチチャネル信号と高周波数マルチチャネル信号を合計して、これによって音響心理的代替信号を生じさせるステップと、
を含む。
上記の特徴に加えて、本発明で開示される主題の本態様による方法は、技術的に実施可能である何らかの所望の組み合わせ又は置換して、
以下に列挙される特徴(i)から(ix)のうちの1又は2以上を含むことができる。
(i)少なくとも1つのチャネル信号が、マルチチャネル高調波信号の全てのチャネル信号を含む。
(ii)少なくとも1つの両耳間レベル差が、少なくとも1つの周波数の全ての両耳間レベル差を含む。
(iii)少なくとも1つの基本周波数が、低周波数マルチチャネル信号の全てのチャネル信号を含む。
(iv)高調波マルチチャネル信号を生成するステップが、
低周波数マルチチャネル信号の少なくとも2つのチャネル信号に対して、
チャネル信号の基本周波数の少なくとも1つの高調波周波数を各々が含むチャネル当たり高調波信号を生成するステップと、
低周波数マルチチャネル信号に従って、基準信号を生成するステップと、
基準信号のラウドネスに従って、ラウドネス利得調整を生成するステップと、
少なくとも1つのチャネル信号と基準信号の間の1つのレベル差に少なくとも従って、チャネル当たり高調波信号の各々に対するILD利得調整を生成するステップと、
生成されたラウドネス利得調整及びそれぞれのILD利得調整をチャネル当たり高調波信号の各々に加えるステップと、
を含む。
(v)高調波マルチチャネル信号を生成するステップが、
マルチチャネルサウンド信号の少なくとも2つのチャネル信号に対して、チャネル信号の基本周波数の少なくとも1つの高調波周波数を各々が含むチャネル当たり高調波信号を生成するステップと、
低周波数マルチチャネル信号に従って、基準信号を生成するステップと、
基準信号のラウドネス及び少なくとも1つのチャネル信号と基準信号の間のレベル差に少なくとも従って、利得調整を生成するステップと、
利得調整をチャネル当たり高調波信号の各々に加えるステップと、
を含む。
(vi)高調波マルチチャネル信号を生成するステップは、
低周波数マルチチャネルの少なくとも2つのチャネル信号に対して、
チャネル信号の基本周波数の少なくとも1つの高調波周波数を各々が含むチャネル当たり高調波信号を生成するステップと、
チャネル当たり高調波信号に従って、リンクエンベロープを計算し、リンクエンベロープに非線形利得曲線を加えて、ラウドネス利得調整を結果として得るステップと、
チャネル当たり高調波信号の各々に対して、非リンクエンベロープを計算し、非リンクエンベロープに非線形利得曲線を加えて、ILD利得調整を結果として得るステップと、
チャネル当たり高調波信号の各々に対して、ラウドネス利得調整及びそれぞれのILD利得調整を加えるステップと、
を含む。
(vii)高調波マルチチャネル信号を生成するステップは、
低周波数マルチチャネル信号の少なくとも2つのチャネル信号に対して、
チャネル信号の基本周波数の少なくとも1つの高調波周波数を各々が含むチャネル当たり高調波信号を生成するステップと、
チャネル当たり高調波信号に従ってリンクエンベロープを計算し、非線形利得曲線をリンクエンベロープに加えて、ラウドネス及びILD利得調整を結果として得るステップと、
チャネル当たり高調波信号の各々に対して、ラウドネス及びILD利得調整を加えるステップと、
を含む。
(viii)高調波マルチチャネル信号を生成するステップは、
低周波数マルチチャネル信号の少なくとも2つのチャネル信号に対して、
チャネル当たり高調波信号を生成するステップであって、各々が低周波数チャネル信号の少なくとも1つの基本周波数の少なくとも1つの高調波周波数を含み、これによって少なくとも2つのチャネル当たり高調波信号を結果として得るステップと、
低周波数マルチチャネル信号に従って基準信号を生成するステップと、
各チャネル当たり高調波信号における少なくとも1つの周波数に対して、周波数当たりラウドネス利得調整に従って調節された少なくとも1つの周波数のラウドネスが、基準信号の対応する基本周波数のラウドネスにほぼ一致するように、周波数当たりラウドネル利得調整を生成するステップと、
各チャネル当たり高調波信号の少なくとも1つの周波数に対して、周波数当たりILD利得調整に従って調節された各チャネル当たり高調波信号の少なくとも1つの周波数のILDが、基準低周波数信号における基本周波数のILDに対応する低周波数チャネル信号の基本周波数のILDにほぼ一致するように、周波数当たりILD利得調整を計算するステップと、
ラウドネス利得調整及びそれぞれのILD利得調整をチャネル当たり高調波信号の各々の少なくとも1つの周波数に加えるステップと、
を含む。
(ix)チャネル当たり高調波信号を生成するステップは、高調波信号の位相を低周波数マルチチャネル信号の位相と同期させる。
本発明で開示される主題の別の態様によれば、処理ユニットを含むシステムが提供され、この処理ユニットは、請求項1に従って作動するよう構成される。
本発明で開示される主題の別の態様によれば、処理回路によって可読であり、マルチチャネルサウンド信号の方向性が維持される疑似低周波数音響心理的センセーションをリスナーに伝達する方法を実行するよう前記処理回路によって実行可能なコンピュータ可読命令を有形で具現化する非一時的プログラムストレージデバイスが提供され、
本方法は、
処理ユニットによって、サウンド信号から高周波数マルチチャネル信号及び低周波数マルチチャネル信号を生成するステップであって、低周波数マルチチャネル信号が関心のある低周波数範囲にわたって広がる、ステップと、
処理ユニットによって、マルチチャネル高調波信号を生成するステップであって、マルチチャネル高調波信号の少なくとも1つのチャネル信号のラウドネスが、低周波数マルチチャネル信号における対応するチャネルのラウドネスにほぼ一致し、マルチチャネル高調波信号の少なくとも1つのチャネルペアの少なくとも1つの周波数の少なくとも1つの両耳間レベル差(ILD)が、低周波数マルチチャネル信号における対応するチャネルペアの対応する基本周波数のILDにほぼ一致する、ステップと、
処理ユニットによって、高調波マルチチャネル信号と高周波数マルチチャネル信号を合計して、これによって音響心理的代替信号を生じさせるステップと、
を含む。
本発明を理解し実際に実行する方法を理解するために、非限定的な実施例として、添付図面を参照しながら実施形態について説明する。
本発明で開示される主題の一部の実施形態による仮想バス拡張の全体的なシステムを示す概略図である。 本発明で開示される主題の一部の実施形態による方向性維持バス拡張の例示的な方法を示す汎用流れ図である。 本発明で開示される主題の一部の実施形態による方向性維持高調波信号の生成の例示的な方法を示す汎用流れ図である。 本発明で開示される主題の一部の実施形態による高調波ユニットの例示的時間ドメインベースの構造を示す図である。 本発明で開示される主題の一部の実施形態による高調波ユニットの時間ドメイン構造を示す単純化バージョンである。 本発明で開示される主題の一部の実施形態による高調波ユニット120における例示的時間ドメインベースの処理を示す汎用流れ図である。 本発明で開示される主題の一部の実施形態による高調波ユニットの例示的周波数ドメインベースの構造を示す図である。 本発明で開示される主題の一部の実施形態による高調波ユニットの周波数ドメインベースの構造の例示的スペクトラム修正成分を示す図である。 本発明で開示される主題の一部の実施形態による高調波ユニット120における例示的周波数ドメインベースの処理を示す汎用流れ図である。 本発明で開示される主題の一部の実施形態によるヘッドシャドーイングモデルの例示的曲線を示す図である。 本発明で開示される主題の一部の実施形態による高調波生成再帰フィードバックループの例示的な構造を示す図である。
以下の詳細な説明では、多数の特定の詳細が本発明の完全な理解を提供するために示されている。しかしながら、本発明で開示される主題がこれらの特定の詳細なしに実施できることは、当業者によって理解されるであろう。他の事例では、公知の方法、手順、構成要素及び回路は、本発明で開示される主題を曖昧にしないために詳細には説明していない。
別途明確に記載されない限り、以下の説明から明らかなように、明細書全体を通して、「処理する」、「コンピュータ計算する」、「表現する」、「比較する」、「生成する」、「評価する」、「マッチングする」、「更新する」などの用語を用いた論議は、データを、電子、量などの物理量として表されるデータ及び/又は物理的物体を表すデータなどの物理量として表される他のデータに操作及び/又は変換するコンピュータの動作及び/又は処理を指すことを理解されたい。用語「コンピュータ」は、非限定的な実施例として、本出願で開示される「処理ユニット」を含むデータ処理能力を備えたハードウェアベースの電子デバイスの何らかの種類を含むものとして広く解釈すべきである。
本明細書で用いる「非一時的メモリ」及び「非一時的ストレージ媒体」という用語は、本発明で開示される主題に適した何らかの揮発性又は不揮発性コンピュータメモリを含むと広く解釈すべきである。
本明細書の教示による動作は、所望の目的に特別に構成されたコンピュータによって、又は非一時的コンピュータ可読ストレージ媒体に格納されたコンピュータプログラムによる所望の目的に特別に構成された汎用コンピュータによって実行することができる。
本発明で開示される主題の実施形態は、何らかの特定のプログラミング言語に関して記述してはいない。多種多様なプログラミング言語を、本明細書に説明する本発明で開示される主題の教示を実施するために用いることができることが理解されるであろう。
サウンドの方向の人間の知覚は、ILD(両耳間レベル差)及びITD(両耳間時間差)などの方向キューに主として基づいている。再生されるマルチチャネルオーディオコンテンツは、録音又はミキシング処理から生じるILD及びITDキューを含むものとみなされる。例えば、ステレオ音楽は、複数の楽器及びボーカルを包含し、各々が、録音に対して又はマルチトラックミキシング処理の増幅パニングによって用いられるステレオフォニックマイクロフォンによって符号化されるステレオ画像における異なる方向に位置付けられる。
対象者がラウドスピーカを聴取している時に、各ラウドスピーカから反対の耳へのクロストークに起因して、音源の知覚ITDは、実際には、信号のチャネル間の時間(又は位相)差及びレベル差の両方に影響される。
しかしながら、モノラルバス高調波が信号に追加されると、オリジナルサウンドにおける基本周波数の知覚ILD(左チャネルの基本周波数のレベルと右チャネルの基本周波数のレベルとの比によって示される)は、ヘッドフォン及びラウドスピーカ聴取セットアップの両方に対して高調波では知覚されない。高調波生成の前のチャネルのモノ合計によって、ITDもまた知覚されない。同じコンテンツが、限定的なレンジのラウドスピーカ又はヘッドフォンで再生された時に、バス応答が不足し、バスエネルギーの一部がバス拡張(例、[1])の高い高調波と置き換えられた時には、フルレンジデバイスによって再生されるように方向キューを維持するのが望ましい。
ステレオ画像及びバイノーラルコンテンツのILDを維持するマルチチャネルシステムにおける高調波信号を生成するために、発明者らは以下を考慮するようにした。
a)参照[1]に説明したラウドネスの補償は、ステレオ画像を維持するために全チャネルに対して同じにしなければならない。例えば、フィードバックループ[1]を用いた生成高調波の特定のケースでは、高調波信号を拡張する乗算を包含し、この拡張に対する補償(例えばコンプレッサを用いた)、すなわち全てのチャネルに対する同じ補償利得をリンクしなくてはならない。
b)ILDは、図7に示すようにヘッドシャドーイングモデルに従う周波数の関数として単調に減少していき、これは、第1高調波の強度が基本周波数の強度より低くなければならないことを意味し、一般的には各高調波が次の高調波より強く(又はILDが全ての周波数に対して0dBであるゼロ度の場合には等しく)なくてはならないことを意味する。加えて、低周波数(1KHzより下)では、基本周波数対第1高調波のILDの比は、全角度に対してログ[dB]スケールで一定である。これは、高高調波でも当てはまり、第N高調波のILDと(N+1)番目の高調波のILDの間のログスケールにおける比は、ソースの角度に関わらず一定である。方向性を実質的に維持するために、発明者らは、ILD減少曲線を考慮して高調波を生成した。全ての角度で減少が直線であるので(ログ[dB]スケールで)、a=N*r(基本周波数に関して)で各高調波の入力信号の拡張(すなわち、y=xa)によってのみ生成することができ、ここでNは第N高調波、rは基本周波数のILD[dB]と第1高調波のILD[dB]の間の比を表す定数である(〜3.9になることが実験的に発見された)。高調波信号を拡大する乗算を包含するフィードバックループを用いた高調波生成の特定の場合に、補償は、フィードバックループの固有の拡大を考慮する(y=x2−>r=3.9−2=1.9)。
以下に示す説明では、便宜上、全てのチャネル、チャネルの全ての周波数、全てのILDなどに適用されるように記載されることがある。これらの場合の全てにおいて、非限定的な実施例として、これらの動作は、本発明で開示される主題の一部の実施形態においてチャネルのサブセット、チャネルの周波数などに適用できることは理解されるであろう。
同様に、以下に示す説明では、便宜上、例えば390などの識別子を用いる作動が示される場合もある。このような説明は、非限定的な実施例として、識別子390a、390bなどに関係できることは理解されるであろう。
図1に注意を向けると、本発明で開示される主題の一部の実施形態によるマルチチャネル信号のバス拡張の方向性を維持する例示的システムを示す。
処理ユニット100は、方向性維持バス拡張を実施する例示的なシステムである。処理ユニット100は、非限定的な実施例として、高フィデリティステレオオーディオ、バイノーラル又はサラウンドサウンドゲームコンテンツなどのオーディオコンテンツの様々な種類を包含できるマルチチャネル入力信号105を受信することができる。処理ユニット100は、例えば、イヤフォン又はデスクトップスピーカなどの限定的なレンジのサウンド出力デバイスでの出力に適したラウドネス維持及び方向性維持拡張バスマルチチャネル出力信号145を出力することができる。
処理ユニット100は、例えば、アナログ回路に基づく信号処理ユニットとすることができる。処理ユニット100は、例えば、デジタル信号処理技術(例えば、アナログ回路の代わりに又はこれに加えて)を利用することができる。この場合、処理ユニット100は、DSP(又は他の種類のCPU)及びメモリを含むことができる。入力オーディオ信号は、例えば当技術で公知の技術を用いてデジタル信号に変換することができ、結果デジタル出力信号は、例えば、更なるアナログ処理のためにアナログオーディオ信号に同様に変換することができる。この場合、図1に示した様々なユニットは、「処理ユニットに含まれる」と表現される。
処理ユニット100は、分離ユニット110を含むことができる。分離ユニット110は、マルチチャネル入力信号105から関心のある所与のレンジにおける低周波数を分離することができ、マルチチャネル低周波数信号115及びマルチチャネル高周波数信号125を結果として生じる。分離ユニット110は、例えば、ハイパスフィルタ(HPF)及びローパスフィルタ(LPF)(並列に並べられる)を介してマルチチャネル入力信号105の各チャネルをディレクトし、HPF出力をマルチチャネル高周波数信号125にLPF出力をマルチチャネル低周波数信号115にパスすることによって実施することができる。
処理ユニット100は高調波ユニット120を含むことができる。高調波ユニット120は、マルチチャネル信号の各チャネルに対して、マルチチャネル低周波数信号115に存在する基本周波数に従って、高調波周波数を生成し、マルチチャネル高調波信号135を出力することができる。
本発明で開示される主題の一部の実施形態では、高調波ユニット120は、以下の特徴の一部又は全てを備えたマルチチャネル高調波信号135を生成する。
a)マルチチャネル高調波信号の少なくとも1つのチャネル信号のラウドネスは、低周波数マルチチャネル信号の対応するチャネルのラウドネスにほぼ一致する。
b)マルチチャネル高調波信号のチャネルの少なくとも1つのペアの少なくとも1つの周波数の少なくとも1つの両耳間レベル差(ILD)は、低周波数マルチチャネル信号におけるチャネルの対応するペアの対応する基本周波数のILDにほぼ一致する。
1つの信号のラウドネスは、例えば、[1]に指定された「基本的にラウドネスマッチ」の条件が満足された時に、別の信号のラウドネスにほぼ一致すると考えることができる。高調波が生成される基本周波数は、本明細書では対応する基本周波数と呼ばれる。高調波マルチチャネル信号のチャネルが生成される低周波数マルチチャネル信号のチャネルは、本明細書では対応するチャネルと呼ばれる。
特定の周波数のマルチチャネル信号のチャネルの1つのペアのILDは、例えば、ILDが、例えば周波数感知ヘッドシャドーイングモデル、例えばBrown,C.P.,Duda,R.O.−3Dサウンドのための効率的なhrtfモデルに従って、等価の知覚されたレベル差を有する時に、異なる周波数における対応するマルチチャネル信号の別のチャネルのペアのILDにほぼ一致すると考えることができる。オーディオ及び音響への信号処理の応用におけるIEEE ASSPワークショップの議事録、IEEE(1997年)。
高調波ユニット120は、何らかの適切な方式で実施することができる。非限定的な実施例として、高調波ユニット120は、図3に関して以下に説明する時間ドメイン構造を用いて実施することができる。非限定的な実施例として、高調波ユニット120は、図5に関して以下の本明細書に説明する周波数ドメイン構造を用いて実施することができる。
処理ユニット100はミキサユニット130を含むことができる。ミキサユニット130は、マルチチャネル高周波数信号125及びマルチチャネル高調波信号135を組み合わせて出力マルチチャネル高調波信号135を生成することができる。ミキサユニット130は、例えばミキサ回路によって又はそのデジタル等価物によって実施することができる。
本発明で開示される主題の教示は、図1に関して説明した方向性維持バス拡張システムによって縛られない点に留意されたい。等価の及び/又は修正された機能を別の方法で確立又は分割することができ、ファームウェア及び/又はハードウェアとのソフトウェアの何らかの適切な組み合わせで実施することができ且つ適切なデバイスで実行することができる。処理ユニット(100)は、独立エンティティとすることができるか、又は他のエンティティに完全に又は部分的に統合することができる。
図2は、本発明で開示される主題の一部の実施形態による図1の構造に基づく方向性維持バス拡張の例示的な方法の汎用流れ図を示す。
本発明で開示される主題の教示は、図2に示した流れ図によって縛られることなく、図示した作動を図示の順序以外で起こすことができる点に留意されたい。フローチャートが図1のシステムの要素に関して示されているが、これは決して拘束力のあるものではなく、作動は本明細書で説明する要素以外の要素によって実行できる点に留意されたい。
図2に注意を向けると、本発明で開示される主題の一部の実施形態による方向性維持高調波信号の生成の例示的な方法が示されている。
プロセッサ100(例えば、高調波ユニット120)は、各チャネルに対して、チャネル信号における各基本周波数に対応する高調波周波数を含むチャネル当たり高調波信号を生成することができる(210)。
プロセッサ100(例えば、高調波ユニット120)は、マルチチャネル信号から生成される基準信号を生成することができる(220)(例えば、時間ドメインであらゆるサンプルに対して又は周波数ドメインであらゆるバッファに対して)。
プロセッサ100(例えば、高調波ユニット120)は、基準信号2のラウドネス特性に従って、ラウドネス利得調整を生成することができる(230)。
プロセッサ100(例えば、高調波ユニット120)は、チャネル当たり高調波信号を生成した入力信号と基準信号の間の方向性キューに従って、各チャネル当たり高調波信号に対する方向性利得調整を生成することができる(240)。
プロセッサ100(例えば、高調波ユニット120)は、各チャネル当たり高調波信号に、生成されたラウドネス利得調整及びILD利得調整を加えることができる(250)。
本発明で開示される主題の教示は、図2に示した流れ図によって縛られず、図示した作動を例示した順序以外で行うことができる点に留意されたい。フローチャートが図1のシステムの要素に関して示されているが、これは拘束を意味するものではなく、本明細書に示した要素以外の要素によって動作を実行できる点に留意されたい。
ここで図3に注意を向けると、本発明で開示される主題の一部の実施形態による高調波ユニットの例示的時間ドメインベースの構造が示されている。
説明を分かり易くするために、例示的高調波ユニット120は、2つのオーディオチャネルの処理を含む。この教示が2つより多いオーディオチャネルを含む実施形態に適用されることが当業者には明らかであろう。
図1に関して上述したように、各チャネルの低周波数を含むマルチチャネル入力信号は、高調波ユニット120で受信することができる。高調波ユニット120は、高調波生成ユニット(HGU)310の幾つかのインスタンスを含むことができ、例えばマルチチャネル信号の1つのチャネル当たり1つのHGU310インスタンスがある。各HGUインスタンスは、オリジナル低周波数マルチチャネル信号の1つの低周波数チャネル信号を処理することができる。
本発明で開示される主題の一部の実施形態では、HGU310aは、入力信号に従って、入力信号の各基本周波数の少なくとも第1の2つの高調波周波数を含む高調波信号320aを生成する。
HGU310は、[1]の図4に示したものなどの再帰的フィードバックループとして実施することができる(以下図8に図示)。HGU310aは、以下に説明する高調波レベル制御ユニット340によって生成される利得325aを受け取ることができる。利得325aは、フィードバックループの高調波信号作成の強度を決定する制御信号として機能することができる。
本発明で開示される主題の一部の実施形態では、各高調波信号320a、320bは、高調波レベル制御ユニット(HLC)340への入力として用いられる。HLCは、例えば調節された高調波信号380a、380bを出力することができ、調節された高調波信号は、a)対応するオリジナル低周波数チャネル信号のラウドネス及びb)例えばILD又はITDなどの方向性キュー情報の両方にほぼ一致する。
本発明で開示される主題の一部の実施形態では、HLC340は、各チャネル当たり高調波信号のエンベロープを決定することができるエンベロープ成分345a、345bを含む。チャネル当たりエンベロープは、最大選択成分350及び非リンク利得曲線成分370a、370bへの入力としての役割を果たすことができる。
最大選択成分350は、入力として各チャネル当たりエンベロープを受け取り、入力チャネルのラウドネスを指示するエンベロープを出力する。本発明で開示される主題の一部の実施形態では、出力エンベロープは、例えば入力エンベロープの最大値とすることができる。本発明で開示される主題の一部の実施形態では、出力エンベロープは、例えば入力エンベロープの平均値とすることができる。出力エンベロープは、リンク利得曲線成分360への入力として供給することができる。
リンク利得曲線成分360は、フレッチャー−マンソンモデルなどのラウドネスモデルに従って、対応する高調波信号のラウドネスを調節する利得曲線をもたらすことができ、これによって各生成された高調波周波数のラウドネス(例えばフォンで測定)は、高調波が生成された基本周波数のラウドネスと同じである。
リンク利得曲線成分360は、例えば[1]の図4及び図6に示すようにダイナミックレンジコンプレッサ又はAGCとして実施することができる。
非線形非リンク利得曲線成分370a、370bは、最大選択成分350から生じるエンベロープを用いて、高調波信号の知覚ILDが基本周波数のILDにほぼ一致するように対応する高調波信号のレベルを調節する利得曲線をもたらすことができる。
非リンク利得曲線成分370a、370bは、例えば[1]の図4及び図6に示すようにダイナミックレンジコンプレッサ又はAGCとして実施することができる。
リンク利得は、非リンク利得によって乗算することができ、結果生じた利得信号は、高調波信号320に及び制御信号として高調波生成器310のフィードバック処理に加えられる。
本発明で開示される主題の教示が図3に関して説明した方向性維持バス拡張システムによって縛られない点に留意されたい。等価の及び/又は修正された機能を別の方法で確立又は分割することができ、ファームウェア及び/又はハードウェアとのソフトウェアの何らかの適切な組み合わせで実施することができ且つ適切なデバイスで実行することができる。高調波ユニット(120)は、独立型エンティティとすることができるか、又は他のエンティティに完全に又は部分的に統合することができる。
図3aは、図3に示した時間ドメイン処理構造の単純化バージョンを表す。この実施形態では、非リンク利得曲線成分がない。単一利得曲線成分360は制御信号を生成し、左及び右高調波生成器310a310bが、高調波信号320a、320bの両方に加えられる。利得曲線成分360は、例えば[1]の図4及び図6に示すようなダイナミックレンジコンプレッサ又はAGCなどの様々な方法で実施することができる。
本発明で開示される主題の教示が、図3aに関して説明した方向性維持バス拡張システムによって縛られない点に留意されたい。等価の及び/又は修正された機能を別の方法で確立又は分割することができ、ファームウェア及び/又はハードウェアとのソフトウェアの何らかの適切な組み合わせで実施し且つ適切なデバイスで実行することができる。高調波ユニット(120)は、独立型エンティティとすることができ、又は他のエンティティに完全に又は部分的に統合することができる。
図4に注意を向けると、本発明で開示される主題の一部の実施形態による高調波ユニット120での例示的時間ドメインベースの処理の汎用流れ図が示されている。
処理ユニット(100)(例えば、高調波生成ユニット310)は、各チャネルに対して、入力信号に従って、入力信号の各基本周波数の少なくとも第1の2つの高調波周波数を含む高調波信号320aを生成することができる(410)。
処理ユニット(100)(例えば、エンベロープユニット345)は、各チャネルに対して、高調波信号のエンベロープを計算することができる(420)。
処理ユニット(100)(例えば、最大ユニット350)は、リンクエンベロープ値を決定することができる(430)。
処理ユニット(100)(例えば、非リンク利得曲線345)は、各チャネルに対して、高調波間の補正比を表す(ヘッドシャドーイングモデルに従う)利得曲線を作成するために非リンクエンベロープに非線形利得曲線を加えることができる(440)。
処理ユニット(100)(例えば、リンク利得曲線360)は、高調波の補正ラウドネスを表す利得曲線を生成するためにリンクエンベロープに非線形利得曲線を加えることができる(450)。
処理ユニット(100)(例えば、ミキサ240)は、各チャネルに対して、非リンク利得とリンク利得を組み合わせることができる(460)。
処理ユニット(100)(例えば、ミキサ330)は、各チャネルに対して、組み合わせた利得曲線を出力高調波信号に加えることができる(470)。
本発明で開示される主題の教示が図4に示した流れ図によって縛られないこと、図示した作動を図示した順序以外で起こすことができる点に留意されたい。流れ図は図3又は3aのシステムの要素に関して示しているが、これは決して拘束力のあるものではなく、本明細書で説明した要素以外の要素によって作動を実行できる点に留意されたい。
図5に注意を向けると、本発明で開示される主題の一部の実施形態による高調波ユニットの例示的周波数ドメインベースの構造が示されている。
説明を分かり易くするために、例示的高調波ユニット120は、2つのオーディオチャネルを処理するステップを含む。この教示が2つより多いオーディオチャネルを含む実施形態に適用されることが当業者には明らかであろう。
高調波ユニット120は、任意的にダウンサンプリング成分510を含むことができる。ダウンサンプリング成分510は、最高高調波周波数が新しいサンプルレートのナイキスト周波数(2*sample_rate/D)を下回るように因数(Dと呼ぶ)によってオリジナルサンプリングレートを低減することができる。非限定的な実施例として、最高高調波周波数が1400Hz(第4高調波)でありサンプル_レートが48KHzである場合、Dは16になる。
高調波ユニット120は、例えば高速フーリエ変換(FFT)成分520を含むことができる。このFFTは、入力時間ドメイン信号を周波数ドメイン信号に変換することができる。本発明で開示される主題の一部の実施形態では、異なる時間ドメイン対周波数ドメイン変換方法をFFTの代わりに用いることができる。FFTは、例えば時間オーバーラップあり又は時間オーバーラップなしで及び/又はフィルタバンクの帯域を合計することによって用いることができる。
FFT520は、例えば、周波数ドメイン信号を周波数帯域の一群に分割することができ、ここで各帯域は単一の基本周波数を包含する。各帯域は更に幾つかのビンを含むことができる。
高調波ユニット120は、各帯域に対して、高調波レベル制御成分530及び高調波生成成分のペア540、542(1つのチャネルにつき1つ)を含むことができる。高調波レベル制御成分530及び高調波生成成分540、5442は、例えば入力として帯域当たりマルチチャネル入力信号を受信することができる。ここで「fund」は、基本ビンにおける線形サウンド圧力レベルであり、hNは、関連のある基本周波数の第N高調波ビンにおける線形サウンド圧力レベルである。
帯域当たり高調波生成器540、542は、マルチチャネル信号の各チャネルに対して、基本周波数強度に等しい強度を持つ高調波信号のシリーズ(最大ナイキスト周波数)を生成することができる。帯域当たり高調波生成器540、542は、例えば[2]に示した基本周波数のピッチシフトを加えることなどによって、当技術で公知の方法を用いて高調波信号を生成することができる。
帯域当たり高調波レベル制御530は、各帯域において、最高基本周波数信号強度を持つチャネル(以下チャネルiMaxと呼ぶ)を選択することができる。
この段階で高調波のレベルは基本周波数のレベルに等しい点に留意されたい。
帯域当たり高調波レベル制御530は、各チャネルの帯域の各ビンに対して、LC(ラウドネス補償)、すなわち利得値を計算して、例えばチャネルiMaxの帯域の基本周波数のラウドネスにほぼ一致するビンの高調波周波数のラウドネスをレンダリングすることができる。ラウドネス値は、例えばフレッチャー−マンソンイコールラウドネス輪郭に基づいてサウンド圧力レベル対フォン比を用いて決定することができる。
任意的に、帯域当たり高調波レベル制御530は、時間の経過につれてラウドネス補償利得を平滑化することができる。
帯域当たり高調波レベル制御530は、チャネルの各チャネルに対して且つ各帯域に対して、基本周波数のILDを測定することができる。例えば、入力信号のこのチャネルにおける基本周波数のレベルとチャネルiMaxにおける基本周波数のレベルの間の比を計算することによってこれを実行することができる。
非限定的な実施例として、上述の信号を続けると、基本周波数のILDは、0.5/1、すなわち0.5である。
帯域当たり高調波レベル制御530は、各チャネルに対して、帯域の各ビンに対して、ILD補償利得、すなわち利得値を計算して、例えば、チャネルに対して(チャネルiMaxに対して)計算されたILDにほぼ一致するビン(チャネルiMaxに対する)の高調波周波数の知覚されたILDをレンダリングすることができる。
知覚されたILDは、例えば図7に示した例示的曲線などのヘッドシャドーイングモデルに従って、評価することができる。詳細には、ヘッドシャドーイングモデルは、Brown,C.P.,Duda,R.O.:3Dサウンドの効率的hrtfモデルに記述されている。オーディオ及び音響への信号処理の応用におけるIEEE ASSPワークショップの議事録、IEEE(1997年)を例として用いることができる。
帯域当たり高調波レベル制御530は、例えば、計算されたILD補償利得によって基本周波数の計算されたILDを乗算することによって、方向性維持補償利得を生成することができる。
任意的に、帯域当たり高調波レベル制御530は、時間の経過につれて方向性維持補償利得を平滑化することができる。
帯域当たり高調波レベル制御530は、各チャネルに対して且つチャネル内の各帯域に対して、LC利得によって及びILD利得によって各ビンの振幅を乗算することによって高調波信号のスペクトラム修正を適用して出力利得信号を生成することができる。それぞれの出力利得信号は、帯域当たり高調波生成器540、542によって生成された高調波信号に加えることができる。この処理の例示的な構造を図5aに関して以下に詳しく示す。
高調波ユニット120は、例えば、各帯域からの高調波信号を合計できる加算器550a及び550b(各チャネルに対して1つの加算器)を含むことができる。
高調波ユニット120は、例えば周波数ドメイン高調波信号を時間ドメインに変換するための逆高速フーリエ変換(IFFT)成分を含むことができる。本発明で開示される主題の一部の実施形態では、この変換を、他の方法を介して、例えば[4]に示した正弦波の和によって達成することができる。IFFTは、時間オーバーラップあり又は時間オーバーラップなしで及び/又はフィルタバンクの帯域を合計することによって使用することができる。
高調波ユニット120は、オリジナルサンプルレートをリストアするために、比Dのアップサンプリングユニット570を任意的に含むことができる。
本発明で開示される主題の教示が、図5に関して説明した方向性維持バス拡張システムによって縛られない点に留意されたい。等価の及び/又は修正された機能を別の方法で確立又は分割することができ、ファームウェア及び/又はハードウェアとのソフトウェアの何らかの適切な組み合わせで実施して適切なデバイスで実行することができる。高調波ユニット(120)は独立型エンティティとすることができるか、又は他のエンティティに完全に又は部分的に統合することができる。
ここで図6に注意を向けると、本発明で開示される主題の一部の実施形態による高調波ユニット120での例示的周波数ドメインベースの処理の汎用流れ図が示されている。
以下に説明する方法は、非限定的な実施例として、図5に関して上述したシステムなどのシステム上で実行することができる。以下の説明は、単一周波数帯域内の処理を説明するが、この処理は、例えば図5に示したあらゆる周波数帯域で起こすことができる。
以下の説明は、例えば周波数ドメイン内の−基本周波数を包含する帯域に分離された信号における方法の作動に関する。周波数ドメイン信号が取得される方法又は利用される方法の例示的説明を図5及び図5aに関して上述している。
非限定的な実施例として、オリジナル信号は以下のように現れることができる。
Figure 2020527893
処理ユニット(100)(例えば、高調波レベル生成器540、542)は、各チャネル信号における各基本周波数に対して、高調波周波数のシリーズを生成することができる(610)。本発明で開示される主題の一部の実施形態では、処理ユニット(100)(例えば、高調波レベル生成器540、542)は、例えば基本周波数に等しい周波数の強度を持つ最大ナイキスト周波数までの高調波ラインのシリーズを生成する。高調波シリーズは、例えばピッチシフトなどの高調波生成アルゴリズムによって生成することができる。
非限定的な実施例として、高調波生成後(ch1が基準信号である場合)、信号はこれに従って、表すことができる。
Figure 2020527893
本発明で開示される主題の一部の実施形態では、処理ユニット(100)(例えば、高調波レベル生成器540、542)は、高調波周波数を基本周波数の位相に同期する方法を用いて高調波シリーズを生成することができる(非限定的な実施例として、この方法は、Sanjaume,Jordi Bonada、プロフェッショナルオーディオ事後作製の文脈におけるオーディオ時間スケール修正,インフォマチカ コミュニカチオ デジタル、バルセロナ ポンペウファブラ大学、スペイン バルセロナ 2002年(63ページ 5.2.4節に記述されている)。このような方法は、例えば、高調波信号のITDがリスナーによって知覚される方向性を維持するよう入力信号のITDにほぼ一致することを保証できる。
次に、処理ユニット(100)(例えば、高調波レベル制御530)は、各基本周波数に対して、入力チャネル信号、ラウドネス補償値に基づいて基準信号(基準信号強度を持つ)を決定することができる(620)。
処理ユニット(100)(例えば、高調波レベル制御530)は、基準信号における基本周波数のラウドネスに従って、各チャネルにおける各高調波周波数に対するラウドネス補償値を決定することができる(630)。
ラウドネス補償値は、例えば、チャネルiMaxにおける帯域の基本周波数のラウドネスにほぼ一致するビンの高調波周波数のラウドネスをレンダリングするための利得値である。このラウドネス値は、例えばフレッチャー-マンソンイコールラウドネス輪郭に基づくサウンド圧力レベル対フォン比を用いて決定することができる。
任意的に、処理ユニット(100)(例えば、高調波レベル制御530)は、時間の経過につれてラウドネス補償利得を平滑化することができる。
処理ユニット(100)(例えば、高調波レベル制御530)は、各チャネルに対して−帯域における各高調波周波数に対して、方向性維持ILD補償値、すなわち、例えば基本チャネルに対する(基準信号に対する)計算されたILDにほぼ一致する高調波周波数の知覚ILD(基準信号に対する)をレンダリングするための利得値を決定することができる(640)。
これを行うために、処理ユニット(100)(例えば、高調波レベル制御530)は、各チャネルに対して及びチャネルにおける各帯域に対して−基本周波数のILDをまず計算することができる。これは、例えば入力信号におけるこのチャネルの基本周波数のレベルと基準信号における基本周波数のレベルとの間の比を計算することによって行うことができる。
非限定的な実施例として、上述した信号を続けると、基本周波数のILDは、0.5/1、すなわち0.5である。
特定の高調波周波数の知覚ILDは、例えば、特定の周波数の実際に観察されたILD、特定の周波数自体、及び、例えば図7に示した例示的曲線などのヘッドシャドーイングモデルなどのモデルに従って、評価することができる。詳細には、ヘッドシャドーイングモデルは、Brown,C.P., Duda,R.O.:3Dサウンドのための効率的なhrtfモデルに記述されている。オーディオ及び音響への信号処理の応用のIEEE ASSPワークショップの議事録 IEEE(1997年)を用いることができる。処理ユニット(100)(例えば、高調波レベル制御530)は従って、モデルに従う知覚ILDが基本周波数の計算されたILDにほぼ一致する利得値を選択することができる。
非限定的な実施例として、基準信号に関するヘッドシャドー曲線に従う上記に提示された信号のILD補償利得を以下のように示すことができる。
Figure 2020527893
処理ユニット(100)(例えば、高調波レベル制御530)は、例えば計算されたILD補償利得によって基本周波数の計算されたILDを乗算することによって、方向性維持補償値を最終的にコンピュータ計算することができる。
任意的に、処理ユニット(100)(例えば、高調波レベル制御530)は、時間の経過につれて方向性維持補償利得を平滑化することができる。
非限定的な実施例として、上記の信号に対して、方向性維持補償利得=(基本周波数のILDxILD補償利得)であり、以下のように表される。
Figure 2020527893
本発明で開示される主題の教示が図6に示した流れ図によって縛られず、図示した作動を図示した順序以外で起こすことができる点に留意されたい。流れ図は図5のシステムの要素に関して説明されているが、決して拘束力のあるものではなく、本明細書で説明する要素以外の要素によって作動を実行できる点に留意されたい。
本発明は、本明細書に包含されるか又は図面に示された説明に示した詳細にその応用において制限されないことを理解されたい。本発明は、他の実施形態を可能にでき、様々な方法で実施及び実行することができる。従って、本明細書で用いる表現及び用語は説明の目的のためにあり、限定として捉えるべきでないことを理解されたい。従って、当業者は、本開示が基づく概念が、本発明で開示される主題の幾つかの目的を果たすための他の構造、方法、及びシステムを設計する基盤として容易に用いられ得ることを理解するであろう。
本発明によるシステムは、適切にプログラムされたコンピュータで少なくとも一部実施できることが理解されるであろう。同様に、本発明は、本発明の方法を実行するためのコンピュータによって可読のコンピュータプログラムを意図する。本発明は、本発明の方法を実行するためのコンピュータによって実行可能な命令のプログラムを有形で実施する非一時的コンピュータ可読メモリを意図する。
当業者であれば、様々な修正及び変更が、添付の請求項に定義され且つ添付の請求項による本発明の範囲から逸脱することなく以下に記述する本発明の実施形態に適用できることを容易に理解するであろう。
100 処理ユニット
105 マルチチャネル入力信号
110 分離ユニット
115 マルチチャネル低周波数信号
120 高調波ユニット
125 マルチチャネル高周波数信号
130 ミキサユニット
135 マルチチャネル高調波信号
145 方向性維持拡張バスマルチチャネル出力信号

Claims (12)

  1. マルチチャネルサウンド信号の方向性が維持される疑似低周波数音響心理的センセーションをリスナーに伝達する方法であって、
    処理ユニットによって、前記サウンド信号から高周波数マルチチャネル信号及び低周波数マルチチャネル信号を生成するステップであって、前記低周波数マルチチャネル信号が、関心のある低周波数範囲にわたって広がる、ステップと、
    前記処理ユニットによって、マルチチャネル高調波信号を生成するステップであって、前記マルチチャネル高調波信号の少なくとも1つのチャネル信号のラウドネスは、前記低周波数マルチチャネル信号における対応するチャネルのラウドネスにほぼ一致し、前記マルチチャネル高調波信号の少なくとも1つのチャネルペアの少なくとも1つの周波数の少なくとも1つの両耳間レベル差(ILD)は、前記低周波数マルチチャネル信号における対応するチャネルペアの対応する基本周波数のILDにほぼ一致する、ステップと、
    前記処理ユニットによって、前記高調波マルチチャネル信号と前記高周波数マルチチャネル信号を合計して、これによって音響心理的代替信号を生じさせるステップと、
    を含む、方法。
  2. 前記少なくとも1つのチャネル信号は、前記マルチチャネル高調波信号の全チャネル信号を含む、請求項1に記載の方法。
  3. 前記少なくとも1つの両耳間レベル差は、前記少なくとも1つの周波数の全ての両耳間レベル差を含む、請求項1に記載の方法。
  4. 前記少なくとも1つの基本周波数は、前記低周波数マルチチャネル信号の全チャネル信号を含む、請求項1に記載の方法。
  5. 前記高調波マルチチャネル信号を生成するステップは、
    前記低周波数マルチチャネル信号の少なくとも2つのチャネル信号に対して、
    前記チャネル信号の基本周波数の少なくとも1つの高調波周波数を各々が含むチャネル当たり高調波信号を生成するステップと、
    前記低周波数マルチチャネル信号に従って、基準信号を生成するステップと、
    前記基準信号のラウドネスに従って、ラウドネス利得調整を生成するステップと、
    前記少なくとも1つのチャネル信号と前記基準信号の間のレベル差に少なくとも従って、前記チャネル当たり高調波信号の各々に対するILD利得調整を生成するステップと、
    前記生成されたラウドネス利得調整及びそれぞれのILD利得調整を前記チャネル当たり高調波信号の各々に加えるステップと、
    を含む、請求項1に記載の方法。
  6. 前記高調波マルチチャネル信号を生成するステップは、
    前記マルチチャネルサウンド信号の少なくとも2つのチャネル信号に対して、前記チャネル信号の基本周波数の少なくとも1つの高調波周波数を各々が含むチャネル当たり高調波信号を生成するステップと、
    前記低周波数マルチチャネル信号に従って、基準信号を生成するステップと、
    前記基準信号のラウドネス及び少なくとも前記少なくとも1つのチャネル信号と前記基準信号との間のレベル差に従って、利得調整を生成するステップと、
    前記利得調整を前記チャネル当たり高調波信号の各々に加えるステップと、
    を含む、請求項1に記載の方法。
  7. 前記高調波マルチチャネル信号を生成するステップは、
    前記低周波数マルチチャネル信号の少なくとも2つのチャネル信号に対して、
    前記チャネル信号の基本周波数の少なくとも1つの高調波周波数を各々が含むチャネル当たり高調波信号を生成するステップと、
    前記チャネル当たり高調波信号に従って、リンクエンベロープを計算し、非線形利得曲線を前記リンクエンベロープに加えて、ラウドネス利得調整を得るステップと、
    前記チャネル当たり高調波信号の各々に対して、非リンクエンベロープを計算し、非線形利得曲線を前記非リンクエンベロープに加えて、ILD利得調整を得るステップと、
    前記チャネル当たり高調波信号の各々に対して、ラウドネス利得調整及び前記それぞれのILD利得調整を加えるステップと、
    を含む、請求項1に記載の方法。
  8. 前記高調波マルチチャネル信号を生成するステップは、
    前記低周波数マルチチャネル信号の少なくとも2つのチャネル信号に対して、
    前記チャネル信号の基本周波数の少なくとも1つの高調波周波数を各々が含むチャネル当たり高調波信号を生成するステップと、
    前記チャネル当たり高調波信号に従ってリンクエンベロープを計算し、非線形利得曲線を前記リンクエンベロープに加えて、ラウドネス及びILD利得調整を得るステップと、
    前記チャネル当たり高調波信号の各々に対して、前記ラウドネス及びILD利得調整を加えるステップと、
    を含む、請求項1に記載の方法。
  9. 前記高調波マルチチャネル信号を生成するステップは、
    前記低周波数マルチチャネル信号の少なくとも2つのチャネル信号に対して、チャネル当たり高調波信号を生成するステップであって、各々が、前記低周波数チャネル信号の少なくとも1つの基本周波数の少なくとも1つの高調波周波数を含み、これによって少なくとも2つのチャネル当たり高調波信号を得るステップと、
    前記低周波数マルチチャネル信号に従って基準信号を生成するステップと、
    各チャネル当たり高調波信号における少なくとも1つの周波数に対して、前記周波数当たりラウドネス利得調整に従って調節された前記少なくとも1つの周波数のラウドネスが、前記基準信号の対応する基本周波数のラウドネスにほぼ一致するように、周波数当たりラウドネス利得調整を生成するステップと、
    各チャネル当たり高調波信号の少なくとも1つの周波数に対して、前記周波数当たりILD利得調整に従って調節された各チャネル当たり高調波信号の少なくとも1つの周波数のILDが、前記基準低周波数信号における基本周波数のILDに対応する低周波数チャネル信号の基本周波数のILDにほぼ一致するように、周波数当たりILD利得調整を計算するステップと、
    前記ラウドネス利得調整及びそれぞれのILD利得調整を前記チャネル当たり高調波信号の各々の少なくとも1つの周波数に加えるステップと、
    を含む、請求項1に記載の方法。
  10. 前記チャネル当たり高調波信号を生成するステップは、前記低周波数マルチチャネル信号の位相に従って前記高調波信号の位相を同期する、ことを特徴とする請求項9に記載の方法。
  11. 処理ユニットを含むシステムであって、前記処理ユニットは、請求項1〜10の何れかに従って作動するよう構成される、ことを特徴とするシステム。
  12. 処理回路によって読まれた時に、マルチチャネルサウンド信号の方向性が維持される疑似低周波数音響心理的センセーションをリスナーに伝達する方法を前記処理回路に実行させるプログラム命令を保持するコンピュータ可読ストレージ媒体を含むコンピュータプログラム製品であって、
    前記方法は、
    処理ユニットによって、前記サウンド信号から高周波数マルチチャネル信号及び低周波数マルチチャネル信号を生成するステップであって、前記低周波数マルチチャネル信号が、関心のある低周波数範囲にわたって広がる、ステップと、
    前記処理ユニットによって、マルチチャネル高調波信号を生成するステップであって、前記マルチチャネル高調波信号の少なくとも1つのチャネル信号のラウドネスは、前記低周波数マルチチャネル信号における対応するチャネルのラウドネスにほぼ一致し、前記マルチチャネル高調波信号の少なくとも1つのチャネルペアの少なくとも1つの周波数の少なくとも1つの両耳間レベル差(ILD)は、前記低周波数マルチチャネル信号における対応するチャネルペアの対応する基本周波数のILDにほぼ一致する、ステップと、
    前記処理ユニットによって、前記高調波マルチチャネル信号と前記高周波数マルチチャネル信号を合計して、これによって音響心理的代替信号を生じさせるステップと、
    を含む、コンピュータプログラム製品。
JP2020501123A 2017-07-23 2018-07-23 ステレオ仮想バス拡張 Active JP6968376B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201762535898P 2017-07-23 2017-07-23
US62/535,898 2017-07-23
PCT/IL2018/050815 WO2019021276A1 (en) 2017-07-23 2018-07-23 STEREO VIRTUAL LOW IMPROVEMENT

Publications (2)

Publication Number Publication Date
JP2020527893A true JP2020527893A (ja) 2020-09-10
JP6968376B2 JP6968376B2 (ja) 2021-11-17

Family

ID=65039503

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020501123A Active JP6968376B2 (ja) 2017-07-23 2018-07-23 ステレオ仮想バス拡張

Country Status (5)

Country Link
US (1) US11102577B2 (ja)
EP (1) EP3613219B1 (ja)
JP (1) JP6968376B2 (ja)
CN (1) CN110832881B (ja)
WO (1) WO2019021276A1 (ja)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3811515B1 (en) * 2018-06-22 2022-07-27 Dolby Laboratories Licensing Corporation Multichannel audio enhancement, decoding, and rendering in response to feedback
US11523239B2 (en) 2019-07-22 2022-12-06 Hisense Visual Technology Co., Ltd. Display apparatus and method for processing audio
CN112261545A (zh) * 2019-07-22 2021-01-22 海信视像科技股份有限公司 显示装置
WO2021026314A1 (en) 2019-08-08 2021-02-11 Boomcloud 360, Inc. Nonlinear adaptive filterbanks for psychoacoustic frequency range extension
US10904690B1 (en) * 2019-12-15 2021-01-26 Nuvoton Technology Corporation Energy and phase correlated audio channels mixer
CN115299075B (zh) * 2020-03-20 2023-08-18 杜比国际公司 扬声器的低音增强
CN111970627B (zh) * 2020-08-31 2021-12-03 广州视源电子科技股份有限公司 音频信号的增强方法、装置、存储介质和处理器
CN113205794B (zh) * 2021-04-28 2022-10-14 电子科技大学 基于生成网络的虚拟低音转换方法
US11950089B2 (en) 2021-07-29 2024-04-02 Samsung Electronics Co., Ltd. Perceptual bass extension with loudness management and artificial intelligence (AI)
CN114501233A (zh) * 2022-01-30 2022-05-13 联想(北京)有限公司 一种信号处理方法、装置及电子设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009010996A (ja) * 2008-09-11 2009-01-15 Sony Corp 音声信号処理装置および音声信号処理方法
JP2009055079A (ja) * 2007-08-23 2009-03-12 Sony Corp 信号処理装置、信号処理方法、プログラム
JP2010124016A (ja) * 2008-11-17 2010-06-03 Clarion Co Ltd 低域補完装置
JP2011517546A (ja) * 2008-04-09 2011-06-09 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ オーディオ信号を処理する装置
JP2014072775A (ja) * 2012-09-28 2014-04-21 Sharp Corp 音信号出力装置、音信号出力方法及びコンピュータプログラム

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5930373A (en) * 1997-04-04 1999-07-27 K.S. Waves Ltd. Method and system for enhancing quality of sound signal
EP1044583B2 (en) * 1998-09-08 2007-09-05 Koninklijke Philips Electronics N.V. Means for bass enhancement in an audio system
US8135136B2 (en) * 2004-09-06 2012-03-13 Koninklijke Philips Electronics N.V. Audio signal enhancement
US20080267426A1 (en) * 2005-10-24 2008-10-30 Koninklijke Philips Electronics, N.V. Device for and a Method of Audio Data Processing
US20110091048A1 (en) 2006-04-27 2011-04-21 National Chiao Tung University Method for virtual bass synthesis
TWI339991B (en) 2006-04-27 2011-04-01 Univ Nat Chiao Tung Method for virtual bass synthesis
KR101329308B1 (ko) * 2006-11-22 2013-11-13 삼성전자주식회사 오디오 신호의 저주파 성분 보강 방법 및 그 장치, 오디오신호의 기본 주파수 계산 방법 및 그 장치
KR101310231B1 (ko) 2007-01-18 2013-09-25 삼성전자주식회사 저음 증강 장치 및 방법
JP2009044268A (ja) * 2007-08-06 2009-02-26 Sharp Corp 音声信号処理装置、音声信号処理方法、音声信号処理プログラム、及び、記録媒体
ATE520260T1 (de) * 2007-09-03 2011-08-15 Am3D As Verfahren und vorrichtung zur erweiterung der niederfrequenzausgabe eines lautsprechers
TWI462601B (zh) * 2008-10-03 2014-11-21 Realtek Semiconductor Corp 音頻信號裝置及方法
US8971551B2 (en) 2009-09-18 2015-03-03 Dolby International Ab Virtual bass synthesis using harmonic transposition
CN101673549B (zh) * 2009-09-28 2011-12-14 武汉大学 一种移动音源空间音频参数预测编解码方法及系统
CN102354500A (zh) * 2011-08-03 2012-02-15 华南理工大学 一种基于谐波控制的虚拟低音增强处理方法
US20150146890A1 (en) * 2012-05-29 2015-05-28 Creative Technology Ltd Adaptive bass processing system
CN103607690A (zh) * 2013-12-06 2014-02-26 武汉轻工大学 一种3d音频中多声道信号的下混方法
CN108472686B (zh) * 2015-09-16 2020-05-12 泰克宣技术有限公司 用于声音的音频-触觉空间化和低音的感知的设备和方法
US9794689B2 (en) * 2015-10-30 2017-10-17 Guoguang Electric Company Limited Addition of virtual bass in the time domain
US9794688B2 (en) 2015-10-30 2017-10-17 Guoguang Electric Company Limited Addition of virtual bass in the frequency domain

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009055079A (ja) * 2007-08-23 2009-03-12 Sony Corp 信号処理装置、信号処理方法、プログラム
JP2011517546A (ja) * 2008-04-09 2011-06-09 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ オーディオ信号を処理する装置
JP2009010996A (ja) * 2008-09-11 2009-01-15 Sony Corp 音声信号処理装置および音声信号処理方法
JP2010124016A (ja) * 2008-11-17 2010-06-03 Clarion Co Ltd 低域補完装置
JP2014072775A (ja) * 2012-09-28 2014-04-21 Sharp Corp 音信号出力装置、音信号出力方法及びコンピュータプログラム

Also Published As

Publication number Publication date
WO2019021276A1 (en) 2019-01-31
CN110832881B (zh) 2021-05-28
EP3613219B1 (en) 2021-11-17
JP6968376B2 (ja) 2021-11-17
CN110832881A (zh) 2020-02-21
EP3613219A4 (en) 2020-05-06
EP3613219A1 (en) 2020-02-26
US11102577B2 (en) 2021-08-24
US20200162817A1 (en) 2020-05-21

Similar Documents

Publication Publication Date Title
JP6968376B2 (ja) ステレオ仮想バス拡張
TWI489887B (zh) 用於喇叭或耳機播放之虛擬音訊處理技術
EP3061268B1 (en) Method and mobile device for processing an audio signal
US10104470B2 (en) Audio processing device, audio processing method, recording medium, and program
US20240040303A1 (en) Apparatus and method for generating a first control signal and a second control signal by using a linearization and/or a bandwidth extension
JP2012533953A (ja) ステレオ又は疑似ステレオオーディオ信号を改善する装置及び方法
CA2835742C (en) Apparatus and method and computer program for generating a stereo output signal for providing additional output channels
US20240098448A1 (en) Apparatus and method for generating a control signal for a sound generator or for generating an extended multi-channel audio signal by using a similarity analysis
US20190020966A1 (en) Sub-band Spatial Audio Enhancement
CN113645531B (zh) 一种耳机虚拟空间声回放方法、装置、存储介质及耳机
US11388538B2 (en) Signal processing device, signal processing method, and program for stabilizing localization of a sound image in a center direction
JP6699280B2 (ja) 音響再生装置
TWI854235B (zh) 用以藉由使用相似度分析產生用於聲音產生器之控制信號或產生擴展多聲道音訊信號之設備及方法
US20240056735A1 (en) Stereo headphone psychoacoustic sound localization system and method for reconstructing stereo psychoacoustic sound signals using same
JP7292650B2 (ja) ミキシング装置、ミキシング方法、及びミキシングプログラム
JP6832095B2 (ja) チャンネル数変換装置およびそのプログラム
WO2023156274A1 (en) Apparatus and method for reducing spectral distortion in a system for reproducing virtual acoustics via loudspeakers
KR101636801B1 (ko) 어레이 스피커를 이용하여 음원을 포커싱하는 음원 포커싱장치 및 방법
JP2006042316A (ja) 音像上方拡大回路
JP2018101824A (ja) マルチチャンネル音響の音声信号変換装置及びそのプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200414

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210219

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210325

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210518

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20211011

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20211018

R150 Certificate of patent or registration of utility model

Ref document number: 6968376

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150