JP2022536530A - Mチャネル入力のs個のスピーカーでのレンダリング(s<m) - Google Patents
Mチャネル入力のs個のスピーカーでのレンダリング(s<m) Download PDFInfo
- Publication number
- JP2022536530A JP2022536530A JP2021574291A JP2021574291A JP2022536530A JP 2022536530 A JP2022536530 A JP 2022536530A JP 2021574291 A JP2021574291 A JP 2021574291A JP 2021574291 A JP2021574291 A JP 2021574291A JP 2022536530 A JP2022536530 A JP 2022536530A
- Authority
- JP
- Japan
- Prior art keywords
- audio signal
- channels
- rendering matrix
- matrix
- speakers
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000009877 rendering Methods 0.000 title claims abstract description 71
- 239000011159 matrix material Substances 0.000 claims abstract description 63
- 230000005236 sound signal Effects 0.000 claims abstract description 36
- 238000000034 method Methods 0.000 claims description 33
- 238000009499 grossing Methods 0.000 claims description 7
- 239000013598 vector Substances 0.000 claims description 5
- 230000001419 dependent effect Effects 0.000 claims description 2
- 238000004590 computer program Methods 0.000 claims 3
- 238000012986 modification Methods 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 238000013459 approach Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 239000000203 mixture Substances 0.000 description 4
- 101150092843 SEC1 gene Proteins 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000010304 firing Methods 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000007723 transport mechanism Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R5/00—Stereophonic arrangements
- H04R5/02—Spatial or constructional arrangements of loudspeakers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/30—Control circuits for electronic adaptation of the sound field
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R5/00—Stereophonic arrangements
- H04R5/04—Circuit arrangements, e.g. for selective connection of amplifier inputs/outputs to loudspeakers, for loudspeaker detection, or for adaptation of settings to personal preferences or hearing impairments
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2205/00—Details of stereophonic arrangements covered by H04R5/00 but not provided for in any of its subgroups
- H04R2205/024—Positioning of loudspeaker enclosures for spatial sound reproduction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2499/00—Aspects covered by H04R or H04S not otherwise provided for in their subgroups
- H04R2499/10—General applications
- H04R2499/11—Transducers incorporated or for use in hand-held devices, e.g. mobile phones, PDA's, camera's
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/03—Aspects of down-mixing multi-channel audio to configurations with lower numbers of playback channels, e.g. 7.1 -> 5.1
Landscapes
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Stereophonic System (AREA)
Abstract
Description
本願は、2019年6月20日に出願されたPCT出願第PCT/CN2019/092021号、および2019年7月17日に出願された米国仮出願第62/875,160号(それぞれ参照によりその全体が本明細書に組み込まれる)に対する優先権を主張する。
本発明は、SがMより小さい場合に、Sスピーカー上でのMチャネル入力のレンダリングに関する。
以下に開示されるシステムおよび方法は、ソフトウェア、ファームウェア、ハードウェア、またはそれらの組み合わせとして実装されうる。ハードウェア実装では、タスクの分割は必ずしも物理的ユニットへの分割に対応しない;逆に、一つの物理的コンポーネントが複数の機能を有することがあり、一つのタスクが協働する複数の物理的コンポーネントによって実行されてもよい。ある種のコンポーネントまたはすべてのコンポーネントは、デジタル信号プロセッサまたはマイクロプロセッサによって実行されるソフトウェアとして実装されてもよく、またはハードウェアとして、または特定用途向け集積回路として実装されてもよい。そのようなソフトウェアは、コンピュータ記憶媒体(または非一時的媒体)および通信媒体(または一時的媒体)を含みうるコンピュータ読み取り可能な媒体上で配布されてもよい。当業者には周知のように、用語「コンピュータ記憶媒体」は、コンピュータ読み取り可能な命令、データ構造、プログラムモジュール、または他のデータのような情報の記憶のための任意の方法または技術で実装される揮発性および不揮発性の、取り外し可能型および非取り外し可能型の媒体の両方を含む。コンピュータ記憶媒体は、RAM、ROM、EEPROM、フラッシュメモリ、または他のメモリ技術、CD-ROM、デジタル多用途ディスク(DVD)、または他の光ディスク記憶、磁気カセット、磁気テープ、磁気ディスク記憶、または他の磁気記憶装置、または所望の情報を記憶するために使用することができ、コンピュータによってアクセスされることができる他の任意の媒体を含むが、これらに限定されない。さらに、通信媒体は、典型的には、変調されたデータ信号、たとえば搬送波または他のトランスポート機構においてコンピュータ読み取り可能な命令、データ構造、プログラムモジュールまたは他のデータを具現し、任意の情報送達媒体を含むことが当業者には周知である。
Mチャネルの入力信号とSスピーカー装置が与えられた場合、一般的なレンダリング処理は次の式で表される:
y=Rx (1)
ここで、xは入力信号を表すM次元ベクトルであり、yはレンダリングされた信号を表すS次元ベクトルであり、RはS×Mレンダリング行列である。レンダリング行列Rについては、行はスピーカーに対応し、列は入力信号のチャネルに対応する。レンダリング行列のエントリーは、チャネルからスピーカーへのマッピングを示す。
1)前方チャネル、すなわち左、右、中央チャネル(L、R、C)
2)聴取者平面のサラウンドチャネル、たとえば5.1/5.1.2/5.1.4などの左/右サラウンド(Ls/Rs)または7.1/7.1.2/7.1.4などの左/右サラウンド(Lrs/Rrs)
3)高さチャネル、たとえば、5.1.2/7.1.2/9.1.2などの左/右上(Lt/Rt)、5.1.4/7.1.4/9.1.4などの左/右上前/後(Ltf/Rtf、Ltr/Rtr)
4)LFEチャネル。
チャネル解析モジュール23は、入力信号が縮退しているか否かを決定することを目的とし、それにより、適正なプリレンダリングされた信号またはそれらの適切な混合信号が使用できる。モジュール23は、フレームごとに実行される。
利得grawは、入力信号の履歴に従って平滑化モジュール14によってさらに平滑化されることができる。現在のフレームn(n>1)では、平滑化された利得は下のように計算できる。
本明細書中で使用されるところでは、別段の規定がない限り、共通の対象を記述するための順序形容詞「第1の」、「第2の」、「第3の」などの使用は、単に、類似の対象の異なるインスタンスが言及されていることを示し、そのように記載された対象が、時間的に、空間的に、ランク付けにおいて、または任意の他の仕方で、所与のシーケンスになければならないことを意味することを意図するものではない。
たとえば、図示した実施形態では、ポータブル装置は、4つのスピーカー(S=4)を有する。もちろん、4つより多くの(または少ない)スピーカーをもつことが可能であり、その結果、異なる行列サイズが生じる。
Claims (20)
- M個のチャネルを有するマルチチャネル・オーディオ信号を、S個の独立したスピーカーを有するポータブル装置にレンダリングするオーディオ・レンダラーであって、S<Mであり、当該オーディオ・レンダラーは:
前記入力オーディオ信号に一次レンダリング行列を適用して、前記複数の独立したスピーカーでの再生に好適な第1のプリレンダリングされた信号を提供する第1の行列適用モジュールと;
前記入力オーディオ信号に二次レンダリング行列を適用して、前記複数の独立したスピーカーでの再生に好適な第2のプリレンダリングされた信号を提供する第2の行列適用モジュールと;
時間変化するチャネル分布に従って混合利得を計算するように構成されたチャネル解析モジュールと;
前記混合利得に基づいて前記第1および第2のプリレンダリングされた信号を混合することによって、レンダリングされた出力信号を生成するように構成された混合モジュールとを有する、
オーディオ・レンダラー。 - 前記二次レンダリング行列は、前記入力オーディオ信号における前記チャネルの少なくとも1つを無視するように構成される、請求項1に記載のオーディオ・レンダラー。
- 前記入力オーディオ信号は、2つの高さチャネルを含み、前記二次レンダリング行列は、前記高さチャネルを無視するように構成される、請求項2に記載のオーディオ・レンダラー。
- 先行するフレームの集合についての利得を混合することに基づいて現在のフレームについての混合利得を平滑化する平滑化モジュールをさらに有する、請求項1ないし6のうちいずれか一項に記載のオーディオ・レンダラー。
- 前記一次レンダリング行列および前記二次レンダリング行列のエントリーは、実定数または周波数依存の複素ベクトルである、請求項1ないし7のうちいずれか一項に記載のオーディオ・レンダラー。
- 前記一次レンダリング行列の少なくともいくつかのエントリーは、特定の諸周波数帯域、たとえば7kHz~9kHzにおいて細分される、請求項1ないし8のうちいずれか一項に記載のオーディオ・レンダラー。
- 前記一次レンダリング行列および前記二次レンダリング行列の少なくともいくつかのエントリーは等しい、請求項1ないし9のうちいずれか一項に記載のオーディオ・レンダラー。
- 前記チャネル解析モジュールは、前記入力チャネルの間でのエネルギー分布に基づいて前記混合利得を決定する、請求項1ないし10のうちいずれか一項に記載のオーディオ・レンダラー。
- M個のチャネルを有するマルチチャネル・オーディオ信号を、S個の独立したスピーカーを有するポータブル装置にレンダリングする方法であって、S<Mであり、当該方法は:
前記入力オーディオ信号に一次レンダリング行列を適用して、前記複数の独立したスピーカーでの再生に好適な第1のプリレンダリングされた信号を提供する段階と;
前記入力オーディオ信号に二次レンダリング行列を適用して、前記複数の独立したスピーカーでの再生に好適な第2のプリレンダリングされた信号を提供する段階と;
時間変化するチャネル分布に従って混合利得を計算する段階と;
前記混合利得に基づいて前記第1および第2のプリレンダリングされた信号を混合して、レンダリングされた出力信号を生成する段階とを含む、
方法。 - 前記二次レンダリング行列は、前記入力オーディオ信号における前記チャネルの少なくとも1つを無視するように構成される、請求項12に記載の方法。
- 前記入力オーディオ信号は、2つの高さチャネルを含み、前記二次レンダリング行列は、前記高さチャネルを無視するように構成される、請求項13に記載の方法。
- 先行するフレームの集合についての利得を混合することに基づいて現在のフレームについての混合利得を平滑化する段階をさらに有する、請求項12ないし17のうちいずれか一項に記載の方法。
- プロセッサ上で実行されたときに請求項12ないし18のうちいずれか一項に記載の段階を実行するように構成されたコンピュータ・プログラム・コード部分を含む、コンピュータ・プログラム・プロダクト。
- 非一時的なコンピュータ読み取り可能な媒体に記憶された、請求項19に記載のコンピュータ・プログラム・プロダクト。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2024079078A JP2024105545A (ja) | 2019-06-20 | 2024-05-15 | Mチャネル入力のs個のスピーカーでのレンダリング(s<m) |
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2019092021 | 2019-06-20 | ||
CNPCT/CN2019/092021 | 2019-06-20 | ||
US201962875160P | 2019-07-17 | 2019-07-17 | |
US62/875,160 | 2019-07-17 | ||
PCT/US2020/038209 WO2020257331A1 (en) | 2019-06-20 | 2020-06-17 | Rendering of an m-channel input on s speakers (s<m) |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2024079078A Division JP2024105545A (ja) | 2019-06-20 | 2024-05-15 | Mチャネル入力のs個のスピーカーでのレンダリング(s<m) |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022536530A true JP2022536530A (ja) | 2022-08-17 |
JP7571061B2 JP7571061B2 (ja) | 2024-10-22 |
Family
ID=
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011528200A (ja) * | 2008-07-17 | 2011-11-10 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | オブジェクトベースのメタデータを用いてオーディオ出力信号を生成するための装置および方法 |
JP2016100877A (ja) * | 2014-11-26 | 2016-05-30 | 日本放送協会 | 三次元音響再生装置及びプログラム |
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011528200A (ja) * | 2008-07-17 | 2011-11-10 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | オブジェクトベースのメタデータを用いてオーディオ出力信号を生成するための装置および方法 |
JP2016100877A (ja) * | 2014-11-26 | 2016-05-30 | 日本放送協会 | 三次元音響再生装置及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
CN114080822B (zh) | 2023-11-03 |
WO2020257331A1 (en) | 2020-12-24 |
CN114080822A (zh) | 2022-02-22 |
EP3987825A1 (en) | 2022-04-27 |
JP2024105545A (ja) | 2024-08-06 |
EP3987825B1 (en) | 2024-07-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7502377B2 (ja) | 没入型オーディオ再生システム | |
US11902762B2 (en) | Orientation-aware surround sound playback | |
EP3257269B1 (en) | Upmixing of audio signals | |
US11943605B2 (en) | Spatial audio signal manipulation | |
US10306392B2 (en) | Content-adaptive surround sound virtualization | |
JP7321218B2 (ja) | 変調された脱相関による空間的オーディオ信号の向上 | |
CN105144753A (zh) | 声音处理设备和方法以及程序 | |
JP7571061B2 (ja) | Mチャネル入力のs個のスピーカーでのレンダリング(s<m) | |
JP2022536530A (ja) | Mチャネル入力のs個のスピーカーでのレンダリング(s<m) | |
EP3488623B1 (en) | Audio object clustering based on renderer-aware perceptual difference | |
WO2018017394A1 (en) | Audio object clustering based on renderer-aware perceptual difference | |
KR20170095105A (ko) | 하이브리드 오디오 신호의 메타 데이터 생성 장치 및 그 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20211214 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20221223 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230207 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230428 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230829 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20231031 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20240213 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240515 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20240522 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240910 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20241009 |