JP2022536530A - Mチャネル入力のs個のスピーカーでのレンダリング(s<m) - Google Patents

Mチャネル入力のs個のスピーカーでのレンダリング(s<m) Download PDF

Info

Publication number
JP2022536530A
JP2022536530A JP2021574291A JP2021574291A JP2022536530A JP 2022536530 A JP2022536530 A JP 2022536530A JP 2021574291 A JP2021574291 A JP 2021574291A JP 2021574291 A JP2021574291 A JP 2021574291A JP 2022536530 A JP2022536530 A JP 2022536530A
Authority
JP
Japan
Prior art keywords
audio signal
channels
rendering matrix
matrix
speakers
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2021574291A
Other languages
English (en)
Other versions
JP7571061B2 (ja
Inventor
ヤーン,ズーユイ
シュワーン,ジーウエイ
リウ,ヤーン
リウ,ジーファーン
Original Assignee
ドルビー ラボラトリーズ ライセンシング コーポレイション
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ドルビー ラボラトリーズ ライセンシング コーポレイション filed Critical ドルビー ラボラトリーズ ライセンシング コーポレイション
Publication of JP2022536530A publication Critical patent/JP2022536530A/ja
Priority to JP2024079078A priority Critical patent/JP2024105545A/ja
Application granted granted Critical
Publication of JP7571061B2 publication Critical patent/JP7571061B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • H04R5/02Spatial or constructional arrangements of loudspeakers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • H04R5/04Circuit arrangements, e.g. for selective connection of amplifier inputs/outputs to loudspeakers, for loudspeaker detection, or for adaptation of settings to personal preferences or hearing impairments
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2205/00Details of stereophonic arrangements covered by H04R5/00 but not provided for in any of its subgroups
    • H04R2205/024Positioning of loudspeaker enclosures for spatial sound reproduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2499/00Aspects covered by H04R or H04S not otherwise provided for in their subgroups
    • H04R2499/10General applications
    • H04R2499/11Transducers incorporated or for use in hand-held devices, e.g. mobile phones, PDA's, camera's
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/03Aspects of down-mixing multi-channel audio to configurations with lower numbers of playback channels, e.g. 7.1 -> 5.1

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Stereophonic System (AREA)

Abstract

M個のチャネルを有するマルチチャネル・オーディオ信号を、S個の独立したスピーカーを有するポータブル装置にレンダリングするオーディオ・レンダラーが、入力オーディオ信号に一次レンダリング行列を適用して、複数の独立したスピーカーでの再生に好適な第1のプリレンダリングされた信号を提供する第1の行列適用モジュールと、入力オーディオ信号に二次レンダリング行列を適用して、複数の独立したスピーカーでの再生に好適な第2のプリレンダリングされた信号を提供する第2の行列適用モジュールと、時間変化するチャネル分布に従って混合利得を計算するように構成されたチャネル解析モジュールと、混合利得に基づいて第1および第2のプリレンダリングされた信号を混合することによって、レンダリングされた出力信号を生成するように構成された混合モジュールとを有する。

Description

関連出願への相互参照
本願は、2019年6月20日に出願されたPCT出願第PCT/CN2019/092021号、および2019年7月17日に出願された米国仮出願第62/875,160号(それぞれ参照によりその全体が本明細書に組み込まれる)に対する優先権を主張する。
技術分野
本発明は、SがMより小さい場合に、Sスピーカー上でのMチャネル入力のレンダリングに関する。
携帯電話やタブレット端末などのポータブル装置は、ますます普及してきており、現在では非常に一般的になっている。そうした機器は、YouTube(登録商標)または同様な源などからの映画や音楽を含むメディア再生のためによく使用される。没入的な聴取体験を実現するために、ポータブル装置は、しばしば、複数の独立したスピーカーを備える。たとえば、タブレットは、2つの上層(top-layer)スピーカーと2つの下層(bottom-layer)スピーカーを備えることができる。さらに、これらの装置は、通例、再生制御のために装置を柔軟にするために、それらのスピーカーのための複数の独立した電力増幅器(PA)を備えている。
同時に、マルチチャネル・オーディオコンテンツ、すなわち、2つより多いチャネルをもつコンテンツ、たとえば、5.1、5.1.2がより一般的になってきている。マルチチャネル・オーディオは、オリジナルとして制作されることができ、あるいは他のフォーマット、たとえば、オブジェクトベースのオーディオから、またはさまざまなアップミックス方法によって、変換されることができる。
マルチチャネル・オーディオを、チャネル数より少ないスピーカーを有するポータブル装置にレンダリングすることに向けた異なるアプローチがある。5.1.2オーディオ信号(8チャネル)を4スピーカーのタブレットにレンダリングすることに向けた1つの手法は、入力信号の高さチャネルを2つの上層スピーカーにレンダリングすることである。上層スピーカーおよび下層スピーカーに関して再生サウンドをバランスさせるために、直接チャネル(すなわち、非高さチャネル)は、2つの下層スピーカーにレンダリングされる。そのようなレンダリング手法の一例は、特許文献1によって提供されている。
しかしながら、従来技術のレンダリング手法は、入力オーディオチャネルの時間変化する挙動を考慮していない。
WO2017/165837
本発明の目的は、入力オーディオに基づいた、よりダイナミックなレンダリング手法を提供することである。
本発明の第1の側面によれば、このおよび他の目的は、M個のチャネルを有するマルチチャネル・オーディオ信号を、S個の独立したスピーカーを有するポータブル装置にレンダリングするオーディオ・レンダラーによって達成される。ここで、S<Mであり、当該オーディオ・レンダラーは、入力オーディオ信号に一次レンダリング行列を適用して、前記複数の独立したスピーカーでの再生に好適な第1のプリレンダリングされた信号を提供する第1の行列適用モジュールと、入力オーディオ信号に二次レンダリング行列を適用して、前記複数の独立したスピーカーでの再生に好適な第2のプリレンダリングされた信号を提供する第2の行列適用モジュールと、時間変化するチャネル分布に従って混合利得を計算するように構成されたチャネル解析モジュールと、前記混合利得に基づいて第1および第2のプリレンダリングされた信号を混合することによって、レンダリングされた出力信号を生成するように構成された混合モジュールとを有する。
本発明の第2の側面によれば、このおよび他の目的は、M個のチャネルを有するマルチチャネル・オーディオ信号を、S個の独立したスピーカーを有するポータブル装置にレンダリングする方法によって達成される。ここで、S<Mであり、当該方法は、入力オーディオ信号に一次レンダリング行列を適用して、前記複数の独立したスピーカーでの再生に好適な第1のプリレンダリングされた信号を提供する段階と、入力オーディオ信号に二次レンダリング行列を適用して、前記複数の独立したスピーカーでの再生に好適な第2のプリレンダリングされた信号を提供する段階と、時間変化するチャネル分布に従って混合利得を計算する段階と、前記混合利得に基づいて第1および第2のプリレンダリングされた信号を混合して、レンダリングされた出力信号を生成する段階とを含む。
本発明は、マルチチャネル・オーディオ入力がさまざまな数のアクティブ・チャネルを有することができるという認識に基づいている。いくつかの(少なくとも2つの)異なるレンダリング行列を提供し、入力信号の解析に基づいてレンダリング行列の適切な混合を選択することによって、利用可能なスピーカー上での、より効率的なレンダリングが達成できる。
極端な場合には、レンダリングされた出力は、プリレンダリングされた信号の1つに対応し、他の場合には、両方の混合である。
二次レンダリング行列は、入力オーディオフォーマットにおける前記チャネルの少なくとも1つを無視するように構成されることができる。これは、入力信号の一つまたは複数のチャネルが比較的弱く、よって、レンダリングされた出力にもはや著しく寄与しない場合に適切でありうる。諸時間期間の間、弱いことがありうるチャネルの一例は、高さチャネル、すなわち、聴取者の上方に位置する、または少なくとも他の(直接)スピーカーよりも高くに位置する(高さ)スピーカー上での再生のために意図されたチャネルである。
ある特定の例は、5.1.2オーディオ、すなわち、左、右、中央、左後、右後、LFE、および左/右高さチャネルを有するオーディオに関する。いくつかの期間の間、たとえば、高さチャネルは比較的弱いことがあり、その場合、5.1.2信号は5.1信号、すなわち8チャネルではなく6チャネルに縮退する。その状況では、もとのレンダリング行列(5.1.2に適応されている)が、上レベルと下レベルのスピーカーの間の不均衡なラウドネスにつながる可能性がある。本発明によれば、レンダリングは、現在アクティブなチャネルに焦点を合わせるように動的に調節されてもよい。したがって、与えられた例では、入力オーディオは、5.1.2に適応されたレンダリング行列ではなく、5.1に適応されたレンダリング行列を使用してレンダリングできる。以下の詳細な説明は、レンダリング行列のより詳細な例を提供する。
本発明は、本発明の現在好ましい実施形態を示す添付図面を参照して、より詳細に説明される。
本発明のある実施形態によるオーディオ・レンダラーのブロック図である。 本発明のある実施形態のフローチャートである。 a~bは、上/下発射(a)および左/右発射(b)に対応する、ポータブル装置の横置き配向の4スピーカー・レイアウトの2つの例を示す。
現在好ましい実施形態の詳細な説明
以下に開示されるシステムおよび方法は、ソフトウェア、ファームウェア、ハードウェア、またはそれらの組み合わせとして実装されうる。ハードウェア実装では、タスクの分割は必ずしも物理的ユニットへの分割に対応しない;逆に、一つの物理的コンポーネントが複数の機能を有することがあり、一つのタスクが協働する複数の物理的コンポーネントによって実行されてもよい。ある種のコンポーネントまたはすべてのコンポーネントは、デジタル信号プロセッサまたはマイクロプロセッサによって実行されるソフトウェアとして実装されてもよく、またはハードウェアとして、または特定用途向け集積回路として実装されてもよい。そのようなソフトウェアは、コンピュータ記憶媒体(または非一時的媒体)および通信媒体(または一時的媒体)を含みうるコンピュータ読み取り可能な媒体上で配布されてもよい。当業者には周知のように、用語「コンピュータ記憶媒体」は、コンピュータ読み取り可能な命令、データ構造、プログラムモジュール、または他のデータのような情報の記憶のための任意の方法または技術で実装される揮発性および不揮発性の、取り外し可能型および非取り外し可能型の媒体の両方を含む。コンピュータ記憶媒体は、RAM、ROM、EEPROM、フラッシュメモリ、または他のメモリ技術、CD-ROM、デジタル多用途ディスク(DVD)、または他の光ディスク記憶、磁気カセット、磁気テープ、磁気ディスク記憶、または他の磁気記憶装置、または所望の情報を記憶するために使用することができ、コンピュータによってアクセスされることができる他の任意の媒体を含むが、これらに限定されない。さらに、通信媒体は、典型的には、変調されたデータ信号、たとえば搬送波または他のトランスポート機構においてコンピュータ読み取り可能な命令、データ構造、プログラムモジュールまたは他のデータを具現し、任意の情報送達媒体を含むことが当業者には周知である。
ここで、本発明のある実施形態について、図1のブロック図および図2のフローチャートを参照して論じる。
本方法はリアルタイムで実行される。最初に、ステップS1でマルチチャネル入力オーディオが受領され(たとえばデコードされ)、ステップS2で受領されたチャネルの数Mおよび利用可能なスピーカーの数Sに基づいてレンダリング行列の集合が生成される。各レンダリング行列は、M個の受領された信号をS個のスピーカー・フィードにレンダリングするように構成される。ここで、S<Mである。図示される例では、集合は、一次(デフォルト)行列と二次(代替)行列を含むが、一つまたは複数の追加的な代替行列が可能である。ステップS3では、各行列は、行列適用モジュール11、12によって入力信号に適用され、さらなる混合のためにあらかじめレンダリングされた信号を生成する。並列なステップS4では、入力オーディオはチャネル解析モジュール13によって解析される。ステップS5では、たとえばチャネル間のエネルギー分布に基づいて、解析モジュール13によって利得が計算される。この利得は、ステップS6において平滑化モジュール14によってさらに平滑化され、次いで混合モジュール15に入力され、混合モジュール15は、行列適用モジュール11、12からの出力も受け取る。ステップS7では、混合モジュール15は、平滑化された利得に基づいて、事前にレンダリングされた信号を混合(加重)し、レンダリングされたオーディオ信号を出力する。レンダリング処理の詳細については、以下で説明する。
レンダリング行列
Mチャネルの入力信号とSスピーカー装置が与えられた場合、一般的なレンダリング処理は次の式で表される:
y=Rx (1)
ここで、xは入力信号を表すM次元ベクトルであり、yはレンダリングされた信号を表すS次元ベクトルであり、RはS×Mレンダリング行列である。レンダリング行列Rについては、行はスピーカーに対応し、列は入力信号のチャネルに対応する。レンダリング行列のエントリーは、チャネルからスピーカーへのマッピングを示す。
S個の独立したスピーカー(S>2)を備えたポータブル装置が与えられると、一次レンダリング行列Rprimと二次レンダリング行列Rsecは、入力チャネル数Mに応じて決定される。RprimとRsecは、両方とも同じサイズのS×Mをもつ。具体的には、行列RprimおよびRsecは次のように書くことができる。
Figure 2022536530000002
ここで、Rprimは、入力Mチャネル・オーディオをレンダリングするための最適行列であり、一方、Rsecは、縮退信号のための最適行列である。縮退信号とは、すなわち、D個だけの有意なチャネル(D<M)と、取るに足りない寄与を有し、無視されてもよい一つまたは複数のチャネルとを含むMチャネル・オーディオ信号である。よって、レンダリング行列RsecもS×M行列であるが、一つまたは複数のゼロ列をもつ(ゼロ列はMチャネルのうちの1つからのゼロ寄与を与える)。2つのレンダリング行列RprimおよびRsecが入力信号xに適用されると、2つのプリレンダリングされた信号yprimおよびysecが生成される:
Figure 2022536530000003
一般に、マルチチャネル・オーディオは、通例、4つのカテゴリーのチャネルを含む:
1)前方チャネル、すなわち左、右、中央チャネル(L、R、C)
2)聴取者平面のサラウンドチャネル、たとえば5.1/5.1.2/5.1.4などの左/右サラウンド(Ls/Rs)または7.1/7.1.2/7.1.4などの左/右サラウンド(Lrs/Rrs)
3)高さチャネル、たとえば、5.1.2/7.1.2/9.1.2などの左/右上(Lt/Rt)、5.1.4/7.1.4/9.1.4などの左/右上前/後(Ltf/Rtf、Ltr/Rtr)
4)LFEチャネル。
目標スピーカー・レイアウトが与えられた場合、式(2)で定義された一次行列はブロック行列として書き直すことができる:
Figure 2022536530000004
ここで、F、R、Hはそれぞれ前方、サラウンド、高さチャネルの数であり、liはLFEの係数に対応する。
二次行列Rsecは、一つまたは複数のゼロ列を用いてRprimから導出できる。
本発明の実施形態によるレンダリング行列の、いくつかの、より具体的な例を以下に説明する。
図3のaおよびbは、ポータブル装置、ここでは横置き配向のタブレットの2つの例を示しており、この装置は複数の独立に制御されるスピーカーを備えている。どちらの例でも、装置は4つのスピーカーa~dをもつ(S=4)。図1のaでは、スピーカーは、装置の上側および下側(upper and lower sides)に配置され、よって、音を上方に(upwards)発する2つのスピーカーa、bと、音を下方に(downwards)発する2つのスピーカーc、dを含む。図1のbでは、スピーカーは、装置の左側および右側に配置され、よって、音を側方に発する2つの上(upper)スピーカーa、bおよび音を側方に発する2つの下(lower)スピーカーc、dを含む。
本例では、5.1.2チャネル・オーディオ信号(M=8)が、図3のaまたはbのポータブル装置で再生される。
この場合、一次行列Rprimは次式によって定義できる。
Figure 2022536530000005
ここで、行インデックス1~4はスピーカーa~dに対応し、列インデックス1~8は5.1.2フォーマットのL、R、C、Ls、Rs、LFE、Lt、Rtチャネルに対応する。
もとの5.1.2信号の高さチャネルがほぼ無音である期間中は、オーディオ信号は5.1信号に、無視されうる2チャネルを加えたものに縮退する。よって、二次レンダリング行列Rsec1は、次式によって定義できる。
Figure 2022536530000006
ここで、最後の2つの列は、2つの無音の高さチャネルLtとRtに対応するゼロである。
所与の装置および入力信号について複数の二次レンダリング行列Rsecxが存在しうることに留意されたい。5.1.2オーディオを4つのスピーカーにレンダリングする上記の例では高さチャネルに加えてサラウンドチャネルLs、Rsもほぼ無音である場合、信号はC、L、R、LFEチャネルのみを含む3.1信号と、無視されうるチャネルの集合に縮退する。その場合、対応する二次行列Rsec2は次のようになる。
Figure 2022536530000007
実際上は、複数の二次行列が存在する場合、適正な二次行列は、以下に記載されるチャネル解析に基づいて動的に選択される。
入力信号の効率的なレンダリングを保証することに加えて、すべての入力チャネル(たとえば、高さチャネル)がレンダリング後に明確に区別されることを保証するという課題もある。これは、ポータブル装置内のスピーカー位置間の距離が小さいためである。高さチャネルの例をとると、それらは非高さチャネルのためのスピーカーに比較的近いスピーカーにレンダリングされる可能性が高くなる。これは、高さの音像に関して空間的なつぶれにつながる。
空間的なつぶれを緩和し、レンダリング後に高さチャネルを区別可能にするためには、レンダリング行列Rprimの適正なエントリーを生成することが決定的に重要である。具体的には、高さチャネルの大半を上スピーカー(top speakers)にレンダリングし、一方、前方チャネルを下スピーカー(bottom speakers)にレンダリングすることが望ましい。これにより、高さチャネルが前方チャネルに「沈み込む」ことが緩和される。
上記の例については、Rprimのエントリーは次のように設定できる。
Figure 2022536530000008
あるいはまた、Rprimのエントリーは次のように設定できる。
Figure 2022536530000009
上記の両方の例において、列は(左から右へ)、それぞれ、チャネルL、R、C、LFE、Ls、Rs、LtおよびRtに対応する。
2つの高さチャネルLtおよびRt(列7および8)を無視するように構成された第1の二次行列Rsec1のエントリーは、次のように設定できる。
Figure 2022536530000010
2つの高さチャネルLtおよびRt(列7および8)および2つのサラウンドチャネルLsおよびRs(列5および6)を無視するように構成された第2の二次行列のエントリーは、次のように設定できる。
Figure 2022536530000011
別の例では、7.1.2チャネル(M=10)入力信号が、図3aまたは図3b(S=4)の装置によって再生される。この場合、Rprimのエントリーは次のように設定できる。
Figure 2022536530000012
この場合、列は(左から右へ)、それぞれチャネルL、R、C、LFE、Ls、Rs、Lrs、Rrs、Lt、およびRtに対応する。
二次行列Rsec1およびRsec2のエントリーは次のように設定できる。
Figure 2022536530000013
ここで、RprimおよびRsecxは、縮退した7.1および3.1信号にそれぞれ対応する。
レンダリング行列RprimおよびRsecxのエントリーは、実定数または周波数依存複素ベクトルでありうることに注意されたい。たとえば、式(2)におけるRprimのエントリーは、B次元の複素ベクトルに拡張することができる。ここで、Bは周波数帯域の数である。前述の使用事例では、高さチャネルを向上させるために、式(2)におけるRprimの最後の2つの列のエントリーについて特定の諸周波数帯域が修正されることができる。特定の周波数帯域の例は、7kHz~9kHzでありうる。
また、上記の例によって例示されるように、RprimおよびRsecx行列のエントリーの少なくともいくつかは同じに設定できることに留意されたい。
チャネル解析
チャネル解析モジュール23は、入力信号が縮退しているか否かを決定することを目的とし、それにより、適正なプリレンダリングされた信号またはそれらの適切な混合信号が使用できる。モジュール23は、フレームごとに実行される。
1つの手法は、入力チャネル間のエネルギー分布に基づく。
2つの異なるレンダリング行列のみをもつ前述の使用事例が、例として取り上げられる。4スピーカーのポータブル装置および5.1.2入力信号については、利得grawは次式によって計算される。
Figure 2022536530000014
ここで、rheightは高さチャネルのエネルギーと全エネルギーの比であり、mは冪パラメータであり、TuおよびTlはそれぞれ上限および下限である。
エネルギーに加えて、拡散性(diffuseness)が、入力チャネルを解析するための代替的または追加的な基準となりうる。拡散性が大きいと、上下のスピーカーの間で、L/Rチャネルについて不均衡な係数が割り当てられる傾向がある。
適応的な平滑化および混合
利得grawは、入力信号の履歴に従って平滑化モジュール14によってさらに平滑化されることができる。現在のフレームn(n>1)では、平滑化された利得は下のように計算できる。
Figure 2022536530000015
ここで、αは平滑化パラメータである。
最終的なレンダリング信号yは、下のような混合プロセスによって得られる。
Figure 2022536530000016
2つより多くの異なるレンダリング行列がある場合、レンダリングされた出力は、チャネル解析に依存して、3つ以上のプリレンダリングされた信号の混合を含むことになる。
結語
本明細書中で使用されるところでは、別段の規定がない限り、共通の対象を記述するための順序形容詞「第1の」、「第2の」、「第3の」などの使用は、単に、類似の対象の異なるインスタンスが言及されていることを示し、そのように記載された対象が、時間的に、空間的に、ランク付けにおいて、または任意の他の仕方で、所与のシーケンスになければならないことを意味することを意図するものではない。
特許請求の範囲および本明細書中の説明において、有する、から構成される、含む、という用語はどれも、少なくとも後続の要素/特徴を含むが他の要素を除外しないことを意味するオープンな用語である。よって、特許請求の範囲において使用される場合、有する/含むという用語は、その後に列挙される手段、要素、またはステップに限定されるものとして解釈されるべきではない。たとえば、AおよびBを含む装置という表現の範囲は、要素AおよびBのみからなる装置に限定されるべきではない。本明細書で使用されるところの、含む、含んでいる、包含するという用語も、どれも、少なくとも後続の要素/特徴を含むが他の要素を除外しないことを意味するオープンな用語である。よって、特許請求の範囲において使用される場合、有する/含むという用語は、その後に列挙される手段、要素、またはステップに限定されるものとして解釈されるべきではない。たとえば、AおよびBを含む装置という表現の範囲は、要素AおよびBのみからなる装置に限定されるべきではない。よって、含むは、有すると同義であり、有するを意味する。
本明細書で使用されるところでは、用語「例示的」は、特質を示すのではなく、例を提供するという意味で使用される。すなわち、「例示的実施形態」は、必ず例示的特質の実施形態ではなく、例として提供される実施形態である。
本発明の例示的な実施形態の上述の説明では、本発明のさまざまな特徴が、開示の流れをよくし、さまざまな発明的側面の一つまたは複数の理解を助ける目的で、単一の実施形態、図面、またはその説明において一緒にまとめられることがあることが理解されるべきである。しかしながら、この開示方法は、特許請求される発明が各請求項において明示的に記載されているよりも多くの特徴を必要とするという意図を反映するものと解釈されるべきではない。むしろ、以下の特許請求の範囲が反映するように、発明的な側面は、単一の上述の実施形態のすべての特徴よりも少ないものに存する。よって、詳細な説明に続く特許請求の範囲は、ここに明示的にこの詳細な説明に組み込まれ、各請求項が本発明の別個の実施形態として自立する。
さらに、本明細書に記載されるいくつかの実施形態は、他の実施形態に含まれるいくつかの特徴を含むが他の特徴は含まないものの、当業者には理解されるように、異なる実施形態の特徴の組み合わせは、本発明の範囲内であり、異なる実施形態を形成することが意図されている。たとえば、以下の請求項では、請求項に記載された実施形態の任意のものが、任意の組み合わせで使用できる。
さらに、実施形態のいくつかは、コンピュータ・システムのプロセッサによって、または機能を実行する他の手段によって実現できる方法または方法の要素の組み合わせとして本明細書に記載されている。よって、そのような方法または方法の要素を実行するための必要な命令を有するプロセッサが、該方法または方法の要素を実行するための手段をなす。さらに、装置実施形態の本明細書に記載されている要素は、本発明を実施する目的のために該要素によって実行される機能を実行するための手段の例である。
本明細書において提供される説明において、多数の特定の詳細が記載されている。しかしながら、本発明の実施形態は、こうした特定の詳細なしで実施されうることが理解される。他方では、周知の方法、構造および技法は、本稿の理解を不明瞭にしないため、詳細には示されていない。
同様に、結合されるという用語は、請求項において使用される場合、直接接続のみに限定されるものとして解釈されるべきではないことに留意されたい。「結合された」および「接続された」という用語ならびにそれらの派生形が使用されうる。これらの用語は、互いに同義語として意図されるものではないことを理解しておくべきである。よって、装置Bに結合された装置Aという表現の範囲は、装置Aの出力が装置Bの入力に直接接続される装置またはシステムに限定されるべきではなく、装置Aの出力とBの入力との間に経路が存在し、該経路は他の装置または手段を含む経路であってもよいことを意味する。「結合された」は、2つ以上の要素が、直接的な物理的または電気的接触にあるか、または2つ以上の要素が、互いに直接的に接触していないが、それでも互いと協働または相互作用することを意味しうる。
よって、本発明の特定の実施形態が記載されているが、当業者は、本発明の精神から逸脱することなく、他のさらなる修正がそれに加えられてもよく、あらゆるそのような変更および修正を本発明の範囲内にはいるものとして請求することが意図されていることを理解するであろう。たとえば、上述の式は、単に使用されうる手順を表す。ブロック図から機能が追加または削除されてもよく、機能ブロック間で動作が交換されてもよい。本発明の範囲内に記載される方法にステップが追加または削除されてもよい。
このように、本発明の特定の実施形態が記載されているが、当業者は、本発明の精神から逸脱することなく、他のさらなるなる修正がそれに加えられてもよく、あらゆるそのような変更および修正を本発明の範囲内にはいるものとして請求することが意図されていることを理解するであろう。たとえば、上述の式は、単に使用されうる手順を表す。ブロック図から機能が追加または削除されてもよく、機能ブロック間で動作が交換されてもよい。本発明の範囲内に記載される方法にステップが追加または削除されてもよい。
たとえば、図示した実施形態では、ポータブル装置は、4つのスピーカー(S=4)を有する。もちろん、4つより多くの(または少ない)スピーカーをもつことが可能であり、その結果、異なる行列サイズが生じる。

Claims (20)

  1. M個のチャネルを有するマルチチャネル・オーディオ信号を、S個の独立したスピーカーを有するポータブル装置にレンダリングするオーディオ・レンダラーであって、S<Mであり、当該オーディオ・レンダラーは:
    前記入力オーディオ信号に一次レンダリング行列を適用して、前記複数の独立したスピーカーでの再生に好適な第1のプリレンダリングされた信号を提供する第1の行列適用モジュールと;
    前記入力オーディオ信号に二次レンダリング行列を適用して、前記複数の独立したスピーカーでの再生に好適な第2のプリレンダリングされた信号を提供する第2の行列適用モジュールと;
    時間変化するチャネル分布に従って混合利得を計算するように構成されたチャネル解析モジュールと;
    前記混合利得に基づいて前記第1および第2のプリレンダリングされた信号を混合することによって、レンダリングされた出力信号を生成するように構成された混合モジュールとを有する、
    オーディオ・レンダラー。
  2. 前記二次レンダリング行列は、前記入力オーディオ信号における前記チャネルの少なくとも1つを無視するように構成される、請求項1に記載のオーディオ・レンダラー。
  3. 前記入力オーディオ信号は、2つの高さチャネルを含み、前記二次レンダリング行列は、前記高さチャネルを無視するように構成される、請求項2に記載のオーディオ・レンダラー。
  4. 前記入力オーディオ信号は、7つのチャネルを有する5.1.2オーディオ信号であり(M=7)、独立したスピーカーの数は4であり(S=4)、前記一次レンダリング行列は、
    Figure 2022536530000017
    に設定される、請求項1ないし3のうちいずれか一項に記載のオーディオ・レンダラー。
  5. 前記入力オーディオ信号は、7つのチャネルを有する5.1.2オーディオ信号であり(M=7)、独立したスピーカーの数は4であり(S=4)、前記一次レンダリング行列は、
    Figure 2022536530000018
    に設定される、請求項1ないし3のうちいずれか一項に記載のオーディオ・レンダラー。
  6. 前記入力オーディオ信号は、7つのチャネルを有する5.1.2オーディオ信号であり(M=7)、独立したスピーカーの数は4であり(S=4)、前記二次レンダリング行列は、
    Figure 2022536530000019
    に設定される、請求項1ないし5のうちいずれか一項に記載のオーディオ・レンダラー。
  7. 先行するフレームの集合についての利得を混合することに基づいて現在のフレームについての混合利得を平滑化する平滑化モジュールをさらに有する、請求項1ないし6のうちいずれか一項に記載のオーディオ・レンダラー。
  8. 前記一次レンダリング行列および前記二次レンダリング行列のエントリーは、実定数または周波数依存の複素ベクトルである、請求項1ないし7のうちいずれか一項に記載のオーディオ・レンダラー。
  9. 前記一次レンダリング行列の少なくともいくつかのエントリーは、特定の諸周波数帯域、たとえば7kHz~9kHzにおいて細分される、請求項1ないし8のうちいずれか一項に記載のオーディオ・レンダラー。
  10. 前記一次レンダリング行列および前記二次レンダリング行列の少なくともいくつかのエントリーは等しい、請求項1ないし9のうちいずれか一項に記載のオーディオ・レンダラー。
  11. 前記チャネル解析モジュールは、前記入力チャネルの間でのエネルギー分布に基づいて前記混合利得を決定する、請求項1ないし10のうちいずれか一項に記載のオーディオ・レンダラー。
  12. M個のチャネルを有するマルチチャネル・オーディオ信号を、S個の独立したスピーカーを有するポータブル装置にレンダリングする方法であって、S<Mであり、当該方法は:
    前記入力オーディオ信号に一次レンダリング行列を適用して、前記複数の独立したスピーカーでの再生に好適な第1のプリレンダリングされた信号を提供する段階と;
    前記入力オーディオ信号に二次レンダリング行列を適用して、前記複数の独立したスピーカーでの再生に好適な第2のプリレンダリングされた信号を提供する段階と;
    時間変化するチャネル分布に従って混合利得を計算する段階と;
    前記混合利得に基づいて前記第1および第2のプリレンダリングされた信号を混合して、レンダリングされた出力信号を生成する段階とを含む、
    方法。
  13. 前記二次レンダリング行列は、前記入力オーディオ信号における前記チャネルの少なくとも1つを無視するように構成される、請求項12に記載の方法。
  14. 前記入力オーディオ信号は、2つの高さチャネルを含み、前記二次レンダリング行列は、前記高さチャネルを無視するように構成される、請求項13に記載の方法。
  15. 前記入力オーディオ信号は、7つのチャネルを有する5.1.2オーディオ信号であり(M=7)、独立したスピーカーの数は4であり(S=4)、前記一次レンダリング行列は、
    Figure 2022536530000020
    に設定される、請求項12ないし14のうちいずれか一項に記載の方法。
  16. 前記入力オーディオ信号は、7つのチャネルを有する5.1.2オーディオ信号であり(M=7)、独立したスピーカーの数は4であり(S=4)、前記一次レンダリング行列は、
    Figure 2022536530000021
    に設定される、請求項12ないし14のうちいずれか一項に記載の方法。
  17. 前記入力オーディオ信号は、7つのチャネルを有する5.1.2オーディオ信号であり(M=7)、独立したスピーカーの数は4であり(S=4)、前記一次レンダリング行列は、
    Figure 2022536530000022
    に設定される、請求項12ないし14のうちいずれか一項に記載の方法。
  18. 先行するフレームの集合についての利得を混合することに基づいて現在のフレームについての混合利得を平滑化する段階をさらに有する、請求項12ないし17のうちいずれか一項に記載の方法。
  19. プロセッサ上で実行されたときに請求項12ないし18のうちいずれか一項に記載の段階を実行するように構成されたコンピュータ・プログラム・コード部分を含む、コンピュータ・プログラム・プロダクト。
  20. 非一時的なコンピュータ読み取り可能な媒体に記憶された、請求項19に記載のコンピュータ・プログラム・プロダクト。
JP2021574291A 2019-06-20 2020-06-17 Mチャネル入力のs個のスピーカーでのレンダリング(s<m) Active JP7571061B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2024079078A JP2024105545A (ja) 2019-06-20 2024-05-15 Mチャネル入力のs個のスピーカーでのレンダリング(s<m)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
CN2019092021 2019-06-20
CNPCT/CN2019/092021 2019-06-20
US201962875160P 2019-07-17 2019-07-17
US62/875,160 2019-07-17
PCT/US2020/038209 WO2020257331A1 (en) 2019-06-20 2020-06-17 Rendering of an m-channel input on s speakers (s<m)

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2024079078A Division JP2024105545A (ja) 2019-06-20 2024-05-15 Mチャネル入力のs個のスピーカーでのレンダリング(s<m)

Publications (2)

Publication Number Publication Date
JP2022536530A true JP2022536530A (ja) 2022-08-17
JP7571061B2 JP7571061B2 (ja) 2024-10-22

Family

ID=

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011528200A (ja) * 2008-07-17 2011-11-10 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ オブジェクトベースのメタデータを用いてオーディオ出力信号を生成するための装置および方法
JP2016100877A (ja) * 2014-11-26 2016-05-30 日本放送協会 三次元音響再生装置及びプログラム

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011528200A (ja) * 2008-07-17 2011-11-10 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ オブジェクトベースのメタデータを用いてオーディオ出力信号を生成するための装置および方法
JP2016100877A (ja) * 2014-11-26 2016-05-30 日本放送協会 三次元音響再生装置及びプログラム

Also Published As

Publication number Publication date
CN114080822B (zh) 2023-11-03
WO2020257331A1 (en) 2020-12-24
CN114080822A (zh) 2022-02-22
EP3987825A1 (en) 2022-04-27
JP2024105545A (ja) 2024-08-06
EP3987825B1 (en) 2024-07-24

Similar Documents

Publication Publication Date Title
JP7502377B2 (ja) 没入型オーディオ再生システム
US11902762B2 (en) Orientation-aware surround sound playback
EP3257269B1 (en) Upmixing of audio signals
US11943605B2 (en) Spatial audio signal manipulation
US10306392B2 (en) Content-adaptive surround sound virtualization
JP7321218B2 (ja) 変調された脱相関による空間的オーディオ信号の向上
CN105144753A (zh) 声音处理设备和方法以及程序
JP7571061B2 (ja) Mチャネル入力のs個のスピーカーでのレンダリング(s<m)
JP2022536530A (ja) Mチャネル入力のs個のスピーカーでのレンダリング(s<m)
EP3488623B1 (en) Audio object clustering based on renderer-aware perceptual difference
WO2018017394A1 (en) Audio object clustering based on renderer-aware perceptual difference
KR20170095105A (ko) 하이브리드 오디오 신호의 메타 데이터 생성 장치 및 그 방법

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20211214

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20221223

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230207

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230428

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230829

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20231031

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20240213

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240515

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20240522

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20240910

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20241009