JP7441057B2 - オーディオオーサリング装置、オーディオレンダリング装置、送信装置、受信装置、及び方法 - Google Patents
オーディオオーサリング装置、オーディオレンダリング装置、送信装置、受信装置、及び方法 Download PDFInfo
- Publication number
- JP7441057B2 JP7441057B2 JP2020010038A JP2020010038A JP7441057B2 JP 7441057 B2 JP7441057 B2 JP 7441057B2 JP 2020010038 A JP2020010038 A JP 2020010038A JP 2020010038 A JP2020010038 A JP 2020010038A JP 7441057 B2 JP7441057 B2 JP 7441057B2
- Authority
- JP
- Japan
- Prior art keywords
- rendering
- metadata
- audio signal
- priority
- playback
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000009877 rendering Methods 0.000 title claims description 299
- 238000000034 method Methods 0.000 title claims description 39
- 230000005236 sound signal Effects 0.000 claims description 139
- 238000000926 separation method Methods 0.000 claims description 7
- 230000004044 response Effects 0.000 claims description 4
- 238000010586 diagram Methods 0.000 description 18
- 230000008569 process Effects 0.000 description 6
- 238000004519 manufacturing process Methods 0.000 description 4
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 101100126625 Caenorhabditis elegans itr-1 gene Proteins 0.000 description 1
- 101100018996 Caenorhabditis elegans lfe-2 gene Proteins 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000004091 panning Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Landscapes
- Stereophonic System (AREA)
Description
l: 左、left 15°≦φ≦165°
c: 中央、center -15°<φ<15°
r: 右、right -165°≦φ≦-15°
f: 前、front -60°<φ<60°
s: 横、side 60°≦φ≦120°、-120°≦φ≦-60°
b: 後、back 120°<φ≦180°、-180°≦φ<-120°
T: 天頂、top 60°<θ≦90°
U: 上層、upper 30°≦θ≦60°
M: 中層、middle -30°<θ<30°
B: 下層、bottom -60°≦θ≦-30°
左右方向: (1)左 (2)中央
前後方向: (1)後 (2)横 (3)前
上下方向: (1)上層 (2)中層 (3)下層
[l/c,b/s/f,U/M/B]
となる。本実施形態では、優先レンダリング位置メタデータを、上記のように属性値で、優先順に/で区切って記述することとする。なお、属性値の記述順は、ここでは左右、前後、上下としたが、異なる順序としてもよく、また、どの要素の属性値であるかを示すフラグを併用してもよい。
[l/c,b/s/f,*]
上記のように記述した場合、上下方向に関してはどの層にレンダリングしても構わないことを示し、上下方向の情報はレンダリング時の制約条件に含める必要がないことを意味する。また、l/cの制約条件は、l,cどちらへのレンダリングも不可能な場合、当該オーディオ信号は不再生(ミュート)になることを示す。一方、l/*と記述した場合は、lへのレンダリングが不可能な場合にはその他のどの位置(c又はr)にレンダリングしても構わないことを意味する。
[l/c,b/s,¬B]
とすることでレンダリング禁止位置を指定できる。なお、全属性値及び禁止位置を示す記号は上記のものに限らず、適宜設定することができる。
(1)左・後・上層 (2)左・後・中層
のように、左右方向、前後方向、上下方向を組み合わせて優先レンダリング位置を指示する場合、次のように表示することができる。
[(lbU)/(lbM)]
この場合、lbUが示すレンダリング位置である[左・後・上層]へのレンダリングが最優先され、その次にlbMが示す[左・後・中層]へのレンダリングが選択されることを示す。また、全属性値*を用いると、
[(lb*)/(***)]
のように[左・後]にレンダリングできない場合はどこにレンダリングしても構わない、という優先レンダリング位置の設定も可能になる。
TpFL: [l,f,g(U/M)]
TpBL: [l,b,g(U/M)]
とすると、上下方向の制約条件のg(U/M)は、TpFLとTpBLの両チャンネルが、上層(U)(優先度1)または中層(M)(優先度2)に同時にレンダリングできる場合のみレンダリングすることを示す。このグループ化の例は、両者が同じ高さで再生されることが重要であるときに用いられる。
図7に、優先レンダリング位置メタデータを用いて、再生位置を決定する一例を示す。ここでは、22.2chのBC(再生位置φ=180°,θ=0°)を、5.1.2chの再生環境にレンダリングする場合を考える。
22.2chのBtFL(再生位置φ=45°,θ=-30°)を、優先レンダリング位置[l,f,B]で5.1.2chにレンダリングする場合を考える。この場合、再生環境に下層のスピーカがないため、レンダリング可否判定部31はレンダリング不可と判定する。さらにレンダリング位置決定部32も優先レンダリング位置メタデータに基づいてレンダリング不可と判定し、BtFLのオーディオ信号は不再生(ミュート)になる。
22.2chのTpFL(再生位置φ=45°,θ=30°)とTpBL(再生位置φ=135°,θ=30°)をレンダリングする場合を考える。どちらのチャンネルも左及び上層にレンダリングすることを優先させるなら、TpFLの優先レンダリング位置メタデータを[l,*,U]、TpBLの優先レンダリング位置メタデータを[l,*,U]と記述することになる。この条件で5.1.2chへレンダリングする場合、TpFL、TpBLは共にLtfへレンダリングされる。
図8に、優先レンダリング位置メタデータを用いて、再生位置を決定する別の例を示す。ここでは、22.2chを5.1.2chの再生環境にレンダリングする際に、22.2chのTpSiL(再生位置φ=90°,θ=30°)とTpBL(再生位置φ=135°,θ=30°)の前後関係を維持したまま同一の層にレンダリングしたい場合を考える。
rendering_priority_typeは、優先レンダリングの記述形式を示しており、“0”で属性値ごとの記述、“1”でレンダリングエリアごとの記述を表す。
num_component_lrは、水平面内における左右方向の属性値の数、num_component_fbは、水平面内における前後方向の属性値の数、num_component_ubは、空間における上下方向の属性値の数を格納する。
component_lr_indexは水平面内における左右方向の属性値のインデックスを格納し、例えば図11のように関連付ける。
component_fb_indexは水平面内における前後方向の属性値のインデックスを格納し、例えば図12のように関連付ける。
component_ub_indexは空間における上下方向の属性値のインデックスを格納し、例えば図13のように関連付ける。
group_statusは優先レンダリング位置メタデータにおけるグルーピングの有無を示すフラグであり、“0”で無、“1”で有を示す。“0”の場合は、グルーピングに係るsyntaxは無効となる。
num_groupは当該オーディオ信号の優先レンダリング位置メタデータのうち、グルーピングされるメタデータの数を示す。
group_classは当該オーディオ信号の優先レンダリング位置メタデータ内のグループの通し番号を示す。
group_component_indexはグルーピングされる属性のインデックスを示し、例えば図14のように関連付けられる。
group_component_rankはグルーピングされる属性値の優先順位を示す。
num_areaは優先レンダリング位置メタデータに記述されるレンダリングエリアの個数を示す。
area_lr_indexはレンダリングエリアにおける左右方向の属性値の優先順位ごとのインデックスを格納し、例えば図11と同様に関連づける。
area_fb_indexはレンダリングエリアにおける前後方向の属性値の優先順位ごとのインデックスを格納し、例えば図12と同様に関連づける。
area_ub_indexはレンダリングエリアにおける上下方向の属性値の優先順位ごとのインデックスを格納し、例えば図13と同様に関連づける。
11 メタデータ関連付け部
20 符号化装置
21 分離部
22,23 メタデータ符号化部
24 オーディオ信号符号化部
25 多重化部
30 オーディオレンダリング装置
31 レンダリング可否判定部
32 レンダリング位置決定部
33 再生位置メタデータ置換部
34 レンダリング部
40 スピーカ
50 復号装置
51 分離部
52,53 メタデータ復号部
54 オーディオ信号復号部
100 送信装置
200 受信装置
Claims (7)
- マルチチャンネルのオーディオ信号と、各オーディオ信号の再生位置を示す再生位置メタデータと、前記再生位置メタデータに基づくレンダリングができない場合に各オーディオ信号のレンダリング位置の優先順位を示す優先レンダリング位置メタデータとが入力され、
前記マルチチャンネルのオーディオ信号に前記再生位置メタデータと前記優先レンダリング位置メタデータとを関連付けるメタデータ関連付け部を備え、
前記優先レンダリング位置メタデータは、再生空間を分割した領域ごとの属性値を用いて前記優先順位を設定することを特徴とする、オーディオオーサリング装置。 - 請求項1に記載のオーディオオーサリング装置において、前記優先レンダリング位置メタデータは、複数のオーディオ信号をグループ化し、第1のオーディオ信号の優先レンダリング位置と第2のオーディオ信号の優先レンダリング位置とを関連付けて設定可能なことを特徴とする、オーディオオーサリング装置。
- 請求項1又は2に記載のオーディオオーサリング装置と、符号化装置とを備えた送信装置であって、
前記符号化装置は、
前記オーディオオーサリング装置の出力を前記オーディオ信号と前記再生位置メタデータと前記優先レンダリング位置メタデータとに分離する分離部と、
前記オーディオ信号と前記再生位置メタデータと前記優先レンダリング位置メタデータをそれぞれ符号化する符号化部と、を備え、
符号化された前記オーディオ信号と符号化された前記再生位置メタデータ及び前記優先レンダリング位置メタデータとを多重化して又は関連付けて伝送することを特徴とする、送信装置。 - マルチチャンネルのオーディオ信号と、各オーディオ信号の再生位置を示す再生位置メタデータと、前記再生位置メタデータに基づくレンダリングができない場合に各オーディオ信号のレンダリング位置の優先順位を示す優先レンダリング位置メタデータとに基づいて、レンダリングを行うオーディオレンダリング装置であって、
前記オーディオ信号ごとに、前記再生位置メタデータと再生環境のレンダリングエリアメタデータに基づき、前記再生位置メタデータに基づくレンダリングの可否を判定するレンダリング可否判定部と、
前記レンダリング可否判定部の否決を受けて、前記優先レンダリング位置メタデータと前記レンダリングエリアメタデータから前記オーディオ信号の新たなレンダリング位置を決定するレンダリング位置決定部であって、前記優先レンダリング位置メタデータは、再生空間を分割した領域ごとの属性値を用いて前記優先順位を設定するデータである、レンダリング位置決定部と、
前記再生位置メタデータを前記新たなレンダリング位置に置換する再生位置メタデータ置換部と、
前記オーディオ信号を、前記再生位置メタデータ又は置換済みの再生位置メタデータに基づいてレンダリングするレンダリング部と、
を備えることを特徴とする、オーディオレンダリング装置。 - 復号装置と、請求項4に記載のオーディオレンダリング装置とを備えた受信装置であって、
前記復号装置は、
受信した信号を、符号化された前記オーディオ信号と符号化された前記再生位置メタデータと符号化された前記優先レンダリング位置メタデータとに分離する分離部と、
符号化された前記オーディオ信号と符号化された前記再生位置メタデータと符号化された前記優先レンダリング位置メタデータをそれぞれ復号する復号部とを備え、
復号された前記マルチチャンネルのオーディオ信号と前記再生位置メタデータと前記優先レンダリング位置メタデータとを、前記オーディオレンダリング装置に出力することを特徴とする、受信装置。 - マルチチャンネルのオーディオ信号に対して、各オーディオ信号の再生位置を示す再生位置メタデータと、前記再生位置メタデータに基づくレンダリングができない場合に各オーディオ信号のレンダリング位置の優先順位を示す優先レンダリング位置メタデータとを生成し、
前記マルチチャンネルのオーディオ信号に前記再生位置メタデータと前記優先レンダリング位置メタデータとを関連付け、
前記優先レンダリング位置メタデータは、再生空間を分割した領域ごとの属性値を用いて前記優先順位を設定することを特徴とする、マルチチャンネルのオーディオ信号をオーサリングする方法。 - マルチチャンネルのオーディオ信号と、各オーディオ信号の再生位置を示す再生位置メタデータと、前記再生位置メタデータに基づくレンダリングができない場合に各オーディオ信号のレンダリング位置の優先順位を示す優先レンダリング位置メタデータとに基づいて、マルチチャンネルのオーディオ信号をレンダリングする方法であって、
前記オーディオ信号ごとに、前記再生位置メタデータと再生環境のレンダリングエリアメタデータに基づき、前記再生位置メタデータに基づくレンダリングの可否を判定し、
レンダリングの前記判定の否決を受けて、前記優先レンダリング位置メタデータと前記レンダリングエリアメタデータから前記オーディオ信号の新たなレンダリング位置を決定し、
前記オーディオ信号を、前記再生位置メタデータ又は前記新たなレンダリング位置に基づいてレンダリングし、
前記優先レンダリング位置メタデータは、再生空間を分割した領域ごとの属性値を用いて前記優先順位を設定するデータであることを特徴とする、マルチチャンネルのオーディオ信号をレンダリングする方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019011632 | 2019-01-25 | ||
JP2019011632 | 2019-01-25 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020120377A JP2020120377A (ja) | 2020-08-06 |
JP7441057B2 true JP7441057B2 (ja) | 2024-02-29 |
Family
ID=71891348
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020010038A Active JP7441057B2 (ja) | 2019-01-25 | 2020-01-24 | オーディオオーサリング装置、オーディオレンダリング装置、送信装置、受信装置、及び方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7441057B2 (ja) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014204317A (ja) | 2013-04-05 | 2014-10-27 | 日本放送協会 | 音響信号再生装置、音響信号作成装置 |
JP2016072891A (ja) | 2014-09-30 | 2016-05-09 | シャープ株式会社 | 音声出力制御装置および音声出力制御方法 |
WO2016203994A1 (ja) | 2015-06-19 | 2016-12-22 | ソニー株式会社 | 符号化装置および方法、復号装置および方法、並びにプログラム |
-
2020
- 2020-01-24 JP JP2020010038A patent/JP7441057B2/ja active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014204317A (ja) | 2013-04-05 | 2014-10-27 | 日本放送協会 | 音響信号再生装置、音響信号作成装置 |
JP2016072891A (ja) | 2014-09-30 | 2016-05-09 | シャープ株式会社 | 音声出力制御装置および音声出力制御方法 |
WO2016203994A1 (ja) | 2015-06-19 | 2016-12-22 | ソニー株式会社 | 符号化装置および方法、復号装置および方法、並びにプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP2020120377A (ja) | 2020-08-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2741738C1 (ru) | Система, способ и постоянный машиночитаемый носитель данных для генерирования, кодирования и представления данных адаптивного звукового сигнала | |
US11190893B2 (en) | Methods and systems for rendering audio based on priority | |
US9299353B2 (en) | Method and apparatus for three-dimensional acoustic field encoding and optimal reconstruction | |
JP6412931B2 (ja) | 空間的オーディオ・システムおよび方法 | |
KR102302672B1 (ko) | 음향 신호의 렌더링 방법, 장치 및 컴퓨터 판독 가능한 기록 매체 | |
JP5417227B2 (ja) | マルチチャンネル音響信号のダウンミックス装置及びプログラム | |
KR20150115873A (ko) | 비트스트림에서 오디오 렌더링 정보의 시그널링 | |
US20040008847A1 (en) | Method and apparatus for producing multi-channel sound | |
CN104428835A (zh) | 音频信号的编码和解码 | |
KR102149411B1 (ko) | 오디오 데이터 생성 장치 및 방법, 오디오 데이터 재생 장치 및 방법 | |
JP6174326B2 (ja) | 音響信号作成装置及び音響信号再生装置 | |
CA2944355A1 (en) | Method and apparatus for rendering acoustic signal, and computer-readable recording medium | |
JP7441057B2 (ja) | オーディオオーサリング装置、オーディオレンダリング装置、送信装置、受信装置、及び方法 | |
KR101935020B1 (ko) | 오디오 데이터 제공 방법 및 장치, 오디오 메타데이터 제공 방법 및 장치, 오디오 데이터 재생 방법 및 장치 | |
KR102370348B1 (ko) | 오디오 메타데이터 제공 장치 및 방법, 오디오 데이터 제공 장치 및 방법, 오디오 데이터 재생 장치 및 방법 | |
KR20110085155A (ko) | 실시간 스트리밍을 위한 오디오 생성장치, 오디오 재생장치 및 그 방법 | |
CN108206983A (zh) | 兼容现有音视频系统的三维声信号的编码器及其方法 | |
KR20220030983A (ko) | 오디오 메타데이터 제공 장치 및 방법, 오디오 데이터 제공 장치 및 방법, 오디오 데이터 재생 장치 및 방법 | |
JP2019036961A (ja) | 音響処理装置及びプログラム | |
JP2022553111A (ja) | チャネルベースオーディオからオブジェクトベースオーディオへの変換のためのシステム、方法、及び機器 | |
JP2015186144A (ja) | チャンネル数変換装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20221226 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230809 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230926 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20231116 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240123 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240216 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7441057 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |