RU2020127190A - Способы, аппараты и системы кодирования и декодирования направленных источников звука - Google Patents

Способы, аппараты и системы кодирования и декодирования направленных источников звука Download PDF

Info

Publication number
RU2020127190A
RU2020127190A RU2020127190A RU2020127190A RU2020127190A RU 2020127190 A RU2020127190 A RU 2020127190A RU 2020127190 A RU2020127190 A RU 2020127190A RU 2020127190 A RU2020127190 A RU 2020127190A RU 2020127190 A RU2020127190 A RU 2020127190A
Authority
RU
Russia
Prior art keywords
metadata
audio
data
pattern
paragraphs
Prior art date
Application number
RU2020127190A
Other languages
English (en)
Other versions
RU2020127190A3 (ru
RU2772227C2 (ru
Inventor
Николас Р. ТСИНГОС
Марк Р. П. ТОМАС
Кристоф ФЕРШ
Original Assignee
Долби Лабораторис Лайсэнзин Корпорейшн
Долби Интернешнл Аб
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Долби Лабораторис Лайсэнзин Корпорейшн, Долби Интернешнл Аб filed Critical Долби Лабораторис Лайсэнзин Корпорейшн
Publication of RU2020127190A3 publication Critical patent/RU2020127190A3/ru
Publication of RU2020127190A publication Critical patent/RU2020127190A/ru
Application granted granted Critical
Publication of RU2772227C2 publication Critical patent/RU2772227C2/ru

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/302Electronic adaptation of stereophonic sound system to listener position or orientation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/11Positioning of individual sound objects, e.g. moving airplane, within a sound field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/01Enhancing the perception of the sound image or of the spatial distribution using head related transfer functions [HRTF's] or equivalents thereof, e.g. interaural time difference [ITD] or interaural level difference [ILD]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/11Application of ambisonics in stereophonic audio systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Stereophonic System (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Claims (39)

1. Способ кодирования направленных звуковых данных, включающий:
прием монофонического звукового сигнала, соответствующего звуковому объекту, и представления схемы излучения, соответствующей звуковому объекту, причем схема излучения содержит уровни звука, соответствующие нескольким периодам дискретизации, нескольким полосам частот и нескольким направлениям;
кодирование монофонического звукового сигнала и
кодирование схемы излучения источника для определения метаданных схемы излучения;
при этом кодирование схемы излучения включает определение преобразования сферических гармоник представления схемы излучения и сжатие преобразования сферических гармоник для получения метаданных кодированной схемы излучения.
2. Способ по п. 1, отличающийся тем, что дополнительно включает кодирование нескольких направленных звуковых объектов на основании кластера звуковых объектов, при этом схема излучения представляет центроид, который отражает среднее значение уровня звука для каждой полосы частот.
3. Способ по п. 2, отличающийся тем, что несколько направленных звуковых объектов кодируют в качестве одного направленного звукового объекта, направленность которого соответствует изменяющемуся во времени энергетически взвешенному среднему коэффициентов сферических гармоник каждого звукового объекта.
4. Способ по п. 2 или 3, отличающийся тем, что метаданные кодированной схемы излучения указывают на положение кластера звуковых объектов, то есть среднее положения каждого звукового объекта.
5. Способ по любому из пп. 1-4, отличающийся тем, что дополнительно включает кодирование метаданных группы, относящихся к схеме излучения группы направленных звуковых объектов.
6. Способ по любому из пп. 1-5, отличающийся тем, что масштаб схемы излучения источника изменяют до амплитуды схемы входного излучения в направлении по частоте для определения схемы нормализованного излучения.
7. Способ по любому из пп. 1-6, отличающийся тем, что сжатие преобразования сферических гармоник включает по меньшей мере способ разложения по сингулярным числам, анализ основных компонентов, дискретные косинусные преобразования, не зависящие от данных базисы или устранение коэффициентов сферических гармоник преобразования сферических гармоник, которые выше порогового порядка коэффициентов сферических гармоник.
8. Способ декодирования звуковых данных, включающий:
прием кодированного базового звукового сигнала, метаданных кодированной схемы излучения и метаданных кодированного звукового объекта;
декодирование кодированного базового звукового сигнала для определения базового звукового сигнала;
декодирование метаданных кодированной схемы излучения для определения декодированной схемы излучения;
декодирование метаданных звукового объекта и
рендеринг базового звукового сигнала на основании метаданных звукового объекта и декодированной схемы излучения.
9. Способ по п. 8, отличающийся тем, что метаданные звукового объекта содержат по меньшей мере одно из изменяющейся во времени информации об ориентации источника 3 степеней свободы (DoF) или 6DoF.
10. Способ по п. 8 или 9, отличающийся тем, что базовый звуковой сигнал содержит несколько направленных объектов на основании кластера объектов и при этом декодированная схема излучения представляет центроид, который отражает среднее значение для каждой полосы частот.
11. Способ по любому из пп. 8-10, отличающийся тем, что рендеринг основан на применении коэффициентов усиления поддиапазона, основанных по меньшей мере частично на декодированных данных излучения, к декодированному базовому звуковому сигналу.
12. Способ по любому из пп. 8-11, отличающийся тем, что метаданные кодированной схемы излучения соответствуют переменному во времени и по частоте набору коэффициентов сферических гармоник.
13. Способ по любому из пп. 8-12, отличающийся тем, что метаданные кодированной схемы излучения содержат метаданные типа звукового объекта.
14. Способ по п. 13, отличающийся тем, что метаданные типа звукового объекта указывают на параметрические данные схемы направленности, и при этом параметрические данные схемы направленности содержат одну или более функций, выбранных из списка функций, состоящего из косинусной функции, синусной функции или кардиоидной функции.
15. Способ по п. 13, отличающийся тем, что метаданные типа звукового объекта указывают на данные схемы направленности базы данных, и при этом декодирование метаданных кодированной схемы излучения для определения декодированной схемы излучения включает запрашивание структуры данных направленности, которая содержит типы звукового объекта и соответствующие данные схемы направленности.
16. Способ по п. 13, отличающийся тем, что метаданные типа звукового объекта указывают на динамические данные схемы направленности, и при этом динамические данные схемы направленности соответствуют переменному во времени и по частоте набору коэффициентов сферических гармоник.
17. Способ по п. 16, отличающийся тем, что дополнительно включает прием динамических данных схемы направленности до приема кодированного базового звукового сигнала.
18. Аппарат декодирования звука, содержащий:
интерфейсную систему и
систему управления, выполненную с возможностью:
приема посредством интерфейсной системы звуковых данных, соответствующих по меньшей мере одному звуковому объекту, при этом звуковые данные включают монофонический звуковой сигнал, метаданные положения звукового объекта, метаданные размера звукового объекта и параметр рендеринга;
определения, указывает ли параметр рендеринга на режим положения или режим направленности, и при определении, что параметр рендеринга указывает на режим направленности, рендеринг звуковых данных для воспроизведения посредством по меньшей мере одного громкоговорителя в соответствии со схемой направленности, указанной по меньшей мере одним из метаданных положения или метаданных размера.
19. Аппарат по п. 18, отличающийся тем, что рендеринг звуковых данных может включать интерпретацию метаданных положения звукового объекта в качестве метаданных ориентации звукового объекта.
20. Аппарат по п. 19, отличающийся тем, что метаданные положения звукового объекта содержат по меньшей мере одно из данных координат x, y, z, данных сферических координат или данных цилиндрических координат и при этом метаданные ориентации звукового объекта содержат данные рыскания, тангажа и крена.
21. Аппарат по любому из пп. 18-20, отличающийся тем, что рендеринг звуковых данных включает интерпретацию метаданных размера звукового объекта в качестве метаданных направленности, которые соответствуют схеме направленности.
22. Аппарат по любому из пп. 18-21, отличающийся тем, что рендеринг звуковых данных включает запрашивание структуры данных, которая содержит несколько схем направленности, и соотнесение по меньшей мере одного из метаданных положения или метаданных размера с одной или более схемами направленности.
23. Аппарат по п. 22, отличающийся тем, что система управления выполнена с возможностью приема структуры данных посредством интерфейсной системы.
24. Аппарат по п. 23, отличающийся тем, что структура данных принимается до звуковых данных.
25. Аппарат по любому из пп. 18-24, отличающийся тем, что звуковые данные принимаются в формате Dolby Atmos.
26. Аппарат по любому из пп. 18-25, отличающийся тем, что метаданные положения звукового объекта соответствуют мировым координатам или модельным координатам.
RU2020127190A 2018-04-16 2019-04-15 Способы, аппараты и системы кодирования и декодирования направленных источников звука RU2772227C2 (ru)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US201862658067P 2018-04-16 2018-04-16
US62/658,067 2018-04-16
US201862681429P 2018-06-06 2018-06-06
US62/681,429 2018-06-06
US201862741419P 2018-10-04 2018-10-04
US62/741,419 2018-10-04
PCT/US2019/027503 WO2019204214A2 (en) 2018-04-16 2019-04-15 Methods, apparatus and systems for encoding and decoding of directional sound sources

Related Child Applications (1)

Application Number Title Priority Date Filing Date
RU2022112239A Division RU2022112239A (ru) 2018-04-16 2019-04-15 Способы, аппараты и системы кодирования и декодирования направленных источников звука

Publications (3)

Publication Number Publication Date
RU2020127190A3 RU2020127190A3 (ru) 2022-02-14
RU2020127190A true RU2020127190A (ru) 2022-02-14
RU2772227C2 RU2772227C2 (ru) 2022-05-18

Family

ID=

Also Published As

Publication number Publication date
US11315578B2 (en) 2022-04-26
WO2019204214A2 (en) 2019-10-24
RU2020127190A3 (ru) 2022-02-14
JP2023139188A (ja) 2023-10-03
EP3782152A2 (en) 2021-02-24
US20220328052A1 (en) 2022-10-13
KR20200141981A (ko) 2020-12-21
JP7321170B2 (ja) 2023-08-04
US20240212693A1 (en) 2024-06-27
WO2019204214A3 (en) 2019-11-28
JP2021518923A (ja) 2021-08-05
US11887608B2 (en) 2024-01-30
CN111801732A (zh) 2020-10-20
US20210118452A1 (en) 2021-04-22
BR112020016912A2 (pt) 2020-12-15

Similar Documents

Publication Publication Date Title
CN109313907B (zh) 合并音频信号与空间元数据
CN104471640B (zh) 基于对象的环绕声编码解码器的具有反馈的可缩放降混设计
US20240212693A1 (en) Methods, apparatus and systems for encoding and decoding of directional sound sources
US10972853B2 (en) Signalling beam pattern with objects
CN108140389A (zh) 空间向量的量化
CN111316353A (zh) 确定空间音频参数编码和相关联的解码
CN108780647A (zh) 音频的混合域译码
JP5000297B2 (ja) 音場の表現を求めるためのシステムおよび方法
CN108141688A (zh) 从以信道为基础的音频到高阶立体混响的转换
EP3777242B1 (en) Spatial sound rendering
EP4430609A1 (en) Audio content generation and classification
TWI716810B (zh) 用以轉換音訊物件之物件位置的設備、音訊串流供應器、音訊內容產生系統、音訊播放設備、方法及電腦程式
MX2021016056A (es) Metodos, aparatos y sistemas para representacion, codificacion, y decodificacion de datos de directividad discreta.
RU2772227C2 (ru) Способы, аппараты и системы кодирования и декодирования направленных источников звука
EP4346235A1 (en) Apparatus and method employing a perception-based distance metric for spatial audio
WO2023074800A1 (ja) 情報処理装置および方法、並びにプログラム
CN118800253A (zh) 场景音频信号的解码方法和装置
CN118800251A (zh) 场景音频信号的编码方法和装置
CN118800249A (zh) 场景音频信号的解码方法和装置
CN118140492A (zh) 信息处理装置、方法和程序
CN118800255A (zh) 场景音频信号的解码方法和装置
CN118800256A (zh) 场景音频信号的解码方法和装置
CN118138980A (zh) 场景音频解码方法及电子设备
CN118136027A (zh) 场景音频编码方法及电子设备
CN118314908A (zh) 场景音频解码方法及电子设备