RU2022106060A

RU2022106060A - Обработка аудиоданных на основе карты направленной громкости

Info

Publication number: RU2022106060A
Application number: RU2022106060A
Authority: RU
Inventors: Юрген ХЕРРЕ; Пабло Мануэль ДЕЛЬГАДО; Саша ДИК
Original assignee: Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф.
Priority date: 2018-10-26
Filing date: 2019-10-28
Publication date: 2022-04-04
Also published as: RU2022106058A; EP4220639A1; JP2022505964A; US20210383820A1; JP2022177253A; CN113302692A; EP3871216A1; EP4213147A1; WO2020084170A1; BR112021007807A2

Claims

1. Аудиокодер (300) для кодирования (310) входного аудиосодержимого (112), содержащего один или более входных аудиосигналов (112, 112₁, 112₂, 112₃, 112a, 112b),

причем аудиокодер (300) выполнен с возможностью обеспечения одного или более кодированных аудиосигналов (320) на основе одного или более входных аудиосигналов (112, 112₁, 112₂, 112₃, 112a, 112b) или одного или более полученных из них сигналов (110, 110₁, 110₂, 110a, 110b);

причем аудиокодер (300) выполнен с возможностью адаптации (340) параметров кодирования в зависимости от одной или более карт направленной громкости, которые представляют информацию (142, 142₁, 142₂, 142a, 142b) о громкости, ассоциированную с множеством различных направлений (121), из одного или более подлежащих кодированию сигналов.

2. Аудиокодер (300) по п. 1, причем аудиокодер (300) выполнен с возможностью адаптации (340) распределения битов между одним или более сигналами и/или параметрами, подлежащими кодированию, в зависимости от вкладов отдельных карт направленной громкости одного или более сигналов и/или параметров, подлежащих кодированию, в общую карту (142, 142₁, 142₂, 142a, 142b) направленной громкости.

3. Аудиокодер (300) по п. 1, причем аудиокодер (300) выполнен с возможностью запрещения кодирования (310) определённого одного из подлежащих кодированию сигналов, когда вклады отдельной карты направленной громкости определённого одного из подлежащих кодированию сигналов в общую карту направленной громкости ниже порогового значения.

4. Аудиокодер (300) по п. 1, причем аудиокодер (300) выполнен с возможностью адаптации (342) точности квантования одного или более подлежащих кодированию сигналов в зависимости от вкладов отдельных карт направленной громкости одного или более подлежащих кодированию сигналов в общую карту направленной громкости.

5. Аудиокодер (300) по п. 1, причем аудиокодер (300) выполнен с возможностью квантования (312) представлений (110, 110₁, 110₂, 110a, 110b) в спектральной области одного или более входных аудиосигналов (112, 112₁, 112₂, 112₃, 112a, 112b) или одного или более полученных из них сигналов (110, 110₁, 110₂, 110a, 110b) с использованием одного или более параметров квантования для получения одного или более квантованных представлений (313) в спектральной области;

причем аудиокодер (300) выполнен с возможностью регулирования (342) одного или более параметров квантования в зависимости от одной или более карт направленной громкости, которые представляют информацию (142, 142₁, 142₂, 142a, 142b) о громкости, ассоциированную с множеством различных направлений (121) одного или более подлежащих квантованию сигналов для адаптации формирования одного или более кодированных аудиосигналов (320); и

причем аудиокодер (300) выполнен с возможностью кодирования одного или более квантованных представлений (313) в спектральной области для получения одного или более кодированных аудиосигналов (320).

6. Аудиокодер (300) по п. 5, причем аудиокодер (300) выполнен с возможностью регулирования (342) одного или более параметров квантования в зависимости от вкладов отдельных карт направленной громкости одного или более подлежащих квантованию сигналов в общую карту направленной громкости.

7. Аудиокодер (300) по п. 5, причем аудиокодер (300) выполнен с возможностью определения общей карты направленной громкости на основе входных аудиосигналов (112, 112₁, 112₂, 112₃, 112a, 112b) таким образом, что общая карта направленной громкости представляет информацию (142, 142₁, 142₂, 142a, 142b) о громкости, ассоциированную с различными направлениями (121) аудиосцены, представленной входными аудиосигналами (112, 112₁, 112₂, 112₃, 112a, 112b).

8. Аудиокодер (300) по п. 5, в котором один или более подлежащих квантованию сигналов ассоциированы с различными направлениями (121), или ассоциированы с различными громкоговорителям, или ассоциированы с различными звуковыми объектами.

9. Аудиокодер (300) по п. 5, в котором подлежащие квантованию сигналы содержат компоненты совместного многосигнального кодирования двух или более входных аудиосигналов (112, 112₁, 112₂, 112₃, 112a, 112b).

10. Аудиокодер (300) по п. 5, причем аудиокодер (300) выполнен с возможностью оценки вклада разностного сигнала совместного многосигнального кодирования в общую карту направленной громкости и регулирования (342) в зависимости от него одного или более параметров квантования.

11. Аудиокодер (300) по п. 1, причем аудиокодер (300) выполнен с возможностью адаптации (340) распределения битов между одним или более сигналами и/или параметрами, подлежащими кодированию отдельно для различных спектральных интервалов или отдельно для различных частотных полос; и/или

причем аудиокодер (300) выполнен с возможностью адаптации (342) точности квантования одного или более подлежащих кодированию сигналов отдельно для различных спектральных интервалов или отдельно для различных частотных полос.

12. Аудиокодер (300) по п. 1,

причем аудиокодер (300) выполнен с возможностью адаптации (340) распределения битов между одним или более сигналами и/или параметрами, подлежащими кодированию в зависимости от оценки пространственного маскирования между двумя или более подлежащими кодированию сигналами,

причем аудиокодер (300) выполнен с возможностью оценки пространственного маскирования на основе карт направленной громкости, ассоциированных с двумя или более подлежащими кодированию сигналами.

13. Аудиокодер (300) по п. 12, причем аудиокодер (300) выполнен с возможностью оценки эффекта маскирования вклада (132, 132₁, 132₂, 135₁, 135₂) громкости, ассоциированного с первым направлением первого подлежащего кодированию сигнала, на вклад (132, 132₁, 132₂, 135₁, 135₂) громкости, ассоциированный со вторым направлением второго подлежащего кодированию сигнала.

14. Аудиокодер (300) по п. 1, причем аудиокодер (300) содержит модуль (100) анализа аудиоданных,

причем модуль (100) анализа аудиоданных выполнен с возможностью получения представлений (110, 110₁, 110₂, 110a, 110b) в спектральной области двух или более входных аудиосигналов (112, 112₁, 112₂, 112₃, 112a, 112b);

причем модуль (100) анализа аудиоданных выполнен с возможностью получения информации (122, 122₁, 122₂, 125, 127) о направлении, ассоциированной со спектральными полосами представлений (110, 110₁, 110₂, 110a, 110b) в спектральной области;

причем модуль (100) анализа аудиоданных выполнен с возможностью получения информации (142, 142₁, 142₂, 142a, 142b) о громкости, ассоциированной с различными направлениями (121), в качестве результата анализа,

причем вклады (132, 132₁, 132₂, 135₁, 135₂) в информацию (142, 142₁, 142₂, 142a, 142b) о громкости определяются в зависимости от информации (122, 122₁, 122₂, 125, 127) о направлении;

причём информация (142, 142₁, 142₂, 142a, 142b) о громкости, ассоциированная с различными направлениями (121), формирует карту направленной громкости.

15. Аудиокодер (300) по п. 1,

причем аудиокодер (300) выполнен с возможностью адаптации (340) шума, вносимого кодером, в зависимости от одной или более карт направленной громкости.

16. Аудиокодер (300) по п. 15,

причем аудиокодер (300) выполнен с возможностью использования отклонения между картой направленной громкости, которая ассоциирована с определённым не кодированным входным аудиосигналом, и картой направленной громкости, достижимой кодированной версией определённого входного аудиосигнала, в качестве критерия адаптации формирования определённого кодированного аудиосигнала.

17. Аудиокодер (300) по п. 1,

причем аудиокодер (300) выполнен с возможностью активации и деактивации инструмента совместного кодирования в зависимости от одной или более карт направленной громкости, которые представляют информацию (142, 142₁, 142₂, 142a, 142b) о громкости, ассоциированную с множеством различных направлений (121) одного или более подлежащих кодированию сигналов.

18. Аудиокодер (300) по п. 1,

причем аудиокодер (300) выполнен с возможностью определения одного или более параметров инструмента совместного кодирования в зависимости от одной или более карт направленной громкости, которые представляют информацию (142, 142₁, 142₂, 142a, 142b) о громкости, ассоциированную с множеством различных направлений (121) одного или более подлежащих кодированию сигналов.

19. Аудиокодер (300) по п. 1, причем аудиокодер (300) выполнен с возможностью определения или оценки влияния вариации одного или более управляющих параметров, управляющих обеспечением одного или более кодированных аудиосигналов (320), на карту направленной громкости одного или более кодированных сигналов и регулирования одного или более управляющих параметров в зависимости от определения или оценки влияния.

20. Аудиокодер (300) по п. 1,

причем аудиокодер (300) выполнен с возможностью получения компонента направления, используемого для получения одной или более карт направленной громкости, с использованием метаданных, представляющих информацию о положении громкоговорителей, ассоциированных с входными аудиосигналами (112, 112₁, 112₂, 112₃, 112a, 112b).

21. Аудиокодер (300) для кодирования (310) входного аудиосодержимого (112), содержащего один или более входных аудиосигналов (112, 112₁, 112₂, 112₃, 112a, 112b),

причем аудиокодер (300) выполнен с возможностью обеспечения одного или более кодированных аудиосигналов (320) на основе двух или более входных аудиосигналов (112, 112₁, 112₂, 112₃, 112a, 112b) или на основе двух или более полученных из них сигналов (110, 110₁, 110₂, 110a, 110b) с использованием совместного кодирования (310) двух или более подлежащих совместному кодированию сигналов;

причем аудиокодер (300) выполнен с возможностью выбора (350) подлежащих совместному кодированию сигналов из множества возможных сигналов (110, 110₁, 110₂) или из множества пар возможных сигналов (110, 110₁, 110₂) в зависимости от карт направленной громкости, которые представляют информацию (142, 142₁, 142₂, 142a, 142b), ассоциированную с множеством различных направлений (121) возможных сигналов (110, 110₁, 110₂) или пар возможных сигналов (110, 110₁, 110₂).

22. Аудиокодер (300) по п. 21,

причем аудиокодер (300) выполнен с возможностью выбора (350) подлежащих совместному кодированию сигналов из множества возможных сигналов (110, 110₁, 110₂) или из множества пар возможных сигналов (110, 110₁, 110₂) в зависимости от вкладов отдельных карт направленной громкости возможных сигналов (110, 110₁, 110₂) в общую карту направленной громкости или в зависимости от вкладов карт направленной громкости пар возможных сигналов (110, 110₁, 110₂) в общую карту направленной громкости.

23. Аудиокодер (300) по п. 21,

причем аудиокодер (300) выполнен с возможностью определения вклада пар возможных сигналов (110, 110₁, 110₂) в общую карту направленной громкости; и

причем аудиокодер (300) выполнен с возможностью выбора одной или более пар возможных сигналов (110, 110₁, 110₂), имеющих наиболее высокий вклад в общую карту направленной громкости, для совместного кодирования (310), или

причем аудиокодер (300) выполнен с возможностью выбора одной или более пар возможных сигналов (110, 110₁, 110₂), вклад которых в общую карту направленной громкости больше заданного порогового значения, для совместного кодирования (310).

24. Аудиокодер (300) по п. 21,

причем аудиокодер (300) выполнен с возможностью определения отдельных карт направленной громкости двух или более возможных сигналов (110, 110₁, 110₂), и

причем аудиокодер (300) выполнен с возможностью сравнения отдельных карт направленной громкости двух или более возможных сигналов (110, 110₁, 110₂), и

причем аудиокодер (300) выполнен с возможностью выбора (350) двух или более из возможных сигналов (110, 110₁, 110₂) для совместного кодирования (310) в зависимости от результата сравнения.

25. Аудиокодер (300) по п. 21,

причем аудиокодер (300) выполнен с возможностью определения общей карты направленной громкости с использованием понижающего микширования входных аудиосигналов (112, 112₁, 112₂, 112₃, 112a, 112b) или с использованием бинаурализации входных аудиосигналов (112, 112₁, 112₂, 112₃, 112a, 112b).

26. Аудиокодер (300) для кодирования (310) входного аудиосодержимого (112), содержащего один или более входных аудиосигналов (112, 112₁, 112₂, 112₃, 112a, 112b),

причем аудиокодер (300) выполнен с возможностью обеспечения одного или более кодированных аудиосигналов (320) на основе двух или более входных аудиосигналов (112, 112₁, 112₂, 112₃, 112a, 112b) или на основе двух или более полученных из них сигналов (110, 110₁, 110₂, 110a, 110b);

причем аудиокодер (300) выполнен с возможностью определения общей карты направленной громкости на основе входных аудиосигналов (112, 112₁, 112₂, 112₃, 112a, 112b) и/или определять одну или более отдельных карт направленной громкости, ассоциированных с отдельными входными аудиосигналами (112, 112₁, 112₂, 112₃, 112a, 112b); и

причем аудиокодер (300) выполнен с возможностью кодирования общей карты направленной громкости и/или одной или более отдельных карт направленной громкости в качестве вспомогательной информации.

27. Аудиокодер (300) по п. 26,

причем аудиокодер (300) выполнен с возможностью определения общей карты направленной громкости на основе входных аудиосигналов (112, 112₁, 112₂, 112₃, 112a, 112b) таким образом, что общая карта направленной громкости представляет информацию (142, 142₁, 142₂, 142a, 142b) о громкости, ассоциированную с различными направлениями (121) аудиосцены, представленной входными аудиосигналами (112, 112₁, 112₂, 112₃, 112a, 112b).

28. Аудиокодер (300) по п. 26,

причем аудиокодер (300) выполнен с возможностью кодирования общей карты направленной громкости в виде множества значений, ассоциированных с различными направлениями (121); или

причем аудиокодер (300) выполнен с возможностью кодирования общей карты направленной громкости с использованием значения центрального положения и информации о градиенте; или

причем аудиокодер (300) выполнен с возможностью кодирования общей карты направленной громкости в виде полиномиального представления; или

причем аудиокодер (300) выполнен с возможностью кодирования общей карты направленной громкости в виде сплайнового представления.

29. Аудиокодер (300) по п. 26,

причем аудиокодер (300) выполнен с возможностью кодирования одного микшированного с понижением сигнала, полученного на основе множества входных аудиосигналов (112, 112₁, 112₂, 112₃, 112a, 112b) и общей карты направленной громкости; или

причем аудиокодер (300) выполнен с возможностью кодирования множества сигналов и кодирования отдельных карты направленной громкости множества кодируемых сигналов; или

причем аудиокодер (300) выполнен с возможностью кодирования общей карты направленной громкости, множества сигналов и параметров, описывающих вклады кодируемых сообщений в общую карту направленной громкости.

30. Аудиодекодер (400) для декодирования (410) кодированного аудиосодержимого (420),

причем аудиодекодер (400) выполнен с возможностью приёма кодированного представления (420) одного или более аудиосигналов и обеспечения декодированного представления (432) одного или более аудиосигналов;

причем аудиодекодер (400) выполнен с возможностью приёма кодированной информации (424) о картах направленной громкости и декодирования кодированной информации (424) о картах направленной громкости для получения одной или более карт (414) направленной громкости; и

причем аудиодекодер (400) выполнен с возможностью воссоздания (430) аудиосцены с использованием декодированного представления (432) одного или более аудиосигналов и с использованием одной или более карт направленной громкости.

31. Аудиодекодер (400) по п. 30, причем аудиодекодер (400) выполнен с возможностью получения выходных сигналов таким образом, что одна или более карт направленной громкости, ассоциированных с выходными сигналами, приблизительно равны или равны одной или более целевым картам направленной громкости,

причем одна или более целевых карт направленной громкости основаны на одной или более декодированных картах (414) направленной громкости или равны одной или более декодированным картам (414) направленной громкости.

32. Аудиодекодер (400) по п. 30,

причем аудиодекодер (400) выполнен с возможностью приёма

- одного кодированного микшированного с понижением сигнала и общей карты направленной громкости; или

- множества кодированных аудиосигналов (422) и отдельных карт направленной громкости множества кодированных сигналов; или

- общей карты направленной громкости, множества кодированных аудиосигналов (422) и параметров, описывающих вклады кодированных аудиосигналов (422) в общую карту направленной громкости; и

причем аудиодекодер (400) выполнен с возможностью обеспечения на их основе выходных сигналов.

33. Способ (3000) кодирования входного аудиосодержимого, содержащего один или более входных аудиосигналов,

причем способ содержит этап, на котором обеспечивают (3100) один или более кодированных аудиосигналов на основе одного или более входных аудиосигналов или одного или более полученных из них сигналов; и

причем способ содержит этап, на котором адаптируют (3200) формирование одного или более кодированных аудиосигналов в зависимости от одной или более карт направленной громкости, которые представляют информацию о громкости, ассоциированную с множеством различных направлений одного или более подлежащих кодированию сигналов.

34. Способ (4000) кодирования входного аудиосодержимого, содержащего один или более входных аудиосигналов,

причем способ содержит этап, на котором обеспечивают (4100) один или более кодированных аудиосигналов на основе двух или более входных аудиосигналов или на основе двух или более полученных из них сигналов с использованием совместного кодирования двух или более подлежащих совместному кодированию сигналов; и

причем способ содержит выбор (4200) сигналов, подлежащих совместному кодированию, из множества возможных сигналов или из множества пар возможных сигналов в зависимости от карт направленной громкости, которые представляют информацию о громкости, ассоциированную с множеством различных направлений возможных сигналов или пар возможных сигналов.

35. Способ (5000) кодирования входного аудиосодержимого, содержащего один или более входных аудиосигналов,

причем способ содержит этап, на котором обеспечивают (5100) один или более кодированных аудиосигналов на основе двух или более входных аудиосигналов или на основе двух или более полученных из них сигналов;

причем способ содержит этап, на котором определяют (5200) общую карту направленной громкости на основе входных аудиосигналов и/или определяют одну или более отдельных карт направленной громкости, ассоциированных с отдельными входными аудиосигналами; и

причем способ содержит этап, на котором кодируют (5300) общую карту направленной громкости и/или одну или более отдельных карт направленной громкости в качестве вспомогательной информации.

36. Способ (6000) декодирования кодированного аудиосодержимого,

причем способ содержит этапы, на которых принимают (6100) кодированное представление одного или более аудиосигналов и обеспечивают (6200) декодированное представление одного или более аудиосигналов;

причем способ содержит этапы, на которых принимают (6300) кодированную информацию о картах направленной громкости и декодируют (6400) кодированную информацию о картах направленной громкости для получения (6500) одной или более карт направленной громкости; и

причем способ содержит этап, на котором воссоздают (6600) аудиосцену с использованием декодированного представления одного или более аудиосигналов и используют одну или более карт направленной громкости.

37. Компьютерная программа, имеющая программный код для выполнения способа по п. 33 или 34? или 35 при его выполнении на компьютере.

38. Кодированное звуковое представление, содержащее

кодированное представление одного или более аудиосигналов; и

кодированную информацию о картах направленной громкости.