RU2011145866A

RU2011145866A - Устройство для оптимизации одного или более параметров представления сигнала повышающего микширования на основе представления сигнала понижающего микширования, декодер аудиосигнала, транскодер аудиосигнала, кодер аудиосигнала, аудиобитстрим, способ и компьютерная программа с использованием объектно-ориентированной параметрической информации

Info

Publication number: RU2011145866A
Application number: RU2011145866/08A
Authority: RU
Inventors: Юрген ХЕРРЕ; Андреас ХОЕЛЦЕР; Леонид ТЕРЕНТЬЕВ; Торстен КАСТНЕР; Корнелиа ФАЛХ; Хеико ПУРНХАГЕН; Йонас ЭНГДЕГАРД; Риддербуш ФАЛКО
Original assignee: Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф.; Фридрих-Александр-Университет Эрланген-Нюрнберг; Долби Интернэшионал АБ
Priority date: 2009-04-28
Filing date: 2010-04-28
Publication date: 2013-05-27
Also published as: PL2425427T3; US9786285B2; KR101431889B1; JP5554830B2; US20140229187A1; ES2572083T3; WO2010125104A1; MY157169A; JP2014206747A; ZA201107895B; CA2760515A1; MX2011011399A; KR20120018778A; CA2852503C; SG175392A1; EP2425427A1; TWI560706B; BRPI1007777A2; EP2816555B1; TW201104674A

Abstract

1. Устройство (100; 240; 320; 550) для оптимизации одного или более параметров (120; 222; 324; r', r) представления сигнала повышающего микширования (; 316; 522, 524; 522, 574) на основе представления сигнала понижающего микширования (212; 312; 524) и объектно-ориентированной параметрической информации (214; 314; 520), включающее в свою конструкцию: регулятор параметров (140; 240), выполненный с возможностью принимать один или более входных параметров (110; 242; 322; 552, 554; r) и на их основе генерировать один или более оптимизированных параметров (120; 222; 324; 542), причем регулятор параметров отличается тем, что генерирует один или более оптимизированных параметров в зависимости от одного или более входных параметров и объектно-ориентированной параметрической информации (130; 214а, 214b, 214c; 314; 520) таким образом, что искажение представления сигнала повышающего микширования, вызванное приложением неоптимальных параметров, уменьшается, по меньшей мере, для входных параметров, которые имеют отклонение от оптимальных параметров, выходящее за установленный допустимый диапазон отклонений.2. Устройство по п.1, характеризующееся тем, что оно принимает в качестве входных параметров (110; 242; 322; 552, 554; r) произвольно заданные (желаемые) параметры аудиорендеринга (r), описывающие желаемое масштабирование интенсивности множества сигналов аудиообъектов (x-x) по одному или более аудиоканалов, описанных в представлении сигнала повышающего микширования (; 316; 522, 524; 522, 574); и тем, что в его составе регулятор параметров генерирует один или более актуализованных параметров аудиорендеринга (r', r), исходя из одного или более желаемых параметров аудиорендеринга (r).3. Устройство по п.2, в составе которого �

Claims

1. Устройство (100; 240; 320; 550) для оптимизации одного или более параметров (120; 222; 324; r_m', r_lim,m) представления сигнала повышающего микширования (

; 316; 522, 524; 522, 574) на основе представления сигнала понижающего микширования (212; 312; 524) и объектно-ориентированной параметрической информации (214; 314; 520), включающее в свою конструкцию: регулятор параметров (140; 240), выполненный с возможностью принимать один или более входных параметров (110; 242; 322; 552, 554; r_i) и на их основе генерировать один или более оптимизированных параметров (120; 222; 324; 542), причем регулятор параметров отличается тем, что генерирует один или более оптимизированных параметров в зависимости от одного или более входных параметров и объектно-ориентированной параметрической информации (130; 214а, 214b, 214c; 314; 520) таким образом, что искажение представления сигнала повышающего микширования, вызванное приложением неоптимальных параметров, уменьшается, по меньшей мере, для входных параметров, которые имеют отклонение от оптимальных параметров, выходящее за установленный допустимый диапазон отклонений.

2. Устройство по п.1, характеризующееся тем, что оно принимает в качестве входных параметров (110; 242; 322; 552, 554; r_i) произвольно заданные (желаемые) параметры аудиорендеринга (r_i), описывающие желаемое масштабирование интенсивности множества сигналов аудиообъектов (x₁-x_N) по одному или более аудиоканалов, описанных в представлении сигнала повышающего микширования (

; 316; 522, 524; 522, 574); и тем, что в его составе регулятор параметров генерирует один или более актуализованных параметров аудиорендеринга (r_m', r_lim,m), исходя из одного или более желаемых параметров аудиорендеринга (r_i).

3. Устройство по п.2, в составе которого регулятор параметров выполнен с возможностью генерировать одно или более пороговых значений параметров рендеринга

в зависимости от объектно-ориентированной параметрической информации (130; 214а, 214b, 214с; 314; 520) и информации понижающего микширования (214b; d_i), описывающих соотношение составляющих сигналов аудиообъектов (x₁-x_N) для представления сигнала понижающего микширования, при этом генерировать таким образом, что метрика искажений (dm₁(m), dm₂(m), dm₅(m), dm₆(m), DM₁, DM₂, DM₃, DM₄, DM₅, DM₆) находится в пределах заданного диапазона значений параметров рендеринга, удовлетворяющих интервалу значений, установленному предельными значениями параметров рендеринга, и в составе которого регулятор параметров выполнен с возможностью выведения актуализованных параметров аудиорендеринга (r_m', r_lim,m), исходя из желаемых параметров аудиорендеринга (r_i) и одного или более пороговых значений параметров рендеринга таким образом, что актуализованные параметры рендеринга удовлетворяют интервалу значений, заданному предельными значениями параметров аудиорендеринга.

4. Устройство по п.2, в составе которого регулятор параметров выполнен с возможностью выведения одного или более пороговых значений параметров рендеринга

таким образом, что относительная составляющая сигнала объекта (x₁-x_N) в суперпозиции из множества сигналов объектов, сформированной в процессе аудиорендеринга с использованием одного или более параметров рендеринга (r_m', r_lim,m), отвечающих одному или более пороговым значениям параметров рендеринга, отличается от относительной составляющей сигнала объекта (x₁-x_N) в структуре микшированного с понижением сигнала (212; 312; 524) не больше, чем на расчетную разность.

5. Устройство по п.4, в составе которого регулятор параметров выполнен с возможностью расчета одного или более значений параметров рендеринга r_m таким образом, что уравнение

выполняется для одного или более аудиообъектов, обозначенных индексом объекта m, где r_m - параметр рендеринга, описывающий составляющую сигнала аудиообъекта с индексом m в определенном канале

микшированного с повышением сигнала, где d_m - параметр понижающего микширования, описывающий составляющую сигнала объекта (x₁-x_N) с индексом m в микшированном с понижением сигнале, и где X_i - мера энергии аудиообъекта с индексом m, определяемая объектно-ориентированной параметрической информацией.

6. Устройство по п.2, в составе которого регулятор параметров выполнен с возможностью выведения одного или более предельных значений параметров рендеринга

таким образом, что мера искажения (DM₃), описывающая когерентность даунмикс-сигнала, отраженную в представлении даунмикс-сигнала, и сигнала, полученного рендерингом с использованием одного или более параметров аудиорендеринга (r_m), удовлетворяющих одному или более предельным значениям параметров рендеринга

, находится в пределах заданного диапазона.

7. Устройство по п.6, в составе которого регулятор параметров выполнен с возможностью выведения одного или более предельных значений параметров рендеринга для

так, чтобы мера искажения

принимала заданное значение, где С определяется как

;

где

- матрица, в которой первый ряд параметров рендеринга r₁ t_o r_n и второй ряду параметров понижающего микширования d₁ t_o d_n описывают составляющие сигналов аудиообъектов в структуре представления сигнала понижающего микширования; где E - матрица ковариации объектов, сформированная с использованием параметров (OLD, IOC) объектно-ориентированной параметрической информации, и где "*" - комплексно-сопряженный оператор.

8. Устройство по п.2, в составе которого регулятор параметров выполнен с возможностью вычисления линейной комбинации квадрата желаемого параметра рендеринга (r_m) и квадрата оптимального параметра рендеринга (r_opt,m), для актуализации (генерации актуализованного) параметра аудиорендеринга (r_lim,m); в составе которого регулятор параметров выполнен с возможностью расчета соотношения составляющих желаемого параметра рендеринга (r_m) и оптимального параметра рендеринга (r_opt,m) в линейной комбинации, исходя из заданного порогового параметра Т и метрики искажения (dm₁, dm₂, dm₃, dm₄, dm₅, dm₆), описывающей искажение, возможное в случае применения одного или более желаемых параметров аудиорендеринга (r_m) - вместо оптимальных параметров рендеринга (r_opt,m) - для формирования представления сигнала повышающего микширования на основе представления сигнала понижающего микширования.

9. Устройство по п.8, в составе которого регулятор параметров выполнен с возможностью вычисления уравнения

для актуализации (выведения актуализованного) параметра рендеринга _lim,m, описывающего составляющую сигнала объекта с индексом m в данном апмикс-сигнале, где Т - расчетный предельный показатель искажения, где dm_x(m) - метрика искажения, соотнесенная с желаемым параметром рендеринга r_m, описывающим желаемую составляющую сигнала аудиообъекта с индексом объекта m в структуре канала апмикс-сигнала; где r_opt,m - оптимальный параметр рендеринга, описывающий оптимальную составляющую сигнала аудиообъекта с индексом объекта m в канале апмикс-сигнала.

10. Устройство по п.8, в составе которого регулятор параметров выполнен с возможностью расчета метрики искажения, находящейся в зависимости от соотношения составляющей сигнала объекта в суперпозиции множества сигналов объектов, образованной в процессе рендеринга с введением желаемых параметров рендеринга, и составляющей данного сигнала объекта в структуре даунмикс-сигнала, включающего в себя данный сигнал объекта.

11. Устройство по п.8, в составе которого регулятор параметров выполнен с возможностью расчета метрики искажения (dm₁), зависящей от соотношения составляющей данного сигнала объекта (x₁-x_N) в суперпозиции множества сигналов объектов, сформированной в процессе рендеринга с использованием желаемых параметров рендеринга (r_m), и составляющей данного сигнала объекта (x₁-x_N) в даунмикс-сигнале, включающем в себя данный сигнал объекта (x₁-x_N).

12. Устройство по п.8, в составе которого регулятор параметров выполнен с возможностью расчета метрики искажения dm_x(m) согласно

где r_m и r_i - произвольно заданные (желаемые) параметры рендеринга, соотнесенные с аудиообъектами, имеющими индексы объектов m и i, соответственно; где d_m и d_i - параметры понижающего микширования, описывающие относительные составляющие сигналов аудиообъектов с индексами объектов m и i, соответственно, в даунмикс-сигнале в представлении даунмикс-сигнала; где N_ob - количество выделенных аудиообъектов; где X_i - показатели уровня энергии, относящиеся к сигналам аудиообъектов с индексом объекта i.

13. Устройство по п.8, в составе которого регулятор параметров выполнен с возможностью расчета метрики искажения (dm₂), находящейся в зависимости от разности между относительной составляющей данного сигнала объекта (x₁-x_N) в суперпозиции множества сигналов объектов, сформированной в процессе аудиорендеринга с использованием желаемых параметров рендеринга (r_m) и относительной составляющей данного сигнала объекта (x₁-x_N) в структуре сигнала понижающего микширования, включающего в себя данный сигнал объекта (x₁-x_N).

14. Устройство по п.8, в составе которого регулятор параметров выполнен с возможностью расчета метрики искажения (dm₂), находящейся в зависимости от отношения маска-сигнал (порога слышимости к сигналу) (msr), таким образом, что метрика искажения (dm₂) убывает, служа показателем меньшего искажения, если отношение маска-сигнал возрастает.

15. Устройство по п.8, в составе которого регулятор параметров выполнен с возможностью расчета метрики искажения на основании

или

где r_m и r_i - произвольно заданные (желаемые) параметры рендеринга, соотнесенные с аудиообъектами, имеющими индексы объектов m и i соответственно; где d_m и d_i - параметры понижающего микширования, описывающие относительные составляющие сигналов аудиообъектов с индексами объектов m и i соответственно в даунмикс-сигнале в представлении даунмикс-сигнала; где N - количество выделенных аудиообъектов; где X_i и X_m - показатели уровня энергии, относящиеся к сигналам аудиообъектов с индексами объекта i и m соответственно; и где msr - отношение маска-сигнал.

16. Устройство по п.1, в составе которого регулятор параметров выполнен с возможностью генерировать один или более оптимизированных параметров в зависимости от вычислительной меры перцепционной деградации таким образом, что перцептивно оцениваемое искажение представления сигнала повышающего микширования, возбужденное введением неоптимальных параметров, и выраженное вычислительной мерой перцепционной деградации, ограничены.

17. Устройство по п.1, в составе которого регулятор параметров выполнен с возможностью приема информации о свойствах обособленного объекта, описывающей характеристики одного или более сигналов исходного объекта, которые составляют основу сигнала понижающего микширования, описанного посредством представления сигнала понижающего микширования; и в составе которого регулятор параметров выполнен с возможностью учета индивидуальных данных обособленного объекта и генерации оптимизированных параметров таким образом, что искажение представления сигнала повышающего микширования относительно идеального представления сигнала повышающего микширования уменьшается, по крайней мере, для входных параметров, имеющих отклонение от оптимальных параметров, превышающее расчетное отклонение.

18. Устройство по п.17, в составе которого регулятор параметров характеризуется тем, что принимает и учитывает в качестве индивидуальных данных аудиообъекта тональные характеристики сигнала объекта для формирования одного или более оптимизированных параметров.

19. Устройство по п.18, в составе которого регулятор параметров характеризуется тем, что оценивает тональные характеристики (N) апмикс-сигнала идеального рендеринга, исходя из полученной информации о тональных свойствах сигнала объекта и полученной информации о мощности объекта (OLD, P); и в составе которого регулятор параметров характеризуется тем, что генерирует один или более оптимизированных параметров с целью уменьшения различия между оцененной тональностью и тональностью апмикс-сигнала, сформированного с использованием одного или более оптимизированных параметров, по сравнению с различием между оцененной тональностью и тональностью апмикс-сигнала, сформированного с использованием одного или более входных параметров, или с целью сохранения различия между оцененной тональностью и тональностью апмикс-сигнала, сформированного с использованием одного или более оптимизированных параметров в пределах заданного диапазона.

20. Устройство по п.1, в составе которого регулятор параметров характеризуется тем, что выполняет подстройку входных параметров по частоте и времени.

21. Устройство по п.1, в составе которого регулятор параметров характеризуется тем, что при формировании одного или более оптимизированных параметров учитывает также представление сигнала понижающего микширования.

22. Устройство по п.1, в составе которого регулятор параметров характеризуется тем, что определяет совокупную меру искажения, представляющую собой взвешенную совокупность мер искажения, описывающих множество типов артефактов; в составе которого регулятор параметров характеризуется тем, что определяет совокупную меру искажения как меру искажений, которые могли быть вызваны введением одного или более входных параметров рендеринга вместо оптимальных параметров рендеринга при формировании представления сигнала повышающего микширования на основе представления сигнала понижающего микширования.

23. Устройство по п.22, в составе которого регулятор параметров характеризуется тем, что объединяет, по меньшей мере, две из перечисленных ниже мер искажения для выработки совокупной меры искажения:

- мера, описывающая паразитное изменение тембра аудиообъекта;

- мера, описывающая паразитную модуляцию сигнала аудиообъекта;

- мера, описывающая присутствие паразитного музыкального тона;

- мера, описывающая наличие паразитного модулированного шума.

24. Декодер аудиосигнала (220, 240; 300) для представления в виде сигнала повышающего микширования множества аудиоканалов повышающего микширования (

; 316) на основе представления сигнала понижающего микширования (212; 312), объектно-ориентированной параметрической информации (214; 314) и параметров произвольно задаваемого (желаемого) рендеринга (242; 322), включающий в свой состав: повышающий микшер (220; 310), реализованный с целью формирования аудиоканалов повышающего микширования (

; 316) на основе представления сигнала понижающего микширования (212; 312) с учетом объектно-ориентированной параметрической информации (214; 314) и актуализованных данных рендеринга (222; 324), описывающих пространственное расположение множества сигналов аудиообъектов, отображенных в объектно-ориентированной параметрической информации, для аудиоканалов повышающего микширования; и устройство (100; 240; 320) для оптимизации одного или более параметров по одному из пп.1-23, характеризующееся тем, что принимает информацию о желаемом рендеринге (242; 322) в виде одного или более входных параметров (110) и генерирует один или более оптимизированных параметров (222; 324) в виде данных актуализированного рендеринга; и характеризующееся тем, что генерирует один или более оптимизированных параметров таким образом, что искажения аудиоканалов повышающего микширования (

; 316), вызванные использованием актуализованных параметров рендеринга (r_m', r_lim,m), которые имеют отклонения от оптимальных параметров рендеринга (r_opt,m), уменьшаются, по крайней мере, для желаемых параметров рендеринга (r_i), чье отклонение от оптимальных параметров рендеринга (r_opt,m) превышает расчетное отклонение.

25. Транскодер аудиосигнала (500; 560) для представления в виде сигнала повышающего микширования (522) информации о параметрах каналов на основе представления сигнала понижающего микширования (524), объектно-ориентированной параметрической информации (520) и желаемых параметров рендеринга (552, 554), включающий в свой состав: транскодер служебной информации (540), реализованный с целью подготовки параметрических данных каналов (522) на основе представления сигнала понижающего микширования (524) с учетом объектно-ориентированной параметрической информации (520) и актуализованных данных рендеринга (542), описывающих пространственное расположение множества сигналов аудиообъектов, отображенных в объектно-ориентированной параметрической информации (522), для аудиоканалов повышающего микширования, описываемых информацией о параметрах каналов; и устройство (100; 550) для оптимизации одного или более параметров (542) по одному из пп.1-23, характеризующееся тем, что принимает желаемые параметры рендеринга (552, 554) как один или более входных параметров (110) и генерирует один или более оптимизированных параметров (120) в виде актуализованных данных рендеринга (542); и характеризующееся тем, что оно генерирует один или более оптимизированных параметров (120) таким образом, что искажения аудиоканалов повышающего микширования, вызванные использованием актуализованных параметров рендеринга (542), имеющих отклонения от оптимальных параметров рендеринга, уменьшаются, по крайней мере, для желаемых параметров рендеринга (552, 554), имеющих отклонение от оптимальных параметров рендеринга, превышающее расчетное отклонение.

26. Способ оптимизации одного или более параметров для представления сигнала повышающего микширования на основе представления сигнала понижающего микширования с учетом объектно-ориентированной параметрической информации, для осуществления которого: принимают один или более входных параметров и генерируют на их основе один или более оптимизированных параметров, причем генерацию одного или более оптимизированных параметров осуществляют на основе одного или более входных параметров с учетом объектно-ориентированной параметрической информации таким образом, что искажение представления сигнала повышающего микширования, вызванное использованием неоптимальных параметров, уменьшается, по крайней мере, для входных параметров, имеющих отклонение от оптимальных параметров, превышающее расчетное отклонение.

27. Способ представления в виде сигнала повышающего микширования множества аудиоканалов повышающего микширования на основе представления сигнала понижающего микширования, объектно-ориентированной пармаетрической информации и желаемых (произвольно задаваемых) параметров рендеринга, для осуществления которого: выполняют оптимизацию одного или более параметров по п.26, для чего принимают желаемые параметры рендеринга в виде одного или более входных параметров, и для чего один или более оптимизированных параметров генерируют в виде актуализованных параметров рендеринга, и для чего один или более оптимизированных параметров генерируют таким образом, что искажения аудиоканалов повышающего микширования, вызванные использованием актуализованных параметров рендеринга, имеющих отклонения от оптимальных параметров рендеринга, уменьшаются, по крайней мере, для желаемых параметров рендеринга, имеющих отклонение от оптимальных параметров рендеринга, превышающее заданное отклонение; и формируют аудиоканалы повышающего микширования на базе представления сигнала понижающего микширования с учетом объектно-ориентированной параметрической информации и актуализованных данных рендеринга, описывающих пространственное расположение множества сигналов аудиообъектов, отображенных в объектно-ориентированной параметрической информации, для аудиоканалов повышающего микширования.

28. Способ представления в виде сигнала повышающего микширования параметрических данных каналов на базе представления сигнала понижающего микширования, объектно-ориентированной параметрической информации и желаемых параметров рендеринга, для осуществления которого: выполняют оптимизацию одного или более параметров по п.26, для чего принимают желаемые параметры рендеринга в виде одного или более входных параметров, и для чего один или более оптимизированных параметров генерируют в виде актуализованных параметров рендеринга, и для чего один или более оптимизированных параметров генерируют таким образом, что искажения аудиоканалов повышающего микширования, вызванные использованием актуализованных параметров рендеринга, имеющих отклонения от оптимальных параметров рендеринга, уменьшаются, по крайней мере, для желаемых параметров рендеринга, имеющих отклонение от оптимальных параметров рендеринга, превышающее заданное отклонение; и получают параметрические данные каналов, которые описывают аудиоканалы повышающего микширования на основе представления сигнала понижающего микширования с учетом объектно-ориентированной параметрической информации и актуализованных данных рендеринга, отображающих пространственное расположение множества сигналов аудиообъектов, охарактеризованных в объектно-ориентированной параметрической информации, для аудиоканалов повышающего микширования, которые описаны параметрическими данными каналов.

29. Кодер аудиосигнала (600), предназначенный для формирования представления сигнала понижающего микширования (614) и объектно-ориентированной параметрической информации (616) на основе множества сигналов объектов (x₁-x_N), включающий в себя: понижающий микшер (620), генерирующий один или более даунмикс-сигналов на основании даунмикс-коэффициентов (d₁-d_N), соотнесенных с сигналами объектов (x₁-x_N), таким образом, что один или более даунмикс-сигналов отображают суперпозицию множества сигналов объектов; драйвер доступа к служебной информации (630), обеспечивающий дополнительные данные межобъектного соотношения (OLD, IOC), описывающие разности уровней и корреляционные характеристики сигналов объектов (x₁-x_N) и сопутствующие данные обособленного объекта, описывающие одно или более индивидуальных свойств сигналов обособленных объектов (x₁-x_N).

30. Устройство по п.29, в составе которого драйвер доступа к служебной информации (630) формирует сопутствующие данные обособленного объекта, описывающие тональные характеристики сигналов выделенных объектов (x₁-x_N).

31. Способ формирования представления сигнала понижающего микширования и объектно-ориентированной параметрической информации на материале массива сигналов объектов, для осуществления которого: формируют один или более даунмикс-сигналов в зависимости от даунмикс-коэффициентов, соотнесенных с сигналами объектов, таким образом, что один или более даунмикс-сигналов отображают суперпозицию совокупности сигналов объектов; и формируют дополнительные данные межобъектного соотношения, описывающие разности уровней и корреляционные характеристики сигналов объектов; и формируют сопутствующие данные обособленного объекта, описывающие одно или более индивидуальных свойств сигналов обособленных объектов.

32. Аудиобитстрим (поток двоичного представления звука) (700), представляющий множество сигналов объектов (x₁-x_N) в кодированной форме, содержащий в себе: представление даунмикс-сигнала (710), включающее в себя один или более даунмикс-сигналов, из которых, по меньшей мере, один даунмикс-сигнал отображает суперпозицию множества сигналов объектов; и служебную информацию о межобъектном соотношении (720), описывающую разности уровней и характеристики корреляции сигналов объектов; и сопутствующие данные обособленного объекта (730), описывающие одно или более индивидуальных свойств сигналов обособленных объектов.

33. Аудиобитстрим по п.32, в структуре которого сопутствующие данные обособленного объекта отображают тональные характеристики сигналов обособленных объектов.

34. Компьютерная программа для осуществления одного из способов по пп.26, 27, 28 или 31.