RU2015136502A

RU2015136502A - Заполнение шумом при аудиокодировании с перцепционным преобразованием

Info

Publication number: RU2015136502A
Application number: RU2015136502A
Authority: RU
Inventors: Саша ДИШ; Марк ГАЙЕР; Кристиан ХЕЛЬМРИХ; Горан МАРКОВИЧ; ВАЛЕРО Мария ЛУИС
Original assignee: Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф.
Priority date: 2013-01-29
Filing date: 2014-01-28
Publication date: 2017-03-07
Also published as: BR112015017748B1; ZA201506266B; HK1218344A1; BR112015017633A2; ES2834929T3; AU2014211544B2; KR20150109437A; PL2951818T3; KR20160091449A; CN105190749B; ES2709360T3; RU2660605C2; EP2951818B1; US20150332686A1; KR20160090403A; KR20160091448A; TW201434035A; EP2951817A1; PL2951817T3; BR112015017633B1

Claims

1. Аудиодекодер с перцепционным преобразованием, содержащий

модуль заполнения шумом, сконфигурированный с возможностью выполнять заполнение шумом над спектром (34) аудиосигнала посредством заполнения спектра с помощью шума, чтобы получать заполненный шумом спектр; и

модуль формирования шума частотной области, сконфигурированный с возможностью подвергать заполненный шумом спектр спектральному формированию с использованием спектральной перцепционной весовой функции,

при этом модуль формирования шума частотной области сконфигурирован с возможностью:

определять спектральную перцепционную весовую функцию из информации (162) коэффициентов линейного предсказания, сигнализируемой в потоке данных, в который спектр (34) кодируется (164), или

определять спектральную перцепционную весовую функцию из коэффициентов (112) масштабирования, относящихся к диапазонам (110) коэффициентов масштабирования, сигнализируемых в потоке данных, в который спектр (34) кодируется,

при этом модуль заполнения шумом сконфигурирован с возможностью:

генерировать промежуточный сигнал шума;

идентифицировать непрерывные спектральные нулевые части спектра аудиосигнала;

определять функцию для каждой непрерывной спектральной нулевой части в зависимости от

ширины соответствующей непрерывной спектральной нулевой части, так что функция ограничивается соответствующей непрерывной спектральной нулевой частью,

спектрального положения соответствующей непрерывной спектральной нулевой части, так что масштабирование функции зависит от спектрального положения соответствующей непрерывной спектральной нулевой части, так что величина масштабирования монотонно возрастает или убывает с возрастанием частоты

спектрального положения соответствующей непрерывной спектральной нулевой части; и

спектрально формировать, для каждой непрерывной спектральной нулевой части, промежуточный сигнал шума с использованием функции, определенной для соответствующей непрерывной спектральной нулевой части, так что шум демонстрирует спектрально глобальный наклон, имеющий отрицательный угловой коэффициент.

2. Аудиодекодер с перцепционным преобразованием по п. 1, в котором модуль заполнения шумом сконфигурирован с возможностью изменять крутизну спектрально глобального наклона в ответ на неявную или явную сигнализацию в потоке данных, в который спектр (34) кодируется (164).

3. Аудиодекодер с перцепционным преобразованием по п. 1, в котором модуль заполнения шумом сконфигурирован с возможностью выводить крутизну спектрально глобального наклона из части потока данных, которая сигнализирует спектральную перцепционную весовую функцию, или из сигнализации длины окна преобразования в потоке данных.

4. Аудиодекодер с перцепционным преобразованием по п. 1, дополнительно содержащий

модуль обратного преобразования, сконфигурированный с возможностью выполнять обратное преобразование заполненного шумом спектра, спектрально сформированного посредством модуля формирования шума частотной области, чтобы получать обратное преобразование, и подвергать обратное преобразование обработке добавления перекрывания.

5. Аудиодекодер с перцепционным преобразованием по п. 1, в котором модуль заполнения шумом сконфигурирован так, что функция (48, 50) принимает максимум во внутренней части (52) непрерывной спектральной нулевой части (40), и имеет спадающие к наружи края (58, 60), абсолютный угловой коэффициент которых отрицательно зависит от тональности.

6. Аудиодекодер с перцепционным преобразованием по п. 1, в котором модуль заполнения шумом сконфигурирован так, что функция (48, 50) принимает максимум во внутренней части (52) непрерывной спектральной нулевой части (40), и имеет спадающие кнаружи края (58, 60), спектральная ширина (54, 56) которых положительно зависит от тональности.

7. Аудиодекодер с перцепционным преобразованием по п. 1, в котором модуль заполнения шумом дополнительно сконфигурирован так, что функция является постоянной или унимодальной функцией (48, 50), интеграл которой - нормализованной к интегралу, равному 1 - по внешним четвертям (a, d) непрерывной спектральной нулевой части (40) отрицательно зависит от тональности.

8. Аудиодекодер с перцепционным преобразованием по п. 1, в котором модуль заполнения шумом дополнительно сконфигурирован так, что набор (80) функций зависит от тональности аудиосигнала, так что если тональность аудиосигнала увеличивается, масса функции становится более сосредоточенной во внутренней части соответствующей непрерывной спектральной нулевой части и отдаленной от внешних краев соответствующей непрерывной спектральной нулевой части.

9. Аудиодекодер с перцепционным преобразованием по п. 1, в котором модуль заполнения шумом дополнительно сконфигурирован с возможностью масштабировать шум с использованием параметра уровня шума, сигнализируемого в потоке данных, в который спектр кодируется, спектрально глобальным способом.

10. Аудиодекодер с перцепционным преобразованием по п. 1, в котором модуль заполнения шумом дополнительно сконфигурирован с возможностью генерировать шум с использованием случайной или псевдослучайной обработки или с использованием наложения заплат.

11. Аудиодекодер с перцепционным преобразованием по п. 5, в котором модуль заполнения шумом дополнительно сконфигурирован с возможностью выводить тональность из параметра кодирования, с использованием которого аудиосигнал кодируется.

12. Аудиодекодер с перцепционным преобразованием по п. 11, в котором модуль заполнения шумом дополнительно сконфигурирован так, что параметр кодирования является флагом активации или усилением LTP (долгосрочного предсказания) или TNS (временного формирования шума) и/или флагом активации перегруппировки спектра, при этом флаг активации спектральной перегруппировки сигнализирует вариант выбора кодирования, согласно которому квантованные спектральные значения спектрально по-новому размещаются, с дополнительной передачей внутри потока данных предписания перегруппировки.

13. Аудиодекодер с перцепционным преобразованием по п. 1, в котором модуль заполнения шумом дополнительно сконфигурирован с возможностью ограничивать заполнение шумом на высокочастотную спектральную часть спектра аудиосигнала.

14. Аудиодекодер с перцепционным преобразованием по п. 13, в котором модуль заполнения шумом дополнительно сконфигурирован с возможностью устанавливать низкочастотное начальное положение высокочастотной спектральной части, соответствующее явной сигнализации в потоке данных, в который спектр аудиосигнала кодируется.

15. Аудиокодер с перцепционным преобразованием, содержащий

фильтр предыскажения;

модуль анализа LPC, сконфигурированный с возможностью определять информацию (162) коэффициентов линейного предсказания посредством выполнения анализа LP над версией аудиосигнала, подвергнутой фильтру предыскажения, при этом информация (162) коэффициентов линейного предсказания представляет огибающую спектра LPC спектра подвергнутой предыскажению версии аудиосигнала;

модуль преобразования, сконфигурированный с возможностью обеспечивать исходный спектр аудиосигнала;

модуль взвешивания спектра, сконфигурированный с возможностью спектрально взвешивать исходный спектр аудиосигнала согласно обратной к спектральной перцепционной весовой функции, чтобы получать взвешенный по восприятию спектр,

при этом модуль спектрального взвешивания сконфигурирован с возможностью определять спектральную перцепционную весовую функцию, чтобы следовала за огибающей спектра LPC;

модуль квантования, сконфигурированный с возможностью квантовать взвешенный по восприятию спектр способом, одинаковым для спектральных линий взвешенного по восприятию спектра, чтобы получать квантованный спектр, при этом кодер сконфигурирован с возможностью кодировать квантованный спектр в поток данных, подлежащий выводу в аудиодекодер с перцепционным преобразованием по любому из предшествующих пунктов, при этом информация коэффициентов линейного предсказания также сигнализируется в потоке данных;

модуль вычисления уровня шума, сконфигурированный с возможностью вычислять параметр уровня шума посредством

идентификации непрерывных спектральных нулевых частей спектра аудиосигнала;

определения функции для каждой непрерывной спектральной нулевой части в зависимости от

спектрального положения соответствующей непрерывной спектральной нулевой части, так что масштабирование функции зависит от спектрального положения соответствующей непрерывной спектральной нулевой части, так что величина масштабирования монотонно возрастает или убывает с возрастанием частоты спектрального положения соответствующей непрерывной спектральной нулевой части; и

спектрального формирования, для каждой непрерывной спектральной нулевой части, промежуточного сигнала шума с использованием функции, определенной для соответствующей непрерывной спектральной нулевой части, так что шум демонстрирует спектрально глобальный наклон, имеющий положительный угловой коэффициент.

16. Аудиокодер с перцепционным преобразованием по п. 15, в котором фильтр предыскажения сконфигурирован с возможностью подвергать высокочастотной фильтрации аудиосигнал с изменяющейся величиной предыскажения, чтобы получать версию аудиосигнала, подвергнутую фильтру предыскажения, при этом модуль вычисления уровня шума сконфигурирован с возможностью устанавливать угловой коэффициент спектрально глобального наклона в зависимости от величины предыскажения.

17. Аудиокодер с перцепционным преобразованием по п. 16,

сконфигурированный с возможностью явно кодировать величину спектрально глобального наклона или величину предыскажения в потоке данных, в который квантованный спектр (34) кодируется (164).

18. Аудиокодер с перцепционным преобразованием по п. 17, содержащий

модуль определения коэффициентов масштабирования, сконфигурированный с возможностью, под управлением модели восприятия, определять коэффициенты (112) масштабирования, относящиеся к диапазонам (110) коэффициентов масштабирования, чтобы следовали за порогом маскирования, при этом модуль спектрального взвешивания сконфигурирован с возможностью определять спектральную перцепционную весовую функцию, чтобы следовала за коэффициентами масштабирования.

19. Аудиокодер с перцепционным преобразованием по п. 15, в котором модуль вычисления уровня шума сконфигурирован с возможностью определять, для каждой непрерывной спектральной нулевой части, функцию (48, 50) так, что

она принимает максимум во внутренней части (52) непрерывной спектральной нулевой части (40), и имеет спадающие кнаружи края (58, 60), абсолютный угловой коэффициент которых отрицательно зависит от тональности,

она принимает максимум во внутренней части (52) непрерывной спектральной нулевой части (40), и имеет спадающие кнаружи края (58, 60), спектральная ширина (54, 56) которых положительно зависит от тональности, и/или

она является постоянной или унимодальной функцией (48, 50), интеграл которой - нормализованной к интегралу, равному 1 - по внешним четвертям (a, d) непрерывной спектральной нулевой части (40) отрицательно зависит от тональности.

20. Аудиокодер с перцепционным преобразованием по п. 19, в котором модуль вычисления уровня шума сконфигурирован с возможностью выводить тональность из флага активации или усиления LTP (долгосрочного предсказания) или TNS (временного формирования шума) и/или флага активации перегруппировки спектра, используемого аудиокодером с перцепционным преобразованием, чтобы кодировать аудиосигнал, при этом флаг активации спектральной перегруппировки сигнализирует вариант выбора кодирования, согласно которому квантованные спектральные значения спектрально по-новому размещаются, с дополнительной передачей внутри потока данных предписания перегруппировки.

21. Аудиокодер с перцепционным преобразованием по п. 15, в котором модуль заполнения шумом сконфигурирован с возможностью ограничивать заполнение шумом на высокочастотную спектральную часть спектра аудиосигнала.

22. Аудиокодер с перцепционным преобразованием по п. 15, в котором модуль вычисления уровня шума сконфигурирован с возможностью ограничивать измерение высокочастотной спектральной частью, при этом явная сигнализация устанавливает ее низкочастотное начальное положение в потоке данных, в который аудиосигнал кодируется.

23. Способ для декодирования аудио с перцепционным преобразованием, содержащий

выполнение заполнения шумом над спектром (34) аудиосигнала посредством заполнения спектра с помощью шума, чтобы получать заполненный шумом спектр; и

формирование шума частотной области, содержащее подвергание заполненного шумом спектра спектральному формированию с использованием спектральной перцепционной весовой функции, при этом формирование шума частотной области содержит определение спектральной перцепционной весовой функции из информации (162) коэффициентов линейного предсказания, сигнализируемой в потоке данных, в который спектр (34) кодируется (164), или определение спектральной перцепционной весовой функции из коэффициентов (112) масштабирования, относящихся к диапазонам (110) коэффициентов масштабирования, сигнализируемых в потоке данных, в который спектр (34) кодируется,

при этом заполнение шумом включает в себя

генерирование промежуточного сигнала шума;

идентификацию непрерывных спектральных нулевых частей спектра аудиосигнала;

определение функции для каждой непрерывной спектральной нулевой части в зависимости от

спектрального формирования, для каждой непрерывной спектральной нулевой части, промежуточного сигнала шума с использованием функции, определенной для соответствующей непрерывной спектральной нулевой части, так что шум демонстрирует спектрально глобальный наклон, имеющий отрицательный угловой коэффициент.

24. Способ для кодирования аудио с перцепционным преобразованием, содержащий

определение информации (162) коэффициентов линейного предсказания посредством выполнения анализа LP над версией аудиосигнала, подвергнутой фильтру предыскажения, при этом информация (162) коэффициентов линейного предсказания представляет огибающую спектра LPC спектра подвергнутой предыскажению версии аудиосигнала;

обеспечение исходного спектра аудиосигнала посредством модуля преобразования;

спектральное взвешивание исходного спектра аудиосигнала согласно обратной к спектральной перцепционной весовой функции, чтобы получать взвешенный по восприятию спектр, при этом функция спектрального взвешивания определяется, чтобы следовала за огибающей спектра LPC;

квантование взвешенного по восприятию спектра способом, одинаковым для спектральных линий взвешенного по восприятию спектра, чтобы получать квантованный спектр, при этом квантованный спектр кодируется в поток данных, подлежащий выводу

в аудиодекодер с перцепционным преобразованием по любому из пп. 1 по 14, при этом информация коэффициентов линейного предсказания также сигнализируется в потоке данных;

вычисление параметра уровня шума посредством

25. Компьютерная программа, имеющая программный код для выполнения, когда исполняется на компьютере, способа по п. 23 или 24.