RU2015136223A

RU2015136223A - Низкочастотное акцентирование для основанного на lpc кодирования в частотной области

Info

Publication number: RU2015136223A
Application number: RU2015136223A
Authority: RU
Inventors: Штефан ДЕЛА; Бернхард ГРИЛЛ; Кристиан ХЕЛЬМРИХ; Николаус РЕТТЕЛЬБАХ
Original assignee: Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф.
Priority date: 2013-01-29
Filing date: 2014-01-28
Publication date: 2017-03-06
Also published as: CN110047500B; EP2951814A1; US20180240467A1; CA2898677A1; CN110047500A; CN105122357B; US10176817B2; US11854561B2; US20180293993A9; RU2612589C2; PT2951814T; AU2014211520A1; CN105122357A; US11568883B2; EP2951814B1; ES2635142T3; AR115901A2; AR094682A1; AU2014211520B2; US10692513B2

Claims

1. Аудиокодер для кодирования неречевого аудиосигнала (AS) так, чтобы произвести из него поток (BS) битов, причем аудиокодер (1) включает в себя:

комбинацию (2, 3) фильтра (2) кодирования с линейным предсказанием, имеющего множество коэффициентов (LC) кодирования с линейным предсказанием, и преобразователя (3) из временной области в частотную область, причем эта комбинация (2, 3) выполнена с возможностью фильтрации и преобразования фрейма (FI) аудиосигнала (AS) в частотную область для того, чтобы вывести спектр (SP) на основе этого фрейма (FI) и коэффициентов (LC) кодирования с линейным предсказанием;

блок (4) низкочастотного акцентирования, выполненный с возможностью вычисления обработанного спектра (PS) на основе спектра (SP), в котором спектральные линии (SL) обработанного спектра (PS), представляющие более низкую частоту, чем референсная спектральная линия (RSL), акцентированы;

управляющее устройство (5), выполненное с возможностью управления вычислением обработанного спектра (PS) с помощью блока (4) низкочастотного акцентирования в зависимости от коэффициентов (LC) кодирования с линейным предсказанием фильтра (2) кодирования с линейным предсказанием;

устройство (6) квантования, выполненное с возможностью производства квантованного спектра (QS), на основе обработанного спектра (PS);

а также генератор (7) потока битов, выполненный с возможностью встраивания квантованного спектра (QS) и коэффициентов (LC) кодирования с линейным предсказанием в поток (BS) битов.

2. Аудиокодер по п. 1, в котором фрейм (FI) аудиосигнала (AS) подается на фильтр (2) кодирования с линейным предсказанием, причем фильтрованный фрейм (FF) выводится фильтром (2) кодирования с линейным предсказанием и при этом преобразователь (3) из временной области в частотную область выполнен с возможностью оценки спектра (SP) на основе фильтрованного фрейма (FF).

3. Аудиокодер по п. 1, в котором фрейм (FI) аудиосигнала (AS) подается на преобразователь (3) из временной области в частотную область, причем преобразованный фрейм (FC) выводится преобразователем (3) из временной области в частотную область и при этом фильтр (2) кодирования с линейным предсказанием выполнен с возможностью оценки спектра (SP) на основе преобразованного фрейма (FC).

4. Аудиокодер по п. 1, в котором управляющее устройство (5) включает в себя спектральный анализатор (8), выполненный с возможностью оценки спектрального представления (SR) коэффициентов (LC) кодирования с линейным предсказанием, анализатор (9) максимума-минимума, выполненный с возможностью оценки минимума (MI) спектрального представления (SR) и максимума (MA) спектрального представления (SR) ниже дополнительной референсной спектральной линии, а также блок (10, 11) вычисления коэффициента акцентирования, выполненный с возможностью вычисления коэффициентов (SEF) акцентирования спектральной линии для вычисления спектральных линий (SL) обработанного спектра (PS), представляющих более низкую частоту, чем референсная спектральная линия (RSL), на основе минимума (MI) и максимума (MA), причем спектральные линии (SL) обработанного спектра (PS) акцентируются путем применения коэффициентов (SEF) акцентирования спектральной линии к спектральным линиям спектра фильтрованного фрейма.

5. Аудиокодер по п. 4, в котором блок (10, 11) вычисления коэффициента акцентирования конфигурируется таким образом, что коэффициенты (SEF) акцентирования спектральной линии увеличиваются в направлении от референсной спектральной линии (RSL) к спектральной линии (SL), представляющей самую низкую частоту спектра (SP).

6. Аудиокодер по п. 4, в котором блок (10, 11) вычисления коэффициента акцентирования включает в себя первый каскад (10), выполненный с возможностью вычисления базисного коэффициента (BEF) акцентирования в соответствии с первой формулой γ=(α·min/max)^β, где α является первой заданной величиной, α>1, β является второй заданной величиной, 0<β≤1, min является минимумом (MI) спектрального представления (SR), max является максимумом (MA) спектрального представления (SR), и γ является базисным коэффициентом (BEF) акцентирования, и причем блок (10, 11) вычисления коэффициента акцентирования включает в себя второй каскад (11), выполненный с возможностью вычисления коэффициентов (SEF) акцентирования спектральной линии в соответствии со второй формулой ε_i=γ^i’-i, в которой i’ является количеством спектральных линий (SL), которые будут акцентированы, i является индексом соответствующей спектральной линии (SL), причем значение индекса увеличивается с увеличением частоты спектральных линий, i=0 ... i’-1, γ является базисным коэффициентом (BEF) акцентирования, и ε_i является коэффициентом (SEF) акцентирования спектральной линии с индексом i.

7. Аудиокодер по п. 6, в котором первая заданная величина меньше чем 42 и больше чем 22, в частности меньше чем 38 и больше чем 26, более конкретно меньше чем 34 и больше чем 30.

8. Аудиокодер по п. 6, в котором вторая заданная величина определяется в соответствии с формулой β=1/(θ·i’), в которой i’ является количеством акцентируемых спектральных линий, θ является коэффициентом между 3 и 5, в частности между 3,4 и 4,6, более конкретно между 3,8 и 4,2.

9. Аудиокодер по п. 1, в котором референсная спектральная линия (RSL) представляет частоту между 600 и 1000 Гц, в частности между 700 и 900 Гц, более конкретно между 750 и 850 Гц.

10. Аудиокодер по п. 4, в котором дополнительная референсная спектральная линия представляет ту же самую или более высокую частоту, чем референсная спектральная линия (RSL).

11. Аудиокодер по п. 1, в котором управляющее устройство (5) конфигурируется таким образом, что спектральные линии (SL) обработанного спектра (PS), представляющие более низкую частоту, чем референсная спектральная линия (RSL), акцентируются только в том случае, если максимум (MA) меньше минимума (MI), умноженного на первую заданную величину.

12. Аудиодекодер (12) для декодирования потока (BS) битов, на основе неречевого аудиосигнала (AS), так, чтобы произвести из потока (BS) битов неречевой выходной аудиосигнал (OS), в частности для декодирования потока (BS) битов, произведенного аудиокодером (1) по пп. 1-12, причем поток (BS) битов содержит квантованные спектры (QS) и множество коэффициентов (LC) кодирования с линейным предсказанием, причем аудиодекодер (12) включает в себя:

приемник (13) потока битов, выполненный с возможностью извлечения квантованного спектра (QS) и коэффициентов (LC) кодирования с линейным предсказанием из потока (BS) битов;

устройство (14) деквантования, выполненное с возможностью производства деквантованного спектра (DQ) на основе квантованного спектра (QS);

блок (15) низкочастотного деакцентирования, выполненный с возможностью вычисления обратно обработанного спектра (RS) на основе деквантованного спектра (DQ), причем спектральные линии (SLD) обратно обработанного спектра (RS), представляющие более низкие частоты, чем референсная спектральная линия (RSLD), деакцентированы; и

управляющее устройство (16), выполненное с возможностью управления вычислением обратно обработанного спектра (RS) с помощью блока (15) низкочастотного деакцентирования в зависимости от коэффициентов (LC) кодирования с линейным предсказанием, содержащихся в потоке (BS) битов.

13. Аудиодекодер (12) по п. 12, который включает в себя комбинацию (17, 18) преобразователя (17) из частотной области во временную область и фильтра (18) обратного кодирования с линейным предсказанием, получающего множество коэффициентов (LC) кодирования с линейным предсказанием, содержащихся в потоке (BS) битов, причем эта комбинация (17, 18) выполнена с возможностью обратной фильтрации и преобразования обратно обработанного спектра (RS) во временную область для того, чтобы вывести выходной сигнал (OS), основанный на обратно обработанном спектре (RS) и на коэффициентах (LC) кодирования с линейным предсказанием.

14. Аудиодекодер по п. 13, в котором преобразователь (17) из частотной области во временную область выполнен с возможностью оценки временного сигнала (TS), на основе обратно обработанного спектра (RS), и причем обратный фильтр (18) кодирования с линейным предсказанием выполнен с возможностью вывода выходного сигнала (OS), на основе временного сигнала (TS).

15. Аудиодекодер по п. 13, в котором обратный фильтр (18) кодирования с линейным предсказанием выполнен с возможностью оценки обратно фильтрованного сигнала (IFS), на основе обратно обработанного спектра (RS), и причем преобразователь (17) из частотной области во временную область выполнен с возможностью вывода выходного сигнала (OS), на основе обратно фильтрованного сигнала (IFS).

16. Аудиодекодер по п. 12, в котором управляющее устройство (16) включает в себя спектральный анализатор (19), выполненный с возможностью оценки спектрального представления (SR) коэффициентов (LC) кодирования с линейным предсказанием, анализатор (20) максимума-минимума, выполненный с возможностью оценки минимума (MI) спектрального представления (SR) и максимума (MA) спектрального представления (SR) ниже дополнительной референсной спектральной линии, а также блок (21, 22) вычисления коэффициента деакцентирования, выполненный с возможностью вычисления коэффициентов (SDF) деакцентирования спектральной линии для вычисления спектральных линий (SLD) обратно обработанного спектра (RS), представляющих более низкую частоту, чем референсная спектральная линия (RSLD), на основе минимума (MI) и максимума (MA), причем спектральные линии (SLD) обратно обработанного спектра (RS) деакцентируются путем применения коэффициентов (SDF) деакцентирования спектральной линии к спектральным линиям деквантованного спектра (DQ).

17. Аудиодекодер по п. 16, в котором блок (21, 22) вычисления коэффициента деакцентирования конфигурируется таким образом, что коэффициенты (SDF) деакцентирования спектральной линии уменьшаются в направлении от референсной спектральной линии (RSLD) к спектральной линии (SL), представляющей самую низкую частоту обратно обработанного спектра (RS).

18. Аудиодекодер по п. 16, в котором блок (21, 22) вычисления коэффициента деакцентирования включает в себя первый каскад (21), выполненный с возможностью вычисления базисного коэффициента (BDF) деакцентирования в соответствии с первой формулой δ=(α·min/max)^-β, где α является первой заданной величиной, α>1, β является второй заданной величиной, 0<β≤1, min является минимумом (MI) спектрального представления (SR), max является максимумом (MA) спектрального представления (SR), и δ является базисным коэффициентом (BDF) деакцентирования, и причем блок (21, 22) вычисления коэффициента деакцентирования включает в себя второй каскад (22), выполненный с возможностью вычисления коэффициентов (SDF) деакцентирования спектральной линии в соответствии со второй формулой

_i=δ^i’-i, в которой i’ является количеством спектральных линий (SLD), которые будут деакцентированы, i является индексом соответствующей спектральной линии (SLD), причем значение индекса увеличивается с увеличением частоты спектральных линий, i=0 ... i’-1, δ является базисным коэффициентом (BDF) деакцентирования, и

_i является коэффициентом (SDF) деакцентирования спектральной линии с индексом i.

19. Аудиодекодер по п. 18, в котором первая заданная величина меньше чем 42 и больше чем 22, в частности меньше чем 38 и больше чем 26, более конкретно меньше чем 34 и больше чем 30.

20. Аудиодекодер по п. 18, в котором вторая заданная величина определяется в соответствии с формулой β=1/(θ·i’), в которой i’ является количеством акцентируемых спектральных линий (SLD), θ является коэффициентом между 3 и 5, в частности между 3,4 и 4,6, более конкретно между 3,8 и 4,2.

21. Аудиодекодер по п. 12, в котором референсная спектральная линия (RSLD) представляет частоту между 600 и 1000 Гц, в частности между 700 и 900 Гц, более конкретно между 750 и 850 Гц.

22. Аудиодекодер по п. 16, в котором дополнительная референсная спектральная линия представляет ту же самую или более высокую частоту, чем референсная спектральная линия (RSLD).

23. Аудиодекодер по п. 12, в котором управляющее устройство (16) конфигурируется таким образом, что спектральные линии (SLD) обратно обработанного спектра (RS), представляющие более низкую частоту, чем референсная спектральная линия (RSLD), деакцентируются только в том случае, если максимум (MA) меньше минимума (MI), умноженного на первую заданную величину.

24. Система, включающая в себя декодер (12) и кодер (1), в которой кодер (1) спроектирован в соответствии с одним из пп. 1-11 и/или декодер спроектирован в соответствии с одним из пп. 12-23.

25. Способ кодирования неречевого аудиосигнала (AS) так, чтобы произвести из него поток (BS) битов, причем способ включает в себя этапы:

фильтрования с фильтром (2) кодирования с линейным предсказанием, имеющим множество коэффициентов (LC) кодирования с линейным предсказанием, и преобразования фрейма (FI) аудиосигнала (AS) в частотную область для того, чтобы вывести спектр (SP) на основе этого фрейма (FI) и коэффициентов (LC) кодирования с линейным предсказанием;

вычисления обработанного спектра (PS) на основе спектра (SP), причем спектральные линии (SL) обработанного спектра (PS), представляющие более низкую частоту, чем референсная спектральная линия (RSL), акцентированы; и

управления вычислением обработанного спектра (PS) в зависимости от коэффициентов (LC) кодирования с линейным предсказанием фильтра (2) кодирования с линейным предсказанием;

производства квантованного спектра (QS), на основе обработанного спектра (PS); и

встраивания квантованного спектра (QS) и коэффициентов (LC) кодирования с линейным предсказанием в поток (BS) битов.

26. Способ для декодирования потока (BS) битов, на основе неречевого аудиосигнала (AS), так, чтобы произвести из потока (BS) битов неречевой выходной аудиосигнал (OS), в частности для декодирования потока (BS) битов, произведенного с помощью способа по предшествующему пункту, причем поток (BS) битов содержит квантованные спектры (QS) и множество коэффициентов (LC) кодирования с линейным предсказанием, причем способ включает в себя этапы:

извлечения квантованного спектра (QS) и коэффициентов (LC) кодирования с линейным предсказанием из потока (BS) битов;

производства деквантованного спектра (DQ), на основе квантованного спектра (QS);

вычисления обратно обработанного спектра (RS) на основе деквантованного спектра (DQ), причем спектральные линии (SLD) обратно обработанного спектра (RS), представляющие более низкие частоты, чем референсная спектральная линия (RSLD), деакцентированы; и

управления вычислением обратно обработанного спектра (RS) в зависимости от коэффициентов (LC) кодирования с линейным предсказанием, содержащихся в потоке (BS) битов.

27. Компьютерная программа, которая при ее выполнении на компьютере или процессоре выполняет способ по п. 25 или 26.