RU2017105448A

RU2017105448A - Кодер и декодер аудиосигнала, использующие процессор частотной области с заполнением промежутка в полной полосе и процессор временной области

Info

Publication number: RU2017105448A
Application number: RU2017105448A
Authority: RU
Inventors: Саша ДИШ; Мартин ДИТЦ; Маркус МУЛЬТРУС; Гийом ФУКС; Эммануэль РАВЕЛЛИ; Маттиас НОЙЗИНГЕР; Маркус ШНЕЛЛЬ; Беньямин ШУБЕРТ; Бернхард ГРИЛЛ
Original assignee: Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф.
Priority date: 2014-07-28
Filing date: 2015-07-24
Publication date: 2018-08-30
Also published as: EP3186809B1; CN113936675A; AU2015295605A1; MX2017001235A; US20230154476A1; CN113963706A; WO2016016123A1; EP2980794A1; TR201908602T4; US10332535B2; CN113963704A; JP2019194721A; BR122022012616B1; TW201610986A; JP2021099507A; PT3186809T; JP6549217B2; ES2733207T3; US11049508B2; BR122022012700B1

Claims

1. Аудиокодер для кодирования аудиосигнала, содержащий:

первый процессор (600) кодирования для кодирования первого участка аудиосигнала в частотной области, причем первый процессор (600) кодирования содержит:

временно-частотный преобразователь (602) для преобразования первого участка аудиосигнала в представление частотной области, имеющее спектральные линии вплоть до максимальной частоты первого участка аудиосигнала;

анализатор (604) для анализа представления частотной области вплоть до максимальной частоты для определения первых спектральных участков, подлежащих кодированию с первым спектральным разрешением, и вторых спектральных участков, подлежащих кодированию со вторым спектральным разрешением, причем второе спектральное разрешение ниже, чем первое спектральное разрешение, причем анализатор (604) выполнен с возможностью определения первого спектрального участка (306) из первых спектральных участков, причем первый спектральный участок располагается, относительно частоты, между двумя вторыми спектральными участками (307a, 307b) из вторых спектральных участков;

спектральный кодер (606) для кодирования первых спектральных участков с первым спектральным разрешением и для кодирования вторых спектральных участков со вторым спектральным разрешением, причем спектральный кодер содержит параметрический кодер для вычисления информации спектральной огибающей, имеющей второе спектральное разрешение, из вторых спектральных участков;

второй процессор (610) кодирования для кодирования второго, другого, участка аудиосигнала во временной области, причем второй процессор (610) кодирования содержит:

преобразователь (900) частоты дискретизации для преобразования второго участка аудиосигнала в представление с более низкой частотой дискретизации, причем более низкая частота дискретизации ниже, чем частота дискретизации аудиосигнала, причем представление с более низкой частотой дискретизации не включает в себя верхнюю полосу входного сигнала;

кодер (910) нижней полосы временной области для кодирования во временной области представления с более низкой частотой дискретизации; и

кодер (920) с расширением полосы временной области для параметрического кодирования верхней полосы;

контроллер (620), выполненный с возможностью анализа аудиосигнала и определения, какой участок аудиосигнала является первым участком аудиосигнала, кодированным в частотной области, и какой участок аудиосигнала является вторым участком аудиосигнала, кодированным во временной области; и

формирователь (630) кодированного сигнала для формирования кодированного аудиосигнала, содержащего первый кодированный участок сигнала для первого участка аудиосигнала и второй кодированный участок сигнала для второго участка аудиосигнала.

2. Аудиокодер по п. 1, дополнительный содержащий:

препроцессор (1000), выполненный с возможностью предобработки первого участка аудиосигнала и второго участка аудиосигнала,

причем препроцессор содержит:

анализатор (1002) предсказания для определения коэффициентов предсказания; и

при этом второй процессор кодирования содержит:

квантователь (1010) коэффициентов предсказания для генерирования квантованной версии коэффициентов предсказания; и

энтропийный кодер для генерирования кодированной версии квантованных коэффициентов предсказания,

причем формирователь (630) кодированного сигнала выполнен с возможностью внесения кодированной версии в кодированный аудиосигнал.

3. Аудиокодер по п. 1,

в котором препроцессор (1000) содержит блок (1004) повторной дискретизации для повторной дискретизации аудиосигнала до частоты дискретизации второго процессора кодирования; и

причем анализатор предсказания выполнен с возможностью определения коэффициентов предсказания с использованием повторной дискретизированного аудиосигнала, или

препроцессор (1000) дополнительно содержит ступень (1006) анализа долгосрочного предсказания для определения одного или более параметров долгосрочного предсказания для первого участка аудиосигнала.

4. Аудиокодер по п. 1, дополнительно содержащий кросспроцессор (700) для вычисления, из кодированного спектрального представления первого участка аудиосигнала, данных инициализации второго процессора (610) кодирования, таким образом, что вторая обработка (610) кодирования инициализируется для кодирования второго участка аудиосигнала, следующего по времени непосредственно за первым участком аудиосигнала в аудиосигнале.

5. Аудиокодер по п. 4, в котором кросспроцессор (700) содержит:

спектральный декодер (701) для вычисления декодированной версии первого кодированного участка сигнала;

ступень (707) задержки для подачи задержанной версии декодированной версии на ступень (617) устранения предыскажений второго процессора кодирования для инициализации;

блок (708) анализирующей фильтрации взвешенных коэффициентов предсказания для подачи выходного сигнала фильтра на определитель (613) кодовой книги второго процессора (610) кодирования для инициализации;

ступень (706) анализирующей фильтрации для фильтрации декодированной версии или версии с введенными предыскажениями (709) и для подачи остатка фильтра на определитель (612) адаптивной кодовой книги второго процессора кодирования для инициализации; или

фильтр (709) введения предыскажений для фильтрации декодированной версии и для подачи версии с задержкой или с введенными предыскажениями на ступень (616) синтезирующей фильтрации второго процессора (610) кодирования для инициализации.

6. Аудиокодер по п. 1,

в котором анализатор (604) выполнен с возможностью осуществления анализа временного формирования мозаичного элемента или временного формирования шума или операции обнуления спектральных значений во вторых спектральных участках,

причем первый процессор (600) кодирования выполнен с возможностью осуществления формирования (606a) спектральных значений первых спектральных участков с использованием коэффициентов (1002, 1010) предсказания, выведенных из первого участка аудиосигнала, и при этом первый процессор (600) кодирования дополнительно выполнен с возможностью осуществления операции (606b) квантования и энтропийного кодирования спектральных значений с заданной формой первых спектральных участков, и

при этом спектральные значения вторых спектральных участков обнуляются.

7. Аудиокодер по п. 6, дополнительно содержащий кросспроцессор (700), причем кросспроцессор (700) содержит:

формирователь (703) шума для формирования квантованных спектральных значений первых спектральных участков с использованием коэффициентов (1010) LPC, выведенных из первого участка аудиосигнала;

спектральный декодер (704, 705) для декодирования спектральных участков со сформированным спектром первого спектрального участка с высоким спектральным разрешением и для синтеза вторых спектральных участков с использованием параметрического представления вторых спектральных участков и, по меньшей мере, декодированного первого спектрального участка для получения декодированного спектрального представления;

частотно-временной преобразователь (702) для преобразования спектрального представления во временную область для получения декодированного первого участка аудиосигнала, причем частота дискретизации, связанная с декодированным первым участком аудиосигнала, отличается от частоты дискретизации аудиосигнала, и частота дискретизации, связанная с выходным сигналом частотно-временного преобразователя (702), отличается от частоты дискретизации аудиосигнала, поступающего на частотно-временной преобразователь (602).

8. Аудиокодер по п. 1,

в котором второй процессор кодирования содержит, по меньшей мере, один блок из следующей группы блоков:

анализирующего фильтра (611) предсказания;

ступени (612) адаптивной кодовой книги;

ступени (614) инновационной кодовой книги;

блока (613) оценки для оценки записи инновационной кодовой книги;

ступени (615) усиления/кодирования ACELP;

ступени (616) синтезирующей фильтрации предсказания;

ступени (617) устранения предыскажений; и

ступени (618) анализирующего постфильтра басов.

9. Аудиокодер по п. 1,

в котором с процессором кодирования временной области связана вторая частота дискретизации,

причем с процессором кодирования частотной области связана первая частота дискретизации, более высокая, чем вторая частота дискретизации, причем аудиокодер дополнительно содержит кросспроцессор (700) для вычисления, из кодированного спектрального представления первого участка аудиосигнала, данных инициализации второго процессора кодирования,

причем кросспроцессор содержит частотно-временной преобразователь (702) для генерации сигнала временной области на второй частоте дискретизации,

причем частотно-временной преобразователь (702) содержит:

блок (726) выбора для выбора нижнего участка спектра, поступающего на частотно-временной преобразователь, в соответствии с отношением первой частоты дискретизации и второй частоты дискретизации, причем отношение меньше 1,

процессор (720) преобразования, имеющий длину преобразования, меньшую длины преобразования временно-частотного преобразователя (602); и

блок (712) формирования окна для синтеза для формирования окна с использованием функции окна, имеющей меньшее количество коэффициентов функции окна по сравнению с функцией окна, используемой временно-частотным преобразователем (602).

10. Аудиодекодер для декодирования кодированного аудиосигнала, содержащий:

первый процессор (1120) декодирования для декодирования первого кодированного участка аудиосигнала в частотной области, причем первый процессор (1120) декодирования содержит:

спектральный декодер (1122) для декодирования первых спектральных участков с высоким спектральным разрешением и для синтеза вторых спектральных участков с использованием параметрического представления вторых спектральных участков и, по меньшей мере, декодированного первого спектрального участка для получения декодированного спектрального представления, причем спектральный декодер (1122) выполнен с возможностью генерации первого декодированного представления таким образом, что первый спектральный участок (306) располагается относительно частоты между двумя вторыми спектральными участками (307a, 307b); и

частотно-временной преобразователь (1120) для преобразования декодированного спектрального представления во временную область для получения декодированного первого участка аудиосигнала;

второй процессор (1140) декодирования для декодирования второго кодированного участка аудиосигнала во временной области для получения декодированного второго участка аудиосигнала; и

объединитель (1160) для объединения декодированного первого спектрального участка и декодированного второго спектрального участка для получения декодированного аудиосигнала,

причем второй процессор декодирования содержит:

декодер (1200) нижней полосы временной области для декодирования сигнала нижней полосы временной области;

повышающий дискретизатор (1210) для повышения частоты дискретизации сигнала нижней полосы временной области;

декодер (1220) с расширением полосы временной области для синтеза верхней полосы выходного сигнала временной области;

микшер (1230) для микширования синтезированной верхней полосы сигнала временной области и повышенно дискретизированного сигнала нижней полосы временной области; и

объединитель (1160) для объединения декодированного первого спектрального участка и декодированного второго спектрального участка для получения декодированного аудиосигнала.

11. Аудиодекодер по п. 10,

в котором повышающий дискретизатор (1210) содержит банк (1471) анализирующих фильтров, действующий на первой частоте дискретизации временной области декодера нижней полосы , и банк (1473) синтезирующих фильтров, действующий на второй выходной частоте дискретизации, которая выше первой частоты дискретизации нижней полосы временной области.

12. Аудиодекодер по п. 10,

в котором декодер (1200) нижней полосы временной области содержит остаточный сигнал, декодер (1149, 1141, 1142) и синтезирующий фильтр (1143) для фильтрации остаточного сигнала с использованием коэффициентов (1145) синтезирующего фильтра,

причем декодер (1220) с расширением полосы временной области выполнен с возможностью повышения частоты дискретизации остаточного сигнала (1221) и обработки (1222) повышенно дискретизированного остаточного сигнала с использованием нелинейной операции для получения остаточного сигнала верхней полосы и для спектрального формирования (1223) остаточного сигнала верхней полосы для получения синтезированной верхней полосы.

13. Аудиодекодер по п. 10,

в котором первый процессор (1120) декодирования содержит адаптивный постфильтр (1420) долгосрочного предсказания для постфильтрации первого декодированного первого участка сигнала, причем фильтр (1420) управляется одним или более параметрами долгосрочного предсказания, включенными в кодированный аудиосигнал.

14. Аудиодекодер по п. 10, дополнительно содержащий:

кросспроцессор (1170) для вычисления, из декодированного спектрального представления первого кодированного участка аудиосигнала, данных инициализации второго процессора (1140) декодирования, таким образом, что второй процессор (1140) декодирования инициализируется для декодирования кодированного второго участка аудиосигнала, следующий по времени за первым участком аудиосигнала в кодированном аудиосигнале.

15. Аудиодекодер по п. 14, в котором кросспроцессор дополнительно содержит:

частотно-временной преобразователь (1170), действующий на более низкой частоте дискретизации, чем частотно-временной преобразователь (1124) первого процессора (1120) декодирования, для получения дополнительно декодированного первого участка сигнала во временной области,

причем сигнал на выходе частотно-временного преобразователя (1171) имеет вторую частоту дискретизации, более низкую, чем первая частота дискретизации, связанная с выходом частотно-временного преобразователя (1124) второго процессора декодирования,

причем дополнительный частотно-временной преобразователь (1171) содержит блок (726) выбора для выбора нижнего участка спектра, поступающего на дополнительный частотно-временной преобразователь (1171), в соответствии с отношением первой частоты дискретизации и второй частоты дискретизации, причем отношение меньше 1;

процессор (720) преобразования, имеющий длину преобразования, меньшую, чем длина (710) преобразования временно-частотного преобразователя (1124); и

блок (722) формирования окна для синтеза, использующий функцию окна, имеющую меньшее количество коэффициентов по сравнению с функцией окна, используемой частотно-временным преобразователем (1124).

16. Аудиодекодер по п. 14,

в котором кросспроцессор (1170) содержит:

ступень (1172) задержки для задержки дополнительного декодированного первого участка сигнала и для подачи задержанной версии декодированного первого участка сигнала на ступень (1144) устранения предыскажений второго процессора декодирования для инициализации;

фильтр (1173) введения предыскажений и ступень (1175) задержки для фильтрации и задержки дополнительного декодированного первого участка сигнала и для подачи выходного сигнала ступени задержки на синтезирующий фильтр (1143) предсказания второго процессора декодирования для инициализации;

анализирующий фильтр (1174) предсказания для генерации остаточного сигнала предсказания из дополнительного декодированного первого спектрального участка или дополнительного декодированного первого участка сигнала с введенными предыскажениями (1173) и для подачи остаточного сигнала предсказания на синтезатор (1141) кодовой книги второго процессора (1200) декодирования; или

переключатель (1480) для подачи дополнительного декодированного первого участка сигнала на ступень (1471) анализа блока (1210) повторной дискретизации второго процессора декодирования для инициализации.

17. Аудиодекодер по п. 10,

в котором второй процессор (1200) декодирования содержит, по меньшей мере, один блок из группы блоков, содержащей:

ACELP для декодирования коэффициентов усиления и инновационной кодовой книги;

ступень (1141) синтеза адаптивной кодовой книги;

постпроцессор (1142) ACELP;

синтезирующий фильтр (1143) предсказания; и

ступень (1144) устранения предыскажений.

18. Способ кодирования аудиосигнала, содержащий этапы, на которых:

осуществляют первое кодирование (600) первого участка аудиосигнала в частотной области, причем первое кодирование (600) содержит этапы, на которых:

преобразуют (602) первый участок аудиосигнала в представление частотной области, имеющее спектральные линии вплоть до максимальной частоты первого участка аудиосигнала;

анализируют (604) представление частотной области вплоть до максимальной частоты для определения первых спектральных участков, подлежащих кодированию с первым спектральным разрешением, и вторых спектральных участков, подлежащих кодированию со вторым спектральным разрешением, причем второе спектральное разрешение ниже, чем первое спектральное разрешение, причем на этапе анализа (604) определяют первый спектральный участок (306) из первых спектральных участков, причем первый спектральный участок располагается, относительно частоты, между двумя вторыми спектральными участками (307a, 307b) из вторых спектральных участков;

кодируют (606) первые спектральные участки с первым спектральным разрешением и для кодирования вторых спектральных участков со вторым спектральным разрешением, причем кодирование второй спектральный участок содержит вычисление, из вторых спектральных участков, информации спектральной огибающей, имеющей второе спектральное разрешение;

кодируют (606) представление частотной области;

осуществляют второе кодирование (610) второго, другого, участка аудиосигнала во временной области, причем второе кодирование (610) содержит этапы, на которых:

преобразуют (900) второй участок аудиосигнала в представление с более низкой частотой дискретизации, причем более низкая частота дискретизации ниже, чем частота дискретизации аудиосигнала, причем представление с более низкой частотой дискретизации не включает в себя верхнюю полосу входного сигнала;

кодируют (910) во временной области представление с более низкой частотой дискретизации; и

параметрически кодируют (920) верхнюю полосу;

анализируют (620) аудиосигнал и определяют, какой участок аудиосигнала является первым участком аудиосигнала, кодированным в частотной области, и какой участок аудиосигнала является вторым участком аудиосигнала, кодированным во временной области; и

формируют (630) кодированный аудиосигнал, содержащий первый кодированный участок сигнала для первого участка аудиосигнала и второй кодированный участок сигнала для второго участка аудиосигнала.

19. Способ декодирования кодированного аудиосигнала, содержащий этапы, на которых:

осуществляют первое декодирование (1120) первого кодированного участка аудиосигнала в частотной области, причем первое декодирование (1120) содержит этап, на котором:

декодируют (1122) первые спектральные участки с высоким спектральным разрешением и синтезируют вторые спектральные участки с использованием параметрического представления вторых спектральных участков и, по меньшей мере, декодированного первого спектрального участка для получения декодированного спектрального представления, причем декодирование (1122) содержит генерирование первого декодированного представления таким образом, что первый спектральный участок (306) располагается относительно частоты между двумя вторыми спектральными участками (307a, 307b); и

преобразуют (1120) декодированное спектральное представление во временную область для получения декодированного первого участка аудиосигнала;

осуществляют второе декодирование (1140) второго кодированного участка аудиосигнала во временной области для получения декодированного второго участка аудиосигнала, причем второе декодирование содержит этапы, на которых:

декодируют (1200) сигнал нижней полосы временной области;

повышают (1210) частоту дискретизации сигнала нижней полосы временной области;

синтезируют (1220) верхнюю полосу выходного сигнала временной области; и

микшируют (1230) синтезированную верхнюю полосу сигнала временной области и повышенно дискретизированный сигнал нижней полосы временной области; и

объединяют (1160) декодированный первый спектральный участок и декодированный второй спектральный участок для получения декодированного аудиосигнала.

20. Компьютерная программа для осуществления, при выполнении на компьютере или процессоре, способа по п. 18 или 19.