RU2016118979A

RU2016118979A - Принцип для кодирования аудиосигнала и декодирования аудиосигнала с использованием детерминированной и шумоподобной информации

Info

Publication number: RU2016118979A
Application number: RU2016118979A
Authority: RU
Inventors: Гийом ФУКС; Маркус МУЛЬТРУС; Эммануэль РАВЕЛЛИ; Маркус ШНЕЛЛЬ
Original assignee: Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф.
Priority date: 2013-10-18
Filing date: 2014-10-10
Publication date: 2017-11-23
Also published as: US20190228787A1; JP6366705B2; BR112016008544A2; US10607619B2; EP3779982A1; SG11201603041YA; KR20160070147A; CA2927722C; BR112016008544B1; US20160232908A1; ES2839086T3; CA2927722A1; AU2014336357B2; TWI576828B; AU2014336357A1; WO2015055532A1; US10304470B2; CN105723456A; PL3058569T3; MY187944A

Claims

1. Кодер для кодирования аудиосигнала, причем кодер содержит:

- анализатор (120; 320), выполненный с возможностью извлечения коэффициентов (122; 322) прогнозирования и остаточного сигнала из невокализованного кадра аудиосигнала (102);

- модуль (550; 550') вычисления параметров усиления, выполненный с возможностью вычисления информации первого параметра (g_c) усиления для задания первого сигнала (c(n)) возбуждения, связанного с детерминированной таблицей кодирования, и вычисления информации второго параметра (g_n) усиления для задания второго сигнала (n(n)) возбуждения, связанного с шумоподобным сигналом для невокализованного кадра; и

- модуль (690) формирования потоков битов, выполненный с возможностью формирования выходного сигнала (692) на основе информации (142), связанной с вокализованным кадром сигнала, информации первого параметра (g_c) усиления и информации второго параметра (g_n) усиления.

2. Кодер по п. 1, в котором модуль (550; 550') вычисления параметров усиления выполнен с возможностью вычисления первого параметра (g_c) усиления и второго параметра (g_n) усиления, при этом модуль (690) формирования потоков битов выполнен с возможностью формирования выходного сигнала (692) на основе первого параметра (g_c) усиления и второго параметра (g_n) усиления; или

- при этом модуль (550; 550') вычисления параметров усиления содержит квантователь (170-1, 170-2), выполненный с возможностью квантования первого параметра (g_c) усиления для получения первого параметра (

) квантованного усиления, и квантования второго параметра (g_n) усиления для получения второго параметра (

) квантованного усиления, при этом модуль (690) формирования потоков битов выполнен с возможностью формирования выходного сигнала (692) на основе первого параметра (

) квантованного усиления и второго параметра (

) квантованного усиления.

3. Кодер по п. 1 или 2, дополнительно содержащий модуль (160) вычисления информации формант, выполненный с возможностью вычисления информации (162) формирования речевого спектра из коэффициентов (122; 322) прогнозирования, при этом модуль (550; 550') вычисления параметров усиления выполнен с возможностью вычислять информацию (g_c) первых параметров усиления и информацию (g_n) вторых параметров усиления на основе информации (162) формирования речевого спектра.

4. Кодер по одному из предшествующих пунктов, в котором модуль (550') вычисления параметров усиления содержит:

- первый усилитель (550e), выполненный с возможностью усиления первого сигнала (c(n)) возбуждения посредством применения первого параметра g_c усиления, чтобы получать первый усиленный сигнал (550f) возбуждения;

- второй усилитель (350e; 550g), выполненный с возможностью усиления второго сигнала (n(n)) возбуждения, отличающегося от первого сигнала возбуждения (c(n)), посредством применения второго параметра (g_n) усиления, чтобы получать второй усиленный сигнал (350g; 550h) возбуждения;

- модуль (550i) комбинирования, выполненный с возможностью комбинирования первого усиленного сигнала (550f) возбуждения и второго усиленного сигнала (350g; 550h) возбуждения, чтобы получать комбинированный сигнал (550k; 550k') возбуждения;

- контроллер (550n), выполненный с возможностью фильтрации комбинированного сигнала (550k; 550k') возбуждения с помощью синтезирующего фильтра, чтобы получать синтезированный сигнал (350l'), сравнения синтезированного сигнала (350l') и кадра (102) аудиосигнала, чтобы получать результат сравнения, адаптировать первый параметр (g_c) усиления или второй параметр (g_n) усиления на основе результата сравнения; и

- при этом модуль (690) формирования потоков битов выполнен с возможностью формирования выходного сигнала (692) на основе информации (

;

), связанной с первым параметром (g_c) усиления и вторым параметром (g_n) усиления.

5. Кодер по одному из предшествующих пунктов, в котором контроллер (550; 550') параметров усиления дополнительно содержит, по меньшей мере, один формирователь (350; 550b), выполненный с возможностью придания определенной формы спектру первого сигнала (c(n)) возбуждения или сигнала, извлекаемого из него, или второго сигнала (n(n)) возбуждения или сигнала, извлекаемого из него, на основе информации (162) формирования спектра.

6. Кодер по одному из предшествующих пунктов, в котором кодер выполнен с возможностью кодирования аудиосигнала (102) покадрово в последовательности кадров, при этом модуль (550; 550') вычисления параметров усиления выполнен с возможностью определения первого параметра (g_c) усиления и второго параметра (g_n) усиления для каждого из множества субкадров обработанного кадра, при этом контроллер (550; 550') параметров усиления выполнен с возможностью определения среднего значения энергии, ассоциированного с обработанным кадром.

7. Кодер по одному из предшествующих пунктов, дополнительно содержащий:

- модуль (160) вычисления информации формант, выполненный с возможностью вычисления, по меньшей мере, первой информации формирования речевого спектра из коэффициентов (122; 322) прогнозирования;

- решающий модуль (130), выполненный с возможностью определения того, определен или нет остаточный сигнал из аудиокадра невокализованного сигнала.

8. Кодер по одному из предшествующих пунктов, в котором контроллер (550; 550') параметров усиления содержит контроллер (550n), выполненный с возможностью определения первого параметра (g_c) усиления на основе следующего:

- при этом cw(n) является фильтрованным сигналом возбуждения изобретаемой таблицы кодирования, и xw(n) является целевым перцепционным возбуждением, вычисленным в CELP-кодере;

- при этом контроллер (550n) выполнен с возможностью определять квантованное усиление (

) шума на основе квантованного значения первого параметра

усиления и корневого квадратного энергетического отношения между первым возбуждением и вторым возбуждением:

- при этом Lsf является размером субкадра в выборках.

9. Кодер по одному из предшествующих пунктов, дополнительно содержащий квантователь (170-1, 170-2), выполненный с возможностью квантования первого параметра (g_c) усиления, чтобы получать квантованный первый параметр усиления (

), при этом контроллер (550n) параметров усиления выполнен с возможностью определения первого параметра (g_c) усиления на основе следующего:

- при этом g_c является первым параметром усиления, Lsfis является размером субкадра в выборках, cw(n) обозначает первый сигнал возбуждения определенной формы, xw(n) обозначает сигнал кодирования на основе линейного прогнозирования с возбуждением по коду,

- при этом контроллер (550n) параметров усиления или квантователь (170-1, 170-2) дополнительно выполнен с возможностью нормализации первого параметра (g_c) усиления, чтобы получать нормализованный первый параметр усиления на основе следующего:

- при этом g_nc обозначает нормализованный первый параметр усиления, и

является показателем для средней энергии невокализованного остаточного сигнала для всего кадра; и

- при этом квантователь (170-1, 170-2) выполнен с возможностью квантования нормализованного первого параметра усиления, чтобы получать квантованный первый параметр (

) усиления.

10. Кодер по п. 9, в котором квантователь (170-1, 170-2) выполнен с возможностью квантования второго параметра (g_n) усиления, чтобы получать квантованный второй параметр (

) усиления, при этом контроллер (550; 550') параметров усиления выполнен с возможностью определять второй параметр (g_n) усиления посредством определения значения ошибки на основе следующего:

- при этом переменный коэффициент ослабления в диапазоне между 0,5 и 1, Lsf соответствует размеру субкадра обработанного аудиокадра, cw(n) обозначает первый сигнал (c(n)) возбуждения определенной формы, xw(n) обозначает сигнал кодирования на основе линейного прогнозирования с возбуждением по коду, g_n обозначает второй параметр усиления, и

обозначает квантованный первый параметр усиления;

- при этом контроллер (550; 550') параметров усиления выполнен с возможностью определения ошибки для текущего субкадра, при этом квантователь (170-1, 170-2) выполнен с возможностью определения квантованного второго усиления (

), которое минимизирует ошибку, и получения квантованного второго усиления (

) на основе следующего:

- где

обозначает скалярное значение из конечного набора возможных значений.

11. Кодер по п. 10, в котором модуль (550i) комбинирования выполнен с возможностью комбинирования первого параметра (g_c) усиления и второго параметра (g_n) усиления, чтобы получать комбинированный сигнал (e(n)) возбуждения на основе следующего:

12. Декодер (1000) для декодирования принимаемого аудиосигнала (1002), содержащего информацию, связанную с коэффициентами (122) прогнозирования, причем декодер (1000) содержит:

- генератор (1010) первых сигналов, выполненный с возможностью формирования первого сигнала (1012) возбуждения из детерминированной таблицы кодирования для части синтезированного сигнала (1062);

- генератор (1020) вторых сигналов, выполненный с возможностью формирования второго сигнала (1022) возбуждения из шумоподобного сигнала для части синтезированного сигнала (1062);

- модуль (1050) комбинирования, выполненный с возможностью комбинирования первого сигнала (1012) возбуждения и второго сигнала (1022) возбуждения для формирования комбинированного сигнала (1052) возбуждения для части синтезированного сигнала (1062); и

- синтезатор (1060), выполненный с возможностью синтезирования части синтезированного сигнала (1062) из комбинированного сигнала (1052) возбуждения и коэффициентов (122) прогнозирования.

13. Декодер по п. 12, в котором принимаемый аудиосигнал (1002) содержит информацию, связанную с первым параметром (g_c) усиления и со вторым параметром (g_n) усиления, при этом декодер дополнительно содержит:

- первый усилитель (254; 350e; 550e), выполненный с возможностью усиления первого сигнала (1012) возбуждения или сигнала, извлекаемого из него, посредством применения первого параметра (g_c) усиления, чтобы получать первый усиленный сигнал (1012') возбуждения;

- второй усилитель (254; 350e; 550e), выполненный с возможностью усиления второго сигнала (1022) возбуждения или извлекаемого сигнала посредством применения второго параметра усиления, чтобы получать второй усиленный сигнал (1022') возбуждения;

14. Декодер по п. 12 или 13, дополнительно содержащий:

- модуль (160; 1090) вычисления информации формант, выполненный с возможностью вычисления первой информации (1092a) формирования спектра и второй информации (1092b) формирования спектра из коэффициентов (122; 322) прогнозирования;

- первый формирователь (1070) для придания определенной спектральной формы спектру первого сигнала (1012) возбуждения или сигнала, извлекаемого из него, с использованием первой информации (1092a) формирования спектра; и

- второй формирователь (1080) для придания определенной спектральной формы спектру второго сигнала (1022) возбуждения или сигнала, извлекаемого из него, с использованием второй информации (1092b) формирования.

15. Кодированный аудиосигнал (692; 1002), содержащий информацию, связанную с коэффициентами (122; 322) прогнозирования, информацию, связанную с детерминированной таблицей кодирования, информацию, связанную с первым параметром (g_c) усиления и вторым параметром (g_n) усиления, и информацию (142), связанную с вокализованным и невокализованным кадром сигнала.

16. Способ (1400) для кодирования аудиосигнала (102), при этом способ содержит этапы, на которых:

- извлекают (1410) коэффициенты (122; 322) прогнозирования и остаточный сигнал из невокализованного кадра аудиосигнала(102);

- вычисляют (1420) информацию (

) первых параметров усиления для задания первого сигнала (c(n)) возбуждения, связанного с детерминированной таблицей кодирования, и вычисляют информацию (

) вторых параметров усиления для задания второго сигнала (n(n)) возбуждения, связанного с шумоподобным сигналом (n(n)) для невокализованного кадра; и

- формируют (1430) выходной сигнал (692; 1002) на основе информации (142), связанной с вокализованным кадром сигнала, информации (

) первых параметров усиления и информации (

) вторых параметров усиления.

17. Способ (1500) для декодирования принимаемого аудиосигнала (692; 1002), содержащего информацию, связанную с коэффициентами (122; 322) прогнозирования, причем декодер (1000) содержит:

- формируют (1510) первый сигнал (1012, 1012') возбуждения из детерминированной таблицы кодирования для части синтезированного сигнала (1062);

- формируют (1520) второй сигнал (1022, 1022') возбуждения из шумоподобного сигнала (n(n)) для части синтезированного сигнала (1062);

- комбинируют (1530) первый сигнал (1012, 1012') возбуждения и второй сигнал (1022, 1022') возбуждения для формирования комбинированного сигнала (1052) возбуждения для части синтезированного сигнала (1062); и

- синтезируют (1540) часть синтезированного сигнала (1062) из комбинированного сигнала (1052) возбуждения и коэффициентов (122; 322) прогнозирования.

18. Компьютерная программа, имеющая программный код для осуществления способа по п. 16 или 17 при выполнении на компьютере.