RU2013141919A

RU2013141919A - Устройство и способ для кодирования и декодирования аудиосигнала с использованием выровненной части опережающего просмотра

Info

Publication number: RU2013141919A
Application number: RU2013141919/08A
Authority: RU
Inventors: Эммануэль РАВЕЛЛИ; Ральф ГАЙГЕР; Маркус ШНЕЛЛЬ; Гийом ФУКС; Веза РУОППИЛА; Том БЯКСТРЕМ; Бернхард ГРИЛЛ; Кристиан ХЕЛЬМРИХ
Original assignee: Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф.
Priority date: 2011-02-14
Filing date: 2012-02-14
Publication date: 2015-03-27
Also published as: EP4243017A2; AR098557A2; EP2676265B1; JP2014510305A; CN103503062B; EP3503098C0; TR201908598T4; KR101698905B1; CN103503062A; AU2012217153B2; TW201506907A; AR102602A2; EP4243017A3; KR101853352B1; CN105304090B; MY160265A; KR20130133846A; AU2012217153A1; CN105304090A; US9047859B2

Abstract

1. Устройство для кодирования аудиосигнала, имеющего поток дискретных значений (100) аудиосигнала, содержащее:блок (102) применения оконной функции для применения окна (200) анализа кодирования с предсказанием к потоку дискретных значений аудиосигнала для получения обработанных с помощью оконной функции данных для анализа с предсказанием и для применения окна (204) анализа кодирования с преобразованием к потоку дискретных значений аудиосигнала для получения обработанных с помощью оконной функции данных для анализа с преобразованием,причем окно анализа кодирования с преобразованием связано с дискретными значениями аудиосигнала в пределах текущего кадра дискретных значений аудиосигнала и с дискретными значениями аудиосигнала заданной части будущего кадра дискретных значений аудиосигнала, являющимися частью (206) опережающего просмотра кодирования с преобразованием,причем окно анализа кодирования с предсказанием связано по меньшей мере с частью дискретных значений аудиосигнала текущего кадра и с дискретными значениями аудиосигнала заданной части будущего кадра, являющимися частью (208) опережающего просмотра кодирования с предсказанием,причем часть (206) опережающего просмотра кодирования с преобразованием и часть (208) опережающего просмотра кодирования с предсказанием тождественны друг другу или отличаются друг от друга менее чем 20% части (208) опережающего просмотра кодирования с предсказанием или менее чем 20% части (206) опережающего просмотра кодирования с преобразованием; ипроцессор (104) кодирования для генерации данных, кодированных с помощью кодирования с предсказанием, для текущего кадра с использов�

Claims

1. Устройство для кодирования аудиосигнала, имеющего поток дискретных значений (100) аудиосигнала, содержащее:

блок (102) применения оконной функции для применения окна (200) анализа кодирования с предсказанием к потоку дискретных значений аудиосигнала для получения обработанных с помощью оконной функции данных для анализа с предсказанием и для применения окна (204) анализа кодирования с преобразованием к потоку дискретных значений аудиосигнала для получения обработанных с помощью оконной функции данных для анализа с преобразованием,

причем окно анализа кодирования с преобразованием связано с дискретными значениями аудиосигнала в пределах текущего кадра дискретных значений аудиосигнала и с дискретными значениями аудиосигнала заданной части будущего кадра дискретных значений аудиосигнала, являющимися частью (206) опережающего просмотра кодирования с преобразованием,

причем окно анализа кодирования с предсказанием связано по меньшей мере с частью дискретных значений аудиосигнала текущего кадра и с дискретными значениями аудиосигнала заданной части будущего кадра, являющимися частью (208) опережающего просмотра кодирования с предсказанием,

причем часть (206) опережающего просмотра кодирования с преобразованием и часть (208) опережающего просмотра кодирования с предсказанием тождественны друг другу или отличаются друг от друга менее чем 20% части (208) опережающего просмотра кодирования с предсказанием или менее чем 20% части (206) опережающего просмотра кодирования с преобразованием; и

процессор (104) кодирования для генерации данных, кодированных с помощью кодирования с предсказанием, для текущего кадра с использованием обработанных с помощью оконной функции данных для анализа с предсказанием или для генерации данных, кодированных с преобразованием, для текущего кадра с использованием обработанных с помощью оконной функции данных для анализа с преобразованием.

2. Устройство по п. 1, в котором окно (204) анализа кодирования с преобразованием содержит неперекрывающуюся часть, простирающуюся в части (206) опережающего просмотра кодирования с преобразованием.

3. Устройство по п. 1, в котором окно (204) анализа кодирования с преобразованием содержит дополнительную перекрывающуюся часть (210), начинающуюся в начале текущего кадра и заканчивающуюся в начале неперекрывающейся части (208).

4. Устройство по п. 1, в котором блок (102) применения оконной функции сконфигурирован с возможностью использовать только начальное окно (220, 222) для перехода от кодирования с предсказанием к кодированию с преобразованием от кадра к следующему кадру, причем начальное окно не используется для перехода от кодирования с преобразованием к кодированию с предсказанием от одного кадра к следующему кадру.

5. Устройство по п. 1, дополнительно содержащее:

выходной интерфейс (106) для вывода кодируемого сигнала для текущего кадра; и

селектор (112) режима кодирования для управления процессором (104) кодирования для вывода или данных, кодированных с помощью кодирования с предсказанием, или данных, кодированных с преобразованием, для текущего кадра,

причем селектор (112) режима кодирования сконфигурирован с возможностью переключаться только между кодированием с предсказанием или кодированием с преобразованием для целого кадра, так что кодируемый сигнал для целого кадра или содержит данные, кодированные с помощью кодирования с предсказанием, или данные, кодированные с преобразованием.

6. Устройство по п. 1,

в котором блок применения (102) оконной функции использует, в дополнение к окну анализа кодирования с предсказанием дополнительное окно (202) анализа кодирования с предсказанием, связанное с дискретными значениями аудиосигнала, размещенными в начале текущего кадра, и в котором окно (200) анализа кодирования с предсказанием не связано с дискретными значениями аудиосигнала, размещенными в начале текущего кадра.

7. Устройство по п. 1,

в котором кадр содержит множество подкадров, причем окно (200) анализа с предсказанием центрировано в центре подкадра, и причем окно анализа кодирования с преобразованием центрировано на границе между двумя подкадрами.

8. Устройство по п. 7,

в котором окно (200) анализа с предсказанием центрировано в центре последнего подкадра кадра, причем дополнительное окно анализа (202) центрировано в центре второго подкадра текущего кадра, и причем окно анализа кодирования с преобразованием центрировано на границе между третьим и четвертым подкадром текущего кадра, причем текущий кадр подразделен на четыре подкадра.

9. Устройство по п. 1, в котором дополнительное окно (202) анализа кодирования с предсказанием не имеет части опережающего просмотра в будущем кадре и связано с дискретными значениями текущего кадра.

10. Устройство по п. 1, в котором окно анализа кодирования с преобразованием дополнительно содержит нулевую часть перед началом окна и нулевую часть после конца окна так, чтобы полная длина во времени окна анализа кодирования с преобразованием была в два раза больше длины во времени текущего кадра.

11. Устройство по п. 10, в котором для перехода от режима кодирования с предсказанием к режиму кодирования с преобразованием от одного кадра к следующему кадру блоком (102) применения оконной функции используется окно перехода,

причем окно перехода содержит первую неперекрывающуюся часть, начинающуюся в начале кадра, и перекрывающуюся часть, начинающуюся в конце неперекрывающейся части и простирающуюся в будущий кадр,

причем перекрывающаяся часть, простирающаяся в будущий кадр, имеет длину, которая идентична длине окна анализа части опережающего просмотра кодирования с преобразованием.

12. Устройство по п. 1, в котором длина во времени окна анализа кодирования с преобразованием больше, чем длина во времени окна (200, 202) анализа кодирования с предсказанием.

13. Устройство по п. 1, дополнительно содержащее:

выходной интерфейс (106) для вывода закодированного сигнала для текущего кадра; и

причем окно (102) сконфигурировано с возможностью использовать дополнительное окно кодирования с предсказанием, расположенное в текущем кадре перед окном кодирования с предсказанием, и

причем селектор (112) режима кодирования сконфигурирован с возможностью управлять процессором (104) кодирования для посылки только данных анализа кодирования с предсказанием полученных из окна кодирования с предсказанием, когда данные, кодированные с преобразованием, выводятся на выходной интерфейс, и не посылать данные анализа кодирования с предсказанием полученные из дополнительного окна кодирования с предсказанием, и

причем селектор (112) режима кодирования сконфигурирован с возможностью управлять процессором (104) кодирования для посылки данных анализа кодирования с предсказанием, полученных из окна кодирования с предсказанием, и для посылки данных анализа кодирования с предсказанием, полученных из дополнительного окна кодирования с предсказанием, когда данные кодированные с предсказанием, выводятся на выходной интерфейс.

14. Устройство по п. 1, в котором процессор (104) кодирования содержит:

анализатор (302) кодирования с предсказанием для получения данных кодирования с предсказанием для текущего кадра из обработанных с помощью оконной функции данных (100a) для анализа с предсказанием;

ветвь кодирования с предсказанием, содержащую:

каскад (304) фильтра для вычисления данных фильтра по дискретным значениям аудиосигнала для текущего кадра, используя данные кодирования с предсказанием; и

вычислитель (306) параметров кодера с предсказанием для вычисления параметров кодирования с предсказанием для текущих кадров; и

ветвь кодирования с преобразованием, содержащую:

спектрально-временной преобразователь (310) для преобразования данных окна для алгоритма кодирования с преобразованием в спектральное представление;

блок (312) спектрального взвешивания для взвешивания спектральных данных, используя взвешенные данные взвешивания, полученные из данных кодирования с предсказанием, для получения взвешенных спектральных данных; и

процессор (314) для спектральных данных для обработки взвешенных спектральных данных для получения данных, кодированных с помощью преобразования, для текущего кадра.

15. Способ кодирования аудиосигнала, имеющего поток дискретных значений (100) аудиосигнала, содержащий:

применение (102) окна (200) анализа кодирования с предсказанием к потоку дискретных значений аудиосигнала для получения обработанных с помощью оконной функции данных для анализа с предсказанием и применения окна (204) анализа кодирования с преобразованием к потоку дискретных значений аудиосигнала для получения обработанных с помощью оконной функции данных для анализа с преобразованием,

генерацию (104) данных, кодированных с помощью преобразования, для текущего кадра, используя обработанные с помощью оконной функции данные для анализа с предсказанием, или для генерации с преобразованием данных, кодированных с помощью преобразования, для текущего кадра, используя обработанные с помощью оконной функции данные для анализа с преобразованием.

16. Аудиодекодер для декодирования закодированного аудиосигнала, содержащий:

декодер (180) параметров предсказания для выполнения декодирования данных для кадра кодированного с предсказанием из закодированного аудиосигнала;

декодер (183) параметров преобразования для выполнения декодирования данных для кадра кодированного с преобразованием, из закодированного аудиосигнала,

причем декодер (183) параметров преобразования сконфигурирован выполнять спектрально-временное преобразование и применять окно синтеза к преобразованным данным для получения данных для текущего кадра и будущего кадра, окно синтеза, имеющее первую перекрывающуюся часть, смежную вторую неперекрывающуюся часть и смежную третью перекрывающуюся часть (206), третью перекрывающуюся часть, связанную с дискретными значениями аудиосигнала для будущего кадра, и неперекрывающуюся часть (208), связанную с данными текущего кадра; и

добавляющий перекрытие блок (184) для наложения и добавления обработанных с помощью окна синтеза дискретных значений, связанных с третьей перекрывающейся частью окна синтеза для текущего кадра, и обработанных с помощью окна синтеза дискретных значений, связанных с первой перекрывающейся частью окна синтеза для будущего кадра, для получения первой части дискретных значений аудиосигнала для будущего кадра, причем оставшиеся дискретные значения аудиосигнала для будущего кадра являются обработанными с помощью окна синтеза дискретными значениями, связанными со второй неперекрывающейся частью окна синтеза для будущего кадра, полученными без добавления перекрытия, когда текущий кадр и будущий кадр содержат данные, кодированные с преобразованием.

17. Аудиодекодер по п. 16, в котором текущий кадр закодированного аудиосигнала содержит данные кодированные с преобразованием, и будущий кадр содержит данные кодированные с предсказанием, причем декодер (183) параметров преобразования сконфигурирован выполнять обработку с помощью окна синтеза, используя окно синтеза для текущего кадра, для получения обработанных с помощью оконной функции дискретных значений аудиосигнала, связанных с неперекрывающейся частью (208) окна синтеза, причем обработанные с помощью окна синтеза дискретные значения аудиосигнала, связанные с третьей перекрывающейся частью окна синтеза для текущего кадра, отбрасываются, и

в котором дискретные значения аудиосигнала для будущего кадра обеспечены декодером (180) параметров предсказания без данных от декодера (183) параметров преобразования.

18. Аудиодекодер по п. 16, в котором текущий кадр содержит данные кодирования с предсказанием, а будущий кадр содержит данные кодирования с преобразованием,

в котором декодер (183) параметров преобразования сконфигурирован использовать окно перехода, отличающееся от окна синтеза,

в котором окно (220, 222) перехода содержит первую неперекрывающуюся часть (220) в начале будущего кадра и перекрывающуюся часть (222), начинающуюся в конце будущего кадра и простирающуюся в кадр после будущего кадра во времени, и

в котором дискретные значения аудиосигнала для будущего кадра генерируются без перекрытия, и аудиоданные, связанные со второй перекрывающейся частью (222) окна для будущего кадра вычисляются добавляющим перекрытие блоком (184) с использованием первой перекрывающейся части окна синтеза для кадра после будущего кадра.

19. Аудиодекодер по п. 16,

в котором вычислитель (183) параметров преобразования содержит:

блок (183b) спектрального взвешивания для взвешивания декодированных с преобразованием спектральных данных для текущего кадра, используя данные кодирования с предсказанием; и

вычислитель (183c) данных взвешивания кодирования с предсказанием для вычисления данных кодирования с предсказанием путем объединения взвешенной суммы данных кодирования с предсказанием, полученных из прошлого кадра, и данных кодирования с предсказанием, полученных из текущего кадра, для получения интерполированных данных кодирования с предсказанием.

20. Аудиодекодер по п. 19,

в котором вычислитель (183c) данных взвешивания кодирования с предсказанием сконфигурирован с возможностью преобразовывать данные кодирования с предсказанием в спектральное представление, имеющее весовые значения для каждого диапазона частот, и

причем блок (183b) спектрального взвешивания сконфигурирован с возможностью взвешивать все спектральные значения в полосе посредством идентичного весового значения для этой полосы.

21. Аудиодекодер по п. 16, в котором окно синтеза сконфигурировано с возможностью иметь полную продолжительность менее 50 мс и более 25 мс, причем первая и третья перекрывающиеся части имеют одинаковую длину, и причем третья перекрывающаяся часть имеет длину менее 15 мс.

22. Аудиодекодер по п. 16,

в котором окно синтеза имеет продолжительность в 30 мс без заполненных нулями частей, первая и третья перекрывающиеся части имеют длительность 10 мс, а неперекрывающаяся часть имеет длительность 10 мс.

23. Аудиодекодер по п. 16,

в котором декодер (183) параметров преобразования сконфигурирован с возможностью применять для спектрально-временного преобразования преобразование (183d) DCT, имеющее число дискретных значений, соответствующее длине кадра, и операцию (183e) обратной свертки для генерации числа временных значений, в два раза превышающего число временных значений до DCT, и

применять (183e) окно синтеза к результату операции обратной свертки, причем окно синтеза содержит перед первой перекрывающейся частью и после третьей перекрывающейся части нулевые части, имеющие длину, равную половине длины первой и третьей перекрывающихся частей.

24. Способ декодирования кодированного аудиосигнала, содержащий:

выполнение (180) декодирования данных для кадра, кодированного с предсказанием, из закодированного аудиосигнала;

выполнение (183) декодирования данных для кадра, кодированного с преобразованием, из закодированного аудиосигнала,

причем этап выполнения (183) декодирования данных для кадра, кодированного с преобразованием, содержит выполнение спектрально-временного преобразования и применение окна синтеза к преобразованным данным для получения данных для текущего кадра и будущего кадра, окна синтеза, имеющего первую перекрывающуюся часть, смежную вторую неперекрывающуюся часть и смежную третью перекрывающуюся часть (206), третью перекрывающуюся часть, связанную с дискретными значениями аудиосигнала для будущего кадра, и неперекрывающуюся часть (208), связанную с данными текущего кадра; и

перекрытие и добавление (184) обработанных с помощью окна синтеза дискретных значений, связанных с третьей перекрывающейся частью окна синтеза для текущего кадра, и обработанных с помощью окна синтеза дискретных значений, связанных с первой перекрывающейся частью окна синтеза для будущего кадра, для получения первой части дискретных значений аудиосигнала для будущего кадра, причем оставшиеся дискретные значения аудиосигнала для будущего кадра являются обработанными с помощью окна синтеза дискретными значениями, связанными со второй непересекающейся частью окна синтеза для будущего кадра, полученными без добавления перекрытия, когда текущий кадр и будущий кадр содержат данные, кодированные с преобразованием.

25. Машиночитаемый носитель, содержащий машиночитаемые команды, чтобы заставить компьютер осуществлять способ по п.15.

26. Машиночитаемый носитель, содержащий машиночитаемые команды, чтобы заставить компьютер осуществлять способ по п.24.