RU2009143665A

RU2009143665A - Аудиокодер для кодирования аудиосигнала, имеющего импульсоподобную и стационарную составляющие, способы кодирования, декодер, способ декодирования и кодированный аудиосигнал

Info

Publication number: RU2009143665A
Application number: RU2009143665/09A
Authority: RU
Inventors: Юрген ХЕРРЕ (DE); Юрген ХЕРРЕ; Ралф ДЖИДЖЕР (DE); Ралф ДЖИДЖЕР; Стефан БАЕР (DE); Стефан БАЕР; Гильом ФУШ (DE); Гильом ФУШ; Ульрих КРАЕМЕР (DE); Ульрих КРАЕМЕР; Николаус РЕТТЕЛБАХ (DE); Николаус РЕТТЕЛБАХ; Бернард ГРИЛЛ (DE); Бернард ГРИЛЛ
Original assignee: Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен (DE); Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен
Priority date: 2007-06-11
Filing date: 2008-06-05
Publication date: 2011-07-27
Also published as: CN101743586A; ES2663269T3; AR066959A1; US8706480B2; MX2009013519A; EP2165328A1; MY146431A; TW200912896A; KR101196506B1; AU2008261287A1; TWI371744B; EP2165328B1; WO2008151755A1; PL2165328T3; JP2010530079A; JP5686369B2; CA2691993C; US20100262420A1; AU2008261287B2; BRPI0811384A2

Abstract

1. Аудиокодер для кодирования аудиосигнала (8), имеющего импульсоподобную составляющую и стационарную составляющую, характеризующийся тем, что включает селектор импульсов (10), предназначенный для выделения из аудиосигнала импульсоподобной составляющей, имеющий в своем составе кодер импульсов для кодирования импульсоподобных составляющих с формированием кодированных импульсоподобных сигналов; кодер сигналов (16), предназначенный для кодирования разностного сигнала, выделенного из аудиосигнала, с формированием кодированного разностного сигнала (20), извлеченного из аудиосигнала таким образом, что импульсоподобная составляющая сокращается или удаляется из данного аудиосигнала; и выходной интерфейс (22), предназначенный для вывода кодированного импульсоподобного сигнала (12) и кодированного разностного сигнала (20) с формированием кодированного сигнала (24), при этом импульсный кодер импульсов сконфигурирован таким образом, что не кодирует импульсопподобный сигнал в случае когда селектор импульсов не способен обнаружить импульсную составляющую сигнала. ! 2. Аудиокодер по п.1, характеризующийся тем, что включает в свой состав кодер импульсов (10b) и кодер сигналов (16), из которых кодер импульсов (10b) предназначен для импульсоподобных сигналов в большей степени, чем кодер сигналов (16), а кодер сигналов (16) предназначен для стационарных сигналов в большей степени, чем кодер импульсов (10b). ! 3. Аудиокодер по п.1 или 2, характеризующийся тем, что дополнительно включает генератор разностного сигнала (26), предназначенный для получения аудиосигнала (8) и информации (28) о выделенных импульсоподобных составляющих сигнала и для в�

Claims

1. Аудиокодер для кодирования аудиосигнала (8), имеющего импульсоподобную составляющую и стационарную составляющую, характеризующийся тем, что включает селектор импульсов (10), предназначенный для выделения из аудиосигнала импульсоподобной составляющей, имеющий в своем составе кодер импульсов для кодирования импульсоподобных составляющих с формированием кодированных импульсоподобных сигналов; кодер сигналов (16), предназначенный для кодирования разностного сигнала, выделенного из аудиосигнала, с формированием кодированного разностного сигнала (20), извлеченного из аудиосигнала таким образом, что импульсоподобная составляющая сокращается или удаляется из данного аудиосигнала; и выходной интерфейс (22), предназначенный для вывода кодированного импульсоподобного сигнала (12) и кодированного разностного сигнала (20) с формированием кодированного сигнала (24), при этом импульсный кодер импульсов сконфигурирован таким образом, что не кодирует импульсопподобный сигнал в случае когда селектор импульсов не способен обнаружить импульсную составляющую сигнала.

2. Аудиокодер по п.1, характеризующийся тем, что включает в свой состав кодер импульсов (10b) и кодер сигналов (16), из которых кодер импульсов (10b) предназначен для импульсоподобных сигналов в большей степени, чем кодер сигналов (16), а кодер сигналов (16) предназначен для стационарных сигналов в большей степени, чем кодер импульсов (10b).

3. Аудиокодер по п.1 или 2, характеризующийся тем, что дополнительно включает генератор разностного сигнала (26), предназначенный для получения аудиосигнала (8) и информации (28) о выделенных импульсоподобных составляющих сигнала и для вывода разностного сигнала (18), который не содержит выделенные составляющие сигнала.

4. Аудиокодер по п.3, характеризующийся тем, что генератор разностного сигнала (26) включает вычитающее устройство (26а) для вычитания извлеченных составляющих (28) аудиосигнала (8) с формированием разностного сигнала (18).

5. Аудиокодер по п.3, характеризующийся тем, что селектор импульсов (10) предназначен для извлечения параметрического представления импульсоподобных составляющих сигнала; и генератор разностного сигнала (26) предназначен для синтезирования (26c) формы сигнала с использованием параметрического представления, и для вычитания (26а) формы сигнала из аудиосигнала (8).

6. Аудиокодер по п.3, характеризующийся тем, что генератор разностного сигнала (26) содержит импульсный декодер (26c), предназначенный для вычисления декодированного импульсоподобного сигнала, и вычитающее устройство (26а), предназначенное для вычитания декодированного импульсоподобного сигнала из аудиосигнала (8).

7. Аудиокодер по п.3, характеризующийся тем, что селектор импульсов (10) включает блок (10а) для выполнения LPC анализа аудиосигнала (8), с возможностью получения прогноза сигнала ошибки (84), селектор импульсов (10) включает процессор сигнала ошибки предсказания (10c), предназначенный для обработки сигнала ошибки предсказания с улучшением импульсоподобной характеристики этого сигнала, генератор разностного сигнала (26) предназначен для LPC синтеза (26b) с учетом оптимизированного сигнала ошибки предсказания и для вычитания из аудиосигнала сигнала, полученного в результате синтеза LPC, с получением разностного сигнала (18).

8. Аудиокодер по п.1, характеризующийся тем, что селектор импульсов (10) включает блок (1300) принятия решения импульс/не импульс, и который выполняет функцию идентификации импульсоподобной составляющей аудиосигнала и передачи ее на кодер импульсов (10b), но не на кодер сигнала (16).

9. Аудиокодер по п.1, характеризующийся тем, что блок принятия решения импульс/не импульс выполнен с возможностью распознавания вокализованного/невокализованного сигнала.

10. Аудиокодер по п.1, характеризующийся тем, что аудиосигнал имеет формантную структуру и тонкую структуру; селектор импульсов (10) выполнен с возможностью преобразования аудиосигнала таким образом, что обработанный аудиосигнал реконструирует только тонкую структуру, и, кроме того, данный селектор импульсов при преобразовании сигнала тонкой структуры оптимизирует импульсную характеристику сигнала тонкой структуры (10c); оптимизированный сигнал тонкой структуры кодируется кодером импульсов (10b).

11. Аудиокодер по п.1, характеризующийся тем, что кодер сигнала (16) представляет собой кодер-преобразователь или кодер на базе банков фильтров общего назначения, а кодер импульсов представляет собой кодер, работающий во временной области.

12. Аудиокодер по п.1, характеризующийся тем, что селектор импульсов (10) содержит кодер ACELP (10), выполняющий операции LPC-анализа (1000) с целью получения краткосрочного предсказания, определения высоты тона (1002, 1004) с целью получения показателей высоты основного тона и значения выиграша от долгосрочного предсказания, и получения данных кодового словаря с целью определения позиций ряда импульсов для параметрического представления разностного сигнала; селектор импульсов (10) осуществляет управление (1000) кодером ACELP (10) по показателям выигрыша от долгосрочного предсказания позиционируя переменное число импульсов для первого значения выигрыша от долгосрочного предсказания или фиксированное число импульсов для второго значения выигрыша от долгосрочного предсказания, причем, второе значение выигрыша от долгосрочного предсказания больше, чем первое значение выигрыша от долгосрочного предсказания.

13. Аудиокодер по п.12, характеризующийся тем, что максимум переменного числа импульсов равен или меньше фиксированного числа импульсов.

14. Аудиокодер по п.12, характеризующийся тем, что селектор импульсов (10) выполнен с возможностью управления (1000) кодером ACELP, последовательно распределяя импульсы, начиная с малого числа импульсов (1016) и переходя к большему числу импульсов (1020), при этом последовательное размещение импульсов прекращается, если энергия ошибки становится ниже заданного порогового значения энергии (1019).

15. Аудиокодер по п.12, характеризующийся тем, что селектор импульсов (10) выполнен с возможностью управления (1000) кодером ACELP (10) таким образом, что в случае превышения значением выигрыша от долгосрочного предсказания пороговой величины возможные положения импульсов распределяются в виде решетки, которая базируется, по крайней мере, на одной позиции импульса предшествующего фрейма (1013).

16. Аудиокодер по п.3, характеризующийся тем, что кодер импульсов (10b) представляет собой кодер с линейным предсказанием с кодовым возбуждением (CELP), который вычисляет положения импульсов и значения квантованных импульсов, генератор разностного сигнала (26) выполнен с возможностью использования позиции неквантованных импульсов и значения квантованных импульсов для вычисления сигнала, который должен быть вычтен из аудиосигнала (8) для нахождения разностного сигнала.

17. Аудиокодер по п.3, характеризующийся тем, что селектор импульсов предназначен для синтеза линейного предсказания с кодовым возбуждением CELP с целью определения положения неквантованных импульсов в сигнале ошибки предсказания, и в составе которого кодер импульсов (10b) кодирует положение импульса с точностью, превышающей точность данных квантования краткосрочного предсказания.

18. Аудиокодер по п.3, характеризующийся тем, что селектор импульсов (10) предназначен для определения составляющей сигнала как импульсоподобной, генератор разностного сигнала (26) предназначен для замены составляющей акустического сигнала синтезированным сигналом без импульсоподобной составляющей или с усеченной импульсоподобной составляющей.

19. Аудиокодер по п.18, характеризующийся тем, что генератор разностного сигнала (26) предназначен для вычисления синтезированного сигнала путем экстраполяции на основании границы между импульсоподобным и не импульсоподобным сигналом.

20. Аудиокодер по п.18, характеризующийся тем, что генератор разностного сигнала вычисляет синтезированный сигнал путем взвешивания импульсной составляющей аудиосигнала с применением весового коэффициента, меньшего 0,5.

21. Аудиокодер по п.1, характеризующийся тем, что кодер сигнала (16) является аудиокодером с психоакустическим управлением, в котором психоакустический порог маскирования (1500), используемый для квантования звука (1604а), вычисляется по аудиосигналу (8), при этом данный кодер сигнала (16) предназначен для преобразования разностного сигнала в спектральную форму отображения (1600) и квантования (1604а) величины спектрального представления, используя психоакустический порог маскирования (1500).

22. Аудиокодер по п.1, характеризующийся тем, что селектор импульсов (10) предназначен для извлечения из аудиосигнала импульсного сигнала для получения выделенного импульсного сигнала; селектор импульсов (10) с помощью (10c) выделенных импульсоподобных сигналов предназначен для формирования оптимизированного импульсоподобного сигнала, который представляет собой более совершенную форму импульсоподобного сигнала по сравнению с формой выделенного импульсоподобного сигнала; кодер импульсов (10b) предназначен для кодирования оптимизированного импульсоподобного сигнала с целью получения кодированного оптимизированного импульсоподобного сигнала; аудиокодер содержит вычислитель разностного сигнала (26), предназначенный для вычитания импульсоподобного сигнала, или оптимизированного импульсоподобного сигнала, или сигнала, полученного декодированием кодированного оптимизированного импульсоподобного сигнала из аудиосигнала с целью получения разностного сигнала.

23. Аудиокодер по п.1, характеризующийся тем, что селектор импульсов предназначен для извлечения последовательности импульсов; кодер импульсов предназначен для кодирования сигнала последовательности импульсов с более высокой эффективностью или с меньшей ошибкой кодирования, чем сигнал с неимпульсной последовательностью.

24. Способ кодирования аудиосигнала (8), содержащего импульсоподобную составляющую и стационарную составляющую, характеризующийся тем, что включает в себя вычленение (10) из аудиосигнала импульсоподобной составляющей, стадию извлечения, включающую операцию кодирования импульсоподобных составляющих с получением кодированного импульсоподобного сигнала; кодирование (16) разностного сигнала, полученного из аудиосигнала с формированием кодированного разностного сигнала (20), причем разностный сигнал выводится из акустического сигнала так, что импульсоподобная составляющая сокращается или удаляется из аудиосигнала; и вывод (22) для передачи или сохранения в памяти кодированного импульсоподобного сигнала (12) и кодированного разностного сигнала (20) с целью формирования кодированного сигнала (24), при этом операция импульсного кодирования не осуществляется если на стадии извлечения импульса не обнаружено импульсной составляющей в аудиосигнале.

25. Декодер для декодирования кодированного аудиосигнала (24), содержащего закодированный импульсоподобный сигнал (12) и закодированный разностный сигнал (20), характеризующийся тем, что содержит импульсный декодер (30) для декодирования закодированного импульсоподобного сигнала с использованием алгоритма декодирования, соответствующего алгоритму кодирования, использованному для генерации кодированного импульсоподобного сигнала, с формированием декодированного сигнала импульсного типа; декодер сигнала (32) для декодирования закодированного разностного сигнала (20) с использованием алгоритма декодирования, соответствующего алгоритму кодирования, используемому для генерации кодированного разностного сигнала (20), с формированием декодированного разностного сигнала; и комбинатор сигнала (34) для объединения декодированного импульсоподобного сигнала и декодированного разностного сигнала с формированием декодированного выходного сигнала (36), причем декодер сигналов (32) и декодер импульсов (30) генерируют выходные значения, относящиеся к тому же моменту времени, что и декодированный сигнал, причем импульсный декодер (30) получает закодированный импульсоподобный сигнал и формирует декодированный импульсоподобный сигнал в заданные интервалы времени (142), разделенные периодами (143), в которые декодер сигнала генерирует декодированный разностный сигнал, а импульсный декодер (30) не генерирует декодированный сигнал импульсного типа таким образом, что декодированный выходной сигнал имеет периоды (143), в которые декодированный выходной сигнал идентичен декодированному разностному сигналу, а декодированный выходной сигнал имеет определенные временные составляющие (142), в течение которых декодированный выходной сигнал состоит из декодированного разностного сигнала и декодированного импульсоподобного сигнала, или состоит только из декодированного импульсоподобного сигнала.

26. Декодер по п.25, характеризующийся тем, что декодер импульсов (30) представляет собой декодер временной области, а декодер сигнала (32) представляет собой банк фильтров или декодер-преобразователь.

27. Декодер по п.25, характеризующийся тем, что закодированный аудиосигнал содержит служебную информацию (14), включающую в себя характеристики кодирования или декодирования, соответствующие разностному сигналу; комбинатор (34) предназначен для интегрирования декодированного разностного сигнала и декодированного импульсоподобного сигнала в соответствии со служебной информацией (14).

28. Декодер по п.25, характеризующийся тем, что если служебная информация (14) содержит указания на то, что одновременно с импульсоподобной составляющей в разностном сигнале сгенерирован искусственный сигнал, комбинатор (32) выполнен с возможностью блокирования или, по меньшей мере, ослабления декодированного разностного сигнала во время прохождения импульсоподобной составляющей в соответствии со служебной информацией.

29. Декодер по п.25, характеризующийся тем, что если служебная информация указывает, что импульсоподобный сигнал перед вычитанием из аудиосигнала ослаблен согласно коэффициенту ослабления, комбинатор (34) выполнен с возможностью ослабления декодированного разностного сигнала согласно коэффициенту ослабления и использования ослабленного декодированного сигнала для совмещения с декодированным сигналом импульсного типа.

30. Декодер по п.25, характеризующийся тем, что если закодированный сигнал импульсного типа включает в себя сигнал в форме последовательности импульсов, декодер для декодирования (30) закодированного импульсного сигнала выполнен с возможностью использования алгоритма декодирования, соответствующего алгоритму кодирования, причем алгоритм кодирования предусматривает большую эффективность или меньшую ошибку кодирования при кодировании сигнала в виде последовательности импульсов, чем при кодировании сигнала, не являющегося импульсной последовательностью.

31. Способ декодирования кодированного аудиосигнала (24), содержащего закодированный сигнал импульсного типа (12) и закодированный разностный сигнал (20), характеризующийся тем, что декодирование (30) закодированного импульсоподобного сигнала с использованием алгоритма декодирования, соответствующего алгоритму кодирования, предназначено для генерирования кодированного импульсоподобного сигнала с формированием декодированного сигнала импульсного типа; декодирование (32) закодированного разностного сигнала (20) с использованием алгоритма декодирования, соответствующего алгоритму кодирования, предназначено для генерирования закодированного разностного сигнала (20) с формированием декодированного разностного сигнала; совмещение (34) декодированного импульсного сигнала и декодированного разностного сигнала с формированием декодированного выходного сигнала (36), где фазы декодирования (32, 30) формируют выходные значения, относящиеся к тому же моменту времени, что и декодированный сигнал, причем при декодировании (30) закодированного импульсоподобного сигнала импульсоподобный сигнал принимается, и формируется декодированный сигнал импульсного типа в установленные интервалы времени (142), которые разделены периодами (143), в течение которых выполняется декодирование (32) закодированного разностного сигнала, а операция декодирования (30) закодированного сигнала импульсного типа не выполняется, вследствие чего декодированный выходной сигнал имеет периоды (143), в которые декодированный выходной сигнал идентичен декодированному разностному сигналу, а декодированный выходной сигнал имеет определенные интервалы времени (142), в течение которых декодированный выходной сигнал состоит из декодированного разностного сигнала и декодированного импульсоподобного сигнала, или состоит только из импульсоподобного сигнала.

32. Кодированный аудиосигнал (24), характеризующийся тем, что включает закодированный импульсоподобный сигнал (12), закодированный разностный сигнал (20) и служебную информацию (14), содержащую характеристики кодирования или декодирования, относящиеся к закодированному разностному сигналу или к закодированному импульсоподобному сигналу, причем закодированный сигнал импульсного типа содержит заданные временные составляющие (142) аудиосигнала, в которых аудиосигнал представлен только кодированным импульсоподобным сигналом или представлен кодированным разностным сигналом и кодированным импульсоподобным сигналом, при этом заданные временные составляющие (142) разделены периодами (143), в течение которых аудиосигнал представлен только закодированным разностным сигналом, а не закодированным сигналом импульсного типа (12).

33. Компьютерная программа, имеющая программный код, предназначенная для реализации способа в соответствии с пп.24 или 31 с применением вычислительной техники.