RU2009143665A - Аудиокодер для кодирования аудиосигнала, имеющего импульсоподобную и стационарную составляющие, способы кодирования, декодер, способ декодирования и кодированный аудиосигнал - Google Patents
Аудиокодер для кодирования аудиосигнала, имеющего импульсоподобную и стационарную составляющие, способы кодирования, декодер, способ декодирования и кодированный аудиосигнал Download PDFInfo
- Publication number
- RU2009143665A RU2009143665A RU2009143665/09A RU2009143665A RU2009143665A RU 2009143665 A RU2009143665 A RU 2009143665A RU 2009143665/09 A RU2009143665/09 A RU 2009143665/09A RU 2009143665 A RU2009143665 A RU 2009143665A RU 2009143665 A RU2009143665 A RU 2009143665A
- Authority
- RU
- Russia
- Prior art keywords
- signal
- pulse
- audio
- encoded
- encoder
- Prior art date
Links
- 230000005236 sound signal Effects 0.000 title claims abstract 41
- 238000000034 method Methods 0.000 title claims 6
- 230000015572 biosynthetic process Effects 0.000 claims abstract 12
- 230000007774 longterm Effects 0.000 claims 7
- 230000002238 attenuated effect Effects 0.000 claims 2
- 238000000605 extraction Methods 0.000 claims 2
- 230000000873 masking effect Effects 0.000 claims 2
- 230000003595 spectral effect Effects 0.000 claims 2
- 238000003786 synthesis reaction Methods 0.000 claims 2
- 238000004590 computer program Methods 0.000 claims 1
- 230000005284 excitation Effects 0.000 claims 1
- 238000013213 extrapolation Methods 0.000 claims 1
- 230000006870 function Effects 0.000 claims 1
- 238000013139 quantization Methods 0.000 claims 1
- 230000004044 response Effects 0.000 claims 1
- 238000005303 weighing Methods 0.000 claims 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/20—Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Abstract
1. Аудиокодер для кодирования аудиосигнала (8), имеющего импульсоподобную составляющую и стационарную составляющую, характеризующийся тем, что включает селектор импульсов (10), предназначенный для выделения из аудиосигнала импульсоподобной составляющей, имеющий в своем составе кодер импульсов для кодирования импульсоподобных составляющих с формированием кодированных импульсоподобных сигналов; кодер сигналов (16), предназначенный для кодирования разностного сигнала, выделенного из аудиосигнала, с формированием кодированного разностного сигнала (20), извлеченного из аудиосигнала таким образом, что импульсоподобная составляющая сокращается или удаляется из данного аудиосигнала; и выходной интерфейс (22), предназначенный для вывода кодированного импульсоподобного сигнала (12) и кодированного разностного сигнала (20) с формированием кодированного сигнала (24), при этом импульсный кодер импульсов сконфигурирован таким образом, что не кодирует импульсопподобный сигнал в случае когда селектор импульсов не способен обнаружить импульсную составляющую сигнала. ! 2. Аудиокодер по п.1, характеризующийся тем, что включает в свой состав кодер импульсов (10b) и кодер сигналов (16), из которых кодер импульсов (10b) предназначен для импульсоподобных сигналов в большей степени, чем кодер сигналов (16), а кодер сигналов (16) предназначен для стационарных сигналов в большей степени, чем кодер импульсов (10b). ! 3. Аудиокодер по п.1 или 2, характеризующийся тем, что дополнительно включает генератор разностного сигнала (26), предназначенный для получения аудиосигнала (8) и информации (28) о выделенных импульсоподобных составляющих сигнала и для в�
Claims (33)
1. Аудиокодер для кодирования аудиосигнала (8), имеющего импульсоподобную составляющую и стационарную составляющую, характеризующийся тем, что включает селектор импульсов (10), предназначенный для выделения из аудиосигнала импульсоподобной составляющей, имеющий в своем составе кодер импульсов для кодирования импульсоподобных составляющих с формированием кодированных импульсоподобных сигналов; кодер сигналов (16), предназначенный для кодирования разностного сигнала, выделенного из аудиосигнала, с формированием кодированного разностного сигнала (20), извлеченного из аудиосигнала таким образом, что импульсоподобная составляющая сокращается или удаляется из данного аудиосигнала; и выходной интерфейс (22), предназначенный для вывода кодированного импульсоподобного сигнала (12) и кодированного разностного сигнала (20) с формированием кодированного сигнала (24), при этом импульсный кодер импульсов сконфигурирован таким образом, что не кодирует импульсопподобный сигнал в случае когда селектор импульсов не способен обнаружить импульсную составляющую сигнала.
2. Аудиокодер по п.1, характеризующийся тем, что включает в свой состав кодер импульсов (10b) и кодер сигналов (16), из которых кодер импульсов (10b) предназначен для импульсоподобных сигналов в большей степени, чем кодер сигналов (16), а кодер сигналов (16) предназначен для стационарных сигналов в большей степени, чем кодер импульсов (10b).
3. Аудиокодер по п.1 или 2, характеризующийся тем, что дополнительно включает генератор разностного сигнала (26), предназначенный для получения аудиосигнала (8) и информации (28) о выделенных импульсоподобных составляющих сигнала и для вывода разностного сигнала (18), который не содержит выделенные составляющие сигнала.
4. Аудиокодер по п.3, характеризующийся тем, что генератор разностного сигнала (26) включает вычитающее устройство (26а) для вычитания извлеченных составляющих (28) аудиосигнала (8) с формированием разностного сигнала (18).
5. Аудиокодер по п.3, характеризующийся тем, что селектор импульсов (10) предназначен для извлечения параметрического представления импульсоподобных составляющих сигнала; и генератор разностного сигнала (26) предназначен для синтезирования (26c) формы сигнала с использованием параметрического представления, и для вычитания (26а) формы сигнала из аудиосигнала (8).
6. Аудиокодер по п.3, характеризующийся тем, что генератор разностного сигнала (26) содержит импульсный декодер (26c), предназначенный для вычисления декодированного импульсоподобного сигнала, и вычитающее устройство (26а), предназначенное для вычитания декодированного импульсоподобного сигнала из аудиосигнала (8).
7. Аудиокодер по п.3, характеризующийся тем, что селектор импульсов (10) включает блок (10а) для выполнения LPC анализа аудиосигнала (8), с возможностью получения прогноза сигнала ошибки (84), селектор импульсов (10) включает процессор сигнала ошибки предсказания (10c), предназначенный для обработки сигнала ошибки предсказания с улучшением импульсоподобной характеристики этого сигнала, генератор разностного сигнала (26) предназначен для LPC синтеза (26b) с учетом оптимизированного сигнала ошибки предсказания и для вычитания из аудиосигнала сигнала, полученного в результате синтеза LPC, с получением разностного сигнала (18).
8. Аудиокодер по п.1, характеризующийся тем, что селектор импульсов (10) включает блок (1300) принятия решения импульс/не импульс, и который выполняет функцию идентификации импульсоподобной составляющей аудиосигнала и передачи ее на кодер импульсов (10b), но не на кодер сигнала (16).
9. Аудиокодер по п.1, характеризующийся тем, что блок принятия решения импульс/не импульс выполнен с возможностью распознавания вокализованного/невокализованного сигнала.
10. Аудиокодер по п.1, характеризующийся тем, что аудиосигнал имеет формантную структуру и тонкую структуру; селектор импульсов (10) выполнен с возможностью преобразования аудиосигнала таким образом, что обработанный аудиосигнал реконструирует только тонкую структуру, и, кроме того, данный селектор импульсов при преобразовании сигнала тонкой структуры оптимизирует импульсную характеристику сигнала тонкой структуры (10c); оптимизированный сигнал тонкой структуры кодируется кодером импульсов (10b).
11. Аудиокодер по п.1, характеризующийся тем, что кодер сигнала (16) представляет собой кодер-преобразователь или кодер на базе банков фильтров общего назначения, а кодер импульсов представляет собой кодер, работающий во временной области.
12. Аудиокодер по п.1, характеризующийся тем, что селектор импульсов (10) содержит кодер ACELP (10), выполняющий операции LPC-анализа (1000) с целью получения краткосрочного предсказания, определения высоты тона (1002, 1004) с целью получения показателей высоты основного тона и значения выиграша от долгосрочного предсказания, и получения данных кодового словаря с целью определения позиций ряда импульсов для параметрического представления разностного сигнала; селектор импульсов (10) осуществляет управление (1000) кодером ACELP (10) по показателям выигрыша от долгосрочного предсказания позиционируя переменное число импульсов для первого значения выигрыша от долгосрочного предсказания или фиксированное число импульсов для второго значения выигрыша от долгосрочного предсказания, причем, второе значение выигрыша от долгосрочного предсказания больше, чем первое значение выигрыша от долгосрочного предсказания.
13. Аудиокодер по п.12, характеризующийся тем, что максимум переменного числа импульсов равен или меньше фиксированного числа импульсов.
14. Аудиокодер по п.12, характеризующийся тем, что селектор импульсов (10) выполнен с возможностью управления (1000) кодером ACELP, последовательно распределяя импульсы, начиная с малого числа импульсов (1016) и переходя к большему числу импульсов (1020), при этом последовательное размещение импульсов прекращается, если энергия ошибки становится ниже заданного порогового значения энергии (1019).
15. Аудиокодер по п.12, характеризующийся тем, что селектор импульсов (10) выполнен с возможностью управления (1000) кодером ACELP (10) таким образом, что в случае превышения значением выигрыша от долгосрочного предсказания пороговой величины возможные положения импульсов распределяются в виде решетки, которая базируется, по крайней мере, на одной позиции импульса предшествующего фрейма (1013).
16. Аудиокодер по п.3, характеризующийся тем, что кодер импульсов (10b) представляет собой кодер с линейным предсказанием с кодовым возбуждением (CELP), который вычисляет положения импульсов и значения квантованных импульсов, генератор разностного сигнала (26) выполнен с возможностью использования позиции неквантованных импульсов и значения квантованных импульсов для вычисления сигнала, который должен быть вычтен из аудиосигнала (8) для нахождения разностного сигнала.
17. Аудиокодер по п.3, характеризующийся тем, что селектор импульсов предназначен для синтеза линейного предсказания с кодовым возбуждением CELP с целью определения положения неквантованных импульсов в сигнале ошибки предсказания, и в составе которого кодер импульсов (10b) кодирует положение импульса с точностью, превышающей точность данных квантования краткосрочного предсказания.
18. Аудиокодер по п.3, характеризующийся тем, что селектор импульсов (10) предназначен для определения составляющей сигнала как импульсоподобной, генератор разностного сигнала (26) предназначен для замены составляющей акустического сигнала синтезированным сигналом без импульсоподобной составляющей или с усеченной импульсоподобной составляющей.
19. Аудиокодер по п.18, характеризующийся тем, что генератор разностного сигнала (26) предназначен для вычисления синтезированного сигнала путем экстраполяции на основании границы между импульсоподобным и не импульсоподобным сигналом.
20. Аудиокодер по п.18, характеризующийся тем, что генератор разностного сигнала вычисляет синтезированный сигнал путем взвешивания импульсной составляющей аудиосигнала с применением весового коэффициента, меньшего 0,5.
21. Аудиокодер по п.1, характеризующийся тем, что кодер сигнала (16) является аудиокодером с психоакустическим управлением, в котором психоакустический порог маскирования (1500), используемый для квантования звука (1604а), вычисляется по аудиосигналу (8), при этом данный кодер сигнала (16) предназначен для преобразования разностного сигнала в спектральную форму отображения (1600) и квантования (1604а) величины спектрального представления, используя психоакустический порог маскирования (1500).
22. Аудиокодер по п.1, характеризующийся тем, что селектор импульсов (10) предназначен для извлечения из аудиосигнала импульсного сигнала для получения выделенного импульсного сигнала; селектор импульсов (10) с помощью (10c) выделенных импульсоподобных сигналов предназначен для формирования оптимизированного импульсоподобного сигнала, который представляет собой более совершенную форму импульсоподобного сигнала по сравнению с формой выделенного импульсоподобного сигнала; кодер импульсов (10b) предназначен для кодирования оптимизированного импульсоподобного сигнала с целью получения кодированного оптимизированного импульсоподобного сигнала; аудиокодер содержит вычислитель разностного сигнала (26), предназначенный для вычитания импульсоподобного сигнала, или оптимизированного импульсоподобного сигнала, или сигнала, полученного декодированием кодированного оптимизированного импульсоподобного сигнала из аудиосигнала с целью получения разностного сигнала.
23. Аудиокодер по п.1, характеризующийся тем, что селектор импульсов предназначен для извлечения последовательности импульсов; кодер импульсов предназначен для кодирования сигнала последовательности импульсов с более высокой эффективностью или с меньшей ошибкой кодирования, чем сигнал с неимпульсной последовательностью.
24. Способ кодирования аудиосигнала (8), содержащего импульсоподобную составляющую и стационарную составляющую, характеризующийся тем, что включает в себя вычленение (10) из аудиосигнала импульсоподобной составляющей, стадию извлечения, включающую операцию кодирования импульсоподобных составляющих с получением кодированного импульсоподобного сигнала; кодирование (16) разностного сигнала, полученного из аудиосигнала с формированием кодированного разностного сигнала (20), причем разностный сигнал выводится из акустического сигнала так, что импульсоподобная составляющая сокращается или удаляется из аудиосигнала; и вывод (22) для передачи или сохранения в памяти кодированного импульсоподобного сигнала (12) и кодированного разностного сигнала (20) с целью формирования кодированного сигнала (24), при этом операция импульсного кодирования не осуществляется если на стадии извлечения импульса не обнаружено импульсной составляющей в аудиосигнале.
25. Декодер для декодирования кодированного аудиосигнала (24), содержащего закодированный импульсоподобный сигнал (12) и закодированный разностный сигнал (20), характеризующийся тем, что содержит импульсный декодер (30) для декодирования закодированного импульсоподобного сигнала с использованием алгоритма декодирования, соответствующего алгоритму кодирования, использованному для генерации кодированного импульсоподобного сигнала, с формированием декодированного сигнала импульсного типа; декодер сигнала (32) для декодирования закодированного разностного сигнала (20) с использованием алгоритма декодирования, соответствующего алгоритму кодирования, используемому для генерации кодированного разностного сигнала (20), с формированием декодированного разностного сигнала; и комбинатор сигнала (34) для объединения декодированного импульсоподобного сигнала и декодированного разностного сигнала с формированием декодированного выходного сигнала (36), причем декодер сигналов (32) и декодер импульсов (30) генерируют выходные значения, относящиеся к тому же моменту времени, что и декодированный сигнал, причем импульсный декодер (30) получает закодированный импульсоподобный сигнал и формирует декодированный импульсоподобный сигнал в заданные интервалы времени (142), разделенные периодами (143), в которые декодер сигнала генерирует декодированный разностный сигнал, а импульсный декодер (30) не генерирует декодированный сигнал импульсного типа таким образом, что декодированный выходной сигнал имеет периоды (143), в которые декодированный выходной сигнал идентичен декодированному разностному сигналу, а декодированный выходной сигнал имеет определенные временные составляющие (142), в течение которых декодированный выходной сигнал состоит из декодированного разностного сигнала и декодированного импульсоподобного сигнала, или состоит только из декодированного импульсоподобного сигнала.
26. Декодер по п.25, характеризующийся тем, что декодер импульсов (30) представляет собой декодер временной области, а декодер сигнала (32) представляет собой банк фильтров или декодер-преобразователь.
27. Декодер по п.25, характеризующийся тем, что закодированный аудиосигнал содержит служебную информацию (14), включающую в себя характеристики кодирования или декодирования, соответствующие разностному сигналу; комбинатор (34) предназначен для интегрирования декодированного разностного сигнала и декодированного импульсоподобного сигнала в соответствии со служебной информацией (14).
28. Декодер по п.25, характеризующийся тем, что если служебная информация (14) содержит указания на то, что одновременно с импульсоподобной составляющей в разностном сигнале сгенерирован искусственный сигнал, комбинатор (32) выполнен с возможностью блокирования или, по меньшей мере, ослабления декодированного разностного сигнала во время прохождения импульсоподобной составляющей в соответствии со служебной информацией.
29. Декодер по п.25, характеризующийся тем, что если служебная информация указывает, что импульсоподобный сигнал перед вычитанием из аудиосигнала ослаблен согласно коэффициенту ослабления, комбинатор (34) выполнен с возможностью ослабления декодированного разностного сигнала согласно коэффициенту ослабления и использования ослабленного декодированного сигнала для совмещения с декодированным сигналом импульсного типа.
30. Декодер по п.25, характеризующийся тем, что если закодированный сигнал импульсного типа включает в себя сигнал в форме последовательности импульсов, декодер для декодирования (30) закодированного импульсного сигнала выполнен с возможностью использования алгоритма декодирования, соответствующего алгоритму кодирования, причем алгоритм кодирования предусматривает большую эффективность или меньшую ошибку кодирования при кодировании сигнала в виде последовательности импульсов, чем при кодировании сигнала, не являющегося импульсной последовательностью.
31. Способ декодирования кодированного аудиосигнала (24), содержащего закодированный сигнал импульсного типа (12) и закодированный разностный сигнал (20), характеризующийся тем, что декодирование (30) закодированного импульсоподобного сигнала с использованием алгоритма декодирования, соответствующего алгоритму кодирования, предназначено для генерирования кодированного импульсоподобного сигнала с формированием декодированного сигнала импульсного типа; декодирование (32) закодированного разностного сигнала (20) с использованием алгоритма декодирования, соответствующего алгоритму кодирования, предназначено для генерирования закодированного разностного сигнала (20) с формированием декодированного разностного сигнала; совмещение (34) декодированного импульсного сигнала и декодированного разностного сигнала с формированием декодированного выходного сигнала (36), где фазы декодирования (32, 30) формируют выходные значения, относящиеся к тому же моменту времени, что и декодированный сигнал, причем при декодировании (30) закодированного импульсоподобного сигнала импульсоподобный сигнал принимается, и формируется декодированный сигнал импульсного типа в установленные интервалы времени (142), которые разделены периодами (143), в течение которых выполняется декодирование (32) закодированного разностного сигнала, а операция декодирования (30) закодированного сигнала импульсного типа не выполняется, вследствие чего декодированный выходной сигнал имеет периоды (143), в которые декодированный выходной сигнал идентичен декодированному разностному сигналу, а декодированный выходной сигнал имеет определенные интервалы времени (142), в течение которых декодированный выходной сигнал состоит из декодированного разностного сигнала и декодированного импульсоподобного сигнала, или состоит только из импульсоподобного сигнала.
32. Кодированный аудиосигнал (24), характеризующийся тем, что включает закодированный импульсоподобный сигнал (12), закодированный разностный сигнал (20) и служебную информацию (14), содержащую характеристики кодирования или декодирования, относящиеся к закодированному разностному сигналу или к закодированному импульсоподобному сигналу, причем закодированный сигнал импульсного типа содержит заданные временные составляющие (142) аудиосигнала, в которых аудиосигнал представлен только кодированным импульсоподобным сигналом или представлен кодированным разностным сигналом и кодированным импульсоподобным сигналом, при этом заданные временные составляющие (142) разделены периодами (143), в течение которых аудиосигнал представлен только закодированным разностным сигналом, а не закодированным сигналом импульсного типа (12).
33. Компьютерная программа, имеющая программный код, предназначенная для реализации способа в соответствии с пп.24 или 31 с применением вычислительной техники.
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US94325307P | 2007-06-11 | 2007-06-11 | |
US60/943,253 | 2007-06-11 | ||
US94350507P | 2007-06-12 | 2007-06-12 | |
US60/943,505 | 2007-06-12 |
Publications (2)
Publication Number | Publication Date |
---|---|
RU2009143665A true RU2009143665A (ru) | 2011-07-27 |
RU2439721C2 RU2439721C2 (ru) | 2012-01-10 |
Family
ID=39709533
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2009143665/09A RU2439721C2 (ru) | 2007-06-11 | 2008-06-05 | Аудиокодер для кодирования аудиосигнала, имеющего импульсоподобную и стационарную составляющие, способы кодирования, декодер, способ декодирования и кодированный аудиосигнал |
Country Status (17)
Country | Link |
---|---|
US (1) | US8706480B2 (ru) |
EP (1) | EP2165328B1 (ru) |
JP (1) | JP5686369B2 (ru) |
KR (1) | KR101196506B1 (ru) |
CN (1) | CN101743586B (ru) |
AR (1) | AR066959A1 (ru) |
AU (1) | AU2008261287B2 (ru) |
BR (1) | BRPI0811384A2 (ru) |
CA (1) | CA2691993C (ru) |
ES (1) | ES2663269T3 (ru) |
MX (1) | MX2009013519A (ru) |
MY (1) | MY146431A (ru) |
PL (1) | PL2165328T3 (ru) |
PT (1) | PT2165328T (ru) |
RU (1) | RU2439721C2 (ru) |
TW (1) | TWI371744B (ru) |
WO (1) | WO2008151755A1 (ru) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10586548B2 (en) | 2014-03-14 | 2020-03-10 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Encoder, decoder and method for encoding and decoding |
Families Citing this family (73)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8326614B2 (en) * | 2005-09-02 | 2012-12-04 | Qnx Software Systems Limited | Speech enhancement system |
US7720677B2 (en) * | 2005-11-03 | 2010-05-18 | Coding Technologies Ab | Time warped modified transform coding of audio signals |
EP1852848A1 (en) * | 2006-05-05 | 2007-11-07 | Deutsche Thomson-Brandt GmbH | Method and apparatus for lossless encoding of a source signal using a lossy encoded data stream and a lossless extension data stream |
EP2171713B1 (fr) * | 2007-06-15 | 2011-03-16 | France Telecom | Codage de signaux audionumériques |
US20090006081A1 (en) * | 2007-06-27 | 2009-01-01 | Samsung Electronics Co., Ltd. | Method, medium and apparatus for encoding and/or decoding signal |
US8566107B2 (en) | 2007-10-15 | 2013-10-22 | Lg Electronics Inc. | Multi-mode method and an apparatus for processing a signal |
KR101756834B1 (ko) * | 2008-07-14 | 2017-07-12 | 삼성전자주식회사 | 오디오/스피치 신호의 부호화 및 복호화 방법 및 장치 |
SG174207A1 (en) * | 2009-03-03 | 2011-10-28 | Agency Science Tech & Res | Methods for determining whether a signal includes a wanted signal and apparatuses configured to determine whether a signal includes a wanted signal |
CN101931414B (zh) | 2009-06-19 | 2013-04-24 | 华为技术有限公司 | 脉冲编码方法及装置、脉冲解码方法及装置 |
US9753884B2 (en) | 2009-09-30 | 2017-09-05 | Microsoft Technology Licensing, Llc | Radio-control board for software-defined radio platform |
ES2441069T3 (es) * | 2009-10-08 | 2014-01-31 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Decodificador multimodo para señal de audio, codificador multimodo para señal de audio, procedimiento y programa de computación que usan un modelado de ruido en base a linealidad-predicción-codificación |
MX2012004648A (es) * | 2009-10-20 | 2012-05-29 | Fraunhofer Ges Forschung | Codificacion de señal de audio, decodificador de señal de audio, metodo para codificar o decodificar una señal de audio utilizando una cancelacion del tipo aliasing. |
PT2491553T (pt) | 2009-10-20 | 2017-01-20 | Fraunhofer Ges Forschung | Codificador de áudio, descodificador de áudio, método para codificar uma informação de áudio, método para descodificar uma informação de áudio e programa de computador que utiliza uma redução iterativa de tamanho de intervalo |
WO2011059254A2 (en) * | 2009-11-12 | 2011-05-19 | Lg Electronics Inc. | An apparatus for processing a signal and method thereof |
EP2510515B1 (en) | 2009-12-07 | 2014-03-19 | Dolby Laboratories Licensing Corporation | Decoding of multichannel audio encoded bit streams using adaptive hybrid transformation |
MX2012008075A (es) | 2010-01-12 | 2013-12-16 | Fraunhofer Ges Forschung | Codificador de audio, decodificador de audio, metodo para codificar e informacion de audio, metodo para decodificar una informacion de audio y programa de computacion utilizando una modificacion de una representacion de un numero de un valor de contexto numerico previo. |
US9075446B2 (en) | 2010-03-15 | 2015-07-07 | Qualcomm Incorporated | Method and apparatus for processing and reconstructing data |
EP3422346B1 (en) | 2010-07-02 | 2020-04-22 | Dolby International AB | Audio encoding with decision about the application of postfiltering when decoding |
EP4372742A2 (en) * | 2010-07-08 | 2024-05-22 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Coder using forward aliasing cancellation |
US9136980B2 (en) | 2010-09-10 | 2015-09-15 | Qualcomm Incorporated | Method and apparatus for low complexity compression of signals |
AR085794A1 (es) | 2011-02-14 | 2013-10-30 | Fraunhofer Ges Forschung | Prediccion lineal basada en esquema de codificacion utilizando conformacion de ruido de dominio espectral |
PT3239978T (pt) | 2011-02-14 | 2019-04-02 | Fraunhofer Ges Forschung | Codificação e descodificação de posições de pulso de faixas de um sinal de áudio |
PL2676268T3 (pl) | 2011-02-14 | 2015-05-29 | Fraunhofer Ges Forschung | Urządzenie i sposób przetwarzania zdekodowanego sygnału audio w domenie widmowej |
KR101424372B1 (ko) * | 2011-02-14 | 2014-08-01 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 랩핑 변환을 이용한 정보 신호 표현 |
PT2676270T (pt) | 2011-02-14 | 2017-05-02 | Fraunhofer Ges Forschung | Codificação de uma parte de um sinal de áudio utilizando uma deteção de transiente e um resultado de qualidade |
US9142220B2 (en) | 2011-03-25 | 2015-09-22 | The Intellisis Corporation | Systems and methods for reconstructing an audio signal from transformed audio information |
US8929933B2 (en) | 2011-05-04 | 2015-01-06 | Microsoft Corporation | Spectrum allocation for base station |
JP5752324B2 (ja) * | 2011-07-07 | 2015-07-22 | ニュアンス コミュニケーションズ, インコーポレイテッド | 雑音の入った音声信号中のインパルス性干渉の単一チャネル抑制 |
US8620646B2 (en) | 2011-08-08 | 2013-12-31 | The Intellisis Corporation | System and method for tracking sound pitch across an audio signal using harmonic envelope |
US8548803B2 (en) | 2011-08-08 | 2013-10-01 | The Intellisis Corporation | System and method of processing a sound signal including transforming the sound signal into a frequency-chirp domain |
US9183850B2 (en) * | 2011-08-08 | 2015-11-10 | The Intellisis Corporation | System and method for tracking sound pitch across an audio signal |
CN102419978B (zh) * | 2011-08-23 | 2013-03-27 | 展讯通信(上海)有限公司 | 音频解码器、音频解码的频谱重构方法及装置 |
JPWO2013061584A1 (ja) * | 2011-10-28 | 2015-04-02 | パナソニック株式会社 | 音信号ハイブリッドデコーダ、音信号ハイブリッドエンコーダ、音信号復号方法、及び音信号符号化方法 |
US9130711B2 (en) * | 2011-11-10 | 2015-09-08 | Microsoft Technology Licensing, Llc | Mapping signals from a virtual frequency band to physical frequency bands |
RU2505921C2 (ru) * | 2012-02-02 | 2014-01-27 | Корпорация "САМСУНГ ЭЛЕКТРОНИКС Ко., Лтд." | Способ и устройство кодирования и декодирования аудиосигналов (варианты) |
US20130211846A1 (en) * | 2012-02-14 | 2013-08-15 | Motorola Mobility, Inc. | All-pass filter phase linearization of elliptic filters in signal decimation and interpolation for an audio codec |
US9015044B2 (en) * | 2012-03-05 | 2015-04-21 | Malaspina Labs (Barbados) Inc. | Formant based speech reconstruction from noisy signals |
US9728200B2 (en) * | 2013-01-29 | 2017-08-08 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for adaptive formant sharpening in linear prediction coding |
KR101737254B1 (ko) | 2013-01-29 | 2017-05-17 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 오디오 신호, 디코더, 인코더, 시스템 및 컴퓨터 프로그램을 합성하기 위한 장치 및 방법 |
MX346012B (es) * | 2013-01-29 | 2017-02-28 | Fraunhofer Ges Forschung | Aparato y metodo para procesar una señal codificada y codificador y metodo par a generar una señal codificada. |
KR102150496B1 (ko) * | 2013-04-05 | 2020-09-01 | 돌비 인터네셔널 에이비 | 오디오 인코더 및 디코더 |
ES2688134T3 (es) | 2013-04-05 | 2018-10-31 | Dolby International Ab | Codificador y decodificador de audio para codificación de forma de onda intercalada |
EP2992605B1 (en) * | 2013-04-29 | 2017-06-07 | Dolby Laboratories Licensing Corporation | Frequency band compression with dynamic thresholds |
SG11201510164RA (en) | 2013-06-10 | 2016-01-28 | Fraunhofer Ges Forschung | Apparatus and method for audio signal envelope encoding, processing and decoding by splitting the audio signal envelope employing distribution quantization and coding |
PT3008726T (pt) | 2013-06-10 | 2017-11-24 | Fraunhofer Ges Forschung | Aparelho e método de codificação, processamento e descodificação de envelope de sinal de áudio por modelação da representação de soma cumulativa empregando codificação e quantização de distribuição |
FR3008533A1 (fr) * | 2013-07-12 | 2015-01-16 | Orange | Facteur d'echelle optimise pour l'extension de bande de frequence dans un decodeur de signaux audiofrequences |
EP2830047A1 (en) * | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for low delay object metadata coding |
EP2830050A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for enhanced spatial audio object coding |
EP2830045A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Concept for audio encoding and decoding for audio channels and audio objects |
US9418671B2 (en) * | 2013-08-15 | 2016-08-16 | Huawei Technologies Co., Ltd. | Adaptive high-pass post-filter |
KR101849613B1 (ko) | 2013-10-18 | 2018-04-18 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 스피치 관련 스펙트럼 정형 정보를 사용하는 오디오 신호의 인코딩 및 오디오 신호의 디코딩을 위한 개념 |
AU2014336357B2 (en) | 2013-10-18 | 2017-04-13 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Concept for encoding an audio signal and decoding an audio signal using deterministic and noise like information |
US10204630B2 (en) * | 2013-10-22 | 2019-02-12 | Electronics And Telecommunications Research Instit Ute | Method for generating filter for audio signal and parameterizing device therefor |
CN103761969B (zh) * | 2014-02-20 | 2016-09-14 | 武汉大学 | 基于高斯混合模型的感知域音频编码方法及系统 |
US9959876B2 (en) | 2014-05-16 | 2018-05-01 | Qualcomm Incorporated | Closed loop quantization of higher order ambisonic coefficients |
US9626983B2 (en) * | 2014-06-26 | 2017-04-18 | Qualcomm Incorporated | Temporal gain adjustment based on high-band signal characteristic |
PT3000110T (pt) * | 2014-07-28 | 2017-02-15 | Fraunhofer Ges Forschung | Seleção de um de entre um primeiro algoritmo de codificação e um segundo algoritmo de codificação com o uso de redução de harmônicos. |
EP2980794A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder and decoder using a frequency domain processor and a time domain processor |
EP2980790A1 (en) * | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for comfort noise generation mode selection |
EP2980795A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoding and decoding using a frequency domain processor, a time domain processor and a cross processor for initialization of the time domain processor |
CN107210029B (zh) * | 2014-12-11 | 2020-07-17 | 优博肖德Ug公司 | 用于处理一连串信号以进行复调音符辨识的方法和装置 |
US9842611B2 (en) | 2015-02-06 | 2017-12-12 | Knuedge Incorporated | Estimating pitch using peak-to-peak distances |
US9870785B2 (en) | 2015-02-06 | 2018-01-16 | Knuedge Incorporated | Determining features of harmonic signals |
US9922668B2 (en) | 2015-02-06 | 2018-03-20 | Knuedge Incorporated | Estimating fractional chirp rate with multiple frequency representations |
US10861475B2 (en) * | 2015-11-10 | 2020-12-08 | Dolby International Ab | Signal-dependent companding system and method to reduce quantization noise |
SG11201806256SA (en) * | 2016-01-22 | 2018-08-30 | Fraunhofer Ges Forschung | Apparatus and method for mdct m/s stereo with global ild with improved mid/side decision |
CN111210832B (zh) * | 2018-11-22 | 2024-06-04 | 广州广晟数码技术有限公司 | 基于频谱包络模板的带宽扩展音频编解码方法及装置 |
RU2701491C1 (ru) * | 2019-03-21 | 2019-09-26 | Общество С Ограниченной Ответственностью "Ржн" | Способ распознавания кодового сигнала на фоне аддитивных помех |
CN110070878B (zh) * | 2019-03-26 | 2021-05-04 | 苏州科达科技股份有限公司 | 音频码流的解码方法及电子设备 |
CN116978387A (zh) | 2019-07-02 | 2023-10-31 | 杜比国际公司 | 用于离散指向性数据的表示、编码和解码的方法、设备和系统 |
US11043203B2 (en) * | 2019-09-27 | 2021-06-22 | Eventide Inc. | Mode selection for modal reverb |
US11694692B2 (en) | 2020-11-11 | 2023-07-04 | Bank Of America Corporation | Systems and methods for audio enhancement and conversion |
EP4120257A1 (en) * | 2021-07-14 | 2023-01-18 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Coding and decocidng of pulse and residual parts of an audio signal |
Family Cites Families (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4026A (en) * | 1845-05-01 | Xpump | ||
JPH0333900A (ja) * | 1989-06-30 | 1991-02-14 | Fujitsu Ltd | 音声符号化方式 |
CA2019801C (en) | 1989-06-28 | 1994-05-31 | Tomohiko Taniguchi | System for speech coding and an apparatus for the same |
US5235670A (en) * | 1990-10-03 | 1993-08-10 | Interdigital Patents Corporation | Multiple impulse excitation speech encoder and decoder |
FR2729245B1 (fr) | 1995-01-06 | 1997-04-11 | Lamblin Claude | Procede de codage de parole a prediction lineaire et excitation par codes algebriques |
JPH1051315A (ja) * | 1996-07-29 | 1998-02-20 | Takayoshi Hirata | 代用インパルス波形による信号波形の伝送および記録方式 |
US6134518A (en) * | 1997-03-04 | 2000-10-17 | International Business Machines Corporation | Digital audio signal coding using a CELP coder and a transform coder |
JP4173940B2 (ja) * | 1999-03-05 | 2008-10-29 | 松下電器産業株式会社 | 音声符号化装置及び音声符号化方法 |
EP1187337B1 (en) | 1999-04-19 | 2008-01-02 | Fujitsu Limited | Speech coding processor and speech coding method |
US6757654B1 (en) * | 2000-05-11 | 2004-06-29 | Telefonaktiebolaget Lm Ericsson | Forward error correction in speech coding |
US6968309B1 (en) * | 2000-10-31 | 2005-11-22 | Nokia Mobile Phones Ltd. | Method and system for speech frame error concealment in speech decoding |
US6789059B2 (en) | 2001-06-06 | 2004-09-07 | Qualcomm Incorporated | Reducing memory requirements of a codebook vector search |
JP4622164B2 (ja) | 2001-06-15 | 2011-02-02 | ソニー株式会社 | 音響信号符号化方法及び装置 |
US7272555B2 (en) | 2001-09-13 | 2007-09-18 | Industrial Technology Research Institute | Fine granularity scalability speech coding for multi-pulses CELP-based algorithm |
CN1266673C (zh) * | 2002-03-12 | 2006-07-26 | 诺基亚有限公司 | 可伸缩音频编码的有效改进 |
EP1489599B1 (en) * | 2002-04-26 | 2016-05-11 | Panasonic Intellectual Property Corporation of America | Coding device and decoding device |
KR100462611B1 (ko) | 2002-06-27 | 2004-12-20 | 삼성전자주식회사 | 하모닉 성분을 이용한 오디오 코딩방법 및 장치 |
US7191136B2 (en) * | 2002-10-01 | 2007-03-13 | Ibiquity Digital Corporation | Efficient coding of high frequency signal information in a signal using a linear/non-linear prediction model based on a low pass baseband |
CA2501368C (en) | 2002-10-11 | 2013-06-25 | Nokia Corporation | Methods and devices for source controlled variable bit-rate wideband speech coding |
AU2003208517A1 (en) | 2003-03-11 | 2004-09-30 | Nokia Corporation | Switching between coding schemes |
WO2004097796A1 (ja) * | 2003-04-30 | 2004-11-11 | Matsushita Electric Industrial Co., Ltd. | 音声符号化装置、音声復号化装置及びこれらの方法 |
GB2403634B (en) | 2003-06-30 | 2006-11-29 | Nokia Corp | An audio encoder |
US7739120B2 (en) * | 2004-05-17 | 2010-06-15 | Nokia Corporation | Selection of coding models for encoding an audio signal |
CN101124626B (zh) | 2004-09-17 | 2011-07-06 | 皇家飞利浦电子股份有限公司 | 用于最小化感知失真的组合音频编码 |
BRPI0611430A2 (pt) * | 2005-05-11 | 2010-11-23 | Matsushita Electric Ind Co Ltd | codificador, decodificador e seus métodos |
ES2592416T3 (es) * | 2008-07-17 | 2016-11-30 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Esquema de codificación/decodificación de audio que tiene una derivación conmutable |
-
2008
- 2008-06-05 PL PL08759046T patent/PL2165328T3/pl unknown
- 2008-06-05 ES ES08759046.9T patent/ES2663269T3/es active Active
- 2008-06-05 BR BRPI0811384A patent/BRPI0811384A2/pt not_active Application Discontinuation
- 2008-06-05 CN CN2008800196999A patent/CN101743586B/zh active Active
- 2008-06-05 KR KR1020097025997A patent/KR101196506B1/ko active IP Right Grant
- 2008-06-05 MX MX2009013519A patent/MX2009013519A/es active IP Right Grant
- 2008-06-05 AU AU2008261287A patent/AU2008261287B2/en active Active
- 2008-06-05 JP JP2010511528A patent/JP5686369B2/ja active Active
- 2008-06-05 RU RU2009143665/09A patent/RU2439721C2/ru active
- 2008-06-05 WO PCT/EP2008/004496 patent/WO2008151755A1/en active Application Filing
- 2008-06-05 PT PT87590469T patent/PT2165328T/pt unknown
- 2008-06-05 MY MYPI20095103A patent/MY146431A/en unknown
- 2008-06-05 EP EP08759046.9A patent/EP2165328B1/en active Active
- 2008-06-05 CA CA2691993A patent/CA2691993C/en active Active
- 2008-06-05 US US12/663,828 patent/US8706480B2/en active Active
- 2008-06-11 AR ARP080102482A patent/AR066959A1/es active IP Right Grant
- 2008-06-11 TW TW097121819A patent/TWI371744B/zh active
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10586548B2 (en) | 2014-03-14 | 2020-03-10 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Encoder, decoder and method for encoding and decoding |
Also Published As
Publication number | Publication date |
---|---|
CN101743586A (zh) | 2010-06-16 |
ES2663269T3 (es) | 2018-04-11 |
AR066959A1 (es) | 2009-09-23 |
US8706480B2 (en) | 2014-04-22 |
MX2009013519A (es) | 2010-01-18 |
EP2165328A1 (en) | 2010-03-24 |
MY146431A (en) | 2012-08-15 |
TW200912896A (en) | 2009-03-16 |
KR101196506B1 (ko) | 2012-11-01 |
AU2008261287A1 (en) | 2008-12-18 |
TWI371744B (en) | 2012-09-01 |
EP2165328B1 (en) | 2018-01-17 |
WO2008151755A1 (en) | 2008-12-18 |
PL2165328T3 (pl) | 2018-06-29 |
JP2010530079A (ja) | 2010-09-02 |
JP5686369B2 (ja) | 2015-03-18 |
CA2691993C (en) | 2015-01-27 |
US20100262420A1 (en) | 2010-10-14 |
AU2008261287B2 (en) | 2010-12-16 |
BRPI0811384A2 (pt) | 2017-08-01 |
RU2439721C2 (ru) | 2012-01-10 |
CN101743586B (zh) | 2012-10-17 |
CA2691993A1 (en) | 2008-12-18 |
KR20100024414A (ko) | 2010-03-05 |
PT2165328T (pt) | 2018-04-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2009143665A (ru) | Аудиокодер для кодирования аудиосигнала, имеющего импульсоподобную и стационарную составляющие, способы кодирования, декодер, способ декодирования и кодированный аудиосигнал | |
KR100911426B1 (ko) | 무반복 전역 펄스 교체를 통한 고정 코드북 검색 방법 및이를 이용한 음성 부호화기 | |
US20070282603A1 (en) | Methods and Devices for Low-Frequency Emphasis During Audio Compression Based on Acelp/Tcx | |
RU2646357C2 (ru) | Принцип для кодирования аудиосигнала и декодирования аудиосигнала с использованием информации формирования речевого спектра | |
JP3180762B2 (ja) | 音声符号化装置及び音声復号化装置 | |
USRE43099E1 (en) | Speech coder methods and systems | |
KR101931273B1 (ko) | 결정론적 및 잡음 유사 정보를 사용하는 오디오 신호의 인코딩 및 오디오 신호의 디코딩을 위한 개념 | |
KR20240010550A (ko) | 선형예측계수 양자화방법 및 장치와 역양자화 방법 및 장치 | |
KR19980070294A (ko) | 개선된 멀티모달 코드-여기된 선형 예측(celp)코더 및 방법 | |
JP2008503786A (ja) | オーディオ信号の符号化及び復号化 | |
CN101388214B (zh) | 一种变速率的声码器及其编码方法 | |
EP0810584A2 (en) | Signal coder | |
JPH09258795A (ja) | ディジタルフィルタおよび音響符号化/復号化装置 | |
WO2004090864A2 (en) | Method and apparatus for the encoding and decoding of speech | |
Stachurski et al. | High quality MELP coding at bit-rates around 4 kb/s | |
KR20100006491A (ko) | 무성음 부호화 및 복호화 방법 및 장치 | |
Kaur et al. | MATLAB based encoder designing of 5.90 kbps narrow-band AMR codec | |
Kim et al. | A 4 kbps adaptive fixed code-excited linear prediction speech coder | |
Kim et al. | On a Reduction of Pitch Searching Time by Preliminary Pitch in the CELP Vocoder | |
Al-Naimi et al. | Improved line spectral frequency estimation through anti-aliasing filtering | |
Ekudden et al. | ITU-t g. 729 extension at 6.4 kbps. | |
Li et al. | A high quality 4 kb/s multiple pulse-dispersion ACELP speech coder | |
Viswanathan | HIGH QUALITY MELP CODING AT BIT-RATES AROUND 4 KB/S | |
Stegmann et al. | CELP coding based on signal classification using the dyadic wavelet transform | |
CHALOM | Speech Compression: A Review of the Sinusoidal Model and CELP |