RU2015136502A - Заполнение шумом при аудиокодировании с перцепционным преобразованием - Google Patents

Заполнение шумом при аудиокодировании с перцепционным преобразованием Download PDF

Info

Publication number
RU2015136502A
RU2015136502A RU2015136502A RU2015136502A RU2015136502A RU 2015136502 A RU2015136502 A RU 2015136502A RU 2015136502 A RU2015136502 A RU 2015136502A RU 2015136502 A RU2015136502 A RU 2015136502A RU 2015136502 A RU2015136502 A RU 2015136502A
Authority
RU
Russia
Prior art keywords
spectral
spectrum
noise
perceptual
zero part
Prior art date
Application number
RU2015136502A
Other languages
English (en)
Other versions
RU2631988C2 (ru
Inventor
Саша ДИШ
Марк ГАЙЕР
Кристиан ХЕЛЬМРИХ
Горан МАРКОВИЧ
ВАЛЕРО Мария ЛУИС
Original Assignee
Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. filed Critical Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф.
Publication of RU2015136502A publication Critical patent/RU2015136502A/ru
Application granted granted Critical
Publication of RU2631988C2 publication Critical patent/RU2631988C2/ru

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/028Noise substitution, i.e. substituting non-tonal spectral components by noisy source
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/012Comfort noise or silence coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding

Claims (76)

1. Аудиодекодер с перцепционным преобразованием, содержащий
модуль заполнения шумом, сконфигурированный с возможностью выполнять заполнение шумом над спектром (34) аудиосигнала посредством заполнения спектра с помощью шума, чтобы получать заполненный шумом спектр; и
модуль формирования шума частотной области, сконфигурированный с возможностью подвергать заполненный шумом спектр спектральному формированию с использованием спектральной перцепционной весовой функции,
при этом модуль формирования шума частотной области сконфигурирован с возможностью:
определять спектральную перцепционную весовую функцию из информации (162) коэффициентов линейного предсказания, сигнализируемой в потоке данных, в который спектр (34) кодируется (164), или
определять спектральную перцепционную весовую функцию из коэффициентов (112) масштабирования, относящихся к диапазонам (110) коэффициентов масштабирования, сигнализируемых в потоке данных, в который спектр (34) кодируется,
при этом модуль заполнения шумом сконфигурирован с возможностью:
генерировать промежуточный сигнал шума;
идентифицировать непрерывные спектральные нулевые части спектра аудиосигнала;
определять функцию для каждой непрерывной спектральной нулевой части в зависимости от
ширины соответствующей непрерывной спектральной нулевой части, так что функция ограничивается соответствующей непрерывной спектральной нулевой частью,
спектрального положения соответствующей непрерывной спектральной нулевой части, так что масштабирование функции зависит от спектрального положения соответствующей непрерывной спектральной нулевой части, так что величина масштабирования монотонно возрастает или убывает с возрастанием частоты
спектрального положения соответствующей непрерывной спектральной нулевой части; и
спектрально формировать, для каждой непрерывной спектральной нулевой части, промежуточный сигнал шума с использованием функции, определенной для соответствующей непрерывной спектральной нулевой части, так что шум демонстрирует спектрально глобальный наклон, имеющий отрицательный угловой коэффициент.
2. Аудиодекодер с перцепционным преобразованием по п. 1, в котором модуль заполнения шумом сконфигурирован с возможностью изменять крутизну спектрально глобального наклона в ответ на неявную или явную сигнализацию в потоке данных, в который спектр (34) кодируется (164).
3. Аудиодекодер с перцепционным преобразованием по п. 1, в котором модуль заполнения шумом сконфигурирован с возможностью выводить крутизну спектрально глобального наклона из части потока данных, которая сигнализирует спектральную перцепционную весовую функцию, или из сигнализации длины окна преобразования в потоке данных.
4. Аудиодекодер с перцепционным преобразованием по п. 1, дополнительно содержащий
модуль обратного преобразования, сконфигурированный с возможностью выполнять обратное преобразование заполненного шумом спектра, спектрально сформированного посредством модуля формирования шума частотной области, чтобы получать обратное преобразование, и подвергать обратное преобразование обработке добавления перекрывания.
5. Аудиодекодер с перцепционным преобразованием по п. 1, в котором модуль заполнения шумом сконфигурирован так, что функция (48, 50) принимает максимум во внутренней части (52) непрерывной спектральной нулевой части (40), и имеет спадающие к наружи края (58, 60), абсолютный угловой коэффициент которых отрицательно зависит от тональности.
6. Аудиодекодер с перцепционным преобразованием по п. 1, в котором модуль заполнения шумом сконфигурирован так, что функция (48, 50) принимает максимум во внутренней части (52) непрерывной спектральной нулевой части (40), и имеет спадающие кнаружи края (58, 60), спектральная ширина (54, 56) которых положительно зависит от тональности.
7. Аудиодекодер с перцепционным преобразованием по п. 1, в котором модуль заполнения шумом дополнительно сконфигурирован так, что функция является постоянной или унимодальной функцией (48, 50), интеграл которой - нормализованной к интегралу, равному 1 - по внешним четвертям (a, d) непрерывной спектральной нулевой части (40) отрицательно зависит от тональности.
8. Аудиодекодер с перцепционным преобразованием по п. 1, в котором модуль заполнения шумом дополнительно сконфигурирован так, что набор (80) функций зависит от тональности аудиосигнала, так что если тональность аудиосигнала увеличивается, масса функции становится более сосредоточенной во внутренней части соответствующей непрерывной спектральной нулевой части и отдаленной от внешних краев соответствующей непрерывной спектральной нулевой части.
9. Аудиодекодер с перцепционным преобразованием по п. 1, в котором модуль заполнения шумом дополнительно сконфигурирован с возможностью масштабировать шум с использованием параметра уровня шума, сигнализируемого в потоке данных, в который спектр кодируется, спектрально глобальным способом.
10. Аудиодекодер с перцепционным преобразованием по п. 1, в котором модуль заполнения шумом дополнительно сконфигурирован с возможностью генерировать шум с использованием случайной или псевдослучайной обработки или с использованием наложения заплат.
11. Аудиодекодер с перцепционным преобразованием по п. 5, в котором модуль заполнения шумом дополнительно сконфигурирован с возможностью выводить тональность из параметра кодирования, с использованием которого аудиосигнал кодируется.
12. Аудиодекодер с перцепционным преобразованием по п. 11, в котором модуль заполнения шумом дополнительно сконфигурирован так, что параметр кодирования является флагом активации или усилением LTP (долгосрочного предсказания) или TNS (временного формирования шума) и/или флагом активации перегруппировки спектра, при этом флаг активации спектральной перегруппировки сигнализирует вариант выбора кодирования, согласно которому квантованные спектральные значения спектрально по-новому размещаются, с дополнительной передачей внутри потока данных предписания перегруппировки.
13. Аудиодекодер с перцепционным преобразованием по п. 1, в котором модуль заполнения шумом дополнительно сконфигурирован с возможностью ограничивать заполнение шумом на высокочастотную спектральную часть спектра аудиосигнала.
14. Аудиодекодер с перцепционным преобразованием по п. 13, в котором модуль заполнения шумом дополнительно сконфигурирован с возможностью устанавливать низкочастотное начальное положение высокочастотной спектральной части, соответствующее явной сигнализации в потоке данных, в который спектр аудиосигнала кодируется.
15. Аудиокодер с перцепционным преобразованием, содержащий
фильтр предыскажения;
модуль анализа LPC, сконфигурированный с возможностью определять информацию (162) коэффициентов линейного предсказания посредством выполнения анализа LP над версией аудиосигнала, подвергнутой фильтру предыскажения, при этом информация (162) коэффициентов линейного предсказания представляет огибающую спектра LPC спектра подвергнутой предыскажению версии аудиосигнала;
модуль преобразования, сконфигурированный с возможностью обеспечивать исходный спектр аудиосигнала;
модуль взвешивания спектра, сконфигурированный с возможностью спектрально взвешивать исходный спектр аудиосигнала согласно обратной к спектральной перцепционной весовой функции, чтобы получать взвешенный по восприятию спектр,
при этом модуль спектрального взвешивания сконфигурирован с возможностью определять спектральную перцепционную весовую функцию, чтобы следовала за огибающей спектра LPC;
модуль квантования, сконфигурированный с возможностью квантовать взвешенный по восприятию спектр способом, одинаковым для спектральных линий взвешенного по восприятию спектра, чтобы получать квантованный спектр, при этом кодер сконфигурирован с возможностью кодировать квантованный спектр в поток данных, подлежащий выводу в аудиодекодер с перцепционным преобразованием по любому из предшествующих пунктов, при этом информация коэффициентов линейного предсказания также сигнализируется в потоке данных;
модуль вычисления уровня шума, сконфигурированный с возможностью вычислять параметр уровня шума посредством
идентификации непрерывных спектральных нулевых частей спектра аудиосигнала;
определения функции для каждой непрерывной спектральной нулевой части в зависимости от
ширины соответствующей непрерывной спектральной нулевой части, так что функция ограничивается соответствующей непрерывной спектральной нулевой частью,
спектрального положения соответствующей непрерывной спектральной нулевой части, так что масштабирование функции зависит от спектрального положения соответствующей непрерывной спектральной нулевой части, так что величина масштабирования монотонно возрастает или убывает с возрастанием частоты спектрального положения соответствующей непрерывной спектральной нулевой части; и
спектрального формирования, для каждой непрерывной спектральной нулевой части, промежуточного сигнала шума с использованием функции, определенной для соответствующей непрерывной спектральной нулевой части, так что шум демонстрирует спектрально глобальный наклон, имеющий положительный угловой коэффициент.
16. Аудиокодер с перцепционным преобразованием по п. 15, в котором фильтр предыскажения сконфигурирован с возможностью подвергать высокочастотной фильтрации аудиосигнал с изменяющейся величиной предыскажения, чтобы получать версию аудиосигнала, подвергнутую фильтру предыскажения, при этом модуль вычисления уровня шума сконфигурирован с возможностью устанавливать угловой коэффициент спектрально глобального наклона в зависимости от величины предыскажения.
17. Аудиокодер с перцепционным преобразованием по п. 16,
сконфигурированный с возможностью явно кодировать величину спектрально глобального наклона или величину предыскажения в потоке данных, в который квантованный спектр (34) кодируется (164).
18. Аудиокодер с перцепционным преобразованием по п. 17, содержащий
модуль определения коэффициентов масштабирования, сконфигурированный с возможностью, под управлением модели восприятия, определять коэффициенты (112) масштабирования, относящиеся к диапазонам (110) коэффициентов масштабирования, чтобы следовали за порогом маскирования, при этом модуль спектрального взвешивания сконфигурирован с возможностью определять спектральную перцепционную весовую функцию, чтобы следовала за коэффициентами масштабирования.
19. Аудиокодер с перцепционным преобразованием по п. 15, в котором модуль вычисления уровня шума сконфигурирован с возможностью определять, для каждой непрерывной спектральной нулевой части, функцию (48, 50) так, что
она принимает максимум во внутренней части (52) непрерывной спектральной нулевой части (40), и имеет спадающие кнаружи края (58, 60), абсолютный угловой коэффициент которых отрицательно зависит от тональности,
она принимает максимум во внутренней части (52) непрерывной спектральной нулевой части (40), и имеет спадающие кнаружи края (58, 60), спектральная ширина (54, 56) которых положительно зависит от тональности, и/или
она является постоянной или унимодальной функцией (48, 50), интеграл которой - нормализованной к интегралу, равному 1 - по внешним четвертям (a, d) непрерывной спектральной нулевой части (40) отрицательно зависит от тональности.
20. Аудиокодер с перцепционным преобразованием по п. 19, в котором модуль вычисления уровня шума сконфигурирован с возможностью выводить тональность из флага активации или усиления LTP (долгосрочного предсказания) или TNS (временного формирования шума) и/или флага активации перегруппировки спектра, используемого аудиокодером с перцепционным преобразованием, чтобы кодировать аудиосигнал, при этом флаг активации спектральной перегруппировки сигнализирует вариант выбора кодирования, согласно которому квантованные спектральные значения спектрально по-новому размещаются, с дополнительной передачей внутри потока данных предписания перегруппировки.
21. Аудиокодер с перцепционным преобразованием по п. 15, в котором модуль заполнения шумом сконфигурирован с возможностью ограничивать заполнение шумом на высокочастотную спектральную часть спектра аудиосигнала.
22. Аудиокодер с перцепционным преобразованием по п. 15, в котором модуль вычисления уровня шума сконфигурирован с возможностью ограничивать измерение высокочастотной спектральной частью, при этом явная сигнализация устанавливает ее низкочастотное начальное положение в потоке данных, в который аудиосигнал кодируется.
23. Способ для декодирования аудио с перцепционным преобразованием, содержащий
выполнение заполнения шумом над спектром (34) аудиосигнала посредством заполнения спектра с помощью шума, чтобы получать заполненный шумом спектр; и
формирование шума частотной области, содержащее подвергание заполненного шумом спектра спектральному формированию с использованием спектральной перцепционной весовой функции, при этом формирование шума частотной области содержит определение спектральной перцепционной весовой функции из информации (162) коэффициентов линейного предсказания, сигнализируемой в потоке данных, в который спектр (34) кодируется (164), или определение спектральной перцепционной весовой функции из коэффициентов (112) масштабирования, относящихся к диапазонам (110) коэффициентов масштабирования, сигнализируемых в потоке данных, в который спектр (34) кодируется,
при этом заполнение шумом включает в себя
генерирование промежуточного сигнала шума;
идентификацию непрерывных спектральных нулевых частей спектра аудиосигнала;
определение функции для каждой непрерывной спектральной нулевой части в зависимости от
ширины соответствующей непрерывной спектральной нулевой части, так что функция ограничивается соответствующей непрерывной спектральной нулевой частью,
спектрального положения соответствующей непрерывной спектральной нулевой части, так что масштабирование функции зависит от спектрального положения соответствующей непрерывной спектральной нулевой части, так что величина масштабирования монотонно возрастает или убывает с возрастанием частоты спектрального положения соответствующей непрерывной спектральной нулевой части; и
спектрального формирования, для каждой непрерывной спектральной нулевой части, промежуточного сигнала шума с использованием функции, определенной для соответствующей непрерывной спектральной нулевой части, так что шум демонстрирует спектрально глобальный наклон, имеющий отрицательный угловой коэффициент.
24. Способ для кодирования аудио с перцепционным преобразованием, содержащий
определение информации (162) коэффициентов линейного предсказания посредством выполнения анализа LP над версией аудиосигнала, подвергнутой фильтру предыскажения, при этом информация (162) коэффициентов линейного предсказания представляет огибающую спектра LPC спектра подвергнутой предыскажению версии аудиосигнала;
обеспечение исходного спектра аудиосигнала посредством модуля преобразования;
спектральное взвешивание исходного спектра аудиосигнала согласно обратной к спектральной перцепционной весовой функции, чтобы получать взвешенный по восприятию спектр, при этом функция спектрального взвешивания определяется, чтобы следовала за огибающей спектра LPC;
квантование взвешенного по восприятию спектра способом, одинаковым для спектральных линий взвешенного по восприятию спектра, чтобы получать квантованный спектр, при этом квантованный спектр кодируется в поток данных, подлежащий выводу
в аудиодекодер с перцепционным преобразованием по любому из пп. 1 по 14, при этом информация коэффициентов линейного предсказания также сигнализируется в потоке данных;
вычисление параметра уровня шума посредством
идентификации непрерывных спектральных нулевых частей спектра аудиосигнала;
определения функции для каждой непрерывной спектральной нулевой части в зависимости от
ширины соответствующей непрерывной спектральной нулевой части, так что функция ограничивается соответствующей непрерывной спектральной нулевой частью,
спектрального положения соответствующей непрерывной спектральной нулевой части, так что масштабирование функции зависит от спектрального положения соответствующей непрерывной спектральной нулевой части, так что величина масштабирования монотонно возрастает или убывает с возрастанием частоты спектрального положения соответствующей непрерывной спектральной нулевой части; и
спектрального формирования, для каждой непрерывной спектральной нулевой части, промежуточного сигнала шума с использованием функции, определенной для соответствующей непрерывной спектральной нулевой части, так что шум демонстрирует спектрально глобальный наклон, имеющий положительный угловой коэффициент.
25. Компьютерная программа, имеющая программный код для выполнения, когда исполняется на компьютере, способа по п. 23 или 24.
RU2015136502A 2013-01-29 2014-01-28 Заполнение шумом при аудиокодировании с перцепционным преобразованием RU2631988C2 (ru)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201361758209P 2013-01-29 2013-01-29
US61/758,209 2013-01-29
PCT/EP2014/051631 WO2014118176A1 (en) 2013-01-29 2014-01-28 Noise filling in perceptual transform audio coding

Publications (2)

Publication Number Publication Date
RU2015136502A true RU2015136502A (ru) 2017-03-07
RU2631988C2 RU2631988C2 (ru) 2017-09-29

Family

ID=50029035

Family Applications (2)

Application Number Title Priority Date Filing Date
RU2015136505A RU2660605C2 (ru) 2013-01-29 2014-01-28 Концепция заполнения шумом
RU2015136502A RU2631988C2 (ru) 2013-01-29 2014-01-28 Заполнение шумом при аудиокодировании с перцепционным преобразованием

Family Applications Before (1)

Application Number Title Priority Date Filing Date
RU2015136505A RU2660605C2 (ru) 2013-01-29 2014-01-28 Концепция заполнения шумом

Country Status (21)

Country Link
US (4) US9524724B2 (ru)
EP (6) EP3471093B1 (ru)
JP (2) JP6289508B2 (ru)
KR (6) KR101778220B1 (ru)
CN (5) CN110197667B (ru)
AR (2) AR094679A1 (ru)
AU (2) AU2014211544B2 (ru)
BR (2) BR112015017748B1 (ru)
CA (2) CA2898029C (ru)
ES (4) ES2796485T3 (ru)
HK (2) HK1218345A1 (ru)
MX (2) MX343572B (ru)
MY (2) MY172238A (ru)
PL (4) PL2951817T3 (ru)
PT (4) PT3451334T (ru)
RU (2) RU2660605C2 (ru)
SG (2) SG11201505915YA (ru)
TR (2) TR201902849T4 (ru)
TW (2) TWI529700B (ru)
WO (2) WO2014118175A1 (ru)
ZA (2) ZA201506269B (ru)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2014211544B2 (en) 2013-01-29 2017-03-30 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Noise filling in perceptual transform audio coding
BR112015018023B1 (pt) * 2013-01-29 2022-06-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e. V. Aparelho e método para sintetizar um sinal de áudio, decodificador, codificador e sistema
MX356164B (es) 2013-11-13 2018-05-16 Fraunhofer Ges Forschung Codificador para codificar una señal de audio, sistema de audio de transmisión y método para determinar valores de corrección.
EP2980792A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating an enhanced signal using independent noise-filling
EP2980794A1 (en) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and decoder using a frequency domain processor and a time domain processor
EP2980795A1 (en) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoding and decoding using a frequency domain processor, a time domain processor and a cross processor for initialization of the time domain processor
DE102016104665A1 (de) 2016-03-14 2017-09-14 Ask Industries Gmbh Verfahren und Vorrichtung zur Aufbereitung eines verlustbehaftet komprimierten Audiosignals
US10146500B2 (en) 2016-08-31 2018-12-04 Dts, Inc. Transform-based audio codec and method with subband energy smoothing
TW202341126A (zh) 2017-03-23 2023-10-16 瑞典商都比國際公司 用於音訊信號之高頻重建的諧波轉置器的回溯相容整合
EP3483880A1 (en) * 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Temporal noise shaping
EP3483879A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Analysis/synthesis windowing function for modulated lapped transformation
WO2019166317A1 (en) * 2018-02-27 2019-09-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. A spectrally adaptive noise filling tool (sanft) for perceptual transform coding of still and moving images
US10950251B2 (en) * 2018-03-05 2021-03-16 Dts, Inc. Coding of harmonic signals in transform-based audio codecs
CN112735449B (zh) * 2020-12-30 2023-04-14 北京百瑞互联技术有限公司 优化频域噪声整形的音频编码方法及装置
CN113883672B (zh) * 2021-09-13 2022-11-15 Tcl空调器(中山)有限公司 噪音类型识别方法、空调器及计算机可读存储介质
WO2023117144A1 (en) * 2021-12-23 2023-06-29 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method and apparatus for spectrotemporally improved spectral gap filling in audio coding using a tilt
TW202345142A (zh) * 2021-12-23 2023-11-16 弗勞恩霍夫爾協會 在音訊寫碼中使用傾斜用於頻譜時間改善頻譜間隙填充之方法及設備

Family Cites Families (40)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5040217A (en) * 1989-10-18 1991-08-13 At&T Bell Laboratories Perceptual coding of audio signals
US5692102A (en) * 1995-10-26 1997-11-25 Motorola, Inc. Method device and system for an efficient noise injection process for low bitrate audio compression
US6167133A (en) 1997-04-02 2000-12-26 At&T Corporation Echo detection, tracking, cancellation and noise fill in real time in a communication system
SE9903553D0 (sv) * 1999-01-27 1999-10-01 Lars Liljeryd Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL)
ATE320651T1 (de) * 2001-05-08 2006-04-15 Koninkl Philips Electronics Nv Kodieren eines audiosignals
US7447631B2 (en) * 2002-06-17 2008-11-04 Dolby Laboratories Licensing Corporation Audio coding system using spectral hole filling
CA2454296A1 (en) * 2003-12-29 2005-06-29 Nokia Corporation Method and device for speech enhancement in the presence of background noise
CA2457988A1 (en) * 2004-02-18 2005-08-18 Voiceage Corporation Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization
US9047860B2 (en) * 2005-01-31 2015-06-02 Skype Method for concatenating frames in communication system
KR100707186B1 (ko) * 2005-03-24 2007-04-13 삼성전자주식회사 오디오 부호화 및 복호화 장치와 그 방법 및 기록 매체
US8332216B2 (en) 2006-01-12 2012-12-11 Stmicroelectronics Asia Pacific Pte., Ltd. System and method for low power stereo perceptual audio coding using adaptive masking threshold
US7953595B2 (en) 2006-10-18 2011-05-31 Polycom, Inc. Dual-transform coding of audio signals
KR101291672B1 (ko) * 2007-03-07 2013-08-01 삼성전자주식회사 노이즈 신호 부호화 및 복호화 장치 및 방법
CN101303855B (zh) * 2007-05-11 2011-06-22 华为技术有限公司 一种舒适噪声参数产生方法和装置
US9653088B2 (en) 2007-06-13 2017-05-16 Qualcomm Incorporated Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding
CN101939782B (zh) * 2007-08-27 2012-12-05 爱立信电话股份有限公司 噪声填充与带宽扩展之间的自适应过渡频率
DK3401907T3 (da) 2007-08-27 2020-03-02 Ericsson Telefon Ab L M Fremgangsmåde og indretning til perceptuel spektral afkodning af et audiosignal omfattende udfyldning af spektrale huller
US8527265B2 (en) * 2007-10-22 2013-09-03 Qualcomm Incorporated Low-complexity encoding/decoding of quantized MDCT spectrum in scalable speech and audio codecs
KR101290622B1 (ko) * 2007-11-02 2013-07-29 후아웨이 테크놀러지 컴퍼니 리미티드 오디오 복호화 방법 및 장치
EP2077551B1 (en) * 2008-01-04 2011-03-02 Dolby Sweden AB Audio encoder and decoder
CN101335000B (zh) * 2008-03-26 2010-04-21 华为技术有限公司 编码的方法及装置
ATE539433T1 (de) * 2008-07-11 2012-01-15 Fraunhofer Ges Forschung Bereitstellen eines zeitverzerrungsaktivierungssignals und codierung eines audiosignals damit
KR101518532B1 (ko) * 2008-07-11 2015-05-07 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 오디오 인코더, 오디오 디코더, 오디오 신호, 오디오 스트림을 부호화 및 복호화하는 장치 및 컴퓨터 프로그램
EP3002750B1 (en) 2008-07-11 2017-11-08 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and decoder for encoding and decoding audio samples
BRPI0914056B1 (pt) 2008-10-08 2019-07-02 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Esquema de codificação/decodificação de áudio comutado multi-resolução
AU2010305383B2 (en) 2009-10-08 2013-10-03 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Multi-mode audio signal decoder, multi-mode audio signal encoder, methods and computer program using a linear-prediction-coding based noise shaping
EP3693964B1 (en) * 2009-10-15 2021-07-28 VoiceAge Corporation Simultaneous time-domain and frequency-domain noise shaping for tdac transforms
CN102884574B (zh) * 2009-10-20 2015-10-14 弗兰霍菲尔运输应用研究公司 音频信号编码器、音频信号解码器、使用混迭抵消来将音频信号编码或解码的方法
CN102063905A (zh) * 2009-11-13 2011-05-18 数维科技(北京)有限公司 一种用于音频解码的盲噪声填充方法及其装置
CN102194457B (zh) * 2010-03-02 2013-02-27 中兴通讯股份有限公司 音频编解码方法、系统及噪声水平估计方法
US20120029926A1 (en) * 2010-07-30 2012-02-02 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for dependent-mode coding of audio signals
US9208792B2 (en) * 2010-08-17 2015-12-08 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for noise injection
JP5612698B2 (ja) 2010-10-05 2014-10-22 日本電信電話株式会社 符号化方法、復号方法、符号化装置、復号装置、プログラム、記録媒体
RU2585999C2 (ru) * 2011-02-14 2016-06-10 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Генерирование шума в аудиокодеках
ES2559040T3 (es) * 2011-03-10 2016-02-10 Telefonaktiebolaget Lm Ericsson (Publ) Relleno de subvectores no codificados en señales de audio codificadas por transformada
RU2648595C2 (ru) * 2011-05-13 2018-03-26 Самсунг Электроникс Ко., Лтд. Распределение битов, кодирование и декодирование аудио
JP2013015598A (ja) * 2011-06-30 2013-01-24 Zte Corp オーディオ符号化/復号化方法、システム及びノイズレベルの推定方法
MX350162B (es) * 2011-06-30 2017-08-29 Samsung Electronics Co Ltd Aparato y método para generar señal extendida de ancho de banda.
CN102208188B (zh) * 2011-07-13 2013-04-17 华为技术有限公司 音频信号编解码方法和设备
AU2014211544B2 (en) 2013-01-29 2017-03-30 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Noise filling in perceptual transform audio coding

Also Published As

Publication number Publication date
BR112015017748B1 (pt) 2022-03-15
ZA201506266B (en) 2017-11-29
HK1218344A1 (zh) 2017-02-10
BR112015017633A2 (pt) 2018-05-02
ES2834929T3 (es) 2021-06-21
AU2014211544B2 (en) 2017-03-30
KR20150109437A (ko) 2015-10-01
PL2951818T3 (pl) 2019-05-31
KR20160091449A (ko) 2016-08-02
CN105190749B (zh) 2019-06-11
ES2709360T3 (es) 2019-04-16
RU2660605C2 (ru) 2018-07-06
EP2951818B1 (en) 2018-11-21
US20150332686A1 (en) 2015-11-19
KR20160090403A (ko) 2016-07-29
KR20160091448A (ko) 2016-08-02
TW201434035A (zh) 2014-09-01
EP2951817A1 (en) 2015-12-09
PL2951817T3 (pl) 2019-05-31
BR112015017633B1 (pt) 2021-02-23
EP3451334A1 (en) 2019-03-06
AU2014211543B2 (en) 2017-03-30
US20170372712A1 (en) 2017-12-28
US20190348053A1 (en) 2019-11-14
AU2014211544A1 (en) 2015-08-20
US20150332689A1 (en) 2015-11-19
MX2015009601A (es) 2015-11-25
MX343572B (es) 2016-11-09
US9792920B2 (en) 2017-10-17
PL3471093T3 (pl) 2021-04-06
ES2796485T3 (es) 2020-11-27
MY172238A (en) 2019-11-18
KR20170117605A (ko) 2017-10-23
RU2631988C2 (ru) 2017-09-29
CN110223704B (zh) 2023-09-15
JP6158352B2 (ja) 2017-07-05
TW201434034A (zh) 2014-09-01
EP3761312A1 (en) 2021-01-06
KR101877906B1 (ko) 2018-07-12
PT3471093T (pt) 2020-11-20
HK1218345A1 (zh) 2017-02-10
MY185164A (en) 2021-04-30
CN110223704A (zh) 2019-09-10
ZA201506269B (en) 2017-07-26
RU2015136505A (ru) 2017-03-07
CA2898029A1 (en) 2014-08-07
CA2898024C (en) 2018-09-11
SG11201505915YA (en) 2015-09-29
AR094678A1 (es) 2015-08-19
EP3471093B1 (en) 2020-08-26
JP2016505171A (ja) 2016-02-18
MX345160B (es) 2017-01-18
US10410642B2 (en) 2019-09-10
JP6289508B2 (ja) 2018-03-07
KR101778220B1 (ko) 2017-09-13
TR201902849T4 (tr) 2019-03-21
AU2014211543A1 (en) 2015-08-20
AR094679A1 (es) 2015-08-19
SG11201505893TA (en) 2015-08-28
CN105264597A (zh) 2016-01-20
KR20150108422A (ko) 2015-09-25
KR101897092B1 (ko) 2018-09-11
TWI536367B (zh) 2016-06-01
BR112015017748A2 (ru) 2017-08-22
CN110197667A (zh) 2019-09-03
TR201902394T4 (tr) 2019-03-21
KR101926651B1 (ko) 2019-03-07
TWI529700B (zh) 2016-04-11
CN110189760B (zh) 2023-09-12
EP2951818A1 (en) 2015-12-09
CN105264597B (zh) 2019-12-10
EP3693962A1 (en) 2020-08-12
US11031022B2 (en) 2021-06-08
MX2015009600A (es) 2015-11-25
JP2016511431A (ja) 2016-04-14
ES2714289T3 (es) 2019-05-28
CA2898029C (en) 2018-08-21
WO2014118176A1 (en) 2014-08-07
US9524724B2 (en) 2016-12-20
CN110189760A (zh) 2019-08-30
KR101757347B1 (ko) 2017-07-26
EP3451334B1 (en) 2020-04-01
PL3451334T3 (pl) 2020-12-14
CN110197667B (zh) 2023-06-30
CA2898024A1 (en) 2014-08-07
PT2951817T (pt) 2019-02-25
CN105190749A (zh) 2015-12-23
KR101778217B1 (ko) 2017-09-13
EP3471093A1 (en) 2019-04-17
PT2951818T (pt) 2019-02-25
PT3451334T (pt) 2020-06-29
WO2014118175A1 (en) 2014-08-07
EP2951817B1 (en) 2018-12-05

Similar Documents

Publication Publication Date Title
RU2015136502A (ru) Заполнение шумом при аудиокодировании с перцепционным преобразованием
TWI476757B (zh) 音訊編碼器、音訊解碼器、用以將音訊資訊編碼及解碼之方法、以及基於先前解碼頻譜值之範數來獲取脈絡子區值之電腦程式
TWI578308B (zh) 音訊信號頻譜之頻譜係數的編碼技術
KR101736394B1 (ko) 오디오 신호 인코딩/디코딩 방법 및 오디오 신호 인코딩/디코딩 장치
AU2016231220B2 (en) Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal
JP2016505171A5 (ru)
TWI536369B (zh) 用以基於線性預測編碼之於頻域中編碼的低頻率增強技術
RU2016122865A (ru) Кодер для кодирования аудиосигнала, система передачи аудио и способ определения значений коррекции
CN105556599A (zh) 频谱包络的样本值的基于上下文的熵编码
US11694701B2 (en) Low-complexity tonality-adaptive audio signal quantization
CN104584122A (zh) 使用改进的概率分布估计的基于线性预测的音频编码
KR101860139B1 (ko) 주기성 통합 포락 계열 생성 장치, 주기성 통합 포락 계열 생성 방법, 주기성 통합 포락 계열 생성 프로그램, 기록매체
US20170272766A1 (en) Encoding apparatus, decoding apparatus, and method and program for the same
TW201923747A (zh) 控制編碼器及/或解碼器中頻寬之技術