RU2015136502A - Заполнение шумом при аудиокодировании с перцепционным преобразованием - Google Patents
Заполнение шумом при аудиокодировании с перцепционным преобразованием Download PDFInfo
- Publication number
- RU2015136502A RU2015136502A RU2015136502A RU2015136502A RU2015136502A RU 2015136502 A RU2015136502 A RU 2015136502A RU 2015136502 A RU2015136502 A RU 2015136502A RU 2015136502 A RU2015136502 A RU 2015136502A RU 2015136502 A RU2015136502 A RU 2015136502A
- Authority
- RU
- Russia
- Prior art keywords
- spectral
- spectrum
- noise
- perceptual
- zero part
- Prior art date
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/028—Noise substitution, i.e. substituting non-tonal spectral components by noisy source
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/012—Comfort noise or silence coding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
Claims (76)
1. Аудиодекодер с перцепционным преобразованием, содержащий
модуль заполнения шумом, сконфигурированный с возможностью выполнять заполнение шумом над спектром (34) аудиосигнала посредством заполнения спектра с помощью шума, чтобы получать заполненный шумом спектр; и
модуль формирования шума частотной области, сконфигурированный с возможностью подвергать заполненный шумом спектр спектральному формированию с использованием спектральной перцепционной весовой функции,
при этом модуль формирования шума частотной области сконфигурирован с возможностью:
определять спектральную перцепционную весовую функцию из информации (162) коэффициентов линейного предсказания, сигнализируемой в потоке данных, в который спектр (34) кодируется (164), или
определять спектральную перцепционную весовую функцию из коэффициентов (112) масштабирования, относящихся к диапазонам (110) коэффициентов масштабирования, сигнализируемых в потоке данных, в который спектр (34) кодируется,
при этом модуль заполнения шумом сконфигурирован с возможностью:
генерировать промежуточный сигнал шума;
идентифицировать непрерывные спектральные нулевые части спектра аудиосигнала;
определять функцию для каждой непрерывной спектральной нулевой части в зависимости от
ширины соответствующей непрерывной спектральной нулевой части, так что функция ограничивается соответствующей непрерывной спектральной нулевой частью,
спектрального положения соответствующей непрерывной спектральной нулевой части, так что масштабирование функции зависит от спектрального положения соответствующей непрерывной спектральной нулевой части, так что величина масштабирования монотонно возрастает или убывает с возрастанием частоты
спектрального положения соответствующей непрерывной спектральной нулевой части; и
спектрально формировать, для каждой непрерывной спектральной нулевой части, промежуточный сигнал шума с использованием функции, определенной для соответствующей непрерывной спектральной нулевой части, так что шум демонстрирует спектрально глобальный наклон, имеющий отрицательный угловой коэффициент.
2. Аудиодекодер с перцепционным преобразованием по п. 1, в котором модуль заполнения шумом сконфигурирован с возможностью изменять крутизну спектрально глобального наклона в ответ на неявную или явную сигнализацию в потоке данных, в который спектр (34) кодируется (164).
3. Аудиодекодер с перцепционным преобразованием по п. 1, в котором модуль заполнения шумом сконфигурирован с возможностью выводить крутизну спектрально глобального наклона из части потока данных, которая сигнализирует спектральную перцепционную весовую функцию, или из сигнализации длины окна преобразования в потоке данных.
4. Аудиодекодер с перцепционным преобразованием по п. 1, дополнительно содержащий
модуль обратного преобразования, сконфигурированный с возможностью выполнять обратное преобразование заполненного шумом спектра, спектрально сформированного посредством модуля формирования шума частотной области, чтобы получать обратное преобразование, и подвергать обратное преобразование обработке добавления перекрывания.
5. Аудиодекодер с перцепционным преобразованием по п. 1, в котором модуль заполнения шумом сконфигурирован так, что функция (48, 50) принимает максимум во внутренней части (52) непрерывной спектральной нулевой части (40), и имеет спадающие к наружи края (58, 60), абсолютный угловой коэффициент которых отрицательно зависит от тональности.
6. Аудиодекодер с перцепционным преобразованием по п. 1, в котором модуль заполнения шумом сконфигурирован так, что функция (48, 50) принимает максимум во внутренней части (52) непрерывной спектральной нулевой части (40), и имеет спадающие кнаружи края (58, 60), спектральная ширина (54, 56) которых положительно зависит от тональности.
7. Аудиодекодер с перцепционным преобразованием по п. 1, в котором модуль заполнения шумом дополнительно сконфигурирован так, что функция является постоянной или унимодальной функцией (48, 50), интеграл которой - нормализованной к интегралу, равному 1 - по внешним четвертям (a, d) непрерывной спектральной нулевой части (40) отрицательно зависит от тональности.
8. Аудиодекодер с перцепционным преобразованием по п. 1, в котором модуль заполнения шумом дополнительно сконфигурирован так, что набор (80) функций зависит от тональности аудиосигнала, так что если тональность аудиосигнала увеличивается, масса функции становится более сосредоточенной во внутренней части соответствующей непрерывной спектральной нулевой части и отдаленной от внешних краев соответствующей непрерывной спектральной нулевой части.
9. Аудиодекодер с перцепционным преобразованием по п. 1, в котором модуль заполнения шумом дополнительно сконфигурирован с возможностью масштабировать шум с использованием параметра уровня шума, сигнализируемого в потоке данных, в который спектр кодируется, спектрально глобальным способом.
10. Аудиодекодер с перцепционным преобразованием по п. 1, в котором модуль заполнения шумом дополнительно сконфигурирован с возможностью генерировать шум с использованием случайной или псевдослучайной обработки или с использованием наложения заплат.
11. Аудиодекодер с перцепционным преобразованием по п. 5, в котором модуль заполнения шумом дополнительно сконфигурирован с возможностью выводить тональность из параметра кодирования, с использованием которого аудиосигнал кодируется.
12. Аудиодекодер с перцепционным преобразованием по п. 11, в котором модуль заполнения шумом дополнительно сконфигурирован так, что параметр кодирования является флагом активации или усилением LTP (долгосрочного предсказания) или TNS (временного формирования шума) и/или флагом активации перегруппировки спектра, при этом флаг активации спектральной перегруппировки сигнализирует вариант выбора кодирования, согласно которому квантованные спектральные значения спектрально по-новому размещаются, с дополнительной передачей внутри потока данных предписания перегруппировки.
13. Аудиодекодер с перцепционным преобразованием по п. 1, в котором модуль заполнения шумом дополнительно сконфигурирован с возможностью ограничивать заполнение шумом на высокочастотную спектральную часть спектра аудиосигнала.
14. Аудиодекодер с перцепционным преобразованием по п. 13, в котором модуль заполнения шумом дополнительно сконфигурирован с возможностью устанавливать низкочастотное начальное положение высокочастотной спектральной части, соответствующее явной сигнализации в потоке данных, в который спектр аудиосигнала кодируется.
15. Аудиокодер с перцепционным преобразованием, содержащий
фильтр предыскажения;
модуль анализа LPC, сконфигурированный с возможностью определять информацию (162) коэффициентов линейного предсказания посредством выполнения анализа LP над версией аудиосигнала, подвергнутой фильтру предыскажения, при этом информация (162) коэффициентов линейного предсказания представляет огибающую спектра LPC спектра подвергнутой предыскажению версии аудиосигнала;
модуль преобразования, сконфигурированный с возможностью обеспечивать исходный спектр аудиосигнала;
модуль взвешивания спектра, сконфигурированный с возможностью спектрально взвешивать исходный спектр аудиосигнала согласно обратной к спектральной перцепционной весовой функции, чтобы получать взвешенный по восприятию спектр,
при этом модуль спектрального взвешивания сконфигурирован с возможностью определять спектральную перцепционную весовую функцию, чтобы следовала за огибающей спектра LPC;
модуль квантования, сконфигурированный с возможностью квантовать взвешенный по восприятию спектр способом, одинаковым для спектральных линий взвешенного по восприятию спектра, чтобы получать квантованный спектр, при этом кодер сконфигурирован с возможностью кодировать квантованный спектр в поток данных, подлежащий выводу в аудиодекодер с перцепционным преобразованием по любому из предшествующих пунктов, при этом информация коэффициентов линейного предсказания также сигнализируется в потоке данных;
модуль вычисления уровня шума, сконфигурированный с возможностью вычислять параметр уровня шума посредством
идентификации непрерывных спектральных нулевых частей спектра аудиосигнала;
определения функции для каждой непрерывной спектральной нулевой части в зависимости от
ширины соответствующей непрерывной спектральной нулевой части, так что функция ограничивается соответствующей непрерывной спектральной нулевой частью,
спектрального положения соответствующей непрерывной спектральной нулевой части, так что масштабирование функции зависит от спектрального положения соответствующей непрерывной спектральной нулевой части, так что величина масштабирования монотонно возрастает или убывает с возрастанием частоты спектрального положения соответствующей непрерывной спектральной нулевой части; и
спектрального формирования, для каждой непрерывной спектральной нулевой части, промежуточного сигнала шума с использованием функции, определенной для соответствующей непрерывной спектральной нулевой части, так что шум демонстрирует спектрально глобальный наклон, имеющий положительный угловой коэффициент.
16. Аудиокодер с перцепционным преобразованием по п. 15, в котором фильтр предыскажения сконфигурирован с возможностью подвергать высокочастотной фильтрации аудиосигнал с изменяющейся величиной предыскажения, чтобы получать версию аудиосигнала, подвергнутую фильтру предыскажения, при этом модуль вычисления уровня шума сконфигурирован с возможностью устанавливать угловой коэффициент спектрально глобального наклона в зависимости от величины предыскажения.
17. Аудиокодер с перцепционным преобразованием по п. 16,
сконфигурированный с возможностью явно кодировать величину спектрально глобального наклона или величину предыскажения в потоке данных, в который квантованный спектр (34) кодируется (164).
18. Аудиокодер с перцепционным преобразованием по п. 17, содержащий
модуль определения коэффициентов масштабирования, сконфигурированный с возможностью, под управлением модели восприятия, определять коэффициенты (112) масштабирования, относящиеся к диапазонам (110) коэффициентов масштабирования, чтобы следовали за порогом маскирования, при этом модуль спектрального взвешивания сконфигурирован с возможностью определять спектральную перцепционную весовую функцию, чтобы следовала за коэффициентами масштабирования.
19. Аудиокодер с перцепционным преобразованием по п. 15, в котором модуль вычисления уровня шума сконфигурирован с возможностью определять, для каждой непрерывной спектральной нулевой части, функцию (48, 50) так, что
она принимает максимум во внутренней части (52) непрерывной спектральной нулевой части (40), и имеет спадающие кнаружи края (58, 60), абсолютный угловой коэффициент которых отрицательно зависит от тональности,
она принимает максимум во внутренней части (52) непрерывной спектральной нулевой части (40), и имеет спадающие кнаружи края (58, 60), спектральная ширина (54, 56) которых положительно зависит от тональности, и/или
она является постоянной или унимодальной функцией (48, 50), интеграл которой - нормализованной к интегралу, равному 1 - по внешним четвертям (a, d) непрерывной спектральной нулевой части (40) отрицательно зависит от тональности.
20. Аудиокодер с перцепционным преобразованием по п. 19, в котором модуль вычисления уровня шума сконфигурирован с возможностью выводить тональность из флага активации или усиления LTP (долгосрочного предсказания) или TNS (временного формирования шума) и/или флага активации перегруппировки спектра, используемого аудиокодером с перцепционным преобразованием, чтобы кодировать аудиосигнал, при этом флаг активации спектральной перегруппировки сигнализирует вариант выбора кодирования, согласно которому квантованные спектральные значения спектрально по-новому размещаются, с дополнительной передачей внутри потока данных предписания перегруппировки.
21. Аудиокодер с перцепционным преобразованием по п. 15, в котором модуль заполнения шумом сконфигурирован с возможностью ограничивать заполнение шумом на высокочастотную спектральную часть спектра аудиосигнала.
22. Аудиокодер с перцепционным преобразованием по п. 15, в котором модуль вычисления уровня шума сконфигурирован с возможностью ограничивать измерение высокочастотной спектральной частью, при этом явная сигнализация устанавливает ее низкочастотное начальное положение в потоке данных, в который аудиосигнал кодируется.
23. Способ для декодирования аудио с перцепционным преобразованием, содержащий
выполнение заполнения шумом над спектром (34) аудиосигнала посредством заполнения спектра с помощью шума, чтобы получать заполненный шумом спектр; и
формирование шума частотной области, содержащее подвергание заполненного шумом спектра спектральному формированию с использованием спектральной перцепционной весовой функции, при этом формирование шума частотной области содержит определение спектральной перцепционной весовой функции из информации (162) коэффициентов линейного предсказания, сигнализируемой в потоке данных, в который спектр (34) кодируется (164), или определение спектральной перцепционной весовой функции из коэффициентов (112) масштабирования, относящихся к диапазонам (110) коэффициентов масштабирования, сигнализируемых в потоке данных, в который спектр (34) кодируется,
при этом заполнение шумом включает в себя
генерирование промежуточного сигнала шума;
идентификацию непрерывных спектральных нулевых частей спектра аудиосигнала;
определение функции для каждой непрерывной спектральной нулевой части в зависимости от
ширины соответствующей непрерывной спектральной нулевой части, так что функция ограничивается соответствующей непрерывной спектральной нулевой частью,
спектрального положения соответствующей непрерывной спектральной нулевой части, так что масштабирование функции зависит от спектрального положения соответствующей непрерывной спектральной нулевой части, так что величина масштабирования монотонно возрастает или убывает с возрастанием частоты спектрального положения соответствующей непрерывной спектральной нулевой части; и
спектрального формирования, для каждой непрерывной спектральной нулевой части, промежуточного сигнала шума с использованием функции, определенной для соответствующей непрерывной спектральной нулевой части, так что шум демонстрирует спектрально глобальный наклон, имеющий отрицательный угловой коэффициент.
24. Способ для кодирования аудио с перцепционным преобразованием, содержащий
определение информации (162) коэффициентов линейного предсказания посредством выполнения анализа LP над версией аудиосигнала, подвергнутой фильтру предыскажения, при этом информация (162) коэффициентов линейного предсказания представляет огибающую спектра LPC спектра подвергнутой предыскажению версии аудиосигнала;
обеспечение исходного спектра аудиосигнала посредством модуля преобразования;
спектральное взвешивание исходного спектра аудиосигнала согласно обратной к спектральной перцепционной весовой функции, чтобы получать взвешенный по восприятию спектр, при этом функция спектрального взвешивания определяется, чтобы следовала за огибающей спектра LPC;
квантование взвешенного по восприятию спектра способом, одинаковым для спектральных линий взвешенного по восприятию спектра, чтобы получать квантованный спектр, при этом квантованный спектр кодируется в поток данных, подлежащий выводу
в аудиодекодер с перцепционным преобразованием по любому из пп. 1 по 14, при этом информация коэффициентов линейного предсказания также сигнализируется в потоке данных;
вычисление параметра уровня шума посредством
идентификации непрерывных спектральных нулевых частей спектра аудиосигнала;
определения функции для каждой непрерывной спектральной нулевой части в зависимости от
ширины соответствующей непрерывной спектральной нулевой части, так что функция ограничивается соответствующей непрерывной спектральной нулевой частью,
спектрального положения соответствующей непрерывной спектральной нулевой части, так что масштабирование функции зависит от спектрального положения соответствующей непрерывной спектральной нулевой части, так что величина масштабирования монотонно возрастает или убывает с возрастанием частоты спектрального положения соответствующей непрерывной спектральной нулевой части; и
спектрального формирования, для каждой непрерывной спектральной нулевой части, промежуточного сигнала шума с использованием функции, определенной для соответствующей непрерывной спектральной нулевой части, так что шум демонстрирует спектрально глобальный наклон, имеющий положительный угловой коэффициент.
25. Компьютерная программа, имеющая программный код для выполнения, когда исполняется на компьютере, способа по п. 23 или 24.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201361758209P | 2013-01-29 | 2013-01-29 | |
US61/758,209 | 2013-01-29 | ||
PCT/EP2014/051631 WO2014118176A1 (en) | 2013-01-29 | 2014-01-28 | Noise filling in perceptual transform audio coding |
Publications (2)
Publication Number | Publication Date |
---|---|
RU2015136502A true RU2015136502A (ru) | 2017-03-07 |
RU2631988C2 RU2631988C2 (ru) | 2017-09-29 |
Family
ID=50029035
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2015136505A RU2660605C2 (ru) | 2013-01-29 | 2014-01-28 | Концепция заполнения шумом |
RU2015136502A RU2631988C2 (ru) | 2013-01-29 | 2014-01-28 | Заполнение шумом при аудиокодировании с перцепционным преобразованием |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2015136505A RU2660605C2 (ru) | 2013-01-29 | 2014-01-28 | Концепция заполнения шумом |
Country Status (21)
Country | Link |
---|---|
US (4) | US9524724B2 (ru) |
EP (6) | EP3471093B1 (ru) |
JP (2) | JP6289508B2 (ru) |
KR (6) | KR101778220B1 (ru) |
CN (5) | CN110197667B (ru) |
AR (2) | AR094679A1 (ru) |
AU (2) | AU2014211544B2 (ru) |
BR (2) | BR112015017748B1 (ru) |
CA (2) | CA2898029C (ru) |
ES (4) | ES2796485T3 (ru) |
HK (2) | HK1218345A1 (ru) |
MX (2) | MX343572B (ru) |
MY (2) | MY172238A (ru) |
PL (4) | PL2951817T3 (ru) |
PT (4) | PT3451334T (ru) |
RU (2) | RU2660605C2 (ru) |
SG (2) | SG11201505915YA (ru) |
TR (2) | TR201902849T4 (ru) |
TW (2) | TWI529700B (ru) |
WO (2) | WO2014118175A1 (ru) |
ZA (2) | ZA201506269B (ru) |
Families Citing this family (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU2014211544B2 (en) | 2013-01-29 | 2017-03-30 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Noise filling in perceptual transform audio coding |
BR112015018023B1 (pt) * | 2013-01-29 | 2022-06-07 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e. V. | Aparelho e método para sintetizar um sinal de áudio, decodificador, codificador e sistema |
MX356164B (es) | 2013-11-13 | 2018-05-16 | Fraunhofer Ges Forschung | Codificador para codificar una señal de audio, sistema de audio de transmisión y método para determinar valores de corrección. |
EP2980792A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for generating an enhanced signal using independent noise-filling |
EP2980794A1 (en) * | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder and decoder using a frequency domain processor and a time domain processor |
EP2980795A1 (en) * | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoding and decoding using a frequency domain processor, a time domain processor and a cross processor for initialization of the time domain processor |
DE102016104665A1 (de) | 2016-03-14 | 2017-09-14 | Ask Industries Gmbh | Verfahren und Vorrichtung zur Aufbereitung eines verlustbehaftet komprimierten Audiosignals |
US10146500B2 (en) | 2016-08-31 | 2018-12-04 | Dts, Inc. | Transform-based audio codec and method with subband energy smoothing |
TW202341126A (zh) | 2017-03-23 | 2023-10-16 | 瑞典商都比國際公司 | 用於音訊信號之高頻重建的諧波轉置器的回溯相容整合 |
EP3483880A1 (en) * | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Temporal noise shaping |
EP3483879A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Analysis/synthesis windowing function for modulated lapped transformation |
WO2019166317A1 (en) * | 2018-02-27 | 2019-09-06 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | A spectrally adaptive noise filling tool (sanft) for perceptual transform coding of still and moving images |
US10950251B2 (en) * | 2018-03-05 | 2021-03-16 | Dts, Inc. | Coding of harmonic signals in transform-based audio codecs |
CN112735449B (zh) * | 2020-12-30 | 2023-04-14 | 北京百瑞互联技术有限公司 | 优化频域噪声整形的音频编码方法及装置 |
CN113883672B (zh) * | 2021-09-13 | 2022-11-15 | Tcl空调器(中山)有限公司 | 噪音类型识别方法、空调器及计算机可读存储介质 |
WO2023117144A1 (en) * | 2021-12-23 | 2023-06-29 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Method and apparatus for spectrotemporally improved spectral gap filling in audio coding using a tilt |
TW202345142A (zh) * | 2021-12-23 | 2023-11-16 | 弗勞恩霍夫爾協會 | 在音訊寫碼中使用傾斜用於頻譜時間改善頻譜間隙填充之方法及設備 |
Family Cites Families (40)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5040217A (en) * | 1989-10-18 | 1991-08-13 | At&T Bell Laboratories | Perceptual coding of audio signals |
US5692102A (en) * | 1995-10-26 | 1997-11-25 | Motorola, Inc. | Method device and system for an efficient noise injection process for low bitrate audio compression |
US6167133A (en) | 1997-04-02 | 2000-12-26 | At&T Corporation | Echo detection, tracking, cancellation and noise fill in real time in a communication system |
SE9903553D0 (sv) * | 1999-01-27 | 1999-10-01 | Lars Liljeryd | Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL) |
ATE320651T1 (de) * | 2001-05-08 | 2006-04-15 | Koninkl Philips Electronics Nv | Kodieren eines audiosignals |
US7447631B2 (en) * | 2002-06-17 | 2008-11-04 | Dolby Laboratories Licensing Corporation | Audio coding system using spectral hole filling |
CA2454296A1 (en) * | 2003-12-29 | 2005-06-29 | Nokia Corporation | Method and device for speech enhancement in the presence of background noise |
CA2457988A1 (en) * | 2004-02-18 | 2005-08-18 | Voiceage Corporation | Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization |
US9047860B2 (en) * | 2005-01-31 | 2015-06-02 | Skype | Method for concatenating frames in communication system |
KR100707186B1 (ko) * | 2005-03-24 | 2007-04-13 | 삼성전자주식회사 | 오디오 부호화 및 복호화 장치와 그 방법 및 기록 매체 |
US8332216B2 (en) | 2006-01-12 | 2012-12-11 | Stmicroelectronics Asia Pacific Pte., Ltd. | System and method for low power stereo perceptual audio coding using adaptive masking threshold |
US7953595B2 (en) | 2006-10-18 | 2011-05-31 | Polycom, Inc. | Dual-transform coding of audio signals |
KR101291672B1 (ko) * | 2007-03-07 | 2013-08-01 | 삼성전자주식회사 | 노이즈 신호 부호화 및 복호화 장치 및 방법 |
CN101303855B (zh) * | 2007-05-11 | 2011-06-22 | 华为技术有限公司 | 一种舒适噪声参数产生方法和装置 |
US9653088B2 (en) | 2007-06-13 | 2017-05-16 | Qualcomm Incorporated | Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding |
CN101939782B (zh) * | 2007-08-27 | 2012-12-05 | 爱立信电话股份有限公司 | 噪声填充与带宽扩展之间的自适应过渡频率 |
DK3401907T3 (da) | 2007-08-27 | 2020-03-02 | Ericsson Telefon Ab L M | Fremgangsmåde og indretning til perceptuel spektral afkodning af et audiosignal omfattende udfyldning af spektrale huller |
US8527265B2 (en) * | 2007-10-22 | 2013-09-03 | Qualcomm Incorporated | Low-complexity encoding/decoding of quantized MDCT spectrum in scalable speech and audio codecs |
KR101290622B1 (ko) * | 2007-11-02 | 2013-07-29 | 후아웨이 테크놀러지 컴퍼니 리미티드 | 오디오 복호화 방법 및 장치 |
EP2077551B1 (en) * | 2008-01-04 | 2011-03-02 | Dolby Sweden AB | Audio encoder and decoder |
CN101335000B (zh) * | 2008-03-26 | 2010-04-21 | 华为技术有限公司 | 编码的方法及装置 |
ATE539433T1 (de) * | 2008-07-11 | 2012-01-15 | Fraunhofer Ges Forschung | Bereitstellen eines zeitverzerrungsaktivierungssignals und codierung eines audiosignals damit |
KR101518532B1 (ko) * | 2008-07-11 | 2015-05-07 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 오디오 인코더, 오디오 디코더, 오디오 신호, 오디오 스트림을 부호화 및 복호화하는 장치 및 컴퓨터 프로그램 |
EP3002750B1 (en) | 2008-07-11 | 2017-11-08 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder and decoder for encoding and decoding audio samples |
BRPI0914056B1 (pt) | 2008-10-08 | 2019-07-02 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Esquema de codificação/decodificação de áudio comutado multi-resolução |
AU2010305383B2 (en) | 2009-10-08 | 2013-10-03 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Multi-mode audio signal decoder, multi-mode audio signal encoder, methods and computer program using a linear-prediction-coding based noise shaping |
EP3693964B1 (en) * | 2009-10-15 | 2021-07-28 | VoiceAge Corporation | Simultaneous time-domain and frequency-domain noise shaping for tdac transforms |
CN102884574B (zh) * | 2009-10-20 | 2015-10-14 | 弗兰霍菲尔运输应用研究公司 | 音频信号编码器、音频信号解码器、使用混迭抵消来将音频信号编码或解码的方法 |
CN102063905A (zh) * | 2009-11-13 | 2011-05-18 | 数维科技(北京)有限公司 | 一种用于音频解码的盲噪声填充方法及其装置 |
CN102194457B (zh) * | 2010-03-02 | 2013-02-27 | 中兴通讯股份有限公司 | 音频编解码方法、系统及噪声水平估计方法 |
US20120029926A1 (en) * | 2010-07-30 | 2012-02-02 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for dependent-mode coding of audio signals |
US9208792B2 (en) * | 2010-08-17 | 2015-12-08 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for noise injection |
JP5612698B2 (ja) | 2010-10-05 | 2014-10-22 | 日本電信電話株式会社 | 符号化方法、復号方法、符号化装置、復号装置、プログラム、記録媒体 |
RU2585999C2 (ru) * | 2011-02-14 | 2016-06-10 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Генерирование шума в аудиокодеках |
ES2559040T3 (es) * | 2011-03-10 | 2016-02-10 | Telefonaktiebolaget Lm Ericsson (Publ) | Relleno de subvectores no codificados en señales de audio codificadas por transformada |
RU2648595C2 (ru) * | 2011-05-13 | 2018-03-26 | Самсунг Электроникс Ко., Лтд. | Распределение битов, кодирование и декодирование аудио |
JP2013015598A (ja) * | 2011-06-30 | 2013-01-24 | Zte Corp | オーディオ符号化/復号化方法、システム及びノイズレベルの推定方法 |
MX350162B (es) * | 2011-06-30 | 2017-08-29 | Samsung Electronics Co Ltd | Aparato y método para generar señal extendida de ancho de banda. |
CN102208188B (zh) * | 2011-07-13 | 2013-04-17 | 华为技术有限公司 | 音频信号编解码方法和设备 |
AU2014211544B2 (en) | 2013-01-29 | 2017-03-30 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Noise filling in perceptual transform audio coding |
-
2014
- 2014-01-28 AU AU2014211544A patent/AU2014211544B2/en active Active
- 2014-01-28 KR KR1020167019946A patent/KR101778220B1/ko active IP Right Grant
- 2014-01-28 PT PT181993197T patent/PT3451334T/pt unknown
- 2014-01-28 WO PCT/EP2014/051630 patent/WO2014118175A1/en active Application Filing
- 2014-01-28 PT PT182062240T patent/PT3471093T/pt unknown
- 2014-01-28 KR KR1020157022497A patent/KR101897092B1/ko active IP Right Grant
- 2014-01-28 RU RU2015136505A patent/RU2660605C2/ru active
- 2014-01-28 EP EP18206224.0A patent/EP3471093B1/en active Active
- 2014-01-28 PL PL14701753T patent/PL2951817T3/pl unknown
- 2014-01-28 MY MYPI2015001884A patent/MY172238A/en unknown
- 2014-01-28 RU RU2015136502A patent/RU2631988C2/ru active
- 2014-01-28 ES ES18199319T patent/ES2796485T3/es active Active
- 2014-01-28 EP EP20164371.5A patent/EP3693962A1/en active Pending
- 2014-01-28 EP EP14701991.3A patent/EP2951818B1/en active Active
- 2014-01-28 PL PL18206224T patent/PL3471093T3/pl unknown
- 2014-01-28 KR KR1020177028123A patent/KR101926651B1/ko active IP Right Grant
- 2014-01-28 EP EP18199319.7A patent/EP3451334B1/en active Active
- 2014-01-28 TR TR2019/02849T patent/TR201902849T4/tr unknown
- 2014-01-28 WO PCT/EP2014/051631 patent/WO2014118176A1/en active Application Filing
- 2014-01-28 CA CA2898029A patent/CA2898029C/en active Active
- 2014-01-28 ES ES14701753T patent/ES2714289T3/es active Active
- 2014-01-28 CN CN201910419597.6A patent/CN110197667B/zh active Active
- 2014-01-28 KR KR1020167019944A patent/KR101778217B1/ko active IP Right Grant
- 2014-01-28 CN CN201480006656.2A patent/CN105190749B/zh active Active
- 2014-01-28 MX MX2015009601A patent/MX343572B/es active IP Right Grant
- 2014-01-28 CN CN201480019092.6A patent/CN105264597B/zh active Active
- 2014-01-28 BR BR112015017748-4A patent/BR112015017748B1/pt active IP Right Grant
- 2014-01-28 CN CN201910419610.8A patent/CN110189760B/zh active Active
- 2014-01-28 SG SG11201505915YA patent/SG11201505915YA/en unknown
- 2014-01-28 ES ES18206224T patent/ES2834929T3/es active Active
- 2014-01-28 CN CN201910420349.3A patent/CN110223704B/zh active Active
- 2014-01-28 SG SG11201505893TA patent/SG11201505893TA/en unknown
- 2014-01-28 CA CA2898024A patent/CA2898024C/en active Active
- 2014-01-28 EP EP20192419.8A patent/EP3761312A1/en active Pending
- 2014-01-28 ES ES14701991T patent/ES2709360T3/es active Active
- 2014-01-28 AU AU2014211543A patent/AU2014211543B2/en active Active
- 2014-01-28 MX MX2015009600A patent/MX345160B/es active IP Right Grant
- 2014-01-28 BR BR112015017633-0A patent/BR112015017633B1/pt active IP Right Grant
- 2014-01-28 KR KR1020157022827A patent/KR101757347B1/ko active IP Right Grant
- 2014-01-28 TR TR2019/02394T patent/TR201902394T4/tr unknown
- 2014-01-28 MY MYPI2015001882A patent/MY185164A/en unknown
- 2014-01-28 PT PT14701753T patent/PT2951817T/pt unknown
- 2014-01-28 PT PT14701991T patent/PT2951818T/pt unknown
- 2014-01-28 PL PL14701991T patent/PL2951818T3/pl unknown
- 2014-01-28 JP JP2015555679A patent/JP6289508B2/ja active Active
- 2014-01-28 JP JP2015555680A patent/JP6158352B2/ja active Active
- 2014-01-28 KR KR1020167019945A patent/KR101877906B1/ko active IP Right Grant
- 2014-01-28 PL PL18199319T patent/PL3451334T3/pl unknown
- 2014-01-28 EP EP14701753.7A patent/EP2951817B1/en active Active
- 2014-01-29 AR ARP140100295A patent/AR094679A1/es active IP Right Grant
- 2014-01-29 TW TW103103519A patent/TWI529700B/zh active
- 2014-01-29 TW TW103103524A patent/TWI536367B/zh active
- 2014-01-29 AR ARP140100294A patent/AR094678A1/es active IP Right Grant
-
2015
- 2015-07-28 US US14/811,748 patent/US9524724B2/en active Active
- 2015-07-29 US US14/812,354 patent/US9792920B2/en active Active
- 2015-08-27 ZA ZA2015/06269A patent/ZA201506269B/en unknown
- 2015-08-27 ZA ZA2015/06266A patent/ZA201506266B/en unknown
-
2016
- 2016-06-03 HK HK16106324.6A patent/HK1218345A1/zh unknown
- 2016-06-03 HK HK16106322.8A patent/HK1218344A1/zh unknown
-
2017
- 2017-09-07 US US15/698,442 patent/US10410642B2/en active Active
-
2019
- 2019-07-26 US US16/523,588 patent/US11031022B2/en active Active
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2015136502A (ru) | Заполнение шумом при аудиокодировании с перцепционным преобразованием | |
TWI476757B (zh) | 音訊編碼器、音訊解碼器、用以將音訊資訊編碼及解碼之方法、以及基於先前解碼頻譜值之範數來獲取脈絡子區值之電腦程式 | |
TWI578308B (zh) | 音訊信號頻譜之頻譜係數的編碼技術 | |
KR101736394B1 (ko) | 오디오 신호 인코딩/디코딩 방법 및 오디오 신호 인코딩/디코딩 장치 | |
AU2016231220B2 (en) | Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal | |
JP2016505171A5 (ru) | ||
TWI536369B (zh) | 用以基於線性預測編碼之於頻域中編碼的低頻率增強技術 | |
RU2016122865A (ru) | Кодер для кодирования аудиосигнала, система передачи аудио и способ определения значений коррекции | |
CN105556599A (zh) | 频谱包络的样本值的基于上下文的熵编码 | |
US11694701B2 (en) | Low-complexity tonality-adaptive audio signal quantization | |
CN104584122A (zh) | 使用改进的概率分布估计的基于线性预测的音频编码 | |
KR101860139B1 (ko) | 주기성 통합 포락 계열 생성 장치, 주기성 통합 포락 계열 생성 방법, 주기성 통합 포락 계열 생성 프로그램, 기록매체 | |
US20170272766A1 (en) | Encoding apparatus, decoding apparatus, and method and program for the same | |
TW201923747A (zh) | 控制編碼器及/或解碼器中頻寬之技術 |