RU2642894C2 - Аудиодекодер, имеющий модуль расширения полосы частот с модулем регулирования энергии - Google Patents

Аудиодекодер, имеющий модуль расширения полосы частот с модулем регулирования энергии Download PDF

Info

Publication number
RU2642894C2
RU2642894C2 RU2016101607A RU2016101607A RU2642894C2 RU 2642894 C2 RU2642894 C2 RU 2642894C2 RU 2016101607 A RU2016101607 A RU 2016101607A RU 2016101607 A RU2016101607 A RU 2016101607A RU 2642894 C2 RU2642894 C2 RU 2642894C2
Authority
RU
Russia
Prior art keywords
audio
signal
gain
current
module
Prior art date
Application number
RU2016101607A
Other languages
English (en)
Other versions
RU2016101607A (ru
Inventor
Жереми ЛЕКОНТ
Фабиан БАУЭР
Ральф ШПЕРШНАЙДЕР
Артур ТРИТТАРТ
Original Assignee
Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. filed Critical Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф.
Publication of RU2016101607A publication Critical patent/RU2016101607A/ru
Application granted granted Critical
Publication of RU2642894C2 publication Critical patent/RU2642894C2/ru

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/028Noise substitution, i.e. substituting non-tonal spectral components by noisy source
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/083Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being an excitation gain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques

Abstract

Изобретение относится к акустике, в частности, к устройствам для декодирования аудиосигналов. Аудиодекодер содержит модуль декодирования базовой полосы, модуль расширения полосы частот и средство комбинирования аудиосигнала базовой полосы и аудиосигнала расширения полосы частот. Модуль расширения полосы частот содержит модуль регулирования энергии, сконфигурированный таким образом, что в текущем аудиокадре, в котором происходит потеря аудиокадра, отрегулированная энергия сигнала для текущего аудиокадра для по меньшей мере одной полосы частот устанавливается на основе текущего коэффициента усиления для текущего аудиокадра. Текущий коэффициент усиления вычисляется на основе коэффициента усиления, взятого из предыдущего аудиокадра или из битового потока, и на основе оцененной энергии сигнала. Оцененная энергия сигнала вычисляется из спектра текущего аудиокадра аудиосигнала базовой полосы. Модуль расширения полосы частот содержит модуль задания коэффициента усиления. Модуль расширения частот содержит генератор шума и модуль синтеза сигналов. Технический результат – компенсация ошибок декодирования. 3 н. и 12 з.п. ф-лы, 5 ил.

Description

ОПИСАНИЕ
SBR (репликация спектральных полос), как другие методики расширения полосы частот, предназначена для кодирования и декодирования спектральных частей верхнего диапазона из аудиосигналов в добавление к этапу базового кодера. SBR стандартизована в [ISO09] и используется совместно с AAC в профиле MPEG-4 HE-AAC, который задействуется в различных стандартах приложений, например 3GPP [3GP12a], DAB+ [EBU10] и DRM [EBU12].
Декодирование SBR согласно уровню техники в сочетании с AAC описано в [ISO09, раздел 4.6.18].
Фиг.1 изображает декодер SBR согласно уровню техники, который содержит группу фильтров анализа и синтеза, декодирование данных SBR, генератор HF и средство регулирования HF:
- В декодировании SBR согласно уровню техники выходным сигналом из базового кодера является представление исходного сигнала с фильтрацией низких частот. Это является входным сигналом xpcm_вход для группы фильтров анализа QMF декодера SBR.
- Выходной сигнал из этой группы фильтров xQMF_ан передается генератору HF, где осуществляется корректирование. Корректирование, в сущности, является репликацией спектра низких полос в высокие полосы.
- xHF_корректированный с корректированным спектром теперь подается средству регулирования HF вместе со спектральной информацией высоких полос (огибающих), полученной из декодирования данных SBR. Информация огибающих будет декодирована по алгоритму Хаффмана, затем дифференциально декодирована и, наконец, деквантована для того, чтобы получить данные огибающих (см. фиг.2). Полученные данные огибающих являются набором коэффициентов масштабирования, которые покрывают конкретный промежуток времени, например полный кадр или его части. Средство регулирования HF надлежащим образом регулирует энергии корректированных высоких полос для того, чтобы максимально хорошо установить соответствие с исходными энергиями высоких полос на стороне кодера для каждой полосы k. Уравнение 1 и фиг.2 поясняют это:
gsbr[k]=EОпорн[k]/EОцУср[l]
EРег[k]=EОц[k] × gsbr[k] (1),
где
EОпорн[k] обозначает энергию для одной полосы k, переданную в закодированной форме в битовом потоке SBR;
EОц[k] обозначает энергию из одной высокой полосы k, корректированную генератором HF;
EОцУср[l] обозначает усредненную энергию высокой полосы внутри одной полосы l с коэффициентом масштабирования, определенной как диапазон полос между полосой начала kl начало и полосой конца kl конец:
Figure 00000001
(2)
EРег[k] обозначает энергию из одной высокой полосы k, отрегулированную средством регулирования HF с использованием усиленияsbr;
gsbr[k] обозначает один коэффициент усиления, возникший в результате деления, показанного в уравнении (1).
- Группа фильтров синтеза QMF декодирует обработанные сэмплы QMF xHF_рег в аудио PCM xpcm_выход.
Если восстановленный спектр имеет недостаток шума, который присутствовал в исходных высоких полосах, но не был скорректирован генератором HF, существует возможность добавить некоторый дополнительный шум с конкретным шумовым минимумом Q для каждой полосы k.
Figure 00000002
(3)
Кроме того, SBR согласно уровню техники обеспечивает возможность перемещения границ кадров SBR в конкретных пределах и множество огибающих на кадр.
Декодирование SBR в сочетании с CELP/HVXC описано в [EBU12, раздел 5.6.2.2]. Декодер CELP/HVXC+SBR в DRM является близко родственным с декодированием SBR согласно уровню техники в HE-AAC, описанным в разделе 1.1.1. В сущности, применима фиг.1.
Декодирование информации огибающих приспособлено к спектральным свойствам речеподобных сигналов, как описано в [EBU12, раздел 5.6.2.2.4].
В обычном декодировании AMR-WB возбуждение высоких полос получается путем генерирования белого шума uHB1(n). Мощность возбуждения высоких полос устанавливается равной мощности возбуждения нижних полос u2(n),
что означает
Figure 00000003
Наконец, возбуждение высоких полос находится посредством
Figure 00000004
где
Figure 00000005
- коэффициент усиления.
В режиме 23,85 кбит/с
Figure 00000005
декодируется из принятого индекса усиления (побочная информация).
В режимах 6,60, 8,85, 12,65, 14,25, 15,85, 18,25, 19,85 и 23,05 кбит/с gHB оценивается с использованием голосовой информации, ограниченной [0,1, 1,0]. В первую очередь, находится наклон синтеза eнаклон:
Figure 00000006
(6),
где
Figure 00000007
- синтез речи нижних полос с фильтрацией высоких частот
Figure 00000008
(n) с частотой среза 400 Гц. Затем gHB находится как
Figure 00000009
(7),
где gSP=1-eнаклон - усиление для сигнала речи, gBG=1,25 gSP - усиление для сигнала фонового шума, и wSP - весовая функция, установленная равной 1, когда обнаружение голосовой активности (VAD) включено, и 0, когда VAD выключено. gHB ограничено между [0,1, 1,0]. В случае голосовых сегментов, где меньше энергии присутствует на высоких частотах, eнаклон приближается к 1, что приводит в результате к более низкому усилению gHB. Это уменьшает энергию генерируемого шума в случае голосовых сегментов.
Затем синтезирующий фильтр LP высоких полос AHB(z) получается из взвешенного синтезирующего фильтра LP низких полос:
Figure 00000010
,
где
Figure 00000011
- интерполированный синтезирующий фильтр LP.
Figure 00000011
было вычислено с анализом сигнала с частотой сэмплирования 12,8 кГц, но теперь используется для сигнала с 16 кГц. Это означает, что полоса 5,1-5,6 кГц в области 12,8 кГц будет отображена на 8,4-7,0 кГц в области 16 кГц.
Затем uHB(n) фильтруется посредством AHB(z). Выходной сигнал этого синтеза высоких полос SHB(n) фильтруется посредством полосового FIR-фильтра HHB(z), который имеет полосу пропускания от 6 до 7 кГц. Наконец, SHB прибавляется к синтезированной речи для создания синтезированного выходного сигнала речи.
В AMR-WB+ сигнал HF составлен из составляющих частоты выше (fs/4) входного сигнала. Для представления сигнала HF на низком уровне задействуется подход расширения полосы частот (BWE). В BWE информация энергии посылается декодеру в форме спектральной огибающей и энергии кадра, но тонкая структура сигнала экстраполируется в декодере из принятого (декодированного) сигнала возбуждения в сигнале LF.
Спектр сэмплированного с понижением сигнала SHF может рассматриваться как свернутая версия высокочастотной полосы перед сэмплированием с понижением. Анализ LP выполняется над SHF(n) для получения набора коэффициентов, который моделирует спектральную огибающую этого сигнала. Обычно необходимо меньше параметров, чем в сигнале LF. Здесь используется фильтр порядка 8. Коэффициенты LP затем преобразуются в ISP-представление и квантуются для передачи.
Синтез сигнала HF осуществляет некий вид механизма расширения полосы частот (BWE) и использует некоторые данные от декодера LF. Это является усовершенствованием механизма BWE, используемого в декодере речи AMR-WB (см. выше). Декодер HF подробно изображен на фиг.3.
Сигнал HF синтезируется в 2 этапа:
1. Расчет возбуждения HF;
2. Вычисление сигнала HF из возбуждения HF.
Возбуждение HF получается путем формирования сигнала возбуждения LF во временной области со скалярными коэффициентами (или усилениями) на основе подкадров с 64 сэмплами. Это возбуждение HF подвергается пост-обработке для уменьшения "зашумленности" выходного сигнала и затем фильтруется синтезирующим фильтром HF линейного предсказания 1/AHF(z). Результат дополнительно подвергается пост-обработке для сглаживания вариаций энергии. Для дополнительной информации просим ознакомиться с [3GP09].
Скрытие потери пакетов в SBR в сочетании с AAC определено в 3GPP TS 26.402 [3GP12a, раздел 5.2] и было впоследствии использовано повторно в DRM [EBU12, раздел 5.6.3.1] и DAB [EBU10, раздел A2].
В случае потери кадра количество огибающих на каждый кадр устанавливается равным одной и последние действительные принятые данные огибающих используются повторно и уменьшаются по энергии на постоянный коэффициент для каждого скрытого кадра.
Получающиеся в результате данные огибающих затем подаются в обычный процесс декодирования, где средство регулирования HF использует их для вычисления усилений, которые используются для регулирования корректированных высоких полос из генератора HF. Остальное декодирование SBR происходит обычным образом.
Сверх того, закодированные дельта-значения шумового минимума устанавливаются равными нулю, что позволяет декодированному шумовому минимуму дельта-шума оставаться статичным. В конце процесса декодирования это означает, что энергия шумового минимума следует за энергией сигнала HF.
Кроме того, флаги для добавления синусов очищаются.
Скрытие SBR согласно уровню техники также отвечает за восстановление. Оно обеспечивает плавный переход от скрытого сигнала к верным образом декодированному сигналу в смысле перепадов энергии, которые могут возникать ввиду несоответствующих друг другу границ кадров.
Скрытие SBR согласно уровню техники в сочетании с CELP/HVXC описано в [EBU12, раздел 5.6.3.2] и кратко очерчивается далее:
Всегда, когда поврежденный кадр обнаружен, предварительно определенный набор значений данных применяется к декодеру SBR. Это обеспечивает "статичную спектральную огибающую высокой полосы при низком относительном уровне проигрывания, демонстрирующую спад в отношении более высоких частот" [EBU12, раздел 5.6.3.2]. Здесь скрытие SBR добавляет некий вид комфортного шума, который не имеет специального затухания в области SBR. Это защищает уши слушателя от потенциально громких всплесков аудио и поддерживает впечатление постоянной полосы частот.
Скрытие согласно уровню техники BWE из G.718 описано в [ITU08, 7.11.1.7.1] и кратко очерчивается следующим образом:
В режиме малой задержки, который доступен исключительно для слоя 1 и 2, скрытие высокочастотной полосы 6000-7000 Гц выполняется точно тем же способом, что и тогда, когда никаких стираний кадров не происходит. Операция декодера чистого канала для слоев 1, 2 и 3 является следующей: слепое расширение полосы частот применяется. Спектр в диапазоне 6400-7000 Гц заполняется сигналом белого шума, надлежащим образом масштабированным в области возбуждения (энергия высокой полосы должна соответствовать энергии низкой полосы), затем он синтезируется посредством фильтра, найденного путем взвешивания из того же самого синтезирующего фильтра LP, который используется в области 12,8 кГц. Для слоев 4 и 5 никакое расширение полосы частот не выполняется, поскольку те слои покрывают полную полосу вплоть до 8 кГц.
В операции по умолчанию обработка низкой сложности выполняется для реконструкции высокочастотной полосы синтезированного сигнала при частоте сэмплирования 16 кГц. В первую очередь возбуждение масштабированной высокочастотной полосы U''HB(n) линейно затухает на протяжении кадра следующим образом
Figure 00000012
(9),
где длина кадра равна 320 сэмплов, и gзат(n) - коэффициент затухания, который дается посредством
Figure 00000013
(10)
В вышеуказанном уравнении
Figure 00000014
- среднее усиление высоты. Это то же самое усиление, которое используется в течение скрытия адаптивной кодовой книги. Затем память полосового фильтра в диапазоне частот 6000-7000 Гц затухает с использованием gзат(n), найденного в уравнении 10, для предотвращения каких-либо разрывов. Наконец, высокочастотный сигнал возбуждения u'''(n), фильтруется посредством синтезирующего фильтра. Синтезированный сигнал затем добавляется к скрытому синтезу при частоте сэмплирования 16 кГц.
Скрытие согласно уровню техники слепого расширения полосы частот в AMR-WB очерчивается в [3GP12b, 6.2.4] и кратко резюмируется здесь:
Когда кадр потерян или частично потерян, параметр усиления высоких полос не принимается, и оценка для усиления высоких полос используется вместо него. Это означает, что в случае плохих/потерянных кадров речи восстановление высоких полос оперирует одним и тем же образом для всех различных режимов.
В случае, когда кадр потерян, синтезирующий фильтр LP высоких полос получают обычным образом посредством коэффициентов LPC из базовой полосы. Единственное исключение состоит в том, что коэффициенты LPC не были декодированы из битового потока, но были экстраполированы с использованием обычного подхода скрытия AMR-WB.
Скрытие согласно уровню техники расширения полосы частот в AMR-WB+ очерчивается в [3GP09, 6.2] и кратко резюмируется здесь:
В случае потери пакета управляющие данные, которые являются внутренними для декодера HF, генерируются из вектора указателя плохого кадра BFI=(bfi0, bfi1, bfi2, bfi3). Этими данными являются bfiisfhf, BFIУСИЛЕНИЕ и количество подкадров для интерполяции ISF. Природа этих данных определена более подробно ниже:
bfiisfhf - двоичный флаг, указывающий потерю параметров ISF. Поскольку параметры ISF для сигнала HF всегда передаются в первом пакете (содержащем первый подкадр), являющимся HF20, 40 или 80, флаг потери всегда устанавливается равным указателю bfi первого подкадра (bfi0). То же самое остается верным для указания потерянных усилений HF. Если первый пакет/подкадр текущего режима потерян (HF20, 40 или 80), усиление потеряно и должно быть скрыто.
Скрытие векторов ISF HF очень подобно скрытию ISF для базовых ISF. Основная идея заключается в повторном использовании последнего хорошего вектора ISF, но смещает его в направлении вектора средних значений ISF (где вектор средних значений ISF формируется автономно):
Figure 00000015
(11)
Усиления BWE
Figure 00000016
оцениваются согласно следующему исходному коду (в коде:
Figure 00000017
; 2.807458 - постоянная декодера).
/* использовать прошлые усиления, слегка сдвинутые в сторону средних значений */
*past_q=(0.9f*(past_q+20.0f)) - 20.0f;
for (i=0; i<4; i++) {
gain_q[i]=*past_q+2.807458f;
}
tmp=0.0;
for (i=0; i<4; i++) {
tmp += gain_q[i],
}
*past_q=0.25f*tmp - 2.807458f;
Для получения "усилений для установления соответствия амплитуде на fs/4" выполняется тот же самый алгоритм, что и в декодировании чистого канала, но с тем расширением, что ISF для части HF и/или LF могут уже быть скрыты. Все последующие этапы, такие как линейная интерполяция дБ, суммирование и применение усилений, являются теми же самыми, что и в случае чистого канала.
Для получения возбуждения та же самая процедура применяется, что и в верным образом принятом кадре, где возбуждение нижних полос используется после того, как:
- оно было рандомизировано
- оно было усилено во временной области посредством усилений подкадров
- оно было сформировано в частотной области посредством фильтра LP
- энергия была сглажена с течением времени.
Затем синтез выполняется согласно фиг.3.
Публикация конференции AES 6789: Шнайдер, Краусс и Эрет [SKE06] описывает методику скрытия, которая повторно использует последние действительные данные огибающих SBR. Если более одного кадра SBR потеряно, применяется затухание. "Базовым принципом является просто зафиксировать последние известные действительные значения огибающих SBR, пока обработка SBR не сможет продолжиться с новыми переданными данными. Дополнительно затухание выполняется, если более одного кадра SBR является не декодируемым".
Публикация конференции AES 6962: Сан-Ук Рю и Кеннет Роуз [RR06] описывает методику скрытия, которая оценивает параметрическую информацию, задействующую данные SBR из предыдущего и следующего кадра. Огибающие высоких полос адаптивным образом оцениваются из изменения энергии в окружающих кадрах.
Концепции скрытия потери пакета могут вырабатывать сенсорно ухудшающийся аудиосигнал во время потери пакета.
Целью настоящего изобретения является обеспечение аудиодекодера и способа, имеющих улучшенную концепцию скрытия потери пакета.
Эта цель может достигаться посредством аудиодекодера, сконфигурированного для создания аудиосигнала из битового потока, содержащего аудиокадры, причем аудиодекодер содержит:
модуль декодирования базовой полосы, сконфигурированный для получения непосредственно декодированного аудиосигнала базовой полосы из битового потока;
модуль расширения полосы частот, сконфигурированный для получения параметрически декодированного аудиосигнала расширения полосы частот из аудиосигнала базовой полосы и из битового потока, причем аудиосигнал расширения полосы частот основан на сигнале частотной области, имеющем по меньшей мере одну полосу частот; и
средство комбинирования, сконфигурированное для комбинирования аудиосигнала базовой полосы и аудиосигнала расширения полосы частот с целью создания аудиосигнала;
причем модуль расширения полосы частот содержит модуль регулирования энергии, сконфигурированный таким образом, что в текущем аудиокадре, в котором происходит потеря аудиокадра, отрегулированная энергия сигнала для текущего аудиокадра для по меньшей мере одной полосы частот устанавливается
на основе текущего коэффициента усиления для текущего аудиокадра, причем текущий коэффициент усиления получается из коэффициента усиления из предыдущего аудиокадра или из битового потока, и
на основе оцененной энергии сигнала для по меньшей мере одной полосы частот, причем оцененная энергия сигнала получается из спектра текущего аудиокадра аудиосигнала базовой полосы.
Аудиодекодер согласно изобретению связывает модуль расширения полосы частот с модулем декодирования базовой полосы в плане энергии или, иными словами, обеспечивает то, что модуль расширения полосы частот следует за модулем декодирования базовой полосы в смысле энергии в течение скрытия независимо от того, что делает модуль декодирования базовой полосы.
Нововведение этого подхода состоит в том (в случае скрытия), что генерирование высоких полос больше не выполняется строго с возможностью огибания энергий. Посредством методики фиксации усиления, энергии высоких полос адаптированы к энергиям низких полос во время скрытия и, следовательно, больше не полагаются только на переданные данные в последнем хорошем кадре. Эта обработка применяет идею использования информации низких полос для восстановления высоких полос.
Посредством этого подхода никаких дополнительных данных (например, коэффициента затухания) нет необходимости переносить от базового кодера к кодеру расширения полосы частот. Это делает методику легко применимой к любому кодеру с расширением полосы частот, в особенности к SBR, где вычисление усиления уже выполняется изначально (уравнение 1).
Скрытие изобретательского аудиодекодера принимает в расчет уклон затухания модуля декодирования базовой полосы. Это приводит к задуманному поведению затухания в целом:
Ситуации, в которых энергии полос частот модуля декодирования базовой полосы затухают медленнее, чем энергии полос частот модуля расширения полосы частот, что станет заметным и вызовет неприятное впечатление сигнала с ограниченной полосой, избегаются.
Кроме того, ситуации, в которых энергии в полосах частот модуля декодирования базовой полосы затухают быстрее, чем энергии полос частот модуля расширения полосы частот, что может вносить артефакты, поскольку полосы частот модуля расширения полосы частот слишком усиливаются, по сравнению с полосами частот модуля декодирования базовой полосы, также избегаются.
В отличие от декодера без затухания, имеющего расширение полосы частот с предварительно определенными уровнями энергии (как, например, декодер CELP/HVXC+SBR), который сохраняет только наклон спектра конкретного типа сигнала, изобретательский аудиодекодер работает независимо от спектральных характеристик сигналов так, что сенсорно декодированное ухудшение аудиосигнала избегается.
Предлагаемая методика может быть использована с любым способом расширения полосы частот (BWE) в дополнение к модулю декодирования базовой полосы (далее базовый кодер). Большая часть методики расширения полосы частот основана на усилении на каждую полосу между исходными уровнями энергии и уровнями энергии, полученными после копирования базового спектра. Предлагаемая методика работает не с энергиями предыдущего аудиокадра, как предшествующий уровень техники, а с усилениями предыдущего аудиокадра.
Когда аудиокадр потерян или нечитаем (или, иными словами, если потеря аудиокадра происходит), усиления из последнего хорошего кадра подаются в обычный процесс декодирования модуля декодирования базовой полосы, который регулирует энергии полос частот модуля расширения полосы частот (см. уравнение 1). Это формирует скрытие. Любое затухание, применяемое в модуле декодирования базовой полосы посредством скрытия модуля декодирования базовой полосы, будет автоматически применяться к энергиям полос частот модуля расширения полосы частот путем фиксирования отношения энергии между низкой и высокой полосой.
Сигнал частотной области, имеющий по меньшей мере одну полосу частот, может быть, например, сигналом возбуждения алгебраического линейного предсказания с кодовым возбуждением (сигналом возбуждения ACELP).
В некоторых вариантах осуществления модуль расширения полосы частот содержит модуль обеспечения коэффициента усиления, сконфигурированный для перенаправления текущего коэффициента усиления по меньшей мере в текущем аудиокадре, в котором происходит потеря аудиокадра, к модулю регулирования энергии.
В предпочтительном варианте осуществления модуль обеспечения коэффициента усиления сконфигурирован таким образом, что в текущем аудиокадре, в котором происходит потеря аудиокадра, текущий коэффициент усиления является коэффициентом усиления предыдущего аудиокадра.
Этот вариант осуществления полностью деактивирует затухание, содержащееся в модуле декодирования расширения полосы частот, путем фиксации только усилений, найденных для последней огибающей в последнем хорошем кадре:
Figure 00000018
(12),
где
Figure 00000019
обозначает энергию из одной полосы частот k модуля расширения полосы частот, отрегулированную для максимально хорошего выражения исходного распределения энергии; gbwe [n][k], gbwe[k] обозначает коэффициент усиления текущего кадра; и gbwe [n-1][k] обозначает коэффициент усиления предыдущего кадра.
В другом предпочтительном варианте осуществления модуль обеспечения коэффициента усиления сконфигурирован таким образом, что в текущем аудиокадре, в котором потеря кадра происходит, текущий коэффициент усиления вычисляется из коэффициента усиления предыдущего аудиокадра и из класса сигнала предыдущего аудиокадра.
Этот вариант осуществления использует средство классификации сигналов для вычисления усилений на основе прошлых усилений, а также адаптивно для класса сигнала ранее принятого кадра:
Figure 00000020
(13),
где f(gbwe [ n -1],cсиг [ n -1]) обозначает функцию, зависящую от коэффициента усиления gbwe [ n -1] предыдущего аудиокадра и класса сигнала cсиг [ n -1] предыдущего аудиокадра. Классы сигналов могут ссылаться на классы звуков речи, таких как: шумные (с подклассами: взрывные, аффрикативные, фрикативные), сонорные (с подклассами: носовые, одноударные, аппроксиманты, гласные), боковые, дрожащие.
В предпочтительном варианте осуществления модуль обеспечения коэффициента усиления сконфигурирован для вычисления количества последующих аудиокадров, в которых потери аудиокадра происходят, и сконфигурирован для исполнения процедуры понижения коэффициента усиления в случае, когда количество последующих аудиокадров, в которых потери аудиокадра происходят, превосходит предварительно определенное количество.
Если фрикативный звук происходит непосредственно перед всплесковой потерей кадра (множественными потерями кадров в последующих аудиокадрах), характерное затухание по умолчанию модуля декодирования базовой полосы может быть слишком медленным для обеспечения приятного и естественного звука в комбинации с фиксацией усиления. Воспринимаемым результатом этой проблемы может быть продленный фрикативный звук со слишком большим количеством энергии в полосах частот модуля расширения полосы частот. По этой причине проверка на множественные потери кадров может выполняться. Если эта проверка положительна, процедура понижения коэффициента усиления может исполняться.
В предпочтительном варианте осуществления процедура понижения коэффициента усиления содержит этап понижения текущего коэффициента усиления путем деления текущего коэффициента усиления на первое число в случае, когда текущий коэффициент усиления превосходит первый порог. Посредством этих признаков, усиления, которые превосходят первый порог (который может быть определен эмпирически), уменьшаются.
В предпочтительном варианте осуществления процедура понижения коэффициента усиления содержит этап понижения текущего коэффициента усиления путем деления текущего коэффициента усиления на второе число, которое больше первого числа, в случае, когда текущий коэффициент усиления превосходит второй порог, который больше первого порога. Эти признаки обеспечивают то, что чрезвычайно высокие усиления уменьшаются еще быстрее. Все усиления, превосходящие второй порог, будут уменьшаться быстрее.
В некоторых вариантах осуществления процедура понижения коэффициента усиления содержит этап установления текущего коэффициента усиления равным первому порогу в случае, когда текущий порог после понижения ниже первого порога. Посредством этих признаков уменьшенным усилениям не позволяется падать ниже первого порога.
Пример можно увидеть в псевдокоде 1:
/* ограничить усиление в случае множественной потери кадров */
#ОПРЕДЕЛИТЬ BWE_УСИЛЕНИЕУМЕНЬШ 10
если (предыдущийФлагОшибкиКадра && (усиление[k] > BWE_УСИЛЕНИЕУМЕНЬШ) ) {
/* усиления, превосходящие первый порог в 50 раз, будут уменьшаться быстрее */
если (усиление[k] > 50*BWE_УСИЛЕНИЕУМЕНЬШ) {
усиление[k] /= 6;
}
иначе {
усиление[k] /= 4;
}
/* не позволять усилениям падать ниже BWE_УСИЛЕНИЕУМЕНЬШ */
если (усиление[k] < BWE_УСИЛЕНИЕУМЕНЬШ) {
усиление[k]=BWE_УСИЛЕНИЕУМЕНЬШ;
}
}
где предыдущийФлагОшибкиКадра - флаг, который указывает, присутствует ли множественная потеря кадра, BWE_УСИЛЕНИЕУМЕНЬШ обозначает первый порог, 50*BWE_УСИЛЕНИЕУМЕНЬШ обозначает второй порог, и усиление[k] обозначает текущий коэффициент усиления для полосы частот k.
В некоторых вариантах осуществления модуль расширения полосы частот содержит модуль генератора шума, сконфигурированный для добавления шума в по меньшей мере одну полосу частот, причем в текущем аудиокадре, в котором происходит потеря аудиокадра, отношение энергии сигнала к энергии шума по меньшей мере одной полосы частот предыдущего аудиокадра используется для вычисления энергии шума текущего аудиокадра.
В случае, когда существует признак шумового минимума (т.е. дополнительные составляющие шума для поддержания зашумленности исходного сигнала), осуществляемый в расширении полосы частот, необходимо задействовать идею фиксирования усиления также и в отношении шумового минимума. Для достижения этого уровни энергии шумового минимума нескрытых кадров преобразуются в шумовой коэффициент, принимая в расчет энергию полос частот модуля расширения полосы частот. Коэффициент сохраняется в буфер и будет основой для уровня шума в случае скрытия. Основным преимуществом является лучшее объединение шумового минимума с энергией базового кодера ввиду вычисления коэффициента пред_шум[k].
Псевдокод 2 показывает это:
для (k=полосы) {
если !(флагОшибкиКадра) {
пред_шум[k]=nrgВысокаяПолоса[k]/уровеньШума[k];
}
иначе {
уровеньШума[k]=nrgВысокаяПолоса[k]/пред_шум[k];
}
}
где флагОшибкиКадра - флаг, указывающий, присутствует ли потеря кадра, и пред_шум[k] - отношение между энергией nrgВысокаяПолоса[k] полосы частот k и уровнем шума уровеньШума[k] полосы частот k.
В предпочтительном варианте осуществления аудиодекодер содержит модуль анализа спектра, сконфигурированный для установления спектра текущего аудиокадра аудиосигнала базовой полосы и для получения оцененной энергии сигнала для текущего кадра для по меньшей мере одной полосы частот из спектра текущего аудиокадра аудиосигнала базовой полосы.
В некоторых вариантах осуществления модуль обеспечения коэффициента усиления сконфигурирован таким образом, что, в случае, когда текущий аудиокадр, в котором не происходит потери аудиокадра, последовательно следует за предыдущим аудиокадром, в котором происходит потеря аудиокадра, коэффициент усиления, принятый для текущего аудиокадра, используется для текущего кадра, если задержка между аудиокадрами модуля расширения полосы частот относительно аудиокадров модуля декодирования базовой полосы меньше порога задержки, в то время как коэффициент усиления из предыдущего аудиокадра используется для текущего кадра, если задержка между аудиокадрами модуля расширения полосы частот относительно аудиокадров модуля декодирования базовой полосы больше порога задержки.
Вдобавок к скрытию, в модуле расширения полосы частот особое внимание должно быть уделено кадрированию. Аудиокадры модуля расширения полосы частот и аудиокадры модуля декодирования базовой полосы часто не точно выровнены, а могут иметь некоторую задержку. Так что может произойти то, что один потерянный пакет содержит задерживаемые данные расширения полосы частот в отношении базового сигнала, содержащегося в том же самом пакете.
Результатом в этом случае является то, что первый хороший пакет после потери может содержать данные расширения для создания частей полос частот модуля расширения полосы частот предыдущего аудиокадра модуля декодирования базовой полосы, который уже был скрыт в декодере.
По этой причине кадрирование должно учитываться в течение восстановления в зависимости от соответственных свойств модуля базового декодирования и модуля расширения полосы частот. Это может означать необходимость расценивать первый аудиокадр или его части в модуле расширения полосы частот как ошибочные и не применять новейший коэффициент усиления сразу, а оставить зафиксированные усиления от первого аудиокадра для одного дополнительного кадра.
То, оставлять или не оставлять зафиксированные усиления для первого хорошего кадра, зависит от задержки. Экспериментальное применение к кодекам с различными задержками показало различные преимущества для кодеков с различными задержками. Для кодеков с довольно малыми задержками (например 1 мс) лучше использовать новейшие усиления для первого хорошего аудиокадра.
В предпочтительном варианте осуществления модуль расширения полосы частот содержит модуль генератора сигналов, сконфигурированный для создания необработанного сигнала частотной области, имеющего по меньшей мере одну полосу частот, который перенаправляется к модулю регулирования энергии, на основе аудиосигнала базовой полосы и битового потока.
В предпочтительном варианте осуществления модуль расширения полосы частот содержит модуль синтеза сигнала, сконфигурированный для создания аудиосигнала расширения полосы частот из сигнала частотной области.
Цель изобретения может достигаться посредством способа для создания аудиосигнала из битового потока, содержащего аудиокадры. Способ содержит этапы, на которых:
получают непосредственно декодированный аудиосигнал базовой полосы из битового потока;
получают параметрически декодированный аудиосигнал расширения полосы частот из аудиосигнала базовой полосы и из битового потока, причем аудиосигнал расширения полосы частот основан на сигнале частотной области, имеющем по меньшей мере одну полосу частот; и
комбинируют аудиосигнал базовой полосы и аудиосигнал расширения полосы частот с целью создания аудиосигнала;
причем в текущем аудиокадре, в котором происходит потеря аудиокадра, отрегулированная энергия сигнала для текущего аудиокадра для по меньшей мере одной полосы частот устанавливается
на основе текущего коэффициента усиления для текущего аудиокадра, причем текущий коэффициент усиления получается из коэффициента усиления из предыдущего аудиокадра или из битового потока, и
на основе оцененной энергии сигнала для по меньшей мере одной полосы частот, причем оцененная энергия сигнала получается из спектра текущего аудиокадра аудиосигнала базовой полосы.
Цель изобретения может дополнительно достигаться посредством компьютерной программы для выполнения, при запуске на компьютере или процессоре, способа, описанного выше.
Предпочтительные варианты осуществления изобретения далее рассматриваются в отношении сопроводительных чертежей, на которых:
фиг.4 изображает вариант осуществления аудиодекодера согласно изобретению в схематичном виде; и
фиг.5 изображает кадрирование варианта осуществления аудиодекодера согласно изобретению.
Фиг.4 изображает вариант осуществления аудиодекодера 1 согласно изобретению в схематичном виде. Аудиодекодер 1 сконфигурирован для создания аудиосигнала AS из битового потока BS, содержащего аудиокадры AF. Аудиодекодер 1 содержит:
модуль декодирования базовой полосы, сконфигурированный для получения непосредственно декодированного аудиосигнала базовой полосы CBS из битового потока BS;
модуль 2 расширения полосы частот, сконфигурированный для получения параметрически декодированного аудиосигнала расширения полосы частот BES из аудиосигнала базовой полосы CBS и из битового потока BS, причем аудиосигнал расширения полосы частот BES основан на сигнале частотной области FDS, имеющем по меньшей мере одну полосу частот FB; и
средство 4 комбинирования, сконфигурированное для комбинирования аудиосигнала базовой полосы CBS и аудиосигнала расширения полосы частот BES с целью создания аудиосигнала AS;
причем модуль 3 расширения полосы частот содержит модуль 5 регулирования энергии, сконфигурированный таким образом, что в текущем аудиокадре AF2, в котором происходит потеря аудиокадра AFL, отрегулированная энергия сигнала для текущего аудиокадра AF2 для по меньшей мере одной полосы частот FB устанавливается
на основе текущего коэффициента усиления CGF для текущего аудиокадра AF2, причем текущий коэффициент усиления CGF получается из коэффициента усиления из предыдущего аудиокадра AF1 или из битового потока BS, и
на основе оцененной энергии сигнала EE для по меньшей мере одной полосы частот FB, причем оцененная энергия сигнала EE получается из спектра текущего аудиокадра AF2 аудиосигнала базовой полосы CBS.
Аудиодекодер 1 согласно изобретению связывает модуль 3 расширения полосы частот с модулем декодирования базовой полосы в плане энергии или, иными словами, обеспечивает то, что модуль 3 расширения полосы частот следует за модулем 2 декодирования базовой полосы в смысле энергии в течение скрытия независимо от того, что делает модуль 2 декодирования базовой полосы.
Нововведение этого подхода состоит в том (в случае скрытия), что генерирование высоких полос больше не выполняется строго с возможностью огибания энергий. Посредством методики фиксации усиления, энергии высоких полос адаптированы к энергиям низких полос во время скрытия и, следовательно, больше не полагаются только на переданные данные в последнем хорошем кадре AF1. Эта обработка применяет идею использования информации низких полос для восстановления высоких полос.
Посредством этого подхода никаких дополнительных данных (например коэффициента затухания) нет необходимости переносить от базового кодера 2 к кодеру 3 расширения полосы частот. Это делает методику легко применимой к любому кодеру 1 с расширением 3 полосы частот, в особенности к SBR, где вычисление усиления уже выполняется изначально (уравнение 1).
Скрытие изобретательского аудиодекодера 1 принимает в расчет уклон затухания модуля 2 декодирования базовой полосы. Это приводит к задуманному поведению затухания в целом:
Ситуации, в которых энергии полос частот FB модуля 2 декодирования базовой полосы затухают медленнее, чем энергии полос частот FB модуля 3 расширения полосы частот, что станет заметным и вызовет неприятное впечатление сигнала с ограниченной полосой, избегаются.
Кроме того, ситуации, в которых энергии в полосах частот FB модуля 2 декодирования базовой полосы затухают быстрее, чем энергии полос частот FB модуля 3 расширения полосы частот, что может вносить артефакты, поскольку полосы частот FB модуля 3 расширения полосы частот слишком усиливаются, по сравнению с полосами частот FB модуля 2 декодирования базовой полосы, также избегаются.
В отличие от декодера без затухания, имеющего расширение полосы частот с предварительно определенными уровнями энергии (как, например, декодер CELP/HVXC+SBR), который сохраняет только наклон спектра конкретного типа сигнала, изобретательский аудиодекодер 1 работает независимо от спектральных характеристик сигналов так, что сенсорно декодированное ухудшение аудиосигнала AS избегается.
Предлагаемая методика может быть использована с любым способом расширения полосы частот (BWE) в дополнение к модулю 2 декодирования базовой полосы (далее базовый кодер). Большая часть методики расширения полосы частот основана на усилении на каждую полосу между исходными уровнями энергии и уровнями энергии, полученными после копирования базового спектра. Предлагаемая методика работает не с энергиями предыдущего аудиокадра, как предшествующий уровень техники, а с усилениями предыдущего аудиокадра AF1.
Когда аудиокадр AF2 потерян или нечитаем (или, иными словами, если происходит потеря аудиокадра AFL), усиления из последнего хорошего кадра подаются в обычный процесс декодирования модуля 2 декодирования базовой полосы, который регулирует энергии полос частот FB модуля 3 расширения полосы частот (см. уравнение 1). Это формирует скрытие. Любое затухание, применяемое в модуле 2 декодирования базовой полосы посредством скрытия модуля декодирования базовой полосы, будет автоматически применяться к энергиям полос частот FB модуля 3 расширения полосы частот путем фиксирования отношения энергии между низкой и высокой полосой.
В некоторых вариантах осуществления модуль 3 расширения полосы частот содержит модуль 6 обеспечения коэффициента усиления, сконфигурированный для перенаправления текущего коэффициента усиления CGF по меньшей мере в текущем аудиокадре AF2, в котором происходит потеря аудиокадра AFL, к модулю 5 регулирования энергии.
В предпочтительном варианте осуществления модуль 6 обеспечения коэффициента усиления сконфигурирован таким образом, что в текущем аудиокадре AF2, в котором происходит потеря аудиокадра AFL, текущий коэффициент усиления CGF является коэффициентом усиления предыдущего аудиокадра AF1.
Этот вариант осуществления полностью деактивирует затухание, содержащееся в модуле 3 декодирования расширения полосы частот, путем фиксации только усилений, найденных для последней огибающей в последнем хорошем кадре:
В другом предпочтительном варианте осуществления модуль 6 обеспечения коэффициента усиления сконфигурирован таким образом, что в текущем аудиокадре AF2, в котором потеря кадра AFL происходит, текущий коэффициент усиления CGS вычисляется из коэффициента усиления предыдущего аудиокадра и из класса сигнала предыдущего аудиокадра.
Этот вариант осуществления использует средство классификации сигналов для вычисления усилений GCS на основе прошлых усилений, а также адаптивно для класса сигнала ранее принятого кадра AF1. Классы сигналов могут ссылаться на классы звуков речи, таких как: шумные (с подклассами: взрывные, аффрикативные, фрикативные), сонорные (с подклассами: носовые, одноударные, аппроксиманты, гласные), боковые, дрожащие.
В предпочтительном варианте осуществления модуль 6 обеспечения коэффициента усиления сконфигурирован для вычисления количества последующих аудиокадров, в которых происходят потери аудиокадра AFL, и сконфигурирован для исполнения процедуры понижения коэффициента усиления в случае, когда количество последующих аудиокадров, в которых происходят потери аудиокадра AFL, превосходит предварительно определенное количество.
Если фрикативный звук происходит непосредственно перед всплесковой потерей кадра (множественными потерями кадров AFL в последующих аудиокадрах AF), характерное затухание по умолчанию модуля 2 декодирования базовой полосы может быть слишком медленным для обеспечения приятного и естественного звука в комбинации с фиксацией усиления. Воспринимаемым результатом этой проблемы может быть продленный фрикативный звук со слишком большим количеством энергии в полосах частот FB модуля 3 расширения полосы частот. По этой причине проверка на множественные потери кадров AFL может выполняться. Если эта проверка положительна, процедура понижения коэффициента усиления может исполняться.
В предпочтительном варианте осуществления процедура понижения коэффициента усиления содержит этап понижения текущего коэффициента усиления путем деления текущего коэффициента усиления на первое число в случае, когда текущий коэффициент усиления превосходит первый порог. Посредством этих признаков, усиления, которые превосходят первый порог (который может быть определен эмпирически), уменьшаются.
В предпочтительном варианте осуществления процедура понижения коэффициента усиления содержит этап понижения текущего коэффициента усиления путем деления текущего коэффициента усиления на второе число, которое больше первого числа, в случае, когда текущий коэффициент усиления превосходит второй порог, который больше первого порога. Эти признаки обеспечивают то, что чрезвычайно высокие усиления уменьшаются еще быстрее. Все усиления, превосходящие второй порог, будут уменьшаться быстрее.
В некоторых вариантах осуществления процедура понижения коэффициента усиления содержит этап установления текущего коэффициента усиления равным первому порогу в случае, когда текущий порог после понижения ниже первого порога. Посредством этих признаков уменьшенным усилениям не позволяется падать ниже первого порога.
В некоторых вариантах осуществления модуль 3 расширения полосы частот содержит модуль 7 генератора шума, сконфигурированный для добавления шума NOI в по меньшей мере одну полосу частот FB, причем в текущем аудиокадре AF2, в котором происходит потеря аудиокадра AFL, отношение энергии сигнала к энергии шума по меньшей мере одной полосы частот FB предыдущего аудиокадра AF1 используется для вычисления энергии шума текущего аудиокадра AF2.
В случае, когда существует признак шумового минимума (т.е. дополнительные составляющие шума для поддержания зашумленности исходного сигнала), осуществляемый в расширении 3 полосы частот, необходимо задействовать идею фиксирования усиления также и в отношении шумового минимума. Для достижения этого уровни энергии шумового минимума нескрытых кадров преобразуются в шумовой коэффициент, принимая в расчет энергию полос частот модуля расширения полосы частот. Коэффициент сохраняется в буфер и будет основой для уровня шума в случае скрытия. Основным преимуществом является лучшее объединение шумового минимума с энергией базового кодера ввиду вычисления коэффициента.
В предпочтительном варианте осуществления аудиодекодер 1 содержит модуль 8 анализа спектра, сконфигурированный для установления спектра текущего аудиокадра AF2 аудиосигнала базовой полосы CBS и для получения оцененной энергии сигнала EE для текущего кадра AF2 для по меньшей мере одной полосы частот FB из спектра текущего аудиокадра AF2 аудиосигнала базовой полосы CBS.
В предпочтительном варианте осуществления модуль 3 расширения полосы частот содержит модуль 9 генератора сигналов, сконфигурированный для создания необработанного сигнала частотной области RFS, имеющего по меньшей мере одну полосу частот FB, который перенаправляется к модулю 5 регулирования энергии, на основе аудиосигнала базовой полосы CBS и битового потока BS.
В предпочтительном варианте осуществления модуль 3 расширения полосы частот содержит модуль 10 синтеза сигнала, сконфигурированный для создания аудиосигнала расширения полосы частот BES из сигнала частотной области FDS.
Фиг.5 изображает кадрирование варианта осуществления аудиодекодера 1 согласно изобретению.
В некоторых вариантах осуществления модуль 6 обеспечения коэффициента усиления сконфигурирован таким образом, что в случае, когда текущий аудиокадр AF2, в котором потеря аудиокадра AFL не происходит, последовательно следует за предыдущим аудиокадром AF1, в котором происходит потеря аудиокадра AFL, коэффициент усиления, принятый для текущего аудиокадра AF2, используется для текущего кадра AF2, если задержка DEL между аудиокадрами AF модуля 3 расширения полосы частот относительно аудиокадров AF' модуля 2 декодирования базовой полосы меньше порога задержки, в то время как коэффициент усиления из предыдущего аудиокадра AF1 используется для текущего кадра AF2, если задержка DEL между аудиокадрами AF модуля 3 расширения полосы частот относительно аудиокадров AF' модуля 3 декодирования базовой полосы больше порога задержки.
Вдобавок к скрытию, в модуле 3 расширения полосы частот особое внимание должно быть уделено кадрированию. Аудиокадры AF модуля расширения полосы частот и аудиокадры AF' модуля 3 декодирования базовой полосы часто не точно выровнены, а могут иметь некоторую задержку DEL. Так что может произойти то, что один потерянный пакет содержит задерживаемые данные расширения полосы частот в отношении базового сигнала, содержащегося в том же самом пакете.
Результатом в этом случае является то, что первый хороший пакет после потери может содержать данные расширения для создания частей полос частот FB модуля 3 расширения полосы частот предыдущего аудиокадра AF' модуля декодирования базовой полосы, который уже был скрыт в декодере 2.
По этой причине кадрирование должно учитываться в течение восстановления в зависимости от соответственных свойств модуля базового декодирования и модуля расширения полосы частот. Это может означать необходимость расценивать первый аудиокадр или его части в модуле 3 расширения полосы частот как ошибочные и не применять новейший коэффициент усиления сразу, а оставить зафиксированные усиления от первого аудиокадра для одного дополнительного кадра.
То, оставлять или не оставлять зафиксированные усиления для первого хорошего кадра, зависит от задержки. Экспериментальное применение к кодекам с различными задержками показало различные преимущества для кодеков с различными задержками. Для кодеков с довольно малыми задержками (например, 1 мс) лучше использовать новейшие коэффициенты усиления для первого хорошего аудиокадра.
Несмотря на то что некоторые аспекты были описаны в контексте устройства, ясно, что эти аспекты также представляют описание соответствующего способа, где блок или устройство соответствуют этапу способа или признаку этапа способа. Аналогично, аспекты, описанные в контексте этапа способа, также представляют описание соответствующего блока, или элемента, или признака соответствующего устройства. Некоторые или все из этапов способа могут исполняться посредством (или с использованием) аппаратного устройства, такого как, например, микропроцессор, программируемый компьютер или электронная цепь. В некоторых вариантах осуществления некоторый один или несколько из самых важных этапов способа может исполняться таким устройством.
В зависимости от требований конкретного осуществления, варианты осуществления изобретения могут осуществляться в аппаратных средствах или в программных средствах. Осуществление может выполняться с использованием некратковременного носителя данных, такого как цифровой носитель данных, например гибкий диск, DVD, Blu-Ray, CD, ROM, PROM и EPROM, EEPROM или флэш-память, имеющего электронно читаемые управляющие сигналы, сохраненные на нем, которые взаимодействуют (или имеют возможность взаимодействия) с программируемой компьютерной системой так, чтобы соответственный способ выполнялся. Таким образом, цифровой носитель данных может быть машиночитаемым.
Некоторые варианты осуществления согласно изобретению содержат носитель данных, имеющий электронно читаемые управляющие сигналы, которые имеют возможность взаимодействия с программируемой компьютерной системой так, чтобы один из способов, описанных здесь, выполнялся.
В общем случае, варианты осуществления настоящего изобретения могут осуществляться в качестве компьютерного программного продукта с программным кодом, причем программный код действует для выполнения одного из способов, когда компьютерный программный продукт запущен на компьютере. Программный код может, например, храниться на машиночитаемом носителе.
Другие варианты осуществления содержат компьютерную программу для выполнения одного из способов, описанных здесь, сохраненную на машиночитаемом носителе.
Иными словами, вариантом осуществления изобретательского способа является, таким образом, компьютерная программа, имеющая программный код для выполнения одного из способов, описанных здесь, когда компьютерная программа запущена на компьютере.
Дополнительным вариантом осуществления изобретательского способа является, таким образом, носитель данных (или цифровой носитель данных, или машиночитаемый носитель), содержащий записанную на нем компьютерную программу для выполнения одного из способов, описанных здесь. Носитель данных, цифровой носитель данных или записанный носитель обычно являются материальными и/или некратковременными.
Дополнительным вариантом осуществления способа изобретения является, таким образом, поток данных или последовательность сигналов, представляющая компьютерную программу для выполнения одного из способов, описанных здесь. Поток данных или последовательность сигналов может, например, быть сконфигурирована для переноса посредством соединения связи, например, через Интернет.
Дополнительный вариант осуществления содержит средство обработки, например, компьютер или программируемое логическое устройство, сконфигурированное для, или выполненное с возможностью, выполнения одного из способов, описанных здесь.
Дополнительный вариант осуществления содержит компьютер, имеющий установленную на нем компьютерную программу для выполнения одного из способов, описанных здесь.
Дополнительный вариант осуществления согласно изобретению содержит устройство или систему, сконфигурированную для переноса (например, электронным или оптическим образом) компьютерной программы для выполнения одного из способов, описанных здесь, к приемнику. Приемником может, например, быть компьютер, мобильное устройство, устройство памяти или подобное. Устройство или система может, например, содержать файловый сервер для переноса компьютерной программы к приемнику.
В некоторых вариантах осуществления программируемое логическое устройство (например, программируемая пользователем вентильная матрица) может быть использована для выполнения некоторых или всех из функциональных возможностей способов, описанных здесь. В некоторых вариантах осуществления программируемая пользователем вентильная матрица может взаимодействовать с микропроцессором для того, чтобы выполнять один из способов, описанных здесь. В общем случае, способы предпочтительно выполняются любым аппаратным устройством.
Вышеописанные варианты осуществления являются лишь иллюстративными для принципов настоящего изобретения. Понятно, что модификации и вариации компоновок и подробностей, описанных здесь, будут очевидны другим специалистам в данной области техники. Предполагается, таким образом, ограничение только объемом дальнейшей патентной формулы, а не конкретными подробностями, представленными здесь посредством описания и объяснения вариантов осуществления.
Позиционные обозначения:
1 - аудиодекодер
2 - модуль декодирования базовой полосы
3 - модуль расширения полосы частот
4 - средство комбинирования
5 - модуль регулирования энергии
6 - модуль обеспечения коэффициента усиления
7 - модуль генератора шума
8 - модуль анализа спектра
9 - модуль генератора сигналов
10 - модуль синтеза сигнала
AS - аудиосигнал
BS - битовый поток
AF - аудиокадр
CBS - аудиосигнал базовой полосы
BES - аудиосигнал расширения полосы частот
FDS - сигнал частотной области
FB - полоса частот
AFL - потеря аудиокадра
CGF - текущий коэффициент усиления
EE - оцененная энергия сигнала
NOI - шум
DEL - задержка
RFS - необработанный сигнал частотной области
Ссылки:
[3GP09] 3GPP; Групповые службы и системные аспекты технической спецификации, расширенный адаптивный многорежимный-широкополосный (AMR-WB+) кодек, 3GPP TS 26.290, проект партнерства третьего поколения, 2009 г.
[3GP12a] Функции звуковой обработки общего аудиокодека; улучшенный общий аудиокодек AACplus; дополнительные инструменты декодера (выпуск 11), 3GPP TS 26.402, проект партнерства третьего поколения, сентябрь 2012 г.
[3GP12b] Функции речевой обработки кодека речи; адаптивный многорежимный-широкополосный кодек речи (AMRWB); скрытие ошибок ошибочных или потерянных кадров, 3GPP TS 26.191, проект партнерства третьего поколения, сентябрь 2012 г.
[EBU10] Широкое вещание EBU/ETSI JTC, широкое вещание цифрового аудио (DAB); перенос аудио усовершенствованного аудиокодирования (AAC), ETSI TS 102 563, Европейский вещательный союз, май 2010 г.
[EBU12] Всемирное цифровое радио (DRM); спецификация системы, ETSI ES 201 980, ETSI, июнь 2012 г.
[ISO09] ISO/IEC JTC1/SC29/WG11, информационная технология - кодирование аудио-визуальных объектов - часть 3: аудио, ISO/IEC IS 14496-3, Международная организация по стандартизации, 2009 г.
[ITU08] ITU-T, G.718: Устойчивое к ошибкам кадров узкополосное и широкополосное встроенное кодирование с переменной битовой скоростью речи и аудио от 8 до 32 кбит/с, рекомендация ITU-T G.718, Сектор стандартизации электросвязи ITU, июнь 2008 г.
[RR06] Сан-Ук Рю и Кеннет Роуз, Скрытие потери кадров для аудиодекодеров, задействующих репликацию спектральных полос, публикация конференции 6962, Электрическая и компьютерная инженерия, Калифорнийский университет, октябрь 2006 г., AES.
[SKE06] Андреас Шнайдер, Курт Краусс и Андреас Эрет, Оценка конфигураций транспортного протокола реального времени с использованием AACplus, публикация конференции 6789, AES, май 2006 г., представлена на 120-й конференции 20-23 мая 2006 г.

Claims (27)

1. Аудиодекодер, сконфигурированный для создания аудиосигнала (AS) из битового потока (BS), содержащего аудиокадры (AF), причем аудиодекодер (1) содержит:
модуль (2) декодирования базовой полосы, сконфигурированный для получения непосредственно декодированного аудиосигнала базовой полосы (CBS) из битового потока (BS);
модуль (3) расширения полосы частот, сконфигурированный для получения параметрически декодированного аудиосигнала расширения полосы частот (BES) из аудиосигнала базовой полосы (CBS) и из битового потока (BS), причем аудиосигнал расширения полосы частот (BES) основан на сигнале частотной области (FDS), имеющем по меньшей мере одну полосу частот (FB); и
средство (4) комбинирования, сконфигурированное для комбинирования аудиосигнала базовой полосы (CBS) и аудиосигнала расширения полосы частот (BES) для того, чтобы вырабатывать аудиосигнал (AS);
причем модуль (3) расширения полосы частот содержит модуль регулирования энергии (5), сконфигурированный таким образом, что в текущем аудиокадре (AF2), в котором происходит потеря аудиокадра (AFL), отрегулированная энергия сигнала для текущего аудиокадра (AF2) для по меньшей мере одной полосы частот (FB) устанавливается
на основе текущего коэффициента усиления (CGF) для текущего аудиокадра (AF2), причем текущий коэффициент усиления (CGF) получается из коэффициента усиления из предыдущего аудиокадра (AF1) или из битового потока (BS), и
на основе оцененной энергии сигнала (EE) для по меньшей мере одной полосы частот, причем оцененная энергия сигнала (EE) получается из спектра текущего аудиокадра (AF2') аудиосигнала базовой полосы (CBS).
2. Аудиодекодер по предыдущему пункту, в котором модуль (3) расширения полосы частот содержит модуль (6) обеспечения коэффициента усиления, сконфигурированный для перенаправления текущего коэффициента усиления (CGF) по меньшей мере в текущем аудиокадре (AF2), в котором происходит потеря аудиокадра (AFL), к модулю (5) регулирования энергии.
3. Аудиодекодер по предыдущему пункту, в котором модуль (6) обеспечения коэффициента усиления сконфигурирован таким образом, что в текущем аудиокадре (AF2), в котором происходит потеря аудиокадра (AFL), текущий коэффициент усиления (CGF) является коэффициентом усиления предыдущего аудиокадра (AF1).
4. Аудиодекодер по п.2, в котором модуль (6) обеспечения коэффициента усиления сконфигурирован таким образом, что в текущем аудиокадре (AF2), в котором происходит потеря кадра (AFL), текущий коэффициент усиления (CGF) вычисляется из коэффициента усиления предыдущего аудиокадра (AF1) и из класса сигнала предыдущего аудиокадра (AF1).
5. Аудиодекодер по п.2, в котором модуль (6) обеспечения коэффициента усиления сконфигурирован для вычисления количества последующих аудиокадров, в которых происходят потери аудиокадра (AFL), и сконфигурирован для исполнения процедуры понижения коэффициента усиления в случае, когда количество последующих аудиокадров, в которых происходят потери аудиокадра (AFL), превосходит предварительно определенное количество.
6. Аудиодекодер по предыдущему пункту, в котором процедура понижения коэффициента усиления содержит этап, на котором понижают текущий коэффициент усиления путем деления текущего коэффициента усиления на первое число в случае, когда текущий коэффициент усиления превосходит первый порог.
7. Аудиодекодер по п.5, в котором процедура понижения коэффициента усиления содержит этап, на котором понижают текущий коэффициент усиления путем деления текущего коэффициента усиления на второе число, которое больше первого числа, в случае, когда текущий коэффициент усиления превосходит второй порог, который больше первого порога.
8. Аудиодекодер по п.5, в котором процедура понижения коэффициента усиления содержит этап, на котором устанавливают текущий коэффициент усиления равным первому порогу в случае, когда текущий порог после понижения ниже первого порога.
9. Аудиодекодер по п.1, в котором модуль (3) расширения полосы частот содержит модуль (7) генератора шума, сконфигурированный для добавления шума (NOI) в по меньшей мере одну полосу частот (FB), причем в текущем аудиокадре (AF2), в котором происходит потеря аудиокадра (AFL), отношение энергии сигнала к энергии шума по меньшей мере одной полосы частот (FB) предыдущего аудиокадра (AF1) используется для вычисления энергии шума текущего аудиокадра (AF2).
10. Аудиодекодер по п.1, в котором аудиодекодер (1) содержит модуль (8) анализа спектра, сконфигурированный для установления спектра текущего аудиокадра (AF2') аудиосигнала базовой полосы (CBS) и для получения оцененной энергии сигнала для текущего кадра (AF2) для по меньшей мере одной полосы частот (FB) из спектра текущего аудиокадра (AF2') аудиосигнала базовой полосы (CBS).
11. Аудиодекодер по п.2, в котором модуль (6) обеспечения коэффициента усиления сконфигурирован таким образом, что, в случае, когда текущий аудиокадр, в котором не происходит потери аудиокадра, последовательно следует за предыдущим аудиокадром, в котором происходит потеря аудиокадра, коэффициент усиления, принятый для текущего аудиокадра, используется для текущего кадра, если задержка (DEL) между аудиокадрами (AF1, AF2) модуля (3) расширения полосы частот относительно аудиокадров (AF1', AF2') модуля декодирования базовой полосы (2) меньше порога задержки, в то время как коэффициент усиления из предыдущего аудиокадра используется для текущего кадра, если задержка (DEL) между аудиокадрами модуля расширения полосы частот относительно аудиокадров модуля декодирования базовой полосы больше порога задержки.
12. Аудиодекодер по п.1, в котором модуль (3) расширения полосы частот содержит модуль (9) генератора сигналов, сконфигурированный для создания необработанного сигнала частотной области (RFS), имеющего по меньшей мере одну полосу частот (FB), который перенаправляется к модулю (5) регулирования энергии, на основе аудиосигнала базовой полосы (CBS) и битового потока (BS).
13. Аудиодекодер по п.1, в котором модуль (3) расширения полосы частот содержит модуль (10) синтеза сигнала, сконфигурированный для создания аудиосигнала расширения полосы частот (BES) из сигнала частотной области (FDS).
14. Способ для создания аудиосигнала (AS) из битового потока (BS), содержащего аудиокадры (AF), причем способ содержит этапы, на которых:
получают непосредственно декодированный аудиосигнал базовой полосы (CBS) из битового потока (BS);
получают параметрически декодированный аудиосигнал расширения полосы частот (BES) из аудиосигнала базовой полосы (CBS) и из битового потока (BS), причем аудиосигнал расширения полосы частот (BES) основан на сигнале частотной области (FDS), имеющем по меньшей мере одну полосу частот (FB); и
комбинируют аудиосигнал базовой полосы (CBS) и аудиосигнал расширения полосы частот (BES) с целью создания аудиосигнала (AS);
причем в текущем аудиокадре (AF2), в котором происходит потеря аудиокадра (AFL), отрегулированная энергия сигнала для текущего аудиокадра (AF2) для по меньшей мере одной полосы частот (FB) устанавливается
на основе текущего коэффициента усиления (CGF) для текущего аудиокадра (AF2), причем текущий коэффициент усиления (CGF) получается из коэффициента усиления из предыдущего аудиокадра (AF1) или из битового потока (BS), и
на основе оцененной энергии сигнала для по меньшей мере одной полосы частот (FB), причем оцененная энергия сигнала получается из спектра текущего аудиокадра (AF2') аудиосигнала базовой полосы (CBS).
15. Носитель информации, содержащий компьютерную программу для выполнения, при запуске на компьютере или процессоре, способа по п.14.
RU2016101607A 2013-06-21 2014-06-18 Аудиодекодер, имеющий модуль расширения полосы частот с модулем регулирования энергии RU2642894C2 (ru)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
EP13173152.3 2013-06-21
EP13173152 2013-06-21
EP14167050 2014-05-05
EP14167050.5 2014-05-05
PCT/EP2014/062902 WO2014202701A1 (en) 2013-06-21 2014-06-18 Audio decoder having a bandwidth extension module with an energy adjusting module

Publications (2)

Publication Number Publication Date
RU2016101607A RU2016101607A (ru) 2017-07-26
RU2642894C2 true RU2642894C2 (ru) 2018-01-29

Family

ID=51022308

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2016101607A RU2642894C2 (ru) 2013-06-21 2014-06-18 Аудиодекодер, имеющий модуль расширения полосы частот с модулем регулирования энергии

Country Status (18)

Country Link
US (2) US10096322B2 (ru)
EP (1) EP3011560B1 (ru)
JP (1) JP6228298B2 (ru)
KR (2) KR20170124590A (ru)
CN (1) CN105431898B (ru)
AU (1) AU2014283285B2 (ru)
BR (1) BR112015031605B1 (ru)
CA (1) CA2915001C (ru)
ES (1) ES2697474T3 (ru)
HK (1) HK1224368A1 (ru)
MX (1) MX358362B (ru)
MY (1) MY169410A (ru)
PL (1) PL3011560T3 (ru)
PT (1) PT3011560T (ru)
RU (1) RU2642894C2 (ru)
SG (1) SG11201510458UA (ru)
TW (1) TWI564883B (ru)
WO (1) WO2014202701A1 (ru)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ES2697474T3 (es) * 2013-06-21 2019-01-24 Fraunhofer Ges Forschung Decodificador de audio que tiene un módulo de extensión de ancho de banda con un módulo de ajuste de energía
WO2015105775A1 (en) * 2014-01-07 2015-07-16 Harman International Industries, Incorporated Signal quality-based enhancement and compensation of compressed audio signals
JP7214726B2 (ja) * 2017-10-27 2023-01-30 フラウンホッファー-ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ ニューラルネットワークプロセッサを用いた帯域幅が拡張されたオーディオ信号を生成するための装置、方法またはコンピュータプログラム
CN109668917B (zh) * 2018-09-29 2020-06-19 中国科学院高能物理研究所 一种利用单色器获得不同能量带宽x射线的方法
CN113324546B (zh) * 2021-05-24 2022-12-13 哈尔滨工程大学 罗经失效下的多潜航器协同定位自适应调节鲁棒滤波方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7693710B2 (en) * 2002-05-31 2010-04-06 Voiceage Corporation Method and device for efficient frame erasure concealment in linear predictive based speech codecs
RU2386179C2 (ru) * 2005-04-01 2010-04-10 Квэлкомм Инкорпорейтед Способ и устройство для кодирования речевых сигналов с расщеплением полосы
WO2010127617A1 (en) * 2009-05-05 2010-11-11 Huawei Technologies Co., Ltd. Methods for receiving digital audio signal using processor and correcting lost data in digital audio signal
WO2012036487A2 (en) * 2010-09-15 2012-03-22 Samsung Electronics Co., Ltd. Apparatus and method for encoding and decoding signal for high frequency bandwidth extension
US20130151255A1 (en) * 2011-12-07 2013-06-13 Gwangju Institute Of Science And Technology Method and device for extending bandwidth of speech signal

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6009117A (en) * 1996-09-17 1999-12-28 Kabushiki Kaisha Toyoda Jidoshokki Seisakusho Spread spectrum communication system
US6351730B2 (en) * 1998-03-30 2002-02-26 Lucent Technologies Inc. Low-complexity, low-delay, scalable and embedded speech and audio coding with adaptive frame loss concealment
US6763142B2 (en) * 2001-09-07 2004-07-13 Nline Corporation System and method for correlated noise removal in complex imaging systems
US6985856B2 (en) * 2002-12-31 2006-01-10 Nokia Corporation Method and device for compressed-domain packet loss concealment
JP5100380B2 (ja) * 2005-06-29 2012-12-19 パナソニック株式会社 スケーラブル復号装置および消失データ補間方法
US8374857B2 (en) * 2006-08-08 2013-02-12 Stmicroelectronics Asia Pacific Pte, Ltd. Estimating rate controlling parameters in perceptual audio encoders
US8433582B2 (en) * 2008-02-01 2013-04-30 Motorola Mobility Llc Method and apparatus for estimating high-band energy in a bandwidth extension system
ES2539304T3 (es) * 2008-07-11 2015-06-29 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Un aparato y un método para generar datos de salida por ampliación de ancho de banda
WO2010051857A1 (en) * 2008-11-10 2010-05-14 Oticon A/S N band fm demodulation to aid cochlear hearing impaired persons
US8428938B2 (en) * 2009-06-04 2013-04-23 Qualcomm Incorporated Systems and methods for reconstructing an erased speech frame
US9047875B2 (en) * 2010-07-19 2015-06-02 Futurewei Technologies, Inc. Spectrum flatness control for bandwidth extension
CA3203400C (en) * 2010-07-19 2023-09-26 Dolby International Ab Processing of audio signals during high frequency reconstruction
WO2012131438A1 (en) * 2011-03-31 2012-10-04 Nokia Corporation A low band bandwidth extender
EP2950308B1 (en) * 2013-01-22 2020-02-19 Panasonic Corporation Bandwidth expansion parameter-generator, encoder, decoder, bandwidth expansion parameter-generating method, encoding method, and decoding method
ES2697474T3 (es) * 2013-06-21 2019-01-24 Fraunhofer Ges Forschung Decodificador de audio que tiene un módulo de extensión de ancho de banda con un módulo de ajuste de energía

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7693710B2 (en) * 2002-05-31 2010-04-06 Voiceage Corporation Method and device for efficient frame erasure concealment in linear predictive based speech codecs
RU2386179C2 (ru) * 2005-04-01 2010-04-10 Квэлкомм Инкорпорейтед Способ и устройство для кодирования речевых сигналов с расщеплением полосы
WO2010127617A1 (en) * 2009-05-05 2010-11-11 Huawei Technologies Co., Ltd. Methods for receiving digital audio signal using processor and correcting lost data in digital audio signal
WO2012036487A2 (en) * 2010-09-15 2012-03-22 Samsung Electronics Co., Ltd. Apparatus and method for encoding and decoding signal for high frequency bandwidth extension
US20130151255A1 (en) * 2011-12-07 2013-06-13 Gwangju Institute Of Science And Technology Method and device for extending bandwidth of speech signal

Also Published As

Publication number Publication date
MX358362B (es) 2018-08-15
SG11201510458UA (en) 2016-01-28
PT3011560T (pt) 2018-11-09
CA2915001C (en) 2019-04-02
EP3011560A1 (en) 2016-04-27
US10096322B2 (en) 2018-10-09
MY169410A (en) 2019-04-01
KR20170124590A (ko) 2017-11-10
AU2014283285A1 (en) 2016-02-11
HK1224368A1 (zh) 2017-08-18
BR112015031605B1 (pt) 2022-03-29
TW201513097A (zh) 2015-04-01
EP3011560B1 (en) 2018-08-01
US20190027153A1 (en) 2019-01-24
TWI564883B (zh) 2017-01-01
JP2016530548A (ja) 2016-09-29
BR112015031605A2 (pt) 2017-07-25
CN105431898B (zh) 2019-09-06
RU2016101607A (ru) 2017-07-26
KR20160024920A (ko) 2016-03-07
JP6228298B2 (ja) 2017-11-08
WO2014202701A1 (en) 2014-12-24
CA2915001A1 (en) 2014-12-24
PL3011560T3 (pl) 2019-01-31
AU2014283285B2 (en) 2017-09-21
KR101991421B1 (ko) 2019-06-21
CN105431898A (zh) 2016-03-23
MX2015017846A (es) 2016-04-18
ES2697474T3 (es) 2019-01-24
US20160180854A1 (en) 2016-06-23

Similar Documents

Publication Publication Date Title
US10269359B2 (en) Audio decoder and method for providing a decoded audio information using an error concealment based on a time domain excitation signal
US10262667B2 (en) Audio decoder and method for providing a decoded audio information using an error concealment modifying a time domain excitation signal
RU2685024C1 (ru) Постпроцессор, препроцессор, аудиокодер, аудиодекодер и соответствующие способы для улучшения обработки транзиентов
RU2668058C2 (ru) Оптимизированный масштабный коэффициент для расширения диапазона частот в декодере сигналов звуковой частоты
EP2347412B1 (en) Method and system for frequency domain postfiltering of encoded audio data in a decoder
CN105960675B (zh) 音频信号解码器中改进的频带扩展
RU2642894C2 (ru) Аудиодекодер, имеющий модуль расширения полосы частот с модулем регулирования энергии
Konaté Enhancing speech coder quality: improved noise estimation for postfilters