RU2752520C1 - Управление полосой частот в кодерах и/или декодерах - Google Patents

Управление полосой частот в кодерах и/или декодерах Download PDF

Info

Publication number
RU2752520C1
RU2752520C1 RU2020118947A RU2020118947A RU2752520C1 RU 2752520 C1 RU2752520 C1 RU 2752520C1 RU 2020118947 A RU2020118947 A RU 2020118947A RU 2020118947 A RU2020118947 A RU 2020118947A RU 2752520 C1 RU2752520 C1 RU 2752520C1
Authority
RU
Russia
Prior art keywords
encoder
frequency band
decoder
tools
bandwidth
Prior art date
Application number
RU2020118947A
Other languages
English (en)
Inventor
Маркус ШНЕЛЛЬ
Эммануэль РАВЕЛЛИ
Конрад БЕННДОРФ
Тобиас АЛЬБЕРТ
Манфред ЛУТЦКИ
Адриан ТОМАСЕК
Original Assignee
Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. filed Critical Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф.
Application granted granted Critical
Publication of RU2752520C1 publication Critical patent/RU2752520C1/ru

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • G10L19/035Scalar quantisation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • G10L19/038Vector quantisation, e.g. TwinVQ audio
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/3059Digital compression and data reduction techniques where the original information is represented by a subset or similar information, e.g. lossy compression
    • H03M7/3062Compressive sampling or sensing
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/3066Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction by means of a mask or a bit-map
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/60General implementation details not specific to a particular type of compression
    • H03M7/6005Decoder aspects
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/60General implementation details not specific to a particular type of compression
    • H03M7/6011Encoder aspects
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/03Spectral prediction for preventing pre-echo; Temporary noise shaping [TNS], e.g. in MPEG2 or MPEG4
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/22Mode decision, i.e. based on audio signal content versus external parameters

Abstract

Изобретение относится к средствам для управления полосой частот в кодерах и декодерах. Технический результат заключается в повышении эффективности кодирования. Кодирующее устройство содержит множество инструментов кодера частотной области, FD, для кодирования информационного сигнала, причем информационный сигнал представляет множество кадров. Дополнительно кодирующее устройство содержит средство обнаружения и управления полосы частот кодера, выполненное с возможностью выбора полосы частот по меньшей мере для подгруппы из множества инструментов кодера FD. Причем указанная подгруппа включает в себя меньше инструментов кодера FD, чем множество инструментов кодера FD, на основании характеристик информационного сигнала таким образом, что по меньшей мере один из инструментов кодера FD из указанной подгруппы имеет другую полосу частот относительно по меньшей мере одного из инструментов кодера FD, которые не находятся в указанной подгруппе. 5 н. и 27 з.п. ф-лы, 13 ил.

Description

1. УРОВЕНЬ ТЕХНИКИ
Настоящие примеры относятся к кодерам и декодерам и к способам для этих устройств, в особенности для информационных сигналов, таких как аудиосигналы.
Общие кодеки аудио должны передавать сигналы музыки и речи в очень хорошем качестве. Такие кодеки аудио, например, используются в Bluetooth, где аудиосигналы передаются от мобильного телефона к гарнитуре или наушникам и наоборот.
Квантование частей спектра в нули часто приводит к воспринимаемому ухудшению качества. Таким образом, существует возможность заменить квантованные в нули спектральные линии с шумом с использованием инструмента заполнения шума, работающего в частотной области (FD).
Формирование временного шума (TNS) использует линейное предсказание разомкнутой цепи в частотной области (FD). Этот процесс кодирования/декодирования с предсказанием над частотой эффективно адаптирует временную структуру шума квантования к структуре временного сигнала, тем самым эффективно используя сигнал, чтобы замаскировать эффекты шума. В стандарте улучшенного кодера аудио (AAC) MPEG2, TNS в текущий момент осуществляется путем определения одного фильтра для некоторой заданной полосы частот и затем переключения на другой фильтр для смежной полосы частот, когда структура сигнала в смежной полосе отлична от структуры сигнала в предыдущей полосе.
В особенности для сигналов речи содержимое аудио может иметь ограниченную полосу, что означает, что полоса частот аудио содержит только 4 кГц (узкая полоса, NB), 8 кГц (широкая полоса, WB) или 16 кГц (сверхширокая полоса, SWB). Кодеки аудио должны обнаруживать активную полосу частот аудио и управлять инструментами кодирования соответственно. Поскольку обнаружение полосы частот не на 100% надежно, могут возникать технические проблемы.
Некоторые инструменты кодирования аудио, например формирование временного шума (TNS) или заполнение шума (NF), могут вызывать раздражающие артефакты при работе над файлами аудиоданных ограниченной полосы, например, если инструмент не осведомлен об активной части сигнала. Предполагая, что сигнал WB кодируется на 32 кГц, инструменты могут заполнять верхний спектр (8-16 кГц) искусственным шумом.
Фиг. 1 изображает искусственный шум, генерируемый неконтролируемыми инструментами: линия 11 является активным сигналом вплоть до WB, в то время как сигнал 12 искусственно генерируется параметрическим инструментом, например путем заполнения шума, который не осведомлен об активной полосе частот аудио.
Таким образом, инструменты должны быть ограничены таким образом, чтобы работать только над активными частотными областями.
Некоторые кодеки, такие как AAC, выполнены с возможностью отправки информации об активном спектре для каждой полосы коэффициента масштабирования. Эта информация также используется для управления инструментами кодирования. Это обеспечивает точные результаты, но требует существенного количества дополнительной информации, которая должна быть передана. Поскольку речь обычно передается просто в NB, WB, SWB и FB, этот ограниченный набор возможных активных полос частот предпочтительно используется для ограничения дополнительной информации.
Средство обнаружения полосы частот с неизбежностью время от времени возвращает неверные результаты. Например, средство обнаружения может видеть затухание сигнала музыки и интерпретирует это как случай низкой полосы частот. Для кодеков, которые переключаются между различными режимами полосы частот (NB, WB, SWB, FB) жестким образом, например кодека EVS 3GPP [1], это дает в результате прямоугольную спектральную дыру. Переключение жестким образом означает, что полная операция кодирования ограничена обнаруженной полосой частот. Такое жесткое переключение может давать в результате слышимые артефакты. Фиг. 2 обрисовывает спектральную дыру 22, возникшую в результате неверного обнаружения.
Фиг. 2 изображает схематичный чертеж неверного обнаружения полосы частот: все инструменты кодирования работают на нижней полосе частот аудио, что приводит к прямоугольной спектральной дыре 22.
Существует необходимость преодоления или уменьшения таких недостатков, как те что определены выше.
1.1. Источники
[1] 3GPP EVS Codec, http://www.3gpp.org/ftp//Specs/archive/26_series/26.445/26445-e10.zip, раздел 5.1.6 "Bandwidth detection"
2. РАСКРЫТИЕ ИЗОБРЕТЕНИЯ
В соответствии с примерами, обеспечено кодирующее устройство, содержащее:
- множество инструментов кодера частотной области, FD, для кодирования информационного сигнала, причем информационный сигнал представляет множество кадров; и
- средство обнаружения и управления полосы частот кодера, выполненное с возможностью выбора полосы частот по меньшей мере для подгруппы из множества инструментов кодера FD, причем подгруппа включает в себя меньше инструментов кодера FD, чем множество инструментов кодера FD, на основании характеристик информационного сигнала таким образом, что по меньшей мере один из инструментов кодера FD из подгруппы имеет другую полосу частот относительно по меньшей мере одного из инструментов кодера FD, которые не находятся в подгруппе.
Соответственно, существует возможность избежать спектральных дыр при обслуживании в случае неверного обнаружения полосы частот.
В соответствии с примерами, по меньшей мере один инструмент кодера FD из подгруппы может быть инструментом формирования временного шума, TNS, и/или инструментом средства оценки уровня шума.
В соответствии с примерами, по меньшей мере один инструмент кодера FD, который не находится в подгруппе, выбирается из по меньшей мере одного из спектрального средства формирования на основе линейного кодирования с предсказанием, LPC, инструмента средства формирования спектрального шума, SNS, спектрального квантизатора и остаточного кодера.
В соответствии с примерами, средство обнаружения и управления полосы частот кодера выполнено с возможностью выбора полосы частот по меньшей мере одного инструмента кодера FD из подгруппы между по меньшей мере первой полосы частот, общей для по меньшей мере одного из инструментов кодера FD, который не находятся в подгруппе, и второй полосы частот, отличной от полосы частот по меньшей мере одного из инструментов кодера FD, которые не находятся в подгруппе.
В соответствии с примерами, средство обнаружения и управления полосы частот кодера выполнено с возможностью выбора полосы частот по меньшей мере одного из множества инструментов кодера FD на основании по меньшей мере одной оценки энергии над информационным сигналом.
В соответствии с примерами, средство обнаружения и управления полосы частот кодера выполнено с возможностью сравнения по меньшей мере одной оценки энергии, ассоциированной с полосой частот информационного сигнала, с соответствующей пороговой величиной для управления полосой частот для по меньшей мере одного из множества инструментов кодера FD.
В соответствии с примерами, по меньшей мере один из множества инструментов кодера FD из подгруппы содержит TNS, выполненный с возможностью автокорреляции входного сигнала TNS внутри полосы частот, выбранной средством обнаружения и управления полосы частот кодера.
В соответствии с примерами, по меньшей мере один из инструментов кодера FD, который не находятся в подгруппе, выполнен с возможностью работы в полной полосе частот.
Таким образом, выбор полосы частот работает только для инструментов из подгруппы (например, TNS, инструмента средства оценки шума).
В соответствии с примерами, средство обнаружения и управления полосы частот кодера выполнено с возможностью выбора по меньшей мере одной полосы частот, которая находится внутри полной полосы частот, в которой по меньшей мере один из инструментов кодера FD, которые не находятся в подгруппе, выполнен с возможностью работы.
В соответствии с примерами, по меньшей мере один из остальных инструментов кодера FD из множества инструментов кодера FD выполнен с возможностью работы в открытой цепи относительно полосы частот, выбранной средством обнаружения и управления полосы частот кодера.
В соответствии с примерами, средство обнаружения и управления полосы частот кодера выполнено с возможностью выбора полосы частот из конечного количества полос частот и/или из набора заданных полос частот.
Таким образом, выбор ограничен, и нет необходимости кодирования слишком сложных и/или длинных параметров. В примерах только один параметр (например, кодированный в 0-3 битах) может быть использован для битового потока.
В соответствии с примерами, средство обнаружения и управления полосы частот кодера выполнено с возможностью выполнения выбора из по меньшей мере одного или сочетания из: 8 кГц, 16 кГц, 24 кГц, 32 кГц и 48 кГц и/или NB, WB, SSWB, SWB, FB и т. д.
В соответствии с примерами, средство обнаружения и управления полосы частот кодера выполнено с возможностью управления сигнализацией полосы частот декодеру.
Таким образом, также полосой частот сигналов, обработанных некоторыми инструментами в декодере, может осуществляться управление (например, с использованием той же самой полосы частот).
В соответствии с примерами, кодирующее устройство выполнено с возможностью кодирования поля управляющих данных, включающего в себя информацию, относящуюся к выбранной полосе частот.
В соответствии с примерами, кодирующее устройство выполнено с возможностью определения поля управляющих данных, включающего в себя:
- 0 бит данных, соответствующих полосе частот NB;
- 1 бит данных, соответствующий полосе частот NB, WB;
- 2 бита данных, соответствующих полосе частот NB, WB, SSWB;
- 2 бита данных, соответствующих полосе частот NB, WB, SSWB, SWB;
- 3 бита данных, соответствующих полосе частот NB, WB, SSWB, SWB, FB.
В соответствии с примерами, по меньшей мере одна оценка энергии кодирующего устройства выполняется следующим образом:
Figure 00000001
где X(k) - коэффициенты MDCT (или MDST...), N B - количество полос, и
Figure 00000002
- индексы, ассоциированные с полосой.
В соответствии с примерами, кодирующее устройство содержит инструмент TNS, который может быть выполнен с возможностью выполнения операции фильтрации, включающую в себя вычисление автокорреляционной функции. Одна из возможных функций автокорреляции может иметь следующую форму:
для каждого k=0..8
Figure 00000003
где
Figure 00000004
и
Figure 00000005
где X(k) - коэффициенты MDCT, sub_start(f, s) и sub_stop(f, s) ассоциированы с конкретной полосой частот, обнаруженной средством обнаружения и управления полосы частот кодера.
В соответствии с примерами, кодирующее устройство может содержать инструмент средства оценки шума, который может быть выполнен с возможностью оценки уровня шума. Одна из процедур, используемых для такой оценки, может иметь форму
Figure 00000006
где gg указывает на глобальное усиление, INF(k) - на идентификацию спектральных линий, на которых уровень шума должен оцениваться, и Xf(k) - сигнал (например, MDCT или MDST или другой спектр FD после TNS).
В примерах INF(k) может быть получен как:
Figure 00000007
где bw stop зависит от полосы частот, обнаруженной средством обнаружения и управления полосы частот кодера.
В соответствии с примерами, может быть обеспечено декодирующее устройство, содержащее множество инструментов декодера FD для декодирования информационного сигнала, кодированного в битовом потоке, причем:
инструменты декодера FD подразделяются:
- на подгруппу, содержащую по меньшей мере один инструмент декодера FD;
- на остальные инструменты декодера FD, содержащие по меньшей мере один инструмент декодера FD;
причем декодирующее устройство выполнено таким образом, что по меньшей мере один из множества инструментов декодера из подгруппы выполняет обработку сигналов для другой полосы частот относительно по меньшей мере одного из остальных инструментов декодера FD из множества инструментов декодера.
В соответствии с примерами, декодирующее устройство может содержать средство управления полосы частот, выполненное с возможностью выбора полосы частот на основании информации полосы частот.
В соответствии с примерами, декодирующее устройство может быть таким, что подгруппа содержит по меньшей мере один из инструмента средства оценки шума декодера и/или декодера формы временного шума, TNS.
В соответствии с примерами, по меньшей мере один из остальных инструментов декодера FD является по меньшей мере одним из инструмента декодера линейного кодирования с предсказанием, LPC, инструмента декодера средства формирования спектрального шума, SNS, инструмента декодера глобального усиления, инструмента формирования MDCT или MDST.
В соответствии с примерами, декодирующее устройство может быть выполнено с возможностью управления полосой частот по меньшей мере одного из множества инструментов декодера в подгруппе между:
по меньшей мере первой полосой частот, общей для по меньшей мере одного из остальных инструментов декодера FD; и
по меньшей мере второй полосой частот, отличной от первой полосы частот.
В соответствии с примерами, по меньшей мере один из остальных инструментов декодера FD выполнен с возможностью работы в полной полосе частот.
В соответствии с примерами, по меньшей мере один из остальных инструментов декодера FD выполнен с возможностью работы в открытой цепи относительно полосы частот (например, выбранной средством управления полосы частот).
В соответствии с примерами, средство управления полосы частот выполнено с возможностью выбора полосы частот из конечного количества полос частот и/или из набора заданных полос частот.
В соответствии с примерами, средство управления полосы частот выполнено с возможностью выполнения выбора из по меньшей мере одного или сочетания из: 8 кГц, 16 кГц, 24 кГц, 32 кГц и 48 кГц и/или NB, WB, SSWB, SWB, FB.
В соответствии с примерами, декодер может дополнительно содержать инструмент (46) заполнения шума, выполненный с возможностью применения уровня шума с использованием индексов. Методика получения индексов может обеспечивать, например:
Figure 00000008
где bw stop получается на основании информации полосы частот в битовом потоке.
В соответствии с примерами, декодирующее устройство может содержать инструмент декодера TNS, выполненный с возможностью выполнения по меньшей мере некоторых из следующих операций:
Figure 00000009
где
Figure 00000010
- выходные данные из декодера TNS, и
Figure 00000011
- входные данные декодера TNS, num_tns_filters, start_freq, stop_freq получаются на основании информации полосы частот в битовом потоке.
Инструменты кодирования, такие как TNS или заполнение шума, могут создавать нежелательный искусственный шум в тихих сегментах сигналов с ограниченной полосой. Таким образом, средства обнаружения полосы частот обычно взаимодействуют, чтобы управлять полосой частот, на которой должны работать все инструменты кодирования. Поскольку обнаружение полосы частот может приводить к неясным результатам, такое неверное обнаружение может приводить к звуковым артефактам, таким как внезапное ограничение полосы частот аудио.
Чтобы преодолеть эту проблему, в некоторых примерах некоторыми инструментами, например квантизатором, не управляет средство обнаружения полосы частот. В случае ошибочного обнаружения квантизатор может кодировать верхний спектр - пусть и в низком качестве - чтобы компенсировать проблему.
3. КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ
фиг. 1 изображает искусственный шум, генерируемый неконтролируемыми инструментами;
фиг. 2 изображает схематический чертеж неверного обнаружения полосы частот;
фиг. 3 и 3a изображают кодирующее устройство согласно примерам;
фиг. 4 и 4a изображают декодирующее устройство согласно примерам;
фиг. 5 изображает схему в случае неверного обнаружения полосы частот;
фиг. 6a-6c изображают способы согласно примерам;
фиг. 7 изображает способ TNS в кодере согласно одному примеру;
фиг. 8a и 8b изображают устройство согласно примерам.
4. ОСУЩЕСТВЛЕНИЕ ИЗОБРЕТЕНИЯ
Изобретение, описанное в этом документе, позволяет избежать возникновения спектральных дыр, даже когда средство обнаружения полосы частот возвращает неверный результат. В частности, может быть получено мягкое переключение полосы для применений в аудиокодировании.
Ключевым аспектом является то, что параметрическими инструментами кодирования, например TNS и NF, может строго осуществляться управление посредством средства 39 обнаружения и управления полосы частот, в то время как остальное кодирование, т.е. спектральное средство формирования на основании LPC или средство формирования спектрального шума, SNS, спектральный квантизатор и остаточный кодер, все еще работают над полной полосой частот аудио вплоть до предельной частоты.
Фиг. 3 и 3a обрисовывают примеры кодирующих устройств 30 и 30a, где средство 39 обнаружения и управления полосы частот (BW) оценивает текущую полосу частот аудио в кадре на основании энергий, найденных из спектра MDCT или MDST (или другого спектра FD).
На стороне декодера (фиг. 4 и 4a) направляющая информация полосы частот для TNS и NF извлекается из битового потока, и инструментами осуществляется управление соответственно.
В результате искусственно генерируемый шум в неактивных спектральных областях избегается ввиду параметра полосы частот, используемого, чтобы управлять инструментами кодирования TNS и NF (неконтролируемыми инструментами). Инструмент просто работает над активной частью аудио и, таким образом, не генерирует какого-либо искусственного шума.
С другой стороны, слышимый эффект неверных обнаружений (ложного обнаружения полосы частот) может быть существенно уменьшен, поскольку остальные инструменты кодирования, например спектральный квантизатор, средство формирования LPC или SNS (средство формирования спектрального шума) и остаточный кодер, все еще работают вплоть до предельной частоты. В случае неверных обнаружений эти инструменты могут кодировать верхнюю частоту - по меньшей мере с некоторыми дополнительными искажениями по сравнению с обычным кодированием - и, таким образом, избегать более сильного впечатления, что полоса частот аудио внезапно снижается.
Фиг. 5 изображает новую схему в случае неверного обнаружения полосы частот: спектральная дыра квантуется слабо, но избегает слышимого снижения полосы частот.
В случае если область, обрисованная на чертеже выше, содержит преимущественно нулевые значения, арифметическому кодеру не обязательно кодировать их, поскольку информация над последним ненулевым спектральным кортежем передается в качестве дополнительной информации для арифметического кодера. Это означает, что никакого служебного сигнализирования не требуется для арифметического кодера.
Требуемая дополнительная информация для передаваемой полосы частот также минимизируется. Ввиду устойчивого поведения переключения, сигнализирование обычно используемых полос частот аудио передачи, т. е. NB, WB, SSWB и SWB, является подходящим.
Эта методика также обеспечивает возможность построить менее сложные средства обнаружения полосы частот, которые не используют зависимостей кадра и средств памяти долгой истории, чтобы получить стабильные решения, см. кодек EVS [1], раздел 5.1.6. Это означает, что новая методика обеспечивает возможность средству 39 обнаружения и управления полосы частот реагировать очень быстро при любом изменении полосы частот аудио.
Соответственно, информация полосы частот используется только для того, чтобы управлять конкретными инструментами кодека (например, кодека аудио), при этом сохраняя остальные инструменты в другом режиме операции (например, полной полосе частот).
5. ПРИМЕРЫ
5.1. Обнаружение и управление полосы частот инструментов
Информационный сигнал (например, аудиосигнал) может быть описан во временной области, TD, в виде последовательности выборок (например, x(n)), полученных в различные дискретные моменты времени (n). Представление TD может состоять из множества кадров, каждый из которых ассоциирован с множеством выборок (например, 2048 выборок на кадр). В частотной области, FD, кадр может быть представлен в виде последовательности интервалов (например, X(k)), каждый из которых ассоциирован с конкретной частотой (каждая частота ассоциирована с индексом k).
Фиг. 3 и 3a изображают кодирующие устройства 30 и 30a, соответственно, каждое из которых содержит средство 39 обнаружения и управления полосы частот кодера, которые имеют возможность выбора полосы частот для некоторых инструментов (подгруппы в кодере) кодирующего устройства 30 или 30a так, чтобы другие инструменты работали в другой полосе частот. Средство 39 обнаружения и управления полосы частот кодера также имеет возможность выбора полосы частот для по меньшей мере некоторых из инструментов декодера (подгруппы в декодере). 39a указывает на информацию выбора полосы частот, обеспеченную средством 39 обнаружения и управления полосы частот кодера инструментам из подгруппы (например, 33, 36) и/или декодеру.
Каждое из кодирующих устройств 30 и 30a может содержать инструмент 31 модифицированного дискретного косинусного преобразования, MDCT, низкой задержки или инструмент 31 модифицированного дискретного синусного преобразования, MDST, низкой задержки (или инструмент на основании другого преобразования, такого как преобразование с перекрытием), который может конвертировать информационный сигнал (например, аудиосигнал) из представления во временной области, TD, в представление в частотной области, FD, (например, чтобы получить коэффициенты MDCT, MDST или, в более общем случае, FD).
Кодирующее устройство 30 может содержать инструмент 32 линейного кодирования с предсказанием, LPC, для выполнения анализа LPC в FD.
Кодирующее устройство 30a может содержать инструмент 32a SNS для выполнения анализа SNS в FD.
Каждое из кодирующих устройств 30 и 30a может содержать инструмент 33 формирования временного шума, TNS, чтобы управлять временной формой шума внутри каждого окна информационного сигнала (например, выводимого инструментом MDCT или MDST) в FD.
Каждое из кодирующих устройств 30 и 30a может содержать спектральный квантизатор 34, обрабатывающий сигналы в FD. Сигнал, выводимый инструментом 33 TNS, может квантоваться, например, с использованием мертвой зоны плюс скалярного квантования однородной пороговой величины. Индекс усиления может быть выбран таким образом, чтобы количество битов, необходимых для кодирования квантованного сигнала FD, было максимально близким к доступному запасу битов.
Каждое из кодирующих устройств 30 и 30a может содержать кодер 35, обрабатывающий сигналы в FD, например, чтобы выполнять энтропийное кодирование, например, чтобы сжать битовый поток. Кодер 35 может, например, выполнять остаточное кодирование и/или арифметическое кодирование.
Каждое из кодирующих устройств 30 и 30a может содержать, например, инструмент 36 средства оценки уровня шума, обрабатывающий сигналы в FD, чтобы оценить шум, квантовать его и/или передать его в битовом потоке.
В примерах инструмент 36 средства оценки уровня может быть размещен раньше или позже кодера 35 по ходу потока.
Каждое из кодирующих устройств 30 и 30a может содержать инструменты, которые обрабатывают сигналы во временной области, TD. Например, кодирующее устройство 30 или 30a может содержать инструмент 38a повторной дискретизации (например, средство дискретизации с понижением) и/или инструмент 38b долговременной вторичной фильтрации, LTPF, для управления LTPF, активной в TD в декодере.
Каждое из кодирующих устройств 30 и 30a может содержать инструмент 37 средства мультиплексирования битового потока, чтобы подготовить битовый поток с данными, полученными от инструментыов TD и/или FD, размещенных раньше по ходу потока. Битовый поток может содержать цифровое представление информационного сигнала вместе с управляющими данными (включающими в себя, например, информацию полосы частот для выбора полосы частот в некоторых инструментах декодера), которые должны быть использованы в декодере. Битовый поток может быть сжат или включать в себя части, которые сжаты.
Таким образом, каждое из кодирующих устройств 30 и 30a может содержать инструменты FD (например, 31-36) и, в некотором случае, инструменты TD (например, 38a, 38b).
Средство 39 обнаружения и управления полосы частот кодера может управлять полосой частот инструментов FD, формирующих первую группу (подгруппу), таких как инструмент 33 формирования временного шума, TNS, и/или инструмент 36 средства оценки шума. Инструмент 33 TNS может быть использован, чтобы управлять шумом квантования. Полоса частот, в которой инструменты FD, которые не находятся в подгруппе (такие как по меньшей мере один из инструмента 32 LPC и/или инструмента 32a SNS, квантизатор 34 спектра и кодер 35), выполняют обработку сигналов, может, таким образом, отличаться от полосы частот, в которой инструменты из подгруппы (например 33, 36) выполняют обработку сигналов. Например, полоса частот для инструментов FD, которые не находятся в подгруппе, может быть больше, например может быть полной полосой частот.
В примерах средство 39 обнаружения и управления полосы частот кодера может входить в состав процессора цифровых сигналов, который, например, осуществляет также другие инструменты кодирующего устройства.
Фиг. 4 и 4a изображают декодирующие устройства 40 и 40a, соответственно, каждое из которых может декодировать цифровое представление информационного сигнала, кодированного, например, кодером 30 или 30a. Каждое из декодирующих устройств 40 и 40a может содержать инструменты FD и, в некотором случае, инструменты TD.
Каждое из декодирующих устройств 40 и 40a может содержать инструмент 41 мультиплексирования битового потока, чтобы получать битовый поток (например, путем передачи) от кодирующего устройства (например, устройства 30 или 30a). Например, выходной сигнал от кодирующего устройства 30 или 30a может быть обеспечен в качестве входного сигнала для декодирующего устройства 40 или 40a.
Каждое из декодирующих устройств 40 и 40a может содержать декодер 42, который может, например, распаковывать данные в битовом потоке. Арифметическое декодирование может выполняться. Остаточное декодирование может выполняться.
Каждое из декодирующих устройств 40 и 40a может содержать инструмент 43 заполнения шума, обрабатывающий сигналы в FD.
Каждое из декодирующих устройств 40 и 40a может содержать инструмент 44 глобального усиления, обрабатывающий сигналы в FD.
Каждое из декодирующих устройств 40 и 40a может содержать инструмент 45 декодера TNS, обрабатывающий сигналы в FD. TNS может быть кратко описано следующим образом. На стороне кодера и перед квантованием сигнал фильтруется в частотной области (FD) с использованием линейного предсказания, LP, для того, чтобы выровнять сигнал во временной области. На стороне декодера и после обратного квантования сигнал фильтруется обратно в частотную область с использованием обратного фильтра предсказания для того, чтобы сформировать шум квантования во временной области так, чтобы он был замаскирован сигналом.
Каждое из декодирующих устройств 40 и 40a может содержать инструмент формирования 46 MDCT или MDST (другие виды инструментов формирования могут быть использованы). В частности, инструмент формирования 46 MDCT или MDST может обрабатывать сигналы путем применения коэффициентов масштабирования (или квантованных коэффициентов масштабирования), полученных от инструмента 32a SNS кодера, или коэффициентов усиления, вычисленных из декодированных коэффициентов фильтра LP (полученных от инструмента 47 декодирования LPC), преобразованных в спектр MDCT или MDST.
Каждое из декодирующих устройств 40 и 40a может содержать обратный инструмент 48a обратного MDCT или MDST низкой задержки, чтобы преобразовывать представления сигналов из FD в TD (инструменты на основании других видов обратного преобразования могут быть использованы).
Каждое из декодирующих устройств 40 и 40a может содержать инструмент 48b LTPF для выполнения постфильтра в TD, например, на основании параметров, обеспеченных компонентом 38b в декодере.
Каждое из декодирующих устройств 40 и 40a может содержать средство 49 управления полосы частот декодера, выполненное с возможностью выбора полосы частот по меньшей мере одного из инструментов FD. В частности, полосой частот подгруппы (например, формируемой инструментами 43 и 45) может осуществляться управление для того, чтобы она отличалась от полосы частот, в которой другие инструменты FD (42, 44, 46, 47) обрабатывают сигналы. Средство 49 управления полосы частот может получать входной сигнал 39a, который был подготовлен на стороне кодера (например, средством 39 обнаружения и управления полосы частот), чтобы указывать выбранную полосу частот для по меньшей мере одной из подгрупп (33, 36, 43, 45).
В примерах средство 49 управления полосы частот декодера может выполнять операции, подобные обрабатываемым средством 39 обнаружения и управления полосы частот кодера. Однако в некоторых примерах средство 49 управления полосы частот декодера может предполагаться как компонент, который получает управляющие данные (например, кодированные в битовом потоке) от средства 39 обнаружения и управления полосы частот кодера и обеспечивает управляющие данные (например, информацию полосы частот) инструментам из подгруппы (например, инструменту 43 заполнения шума декодера и/или инструменту 45 декодера TNS). В примерах средство 39 управления является ведущим, а средство 49 управления является ведомым. В примерах средство 49 управления полосы частот декодера может быть частью или секцией процессора цифровых сигналов, который, например, осуществляет также другие инструменты декодера.
В общем, средства 39 и 49 управления полосы частот могут работать таким образом, что инструменты FD подгрупп (например, 33 и 36 для кодирующего устройства и/или 43 и 45 для декодирующего устройства) имеют одну и ту же полосу частот, в то время как другие инструменты FD декодера и/или кодера имеют другую полосу частот (например, более широкую полосу).
Было замечено, в сущности, что соответственно существует возможность уменьшить недостатки уровня техники. В то время как для некоторых инструментов FD (например, инструментов TNS, инструментов заполнения шума) может быть предпочтительно фактически выполнять выбор полосы, для других инструментов FD (например, 32, 34, 35, 42, 44, 46, 47) может быть предпочтительно обрабатывать сигналы в более широкой полосе (например, полной полосе). Соответственно, существует возможность избежать спектральных дыр, которые могут присутствовать в случае жесткого выбора полосы частот для всех инструментов (в частности, когда неверная полоса выбирается).
В примерах полоса частот, которая выбирается средством 49 управления полосы частот декодера, может быть одной из конечного количества вариантов (например, конечного количества полос частот). В примерах существует возможность выбрать из узкой полосы NB (например, 4 кГц), широкой полосы WB (например, 8 кГц), полусверхширокой полосы SSWB (например, 12 кГц), сверхширокой полосы SWB (например, 16 кГц) или полной полосы FB (например, 20 кГц).
Выбор может кодироваться в поле данных кодирующим устройством так, что декодирующему устройству известно, какие полосы частот были выбраны (например, согласно выбору, выполняемому средством 39 обнаружения и управления полосы частот кодера).
Фиг. 6a изображает способ 60. Способ 60 может содержать этапы, которые могут выполняться, по меньшей мере частично, по меньшей мере одним из средств 39 и 49 управления. Способ 60 может быть циклическим для того, чтобы выполнять операции в ассоциации с каждым кадром информационного сигнала.
На этапе S61 энергия для каждой полосы может оцениваться (например, средством 39 обнаружения и управления полосы частот).
На этапе S62 полоса частот может быть обнаружена (например, средством 39 обнаружения и управления полосы частот).
На этапе S63 обнаруженная полоса частот может быть выбрана для по меньшей мере одного из инструмента 33 TNS и инструмента 36 оценки шума: эти инструменты будут выполнять свои процессы в полосе частот, обнаруженной на этапе S62.
В качестве дополнения или альтернативы, на этапе S64 параметры могут быть определены (и/или кодированы) в битовом потоке для сохранения и/или передачи и использования декодером. Среди параметров информация выбора полосы частот (например, 39a) может быть кодирована таким образом, что декодеру будет известна обнаруженная и выбранная полоса частот для подгруппы (например, TNS и заполнения/оценки шума).
Затем новый кадр информационного сигнала может быть проверен. Способ 60 может, таким образом, осуществлять цикл путем перехода к этапу S61. Таким образом, решение может осуществляться покадровым образом.
В частности, в соответствии с обнаруженной полосой частот, другое количество битов может быть кодировано в битовом потоке. В примерах, если обнаруживается полоса частот 8 кГц (NB), никакие биты не будут кодированы в битовом потоке. Однако декодер поймет, что полосой частот является 8 кГц.
Каждое из кодирующих устройств 30 и 30a с фиг. 3 и 3a может содержать:
- множество инструментов кодера частотной области, FD, (31-36) для кодирования информационного сигнала, причем информационный сигнал представляет множество кадров; и
- средство 39 обнаружения и управления полосы частот кодера, выполненное с возможностью выбора полосы частот (например, на этапе S63) по меньшей мере для подгруппы (например, инструмента 33 TNS и инструмента 36 средства оценки уровня шума) из множества инструментов кодера FD на основании характеристик информационного сигнала так, что по меньшей мере один (например, 33, 36) из инструментов кодера FD из подгруппы имеет другую полосу частот относительно по меньшей мере одного из инструментов кодера FD (например, 31, 32, 34, 35), которые не находятся в подгруппе.
В частности, средство 39 обнаружения и управления полосы частот кодера может быть выполнено с возможностью выбора полосы частот по меньшей мере одного инструмента кодера FD из подгруппы (33, 36) между по меньшей мере первой полосой частот (например, предельной частотой), общей для по меньшей мере одного (или более) из инструментов кодера FD, которые не находятся в подгруппе, и второй полосой частот (например, NB, WB, SSWB, SWB), отличной от полосы частот по меньшей мере одного (или более) из инструментов кодера FD, которые не находятся в подгруппе.
Таким образом, некоторые инструменты могут работать в полосах частот, отличных друг от друга, и/или выполнять обработку сигналов с использованием полос частот, отличных друг от друга.
Инструменты, которые не находятся в подгруппе (например, глобальное усиление, спектральное формирование шума и так далее), могут работать в открытой цепи относительно выбора полосы частот.
В примерах средство 39 обнаружения и управления полосы частот кодера выполнено с возможностью выбора (например, на этапе S62) полосы частот по меньшей мере одного из множества инструментов (31-36) кодера FD на основании по меньшей мере одной оценки энергии (например, на этапе S61) над информационным сигналом.
Декодирующее устройство 40 с фиг. 4 содержит множество инструментов декодера FD (43-48a) для декодирования информационного сигнала, кодированного в битовом потоке, причем:
инструменты декодера FD разделены:
- на подгруппу, содержащую по меньшей мере один инструмент декодера FD (например, 43, 45);
- на остальные инструменты декодера FD, содержащие по меньшей мере один инструмент декодера FD (например, 44, 46, 48a);
причем декодирующее устройство 40 или 40a выполнено с возможностью выбора полосы частот для по меньшей мере одного из множества инструментов декодера из подгруппы (например, 43, 45) на основании информации полосы частот, включенной в битовый поток, так, что по меньшей мере один из множества инструментов декодера из подгруппы (например, 43, 45) выполняет обработку сигналов в другой полосе частот относительно по меньшей мере одного из остальных инструментов декодера FD из множества инструментов декодера (например, 44, 46, 48a).
Фиг. 6b изображает способ 60b. Способ 60b может быть способом для кодирования информационного сигнала согласно по меньшей мере множеству операций в частотной области, FD, причем способ содержит этапы, на которых:
выбирают полосу частот для подгруппы операций FD (например, S61b);
выполняют первые операции обработки сигналов в полосе частот для подгруппы операций FD (например, S62b);
выполняют вторые операции обработки сигналов в другой полосе частот для операций FD, которые не находятся в подгруппе (например, S63b).
Нет необходимости, например, выполнять этапы S61b и S62b в этом порядке по времени. Например, S62b может выполняться до S61b. S61b и S62b могут также выполняться параллельно (например, с использованием методик разделения времени или подобных).
Фиг. 6c изображает способ 60c. Способ 60c может быть способом для декодирования битового потока с информационным сигналом и управляющими данными (например, 39a), причем способ содержит множество операций обработки сигналов в частотной области, FD, причем способ содержит этапы, на которых:
выбирают вариант полосы частот для подгруппы операций FD на основании управляющих данных (S61c);
выполняют первые операции обработки сигналов в полосе частот для подгруппы операций FD (S62c);
выполняют вторые операции обработки сигналов в другой полосе частот для операций FD, которые не находятся в подгруппе (S63c).
Нет необходимости, например, выполнять этапы S61c и S62c в этом временном порядке. Например, S62c может выполняться до S61c. S61c и S62c могут также выполняться параллельно (например, с использованием методик разделения времени или подобных).
Согласно одному примеру, средство 39 обнаружения и управления полосы частот кодера может обнаруживать энергию для каждой полосы, например, с использованием уравнения, такого как:
Figure 00000001
где X(k) - коэффициенты MDCT или MDST (или любое другое представление сигнала в FD), N B (например, 64) - количество полос, и
Figure 00000002
- индексы, ассоциированные с полосой (причем каждый индекс ассоциирован с интервалом).
Таким образом, существует возможность обнаруживать (например, на этапе S62) полосу частот (например, из конечного количества полос частот). Средство 39 обнаружения и управления полосы частот кодера может иметь возможность обнаруживать обычно используемую полосу частот в передаче речи, т. е. 4 кГц, 8 кГц, 12 кГц и 16 кГц. Например, существует возможность обнаруживать тишину каждой полосы частот. В случае положительного обнаружения тишины для полосы частот специализированные характеристики отсечения на спектре дополнительно обнаруживаются. Например, флаг (или в любом случае данные), касающийся обнаружения тишины, может быть получен следующим образом:
Figure 00000012
Figure 00000013
F Q (bw) - двоичное значение, которое равно 1, если суммирование меньше T Q (bw), и 0, если суммирование больше T Q (bw). F Q (bw), ассоциированное с конкретной полосой частот bw, указывает тишину (например, с логическим значением «1»), когда суммирование значений энергии меньше пороговой величины для конкретной полосы частот bw (и «0» в остальных случаях). Суммирование относится к сумме значений энергии на различных индексах (например, энергия для каждого интервала или полосы), например, для n от первого индекса полосы частот, ассоциированной с индексом I bw start (bw), до последнего индекса полосы частот, ассоциированной с индексом I bw st op (bw). Количество проверенных полос частот равно N bw .
Процедура может останавливаться, когда F Q (bw)==0 (энергия больше пороговой величины для полосы частот bw). В случае, когда F Q (bw+1)==1, флаги F C (b), указывающие характеристику отсечения спектра, могут быть обнаружены следующим образом
Figure 00000014
где D определяет расстояние между полосами, где характеристика отсечения должна быть проверена, т. е. D(bw).
Затем существует возможность определить окончательную информацию (информацию полосы частот или информацию выбора полосы частот), которая должна быть использована, чтобы управлять подгруппой (например, инструментом 33 TNS, и/или инструментом 36 оценки уровня шума, и/или инструментом 45 декодера TNS, и/или инструментом 43 заполнения шума). Окончательная информация может быть, например, кодирована в некоторых битах и может принимать такую форму, как
Figure 00000015
Параметр полосы частот Pbw (информация выбора полосы частот) может быть использован, чтобы управлять TNS и инструментом заполнения шума, например в декодере, и осуществлять сигнал 39a. Параметр Pbw может сохраняться и/или передаваться в битовом потоке с использованием количества битов nbitsbw. В частности, количество битов не обязательно является постоянным и может варьироваться согласно выбранному шагу дискретизации f s , таким образом уменьшая полезную информацию для битового потока, где в ней нет необходимости.
Таблица, такая как следующая далее, моет быть использована:
Figure 00000016
Таблица 1
f s - некоторая заданная частота дискретизации (например, 8 кГц, 16 кГц, 24 кГц, 32 кГц и/или 48 кГц), и, для каждой f s , количество возможных режимов равно N bw +1.
Таким образом, существует возможность кодировать поле управляющих данных, включающее в себя:
- 0 бит данных, соответствующих (сигнализирующих выбор) полосе частот NB;
- 1 бит данных, соответствующий (сигнализирующий выбор одной из) полосе частот NB и WB;
- 2 бита данных, соответствующих (сигнализирующих выбор одной из) полосе частот NB, WB и SSWB;
- 2 бита данных, соответствующих (сигнализирующих выбор одной из) полосе частот NB, WB, SSWB и SWB;
- 3 бита данных, соответствующих (сигнализирующих выбор одной из) полосе частот NB, WB, SSWB, SWB и FB.
Электронная версия по меньшей мере некоторых частей таблицы 1 может сохраняться в кодере и/или кодере. Соответственно, при параметре полосы частот Pbw существует возможность автоматически узнавать управляющую информацию для операций TNS и заполнения шума. Например, I bw start может указывать на начальный индекс, ассоциированный с нижним концом полосы частот, I bw stop может указывать на последний индекс, ассоциированный с верхним концом полосы частот. Выбор полосы частот и параметры на основании этого выбора могут, таким образом, быть найдены из таблицы, такой как таблица 1.
В примерах, когда fs=8000, средство обнаружения полосы частот не является необходимым, и мы имеем Pbw=0 и nbitsbw=0, т. е. параметр Pbw не размещается в битовом потоке. Однако декодер поймет, что выбранной полосой частот является NB (например, на основе электронных инструментов, таких как электронная версия таблицы 1).
Другие способы могут быть использованы. Одна из полос частот NB, WB, SSWB, SWB, FB может быть идентифицирована и передана к инструментам FD подгруппы кодера, таким как инструмент 33 формирования TNS и инструмент 36 средства оценки шума. Информация, такая как параметр Pbw (39a), может быть кодирована и передана декодирующему устройству 40 или 40a так, что инструмент 43 средства оценки шума декодера и инструмент 45 декодера TNS используют информацию, касающуюся выбранной полосы частот.
В общем виде характеристики информационного сигнала, которые составляют основу для выбора полосы частот, могут содержать, помимо прочего, одно или несколько из полосы частот сигнала, по меньшей мере одной оценки энергии информационного сигнала, характеристик отсечения на спектре, информации об обнаружении тишины в некоторых конкретных полосах, F Q (bw) и т. д.
Примеры выше позволяют получить мягкое переключение полосы частот.
5.2. MDCT или MDST (или другое преобразование) в кодере
Инструмент 31 модифицированного дискретного косинусного преобразования (MDCT) или модифицированного дискретного синусного преобразования (MDST) (или другого модулированного преобразования с перекрытием) может конвертировать цифровое представление в TD в цифровое представление в FD. Другие примеры (возможно основанные на других преобразованиях, таких как преобразования с перекрытием) могут, однако, быть использованы. Пример обеспечен здесь.
Входной сигнал x(n) текущего кадра b в TD может состоять из N F аудиовыборок, где новейший расположен на x(N F -1). К аудиовыборкам прошлых кадров осуществляется доступ путем отрицательного индексирования, например x(-1) является новейшим их предыдущих кадров.
Входной буфер времени для MDCT t может обновляться согласно
Figure 00000017
Figure 00000018
(инициализация требуется только для целостности)
Блок N F временных выборок может быть преобразован в коэффициенты частоты X(k) с использованием следующего уравнения:
Figure 00000019
где w N - окно MDCT низкой задержки согласно используемому размеру кадра. Окно может быть оптимизировано для N F =480, и другие версии для различных размеров кадров могут генерироваться посредством интерполяции. Форма окна может быть результатом процедуры оптимизации и может быть обеспечена поточечно.
Также возможно применить MDST или другие преобразования.
5.3.1. LPC в кодере
Анализ линейного кодирования с предсказанием (LPC) может выполняться инструментом 32 LPC. LPC представляет спектральную огибающую цифрового сигнала в сжатой форме, использующую информацию линейной предсказательной модели.
Фильтр LPC может выводиться в искривленной частотной области и, таким образом, быть психоакустически оптимизированным. Чтобы получить автокорреляционную функцию, энергия E B (b), как определено выше, может быть предыскажена следующим образом
Figure 00000020
где
f s g tilt
16000 18
24000 22
32000 26
48000 30
и преобразована во временную область с использованием, например, обратного нечетного DFT
Figure 00000021
Figure 00000022
В случае R Pre (0)=0 установить R Pre (0)=1 и R Pre (1..N B -1)=0. Первые N L выборок извлекаются в вектор R L =R Pre (0..N L -1), где N L означает порядок фильтра LP, т. е. N L =16.
Коэффициенты фильтра LP могут быть вычислены, например, на основании вектора R L посредством процедуры Левинсона-Дурбина. Эта процедура может быть описана следующим псевдокодом:
Figure 00000023
где
Figure 00000024
- оцененные коэффициенты LPC, и e - ошибка предсказания.
Коэффициенты LPC могут быть взвешены, в примерах, посредством уравнения, такого как:
Figure 00000025
Коэффициенты LPC могут быть квантованы.
Например, взвешенные коэффициенты LPC a w (k) сначала свертываются с коэффициентами b(i) с использованием
Figure 00000026
где
Figure 00000027
и
Figure 00000028
Коэффициенты a c (k) затем могут быть преобразованы в частотную область с использованием
Figure 00000029
где N T =256 - длина преобразования. Следует заметить, что это преобразование может эффективно осуществляться с использованием усеченного FFT. Действительная и мнимая части A(k) затем извлекаются
Figure 00000030
LSF могут быть получены путем поиска с переходом через нуль A r (k) и A i (k), который может быть описан следующим псевдокодом
Figure 00000031
Если найдено меньше 16 LSF, LSF устанавливаются согласно
Figure 00000032
Формирование LPC может выполняться в области MDCT или MDST (FD) путем применения коэффициентов усиления, вычисленных из взвешенных и квантованных коэффициентов фильтра LP, преобразованных в спектр MDCT или MDST.
Чтобы вычислить N B =64 усилений формирования LPC, взвешенные коэффициенты фильтра LP ã сначала преобразуются в частотную область с использованием нечетного DFT.
Figure 00000033
Усиления формирования LPC g LPC (b) затем могут быть получены в виде абсолютных значений G LPC (b).
Figure 00000034
Усиления формирования LPC gLPC(b) могут применяться на частотных линиях MDCT или MDST для каждой полосы отдельно для того, чтобы генерировать сформированный спектр Xs(k), как описано следующим кодом.
Figure 00000035
Как можно увидеть выше, инструментом LPC, для выполнения анализа LPC, не управляет средство 39 управления: например, нет выбора конкретной полосы частот.
5.3.2. SNS в кодере
Обращаясь к фиг. 4a, существует возможность использовать инструмент 32a средства формирования спектрального шума.
Формирование спектрального шума (SNS) формирует шум квантования в частотной области таким образом, чтобы он минимально воспринимался человеческим ухом, максимизируя качество восприятия декодированного выходного сигнала.
Формирование спектрального шума может выполняться с использованием, например, 16 параметров масштабирования. Эти параметры могут быть получены в кодере путем, во-первых, вычисления энергии спектра MDCT (или MDST, или другого преобразования) в 64 неоднородных полосах, затем путем применения некоторой обработки к 64 энергиям (сглаживание, предыскажение, пороговая величина шума, логарифмическое преобразование), затем путем понижающей дискретизации 64 обработанных энергий с коэффициентом 4, чтобы получить 16 параметров, которые наконец нормализованы и масштабированы. Эти 16 параметров затем могут быть квантованы с использованием вектора. Квантованные параметры затем могут быть интерполированы, чтобы получить 64 интерполированных параметра масштабирования. Эти 64 параметра масштабирования затем используются, чтобы непосредственно сформировать спектр MDCT (или MDST...) в 64 неоднородных полосах. Масштабированные коэффициенты MDCT (или MDST...) затем могут быть квантованы с использованием скалярного квантизатора с размером шага, управляемым глобальным усилением. В декодере обратное масштабирование выполняется в каждых 64 полосах, формируя шум квантования, внесенный скалярным квантизатором. Методика SNS, раскрываемая здесь, может использовать, например, только 16+1 параметров в качестве дополнительной информации, и параметры могут быть эффективно кодированы с низким количеством битов с использованием векторного квантования. Следовательно, количество битов дополнительной информации уменьшается, что может приводить к существенному преимуществу при низкой скорости передачи битов и/или низкой задержке. Нелинейное частотное масштабирование может быть использовано. В этих примерах ни одна из относящихся к LPC функций не используется, чтобы уменьшить сложность. Требуемые функции обработки (сглаживание, предыскажение, пороговая величина шума, логарифмическое преобразование, нормализация, масштабирование, интерполяция) требуют сравнительно очень малой сложности. Только векторное квантование все еще имеет относительно высокую сложность. Однако некоторые методики векторного квантования низкой сложности могут быть использованы с малой потерей в производительности (подходы множественного разделения/множественных этапов). Эта методика SNS не полагается на фильтр восприятия на основе LPC. Она использует 16 параметров масштабирования, которые могут быть вычислены с большим количеством свободы. Гибкость, таким образом, увеличивается.
В кодере 30a инструмент 32 SNS может выполнять по меньшей мере один из следующих этапов:
Этап 1: Энергия для каждой полосы
Энергия для каждой полосы E B (n) может быть вычислена следующим образом
Figure 00000036
где X(k) - коэффициенты MDCT (или MDST, или другого преобразования), N B =64 - количество полос, и
Figure 00000002
- индексы полос. Полосы могут быть неоднородными и следовать относящемуся к восприятию масштабу барка (меньше на низких частотах, больше на высоких частотах).
Этап 2: Сглаживание
Энергия для каждой полосы E B (b) сглаживается с использованием
Figure 00000037
Этот этап может главным образом использоваться, чтобы сгладить возможные неустойчивости, которые могут возникать в векторе E B (b). Без сглаживания эти неустойчивости усиливаются при конвертировании в логарифмическую область (см. этап 5), в особенности в минимумах, где энергия близка к 0.
Этап 3: Предыскажение
Сглаженная энергия для каждой полосы E S (b) затем предыскажается с использованием
Figure 00000038
где g tilt управляет наклоном предыскажения и зависит от частоты дискретизации. Оно равно, например, 18 при 16 кГц и 30 при 48 кГц. Предыскажение, используемое на этом этапе, имеет ту же самую цель, что и предыскажение, используемое в фильтре восприятия на основе LPC из уровня техники 2, оно увеличивает амплитуду формируемого спектра на низких частотах, что в результате приводит к уменьшенному шуму квантования на низких частотах.
Этап 4: Пороговая величина шума
Пороговая величина шума на -40 дБ добавляется к E P (b) с использованием
Figure 00000039
где пороговая величина шума вычисляется как
Figure 00000040
Этот этап улучшает качество сигналов, содержащих очень высокие спектральные динамики, таких как, например, колокольчики, путем ограничения усиления амплитуды формируемого спектра в минимумах, что имеет косвенный эффект уменьшения шума квантования в пиках (увеличение шума квантования в минимумах неощутимо).
Этап 5: Логарифм
Преобразование в логарифмическую область затем выполняется с использованием
Figure 00000041
Этап 6: Понижающая дискретизация
Вектор E L (b) затем дискретизируется с понижением с коэффициентом 4 с использованием
Figure 00000042
где
Figure 00000043
Этот этап применяет фильтр низких частот (w(k)) к вектору E L (b) перед прореживанием. Этот фильтр низких частот имеет эффект, подобный функции рассеивания, используемой в психоакустических моделях: он уменьшает шум квантования в пиках ценой увеличения шума квантования вокруг пиков, где его восприятие уже маскируется.
Этап 7: Удаление среднего и масштабирование
Окончательные коэффициенты масштабирования получаются после удаления среднего и масштабирования с коэффициентом 0,85
Figure 00000044
Поскольку кодек имеет дополнительное глобальное усиление, удаление среднего может осуществляться без какой-либо потери информации. Удаление среднего также обеспечивает возможность более эффективного векторного квантования. Масштабирование на 0,85 немного сжимает амплитуду кривой формирования шума. Это имеет эффект восприятия, подобный функции рассеивания, упомянутой на этапе 6: уменьшенный шум квантования в пиках и увеличенный шум квантования в минимумах.
Этап 8: Квантование
Коэффициенты масштабирования квантуются с использованием векторного квантования, производя индексы, которые затем упаковываются в битовый поток и посылаются декодеру, и квантованные коэффициенты масштабирования scfQ(n).
Этап 9: Интерполяция
Квантованные коэффициенты масштабирования scfQ(n) интерполируются с использованием:
Figure 00000045
и преобразуются обратно в линейную область с использованием
Figure 00000046
Интерполяция может быть использована, чтобы получить гладкую кривую формирования шума и, таким образом, избежать каких-либо больших скачков амплитуды между смежными полосами.
Этап 10: Спектральное формирование
Коэффициенты масштабирования SNS g SNS (b) применяются к частотным линиям MDCT (или MDST, или другого преобразования) для каждой полосы отдельно для того, чтобы генерировать сформированный спектр X s (k)
Figure 00000047
5.4. TNS в кодере
Фиг. 7 изображает способ 70, указывающий операции инструмента TNS, такого как инструмент 33 TNS, кодера 30 или 30a.
На этапе S71 выбор информации, относящейся к выбранной полосе частот (например, параметру Pbw), может быть получен, например, от средства 39 обнаружения и управления полосы частот кодера.
Согласно информации выбора (информации полосы частот), поведение TNS различно для различных полос частот (NB, WB, SSWB, SWB, FB). Пример обеспечен следующей таблицей:
Figure 00000048
Таблица 2
Например, когда информацией выбора является SWB, TNS будет выполнять фильтрацию дважды (см. num_tns_filters). Как можно увидеть из таблиц, различные индексы ассоциированы с различными полосами частот (например, для NB частота остановки отлична от частоты остановки для WB и так далее).
Таким образом, как можно увидеть, инструмент 33 TNS может работать в другой полосе частот на основании выбора, определенного средством 39 управления. В частности, другие инструменты FD того же самого декодирующего устройства 40 или 40a могут продолжать выполнять процессы на другой частоте.
Этапы кодирования TNS описаны ниже. Прежде всего анализ оценивает набор коэффициентов отражения для каждого фильтра TNS (этап S72). Затем эти коэффициенты отражения квантуются (этап S73). И, наконец, MDCT- или MDST-спектр фильтруется с использованием квантованных коэффициентов отражения (этап S73).
Обращаясь к этапу S72, полный анализ TNS, описанный ниже, может повторяться для каждого фильтра TNS f, где f=0..num_tns_filters-1 (num_filters дается в таблице 2). Другие операции анализа TNS могут выполняться, которые обеспечивают коэффициенты отражения.
Инструмент TNS может быть выполнен с возможностью выполнения автокорреляции для входного значения TNS. Нормализованная автокорреляционная функция может быть вычислена следующим образом для каждого k=0..8 (например)
Figure 00000049
где
Figure 00000004
и
Figure 00000005
гдк sub_start(f, s) и sub_stop(f, s) даны в таблице 2. e(s) - сумма энергий над спектральной подсекцией (коэффициент нормализации между частотой начала и остановки каждого фильтра).
Для нормализованной автокорреляционной функции может осуществляться корреляционное окно с использованием, например:
Figure 00000050
В некоторых примерах существует возможность выполнить решение включить/выключить фильтр TNS f в текущем кадре на основании усиления предсказания
Если predGain>thresh, то включить фильтр TNS f
где thresh=1,5, и усиление предсказания может быть вычислено как
Figure 00000051
Дополнительные этапы, описанные ниже, выполняются только в случае, если фильтр TNS f включен (или в примере, который не использует включение/выключение).
В некоторых примерах весовой коэффициент может быть вычислен как
Figure 00000052
где thresh2=2, γmin=0,85 и
Figure 00000053
Коэффициенты LPC могут быть взвешены с использованием коэффициента γ
Figure 00000054
Взвешенные коэффициенты LPC могут быть преобразованы в коэффициенты отражения с использованием следующей процедуры:
Figure 00000055
где rc(k, f)=rc(k) - окончательные оцененные коэффициенты отражения для фильтра TNS f.
Если фильтр TNS f выключен, то коэффициенты отражения могут быть просто установлены как 0: rc(k, f)=0, k=0..8.
На этапе S73 этап квантования может выполняться. Например, для каждого фильтра TNS f коэффициенты отражения (например, полученные на этапе S72) могут квантоваться. Например, скалярное однородное квантование в области арксинуса может быть использовано:
Figure 00000056
и/или
Figure 00000057
где
Figure 00000058
, и nint(.) - функция округления до ближайшего целого, например;
rc i (k, f) - выходные индексы квантизатора; и rc q (k, f) - квантованные коэффициенты отражения.
Порядок квантованных коэффициентов отражения может быть вычислен с использованием
Figure 00000059
Полное количество битов, занятых TNS в текущем кадре, может быть вычислено следующим образом
Figure 00000060
где
Figure 00000061
и/или
Figure 00000062
Figure 00000063
означает операцию округления до целого в большую сторону.
Таблицы tab_nbits_TNS_order и tab_nbits_TNS_coef могут быть заданными.
На этапе S74 цифровое представление информационного сигнала в FD (например, обеспеченное инструментом 32 LPC или инструментом 32a SNS) может фильтроваться. Это представление может, в примерах, иметь форму модифицированного дискретного косинусного или синусного преобразования (MDCT или MDST). Спектр MDCT X s (n) может фильтроваться с использованием следующего алгоритма, например:
Figure 00000064
где X f (n) - TNS-фильтрованный спектр MDCT или MDST.
Другие методики фильтрации могут быть использованы. Однако можно увидеть, что TNS применяется к конкретной полосе частот (например, NB, WB, SSWB, SWB, FB), выбранной средством 39 управления на основании характеристик сигнала.
5.5. Спектральное квантование в кодере
Здесь рассматривается инструмент 34 квантизатора спектра. Спектр MDCT или MDST после фильтрации TNS (Xf(n)) может квантоваться с использованием мертвой зоны плюс скалярного квантования однородной пороговой величины, и квантованный спектр MDCT или MDST Xq(n) может затем кодироваться с использованием арифметического кодирования. Глобальное усиление gg может управлять размером шага квантизатора. Это глобальное усиление квантуется с 7 битами, и квантованный индекс глобального усиления ggind тогда является целым, например между 0 и 127. индекс глобального усиления может быть выбран так, чтобы количество битов, необходимых для кодирования квантованного спектра MDCT или MDST, было максимально близко к доступному запасу битов.
В одном примере количество битов, доступных для кодирования спектра, может быть дано как
Figure 00000065
где nbits - количество битов, доступных в одном кадре TD для исходного информационного сигнала, nbits bw обеспеченно в таблице 1, nbits TNS обеспечено из TNS (полное количество битов, занятых TNS в текущем кадре), nbits LTPF ассоциировано, например, с LTPF 38b (количество битов, занятых LTPF), nbits LPC / SNS =38, nbits gain =7 и nbits nf =3. В примерах также могут учитываться биты защиты (например, биты циклического избыточного кода, CRC).
Смещение может сначала быть вычислено с использованием
Figure 00000066
где nbitsoffset old - значение nbitsoffset в предыдущем кадре, nbitsspec old - значение nbitsspec в предыдущем кадре, и nbitsest old - значение nbitsest в предыдущем кадре.
Это смещение может затем быть использовано, чтобы регулировать количество битов, доступных для кодирования спектра
Figure 00000067
Индекс глобального усиления может затем оцениваться так, чтобы количество битов, необходимых, чтобы кодировать квантованный спектр MDCT или MDST, было максимально близко к доступному запасу битов. Эта оценка основана на дихотомическом поиске низкой сложности, который грубо аппроксимирует количество битов, необходимых, чтобы кодировать квантованный спектр. Алгоритм может быть описан следующим образом
Figure 00000068
где E[k] - энергия (в дБ) блоков 4 коэффициентов MDCT или MDST, обеспеченная как
Figure 00000069
Индекс глобального усиления выше первым деквантуется с использованием
Figure 00000070
Спектр Xf может затем квантоваться с использованием, например:
Figure 00000071
Количество битов nbitsest, необходимых, чтобы кодировать квантованный спектр MDCT или MDST (или, в любом случае, FD) Xq(n), может быть точно оценено с использованием алгоритма ниже.
Флаг скорости передачи битов первым вычисляется с использованием, например:
Figure 00000072
Затем индекс последнего ненулевого 2-кортежа получается как
Figure 00000073
Количество битов nbitsest может быть затем вычислено следующим образом
Figure 00000074
где aclookup и acbits - таблицы, которые могут быть заданы.
Количество битов nbits est может сравниваться с доступным запасом битов nbits spec . Если они далеки друг от друга, то квантованный индекс глобального усиления gg ind регулируется, и спектр повторно квантуется. Процедура, используемая, чтобы регулировать квантованный индекс глобального усиления gg ind , дана ниже
Figure 00000075
Как можно увидеть выше, спектральным квантованием не управляет средство 39 управления: нет никакого ограничения для конкретной полосы.
5.6. Энтропийное кодирование
Все или часть кодированных данных (данных TNS, данных LTPF, глобального усиления, квантованного спектра...) могут быть энтропийно кодированы, например, путем сжатия согласно любому алгоритму.
Часть этих данных может быть составлена чистыми битами, которые непосредственно помещаются в битовом потоке, начиная с конца битового потока по ходу назад.
Остальные данные могут быть кодированы с использованием арифметического кодирования, начиная с начала битового потока по ходу вперед.
Два поля данных выше могут меняться местами в плане исходной точки и направления считывания/записи битового потока.
Примером в псевдокоде может быть:
Figure 00000076
Figure 00000077
5.7. Оценка шума в кодере
Инструмент 36 оценки шума (средство оценки уровня шума) может управлять заполнением шума на стороне декодера. На стороне кодера параметр уровня шума может оцениваться, квантоваться и передаваться или сохраняться в битовом потоке.
Уровень шума может оцениваться на основании спектральных коэффициентов, которые были квантованы в ноль, т. е. X q (k)==0. Индексы для актуальных спектральных коэффициентов даны как
Figure 00000078
где bw stop может зависеть от полосы частот, обнаруженной на этапе S62 и/или средством 39 обнаружения и управления полосы частот, как определено, например, в следующей таблице:
Полоса частот ( P bw , 39a)
NB WB SSWB SWB FB
bw_stop 80 160 240 320 400
Таблица 3
Для идентифицированных индексов средний уровень отсутствующих коэффициентов оценивается на основе спектра после фильтрации TNS (Xf(k)), например, и нормализуется глобальным усилением.
Figure 00000006
Окончательный уровень шума может быть квантован в восемь шагов:
Figure 00000079
Таким образом, инструментом 36 средства оценки уровня шума может управлять средство 39 управления, например, на основании информации 39a полосы частот.
Например, электронная версия таблицы 3 может сохраняться в блоке хранения так, что, когда выбор полосы частот для конкретной полосы частот получается, параметр bw stop легко выводится.
5.8. Энтропийное декодирование в декодере
Все кодированные данные (данные TNS, данные LTPF, глобальное усиление, квантованный спектр...) могут быть энтропийно декодированы на стороне декодера, например, с использованием инструмента 42 декодера. Битовый поток, обеспеченный кодером, может, таким образом, быть развернут согласно любому алгоритму.
5.9. Заполнение шума в декодере
Здесь рассматривается инструмент 43 заполнения шума декодера. Инструментом 43 заполнения шума декодера может управлять, помимо прочего, средство 49 управления полосы частот декодера (и/или средство 39 управления через информацию 39a, кодированную в битовом потоке, такую как поле управляющих данных Nbw и/или Pwb из таблицы 1).
Индексы для актуальных спектральных коэффициентов могут быть даны как
Figure 00000080
где bw stop может быть дано в таблице 3.
Заполнение шума может применяться над идентифицированными актуальными спектральными линиями INF(k) с использованием переданного коэффициента шума FNF, полученного от кодера. FNF может быть вычислен в средстве оценки шума на стороне кодера. FNF может быть трехбитным значением, кодированным в качестве дополнительной информации в битовом потоке. FNF может быть получен, например, с использованием следующей процедуры:
Figure 00000081
Figure 00000082
Здесь обеспечена процедура:
Figure 00000083
Как получить nf_seed, может быть описано, например, следующим псевдокодом:
Figure 00000084
Как можно увидеть выше, инструмент 43 фильтра шума декодера может использовать параметр bw stop .
В некоторых примерах параметр bw stop явным образом получается в виде значения в битовом потоке. В примерах параметр bw stop получается средством 49 управления на основании информации 39a полосы частот (Pbw) в управляющем поле битового потока, кодированного кодером. Декодер может иметь электронную версию таблицы 3, сохраненную в постоянном блоке хранения. Соответственно, длина битового потока уменьшается.
Таким образом, средство 49 управления полосы частот (и/или средство 39 обнаружения и управления полосы частот декодера через управляющие данные 39a) может управлять инструментом 43 заполнения шума декодера.
5.9. Глобальное усиление в декодере
Глобальное усиление может применяться над спектром после того, как заполнение шума было применено, с использованием, например, формулы, такой как
Figure 00000085
где ggind - индекс глобального усиления, например, полученный от кодера.
5.10. TNS в декодере
Здесь рассматривается инструмент 45 декодера TNS. Квантованные коэффициенты отражения могут быть получены для каждого фильтра TNS f с использованием
Figure 00000086
где rci(k, f) - выходные индексы квантизатора.
Спектр MDCT или MDST
Figure 00000087
(например, генерируемый инструментом глобального усиления) может затем фильтроваться с использованием следующей процедуры, такой как:
Figure 00000088
где
Figure 00000089
- выходной сигнал декодера TNS.
Параметры num_tns_filters, start_freq и stop_freq могут быть обеспечены на основании управляющей информации, обеспеченной кодером.
В некоторых примерах num_tns_filters, start_freq и/или stop_freq не обеспечены явным образом в битовом потоке. В примерах num_tns_filters, start_freq и stop_freq выводятся на основании значения Nbw в управляющем поле битового потока, кодированного кодером. Например, декодер может иметь электронную версию таблицы 2 (или по меньшей мере ее часть), сохраненную в нем. Соответственно, длина битового потока уменьшается.
Таким образом, инструментом 45 декодера TNS может осуществляться управление посредством полосы частот, обнаруженной на стороне кодера.
5.11.1. Формирование MDCT или MDST в декодере
Здесь рассматривается инструмент 46 формирования MDCT или MDST. Формирование LPC или SNS может выполняться в области MDCT (FD) путем применения коэффициентов усиления, вычисленных из декодированных коэффициентов фильтра LP, преобразованных в спектр MDCT или MDST.
Чтобы вычислить NB усилений формирования LPC, декодированные коэффициенты фильтра LP
Figure 00000090
могут быть сначала преобразованы в частотную область с использованием нечетного DFT.
Figure 00000091
Усиления формирования LPC gLPC(b) затем могут быть вычислены как обратные абсолютные значения GLPC(b).
Figure 00000092
Усиления формирования LPC gLPC(b) могут применяться над TNS-фильтрованными частотными линиями MDCT для каждой полосы отдельно, как описано, для того, чтобы генерировать формированный спектр
Figure 00000093
, как описано, например, посредством следующего кода:
Figure 00000094
Как можно увидеть выше, инструмент 46 формирования MDCT или MDST не обязательно должен быть ограничен конкретной полосой частот, и, таким образом, им не обязательно должно управлять средство 49 или 39 управления.
5.11.2. SNS в декодере
Следующие этапы могут выполняться в инструменте 46a декодера средства формирования шума, SNS:
Этап 1: Квантование
Индексы квантизатора вектора, произведенные на этапе 8 кодера (см. раздел 5.3.2), считываются из битового потока и используются, чтобы декодировать квантованные коэффициенты масштабирования scfQ(n).
Этап 2: Интерполяция
То же самое, что и этап 9 в разделе 5.3.2.
Этап 3: Спектральное формирование
Коэффициенты масштабирования SNS g SNS (b) применяются над квантованными частотными линиями MDCT (или MDST, или другого преобразования) для каждой полосы отдельно для того, чтобы генерировать декодированный спектр
Figure 00000095
, как описано следующим кодом.
Figure 00000096
5.12. Синтез MDCT или MDST в декодере
Здесь рассматривается инструмент 48a обратного MDCT или MDST (другие инструменты на основе других преобразований, таких как преобразования с перекрытием, могут быть использованы).
Реконструированный спектр
Figure 00000093
может быть преобразован во временную область путем следующих этапов:
1. Генерирование буфера наложения временной области
Figure 00000097
Figure 00000098
2. Осуществление окна для наложенного по времени буфера
Figure 00000099
3. Провести операцию суммирования с перекрытием, чтобы получить реконструированные временные выборки
Figure 00000100
Figure 00000101
Figure 00000102
Figure 00000103
причем mem_ola_add(n) инициализируется как 0 перед декодированием первого кадра.
Обращаясь к этапу 1, MDST может выполняться путем замены функции косинуса функцией синуса, например, чтобы получить:
Figure 00000104
Как можно увидеть выше, инструментом 48a обратного MDCT или MDST не осуществляется управление на основании полосы частот, определенной на стороне кодера.
6. ДРУГИЕ ПРИМЕРЫ
Фиг. 8a изображает устройство 110, которое может осуществлять по меньшей мере некоторые инструменты кодирующего устройства 30 или 30a и/или выполнять по меньшей мере некоторые этапы способа 60 и/или 70. Устройство 110 может содержать процессор 111 и постоянный блок 112 памяти, хранящий инструкции, которые, при исполнении процессором 111, могут побуждать процессор 111 осуществлять по меньшей мере один из инструментов TD и/или FD кодирующего устройства 30 или 30a. В частности, инструкции могут осуществлять подгруппу инструментов FD (например, TNS и/или заполнение шума) и других инструментов FD, которые не находятся в подгруппе (например, 31, 32, 34, 35). Инструкции могут также содержать инструкции, которые, при исполнении процессором 111, выполняют выбор полосы частот так, что полоса частот сигналов, обработанных инструментами в подгруппе инструментов FD (например, TNS и/или заполнение шума), отличается от полосы частот сигналов, обработанных другими инструментами FD, которые не находятся в подгруппе (например, 31, 32, 34, 35). Инструкции могут быть такими, чтобы управлять выбором полосы частот на основании обнаружений энергии, ассоциированных с различными полосами частот. Инструкции могут также содержать инструкции, которые, при исполнении процессором 111, позволяют управлять декодером и, в частности, позволяют управлять полосой частот подгруппы инструментов FD (например, 43, 45), которая может отличаться от полосы частот других инструментов FD. Полоса частот, выбранная для подгруппы в кодере, может быть той же самой, что и выбранная для подгруппы в декодере. Постоянный блок 112 памяти может также содержать другие данные, такие как по меньшей мере части электронных версий таблиц 1, 2 и/или 3. Устройство 110 может содержать место 118 хранения для хранения, например, битового потока, полученного из информационного сигнала (например, аудиосигнала). Устройство 110 может содержать блок 117 вывода для передачи данных, например, беспроводным образом, например, с использованием конкретного протокола, такого как Bluetooth. Например, устройство 110 может определять, путем исполнения инструкций, сохраненных в постоянном блоке 112 памяти, битовый поток, который должен быть передан декодеру. Устройство 110 может также содержать блок 116 ввода для получения данных, например, беспроводным образом, например, с использованием конкретного протокола, такого как Bluetooth.
Фиг. 8b изображает устройство 120, которое может осуществлять по меньшей мере некоторые инструменты декодирующего устройства 40 или 40a. Устройство 120 может содержать процессор 121 и постоянный блок 122 памяти, хранящий инструкции, которые, при исполнении процессором 121, могут побуждать процессор 121 осуществлять по меньшей мере один из инструментов TD и/или FD декодирующего устройства 40 или 40a. В частности, инструкции могут осуществлять подгруппу инструментов FD (например, TNS и/или заполнение шума) и другие инструменты FD, которые не находятся в подгруппе (например, 44, 46 и т. д.). Инструкции могут также содержать инструкции, которые, при исполнении процессором 121, выполняют выбор полосы частот так, что полоса частот сигналов, обработанных инструментами в подгруппе инструментов FD (например, TNS и/или заполнение шума), отличается от полосы частот сигналов, обработанных другими инструментами FD, которые не находятся в подгруппе (например, 44, 46 и т. д.). Инструкции могут быть такими, чтобы управлять выбором полосы частот на основании обнаружений энергии, ассоциированных с различными полосами частот, как, например, выполняемые кодером. Инструкции могут также содержать инструкции, которые, при исполнении процессором 121, позволяют работать в качестве кодера и, в частности, позволяют управлять полосой частот подгруппы инструментов FD (например, 43, 45), которая может отличаться от полосы частот других инструментов FD. Полоса частот, выбранная для подгруппы в кодере, может быть той же самой, что и выбранная для подгруппы в декодере. Постоянный блок 122 памяти может также содержать другие данные, такие как по меньшей мере части электронных версий таблиц 1, 2 и/или 3. Устройство 120 может содержать место 128 хранения для хранения, например, битового потока, полученного из информационного сигнала (например, аудиосигнала). Устройство 120 может содержать блок 127 вывода для передачи данных, например, беспроводным образом, например, с использованием конкретного протокола, такого как Bluetooth. Устройство 120 может также содержать блок 126 ввода для получения данных, например, беспроводным образом, например, с использованием конкретного протокола, такого как Bluetooth. Например, устройство 120 может получить, путем исполнения инструкций, сохраненных в постоянном блоке 122 памяти, битовый поток, переданный декодером.
В примерах устройства 110 и 120 могут быть одним и тем же устройством. В примерах композиция различных устройств 110 и 120 формируют систему.
В зависимости от конкретных требований осуществления, примеры могут осуществляться в аппаратных средствах. Осуществление может выполняться с использованием цифрового носителя данных, например гибкого диска, универсального цифрового диска (DVD), диска Blu-Ray, компакт-диска (CD), постоянного запоминающего устройства (ROM), программируемого постоянного запоминающего устройства (PROM), стираемого и программируемого постоянного запоминающего устройства (EPROM), электрически стираемого программируемого постоянного запоминающего устройства (EEPROM) или флэш-памяти, имеющего электронно читаемые управляющие сигналы, сохраненные на нем, которые взаимодействуют (или имеют возможность взаимодействия) с программируемой компьютерной системой так, чтобы выполнялся соответствующий способ. Таким образом, цифровой носитель данных может быть машиночитаемым.
В общем случае примеры могут осуществляться в качестве компьютерного программного продукта с программными инструкциями, причем программные инструкции имеют возможность работать для выполнения одного из способов, когда компьютерный программный продукт выполняется на компьютере. Программные инструкции могут, например, сохраняться на машиночитаемом носителе.
Другие примеры содержат компьютерную программу для выполнения одного из способов, описанных здесь, сохраненную на машиночитаемом носителе. Иными словами, пример способа является, таким образом, компьютерной программой, имеющей программные инструкции для выполнения одного из способов, описанных здесь, когда компьютерная программа запущена на компьютере.
Дополнительный пример способов представляет собой, таким образом, носитель данных (или цифровой носитель данных или машиночитаемый носитель), содержащий записанную на нем компьютерную программу для выполнения одного из способов, описанных здесь. Носитель данных, цифровой носитель данных или носитель записи являются материальными и/или постоянными, а не сигналами, которые нематериальны и кратковременны.
Дополнительный пример содержит блок обработки, например компьютер, или программируемое логическое устройство, выполняющее один из способов, описанных здесь.
Дополнительный пример содержит компьютер, имеющий установленную на нем компьютерную программу для выполнения одного из способов, описанных здесь.
Дополнительный пример содержит устройство или систему, переносящую (например, электронным или оптическим образом) компьютерную программу для выполнения одного из способов, описанных здесь, к приемнику. Приемник может, например, быть компьютером, мобильным устройством, устройством памяти или подобным. Устройство или система может, например, содержать файловый сервер для переноса компьютерной программы к приемнику.
В некоторых примерах программируемое логическое устройство (например, программируемая пользователем вентильная матрица) может быть использовано, чтобы выполнять некоторые или все из функциональных возможностей способов, описанных здесь. В некоторых примерах программируемая пользователем вентильная матрица может взаимодействовать с микропроцессором для того, чтобы выполнять один из способов, описанных здесь. В общем случае способы могут выполняться любым надлежащим аппаратным устройством.
Вышеописанные примеры являются иллюстративными для принципов, рассмотренных выше. Следует понимать, что модификации и вариации компоновок и подробностей, описанных здесь, будут очевидны. Намерением, таким образом, является ограничение объемом дальнейшей патентной формулы, а не конкретными подробностями, представленными здесь в форме описания и объяснения примеров.

Claims (86)

1. Кодирующее устройство, содержащее:
множество инструментов кодера частотной области, FD, для кодирования информационного сигнала, причем информационный сигнал представляет множество кадров; и
средство (39) обнаружения и управления полосы частот кодера, выполненное с возможностью выбора полосы частот по меньшей мере для подгруппы (33, 36) из множества инструментов кодера FD, причем подгруппа (33, 36) включает в себя меньше инструментов кодера FD, чем множество инструментов кодера FD, на основании характеристик информационного сигнала таким образом, что по меньшей мере один из инструментов кодера FD из подгруппы (33, 36) имеет другую полосу частот относительно по меньшей мере одного из инструментов кодера FD, которые не находятся в подгруппе (33, 36).
2. Кодирующее устройство по п.1, в котором:
по меньшей мере один инструмент кодера FD из подгруппы является инструментом формирования временного шума, TNS, (33) и/или инструментом средства оценки уровня шума (36).
3. Кодирующее устройство по п.1, в котором:
по меньшей мере один инструмент кодера FD, который не находится в подгруппе (33, 36), выбран из по меньшей мере одного спектрального средства формирования на основе линейного кодирования с предсказанием, LPC, инструмента формирования спектрального шума, SNS, спектрального квантизатора и остаточного кодера.
4. Кодирующее устройство по п.1, в котором:
средство (39) обнаружения и управления полосы частот кодера выполнено с возможностью выбора полосы частот по меньшей мере одного инструмента кодера FD из подгруппы (33, 36) между по меньшей мере первой полосой частот, общей для по меньшей мере одного из инструментов кодера FD, которые не находятся в подгруппе, и второй полосой частот, отличной от полосы частот по меньшей мере одного из инструментов кодера FD, которые не находятся в подгруппе.
5. Кодирующее устройство по п.1, в котором:
средство (39) обнаружения и управления полосы частот кодера выполнено с возможностью выбора полосы частот по меньшей мере одного из множества инструментов кодера FD на основании по меньшей мере одной оценки энергии для информационного сигнала.
6. Кодирующее устройство по п.1, в котором:
средство (39) обнаружения и управления полосы частот кодера выполнено с возможностью сравнения по меньшей мере одной оценки энергии, ассоциированной с полосой частот информационного сигнала, с соответствующей пороговой величиной для управления полосой частот для по меньшей мере одного из множества инструментов кодера FD.
7. Кодирующее устройство по п.1, в котором:
по меньшей мере один из множества инструментов кодера FD из подгруппы (33, 36) содержит TNS, выполненное с возможностью автокорреляции входного сигнала TNS внутри полосы частот, выбранной средством (39) обнаружения и управления полосы частот кодера.
8. Кодирующее устройство по п.1, в котором по меньшей мере один из инструментов кодера FD, которые не находятся в подгруппе, выполнен с возможностью работы на полной полосе частот.
9. Кодирующее устройство по п.1, в котором средство (39) обнаружения и управления полосы частот кодера выполнено с возможностью выбора по меньшей мере одной полосы частот, которая находится внутри полной полосы частот, в которой по меньшей мере один из инструментов кодера FD, которые не находятся в подгруппе, выполнен с возможностью работы.
10. Кодирующее устройство по п.1, в котором по меньшей мере один из остальных инструментов кодера FD из множества инструментов кодера FD выполнен с возможностью работы в открытой цепи относительно полосы частот, выбранной средством (39) обнаружения и управления полосы частот кодера.
11. Кодирующее устройство по п.1, в котором:
средство (39) обнаружения и управления полосы частот кодера выполнено с возможностью выбора полосы частот из конечного количества полос частот и/или из набора заданных полос частот.
12. Кодирующее устройство по п.1, в котором:
средство (39) обнаружения и управления полосы частот кодера выполнено с возможностью выполнения выбора из по меньшей мере одной или из сочетания следующих полос частот: 4 кГц, 8 кГц, 12 кГц, 16 кГц и 24 кГц и/или NB, WB, SSWB, SWB, FB.
13. Кодирующее устройство по п.1, в котором:
средство (39) обнаружения и управления полосы частот кодера выполнено с возможностью управления сигнализацией полосы частот в декодер.
14. Кодирующее устройство по любому из предыдущих пунктов, дополнительно выполненное с возможностью:
кодирования поля управляющих данных, включающего в себя информацию, касающуюся выбранной полосы частот.
15. Кодирующее устройство по п.1, дополнительно выполненное с возможностью:
кодирования поля управляющих данных, включающего в себя:
- 0 бит данных, соответствующих полосе частот NB;
- 1 бит данных, соответствующий полосе частот NB, WB;
- 2 бита данных, соответствующих полосе частот NB, WB, SSWB;
- 2 бита данных, соответствующих полосе частот NB, WB, SSWB, SWB;
- 3 бита данных, соответствующих полосе частот NB, WB, SSWB, SWB, FB.
16. Кодирующее устройство по п.5, в котором по меньшей мере одна оценка энергии выполняется следующим образом:
Figure 00000105
где X(k) - коэффициенты MDCT, или MDST, или FD, N B - количество полос, и
Figure 00000106
- индексы, ассоциированные с полосой.
17. Кодирующее устройство по п.1, дополнительно содержащее инструмент (33) TNS, выполненный с возможностью выполнения операции фильтрации, включающей в себя вычисление операции фильтрации:
для каждого k=0..8
Figure 00000107
где
Figure 00000108
и
Figure 00000109
где X(k) - коэффициенты MDCT, или MDST, или FD, sub_start(f, s) и sub_stop(f, s) ассоциированы с конкретной полосой частот, обнаруженной средством (39) обнаружения и управления полосы частот кодера.
18. Кодирующее устройство по п.1, дополнительно содержащее средство (36) оценки шума, выполненное с возможностью оценки уровня шума с использованием
Figure 00000110
где gg указывает на глобальное усиление, INF(k) - на идентификацию спектральных линий, на которых уровень шума должен оцениваться, и Xf(k) - сигнал.
19. Декодирующее устройство (40, 40a), содержащее множество инструментов (43-48a) декодера FD для декодирования информационного сигнала, кодированного в битовом потоке, причем
инструменты декодера FD разделены:
- на подгруппу, содержащую по меньшей мере один инструмент (43, 45) декодера FD;
- на остальные инструменты декодера FD, содержащие по меньшей мере один инструмент (44, 46, 48a) декодера FD;
причем декодирующее устройство (40, 40a) выполнено таким образом, что по меньшей мере один из множества инструментов декодера из подгруппы (43, 45) выполняет обработку сигналов для другой полосы частот относительно по меньшей мере одного из остальных инструментов декодера FD из множества инструментов (44, 46, 48a) декодера.
20. Декодирующее устройство по п.19, дополнительно содержащее средство (49) управления полосы частот, выполненное с возможностью:
выбора полосы частот на основании информации полосы частот.
21. Декодирующее устройство по п.19, в котором:
подгруппа содержит по меньшей мере одно из инструмента (43) заполнения шума декодера и/или декодера (45) формы временного шума, TNS.
22. Декодирующее устройство по п.19, в котором:
по меньшей мере один из остальных инструментов декодера FD является по меньшей мере одним из инструмента линейного кодирования с предсказанием, LPC, декодера, инструмента формирования спектрального шума, SNS, инструмента глобального усиления декодера, инструмента формирования MDCT или MDST или другого инструмента формирования на основе другого преобразования.
23. Декодирующее устройство по п.19, дополнительно выполненное с возможностью:
управления полосой частот по меньшей мере одного из множества инструментов декодера в подгруппе между:
по меньшей мере первой полосой частот, общей для по меньшей мере одного из остальных инструментов декодера FD; и
по меньшей мере второй полосой частот, отличной от первой полосы частот.
24. Декодирующее устройство по п.19, в котором по меньшей мере один из остальных инструментов декодера FD выполнен с возможностью работы на полной полосе частот.
25. Декодирующее устройство по п.19, в котором по меньшей мере один из остальных инструментов декодера FD выполнен с возможностью работы в открытой цепи относительно выбранной полосы частот.
26. Декодирующее устройство по п.19, дополнительно выполненное с возможностью:
выбора полосы частот из конечного количества полос частот и/или из набора заданных полос частот.
27. Декодирующее устройство по п.19, дополнительно выполненное с возможностью:
выполнения выбора из по меньшей мере одной или комбинации из: 8 кГц, 16 кГц, 24 кГц, 32 кГц и 48 кГц и/или NB, WB, SSWB, SWB, FB.
28. Декодирующее устройство по п.19, дополнительно содержащее инструмент (43) заполнения шума, выполненный с возможностью применения уровня шума с использованием индексов, обеспеченных формулой
Figure 00000111
где bw stop получается на основании информации полосы частот в битовом потоке.
29. Декодирующее устройство по п.19, дополнительно содержащее декодер (45) TNS, выполненный с возможностью выполнения:
Figure 00000112
где
Figure 00000113
- выходные данные декодера TNS, и
Figure 00000114
- входные данные декодера TNS, num_tns_filters, start_freq, stop_freq получаются на основании информации (39a) полосы частот в битовом потоке,
Figure 00000115
и
Figure 00000116
где
Figure 00000117
, где
Figure 00000118
- функция округления до ближайшего целого, и где
Figure 00000119
- окончательные оцененные коэффициенты отражения для фильтра TNS f.
30. Система, содержащая кодирующее устройство и декодирующее устройство, причем кодирующее устройство соответствует п.1 и/или декодирующее устройство соответствует п.19.
31. Способ кодирования информационного сигнала согласно по меньшей мере множеству операций в частотной области, FD, причем способ содержит этапы, на которых:
выбирают полосу частот для подгруппы операций FD;
выполняют первые операции обработки сигналов в полосе частот для подгруппы операций FD;
выполняют вторые операции обработки сигналов в другой полосе частот для операций FD, которые не находятся в подгруппе.
32. Способ декодирования битового потока с информационным сигналом и управляющими данными (39a), причем способ содержит множество операций обработки сигналов в частотной области, FD, причем способ содержит этапы, на которых:
выбирают вариант полосы частот для подгруппы операций FD на основании управляющих данных (39a);
выполняют первые операции обработки сигналов в полосе частот для подгруппы операций FD;
выполняют вторые операции обработки сигналов в другой полосе частот для операций FD, которые не находятся в подгруппе.
RU2020118947A 2017-11-10 2018-11-06 Управление полосой частот в кодерах и/или декодерах RU2752520C1 (ru)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP17201082.9A EP3483882A1 (en) 2017-11-10 2017-11-10 Controlling bandwidth in encoders and/or decoders
EP17201082.9 2017-11-10
PCT/EP2018/080335 WO2019091977A1 (en) 2017-11-10 2018-11-06 Controlling bandwidth in encoders and/or decoders

Publications (1)

Publication Number Publication Date
RU2752520C1 true RU2752520C1 (ru) 2021-07-28

Family

ID=60301903

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2020118947A RU2752520C1 (ru) 2017-11-10 2018-11-06 Управление полосой частот в кодерах и/или декодерах

Country Status (18)

Country Link
US (1) US11462226B2 (ru)
EP (2) EP3483882A1 (ru)
JP (1) JP7003253B2 (ru)
KR (1) KR102426033B1 (ru)
CN (1) CN111344784B (ru)
AR (1) AR113479A1 (ru)
AU (1) AU2018363698B2 (ru)
BR (1) BR112020009034A2 (ru)
CA (1) CA3080907C (ru)
ES (1) ES2898281T3 (ru)
MX (1) MX2020004779A (ru)
PL (1) PL3707713T3 (ru)
PT (1) PT3707713T (ru)
RU (1) RU2752520C1 (ru)
SG (1) SG11202004171WA (ru)
TW (1) TWI691954B (ru)
WO (1) WO2019091977A1 (ru)
ZA (1) ZA202002082B (ru)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112530444B (zh) * 2019-09-18 2023-10-03 华为技术有限公司 音频编码方法和装置
CN113643713B (zh) * 2021-10-13 2021-12-24 北京百瑞互联技术有限公司 一种蓝牙音频编码方法、装置及存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101140759B (zh) * 2006-09-08 2010-05-12 华为技术有限公司 语音或音频信号的带宽扩展方法及系统
US8473301B2 (en) * 2007-11-02 2013-06-25 Huawei Technologies Co., Ltd. Method and apparatus for audio decoding
US8554549B2 (en) * 2007-03-02 2013-10-08 Panasonic Corporation Encoding device and method including encoding of error transform coefficients
WO2016142337A1 (en) * 2015-03-09 2016-09-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal
US20170103769A1 (en) * 2014-03-21 2017-04-13 Nokia Technologies Oy Methods, apparatuses for forming audio signal payload and audio signal payload
US20170221495A1 (en) * 2011-04-21 2017-08-03 Samsung Electronics Co., Ltd. Apparatus for quantizing linear predictive coding coefficients, sound encoding apparatus, apparatus for de-quantizing linear predictive coding coefficients, sound decoding apparatus, and electronic device therefore
RU2016105619A (ru) * 2013-07-22 2017-08-23 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Устройство и способ для декодирования или кодирования звукового сигнала с использованием значений информации энергии для полосы частот восстановления

Family Cites Families (176)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3639753A1 (de) 1986-11-21 1988-06-01 Inst Rundfunktechnik Gmbh Verfahren zum uebertragen digitalisierter tonsignale
US5012517A (en) 1989-04-18 1991-04-30 Pacific Communication Science, Inc. Adaptive transform coder having long term predictor
US5233660A (en) 1991-09-10 1993-08-03 At&T Bell Laboratories Method and apparatus for low-delay celp speech coding and decoding
JPH05281996A (ja) 1992-03-31 1993-10-29 Sony Corp ピッチ抽出装置
IT1270438B (it) 1993-06-10 1997-05-05 Sip Procedimento e dispositivo per la determinazione del periodo del tono fondamentale e la classificazione del segnale vocale in codificatori numerici della voce
US5581653A (en) 1993-08-31 1996-12-03 Dolby Laboratories Licensing Corporation Low bit-rate high-resolution spectral envelope coding for audio encoder and decoder
JP3402748B2 (ja) 1994-05-23 2003-05-06 三洋電機株式会社 音声信号のピッチ周期抽出装置
JPH0811644A (ja) 1994-06-27 1996-01-16 Nissan Motor Co Ltd ルーフモール取付構造
US6167093A (en) 1994-08-16 2000-12-26 Sony Corporation Method and apparatus for encoding the information, method and apparatus for decoding the information and method for information transmission
EP0732687B2 (en) 1995-03-13 2005-10-12 Matsushita Electric Industrial Co., Ltd. Apparatus for expanding speech bandwidth
US5781888A (en) 1996-01-16 1998-07-14 Lucent Technologies Inc. Perceptual noise shaping in the time domain via LPC prediction in the frequency domain
WO1997027578A1 (en) 1996-01-26 1997-07-31 Motorola Inc. Very low bit rate time domain speech analyzer for voice messaging
US5812971A (en) 1996-03-22 1998-09-22 Lucent Technologies Inc. Enhanced joint stereo coding method using temporal envelope shaping
JPH1091194A (ja) 1996-09-18 1998-04-10 Sony Corp 音声復号化方法及び装置
US6570991B1 (en) 1996-12-18 2003-05-27 Interval Research Corporation Multi-feature speech/music discrimination system
KR100261253B1 (ko) 1997-04-02 2000-07-01 윤종용 비트율 조절이 가능한 오디오 부호화/복호화 방법및 장치
GB2326572A (en) 1997-06-19 1998-12-23 Softsound Limited Low bit rate audio coder and decoder
WO1999016050A1 (en) 1997-09-23 1999-04-01 Voxware, Inc. Scalable and embedded codec for speech and audio signals
JP3344962B2 (ja) 1998-03-11 2002-11-18 松下電器産業株式会社 オーディオ信号符号化装置、及びオーディオ信号復号化装置
US6507814B1 (en) 1998-08-24 2003-01-14 Conexant Systems, Inc. Pitch determination using speech classification and prior pitch estimation
US7272556B1 (en) 1998-09-23 2007-09-18 Lucent Technologies Inc. Scalable and embedded codec for speech and audio signals
US7302396B1 (en) 1999-04-27 2007-11-27 Realnetworks, Inc. System and method for cross-fading between audio streams
US7099830B1 (en) 2000-03-29 2006-08-29 At&T Corp. Effective deployment of temporal noise shaping (TNS) filters
US6735561B1 (en) 2000-03-29 2004-05-11 At&T Corp. Effective deployment of temporal noise shaping (TNS) filters
EP1139665A1 (en) 2000-03-29 2001-10-04 Deutsche Thomson-Brandt Gmbh Method and apparatus for changing the output delay of audio or video data encoding
US6665638B1 (en) 2000-04-17 2003-12-16 At&T Corp. Adaptive short-term post-filters for speech coders
US7395209B1 (en) 2000-05-12 2008-07-01 Cirrus Logic, Inc. Fixed point audio decoding system and method
US20040158462A1 (en) 2001-06-11 2004-08-12 Rutledge Glen J. Pitch candidate selection method for multi-channel pitch detectors
US7512535B2 (en) 2001-10-03 2009-03-31 Broadcom Corporation Adaptive postfiltering methods and systems for decoding speech
US6785645B2 (en) 2001-11-29 2004-08-31 Microsoft Corporation Real-time speech and music classifier
US20030187663A1 (en) * 2002-03-28 2003-10-02 Truman Michael Mead Broadband frequency translation for high frequency regeneration
US7447631B2 (en) 2002-06-17 2008-11-04 Dolby Laboratories Licensing Corporation Audio coding system using spectral hole filling
US7502743B2 (en) 2002-09-04 2009-03-10 Microsoft Corporation Multi-channel audio encoding and decoding with multi-channel transform selection
US7433824B2 (en) 2002-09-04 2008-10-07 Microsoft Corporation Entropy coding by adapting coding between level and run-length/level modes
JP4287637B2 (ja) 2002-10-17 2009-07-01 パナソニック株式会社 音声符号化装置、音声符号化方法及びプログラム
WO2004072956A1 (en) 2003-02-11 2004-08-26 Koninklijke Philips Electronics N.V. Audio coding
KR20030031936A (ko) 2003-02-13 2003-04-23 배명진 피치변경법을 이용한 단일 음성 다중 목소리 합성기
US20040162866A1 (en) 2003-02-19 2004-08-19 Malvar Henrique S. System and method for producing fast modulated complex lapped transforms
KR101063562B1 (ko) 2003-06-17 2011-09-07 파나소닉 주식회사 수신 장치, 전송 장치 및 송신 시스템
WO2005001814A1 (en) 2003-06-30 2005-01-06 Koninklijke Philips Electronics N.V. Improving quality of decoded audio by adding noise
US7620545B2 (en) 2003-07-08 2009-11-17 Industrial Technology Research Institute Scale factor based bit shifting in fine granularity scalability audio coding
KR100550003B1 (ko) 2003-07-11 2006-02-08 학교법인연세대학교 상호부호화기에서 개회로 피치 추정 방법 및 그 장치
AU2003302486A1 (en) 2003-09-15 2005-04-06 Zakrytoe Aktsionernoe Obschestvo Intel Method and apparatus for encoding audio
US7009533B1 (en) 2004-02-13 2006-03-07 Samplify Systems Llc Adaptive compression and decompression of bandlimited signals
KR20050087956A (ko) 2004-02-27 2005-09-01 삼성전자주식회사 무손실 오디오 부호화/복호화 방법 및 장치
DE102004009954B4 (de) 2004-03-01 2005-12-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Verarbeiten eines Multikanalsignals
JP4867914B2 (ja) 2004-03-01 2012-02-01 ドルビー ラボラトリーズ ライセンシング コーポレイション マルチチャンネルオーディオコーディング
DE102004009949B4 (de) 2004-03-01 2006-03-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Ermitteln eines Schätzwertes
ATE523876T1 (de) 2004-03-05 2011-09-15 Panasonic Corp Fehlerverbergungseinrichtung und fehlerverbergungsverfahren
US7272567B2 (en) 2004-03-25 2007-09-18 Zoran Fejzo Scalable lossless audio codec and authoring tool
WO2006107833A1 (en) 2005-04-01 2006-10-12 Qualcomm Incorporated Method and apparatus for vector quantizing of a spectral envelope representation
US7546240B2 (en) 2005-07-15 2009-06-09 Microsoft Corporation Coding with improved time resolution for selected segments via adaptive block transformation of a group of samples from a subband decomposition
US7539612B2 (en) 2005-07-15 2009-05-26 Microsoft Corporation Coding and decoding scale factor information
KR20070037945A (ko) 2005-10-04 2007-04-09 삼성전자주식회사 오디오 신호의 부호화/복호화 방법 및 장치
US20070118361A1 (en) 2005-10-07 2007-05-24 Deepen Sinha Window apparatus and method
KR100888474B1 (ko) 2005-11-21 2009-03-12 삼성전자주식회사 멀티채널 오디오 신호의 부호화/복호화 장치 및 방법
US7805297B2 (en) 2005-11-23 2010-09-28 Broadcom Corporation Classification-based frame loss concealment for audio signals
WO2007070007A1 (en) 2005-12-14 2007-06-21 Matsushita Electric Industrial Co., Ltd. A method and system for extracting audio features from an encoded bitstream for audio classification
US8255207B2 (en) 2005-12-28 2012-08-28 Voiceage Corporation Method and device for efficient frame erasure concealment in speech codecs
US8345890B2 (en) 2006-01-05 2013-01-01 Audience, Inc. System and method for utilizing inter-microphone level differences for speech enhancement
WO2007102782A2 (en) 2006-03-07 2007-09-13 Telefonaktiebolaget Lm Ericsson (Publ) Methods and arrangements for audio coding and decoding
US8150065B2 (en) 2006-05-25 2012-04-03 Audience, Inc. System and method for processing an audio signal
EP2030199B1 (en) 2006-05-30 2009-10-28 Koninklijke Philips Electronics N.V. Linear predictive coding of an audio signal
CN1983909B (zh) 2006-06-08 2010-07-28 华为技术有限公司 一种丢帧隐藏装置和方法
US8015000B2 (en) 2006-08-03 2011-09-06 Broadcom Corporation Classification-based frame loss concealment for audio signals
US8706507B2 (en) 2006-08-15 2014-04-22 Dolby Laboratories Licensing Corporation Arbitrary shaping of temporal noise envelope without side-information utilizing unchanged quantization
FR2905510B1 (fr) 2006-09-01 2009-04-10 Voxler Soc Par Actions Simplif Procede d'analyse en temps reel de la voix pour le controle en temps reel d'un organe numerique et dispositif associe
US7752038B2 (en) 2006-10-13 2010-07-06 Nokia Corporation Pitch lag estimation
DE102006049154B4 (de) 2006-10-18 2009-07-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Kodierung eines Informationssignals
KR101292771B1 (ko) 2006-11-24 2013-08-16 삼성전자주식회사 오디오 신호의 오류은폐방법 및 장치
US20100010810A1 (en) 2006-12-13 2010-01-14 Panasonic Corporation Post filter and filtering method
FR2912249A1 (fr) 2007-02-02 2008-08-08 France Telecom Codage/decodage perfectionnes de signaux audionumeriques.
CN101308658B (zh) * 2007-05-14 2011-04-27 深圳艾科创新微电子有限公司 一种基于片上系统的音频解码器及其解码方法
EP2015293A1 (en) 2007-06-14 2009-01-14 Deutsche Thomson OHG Method and apparatus for encoding and decoding an audio signal using adaptively switched temporal resolution in the spectral domain
WO2008151408A1 (en) 2007-06-14 2008-12-18 Voiceage Corporation Device and method for frame erasure concealment in a pcm codec interoperable with the itu-t recommendation g.711
JP4928366B2 (ja) 2007-06-25 2012-05-09 日本電信電話株式会社 ピッチ探索装置、パケット消失補償装置、それらの方法、プログラム及びその記録媒体
JP4572218B2 (ja) 2007-06-27 2010-11-04 日本電信電話株式会社 音楽区間検出方法、音楽区間検出装置、音楽区間検出プログラム及び記録媒体
US10795949B2 (en) 2007-07-26 2020-10-06 Hamid Hatami-Hanza Methods and systems for investigation of compositions of ontological subjects and intelligent systems therefrom
JP4981174B2 (ja) 2007-08-24 2012-07-18 フランス・テレコム 確率テーブルの動的な計算によるシンボルプレーン符号化/復号化
ATE535904T1 (de) 2007-08-27 2011-12-15 Ericsson Telefon Ab L M Verbesserte transformationskodierung von sprach- und audiosignalen
CN100524462C (zh) 2007-09-15 2009-08-05 华为技术有限公司 对高带信号进行帧错误隐藏的方法及装置
WO2009066869A1 (en) 2007-11-21 2009-05-28 Electronics And Telecommunications Research Institute Frequency band determining method for quantization noise shaping and transient noise shaping method using the same
US9659568B2 (en) 2007-12-31 2017-05-23 Lg Electronics Inc. Method and an apparatus for processing an audio signal
US8386271B2 (en) 2008-03-25 2013-02-26 Microsoft Corporation Lossless and near lossless scalable audio codec
WO2009150290A1 (en) 2008-06-13 2009-12-17 Nokia Corporation Method and apparatus for error concealment of encoded audio data
EP2144231A1 (en) 2008-07-11 2010-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Low bitrate audio encoding/decoding scheme with common preprocessing
CA2871268C (en) 2008-07-11 2015-11-03 Nikolaus Rettelbach Audio encoder, audio decoder, methods for encoding and decoding an audio signal, audio stream and computer program
EP2144230A1 (en) 2008-07-11 2010-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Low bitrate audio encoding/decoding scheme having cascaded switches
CN102105930B (zh) 2008-07-11 2012-10-03 弗朗霍夫应用科学研究促进协会 用于编码采样音频信号的帧的音频编码器和解码器
US8577673B2 (en) 2008-09-15 2013-11-05 Huawei Technologies Co., Ltd. CELP post-processing for music signals
TWI520128B (zh) 2008-10-08 2016-02-01 弗勞恩霍夫爾協會 多解析度切換音訊編碼/解碼方案(一)
GB2466673B (en) 2009-01-06 2012-11-07 Skype Quantization
CN102334160B (zh) 2009-01-28 2014-05-07 弗劳恩霍夫应用研究促进协会 音频编码器,音频解码器,编码和解码音频信号的方法
JP4945586B2 (ja) 2009-02-02 2012-06-06 株式会社東芝 信号帯域拡張装置
US20100223061A1 (en) 2009-02-27 2010-09-02 Nokia Corporation Method and Apparatus for Audio Coding
JP4932917B2 (ja) 2009-04-03 2012-05-16 株式会社エヌ・ティ・ティ・ドコモ 音声復号装置、音声復号方法、及び音声復号プログラム
FR2944664A1 (fr) 2009-04-21 2010-10-22 Thomson Licensing Dispositif et procede de traitement d'images
US8352252B2 (en) 2009-06-04 2013-01-08 Qualcomm Incorporated Systems and methods for preventing the loss of information within a speech frame
US8428938B2 (en) 2009-06-04 2013-04-23 Qualcomm Incorporated Systems and methods for reconstructing an erased speech frame
KR20100136890A (ko) 2009-06-19 2010-12-29 삼성전자주식회사 컨텍스트 기반의 산술 부호화 장치 및 방법과 산술 복호화 장치 및 방법
CN101958119B (zh) 2009-07-16 2012-02-29 中兴通讯股份有限公司 一种改进的离散余弦变换域音频丢帧补偿器和补偿方法
RU2591661C2 (ru) * 2009-10-08 2016-07-20 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. Многорежимный декодировщик аудио сигнала, многорежимный кодировщик аудио сигналов, способы и компьютерные программы с использованием кодирования с линейным предсказанием на основе ограничения шума
EP3693963B1 (en) 2009-10-15 2021-07-21 VoiceAge Corporation Simultaneous time-domain and frequency-domain noise shaping for tdac transforms
WO2011048099A1 (en) 2009-10-20 2011-04-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder, method for encoding an audio information, method for decoding an audio information and computer program using a region-dependent arithmetic coding mapping rule
KR101414305B1 (ko) 2009-10-20 2014-07-02 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 저 지연 애플리케이션들에서 사용하기 위한 오디오 신호 인코더, 오디오 신호 디코더, 오디오 콘텐츠의 인코딩된 표현을 제공하는 방법, 오디오 콘텐츠의 디코딩된 표현을 제공하는 방법 및 컴퓨터 프로그램
US8207875B2 (en) 2009-10-28 2012-06-26 Motorola Mobility, Inc. Encoder that optimizes bit allocation for information sub-parts
US7978101B2 (en) 2009-10-28 2011-07-12 Motorola Mobility, Inc. Encoder and decoder using arithmetic stage to compress code space that is not fully utilized
KR101761629B1 (ko) 2009-11-24 2017-07-26 엘지전자 주식회사 오디오 신호 처리 방법 및 장치
KR101336051B1 (ko) 2010-01-12 2013-12-04 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 오디오 인코더, 오디오 디코더, 오디오 정보 인코딩 방법, 오디오 정보 디코딩 방법, 및 수치적 이전 콘텍스트 값의 수치 표현의 수정을 이용하는 컴퓨터 프로그램
US20110196673A1 (en) 2010-02-11 2011-08-11 Qualcomm Incorporated Concealing lost packets in a sub-band coding decoder
EP2375409A1 (en) 2010-04-09 2011-10-12 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder and related methods for processing multi-channel audio signals using complex prediction
FR2961980A1 (fr) 2010-06-24 2011-12-30 France Telecom Controle d'une boucle de retroaction de mise en forme de bruit dans un codeur de signal audionumerique
PL3079152T3 (pl) 2010-07-02 2018-10-31 Dolby International Ab Dekodowanie audio z selektywnym późniejszym filtrowaniem
EP4131258A1 (en) 2010-07-20 2023-02-08 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder, audio decoding method, audio encoder, audio encoding method and computer program
US9082416B2 (en) 2010-09-16 2015-07-14 Qualcomm Incorporated Estimating a pitch lag
US8738385B2 (en) 2010-10-20 2014-05-27 Broadcom Corporation Pitch-based pre-filtering and post-filtering for compression of audio signals
TWI488177B (zh) 2011-02-14 2015-06-11 Fraunhofer Ges Forschung 使用頻譜域雜訊整形之基於線性預測的編碼方案
US9270807B2 (en) 2011-02-23 2016-02-23 Digimarc Corporation Audio localization using audio signal encoding and recognition
CN107516532B (zh) 2011-03-18 2020-11-06 弗劳恩霍夫应用研究促进协会 音频内容的编码和解码方法以及介质
WO2012152764A1 (en) 2011-05-09 2012-11-15 Dolby International Ab Method and encoder for processing a digital stereo audio signal
FR2977439A1 (fr) 2011-06-28 2013-01-04 France Telecom Fenetres de ponderation en codage/decodage par transformee avec recouvrement, optimisees en retard.
US9363339B2 (en) 2011-07-12 2016-06-07 Hughes Network Systems, Llc Staged data compression, including block level long range compression, for data streams in a communications system
FR2977969A1 (fr) 2011-07-12 2013-01-18 France Telecom Adaptation de fenetres de ponderation d'analyse ou de synthese pour un codage ou decodage par transformee
BR112013026452B1 (pt) 2012-01-20 2021-02-17 Fraunhofer-Gellschaft Zur Förderung Der Angewandten Forschung E.V. aparelho e método para codificação e decodificação de áudio empregando substituição sinusoidal
ES2571742T3 (es) 2012-04-05 2016-05-26 Huawei Tech Co Ltd Método de determinación de un parámetro de codificación para una señal de audio multicanal y un codificador de audio multicanal
US20130282373A1 (en) 2012-04-23 2013-10-24 Qualcomm Incorporated Systems and methods for audio signal processing
US9026451B1 (en) 2012-05-09 2015-05-05 Google Inc. Pitch post-filter
EP2874149B1 (en) 2012-06-08 2023-08-23 Samsung Electronics Co., Ltd. Method and apparatus for concealing frame error and method and apparatus for audio decoding
GB201210373D0 (en) 2012-06-12 2012-07-25 Meridian Audio Ltd Doubly compatible lossless audio sandwidth extension
FR2992766A1 (fr) 2012-06-29 2014-01-03 France Telecom Attenuation efficace de pre-echos dans un signal audionumerique
CN106941004B (zh) 2012-07-13 2021-05-18 华为技术有限公司 音频信号的比特分配的方法和装置
CN102779526B (zh) 2012-08-07 2014-04-16 无锡成电科大科技发展有限公司 语音信号中基音提取及修正方法
US9406307B2 (en) 2012-08-19 2016-08-02 The Regents Of The University Of California Method and apparatus for polyphonic audio signal prediction in coding and networking systems
US9293146B2 (en) 2012-09-04 2016-03-22 Apple Inc. Intensity stereo coding in advanced audio coding
KR102063900B1 (ko) 2012-09-24 2020-01-08 삼성전자주식회사 프레임 에러 은닉방법 및 장치와 오디오 복호화방법 및 장치
CN103714821A (zh) 2012-09-28 2014-04-09 杜比实验室特许公司 基于位置的混合域数据包丢失隐藏
US9401153B2 (en) 2012-10-15 2016-07-26 Digimarc Corporation Multi-mode audio recognition and auxiliary data encoding and decoding
US9318116B2 (en) 2012-12-14 2016-04-19 Disney Enterprises, Inc. Acoustic data transmission based on groups of audio receivers
EP2757558A1 (en) 2013-01-18 2014-07-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Time domain level adjustment for audio signal decoding or encoding
FR3001593A1 (fr) 2013-01-31 2014-08-01 France Telecom Correction perfectionnee de perte de trame au decodage d'un signal.
BR112015018316B1 (pt) 2013-02-05 2022-03-08 Telefonaktiebolaget Lm Ericsson (Publ) Método para controlar um método de ocultação para um quadro de áudio perdido de um sinal de áudio recebido, aparelho, e, meio de armazenamento legível por computador.
TWI530941B (zh) 2013-04-03 2016-04-21 杜比實驗室特許公司 用於基於物件音頻之互動成像的方法與系統
PT3011555T (pt) 2013-06-21 2018-07-04 Fraunhofer Ges Forschung Reconstrução de uma estrutura de discurso
EP2830055A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Context-based entropy coding of sample values of a spectral envelope
KR101831289B1 (ko) 2013-10-18 2018-02-22 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에.베. 오디오 신호의 스펙트럼의 스펙트럼 계수들의 코딩
US9906858B2 (en) 2013-10-22 2018-02-27 Bongiovi Acoustics Llc System and method for digital signal processing
WO2015063227A1 (en) * 2013-10-31 2015-05-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio bandwidth extension by insertion of temporal pre-shaped noise in frequency domain
CA2984017C (en) 2013-10-31 2019-12-31 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Audio decoder and method for providing a decoded audio information using an error concealment modifying a time domain excitation signal
PL3285254T3 (pl) 2013-10-31 2019-09-30 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Dekoder audio i sposób dostarczania zdekodowanej informacji audio z wykorzystaniem ukrywania błędów na bazie sygnału wzbudzenia w dziedzinie czasu
ES2716652T3 (es) 2013-11-13 2019-06-13 Fraunhofer Ges Forschung Codificador para la codificación de una señal de audio, sistema de transmisión de audio y procedimiento para la determinación de valores de corrección
KR102222838B1 (ko) 2014-04-17 2021-03-04 보이세지 코포레이션 다른 샘플링 레이트들을 가진 프레임들간의 전환시 사운드 신호의 선형 예측 인코딩 및 디코딩을 위한 방법, 인코더 및 디코더
US9396733B2 (en) 2014-05-06 2016-07-19 University Of Macau Reversible audio data hiding
NO2780522T3 (ru) 2014-05-15 2018-06-09
EP2963648A1 (en) 2014-07-01 2016-01-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio processor and method for processing an audio signal using vertical phase correction
US9685166B2 (en) 2014-07-26 2017-06-20 Huawei Technologies Co., Ltd. Classification between time-domain coding and frequency domain coding
EP2980799A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for processing an audio signal using a harmonic post-filter
EP2980798A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Harmonicity-dependent controlling of a harmonic filter tool
EP2980796A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method and apparatus for processing an audio signal, audio decoder, and audio encoder
RU2632151C2 (ru) 2014-07-28 2017-10-02 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Устройство и способ выбора одного из первого алгоритма кодирования и второго алгоритма кодирования с использованием уменьшения гармоник
CN107112022B (zh) * 2014-07-28 2020-11-10 三星电子株式会社 用于时域数据包丢失隐藏的方法
EP2988300A1 (en) 2014-08-18 2016-02-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Switching of sampling rates at audio processing devices
WO2016142002A1 (en) 2015-03-09 2016-09-15 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal
US10296959B1 (en) 2015-03-30 2019-05-21 Audible, Inc. Automated recommendations of audio narrations
US9886963B2 (en) * 2015-04-05 2018-02-06 Qualcomm Incorporated Encoder selection
US10049684B2 (en) * 2015-04-05 2018-08-14 Qualcomm Incorporated Audio bandwidth selection
JP6422813B2 (ja) 2015-04-13 2018-11-14 日本電信電話株式会社 符号化装置、復号装置、これらの方法及びプログラム
US9978400B2 (en) 2015-06-11 2018-05-22 Zte Corporation Method and apparatus for frame loss concealment in transform domain
US10847170B2 (en) 2015-06-18 2020-11-24 Qualcomm Incorporated Device and method for generating a high-band signal from non-linearly processed sub-ranges
US9837089B2 (en) 2015-06-18 2017-12-05 Qualcomm Incorporated High-band signal generation
KR20170000933A (ko) 2015-06-25 2017-01-04 한국전기연구원 시간 지연 추정을 이용한 풍력 터빈의 피치 제어 시스템
US9830921B2 (en) 2015-08-17 2017-11-28 Qualcomm Incorporated High-band target signal control
US10803877B2 (en) * 2015-09-04 2020-10-13 Samsung Electronics Co., Ltd. Signal processing methods and apparatuses for enhancing sound quality
US9978381B2 (en) 2016-02-12 2018-05-22 Qualcomm Incorporated Encoding of multiple audio signals
US10219147B2 (en) * 2016-04-07 2019-02-26 Mediatek Inc. Enhanced codec control
US10283143B2 (en) 2016-04-08 2019-05-07 Friday Harbor Llc Estimating pitch of harmonic signals
CN107945809B (zh) 2017-05-02 2021-11-09 大连民族大学 一种复调音乐多音高估计方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101140759B (zh) * 2006-09-08 2010-05-12 华为技术有限公司 语音或音频信号的带宽扩展方法及系统
US8554549B2 (en) * 2007-03-02 2013-10-08 Panasonic Corporation Encoding device and method including encoding of error transform coefficients
US8473301B2 (en) * 2007-11-02 2013-06-25 Huawei Technologies Co., Ltd. Method and apparatus for audio decoding
US20170221495A1 (en) * 2011-04-21 2017-08-03 Samsung Electronics Co., Ltd. Apparatus for quantizing linear predictive coding coefficients, sound encoding apparatus, apparatus for de-quantizing linear predictive coding coefficients, sound decoding apparatus, and electronic device therefore
RU2016105619A (ru) * 2013-07-22 2017-08-23 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Устройство и способ для декодирования или кодирования звукового сигнала с использованием значений информации энергии для полосы частот восстановления
US20170103769A1 (en) * 2014-03-21 2017-04-13 Nokia Technologies Oy Methods, apparatuses for forming audio signal payload and audio signal payload
WO2016142337A1 (en) * 2015-03-09 2016-09-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal

Also Published As

Publication number Publication date
BR112020009034A2 (pt) 2020-10-27
AR113479A1 (es) 2020-05-06
CN111344784B (zh) 2023-08-08
AU2018363698B2 (en) 2020-12-17
US11462226B2 (en) 2022-10-04
KR102426033B1 (ko) 2022-07-27
CN111344784A (zh) 2020-06-26
AU2018363698A1 (en) 2020-05-21
EP3707713A1 (en) 2020-09-16
JP7003253B2 (ja) 2022-01-20
ZA202002082B (en) 2021-07-28
PT3707713T (pt) 2021-12-03
US20200265852A1 (en) 2020-08-20
CA3080907C (en) 2023-12-19
EP3483882A1 (en) 2019-05-15
TW201923747A (zh) 2019-06-16
KR20200077591A (ko) 2020-06-30
SG11202004171WA (en) 2020-06-29
JP2021502591A (ja) 2021-01-28
CA3080907A1 (en) 2019-05-16
ES2898281T3 (es) 2022-03-04
PL3707713T3 (pl) 2022-01-31
EP3707713B1 (en) 2021-09-22
MX2020004779A (es) 2020-08-13
TWI691954B (zh) 2020-04-21
WO2019091977A1 (en) 2019-05-16

Similar Documents

Publication Publication Date Title
US7383180B2 (en) Constant bitrate media encoding techniques
US11854561B2 (en) Low-frequency emphasis for LPC-based coding in frequency domain
US11335355B2 (en) Estimating noise of an audio signal in the log2-domain
RU2762301C2 (ru) Устройство и способ для кодирования и декодирования аудиосигнала с использованием понижающей дискретизации или интерполяции масштабных параметров
CA2899080A1 (en) Apparatus and method for generating a frequency enhancement signal using an energy limitation operation
RU2752520C1 (ru) Управление полосой частот в кодерах и/или декодерах
TWI793666B (zh) 對多頻道音頻信號的頻道使用比例參數的聯合編碼的音頻解碼器、音頻編碼器和相關方法以及電腦程式