RU2475868C2 - Способ и устройство для маскирования ошибок кодированных аудиоданных - Google Patents

Способ и устройство для маскирования ошибок кодированных аудиоданных Download PDF

Info

Publication number
RU2475868C2
RU2475868C2 RU2010154191/08A RU2010154191A RU2475868C2 RU 2475868 C2 RU2475868 C2 RU 2475868C2 RU 2010154191/08 A RU2010154191/08 A RU 2010154191/08A RU 2010154191 A RU2010154191 A RU 2010154191A RU 2475868 C2 RU2475868 C2 RU 2475868C2
Authority
RU
Russia
Prior art keywords
frame
parameters
parameter value
values
sin
Prior art date
Application number
RU2010154191/08A
Other languages
English (en)
Other versions
RU2010154191A (ru
Inventor
Лассе ЛААКСОНЕН
Микко ТАММИ
Адриана ВАСИЛАКЕ
Ансси РЯМЁ
Original Assignee
Нокиа Корпорейшн
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Нокиа Корпорейшн filed Critical Нокиа Корпорейшн
Publication of RU2010154191A publication Critical patent/RU2010154191A/ru
Application granted granted Critical
Publication of RU2475868C2 publication Critical patent/RU2475868C2/ru

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M13/00Coding, decoding or code conversion, for error detection or error correction; Coding theory basic assumptions; Coding bounds; Error probability evaluation methods; Channel models; Simulation or testing of codes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • H04N19/89Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving methods or arrangements for detection of transmission errors at the decoder
    • H04N19/895Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving methods or arrangements for detection of transmission errors at the decoder in combination with error concealment

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Probability & Statistics with Applications (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

Изобретение относится к кодированию и декодированию аудиоданных и, в частности, к маскированию ошибок в кодированных аудиоданных. Техническим результатом является маскирование кадровой ошибки для минимизации числа некомфортных артефактов, а также поддержание воспринимаемых характеристик сигнала в части расширения при кадровых ошибках. Способ маскирования кадровых ошибок в кодированных аудиоданных осуществляется с помощью приема кодированных аудиоданных в множестве кадров. А также с помощью использования сохраненного одного или более значений параметров из одного или более предыдущих кадров для восстановления кадра с кадровой ошибкой. Использование сохраненного одного или более значений параметров включает получение значений параметров по меньшей мере частично на основе одного или более сохраненных значений параметров и применение полученных значений к кадру с кадровой ошибкой. 4 н. и 14 з.п. ф-лы, 9 ил.

Description

ОБЛАСТЬ ТЕХНИКИ
Изобретение относится к кодированию и декодированию аудиоданных и, в частности, к маскированию ошибок в кодированных аудиоданных.
УРОВЕНЬ ТЕХНИКИ
Данный раздел предназначен для описания предпосылок к созданию изобретения, изложенного в формуле изобретения. Данное описание может включать концепции, которые могли бы быть рассмотрены, но не обязательно те концепции, которые до этого были предложены или рассмотрены. Поэтому, если иное не указано явно, данный раздел не является описанием уровня техники для предлагаемого изобретения.
Встроенное кодирование с переменной скоростью, также называемое многоуровневым кодированием, обычно относится к алгоритму кодирования речи, который производит такой битовый поток, что подмножество этого битового потока может быть декодировано с хорошим качеством. Обычно базовый кодек работает на низких битовых скоростях и используется некоторое число уровней над базовым уровнем для улучшения качества выходного сигнала (включая, например, возможное расширение полосы частот или улучшение гранулярности кодирования). В декодере для получения выходного сигнала может быть декодирована либо часть битового потока, соответствующего базовому кодеку, либо дополнительные его части, либо весь битовый поток, соответствующий одному или более уровням над базовым уровнем.
Сектор телекоммуникаций международного союза электросвязи (ITU-T, International Telecommunication Union Telecommunication Standardization Sector) в настоящее время разрабатывает суперширокополосные (SWB, super-wideband) и стереофонические расширения для встроенных речевых кодеков с переменной скоростью, соответствующих стандартам G.718 (известного как EV-VBR) и G.729.1. Стандартизуемые расширение SWB, которое увеличивает полосу частот кодека EV-VBR с 7 кГц до 14 кГц, и стереофоническое расширение являются мостом между речевым кодированием и аудиокодированием. Стандарты G.718 и G.729.1 являются примерами базовых кодеков, над которым могут использоваться расширения.
В сетях беспроводной связи и в пакетных сетях имеют место канальные ошибки. Эти ошибки могут приводить к искажению некоторых сегментов данных (например, содержащих битовые ошибки), приходящих в приемник, а некоторые сегменты данных могут быть полностью потеряны или стерты. Например, в случае кодеков G.718 и G.729.1, канальные ошибки приводят к стиранию кадров. Необходимо обеспечить устойчивость к ошибкам в SWB (и стереофонии), в частности, для кодирования по стандарту G.718.
СУЩНОСТЬ ИЗОБРЕТЕНИЯ
В одном из аспектов данного изобретения способ маскирования кадровых ошибок в кодированных аудиоданных включает прием кодированных аудиоданных в множестве кадров; и использование сохраненного одного или более значений параметров из одного или более предыдущих кадров для восстановления кадра с кадровой ошибкой. Использование сохраненного одного или более значений параметров включает получение значений параметров по меньшей мере частично на основе сохраненных одного или более значений параметров и применение полученных значений к кадру с кадровой ошибкой.
В одном из вариантов осуществления изобретения сохраненные значения параметров соответствуют значениям параметров одного или более предыдущих кадров без ошибок. В одном из вариантов осуществления изобретения сохраненные значения параметров соответствуют значениям параметров ближайшего предыдущего кадра без ошибок. В одном из вариантов осуществления изобретения сохраненные значения параметров соответствуют значениям параметров предыдущего восстановленного кадра с ошибками.
В одном из вариантов осуществления изобретения сохраненные значения параметров масштабируют для поддержания периодических компонент на верхних частотах.
В одном из вариантов осуществления изобретения сохраненные значения параметров включают спектральные значения модифицированного дискретного косинусного преобразования (MDCT, modified discrete cosine transform). Спектральные значения MDCT могут масштабироваться для всего диапазона верхних частот в соответствии с:
for k=0; k<Lhighspectrum; k++
m(k+Llowspectrum)=mprev (k)*facspect
В одном из вариантов осуществления изобретения сохраненные значения параметров включают значения синусоидальных компонент. Значения синусоидальных компонент могут масштабироваться в соответствии с:
for k=0; k<Nsin; k++
m(possin(k)+Llowspectrum)=mprev(possin(k))*facsin
В одном из вариантов осуществления изобретения масштабирование сконфигурировано для постепенного снижения энергии длинных пачек ошибок.
В другом аспекте данного изобретения устройство содержит декодер, сконфигурированный для приема кодированных аудиоданных в множестве кадров; и использования сохраненного одного или более значений параметров из одного или более предыдущих кадров для восстановления кадра с кадровой ошибкой. Использование сохраненных значений параметров включает масштабирование сохраненных значений параметров и применение масштабированных значений к кадру с кадровой ошибкой.
В одном из вариантов осуществления изобретения сохраненные значения параметров соответствуют значениям параметров одного или более предыдущих кадров без ошибок. В одном из вариантов осуществления изобретения сохраненные значения параметров соответствуют значениям параметров ближайшего предыдущего кадра без ошибок. В одном из вариантов осуществления изобретения сохраненные значения параметров соответствуют значениям параметров предыдущего восстановленного кадра с ошибками.
В одном из вариантов осуществления изобретения сохраненные значения параметров масштабируются для поддержания периодических компонент на верхних частотах.
В одном из вариантов осуществления изобретения сохраненные значения параметров включают спектральные значения модифицированного дискретного косинусного преобразования (MDCT). Спектральные значения MDCT могут масштабироваться для всего диапазона верхних частот в соответствии с:
for k=0; k<Lhighspectrum; k++
m(k+Llowspectrum)=mprev(k)*facspect
В одном из вариантов осуществления изобретения сохраненные значения параметров включают значения синусоидальных компонент. Значения синусоидальных компонент могут масштабироваться в соответствии с:
for k=0; k<Nsin; k++
m(possin(k)+Llowspectrum)=mprev(possin(k))*facsin
В одном из вариантов осуществления изобретения масштабирование сконфигурировано для постепенного снижения энергии для длинных пачек ошибок.
В другом аспекте данное изобретение относится к устройству, содержащему процессор и блок памяти, связанный с процессором. Данный блок памяти содержит компьютерный код для приема кодированных аудиоданных в множестве кадров и компьютерный код для использования сохраненных значений параметров из предыдущего кадра для восстановления кадра с кадровой ошибкой. Компьютерный код для использования сохраненных значений параметров содержит компьютерный код для масштабирования сохраненных значений параметров и применения масштабированных значений к кадру с кадровой ошибкой.
В одном из вариантов осуществления изобретения сохраненные значения параметров соответствуют значениям параметров одного или более предыдущих кадров без ошибок. В одном из вариантов осуществления изобретения сохраненные значения параметров соответствуют значениям параметров ближайшего предыдущего кадра без ошибок. В одном из вариантов осуществления изобретения сохраненные значения параметров соответствуют значениям параметров предыдущего восстановленного кадра с ошибкой.
В одном из вариантов осуществления изобретения сохраненные значения параметров масштабируются для поддержания периодических компонент на верхних частотах.
В одном из вариантов осуществления изобретения сохраненные значения параметров включают спектральные значения модифицированного дискретного косинусного преобразования (MDCT). Компьютерный код для масштабирования может быть сконфигурирован для масштабирования спектральных значений MDCT для всего диапазона верхних частот в соответствии с:
for k=0; k<Lhighspectrum; k++
m (k+Llowspectrum)=mprev(k)*facspect
В одном из вариантов осуществления изобретения сохраненные значения параметров включают значения синусоидальных компонент. Компьютерный код для масштабирования может быть сконфигурирован для масштабирования значений синусоидальных компонент в соответствии с:
for k=0; k<Nsin; k++
m(possin(k)+Llowspectrum)=mprev(possin(k))*facsin
В одном из вариантов осуществления изобретения компьютерный код для масштабирования сконфигурирован для постепенного снижения энергии для длинных пачек ошибок.
В другом аспекте изобретения компьютерный программный продукт, реализованный на машиночитаемом носителе, содержит компьютерный код для приема кодированных аудиоданных в множестве кадров и компьютерный код для использования сохраненных значений параметров из предыдущего кадра для восстановления кадра с кадровой ошибкой. Компьютерный код для использования сохраненных значений параметров содержит компьютерный код для масштабирования сохраненных значений параметров и применения масштабированных значений к кадру с кадровой ошибкой.
В одном из вариантов осуществления изобретения сохраненные значения параметров соответствуют значениям параметров одного или более предыдущих кадров без ошибок. В одном из вариантов осуществления изобретения сохраненные значения параметров соответствуют значениям параметров ближайшего предыдущего кадра без ошибок. В одном из вариантов осуществления изобретения сохраненные значения параметров соответствуют значениям параметров предыдущего восстановленного кадра с ошибкой.
В одном из вариантов осуществления изобретения сохраненные значения параметров масштабируются для поддержания периодических компонент на верхних частотах.
В одном из вариантов осуществления изобретения сохраненные значения параметров включают спектральные значения модифицированного дискретного косинусного преобразования (MDCT). Компьютерный код для масштабирования может быть сконфигурирован для масштабирования спектральных значений MDCT для всего диапазона верхних частот в соответствии с:
for k=0; k<Lhighspectrum; k++
m(k+Llowspectrum)=mprev(k)*facspect
В одном из вариантов осуществления изобретения сохраненные значения параметров включают значения синусоидальных компонент. Компьютерный код для масштабирования может быть сконфигурирован для масштабирования значений синусоидальных компонент в соответствии с:
for k=0; k<Nsin; k++
m(possin(k)+Llowspectrum)=mprev(possin(k))*facsin
В одном из вариантов осуществления изобретения компьютерный код для масштабирования сконфигурирован для постепенного снижения энергии для длинных пачек ошибок.
Эти и другие преимущества, а также признаки различных вариантов осуществления настоящего изобретения, их организация и способ работы станут понятными из последующего подробного описания и прилагаемых чертежей.
КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ
Примеры осуществления данного изобретения описываются со ссылкой на прилагаемые чертежи.
На фиг.1 представлена блок-схема, иллюстрирующая пример способа маскирования кадровой ошибки в соответствии с вариантом осуществления настоящего изобретения.
На фиг.2А и 2В проиллюстрировано применение способа маскирования кадровой ошибки к кадру общего типа в соответствии с вариантом осуществления настоящего изобретения.
На фиг.3А и 3В проиллюстрировано применение способа маскирования кадровой ошибки к тональному кадру в соответствии с вариантом осуществления настоящего изобретения.
На фиг.4 представлена общая структура системы, в которой могут быть реализованы различные варианты осуществления настоящего изобретения.
На фиг.5 представлен вид в перспективе примера электронного устройства, которое может применяться в соответствии с различными вариантами осуществления данного изобретения.
На фиг.6 показана общая структура схемы, которая может быть включена в электронное устройство, изображенное на фиг.5.
На фиг.7 показано графическое представление обобщенной мультимедийной системы связи, в которой могут быть реализованы различные варианты осуществления изобретения.
ПОДРОБНОЕ ОПИСАНИЕ ИЗОБРЕТЕНИЯ
В последующем описании в целях объяснения, но не для ограничения представлены подробности и пояснения для обеспечения полного понимания настоящего изобретения. Однако специалистам будет очевидно, что настоящее изобретение может быть реализовано в других вариантах осуществления, которые выходят за рамки этих подробностей и пояснений.
Стирание кадров может искажать выходной сигнал базового кодека. В то время как восприятие эффектов стирания кадров минимизировано существующими механизмами, используемыми в кодеках, таких как G.718, форма сигнала во временной и частотной областях может сильно искажаться, особенно при большом количестве потерянных кадров. Один из примеров подхода, используемого для расширенного кодирования, состоит в отображении контента нижних частот на верхние частоты. При таком подходе стирание кадров низкочастотного контента может также воздействовать на качество сигнала на верхних частотах. Это может приводить к слышимым и некомфортным искажениям в восстановленном выходном сигнале.
Пример осуществления структуры расширенного кодирования для базовых кодекса, например упомянутых выше кодеков G.718 и G.729.1, может использовать два режима. Первый режим может быть режимом тонального кодирования, который оптимизирован для обработки тональных сигналов, представляющих диапазон периодических верхних частот. Второй режим может быть режимом общего кодирования, который обрабатывает другие типы кадров. Расширенное кодирование может функционировать, например, в области модифицированного дискретного косинусного преобразования (MDCT). В других вариантах осуществления изобретения могут использоваться другие преобразования, например быстрое преобразование Фурье (FFT, Fast Fourier Transform). В режиме тонального кодирования в спектральную область преобразования (например, в спектр MDCT) вводят синусоиды, которые аппроксимируют наиболее существенные для восприятия компоненты. В режиме общего кодирования диапазон верхних частот разделяют на одну или более частотных полос и область нижних частот, которая наиболее похожа на контент верхних частот в каждой частотной полосе, отображают на верхние частоты с использованием набора коэффициентов усиления (например, двух отдельных коэффициентов усиления). Этот вариант способа обычно называют «расширением полосы».
Варианты осуществления настоящего изобретения используют параметры расширенного кодирования описанного выше примера структуры с применением режимов общего и тонального кодирования для маскирования кадровой ошибки, чтобы минимизировать число некомфортных артефактов и поддержать воспринимаемые характеристики сигнала в части расширения при кадровых ошибках.
В одном из вариантов осуществления изобретения маскирование ошибок реализуют как часть структуры расширенного кодирования, включая классификацию на основе кадров, режим общего кодирования (например, режим расширения полосы), в котором диапазон верхних частот формируют отображением нижних частот на верхние частоты, и тональный режим кодирования, в котором кадр кодируют с добавлением некоторого числа синусоидальных компонент. В другом варианте осуществления изобретения маскирование ошибок реализовано как часть структуры расширенного кодирования, которая реализует комбинацию этих способов (т.е. комбинацию механизмов, используемых в режиме общего кодирования и в режиме тонального кодирования) для всех кадров, без этапа классификации. В другом варианте осуществления изобретения могут быть реализованы режимы кодирования, дополнительные к общему режиму и тональному режиму.
Расширенное кодирование, реализованное совместно с некоторым базовым кодированием, например с базовым кодеком стандарта G.718, обеспечивает различные параметры, которые могут быть использованы для маскирования кадровых ошибок. Доступные параметры в структуре расширенного кодирования могут включать: режим кодирования базового кодека, режим расширенного кодирования, параметры режима общего кодирования (например, индексы задержек для полос частот, знаки, набор коэффициентов усиления для отображения частотных полос, параметры регулировки энергии во временной области и подобные параметры, которые используют в тональном режиме) и параметры тонального режима (положения синусоид, знаки и амплитуды). Кроме того, обрабатываемый сигнал может состоять из одного канала либо множества каналов (например, стереофонический или бинауральный сигнал).
Варианты осуществления настоящего изобретения позволяют сохранять верхние частоты похожими по восприятию на частоты в предыдущем кадре для индивидуальных кадровых ошибок и осуществлять постепенное снижение энергии для длинных пачек ошибок. Таким образом, варианты осуществления настоящего изобретения могут быть также использованы при переключении от сигнала, содержащего расширения (например, сигнала SWB), к сигналу, содержащему только выходной сигнал базового кодека (например, к сигналу WB), что может иметь место, например, во встроенном масштабируемом кодировании или передаче, когда битовый поток усечен перед декодированием.
Поскольку тональный режим в основном используют для частей сигнала, имеющих периодический характер на верхних частотах, в некоторых вариантах осуществления настоящего изобретения используется допущение о том, что эти качества должны сохраняться в сигнале также и во время кадровых ошибок вместо получения точки разрыва. В то время как резкие изменения уровня энергии в некоторых кадрах могут создавать заметные раздражающие эффекты, целью для кадров общего типа может быть ослабление ошибочного выходного сигнала. В соответствии с некоторыми вариантами осуществления настоящего изобретения постепенное снижение энергии осуществляют достаточно медленно, поддерживая характеристики восприятия предыдущего кадра (или кадров) для единичных кадровых ошибок. В этом отношении варианты осуществления настоящего изобретения могут быть полезны при переключении от выходного сигнала расширенного кодека к выходному сигналу только базового кодека (например, от SWB к WB, когда уровни SWB усечены). Вследствие наложения-суммирования в MDCT вклад от предыдущего (корректного) кадра влияет на первый стертый кадр (или на кадр, идущий сразу после усечения битового потока) и разница между постепенным снижением энергии и вставкой кадра, состоящего из выборок с нулевыми значениями, может не быть заметной для некоторых сигналов.
Обратимся теперь к фиг.1, которая иллюстрирует пример процесса 200 маскирования ошибок кадра в соответствии с вариантом осуществления настоящего изобретения. Для реализации различных вариантов осуществления настоящего изобретения спектр MDCT верхнего уровня и информация о синусоидальных компонентах (например, положение, знаки и амплитуды) из одного или более предыдущих кадров могут быть сохранены в памяти для использования в следующем кадре в случае кадровой ошибки (блок 202). В блоке 204 процесс переходит к следующему кадру и определяет, имеется ли кадровая ошибка (блок 206). Если ошибки нет, процесс возвращается к блоку 202 и сохраняет вышеуказанные параметры. Таким образом, при кадровой ошибке спектр MDCT одного или более предыдущих кадров становится доступным и может быть обработан (например, масштабирован с уменьшением) и добавлен как вклад для высоких частот текущего кадра. Кроме того, информация, относящаяся к синусоидальным компонентам (например, положения, знаки и амплитуды) в спектре MDCT, также известна. Соответственно, может быть сгенерирован восстановленный кадр (блок 208).
На фиг.2А, 2В, 3А и 3В проиллюстрированы примеры реализации маскирования кадровой ошибки в соответствии с вариантами осуществления настоящего изобретения. На фиг.2А и 2В проиллюстрирован эффект применения маскирования кадровой ошибки к кадру общего типа. В связи с этим на фиг.2А показан спектр корректного кадра 210, не содержащего кадровой ошибки. Как указано выше, спектр MDCT верхнего уровня и информация о синусоидальных компонентах из одного или более предыдущих корректных кадров 210 могут быть сохранены. На фиг.2В показан пример спектра восстановленного кадра 220, заменяющего потерянный кадр, после применения маскирования кадровой ошибки в соответствии с вариантами осуществления настоящего изобретения. Как можно заметить на фиг.2А и 2В, энергия контента, полученного из предыдущего кадра (кадров) (фиг.2А), более ослаблена, в то время как синусоидальные компоненты 212, 214, 222, 224 менее ослаблены.
На фиг.3А и 3В проиллюстрировано применение маскирования кадровой ошибки к тональному кадру. В связи с этим на фиг.3А проиллюстрирован корректный кадр 230, не содержащий кадровые ошибки, а на фиг.3В проиллюстрирован восстановленный кадр 240, используемый для замены потерянного кадра после применения маскирования кадровой ошибки, в соответствии с вариантами осуществления настоящего изобретения. Для тональных кадров 230, 240 применено еще меньшее ослабление, чем для синусоидальных компонент 212, 214, 222, 224 сигнала общего типа на фиг.2А и 2В.
Таким образом, в соответствии с вариантами осуществления настоящего изобретения обработка спектра MDCT может быть описана следующим образом. Первое масштабирование выполняют для всего диапазона верхних частот в соответствии с:
for k=0; k<Lhighspectrum; k++
m (k+Llowspectrum)=mprev(k)*facspect
Второе масштабирование выполняют для синусоидальных компонент в соответствии с:
for k=0; k<Nsin; k++
m(possin(k)+Llowspectrum)=mprev(possin(k))*facsin
В других вариантах осуществления вместо применения постоянного масштабирующего коэффициента ко всем частотным компонентам также возможно использование масштабирующей функции, которая, например, ослабляет верхнюю часть высокочастотного диапазона больше, чем нижнюю часть.
В соответствии с вариантами осуществления настоящего изобретения значения масштабирующих коэффициентов могут быть выбраны на основе такой информации, как типы предыдущих кадров, используемых для маскирования ошибок. В одном из вариантов осуществления изобретения рассматривается только режим расширенного кодирования (например, режим SWB) предыдущего корректного кадра. Если это кадр общего типа, то используются масштабирующие коэффициенты, например 0.5 или 0.6. Для тонального кадра может быть использован масштабирующий коэффициент 0.9 для амплитуд синусоидальных компонент. Так, в этом варианте осуществления изобретения в спектре MDCT тональных кадров нет другого контента, кроме синусоидальных компонент, и процесс получения спектра MDCT для текущего спектра m(k), таким образом, может быть существенно упрощен. В других вариантах осуществления изобретения в режиме, принятом в качестве тонального, в спектре может быть другой контент, отличный от синусоид.
Заметим, что в некоторых вариантах осуществления изобретения могут рассматриваться данные более чем из одного из предыдущих кадров. Далее, некоторые варианты осуществления могут использовать, например, данные из одного предыдущего кадра, отличного от последнего кадра. В другом варианте осуществления могут рассматриваться данные из одного или более последующих кадров.
После того как спектр MDCT для потерянного кадра получен, он может быть обработан аналогичным образом для получения корректного кадра. Так, может быть применено обратное преобразование для получения сигнала во временной области. В некоторых вариантах осуществления изобретения спектр MDCT потерянного кадра также может быть сохранен для использования в следующем кадре в случае, если этот следующий кадр также будет потерян и будет необходимость в осуществлении процесса маскирования ошибок.
В некоторых вариантах осуществления настоящего изобретения к сигналу может быть применено дальнейшее масштабирование уже во временной области. В структуре, приводимой в качестве примера, которая может быть использована, например, совместно с кодеком G.718 или G.729.1, уменьшающее масштабирование сигнала может быть выполнено во временной области, например, на основе последовательности от субкадра к субкадру по 8 субкадрам в каждом кадре, если необходимость этого видна на стороне кодера. В соответствии с вариантами осуществления настоящего изобретения, чтобы избежать введения ненужного контента с сильной энергией на верхних частотах, могут быть использованы два примера мер, которые будут представлены ниже.
Во-первых, в случае если предыдущий корректный кадр кодирован в общем режиме, может быть выполнено уменьшающее масштабирование от субкадра к субкадру. Это уменьшение может использовать, например, значения масштабирования предыдущего корректного кадра или специальную схему масштабирования, назначенную для стираний кадров. В последнем варианте может быть, например, простое постепенное уменьшение энергии высоких частот в текущем кадре.
Во-вторых, вклад в полосу верхних частот может быть снижен с помощью гладкой оконной функции по одному или более потерянным (восстановленным) кадрам. В различных вариантах осуществления изобретения это действие может быть выполнено в дополнение к предыдущему масштабированию во временной области или вместо него.
Решающая логика для схемы масштабирования может быть более сложной или менее сложной в различных вариантах осуществления настоящего изобретения. В частности, в некоторых вариантах осуществления изобретения режим кодирования базового кодека может рассматриваться совместно с расширенным режимом кодирования. В вариантах осуществления изобретения могут рассматриваться некоторые параметры базового кодека. В одном из вариантов осуществления изобретения флаг тонального режима переключается в ноль после первого потерянного кадра для более быстрого ослабления синусоидальных компонент в случае, если состояние стирания кадра длится дольше, чем один кадр.
Таким образом, варианты осуществления настоящего изобретения обеспечивают улучшенные характеристики во время стираний кадра без появления заметных артефактов.
На фиг.4 показана система 10, в которой могут быть реализованы различные варианты осуществления настоящего изобретения и которая содержит множество устройств связи, которые могут осуществлять связь посредством одной или более сетей. Система 10 может содержать любую комбинацию проводных или беспроводных сетей, включая, не ограничиваясь этим, мобильную телефонную сеть, беспроводную локальную сеть (LAN), персональную сеть Bluetooth, LAN Ethernet, LAN с маркерным кольцом, глобальную сеть, сеть Интернет и т.д. Система 10 может содержать как проводные, так и беспроводные устройства связи.
В качестве примера, система 10, показанная на фиг.4, содержит мобильную телефонную сеть 11 и сеть Интернет 28. Соединение с сетью Интернет 28 может включать, не ограничиваясь этим, дальние беспроводные соединения, ближние беспроводные соединения и различные проводные соединения, включая, не ограничиваясь этим, телефонные линии, кабельные линии, силовые линии и т.п.
Примеры устройств связи системы 10 могут включать, не ограничиваясь этим, электронное устройство 12 в форме мобильного телефона, сочетание персонального цифрового ассистента (PDA, personal digital assistant) и мобильного телефона 14, PDA 16, интегрированное устройство 18 обмена сообщениями (IMD, integrated messaging device), настольный компьютер 20, ноутбук 22 и т.д. Устройства связи могут быть стационарными или мобильными, переносимыми пользователем, который перемещается. Устройства связи могут также быть расположены в транспортном средстве, включая, не ограничиваясь этим, автомобиль, грузовик, такси, автобус, поезд, судно, самолет, велосипед, мотоцикл и т.д. Некоторые или все устройства связи могут передавать и принимать вызовы и сообщения, а также связываться с провайдерами услуг посредством беспроводного соединения 25 с базовой станцией 24. Базовая станция 24 может быть соединена с сетевым сервером 26, который позволяет осуществлять связь между мобильной телефонной сетью 11 и сетью Интернет 28. Система 10 может содержать дополнительные устройства связи и устройства связи различных типов.
Устройства связи могут осуществлять связь, используя различные технологии передачи, включая, не ограничиваясь этим, множественный доступ с кодовым разделением каналов (CDMA, Code Division Multiple Access), глобальную систему мобильной связи (GSM, Global System for Mobile Communication), универсальную систему мобильной связи (UMTS, Universal Mobile Telecommunications System), множественный доступ с временным разделением каналов (TDMA, Time Division Multiple Access), множественный доступ с частотным разделением каналов (FDMA, Frequency Division Multiple Access), протокол управления передачей/Интернет-протокол (TCP/IP, Transmission Control Protocol/Internet Protocol), службу коротких сообщений (SMS, Short Messaging Service), службу мультимедийных сообщений (MMS, Multimedia Messaging Service), электронную почту, службу непосредственных сообщений (IMS, Instant Messaging Service), технологию Bluetooth, технологию IEEE 802.11 и т.д. Устройство связи, используемое для реализации различных вариантов осуществления настоящего изобретения, может осуществлять связь с применением различных сред, включая, не ограничиваясь этим, радио, инфракрасное излучение, лазер, кабельное соединение и т.п.
На фиг.5 и 6 показан пример электронного устройства 28, которое может использоваться как сетевой узел, в соответствии с различными вариантами осуществления настоящего изобретения. Должно быть ясно, однако, что настоящее изобретение не ограничивается одним конкретным типом устройства. Электронное устройство 28, изображенное на фиг.5 и 6, содержит корпус 30, дисплей 32 в форме жидкокристаллического дисплея, клавиатуру 34, микрофон 36, динамик 38, батарею 40, инфракрасный порт 42, антенну 44, смарт-карту 46 стандарта UICC в соответствии с одним из вариантов осуществления изобретения, считыватель 48 с карты, схему радиоинтерфейса 52, схему кодека 54, контроллер 56 и память 58. Описанные выше компоненты позволяют электронному устройству 28 отправлять другим устройствам или принимать от других устройств различные сообщения, которые могут находиться в сети, в соответствии с различными вариантами осуществления настоящего изобретения. Отдельные схемы и элементы хорошо известны, например, в модельном ряде мобильных телефонов фирмы Nokia.
На фиг.7 проиллюстрировано графическое представление обобщенной мультимедийной системы связи, в которой могут быть реализованы различные варианты осуществления изобретения. Как показано на фиг.7, источник 100 данных обеспечивает исходный сигнал или в аналоговом, или несжатом цифровом, или сжатом цифровом форматах, или в любой комбинации этих форматов. Кодер 110 кодирует исходный сигнал в кодированный битовый поток. Следует отметить, что битовый поток для декодирования может быть принят непосредственно или косвенно от удаленного устройства, расположенного практически в любом типе сети. Дополнительно, битовый поток может быть принят от локального аппаратного или программного обеспечения. Кодер 110 может иметь возможность кодирования более чем одного типа медиаинформации, например аудиоинформации и видеоинформации, или может потребоваться более чем один кодер 110 для кодирования различных типов медиаинформации исходного сигнала. Кодер 110 может также получать синтетически образованный входной сигнал, например графику и текст, или может иметь возможность создавать кодированный битовый поток синтетической медиаинформации. Далее для упрощения описания рассматривается обработка кодированного битового потока медиаинформации только одного типа. Следует отметить, однако, что обычно вещательные службы реального времени содержат несколько потоков (обычно по меньшей мере аудиопоток, видеопоток и текстовый субтитровый поток). Также следует отметить, что система может содержать множество кодеров, но на фиг.7 для упрощения описания представлен только кодер 110. Должно быть понятно, что несмотря на то, что описание и примеры относятся конкретно к процессу кодирования, такие же концепции и принципы также применимы к соответствующему процессу декодирования и наоборот.
Кодированный битовый медиапоток передается в память 120. Память 120 может включать любой тип массовой памяти для хранения кодированного битового медиапотока. Формат кодированного битового медиапотока в памяти 120 может быть форматом элементарного независимого битового потока, либо один или более кодированных битовых медиапотоков могут быть инкапсулированы в файл контейнера. Некоторые системы работают «на лету», т.е. не используют память, и передают напрямую кодированный битовый медиапоток от кодера 110 к отправителю 130. Кодированный битовый медиапоток затем передается к отправителю 130, также называемому сервером, по мере необходимости. Формат, используемый в этой передаче, может быть форматом элементарного независимого битового потока, форматом пакетного потока, либо один или более кодированных битовых медиапотоков могут быть инкапсулированы в файл контейнера. Кодер 110, память 120 и сервер 130 могут находиться в одном физическом устройстве или в отдельных устройствах. Кодер 110 и сервер 130 могут работать с контентом реального времени, в этом случае кодированный битовый медиапоток обычно не сохраняется постоянно, а буферизируется на малые периоды времени в кодере 110 контента и/или в сервере 130 для сглаживания вариаций в задержке обработки, задержке передачи и скорости кодированного битового медиапотока.
Сервер 130 передает кодированный битовый медиапоток, используя стек протоколов связи. Этот стек может включать, не ограничиваясь этим, транспортный протокол реального времени (RTP, Real-Time Transport Protocol), протокол датаграмм пользователя (UDP, User Datagram Protocol) и Интернет-протокол (IP, Internet Protocol). Если стек протокола связи является пакетно-ориентированным, сервер 130 инкапсулирует кодированный битовый медиапоток в пакеты. Например, если используется протокол RTP, сервер 130 инкапсулирует кодированный битовый медиапоток в пакеты протокола RTP в соответствии с форматом полезной нагрузки протокола RTP. Обычно каждый тип медиаинформации имеет специальный формат полезной нагрузки протокола RTP. Следует отметить, что система может содержать более чем один сервер 130, но для упрощения в последующем описании будет рассматриваться только один сервер 130.
Сервер 130 может соединяться или не соединяться со шлюзом 140 через сеть связи. Шлюз 140 может выполнять различные типы функций, такие как преобразование пакетного потока из одного стека протоколов связи в другой стек протоколов связи, объединение и разветвление потоков данных и манипуляция потоком данных в соответствии с возможностями нисходящего канала и/или приемника, например управление скоростью битов перенаправляемого потока согласно преобладающим условиям нисходящего канала сети. Примеры шлюзов 140 включают MCU, шлюзы между системами видеотелефонии с коммутацией каналов и коммутацией пакетов, серверы сотовой связи «нажми и говори» (РоС, Push-to-talk over Cellular), инкапсуляторы IP в системах мобильной широковещательной передачи цифрового видео (DVB-H, digital video broadcasting-handheld) или цифровые телевизионные приставки, которые направляют широковещательные передачи локально к домашним беспроводным сетям. Если используется протокол RTP, то шлюз 140 называется микшером RTP или транслятором RTP и обычно действует как конечная точка соединения RTP.
Система содержит один или более приемников 150, обычно имеющих возможность приема, демодуляции и извлечения передаваемого сигнала в кодированный битовый медиапоток. Кодированный битовый медиапоток передается в память 155. Память 155 может включать любой тип массовой памяти для хранения кодированного битового медиапотока. Память 155 может альтернативно или дополнительно содержать вычислительную память, такую как память с произвольным доступом. Формат кодированного битового медиапотока в памяти 155 может быть форматом элементарного независимого битового потока, либо один или более кодированных битовых медиапотоков могут быть инкапсулированы в файл контейнера. Если имеется множество кодированных битовых медиапотоков, например аудиопоток и видеопоток, ассоциированные друг с другом, обычно используется файл контейнера, и приемник 150 содержит генератор файла контейнера или присоединен к генератору файла контейнера, создающему файл контейнера из входных потоков. Некоторые системы работают «на лету», т.е. не используют память 155, и непосредственно передают кодированный битовый медиапоток от приемника 150 к декодеру 160. В некоторых системах только последняя часть записанного потока, например последний 10-минутный отрывок записанного потока, сохраняются в памяти 155, в то время как любые более ранние записанные данные отбрасываются из памяти 155.
Кодированный битовый медиапоток передается из памяти 155 декодеру 160. Если имеется множество кодированных битовых медиапотоков, например аудиопоток и видеопоток, ассоциированные друг с другом и инкапсулированные в файл контейнера, применяется анализатор файла (не показан) для извлечения каждого кодированного битового потока из файла контейнера. Память 155 или декодер 160 могут содержать анализатор файла, или анализатор файла может присоединяться к памяти 155 или декодеру 160.
Кодированный битовый медиапоток обычно далее обрабатывается декодеров 160, на выходе которого выдаются один или более несжатых медиапотоков. В конечном счете устройство 170 воспроизведения может воспроизвести несжатые медиапотоки, например, с помощью громкоговорителя или дисплея. Приемник 150, память 155, декодер 160 и устройство 170 воспроизведения могут находиться в одном физическом устройстве или могут быть включены в отдельные устройства.
Отправитель 130 в соответствии с различными вариантами осуществления изобретения может быть сконфигурирован для выбора передаваемых уровней по различным причинам, например для ответа на запрос приемника 150 или по преобладающим условиям сети, по которой передается битовый поток. Запрос от приемника может быть, например, запросом на изменение уровней для отображения либо изменения устройства воспроизведения, имеющего другие возможности по сравнению с предыдущим устройством.
Различные варианты осуществления описаны в общем контексте шагов способа или процессов, которые могут быть реализованы в одном из вариантов осуществления изобретения с помощью компьютерного программного продукта, размещенного на машиночитаемом носителе и включающего машиночитаемые инструкции (например, программный код), исполняемые компьютером в сетевом окружении. Машиночитаемый носитель может включать съемные и несъемные устройства хранения, включая, не ограничиваясь этим, постоянное запоминающее устройство (ROM, Read Only Memory), оперативную память (RAM, Random Access Memory), компакт-диски (CD, compact disc), цифровые универсальные диски (DVD, digital versatile disc) и т.д. Обычно программные модули могут содержать процедуры, программы, объекты, компоненты, структуры данных и т.д., которые выполняют определенные задачи или реализуют определенные абстрактные типы данных. Исполняемые инструкции, ассоциированные структуры данных и программные модули представляют примеры программного кода для выполнения описанных выше шагов способов. Определенная последовательность таких исполняемых инструкций или ассоциированных структур данных представляет примеры соответствующих действий для реализации функций, описанных в таких шагах или процессах.
Варианты осуществления изобретения могут быть реализованы программно, аппаратно, с помощью специализированной логики или с помощью комбинации программных средств, аппаратных средств и специализированной логики. Программные средства, специализированная логика и/или аппаратные средства могут находиться, например, в наборе микросхем (чипсете), мобильном устройстве, настольном компьютере, ноутбуке или сервере. Программное обеспечение и сетевые реализации различных вариантов осуществления изобретения могут быть реализованы с помощью стандартных технологий программирования с логикой на базе правил или другой логикой для осуществления различных этапов или процессов поиска в базе данных, этапов или процессов корреляции, сравнения и решения. Различные варианты осуществления изобретения могут быть также реализованы полностью или частично в сетевых элементах или модулях. Следует отметить, что слова «компонент» и «модуль», используемые в описании и формуле изобретения, обозначают реализации с использованием одной или более строк программного кода и/или аппаратные реализации, и/или оборудование для приема данных, вводимых вручную.
Описание вариантов осуществления изобретения приведено для целей иллюстрации. Это описание не является исчерпывающим и не ограничивает варианты осуществления настоящего изобретения конкретными описанными формами, возможны модификации и изменения как в свете вышеприведенных положений, так и в ходе реализации различных вариантов осуществления настоящего изобретения. Рассмотренные варианты осуществления были выбраны и описаны для объяснения принципов и сути различных вариантов осуществления изобретения и их практического применения, чтобы позволить специалисту реализовать настоящее изобретение в различных вариантах его осуществления и с различными модификациями, подходящими для конкретного использования. Признаки описанных вариантов осуществления могут объединяться в любые комбинации способов, устройств, модулей, систем и компьютерных программных продуктов.
В одном аспекте данного изобретения способ маскирования кадровых ошибок в кодированных аудиоданных включает прием кодированных аудиоданных в множестве кадров; и использование сохраненного одного или более значений параметров из одного или более предыдущих кадров для восстановления кадра с кадровой ошибкой. Использование сохраненного одного или более значений параметров включает получение значений параметров по меньшей мере частично на основе одного или более значений параметров и применение полученных значений к кадру с кадровой ошибкой.
В одном из вариантов осуществления изобретения сохраненные значения параметров соответствуют значениям параметров одного или более предыдущих кадров без ошибок. В одном из вариантов осуществления изобретения сохраненные значения параметров соответствуют значениям параметров ближайшего предыдущего кадра без ошибок. В одном из вариантов осуществления изобретения сохраненные значения параметров соответствуют значениям параметров предыдущего восстановленного кадра с ошибкой.
В одном из вариантов осуществления изобретения сохраненные значения параметров масштабируют для поддержания периодических компонент на верхних частотах.
В одном из вариантов осуществления изобретения сохраненные значения параметров включают спектральные значения модифицированного дискретного косинусного преобразования (MDCT). Спектральные значения MDCT могут масштабироваться для всего диапазона верхних частот в соответствии с:
for k=0; k<Lhighspectrum; k++
m(k+Llowspectrum)=mprev(k)*facspect
В одном из вариантов осуществления изобретения сохраненные значения параметров включают значения синусоидальных компонент.
Значения синусоидальных компонент могут масштабироваться в соответствии с:
for k=0; k<Nsin; k++
m(possin(k)+Llowspectrum)= m prev(possin(k))*facsin
В одном из вариантов осуществления изобретения масштабирование сконфигурировано для постепенного снижения энергии для длинных пачек ошибок.
В другом аспекте данного изобретения устройство содержит декодер, сконфигурированный для приема кодированных аудиоданных в множестве кадров и использования сохраненных значений параметров из предыдущего кадра для восстановления кадра с кадровой ошибкой. Использование сохраненных значений параметров включает масштабирование сохраненных значений параметров и применение масштабированных значений к кадру с кадровой ошибкой.
В одном из вариантов осуществления изобретения сохраненные значения параметров соответствуют значениям параметров одного или более предыдущих кадров без ошибок. В одном из вариантов осуществления изобретения сохраненные значения параметров соответствуют значениям параметров ближайшего предыдущего кадра без ошибок. В одном из вариантов осуществления изобретения сохраненные значения параметров соответствуют значениям параметров предыдущего восстановленного кадра с ошибками.
В одном из вариантов осуществления изобретения сохраненные значения параметров масштабируют для поддержания периодических компонент на верхних частотах.
В одном из вариантов осуществления изобретения сохраненные значения параметров содержат спектральные значения модифицированного дискретного косинусного преобразования (MDCT). Спектральные значения MDCT могут масштабироваться для всего диапазона верхних частот в соответствии с:
for k=0; k<Lhighspectrum; k++
m(k+Llowspectrum)=mprev(k)*facspect
В одном из вариантов осуществления изобретения сохраненные значения параметров содержат значения синусоидальных компонент.
Значения синусоидальных компонент могут масштабироваться в соответствии с:
for k=0; k<Nsin; k++
m(possin(k)+Llowspectrum)= m prev (possin (k))*facsin
В одном из вариантов осуществления изобретения масштабирование сконфигурировано для постепенного снижения энергии для длинных пачек ошибок.
В другом аспекте данное изобретение относится к устройству, содержащему процессор и блок памяти, связанный с процессором. Блок памяти содержит компьютерный код для приема кодированных аудиоданных в множестве кадров и компьютерный код для использования сохраненных значений параметров из предыдущего кадра для восстановления кадра с кадровой ошибкой. Компьютерный код для использования сохраненных значений параметров содержит компьютерный код для масштабирования сохраненных значений параметров и применения масштабированных значений к кадру с кадровой ошибкой.
В одном из вариантов осуществления изобретения сохраненные значения параметров соответствуют значениям параметров одного или более предыдущих кадров без ошибок. В одном из вариантов осуществления изобретения сохраненные значения параметров соответствуют значениям параметров ближайшего предыдущего кадра без ошибок. В одном из вариантов осуществления изобретения сохраненные значения параметров соответствуют значениям параметров предыдущего восстановленного кадра с ошибкой.
В одном из вариантов осуществления изобретения сохраненные значения параметров масштабируют для поддержания периодических компонент на верхних частотах.
В одном варианте осуществления сохраненные значения параметров включают спектральные значения модифицированного дискретного косинусного преобразования (MDCT). Компьютерный код для масштабирования может быть сконфигурирован для масштабирования спектральных значений MDCT для всего диапазона верхних частот в соответствии с:
for k=0; k<Lhighspectrum; k++
m(k+Llowspectrum)=mprev(k)*facspect
В одном из вариантов осуществления изобретения сохраненные значения параметров содержат значения синусоидальных компонент. Компьютерный код для масштабирования может быть сконфигурирован для масштабирования значений синусоидальных компонент в соответствии с:
for k=0; k<Nsin; k++
m(possin(k)+Llowspectrum)= m prev(possin(k))*facsin
В одном из вариантов осуществления изобретения компьютерный код для масштабирования сконфигурирован для постепенного снижения энергии для длинных пачек ошибок.
В другом аспекте компьютерный программный продукт, реализованный на машиночитаемом носителе, содержит компьютерный код для приема кодированных аудиоданных в множестве кадров; и компьютерный код для использования сохраненных значений параметров из предыдущего кадра для восстановления кадра с кадровой ошибкой. Компьютерный код для использования сохраненных значений параметров содержит компьютерный код для масштабирования сохраненных значений параметров и применения масштабированных значений к кадру с кадровой ошибкой.
В одном из вариантов осуществления изобретения сохраненные значения параметров соответствуют значениям параметров одного или более предыдущих кадров без ошибок. В одном из вариантов осуществления изобретения сохраненные значения параметров соответствуют значениям параметров ближайшего предыдущего кадра без ошибок. В одном из вариантов осуществления изобретения сохраненные значения параметров соответствуют значениям параметров предыдущего восстановленного кадра с ошибками.
В одном из вариантов осуществления изобретения сохраненные значения параметров масштабируют для поддержания периодических компонент на верхних частотах.
В одном из вариантов осуществления изобретения сохраненные значения параметров включают спектральные значения модифицированного дискретного косинусного преобразования (MDCT). Компьютерный код для масштабирования может быть сконфигурирован для масштабирования спектральных значений MDCT для всего диапазона верхних частот в соответствии с:
for k=0; k<Lhighspectrum; k++
m(k+Llowspectrum)=mprev(k)*facspect
В одном из вариантов осуществления изобретения сохраненные значения параметров содержат значения синусоидальных компонент. Компьютерный код для масштабирования может быть сконфигурирован для масштабирования значений синусоидальных компонент в соответствии с:
for k=0; k<Nsin; k++
m(possin(k)+Llowspectrum)= m prev(possin(k))*facsin
В одном варианте осуществления компьютерный код для масштабирования сконфигурирован для постепенного снижения энергии для длинных пачек ошибок.

Claims (18)

1. Способ маскирования кадровых ошибок в кодированных аудиоданных, включающий:
прием кодированных аудиоданных в множестве кадров; и
восстановление по меньшей мере одного параметра для кадра с кадровой ошибкой на основе по меньшей мере одного сохраненного значения параметра по меньшей мере из одного другого кадра множества кадров, при этом восстановление по меньшей мере одного параметра включает:
получение значений для первого набора параметров по меньшей мере частично на основе упомянутого по меньшей мере одного сохраненного значения параметра с использованием первого подхода;
получение значений для второго набора параметров по меньшей мере частично на основе упомянутого по меньшей мере одного сохраненного значения параметра с использованием второго подхода;
и применение полученных значений к кадру с кадровой ошибкой;
при этом первый набор параметров включает спектральные значения модифицированного дискретного косинусного преобразования (MDCT), а второй набор параметров включает синусоидальные компоненты, введенные в спектр MDCT.
2. Способ по п.1, в котором упомянутое по меньшей мере одно сохраненное значение параметра включает по меньшей мере одно из следующего:
по меньшей мере одно значение параметра по меньшей мере одного предыдущего кадра без ошибок,
по меньшей мере одно значение параметра ближайшего предыдущего кадра без ошибок,
по меньшей мере одно значение параметра по меньшей мере одного предыдущего восстановленного кадра с ошибкой и
по меньшей мере одно значение параметра по меньшей мере одного последующего кадра.
3. Способ по п.1 или 2, в котором упомянутое получение значений с использованием первого подхода включает масштабирование упомянутого по меньшей мере одного сохраненного значения параметра с помощью первого набора масштабирующих коэффициентов, и упомянутое получение значений с использованием второго подхода включает масштабирование упомянутого по меньшей мере одного сохраненного значения параметра с помощью второго набора масштабирующих коэффициентов.
4. Способ по п.1 или 2, в котором первый набор параметров включает параметры для диапазона верхних частот.
5. Способ по п.1 или 2, в котором второй набор параметров включает поднабор первого набора параметров.
6. Способ по п.1 или 2, в котором первый подход включает получение значений (m) параметров для первого набора параметров в соответствии с:
for k=0; k<Lhighspectrum; k++
m(k+Llowspectrum)=mprev(k)*facspect;
где mprev - упомянутое по меньшей мере одно сохраненное значение параметра, и facspect - соответствующий масштабирующий коэффициент.
7. Способ по п.1 или 2, в котором второй подход включает получение значений (m) параметров для второго набора параметров в соответствии с:
for k=0; k<Nsin; k++
m(possin(k)+Llowspectrum)=mprev(possin(k))*facsin,
где mprev - упомянутое по меньшей мере одно сохраненное значение параметра, facsin - соответствующий масштабирующий коэффициент, и possin является переменной, описывающей положения для второго набора параметров, внутри m и mprev.
8. Способ по п.1 или 2, в котором получение значений параметров включает постепенное снижение энергии сигнала.
9. Устройство для маскирования кадровых ошибок в кодированных аудиоданных, содержащее:
декодер, сконфигурированный для:
приема кодированных аудиоданных в множестве кадров; и
восстановления по меньшей мере одного параметра для кадра с кадровой ошибкой на основе по меньшей мере одного сохраненного значения параметра по меньшей мере из одного другого кадра множества кадров, при этом восстановление по меньшей мере одного параметра включает:
получение значений для первого набора параметров по меньшей мере частично на основе упомянутого по меньшей мере одного сохраненного значения параметра с использованием первого подхода;
получение значений для второго набора параметров по меньшей мере частично на основе упомянутого по меньшей мере одного сохраненного значения параметра с использованием второго подхода и
применение полученных значений к кадру с кадровой ошибкой;
при этом первый набор параметров включает спектральные значения модифицированного дискретного косинусного преобразования (MDCT), a второй набор параметров включает синусоидальные компоненты, введенные в спектр MDCT.
10. Устройство по п.9, в котором по меньшей мере одно сохраненное значение параметра содержит по меньшей мере одно из следующего:
по меньшей мере одно значение параметра по меньшей мере одного предыдущего кадра без ошибок,
по меньшей мере одно значение параметра ближайшего предыдущего кадра без ошибок,
по меньшей мере одно значение параметра по меньшей мере одного предыдущего восстановленного кадра с ошибкой и
по меньшей мере одно значение параметра по меньшей мере одного последующего кадра.
11. Устройство по п.9 или 10, в котором упомянутое получение значений с использованием первого подхода включает масштабирование упомянутого по меньшей мере одного сохраненного значения параметра с помощью первого набора масштабирующих коэффициентов, и упомянутое получение значений с использованием второго подхода включает масштабирование упомянутого по меньшей мере одного сохраненного значения параметра с помощью второго набора масштабирующих коэффициентов.
12. Устройство по п.9 или 10, в котором первый набор параметров включает параметры для диапазона верхних частот.
13. Устройство по п.9 или 10, в котором второй набор параметров включает поднабор первого набора параметров.
14. Устройство по п.9 или 10, в котором первый подход включает получение значений (m) параметра для первого набора параметров в соответствии с:
for k=0; k<Lhighspectrum; k++
m(k+Llowspectrum)=mprev(k)*facspect,
где mprev - упомянутое по меньшей мере одно сохраненное значение параметра, и facspect - соответствующий масштабирующий коэффициент.
15. Устройство по п.9 или 10, в котором второй подход включает получение значений (m) параметра для второго набора параметров в соответствии с:
for k=0; k<Nsin; k++
m(possin(k)+Llowspectrum)=mprev(possin(k))*facsin,
где mprev - упомянутое по меньшей мере одно сохраненное значение параметра, facsin - соответствующий масштабирующий коэффициент, и possin является переменной, описывающей положения для второго набора параметров, внутри m и mprev.
16. Устройство по п.9 или 10, в котором получение значений параметров включает постепенное снижение энергии сигнала.
17. Устройство для маскирования кадровых ошибок в кодированных аудиоданных, содержащее:
процессор и блок памяти, связанный с процессором, и содержащий:
компьютерный код, обеспечивающий прием устройством кодированных аудиоданных в множестве кадров; и
компьютерный код для восстановления по меньшей мере одного параметра для кадра с кадровой ошибкой на основе по меньшей мере одного сохраненного значения параметра по меньшей мере из одного другого кадра множества кадров,
при этом компьютерный код для восстановления по меньшей мере одного параметра включает:
компьютерный код для получения значений для первого набора параметров по меньшей мере частично на основе упомянутого по меньшей мере одного сохраненного значения параметра с использованием первого подхода;
компьютерный код для получения значений для второго набора параметров по меньшей мере частично на основе упомянутого по меньшей мере одного сохраненного значения параметра с использованием второго подхода; и
для применения полученных значений к кадру с кадровой ошибкой;
при этом первый набор параметров включает спектральные значения модифицированного дискретного косинусного преобразования (MDCT), а второй набор параметров включает синусоидальные компоненты, введенные в спектр MDCT.
18. Машиночитаемый носитель с компьютерным программным кодом для использования компьютером, при этом компьютерный программный код осуществляет способ по любому из пп.1-8.
RU2010154191/08A 2008-06-13 2009-05-15 Способ и устройство для маскирования ошибок кодированных аудиоданных RU2475868C2 (ru)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US6157208P 2008-06-13 2008-06-13
US61/061,572 2008-06-13
PCT/FI2009/050403 WO2009150290A1 (en) 2008-06-13 2009-05-15 Method and apparatus for error concealment of encoded audio data

Publications (2)

Publication Number Publication Date
RU2010154191A RU2010154191A (ru) 2012-07-20
RU2475868C2 true RU2475868C2 (ru) 2013-02-20

Family

ID=41416403

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2010154191/08A RU2475868C2 (ru) 2008-06-13 2009-05-15 Способ и устройство для маскирования ошибок кодированных аудиоданных

Country Status (10)

Country Link
US (1) US8397117B2 (ru)
EP (1) EP2301015B1 (ru)
KR (1) KR101228165B1 (ru)
CN (1) CN102057424B (ru)
AU (1) AU2009256551B2 (ru)
BR (1) BRPI0915358B1 (ru)
RU (1) RU2475868C2 (ru)
TW (1) TWI466102B (ru)
WO (1) WO2009150290A1 (ru)
ZA (1) ZA201100279B (ru)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2711108C1 (ru) * 2016-03-07 2020-01-15 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Блок маскирования ошибок, аудиодекодер и соответствующие способ и компьютерная программа, подвергающие затуханию замаскированный аудиокадр согласно разным коэффициентам затухания для разных полос частот

Families Citing this family (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8489403B1 (en) * 2010-08-25 2013-07-16 Foundation For Research and Technology—Institute of Computer Science ‘FORTH-ICS’ Apparatuses, methods and systems for sparse sinusoidal audio processing and transmission
CN103229234B (zh) 2010-11-22 2015-07-08 株式会社Ntt都科摩 音频编码装置、方法以及音频解码装置、方法
CN104011793B (zh) * 2011-10-21 2016-11-23 三星电子株式会社 帧错误隐藏方法和设备以及音频解码方法和设备
CN104718570B (zh) * 2012-09-13 2017-07-18 Lg电子株式会社 帧丢失恢复方法,和音频解码方法以及使用其的设备
CN103714821A (zh) 2012-09-28 2014-04-09 杜比实验室特许公司 基于位置的混合域数据包丢失隐藏
WO2014108738A1 (en) * 2013-01-08 2014-07-17 Nokia Corporation Audio signal multi-channel parameter encoder
ES2603266T3 (es) * 2013-02-13 2017-02-24 Telefonaktiebolaget L M Ericsson (Publ) Ocultación de errores de trama
FR3004876A1 (fr) * 2013-04-18 2014-10-24 France Telecom Correction de perte de trame par injection de bruit pondere.
KR102120073B1 (ko) 2013-06-21 2020-06-08 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 개선된 피치 래그 추정을 사용하여 acelpp-형 은폐 내에서 적응적 코드북의 개선된 은폐를 위한 장치 및 방법
AU2014283389B2 (en) 2013-06-21 2017-10-05 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for improved concealment of the adaptive codebook in ACELP-like concealment employing improved pulse resynchronization
CN103646647B (zh) * 2013-12-13 2016-03-16 武汉大学 混合音频解码器中帧差错隐藏的谱参数代替方法及系统
CN104751849B (zh) * 2013-12-31 2017-04-19 华为技术有限公司 语音频码流的解码方法及装置
WO2015104447A1 (en) 2014-01-13 2015-07-16 Nokia Technologies Oy Multi-channel audio signal classifier
CN107369454B (zh) 2014-03-21 2020-10-27 华为技术有限公司 语音频码流的解码方法及装置
CN105374367B (zh) * 2014-07-29 2019-04-05 华为技术有限公司 异常帧检测方法和装置
CN107004417B (zh) * 2014-12-09 2021-05-07 杜比国际公司 Mdct域错误掩盖
MX2018010756A (es) 2016-03-07 2019-01-14 Fraunhofer Ges Forschung Unidad de ocultamiento de error, decodificador de audio, y método relacionado y programa de computadora que usa características de una representación decodificada de una trama de audio decodificada apropiadamente.
US10217467B2 (en) * 2016-06-20 2019-02-26 Qualcomm Incorporated Encoding and decoding of interchannel phase differences between audio signals
WO2019091576A1 (en) 2017-11-10 2019-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits
EP3483880A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Temporal noise shaping
EP3483882A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Controlling bandwidth in encoders and/or decoders
EP3483878A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder supporting a set of different loss concealment tools
EP3483879A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Analysis/synthesis windowing function for modulated lapped transformation
EP3483884A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Signal filtering
EP3483883A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio coding and decoding with selective postfiltering
WO2019091573A1 (en) 2017-11-10 2019-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding and decoding an audio signal using downsampling or interpolation of scale parameters
EP3483886A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Selecting pitch lag
WO2020165263A2 (en) * 2019-02-13 2020-08-20 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Decoder and decoding method selecting an error concealment mode, and encoder and encoding method
WO2020164751A1 (en) * 2019-02-13 2020-08-20 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Decoder and decoding method for lc3 concealment including full frame loss concealment and partial frame loss concealment
WO2020207593A1 (en) * 2019-04-11 2020-10-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder, apparatus for determining a set of values defining characteristics of a filter, methods for providing a decoded audio representation, methods for determining a set of values defining characteristics of a filter and computer program
CN117354585A (zh) * 2023-12-06 2024-01-05 深圳感臻智能股份有限公司 一种针对视频网络丢包的优化方法及装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2119269C1 (ru) * 1991-11-07 1998-09-20 Ар-Си-Эй Томсон Лайсензинг Корпорейшн Телевизионная система для преобразования сжатых данных, представляющих изображения и размещенных в блоках, в несжатые данные и система для обработки сжатых видеоданных, передаваемых в виде блоков
RU2124272C1 (ru) * 1993-09-15 1998-12-27 Фраунхофер-Гезельшафт цур Фердерунг дер Ангевандтен Форшунг Е.В. Способ определения вида кодирования, который следует выбирать для кодирования по меньшей мере двух сигналов
RU2214047C2 (ru) * 1997-11-19 2003-10-10 Самсунг Электроникс Ко., Лтд. Способ и устройство для масштабируемого кодирования/декодирования аудиосигналов
WO2004059894A2 (en) * 2002-12-31 2004-07-15 Nokia Corporation Method and device for compressed-domain packet loss concealment
WO2008062959A1 (en) * 2006-11-24 2008-05-29 Samsung Electronics Co., Ltd. Error concealment method and apparatus for audio signal and decoding method and apparatus for audio signal using the same

Family Cites Families (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5148487A (en) 1990-02-26 1992-09-15 Matsushita Electric Industrial Co., Ltd. Audio subband encoded signal decoder
US5144671A (en) 1990-03-15 1992-09-01 Gte Laboratories Incorporated Method for reducing the search complexity in analysis-by-synthesis coding
JP3102015B2 (ja) * 1990-05-28 2000-10-23 日本電気株式会社 音声復号化方法
JP3085606B2 (ja) * 1992-07-16 2000-09-11 ヤマハ株式会社 ディジタルデータの誤り補正方法
IT1257065B (it) 1992-07-31 1996-01-05 Sip Codificatore a basso ritardo per segnali audio, utilizzante tecniche di analisi per sintesi.
SE504397C2 (sv) 1995-05-03 1997-01-27 Ericsson Telefon Ab L M Metod för förstärkningskvantisering vid linjärprediktiv talkodning med kodboksexcitering
US5797121A (en) 1995-12-26 1998-08-18 Motorola, Inc. Method and apparatus for implementing vector quantization of speech parameters
US5825320A (en) 1996-03-19 1998-10-20 Sony Corporation Gain control method for audio encoding device
US6810377B1 (en) * 1998-06-19 2004-10-26 Comsat Corporation Lost frame recovery techniques for parametric, LPC-based speech coding systems
FI106325B (fi) 1998-11-12 2001-01-15 Nokia Networks Oy Menetelmä ja laite tehonsäädön ohjaamiseksi
US6775649B1 (en) * 1999-09-01 2004-08-10 Texas Instruments Incorporated Concealment of frame erasures for speech transmission and storage system and method
US6959274B1 (en) * 1999-09-22 2005-10-25 Mindspeed Technologies, Inc. Fixed rate speech compression system and method
US6438518B1 (en) * 1999-10-28 2002-08-20 Qualcomm Incorporated Method and apparatus for using coding scheme selection patterns in a predictive speech coder to reduce sensitivity to frame error conditions
US7069208B2 (en) * 2001-01-24 2006-06-27 Nokia, Corp. System and method for concealment of data loss in digital audio transmission
US20030135374A1 (en) * 2002-01-16 2003-07-17 Hardwick John C. Speech synthesizer
US7047187B2 (en) * 2002-02-27 2006-05-16 Matsushita Electric Industrial Co., Ltd. Method and apparatus for audio error concealment using data hiding
EP1589330B1 (en) * 2003-01-30 2009-04-22 Fujitsu Limited Audio packet vanishment concealing device, audio packet vanishment concealing method, reception terminal, and audio communication system
FI118550B (fi) 2003-07-14 2007-12-14 Nokia Corp Parannettu eksitaatio ylemmän kaistan koodaukselle koodekissa, joka käyttää kaistojen jakoon perustuvia koodausmenetelmiä
US7356748B2 (en) 2003-12-19 2008-04-08 Telefonaktiebolaget Lm Ericsson (Publ) Partial spectral loss concealment in transform codecs
US7546508B2 (en) * 2003-12-19 2009-06-09 Nokia Corporation Codec-assisted capacity enhancement of wireless VoIP
US7668711B2 (en) 2004-04-23 2010-02-23 Panasonic Corporation Coding equipment
EP1768937B1 (en) * 2004-06-10 2008-11-19 Imerys Kaolin, Inc. Ultra-low residue, high solids, wet cake products and methods of making same
BRPI0607251A2 (pt) * 2005-01-31 2017-06-13 Sonorit Aps método para concatenar um primeiro quadro de amostras e um segundo quadro subseqüente de amostras, código de programa executável por computador, dispositivo de armazenamento de programa, e, arranjo para receber um sinal de áudio digitalizado
US20060184363A1 (en) 2005-02-17 2006-08-17 Mccree Alan Noise suppression
PT1875463T (pt) 2005-04-22 2019-01-24 Qualcomm Inc Sistemas, métodos e aparelho para nivelamento de fator de ganho
US8620644B2 (en) * 2005-10-26 2013-12-31 Qualcomm Incorporated Encoder-assisted frame loss concealment techniques for audio coding
KR100958144B1 (ko) 2005-11-04 2010-05-18 노키아 코포레이션 오디오 압축
US8255207B2 (en) * 2005-12-28 2012-08-28 Voiceage Corporation Method and device for efficient frame erasure concealment in speech codecs
CN101896968A (zh) 2007-11-06 2010-11-24 诺基亚公司 音频编码装置及其方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2119269C1 (ru) * 1991-11-07 1998-09-20 Ар-Си-Эй Томсон Лайсензинг Корпорейшн Телевизионная система для преобразования сжатых данных, представляющих изображения и размещенных в блоках, в несжатые данные и система для обработки сжатых видеоданных, передаваемых в виде блоков
RU2124272C1 (ru) * 1993-09-15 1998-12-27 Фраунхофер-Гезельшафт цур Фердерунг дер Ангевандтен Форшунг Е.В. Способ определения вида кодирования, который следует выбирать для кодирования по меньшей мере двух сигналов
RU2214047C2 (ru) * 1997-11-19 2003-10-10 Самсунг Электроникс Ко., Лтд. Способ и устройство для масштабируемого кодирования/декодирования аудиосигналов
WO2004059894A2 (en) * 2002-12-31 2004-07-15 Nokia Corporation Method and device for compressed-domain packet loss concealment
US6985856B2 (en) * 2002-12-31 2006-01-10 Nokia Corporation Method and device for compressed-domain packet loss concealment
WO2008062959A1 (en) * 2006-11-24 2008-05-29 Samsung Electronics Co., Ltd. Error concealment method and apparatus for audio signal and decoding method and apparatus for audio signal using the same

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2711108C1 (ru) * 2016-03-07 2020-01-15 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Блок маскирования ошибок, аудиодекодер и соответствующие способ и компьютерная программа, подвергающие затуханию замаскированный аудиокадр согласно разным коэффициентам затухания для разных полос частот

Also Published As

Publication number Publication date
AU2009256551A1 (en) 2009-12-17
TWI466102B (zh) 2014-12-21
US20100115370A1 (en) 2010-05-06
ZA201100279B (en) 2012-06-27
AU2009256551B2 (en) 2015-08-13
BRPI0915358B1 (pt) 2020-04-22
EP2301015A4 (en) 2016-04-13
KR20110040835A (ko) 2011-04-20
BRPI0915358A2 (pt) 2015-11-03
TW201005730A (en) 2010-02-01
EP2301015B1 (en) 2019-09-04
RU2010154191A (ru) 2012-07-20
EP2301015A1 (en) 2011-03-30
CN102057424B (zh) 2015-06-17
CN102057424A (zh) 2011-05-11
KR101228165B1 (ko) 2013-01-30
WO2009150290A1 (en) 2009-12-17
US8397117B2 (en) 2013-03-12

Similar Documents

Publication Publication Date Title
RU2475868C2 (ru) Способ и устройство для маскирования ошибок кодированных аудиоданных
CN101346760B (zh) 用于音频编码的编码器辅助的帧丢失隐藏技术
US8069049B2 (en) Speech coding system and method
WO2006021849A1 (en) Method, apparatus and computer program to provide predictor adaptation for advanced audio coding (aac) system
KR101548846B1 (ko) 워터마킹된 신호의 적응적 인코딩 및 디코딩을 위한 디바이스
US20230137053A1 (en) Audio Coding Method and Apparatus
KR20100063097A (ko) Amr-wb dtx 동기화를 제공하는 시스템 및 방법
Meltzer et al. SBR Enhanced Audio Codecs for Digital Broadcasting Such as" Digital Radio Mondiale"(DRM)
KR20230002899A (ko) 오디오 신호 코딩 방법 및 장치
US20230105508A1 (en) Audio Coding Method and Apparatus
US20160019903A1 (en) Optimized mixing of audio streams encoded by sub-band encoding
Meine et al. Error protection and concealment for HILN MPEG-4 parametric audio coding
WO2022258036A1 (zh) 编解码方法、装置、设备、存储介质及计算机程序
JP2001343998A (ja) ディジタルオーディオデコーダ
JP4486387B2 (ja) エラー補償装置およびエラー補償方法
WO2022267754A1 (zh) 语音编码、语音解码方法、装置、计算机设备和存储介质
AU2012261547B2 (en) Speech coding system and method
JP2000244325A (ja) Mpegオーディオの復号化方法
CN115881138A (zh) 解码方法、装置、设备、存储介质及计算机程序产品
Ehret et al. Evaluation of real-time transport protocol configurations using aacPlus

Legal Events

Date Code Title Description
PC41 Official registration of the transfer of exclusive right

Effective date: 20160602