RU2650025C2 - Генерирование комфортного шума с высоким спектрально-временным разрешением при прерывистой передаче аудиосигналов - Google Patents

Генерирование комфортного шума с высоким спектрально-временным разрешением при прерывистой передаче аудиосигналов Download PDF

Info

Publication number
RU2650025C2
RU2650025C2 RU2015129691A RU2015129691A RU2650025C2 RU 2650025 C2 RU2650025 C2 RU 2650025C2 RU 2015129691 A RU2015129691 A RU 2015129691A RU 2015129691 A RU2015129691 A RU 2015129691A RU 2650025 C2 RU2650025 C2 RU 2650025C2
Authority
RU
Russia
Prior art keywords
spectrum
noise
audio
signal
comfort
Prior art date
Application number
RU2015129691A
Other languages
English (en)
Other versions
RU2015129691A (ru
Inventor
Антони ЛОМБАР
Мартин ДИТЦ
Штефан ВИЛЬДЕ
Эммануэль РАВЕЛЛИ
Панджи СЕТИАВАН
Маркус МУЛЬТРУС
Original Assignee
Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. filed Critical Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф.
Publication of RU2015129691A publication Critical patent/RU2015129691A/ru
Application granted granted Critical
Publication of RU2650025C2 publication Critical patent/RU2650025C2/ru

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/012Comfort noise or silence coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/002Dynamic bit allocation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)
  • Noise Elimination (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)

Abstract

Изобретение относится к средствам для генерирования комфортного шума с высоким спектрально-временным разрешением. Технический результат заключается в повышении качества аудиосигнала посредством добавления комфортного шума. Декодируют битовый поток для получения из него выходного аудиосигнала. Битовый поток содержит активную фазу, за которой следует неактивная фаза. Битовый поток имеет закодированный в нем кадр дескриптора вставки молчания, который описывает спектр фонового шума. Аудиодекодер содержит декодер дескриптора вставки молчания, выполненный с возможностью декодирования кадра дескриптора вставки молчания для восстановления спектра фонового шума; устройство декодирования, выполненное с возможностью восстановления выходного аудиосигнала из битового потока во время активной фазы; спектральный преобразователь, выполненный с возможностью определения спектра выходного аудиосигнала; устройство оценивателя шума; преобразователь разрешения; устройство оценки спектра комфортного шума и генератор комфортного шума. 4 н. и 15 з.п. ф-лы, 5 ил.

Description

Настоящее изобретение относится к обработке аудиосигналов, и в частности к добавлению комфортного шума к аудиосигналам
Генераторы комфортного шума обычно используются при прерывистой передаче (DTX) аудиосигналов, в частности аудиосигналов, содержащих речь. В таком режиме аудиосигнал сначала классифицируется на активные и неактивные кадры детектором голосовой активности (VAD). Основываясь на результате VAD, только активные кадры речи кодируются и передаются с номинальной скоростью передачи в битах. Во время длинных пауз, где присутствует только фоновый шум, скорость передачи в битах понижается или становится равной нулю, и фоновый шум кодируется эпизодически и параметрически, используя кадры дескриптора вставки молчания (кадры SID). Средняя скорость передачи в битах тогда существенно уменьшается.
Шум генерируется во время неактивных кадров на стороне декодера генератором комфортного шума (CNG). На практике размер кадра SID очень ограничен. Поэтому, количество параметров, описывающих фоновый шум, должно поддерживаться максимально малым. С этой целью, оценка шума не применяется непосредственно на выходе спектральных преобразований. Вместо этого, она применяется при более низком спектральном разрешении посредством усреднения входного энергетического спектра среди групп полос, например, по масштабу Барка. Усреднение может достигаться или арифметическим, или геометрическим способом. К сожалению, ограниченное количество параметров, передаваемых в кадрах SID, не позволяет захватывать структуру спектра высокого разрешения фонового шума. Следовательно, только посредством CNG может воспроизводиться только плавная спектральная огибающая шума. Когда VAD запускает кадр CNG, расхождение между плавным спектром восстановленного комфортного шума и спектром фактического фонового шума может стать очень слышимым на переходах между активными кадрами (содержащими нормальное кодирование и декодирование зашумленных участков речи сигнала) и кадрами CNG.
Задачей настоящего изобретения является обеспечение улучшенных принципов обработки аудиосигналов. Более конкретно, задачей настоящего изобретения является обеспечение улучшенных принципов добавления комфортного шума к аудиосигналам. Задача настоящего изобретения достигается посредством аудиодекодера по п. 1 формулы изобретения, системы по п. 17 формулы изобретения, способа по п. 18 формулы изобретения и компьютерной программы по п. 19 формулы изобретения.
В одном аспекте изобретение обеспечивает аудиодекодер, выполненный с возможностью декодирования битового потока для получения из него выходных аудиосигналов, причем битовый поток содержит по меньшей мере активную фазу, за которой следует по меньшей мере неактивная фаза, в котором в битовом потоке закодирован по меньшей мере кадр дескриптора вставки молчания, который описывает спектр фонового шума, причем аудиодекодер содержит:
декодер дескриптора вставки молчания, выполненный с возможностью декодирования кадра дескриптора вставки молчания для восстановления спектра фонового шума;
устройство декодирования, выполненное с возможностью восстановления выходного аудиосигнала из битового потока во время активной фазы;
спектральный преобразователь, выполненный с возможностью определения спектра выходного аудиосигнала;
устройство оценивателя шума, выполненное с возможностью определения первого спектра шума выходного аудиосигнала, основываясь на спектре выходного аудиосигнала, обеспечиваемого спектральным преобразователем, в котором первый спектр шума выходного аудиосигнала имеет более высокое спектральное разрешение, чем спектр фонового шума, обеспечиваемый декодером дескриптора вставки молчания;
преобразователь разрешения, выполненный с возможностью установления второго спектра шума выходного аудиосигнала, основываясь на первом спектре шума выходного аудиосигнала, в котором второй спектр шума выходного аудиосигнала имеет такое же спектральное разрешение, что и спектр фонового шума, обеспечиваемый декодером дескриптора вставки молчания;
устройство оценки спектра комфортного шума, имеющее устройство вычисления масштабных коэффициентов, выполненное с возможностью вычисления масштабных коэффициентов для спектра для комфортного шума, основываясь на спектре фонового шума, обеспечиваемом декодером дескриптора вставки молчания, и основываясь на втором спектре шума выходного аудиосигнала, обеспечиваемом преобразователем разрешения, и имеющее генератор спектра комфортного шума, выполненный с возможностью вычисления спектра для комфортного шума, основываясь на масштабных коэффициентах; и
генератор комфортного шума, выполненный с возможностью получения комфортного шума во время неактивной фазы, основываясь на спектре для комфортного шума.
Битовый поток содержит активные фазы и неактивные фазы, в котором активная фаза представляет собой фазу, которая содержит полезные компоненты аудиоинформации, такой как речь или музыка, тогда как неактивная фаза представляет собой фазу, которая не содержит никаких полезных компонентов аудиоинформации. Неактивные фазы обычно происходят во время пауз, когда не присутствуют полезные компоненты, такие как музыка или речь. Поэтому, неактивные фазы обычно содержат только фоновый шум. Информация в битовом потоке, содержащем кодированный аудиосигнал, вставляется в так называемые кадры, причем каждый из этих кадров содержит аудиоинформацию, ссылающуюся на некоторый момент времени. Во время активных фаз активные кадры, содержащие аудиоинформацию, включающую в себя аудиоинформацию, касающуюся полезного сигнала, могут передаваться в битовом потоке. В противоположность этому, во время неактивных фаз кадры дескриптора вставки молчания, содержащие информацию о шуме, могут передаваться в битовом потоке с меньшей средней скоростью передачи в битах по сравнению со средней скоростью передачи в битах активных фаз.
Декодер дескриптора вставки молчания выполнен с возможностью декодирования кадров дескриптора вставки молчания для восстановления спектра фонового шума. Однако этот спектр фонового шума не позволяет захватывать структуру спектра высокого разрешения фонового шума из-за ограниченного количества параметров, передаваемых в кадрах дескриптора вставки молчания.
Устройством декодирования может быть устройство или компьютерная программа, способные декодировать битовый поток аудио, который представляет собой поток цифровых данных, содержащий аудиоинформацию, во время активных фаз. Процесс декодирования может приводить к цифровому декодированному выходному аудиосигналу, который может подаваться на цифроаналоговый (D/A) преобразователь для получения аналогового аудиосигнала, который затем может подаваться на громкоговоритель для получения звукового сигнала.
Спектральный преобразователь может получать спектр выходного аудиосигнала, который имеет существенно более высокое спектральное разрешение, чем спектр фонового шума, обеспечиваемый декодером дескриптора вставки молчания.
Поэтому, оцениватель шума может определять первый спектр шума выходного аудиосигнала, основываясь на спектре выходного аудиосигнала, обеспечиваемом спектральным преобразователем, в котором первый спектр шума выходного аудиосигнала имеет более высокое спектральное разрешение, чем спектр фонового шума, обеспечиваемый декодером дескриптора вставки молчания.
Кроме того, преобразователь разрешения может устанавливать второй спектр шума выходного аудиосигнала, основываясь на первом спектре шума выходного аудиосигнала, в котором второй спектр шума выходного аудиосигнала имеет такое же спектральное разрешение, что и спектр фонового шума, обеспечиваемый декодером дескриптора вставки молчания.
Устройство вычисления масштабных коэффициентов может легко вычислять масштабные коэффициенты для спектра для комфортного шума, основываясь на спектре фонового шума, обеспечиваемом декодером дескриптора вставки молчания, и основываясь на втором спектре шума выходного аудиосигнала, обеспечиваемом преобразователем разрешения, так как спектр фонового шума, обеспечиваемый декодером дескриптора вставки молчания, и второй спектр шума выходного аудиосигнала имеют одинаковое спектральное разрешение.
Генератор спектра комфортного шума может устанавливать спектр для комфортного шума, основываясь на масштабных коэффициентах и основываясь на первом спектре шума выходного аудиосигнала, обеспечиваемом устройством оценки шума.
Кроме того, генератор комфортного шума может получать комфортный шум во время неактивной фазы, основываясь на спектре комфортного шума.
Оценки шума, полученные на декодере, содержат информацию о спектральной структуре фонового шума, которая является более точной, чем информация о гладкой спектральной огибающей фонового шума, содержащейся в кадрах SID. Однако эти оценки не могут обновляться во время неактивных фаз, так как оценка шума выполняется над декодированным выходным аудиосигналом во время активных фаз. В противоположность этому, кадры SID доставляют новую информацию о спектральной огибающей во время неактивных фаз. Декодер согласно изобретению объединяет эти два источника информации. Масштабные коэффициенты могут обновляться во время активных фаз в зависимости от оценок шума на стороне декодера и во время неактивных фаз в зависимости от оценок шума, содержащихся в кадрах SID. Непрерывное обновление масштабных коэффициентов гарантирует, что нет внезапных изменений характеристик получаемого комфортного шума.
Так как спектр фонового шума, содержащийся в кадрах SID, и второй спектр шума выходного аудиосигнала имеют одинаковое спектральное разрешение, обновление масштабных коэффициентов и, следовательно, комфортного шума может легко выполняться, так как для каждой группы частотных полос спектра фонового шума, содержащегося в кадрах SID, существует точно одна группа частотных полос во втором спектре шума выходного аудиосигнала. Необходимо отметить, что в предпочтительном варианте осуществления группы частотных полос спектра фонового шума, содержащегося в кадрах SID, и группы частотных полос второго спектра шума выходного аудиосигнала соответствуют друг другу.
Кроме того, так как спектр фонового шума, содержащийся в кадрах SID, и второй спектр шума выходного аудиосигнала имеют одинаковое спектральное разрешение, обновление масштабных коэффициентов не создает или создает только едва слышимые помехи.
Согласно предпочтительному варианту осуществления изобретения спектральный анализатор содержит устройство быстрого преобразования Фурье. Быстрое преобразование Фурье (FFT) представляет собой алгоритм для вычисления дискретного преобразования Фурье (DFT), и его обратного преобразования, который требует только низких вычислительных затрат. Поэтому, устройство быстрого преобразования Фурье может легко вычислять спектр выходного аудиосигнала.
Согласно предпочтительному варианту осуществления изобретения устройство оценивателя шума в декодере содержит устройство преобразователя, выполненное с возможностью преобразования спектра выходного аудиосигнала в преобразованный спектр выходного аудиосигнала, который, в основном, имеет значительно меньшее спектральное разрешение. Посредством обеспечения преобразованного спектра выходного аудиосигнала может уменьшаться сложность последующих вычислительных этапов.
Согласно предпочтительному варианту осуществления изобретения устройство оценивателя шума содержит оцениватель шума, выполненный с возможностью определения первого спектра шума выходного аудиосигнала, основываясь на преобразованном спектре выходного аудиосигнала, обеспечиваемом устройством преобразователя. Когда преобразованный спектр выходного аудиосигнала используется в качестве основы для оценки шума в декодере, вычислительные затраты могут уменьшаться без снижения качества оценки шума.
Согласно предпочтительному варианту осуществления изобретения устройство вычисления масштабных коэффициентов выполнено с возможностью вычисления масштабных коэффициентов по формуле
Figure 00000001
, в которой
Figure 00000002
обозначает масштабный коэффициент для группы i частотных полос комфортного шума, в которой
Figure 00000003
обозначает уровень группы i частотных полос спектра фонового шума, содержащегося в кадрах SID, в которой
Figure 00000004
обозначает уровень группы i частотных полос второго спектра шума выходного аудиосигнала, в которой i=0, …, LLR-1, в которой LLR представляет собой количество групп частотных полос спектра фонового шума, содержащегося в кадрах SID, и второго спектра шума выходного аудиосигнала. Посредством этих признаков могут легко вычисляться масштабные коэффициенты.
Согласно предпочтительному варианту осуществления изобретения генератор спектра комфортного шума выполнен с возможностью вычисления спектра комфортного шума, основываясь на масштабных коэффициентах и основываясь на первом спектре шума выходного аудиосигнала, обеспечиваемом устройством оценки шума. Посредством этих признаков спектр комфортного шума может вычисляться таким образом, что он имеет спектральное разрешение первого спектра шума выходного аудиосигнала, которое, в основном, значительно выше спектрального разрешения, полученного из кадров SID.
Согласно предпочтительному варианту осуществления изобретения генератор спектра комфортного шума выполнен с возможностью вычисления спектра комфортного шума по формуле
Figure 00000005
, в которой
Figure 00000006
обозначает уровень частотной полосы k спектра комфортного шума, в которой
Figure 00000007
обозначает масштабный коэффициент группы i частотных полос спектра фонового шума, содержащегося в кадрах SID, и второго спектра шума выходного аудиосигнала, в которой
Figure 00000008
обозначает уровень частотной полосы k первого спектра шума выходного аудиосигнала, в которой k=bLR(i), …, bLR(i+1)-1, в которой bLR(i) представляет собой первую частотную полосу одной из групп частотных полос, в которой i=0, …, LLR-1, в которой LLR представляет собой количество групп частотных полос спектра фонового шума, содержащегося в кадрах SID, и второго спектра шума выходного аудиосигнала. Посредством этих признаков спектр комфортного шума может легко вычисляться с высоким разрешением.
Согласно предпочтительному варианту осуществления изобретения преобразователь разрешения содержит первую ступень преобразователя, выполненную с возможностью установления третьего спектра шума выходного аудиосигнала, основываясь на первом спектре шума выходного аудиосигнала, в котором спектральное разрешение третьего спектра шума выходного аудиосигнала выше или такое же, что и спектральное разрешение первого спектра шума выходного аудиосигнала, и в котором преобразователь разрешения содержит вторую ступень преобразователя, выполненную с возможностью установления второго спектра шума выходного аудиосигнала.
Согласно предпочтительному варианту осуществления изобретения генератор спектра комфортного шума выполнен с возможностью вычисления спектра комфортного шума, основываясь на масштабных коэффициентах и основываясь на третьем спектре шума выходного аудиосигнала, обеспечиваемом первой ступенью преобразователя в преобразователе разрешения. Посредством этих признаков спектр комфортного шума может быть получен во время неактивных фаз, который имеет более высокое спектральное разрешение, чем спектральное разрешение первого спектра шума выходного аудиосигнала во время активных фаз.
Согласно предпочтительному варианту осуществления изобретения генератор спектра комфортного шума выполнен с возможностью вычисления спектра комфортного шума по формуле
Figure 00000009
, в которой
Figure 00000006
обозначает уровень частотной полосы k спектра комфортного шума, в которой
Figure 00000007
обозначает масштабный коэффициент группы i частотных полос спектра фонового шума, содержащегося в кадрах SID, и второго спектра шума выходного аудиосигнала, в которой
Figure 00000010
обозначает уровень частотной полосы k третьего спектра шума выходного аудиосигнала, в которой k=bLR(i), …, bLR(i+1)-1, в которой bLR(i) представляет собой первую частотную полосу группы частотных полос, в которой i=0, …, LLR-1, в которой LLR представляет собой количество групп частотных полос спектра фонового шума, содержащегося в кадрах SID, и второго спектра шума выходного аудиосигнала. Посредством этих признаков спектр комфортного шума может легко вычисляться с высоким разрешением.
Согласно предпочтительному варианту осуществления изобретения генератор комфортного шума содержит первый быстрый преобразователь Фурье, выполненный с возможностью регулировки уровней частотных полос комфортного шума в области быстрого преобразования Фурье, и второй быстрый преобразователь Фурье для получения по меньшей мере части комфортного шума, основываясь на выходном сигнале первого быстрого преобразователя Фурье. Посредством этих признаков может легко получаться фоновый шум.
Согласно предпочтительному варианту осуществления изобретения устройство декодирования содержит основной декодер, выполненный с возможностью получения выходного аудиосигнала во время активной фазы. Посредством этих признаков может достигаться простая конструкция декодера, который подходит для узкополосных (NB) и широкополосных (WB) применений.
Согласно предпочтительному варианту осуществления изобретения устройство декодирования содержит основной декодер, выполненный с возможностью получения аудиосигнала, и модуль расширения полосы частот, выполненный с возможностью получения выходного аудиосигнала, основываясь на аудиосигнале, обеспечиваемом основным декодером. Посредством этих признаков может достигаться простая конструкция декодера, который пригоден для суперширокополосных (SWB) применений.
Согласно предпочтительному варианту осуществления изобретения модуль расширения полосы частот содержит декодер копирования спектральной полосы, анализатор квадратурного зеркального фильтра и/или синтезатор квадратурного зеркального фильтра.
Согласно предпочтительному варианту осуществления изобретения комфортный шум, обеспечиваемый быстрым преобразователем Фурье, подается на модуль расширения полосы частот. Посредством этого признака комфортный шум, обеспечиваемый быстрым преобразователем Фурье, может преобразовываться в комфортный шум с большей полосой частот.
Согласно предпочтительному варианту осуществления изобретения генератор комфортного шума содержит устройство регулятора квадратурного зеркального фильтра, выполненное с возможностью регулировки уровней частотных полос комфортного шума в области квадратурного зеркального фильтра, причем выходной сигнал синтезатора квадратурного зеркального фильтра подается на модуль расширения полосы частот. Посредством этих признаков информация о шуме, передаваемая кадрами дескриптора вставки молчания, относящимися к частотам шума выше полосы частот основного декодера, может использоваться для дополнительного улучшения комфортного шума.
В другом аспекте изобретение относится к системе, содержащей декодер и кодер, в которой декодер разработан согласно изобретению.
В другом аспекте изобретение относится к способу декодирования битового потока аудио для получения из него выходного аудиосигнала, причем битовый поток содержит по меньшей мере активную фазу, за которой следует по меньшей мере неактивная фаза, в котором битовый поток имеет кодированный в нем по меньшей мере кадр дескриптора вставки молчания, который описывает спектр фонового шума, причем способ содержит этапы:
декодирования кадра дескриптора вставки молчания для восстановления спектра фонового шума;
восстановления выходного аудиосигнала из битового потока во время активной фазы;
определения спектра выходного аудиосигнала;
определения первого спектра шума выходного аудиосигнала, основываясь на спектре выходного аудиосигнала, в котором первый спектр шума выходного аудиосигнала имеет более высокое спектральное разрешение, чем спектр фонового шума, обеспечиваемый декодером дескриптора вставки молчания;
установления второго спектра шума выходного аудиосигнала, основываясь на первом спектре шума выходного аудиосигнала, в котором второй спектр шума выходного аудиосигнала имеет такое же спектральное разрешение, что и спектр фонового шума, обеспечиваемый декодером дескриптора вставки молчания;
вычисления масштабных коэффициентов для спектра для комфортного шума, основываясь на спектре фонового шума, обеспечиваемом декодером дескриптора вставки молчания, и основываясь на втором спектре шума выходного аудиосигнала; и
получения комфортного шума во время неактивной фазы, основываясь на спектре комфортного шума.
В другом аспекте изобретение относится к компьютерной программе для выполнения, при выполнении на компьютере или процессоре, обладающими признаками изобретения способа.
Предпочтительные варианты осуществления изобретения ниже описываются в отношении прилагаемых чертежей, на которых:
фиг. 1 иллюстрирует первый вариант осуществления декодера согласно изобретению;
фиг. 2 иллюстрирует второй вариант осуществления декодера согласно изобретению;
фиг. 3 иллюстрирует третий вариант осуществления декодера согласно изобретению;
фиг. 4 иллюстрирует первый вариант осуществления кодера, пригодного для обладающей признаками изобретения системы; и
фиг. 5 иллюстрирует второй вариант осуществления кодера, пригодного для обладающей признаками изобретения системы.
Фиг. 1 иллюстрирует первый вариант осуществления декодера 1 согласно изобретению. Аудиодекодер 1, изображенный на фиг. 1, выполнен с возможностью декодирования битового потока BS для получения из него выходного аудиосигнала OS, причем битовый поток BS содержит по меньшей мере активную фазу, за которой следует по меньшей мере неактивная фаза, в котором битовый поток BS имеет кодированный в нем по меньшей мере кадр SI дескриптора вставки молчания, который описывает спектр SBN фонового шума, причем аудиодекодер 1 содержит:
устройство 2 декодирования, выполненное с возможностью восстановления выходного аудиосигнала OS из битового потока BS во время активной фазы;
декодер 3 дескриптора вставки молчания, выполненный с возможностью декодирования кадра SI дескриптора вставки молчания для восстановления спектра SBN фонового шума;
спектральный преобразователь 4, выполненный с возможностью определения спектра SAS выходного аудиосигнала OS;
устройство 5 оценивателя шума, выполненное с возможностью определения первого спектра SN1 шума выходного аудиосигнала OS, основываясь на спектре SAS выходного аудиосигнала AS, обеспечиваемом спектральным преобразователем 4, в котором первый спектр SN1 шума выходного аудиосигнала OS имеет более высокое спектральное разрешение, чем спектр SBN фонового шума;
преобразователь 6 разрешения, выполненный с возможностью установления второго спектра SN2 шума выходного аудиосигнала OS, основываясь на первом спектре SN1 шума выходного аудиосигнала OS, в котором второй спектр SN2 шума выходного аудиосигнала OS имеет такое же спектральное разрешение, что и спектр SBN фонового шума;
устройство 7 оценки спектра комфортного шума, имеющее устройство 7a вычисления масштабных коэффициентов, выполненное с возможностью вычисления масштабных коэффициентов SF для спектра SCN для комфортного шума CN, основываясь на спектре SBN фонового шума, обеспечиваемом декодером 3 дескриптора вставки молчания, и основываясь на втором спектре SN2 шума выходного аудиосигнала OS, обеспечиваемом преобразователем 6 разрешения, и имеющее генератор 7b спектра комфортного шума, выполненный с возможностью вычисления спектра SCN для комфортного шума CN, основываясь на масштабных коэффициентах SF; и
генератор 8 комфортного шума, выполненный с возможностью получения комфортного шума CN во время неактивной фазы, основываясь на спектре SCN для комфортного шума CN.
Битовый поток BS содержит активные фазы и неактивные фазы, причем активная фаза представляет собой фазу, которая содержит полезные компоненты аудиоинформации, такие как речь или музыку, тогда как неактивная фаза представляет собой фазу, которая не содержит никаких полезных компонентов аудиоинформации.
Неактивные фазы обычно происходят во время пауз, где не присутствуют полезные компоненты, такие как музыка или речь. Поэтому, неактивные фазы обычно содержат исключительно фоновый шум. Информация в битовом потоке BS, содержащем кодированный аудиосигнал, встраивается в так называемые кадры, причем каждый из этих кадров содержит аудиоинформацию, ссылающуюся на некоторый момент времени. Во время активных фаз кадры, содержащие аудиоинформацию, включающую в себя аудиоинформацию, касающуюся полезного сигнала, могут передаваться в битовом потоке BS. В противоположность этому, во время неактивных фаз кадры SI дескриптора вставки молчания, содержащие информацию о шуме, могут передаваться в битовом потоке с меньшей средней скоростью передачи в битах по сравнению со средней скоростью передачи в битах активных фаз.
Устройство 2 декодирования может представлять собой устройство или компьютерную программу, способную декодировать битовой поток BS аудио, который представляет собой поток цифровых данных, содержащий аудиоинформацию, во время активных фаз. Процесс декодирования может приводить к цифровому декодированному выходному аудиосигналу OS, который может подаваться на D/A-преобразователь для получения аналогового аудиосигнала, который затем может подаваться на громкоговоритель для получения звукового сигнала.
Декодер 3 дескриптора вставки молчания выполнен с возможностью декодирования кадров SI дескриптора вставки молчания для восстановления спектра SBN фонового шума. Однако спектр SBN фонового шума не позволяет захватывать структуру спектра высокого разрешения фонового шума из-за ограниченного количества параметров, передаваемых в кадрах SI дескриптора вставки молчания.
Спектральный преобразователь 4 может получать спектр SAS выходного аудиосигнала OS, который имеет существенно более высокое спектральное разрешение, чем спектр SBN фонового шума, обеспечиваемый декодером 3 дескриптора вставки молчания.
Поэтому, оцениватель 10 шума может определять первый спектр SN1 шума выходного аудиосигнала OS, основываясь на спектре SAS выходного аудиосигнала OS, обеспечиваемом спектральным преобразователем 4, причем первый спектр SN1 шума выходного аудиосигнала OS имеет более высокое спектральное разрешение, чем спектр фонового шума SBN.
Кроме того, преобразователь 6 разрешения может устанавливать второй спектр SN2 шума выходного аудиосигнала OS, основываясь на первом спектре SN1 шума выходного аудиосигнала OS, причем второй спектр SN2 шума выходного аудиосигнала OS имеет такое же спектральное разрешение, что и спектр фонового шума SBN.
Устройство 7a вычисления масштабных коэффициентов может легко вычислять масштабные коэффициенты SF для спектра SCN для комфортного шума CN, основываясь на спектре SBN фонового шума, обеспечиваемом декодером 3 дескриптора вставки молчания, и основываясь на втором спектре SN2 шума выходного аудиосигнала OS, обеспечиваемом преобразователем 6 разрешения, так как спектр SBN фонового шума и второй спектр SN2 шума выходного аудиосигнала OS имеют одинаковое спектральное разрешение.
Генератор 7b спектра комфортного шума может устанавливать спектр SCN для комфортного шума CN, основываясь на масштабных коэффициентах SF.
Кроме того, генератор 8 комфортного шума может получать комфортный шум CN во время неактивной фазы, основываясь на спектре SCN для комфортного шума.
Оценки шума, полученные в декодере 1, содержат информацию о спектральной структуре фонового шума, которая более точная, чем информация о спектральной структуре фонового шума, содержащаяся в кадрах SI SID. Однако эти оценки не могут адаптироваться во время неактивных фаз, так как оценка шума выполняется по декодированному выходному аудиосигналу OS. В противоположность этому, кадры SID доставляют новую информацию о спектральной огибающей с регулярными интервалами во время неактивных фаз. Декодер 1 согласно изобретению объединяет эти два источника информации. Масштабные коэффициенты SF могут обновляться во время активных фаз в зависимости от оценок шума на стороне декодера и во время неактивных фаз в зависимости от оценок шума, содержащихся в кадрах SI SID. Непрерывное обновление масштабных коэффициентов SF гарантирует, что нет внезапных изменений характеристик получаемого комфортного шума CN.
Так как спектр SBN фонового шума, содержащийся в кадрах SI SID, и второй спектр SN2 шума выходного аудиосигнала OS имеют одинаковое спектральное разрешение, обновление масштабных коэффициентов SF и, следовательно, комфортного шума CN может легко выполняться, так как для каждой группы частотных полос спектра SBN фонового шума, содержащегося в кадрах SI SID, точно одна группа частотных полос существует во втором спектре SN2 шума выходного аудиосигнала OS. Необходимо отметить, что в предпочтительном варианте осуществления группы частотных полос спектра фонового шума, содержащегося в кадрах SI SID, и группы частотных полос второго спектра SN2 шума выходного аудиосигнала OS соответствуют друг другу.
Кроме того, так как спектр SBN фонового шума, содержащийся в кадрах SI SID, и второй спектр SN2 шума выходного аудиосигнала OS имеют одинаковое спектральное разрешение, обновление масштабных коэффициентов SF не создает или создает только едва слышимые помехи.
Согласно предпочтительному варианту осуществления изобретения спектральный анализатор 4 содержит устройство быстрого преобразования Фурье. Быстрое преобразование Фурье (FFT) представляет собой алгоритм для вычисления дискретного преобразования Фурье (DFT), и его обратного преобразования, который требует только низких вычислительных затрат. Поэтому, устройство быстрого преобразования Фурье может легко вычислять спектр SAS выходного аудиосигнала OS.
Согласно предпочтительному варианту осуществления изобретения устройство 5 оценивателя шума содержит устройство 9 преобразователя, выполненное с возможностью преобразования спектра SAS выходного аудиосигнала OS в преобразованный спектр CSA выходного аудиосигнала OS, который имеет такое же спектральное разрешение, что и основной декодер 17. Как правило, спектральное разрешение спектра SAS выходного аудиосигнала OS, полученного спектральным преобразователем 4, значительно выше, чем спектральное разрешение основного декодера 17. Посредством обеспечения преобразованного спектра CSA выходного аудиосигнала OS может уменьшаться сложность последующих вычислительных этапов.
Согласно предпочтительному варианту осуществления изобретения устройство 5 оценивателя шума содержит оцениватель 10 шума, выполненный с возможностью определения первого спектра SN1 шума выходного аудиосигнала OS, основываясь на преобразованном спектре CAS выходного аудиосигнала OS, обеспечиваемом устройством 9 преобразователя. Когда преобразованный спектр CSA выходного аудиосигнала OS используется в качестве основы для оценки шума в декодере, вычислительные затраты могут уменьшаться без снижения качества оценки шума.
Согласно предпочтительному варианту осуществления изобретения устройство 7a вычисления масштабных коэффициентов выполнено с возможностью вычисления масштабных коэффициентов SF по формуле
Figure 00000001
, в которой
Figure 00000002
обозначает масштабный коэффициент SF для группы i частотных полос комфортного шума CN, в которой
Figure 00000003
обозначает уровень группы i частотных полос спектра SBN фонового шума, в которой
Figure 00000004
обозначает уровень группы i частотных полос второго спектра SN2 шума выходного аудиосигнала, в которой i=0, …, LLR-1, в которой LLR представляет собой количество групп частотных полос спектра SBN фонового шума, и второго спектра SN2 шума выходного аудиосигнала OS. Посредством этих признаков могут легко вычисляться масштабные коэффициенты SF.
Согласно предпочтительному варианту осуществления изобретения генератор 7b спектра комфортного шума выполнен с возможностью вычисления спектра SCN комфортного шума CN, основываясь на масштабных коэффициентах SF и основываясь на первом спектре SN1 шума выходного аудиосигнала OS, обеспечиваемом устройством 5 оценки шума. Посредством этих признаков спектр SCN комфортного шума может вычисляться таким образом, что он имеет спектральное разрешение первого спектра SN1 шума выходного аудиосигнала OS.
Согласно предпочтительному варианту осуществления изобретения генератор 7b спектра комфортного шума выполнен с возможностью вычисления спектра SCN комфортного шума CN по формуле
Figure 00000005
, в которой
Figure 00000006
обозначает уровень частотной полосы k спектра SCN комфортного шума CN, в которой
Figure 00000007
обозначает масштабный коэффициент SF группы i частотных полос спектра SBN фонового шума и второго спектра SN2 шума выходного аудиосигнала OS, в которой
Figure 00000008
обозначает уровень частотной полосы k первого спектра SN1 шума выходного аудиосигнала OS, в которой k=bLR(i), …, bLR(i+1)-1, в которой bLR(i) представляет собой первую частотную полосу одной из групп частотных полос, в которой i=0, …, LLR-1, в которой LLR представляет собой количество групп частотных полос спектра SBN фонового шума и второго спектра SN2 шума выходного аудиосигнала. Посредством этих признаков спектр SCN комфортного шума CN может легко вычисляться с высоким разрешением.
Согласно предпочтительному варианту осуществления изобретения преобразователь 6 разрешения содержит первую ступень 11 преобразователя, выполненную с возможностью установления третьего спектра SN3 шума выходного аудиосигнала OS, основываясь на первом спектре SN1 шума выходного аудиосигнала OS, в котором спектральное разрешение третьего спектра SN3 шума выходного аудиосигнала OS такое же или выше спектрального разрешения первого спектра SN1 шума выходного аудиосигнала OS, и в котором преобразователь 6 разрешения содержит вторую ступень 12 преобразователя, выполненную с возможностью установления второго спектра SN2 шума выходного аудиосигнала OS.
Согласно предпочтительному варианту осуществления изобретения генератор 7b спектра комфортного шума выполнен с возможностью вычисления спектра SCN комфортного шума CN, основываясь на масштабных коэффициентах SF и основываясь на третьем спектре SN3 шума выходного аудиосигнала OS, обеспечиваемом первой ступенью 11 преобразователя в преобразователе 6 разрешения. Посредством этих признаков может быть получен спектр SCN комфортного шума, который имеет более высокое спектральное разрешение, чем спектр SBN фонового шума, обеспечиваемый декодером 3 дескриптора вставки молчания.
Согласно предпочтительному варианту осуществления изобретения генератор 7b спектра комфортного шума выполнен с возможностью вычисления спектра SCN комфортного шума по формуле
Figure 00000009
, в которой
Figure 00000006
обозначает уровень частотной полосы k спектра SCN комфортного шума CN, в которой
Figure 00000007
обозначает масштабный коэффициент SF группы i частотных полос спектра SCN фонового шума и второго спектра SN2 шума выходного аудиосигнала OS, в которой
Figure 00000010
обозначает уровень частотной полосы k третьего спектра SN3 шума выходного аудиосигнала OS, в которой k=bLR(i), …, bLR(i+1)-1, в которой bLR(i) представляет собой первую частотную полосу группы частотных полос, в которой i=0, …, LLR-1, в которой LLR представляет собой количество групп частотных полос спектра SBN фонового шума и второго спектра SN2 шума выходного аудиосигнала OS. Посредством этих признаков спектр SCN комфортного шума может легко вычисляться с высоким разрешением.
Согласно предпочтительному варианту осуществления изобретения генератор 8 комфортного шума содержит первый быстрый преобразователь 15 Фурье, выполненный с возможностью регулировки уровней частотных полос комфортного шума CN в области быстрого преобразования Фурье, и второй быстрый преобразователь 16 Фурье для получения по меньшей мере части комфортного шума CN, основываясь на выходном сигнале первого быстрого преобразователя 15 Фурье. Посредством этих признаков может легко получаться комфортный шум.
Согласно предпочтительному варианту осуществления изобретения устройство 2 декодирования содержит основной декодер 17, выполненный с возможностью получения выходного аудиосигнала OS во время активной фазы. Посредством этих признаков может достигаться простая конструкция декодера, который подходит для узкополосных (NB) и широкополосных (WB) применений.
Согласно предпочтительному варианту осуществления изобретения аудиодекодер 1 содержит устройство 18 считывания заголовка, которое выполнено с возможностью различения активных фаз и неактивных фаз. Устройство 18 считывания заголовка дополнительно выполнено с возможностью переключения устройства 19 переключения таким образом, что битовый поток BS во время активных фаз подается на основной декодер 17, и что кадры дескриптора вставки молчания во время неактивных фаз подаются на декодер 3 дескриптора вставки молчания. Следовательно, флаг неактивной фазы передается на генератор 8 фонового шума, так что может запускаться генерирование комфортного шума CN.
Фиг. 2 иллюстрирует второй вариант осуществления аудиодекодера 1 согласно изобретению. Декодер, изображенный на фиг. 2, основывается на декодере 1 по фиг. 1. Ниже объясняются только различия. Аудиодекодер 1 второго варианта осуществления изобретения содержит модуль 20 расширения полосы частот, на который подается выходной сигнал основного декодера 17. Модуль 20 расширения полосы частот выполнен с возможностью получения выходного сигнала EOS с расширенной полосой частот, основываясь на выходном аудиосигнале OS. Посредством этих признаков может достигаться простая конструкция декодера 1, который пригоден для суперширокополосных (SWB) применений.
Согласно предпочтительному варианту осуществления изобретения комфортный шум CN, обеспечиваемый быстрым преобразователем 16 Фурье, подается на модуль 20 расширения полосы частот. Посредством этого признака комфортный шум CN, обеспечиваемый быстрым преобразователем 16 Фурье, может преобразовываться в комфортный шум CN с большей полосой частот.
Согласно предпочтительному варианту осуществления изобретения генератор 8 комфортного шума содержит устройство 24 регулятора квадратурного зеркального фильтра, выполненное с возможностью регулировки уровней частотных полос комфортного шума CN в области квадратурного зеркального фильтра, причем выходной сигнал синтезатора 24 квадратурного зеркального фильтра подается на модуль 20 расширения полосы частот в качестве дополнительного комфортного шума CN’. Уровни квадратурного зеркального фильтра (QMF), содержащиеся в кадрах SI дескриптора вставки молчания, могут подаваться на устройство 24 синтезатора квадратурного зеркального фильтра. Посредством этих признаков информация о шуме, передаваемая кадрами SI дескриптора вставки молчания, относящаяся к частотам шума выше полосы частот основного декодера 17, может использоваться для дополнительного улучшения комфортного шума CN.
Согласно предпочтительному варианту осуществления изобретения модуль 20 расширения полосы частот содержит декодер 21 копирования спектральной полосы, анализатор 22 квадратурного зеркального фильтра и/или синтезатор 23 квадратурного зеркального фильтра.
Фиг. 3 иллюстрирует третий вариант осуществления декодера 1 согласно изобретению. Декодер 1 по фиг. 3 основывается на декодере 1 по фиг. 2. В нижеследующем описываются только различия.
Согласно предпочтительному варианту осуществления изобретения устройство 2 декодирования содержит основной декодер 17, выполненный с возможностью получения аудиосигнала AS, и модуль 20 расширения полосы частот, выполненный с возможностью получения выходного аудиосигнала OS, основываясь на аудиосигнале AS, обеспечиваемом основным декодером 17. Посредством этих признаков может достигаться простая конструкция декодера, который пригоден для суперширокополосных (SWB) применений.
В принципе, модуль 20 расширения полосы частот по фиг. 3 является таким же, что и модуль 20 расширения полосы частот по фиг. 2. Однако в третьем варианте осуществления аудиодекодера 1 согласно изобретению модуль 20 расширения полосы частот используется для получения выходного аудиосигнала OS, который подается на спектральный преобразователь 4. Посредством этих признаков вся полоса частот может использоваться для получения комфортного шума.
Что касается трех вариантов осуществлении аудиодекодера согласно изобретению, то можно добавить: На стороне декодера случайный генератор 8 может применяться для возбуждения каждой индивидуальной спектральной полосы в области FFT, а также в области QMF для режимов SWB. Амплитуда случайных последовательностей должна индивидуально вычисляться в каждой полосе, так что спектр генерируемого комфортного шума CN имеет сходство со спектром фактического фонового шума, присутствующего в битовом потоке.
Оценки шума с высоким разрешением, полученные в декодере 1, захватывают информацию о структуре спектра высокого разрешения фонового шума. Однако эти оценки не могут адаптироваться во время неактивных фаз, так как оценка шума выполняется по декодированному сигналу OS. В противоположность этому, кадры SI SID доставляют новую информацию о спектральной огибающей с регулярными интервалами во время неактивных фаз. Настоящий декодер 1 объединяет эти два источника информации в попытке воспроизведения структуры спектра высокого разрешения, захваченной из фонового шума, присутствующего во время активных фаз, в то же время обновляя только спектральную огибающую комфортного шума CN во время неактивных частей при помощи информации SID.
Для достижения этой цели дополнительный оцениватель 5 шума используется в декодере 1, как показано на фиг. 1-3. Следовательно, оценка шума выполняется на обеих сторонах системы передачи, но применяя более высокое спектральное разрешение в декодере 1, чем в кодере 100. Одним путем получения высокого спектрального разрешения в декодере 1 является просто принятие во внимание индивидуально каждой спектральной полосы (полное разрешение) вместо группирования их посредством усреднения подобно кодеру 100. Альтернативно, может быть получен компромисс между спектральным разрешением и вычислительной сложностью посредством выполнения группирования спектра также в декодере 1, но, используя увеличенное количество спектральных групп по сравнению с кодером 100, получая, таким образом, квантование с меньшим шагом оси частот в декодере.
Отметьте, что оценка шума на стороне декодера работает по декодированному сигналу OS. В системе на основе DTX она должна, поэтому, быть способна работать только во время активных фаз, т.е. обязательно над содержимым с чистой речью или речью с шумами (в противоположность только шуму).
Энергетический спектр
Figure 00000011
шума с высоким разрешением (HR), вычисленный в декодере, может сначала интерполироваться (например, используя линейную интерполяцию) для получения энергетического спектра
Figure 00000012
с полным разрешением (FR). Он затем может преобразовываться в энергетический спектр
Figure 00000013
с низким разрешением (LR) посредством спектрального группирования (т.е. усреднения), как это делается в кодере. Энергетический спектр
Figure 00000013
проявляет, поэтому, такое же спектральное разрешение, что и уровни
Figure 00000014
шума, полученные из кадров SI SID. Сравнивая спектры
Figure 00000013
и
Figure 00000015
шума с низким разрешением, спектр
Figure 00000016
шума с полным разрешением может, в конечном счете, масштабироваться для получения энергетического спектра с полным разрешением следующим образом:
Figure 00000017
где LLR представляет собой количество спектральных групп, используемых оценкой шума с низким разрешением в кодере, и bLR(i) обозначает первую спектральную полосу i-ой спектральной группы, i=0, …, LLR-1. Энергетический спектр
Figure 00000018
шума с полным разрешением может, в конечном счете, использоваться для точной регулировки уровня комфортного шума, генерируемого в каждой индивидуальной полосе FFT или QMF (последний только для режимов SWB).
На фиг. 1 и 2 вышеприведенный механизм применяется только к коэффициентам FFT. Следовательно, для систем SWB он не применяется в полосах QMF, захватывающих высокочастотное содержимое, отбрасываемое основным уровнем. Так как эти частоты с учетом восприятия являются менее существенными, является, как правило, достаточным воспроизведение плавной спектральной огибающей шума для этих частот.
Чтобы регулировать уровень комфортного шума, применяемого в области QMF для частот, которые находятся выше полосы частот основного уровня в режимах SWB, система основывается исключительно на информации, передаваемой кадрами SID. Модуль SBR, таким образом, обходится, когда VAD запускает кадр CNG. В режимах WB модуль CNG не учитывает полосы QMF, так как применяется слепое расширение полосы частот для восстановления требуемой полосы частот.
Тем не менее, схема легко может быть расширена для охвата всей полосы частот посредством применения оценивателя шума на стороне декодера на выходе модуля расширения полосы частот вместо применения ее на выходе основного декодера. Это расширение, как показано на фиг. 3, вызывает повышение вычислительной сложности, так как также должны учитываться высокие частоты, захватываемые блоком фильтров QMF.
Фиг. 4 иллюстрирует первый вариант осуществления кодера 100, пригодного для обладающей признаками изобретения системы. Входной аудиосигнал IS подается на первый спектральный преобразователь 25, выполненный с возможностью пересылки этого сигнала IS временной области в частотную область. Первый спектральный преобразователь 25 может представлять собой анализатор квадратурного зеркального фильтра. Выходной сигнал первого спектрального преобразователя 25 подается на второй спектральный преобразователь 26, который выполнен с возможностью пересылки выходного сигнала первого спектрального преобразователя 25 в область. Второй спектральный преобразователь 26 может представлять собой синтезатор квадратурного зеркального фильтра. Выходной сигнал второго спектрального преобразователя 26 подается на третий спектральный преобразователь 27, которым может быть устройство быстрого преобразования Фурье. Выходной сигнал третьего спектрального преобразователя 27 подается на устройство 28 оценивателя шума, который состоит из устройства 29 преобразования и оценивателя 30 шума.
Кроме того, кодер 100 содержит детектор 31 активности сигнала, который выполнен с возможностью переключения устройства 32 переключения таким образом, что во время активных фаз входной сигнал подается на основной кодер 33 и что в кадрах SID во время неактивных фаз оценка шума, создаваемая устройством 28 оценки шума, подается на кодер 35 дескриптора вставки молчания. Кроме того, в неактивные фазы флаг неактивности подается на обновитель 34 основного уровня.
Кодер 100 дополнительно содержит устройство 36 получения битового потока, которое принимает кадры SI дескриптора вставки молчания от кодера 35 дескриптора вставки молчания и кодированный входной сигнал ISE от основного кодера 33 для получения из него битового потока BS.
Фиг. 5 иллюстрирует второй вариант осуществления кодера 100, пригодного для обладающей признаками изобретения системы, который основывается на кодере 100 первого варианта осуществления. Дополнительные признаки второго варианта осуществления кратко объясняются ниже. Выходной сигнал первого преобразователя 25 также подается на устройство 28 оценивателя шума. Кроме того, во время активных фаз кодер 37 копирования спектральной полосы получает сигнал ES улучшения, который содержит информацию о более высоких частотах во входном аудиосигнале IS. Этот сигнал 37 улучшения также пересылается на устройство 36 получения битового потока для встраивания этого сигнала ES улучшения в битовый поток BS.
Что касается кодеров, показанных на фиг. 4 и 5, то может быть добавлена следующая информация: В случае, когда VAD запускает фазу CNG, передаются кадры SID, содержащие информацию о входном фоновом шуме. Она должна дать возможность декодеру генерировать искусственный шум, имеющий сходство с фактическим фоновым шумом с точки зрения спектрально-временных характеристик. С этой целью, оцениватель 28 шума применяется на стороне кодера для отслеживания спектральной формы фонового шума, присутствующего во входном сигнале IS, как показано на фиг. 4 и 5.
В принципе, оценка шума может применяться с любым инструментальным средством спектрально-временного анализа, разбивающим сигнал временной области на многочисленные спектральные полосы, до тех пор, пока он проявляет достаточное спектральное разрешение. В настоящей системе блок фильтров QMF используется в качестве инструментального средства повторной выборки для понижающей дискретизации входного сигнала до частоты дискретизации основного уровня. Он проявляет существенно меньшее спектральное разрешение, чем FFT, которое применяется к сигналу основного уровня с пониженной дискретизацией.
Так как основной кодер 33 уже охватывает всю полосу частот NB, и так как режимы WB основываются на слепом расширении полосы частот, частоты выше полосы частот основного уровня являются несущественными и могут просто отбрасываться для систем NB и WB. В режимах SWB, в противоположность этому, эти частоты захватываются верхними полосами QMF и должны явно приниматься во внимание.
Размер кадра SI SID очень ограничен на практике. Поэтому, количество параметров, описывающих фоновый шум, должно поддерживаться минимально возможным. С этой целью, оценка шума не применяется непосредственно в выходном сигнале спектральных преобразований. Вместо этого, она применяется при более низком спектральном разрешении посредством усреднения входного энергетического спектра среди групп полос, например, следуя масштабу Барка. Усреднение может достигаться или арифметическим, или геометрическим образом. В случае SWB спектральное группирование осуществляется для областей FFT и QMF отдельно, тогда как режимы NB и WB основываются только на области FFT.
Отметьте, что снижение спектрального разрешения также является полезным с точки зрения вычислительной сложности, так как необходимо, чтобы оценка шума применялась только к малому количеству спектральных групп вместо принятия во внимание каждой полосы спектра индивидуально.
Оцененные уровни шума (один для каждой спектральной группы) может совместно кодироваться в кадрах SID, используя методы векторного квантования. В режимах NB и WB применяется только область FFT. В противоположность этому, для режимов SWB кодирование кадров SID может выполняться для обеих областей FFT и QMF совместно, используя векторное квантование, т.е. обращаясь к единственной кодовой книге, охватывающей обе области.
Хотя некоторые аспекты были описаны в контексте устройства, ясно, что эти аспекты также представляют описание соответствующего способа, где блок или устройство соответствует этапу способа или признаку этапа способа. Аналогично, аспекты, описанные в контексте этапа способа, также представляют описание соответствующего блока или элемента или признака соответствующего устройства. Некоторые или все этапы способа могут выполняться посредством (или используя) устройство аппаратных средств, подобное, например, микропроцессору, программируемому компьютеру или электронной схеме. В некоторых вариантах осуществления некоторый один или несколько из наиболее важных этапов способа могут выполняться таким устройством.
В зависимости от некоторых требований к реализации варианты осуществления изобретения могут быть реализованы аппаратными или программными средствами. Реализация может выполняться с использованием долговременной запоминающей среды, такой как цифровая запоминающая среда, например дискета, цифровой многофункциональный диск (DVD), диск Blu-Ray, компакт-диск (CD), постоянное запоминающее устройство (ROM), программируемое ROM (PROM) и стираемое программируемое ROM (EPROM), электрически стираемое программируемое ROM (EEPROM) или флэш-память, имеющие хранимые на них сигналы управления, считываемые электронным образом, которые взаимодействуют (или способны взаимодействовать) с программируемой компьютерной системой, так что выполняется соответствующий способ. Поэтому, цифровая запоминающая среда может быть считываемой компьютером.
Некоторые варианты осуществления согласно изобретению содержат носитель данных, имеющий сигналы управления, считываемые электронным образом, которые способны взаимодействовать с программируемой компьютерной системой, так что выполняется один из способов, описанных в данном документе.
Как правило, варианты осуществления настоящего изобретения могут быть реализованы в виде продукта компьютерной программы с программным кодом, причем программный код является действующим для выполнения одного из способов, когда продукт компьютерной программы выполняется на компьютере. Программный код, например, может храниться на машиносчитываемом носителе.
Другие варианты осуществления содержат компьютерную программу для выполнения одного из способов, описанных в данном документе, хранимую на машиносчитываемом носителе.
Другими словами, вариант осуществления обладающего признаками изобретения способа, поэтому, представляет собой компьютерную программу, имеющую программный код для выполнения одного из способов, описанных в данном документе, когда компьютерная программа выполняется на компьютере.
Другой вариант осуществления обладающего признаками изобретения способа, поэтому, представляет собой носитель данных (или цифровую запоминающую среду, или считываемую компьютером среду), содержащий записанную на нем компьютерную программу для выполнения одного из способов, описанных в данном документе. Носитель данных, цифровая запоминающая среда или записанная среда обычно являются материальными и/или долговременными.
Другой вариант осуществления обладающими признаками изобретения способа, поэтому, представляет собой поток данных или последовательность сигналов, представляющих компьютерную программу для выполнения одного из способов, описанных в данном документе. Поток данных или последовательность сигналов, например, могут быть выполнены с возможностью пересылки по соединению передачи данных, например, по Интернету.
Другой вариант осуществления содержит средство обработки, например, компьютер или программируемое логическое устройство, выполненное с возможностью, или приспособленное для, выполнения одного из способов, описанных в данном документе.
Другой вариант осуществления содержит компьютер, имеющий установленную на нем компьютерную программу для выполнения одного из способов, описанных в данном документе.
Другой вариант осуществления согласно изобретению содержит устройство или систему, выполненную с возможностью пересылки (например, электронным или оптическим образом) компьютерной программы для выполнения одного из способов, описанных в данном документе, на приемник. Приемником, например, может быть компьютер, мобильное устройство, устройство памяти или т.п. Устройство или система, например, могут содержать файловый сервер для пересылки компьютерной программы на приемник.
В некоторых вариантах осуществления программируемое логическое устройство (например, программируемая вентильная матрица) может использоваться для выполнения некоторых или всех функциональных возможностей способов, описанных в данном документе. В некоторых вариантах осуществления программируемая вентильная матрица может взаимодействовать с микропроцессором, чтобы выполнять один из способов, описанных в данном документе. Как правило, способы предпочтительно выполняются любым устройством аппаратных средств.
Вышеописанные варианты осуществления являются просто иллюстративными для принципов настоящего изобретения. Понятно, что модификации и варианты устройств и подробностей, описанных в данном документе, очевидны для специалиста в данной области техники. Поэтому, предполагается, что изобретение ограничивается только объемом рассматриваемой формулы изобретения и не конкретными подробностями, представленными посредством описания и объяснения вариантов осуществления в данном документе.
ССЫЛОЧНЫЕ ПОЗИЦИИ
1 – аудиодекодер
2 – устройство декодирования
3 – декодер дескриптора вставки молчания
4 – спектральный преобразователь
5 – устройство оценивателя шума
6 – преобразователь разрешения
7 – устройство оценки спектра комфортного шума
7a – устройство вычисления масштабных коэффициентов
7b – генератор спектра комфортного шума
8 – генератор комфортного шума
9 – устройство преобразователя
10 – оцениватель шума
11 – первая ступень преобразователя
12 – вторая ступень преобразователя
15 – первый быстрый преобразователь Фурье
16 – второй быстрый анализатор Фурье
17 – основной декодер
18 – устройство считывания заголовка
19 – устройство переключения
20 – модуль расширения полосы частот
21 – декодер копирования спектральной полосы
22 – анализатор квадратурного зеркального фильтра
23 – синтезатор квадратурного зеркального фильтра
24 – устройство регулятора квадратурного зеркального фильтра
25 – первый спектральный преобразователь
26 – второй спектральный преобразователь
27 – третий спектральный преобразователь
28 – устройство оценивателя шума
29 – устройство преобразователя
30 – оцениватель шума
31 – детектор активности сигнала
32 – устройство переключения
33 – основной кодер
34 – обновитель основного уровня
35 – кодер дескриптора вставки молчания
36 – устройство получения битового потока
37 – кодер копирования спектральной полосы
100 – кодер
BS – битовый поток
OS – выходной аудиосигнал
SI – кадр дескриптора вставки молчания
SBN – спектр фонового шума
SAS – спектр аудиосигнала
SN1 – первый спектр шума аудиосигнала
SN2 – второй спектр шума аудиосигнала
SF – масштабные коэффициенты
SCN – спектр комфортного шума
CN – комфортный шум
AS – выходной сигнал
CSA – преобразованный спектр аудиосигнала
SN3 – третий спектр шума аудиосигнала
EOS – выходной сигнал с расширенной полосой частот
IS – входной аудиосигнал
ISE – кодированный входной сигнал
ES – сигнал улучшения

Claims (33)

1. Аудиодекодер для декодирования битового потока (BS) для получения из него выходного аудиосигнала (OS), причем битовый поток (BS) содержит по меньшей мере активную фазу, за которой следует по меньшей мере неактивная фаза, в котором битовый поток (BS) имеет закодированный в нем по меньшей мере кадр (SI) дескриптора вставки молчания, который описывает спектр фонового шума (SBN), причем аудиодекодер (1) содержит:
декодер (3) дескриптора вставки молчания, выполненный с возможностью декодирования кадра (SI) дескриптора вставки молчания для восстановления спектра (SBN) фонового шума;
устройство (2) декодирования, выполненное с возможностью восстановления выходного аудиосигнала (OS) из битового потока во время активной фазы;
спектральный преобразователь (4), выполненный с возможностью определения спектра (SAS) выходного аудиосигнала (OS);
устройство (5) оценивателя шума, выполненное с возможностью определения первого спектра (SN1) шума выходного аудиосигнала (OS), основываясь на спектре (SAS) выходного аудиосигнала (OS), обеспечиваемом спектральным преобразователем (4), в котором первый спектр (SN1) шума выходного аудиосигнала (OS) имеет более высокое спектральное разрешение, чем спектр (SBN) фонового шума;
преобразователь (6) разрешения, выполненный с возможностью установления второго спектра (SN2) шума выходного аудиосигнала (OS), основываясь на первом спектре (SN1) шума выходного аудиосигнала (OS), в котором второй спектр (SN2) шума выходного аудиосигнала (OS) имеет такое же спектральное разрешение, что и спектр (SBN) фонового шума;
устройство (7) оценки спектра комфортного шума, имеющее устройство (7a) вычисления масштабных коэффициентов, выполненное с возможностью вычисления масштабных коэффициентов (SF) для спектра (SCN) для комфортного шума (CN), основываясь на спектре (SBN) фонового шума, обеспечиваемом декодером (3) дескриптора вставки молчания, и основываясь на втором спектре (SN2) шума выходного аудиосигнала (OS), обеспечиваемом преобразователем (6) разрешения, и имеющее генератор (7b) спектра комфортного шума, выполненный с возможностью вычисления спектра (SCN) для комфортного шума (CN), основываясь на масштабных коэффициентах (SF); и
генератор (8) комфортного шума, выполненный с возможностью получения комфортного шума (CN) во время неактивной фазы, основываясь на спектре (SCN) для комфортного шума (CN).
2. Аудиодекодер по п. 1, в котором спектральный анализатор (4) содержит устройство (4) быстрого преобразования Фурье.
3. Аудиодекодер по п. 1, в котором устройство (5) оценивателя шума содержит устройство (9) преобразователя, выполненное с возможностью преобразования спектра (SAS) выходного аудиосигнала (OS) в преобразованный спектр (CSA) выходного аудиосигнала (OS), который имеет такое же или меньшее спектральное разрешение, чем спектр (SAS) выходного аудиосигнала, и более высокое спектральное разрешение, чем спектр (SBN) фонового шума.
4. Аудиодекодер по п. 3, в котором устройство (5) оценивателя шума содержит оцениватель (10) шума, выполненный с возможностью определения первого спектра (SN1) шума выходного аудиосигнала (OS), основываясь на преобразованном спектре (CSA) выходного аудиосигнала (OS), обеспечиваемом устройством (9) преобразователя.
5. Аудиодекодер по п. 1, в котором устройство (7a) вычисления масштабных коэффициентов выполнено с возможностью вычисления масштабных коэффициентов (SF) по формуле
Figure 00000019
, в которой
Figure 00000020
обозначает масштабный коэффициент (SF) для группы i частотных полос спектра (SCN) комфортного шума (CN), в которой
Figure 00000021
обозначает уровень группы i частотных полос спектра (SBN) фонового шума, в которой
Figure 00000022
обозначает уровень группы i частотных полос второго спектра (SN2) шума выходного аудиосигнала (OS), в которой i=0, …, LLR-1, в которой LLR представляет собой количество групп частотных полос спектра (SBN) фонового шума и второго спектра (SN2) шума выходного аудиосигнала (OS).
6. Аудиодекодер по п. 1, в котором генератор (7b) спектра комфортного шума выполнен с возможностью вычисления спектра комфортного шума (SCN), основываясь на масштабных коэффициентах (SF) и основываясь на первом спектре (SN1) шума выходного аудиосигнала (OS), обеспечиваемом устройством (5) оценки шума.
7. Аудиодекодер по п. 1, в котором генератор (7b) спектра комфортного шума выполнен с возможностью вычисления спектра (SCN) комфортного шума по формуле
Figure 00000023
, в которой
Figure 00000024
обозначает уровень частотной полосы k спектра комфортного шума (SCN), в которой
Figure 00000020
обозначает масштабный коэффициент (SF) группы i частотных полос спектра (SBN) фонового шума и второго спектра (SN2) шума выходного аудиосигнала, в которой
Figure 00000025
обозначает уровень частотной полосы k первого спектра (SN1) шума выходного аудиосигнала (OS), в которой k=bLR(i), …, bLR(i+1)-1, в которой bLR(i) представляет собой первую частотную полосу одной из групп частотных полос, в которой i=0, …, LLR-1, в которой LLR представляет собой количество групп частотных полос спектра (SBN) фонового шума и второго спектра (SN2) шума выходного аудиосигнала (OS).
8. Аудиодекодер по п. 1, в котором преобразователь (6) разрешения содержит первую ступень (11) преобразователя, выполненную с возможностью установления третьего спектра (SN3) шума выходного аудиосигнала (OS), основываясь на первом спектре (SN1) шума выходного аудиосигнала (OS), в котором спектральное разрешение третьего спектра (SN3) шума выходного аудиосигнала (OS) такое же или выше спектрального разрешения первого спектра (SN1) шума выходного аудиосигнала (OS) и в котором преобразователь (6) разрешения содержит вторую ступень (12) преобразователя, выполненную с возможностью установления второго спектра (SN2) шума выходного аудиосигнала (OS).
9. Аудиодекодер по п. 8, в котором генератор (7b) спектра комфортного шума выполнен с возможностью вычисления спектра комфортного шума (SCN), основываясь на масштабных коэффициентах (SF) и основываясь на третьем спектре (SN3) шума выходного аудиосигнала (OS), обеспечиваемом первой ступенью (11) преобразователя в преобразователе (6) разрешения.
10. Аудиодекодер по п. 8, в котором генератор (7b) спектра комфортного шума выполнен с возможностью вычисления спектра (SCN) комфортного шума по формуле
Figure 00000026
, в которой
Figure 00000024
обозначает уровень частотной полосы k спектра комфортного шума (SCN), в которой
Figure 00000020
обозначает масштабный коэффициент (SF) группы i частотных полос спектра (SBN) фонового шума и второго спектра (SN2) шума выходного аудиосигнала, в которой
Figure 00000027
обозначает уровень частотной полосы k третьего спектра (SN3) шума выходного аудиосигнала (OS), в которой k=bLR(i), …, bLR(i+1)-1, в которой bLR(i) представляет собой первую частотную полосу группы частотных полос, в которой i=0, …, LLR-1, в которой LLR представляет собой количество групп частотных полос спектра (SBN) фонового шума и второго спектра (SN2) шума выходного аудиосигнала (OS).
11. Аудиодекодер по п. 1, в котором генератор (8) комфортного шума содержит первый быстрый преобразователь (15) Фурье, выполненный с возможностью регулировки уровней частотных полос комфортного шума (CN) в области быстрого преобразования Фурье, и второй быстрый преобразователь (16) Фурье для получения по меньшей мере части комфортного шума, основываясь на выходном сигнале первого быстрого преобразователя (15) Фурье.
12. Аудиодекодер по п. 1, в котором устройство (2) декодирования содержит основной декодер (17), выполненный с возможностью получения выходного аудиосигнала (OS) во время активной фазы.
13. Аудиодекодер по п. 1, в котором устройство (2) декодирования содержит основной декодер (17), выполненный с возможностью получения аудиосигнала (AS), и модуль (20) расширения полосы частот, выполненный с возможностью получения выходного аудиосигнала (OS), основываясь на аудиосигнале (AS), обеспечиваемом основным декодером (17).
14. Аудиодекодер по п. 13, в котором модуль (20) расширения полосы частот содержит декодер (21) копирования спектральной полосы, анализатор (22) квадратурного зеркального фильтра и/или синтезатор (23) квадратурного зеркального фильтра.
15. Аудиодекодер по п. 13, в котором комфортный шум (CN), обеспечиваемый быстрым синтезатором (15) Фурье, подается на модуль (17) расширения полосы частот.
16. Аудиодекодер по п. 13, в котором генератор (8) комфортного шума содержит устройство (24) регулятора квадратурного зеркального фильтра, выполненное с возможностью регулировки уровней частотных полос комфортного шума (CN) в области квадратурного зеркального фильтра, причем выходной сигнал синтезатора (24) квадратурного зеркального фильтра подается на модуль (20) расширения полосы частот.
17. Система для получения битового потока и декодирования битового потока, содержащая декодер (1) и кодер (100), в которой декодер (1) выполнен по одному из пп. 1-16.
18. Способ декодирования битового потока (BS) аудио для получения из него выходного аудиосигнала (OS), причем битовый поток (BS) содержит по меньшей мере активную фазу, за которой следует по меньшей мере неактивная фаза, в котором битовый поток (BS) имеет кодированный в нем по меньшей мере кадр (SI) дескриптора вставки молчания, который описывает спектр фонового шума (SBN), причем способ содержит этапы:
декодирования кадра (SI) дескриптора вставки молчания для восстановления спектра (SBN) фонового шума;
восстановления выходного аудиосигнала (OS) из битового потока во время активной фазы;
определения спектра (SAS) выходного аудиосигнала (OS);
определения первого спектра (SN1) шума выходного аудиосигнала (OS), основываясь на спектре (SAS) выходного аудиосигнала (OS), в котором первый спектр (SN1) шума выходного аудиосигнала (OS) имеет более высокое спектральное разрешение, чем спектр (SBN) фонового шума;
установления второго спектра (SN2) шума выходного аудиосигнала (OS), основываясь на первом спектре (SN1) шума выходного аудиосигнала (OS), в котором второй спектр (SN2) шума выходного аудиосигнала (OS) имеет такое же спектральное разрешение, что и спектр (SBN) фонового шума;
вычисления масштабных коэффициентов для спектра (SCN) для комфортного шума (CN), основываясь на спектре (SBN) фонового шума и основываясь на втором спектре (SN2) шума выходного аудиосигнала (OS); и
получения комфортного шума (CN) во время неактивной фазы, основываясь на спектре (SCN) для комфортного шума (CN).
19. Машиночитаемый носитель, содержащий компьютерную программу для выполнения способа по п. 18 при исполнении ее на компьютере или процессоре.
RU2015129691A 2012-12-21 2013-12-19 Генерирование комфортного шума с высоким спектрально-временным разрешением при прерывистой передаче аудиосигналов RU2650025C2 (ru)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201261740857P 2012-12-21 2012-12-21
US61/740,857 2012-12-21
PCT/EP2013/077525 WO2014096279A1 (en) 2012-12-21 2013-12-19 Generation of a comfort noise with high spectro-temporal resolution in discontinuous transmission of audio signals

Publications (2)

Publication Number Publication Date
RU2015129691A RU2015129691A (ru) 2017-01-26
RU2650025C2 true RU2650025C2 (ru) 2018-04-06

Family

ID=49949638

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2015129691A RU2650025C2 (ru) 2012-12-21 2013-12-19 Генерирование комфортного шума с высоким спектрально-временным разрешением при прерывистой передаче аудиосигналов

Country Status (20)

Country Link
US (1) US9583114B2 (ru)
EP (1) EP2936487B1 (ru)
JP (1) JP6180544B2 (ru)
KR (1) KR101690899B1 (ru)
CN (1) CN104871242B (ru)
AR (1) AR094278A1 (ru)
AU (1) AU2013366642B2 (ru)
BR (1) BR112015014212B1 (ru)
CA (1) CA2894625C (ru)
ES (1) ES2588156T3 (ru)
HK (1) HK1216448A1 (ru)
MX (1) MX344169B (ru)
MY (1) MY171106A (ru)
PL (1) PL2936487T3 (ru)
PT (1) PT2936487T (ru)
RU (1) RU2650025C2 (ru)
SG (1) SG11201504810YA (ru)
TW (1) TWI539445B (ru)
WO (1) WO2014096279A1 (ru)
ZA (1) ZA201505193B (ru)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
USD589322S1 (en) 2006-10-05 2009-03-31 Lowe's Companies, Inc. Tool handle
CN103187065B (zh) * 2011-12-30 2015-12-16 华为技术有限公司 音频数据的处理方法、装置和系统
CA2894625C (en) 2012-12-21 2017-11-07 Anthony LOMBARD Generation of a comfort noise with high spectro-temporal resolution in discontinuous transmission of audio signals
MY178710A (en) 2012-12-21 2020-10-20 Fraunhofer Ges Forschung Comfort noise addition for modeling background noise at low bit-rates
EP2980790A1 (en) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for comfort noise generation mode selection
EP2980801A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method for estimating noise in an audio signal, noise estimator, audio encoder, audio decoder, and system for transmitting audio signals
US10325588B2 (en) * 2017-09-28 2019-06-18 International Business Machines Corporation Acoustic feature extractor selected according to status flag of frame of acoustic signal
US10805191B2 (en) 2018-12-14 2020-10-13 At&T Intellectual Property I, L.P. Systems and methods for analyzing performance silence packets
GB2595891A (en) * 2020-06-10 2021-12-15 Nokia Technologies Oy Adapting multi-source inputs for constant rate encoding
CN116075889A (zh) 2020-08-31 2023-05-05 弗劳恩霍夫应用研究促进协会 依赖混合噪声信号的多声道信号产生器、音频编码器及相关方法

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1229520A2 (en) * 2000-10-31 2002-08-07 Telogy Networks Inc. Silence insertion descriptor (sid) frame detection with human auditory perception compensation
RU2237296C2 (ru) * 1998-11-23 2004-09-27 Телефонактиеболагет Лм Эрикссон (Пабл) Кодирование речи с функцией изменения комфортного шума для повышения точности воспроизведения
US6873604B1 (en) * 2000-07-31 2005-03-29 Cisco Technology, Inc. Method and apparatus for transitioning comfort noise in an IP-based telephony system
WO2006136901A2 (en) * 2005-06-18 2006-12-28 Nokia Corporation System and method for adaptive transmission of comfort noise parameters during discontinuous speech transmission
WO2010040522A2 (en) * 2008-10-08 2010-04-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e. V. Multi-resolution switched audio encoding/decoding scheme
WO2010148516A1 (en) * 2009-06-23 2010-12-29 Voiceage Corporation Forward time-domain aliasing cancellation with application in weighted or original signal domain
WO2012110482A2 (en) * 2011-02-14 2012-08-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Noise generation in audio codecs
RU2461898C2 (ru) * 2008-03-26 2012-09-20 Хуавэй Текнолоджиз Ко., Лтд. Способ и устройство для кодирования и декодирования

Family Cites Families (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5537509A (en) * 1990-12-06 1996-07-16 Hughes Electronics Comfort noise generation for digital communication systems
DE69232202T2 (de) 1991-06-11 2002-07-25 Qualcomm, Inc. Vocoder mit veraendlicher bitrate
US5630016A (en) * 1992-05-28 1997-05-13 Hughes Electronics Comfort noise generation for digital communication systems
US5657422A (en) 1994-01-28 1997-08-12 Lucent Technologies Inc. Voice activity detection driven noise remediator
FI101439B1 (fi) * 1995-04-13 1998-06-15 Nokia Telecommunications Oy Transkooderi, jossa on tandem-koodauksen esto
JP3252782B2 (ja) 1998-01-13 2002-02-04 日本電気株式会社 モデム信号対応音声符号化復号化装置
US6122611A (en) 1998-05-11 2000-09-19 Conexant Systems, Inc. Adding noise during LPC coded voice activity periods to improve the quality of coded speech coexisting with background noise
US6424938B1 (en) 1998-11-23 2002-07-23 Telefonaktiebolaget L M Ericsson Complex signal activity detection for improved speech/noise classification of an audio signal
US8583427B2 (en) * 1999-11-18 2013-11-12 Broadcom Corporation Voice and data exchange over a packet based network with voice detection
US20070110042A1 (en) * 1999-12-09 2007-05-17 Henry Li Voice and data exchange over a packet based network
JP2001318694A (ja) 2000-05-10 2001-11-16 Toshiba Corp 信号処理装置、信号処理方法および記録媒体
US6615169B1 (en) * 2000-10-18 2003-09-02 Nokia Corporation High frequency enhancement layer coding in wideband speech codec
US20030120484A1 (en) 2001-06-12 2003-06-26 David Wong Method and system for generating colored comfort noise in the absence of silence insertion description packets
CA2388439A1 (en) 2002-05-31 2003-11-30 Voiceage Corporation A method and device for efficient frame erasure concealment in linear predictive based speech codecs
CN1703736A (zh) * 2002-10-11 2005-11-30 诺基亚有限公司 用于源控制可变比特率宽带语音编码的方法和装置
JP4311541B2 (ja) 2003-10-06 2009-08-12 アルパイン株式会社 オーディオ信号圧縮装置
US7649988B2 (en) * 2004-06-15 2010-01-19 Acoustic Technologies, Inc. Comfort noise generator using modified Doblinger noise estimate
US7454010B1 (en) * 2004-11-03 2008-11-18 Acoustic Technologies, Inc. Noise reduction and comfort noise gain control using bark band weiner filter and linear attenuation
US7610197B2 (en) 2005-08-31 2009-10-27 Motorola, Inc. Method and apparatus for comfort noise generation in speech communication systems
US8139777B2 (en) * 2007-10-31 2012-03-20 Qnx Software Systems Co. System for comfort noise injection
US8483854B2 (en) 2008-01-28 2013-07-09 Qualcomm Incorporated Systems, methods, and apparatus for context processing using multiple microphones
DE102008009719A1 (de) * 2008-02-19 2009-08-20 Siemens Enterprise Communications Gmbh & Co. Kg Verfahren und Mittel zur Enkodierung von Hintergrundrauschinformationen
US20090222268A1 (en) * 2008-03-03 2009-09-03 Qnx Software Systems (Wavemakers), Inc. Speech synthesis system having artificial excitation signal
CA2836871C (en) 2008-07-11 2017-07-18 Stefan Bayer Time warp activation signal provider, audio signal encoder, method for providing a time warp activation signal, method for encoding an audio signal and computer programs
WO2011049515A1 (en) 2009-10-19 2011-04-28 Telefonaktiebolaget Lm Ericsson (Publ) Method and voice activity detector for a speech encoder
SI3239979T1 (sl) 2010-10-25 2024-09-30 Voiceage Evs Llc Kodiranje generičnih zvočnih signalov pri nizkih bitnih hitrostih in majhni zakasnitvi
EP3493205B1 (en) 2010-12-24 2020-12-23 Huawei Technologies Co., Ltd. Method and apparatus for adaptively detecting a voice activity in an input audio signal
PL2676264T3 (pl) * 2011-02-14 2015-06-30 Fraunhofer Ges Forschung Koder audio estymujący szum tła podczas faz aktywnych
US20120237048A1 (en) 2011-03-14 2012-09-20 Continental Automotive Systems, Inc. Apparatus and method for echo suppression
CN107195313B (zh) 2012-08-31 2021-02-09 瑞典爱立信有限公司 用于语音活动性检测的方法和设备
CA2894625C (en) 2012-12-21 2017-11-07 Anthony LOMBARD Generation of a comfort noise with high spectro-temporal resolution in discontinuous transmission of audio signals
US9106196B2 (en) 2013-06-20 2015-08-11 2236008 Ontario Inc. Sound field spatial stabilizer with echo spectral coherence compensation

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2237296C2 (ru) * 1998-11-23 2004-09-27 Телефонактиеболагет Лм Эрикссон (Пабл) Кодирование речи с функцией изменения комфортного шума для повышения точности воспроизведения
US6873604B1 (en) * 2000-07-31 2005-03-29 Cisco Technology, Inc. Method and apparatus for transitioning comfort noise in an IP-based telephony system
EP1229520A2 (en) * 2000-10-31 2002-08-07 Telogy Networks Inc. Silence insertion descriptor (sid) frame detection with human auditory perception compensation
WO2006136901A2 (en) * 2005-06-18 2006-12-28 Nokia Corporation System and method for adaptive transmission of comfort noise parameters during discontinuous speech transmission
RU2461898C2 (ru) * 2008-03-26 2012-09-20 Хуавэй Текнолоджиз Ко., Лтд. Способ и устройство для кодирования и декодирования
WO2010040522A2 (en) * 2008-10-08 2010-04-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e. V. Multi-resolution switched audio encoding/decoding scheme
WO2010148516A1 (en) * 2009-06-23 2010-12-29 Voiceage Corporation Forward time-domain aliasing cancellation with application in weighted or original signal domain
WO2012110482A2 (en) * 2011-02-14 2012-08-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Noise generation in audio codecs

Also Published As

Publication number Publication date
AR094278A1 (es) 2015-07-22
HK1216448A1 (zh) 2016-11-11
ES2588156T3 (es) 2016-10-31
MY171106A (en) 2019-09-25
MX344169B (es) 2016-12-07
EP2936487A1 (en) 2015-10-28
TW201428734A (zh) 2014-07-16
PT2936487T (pt) 2016-09-23
JP2016500452A (ja) 2016-01-12
JP6180544B2 (ja) 2017-08-16
TWI539445B (zh) 2016-06-21
ZA201505193B (en) 2016-07-27
MX2015007434A (es) 2015-09-16
WO2014096279A1 (en) 2014-06-26
EP2936487B1 (en) 2016-06-22
CN104871242B (zh) 2017-10-24
CA2894625A1 (en) 2014-06-26
RU2015129691A (ru) 2017-01-26
AU2013366642A1 (en) 2015-07-02
KR101690899B1 (ko) 2016-12-28
CA2894625C (en) 2017-11-07
CN104871242A (zh) 2015-08-26
PL2936487T3 (pl) 2016-12-30
US20150287415A1 (en) 2015-10-08
US9583114B2 (en) 2017-02-28
SG11201504810YA (en) 2015-07-30
BR112015014212B1 (pt) 2021-10-19
KR20150096494A (ko) 2015-08-24
AU2013366642B2 (en) 2016-09-22
BR112015014212A2 (pt) 2017-08-22

Similar Documents

Publication Publication Date Title
RU2650025C2 (ru) Генерирование комфортного шума с высоким спектрально-временным разрешением при прерывистой передаче аудиосигналов
JP7345694B2 (ja) 高周波再構成の際のオーディオ信号処理
US10115407B2 (en) Method and apparatus for encoding and decoding high frequency signal
US8918196B2 (en) Method for weighted overlap-add
JP6849619B2 (ja) 低ビットレートで背景ノイズをモデル化するためのコンフォートノイズ付加
US20050096917A1 (en) Methods for improving high frequency reconstruction
RU2612589C2 (ru) Низкочастотное акцентирование для основанного на lpc кодирования в частотной области
KR20110139294A (ko) 오디오 신호 조작 장치 및 방법
US20090192789A1 (en) Method and apparatus for encoding/decoding audio signals
RU2648953C2 (ru) Наполнение шумом без побочной информации для celp-подобных кодеров
US11380341B2 (en) Selecting pitch lag