RU2650025C2 - Генерирование комфортного шума с высоким спектрально-временным разрешением при прерывистой передаче аудиосигналов - Google Patents
Генерирование комфортного шума с высоким спектрально-временным разрешением при прерывистой передаче аудиосигналов Download PDFInfo
- Publication number
- RU2650025C2 RU2650025C2 RU2015129691A RU2015129691A RU2650025C2 RU 2650025 C2 RU2650025 C2 RU 2650025C2 RU 2015129691 A RU2015129691 A RU 2015129691A RU 2015129691 A RU2015129691 A RU 2015129691A RU 2650025 C2 RU2650025 C2 RU 2650025C2
- Authority
- RU
- Russia
- Prior art keywords
- spectrum
- noise
- audio
- signal
- comfort
- Prior art date
Links
- 230000005236 sound signal Effects 0.000 title claims abstract description 109
- 230000005540 biological transmission Effects 0.000 title description 3
- 238000001228 spectrum Methods 0.000 claims abstract description 304
- 230000003595 spectral effect Effects 0.000 claims abstract description 106
- 238000003780 insertion Methods 0.000 claims abstract description 39
- 230000037431 insertion Effects 0.000 claims abstract description 39
- 239000012073 inactive phase Substances 0.000 claims abstract description 37
- 239000012071 phase Substances 0.000 claims abstract description 22
- 238000000034 method Methods 0.000 claims description 32
- 238000004590 computer program Methods 0.000 claims description 15
- 230000030279 gene silencing Effects 0.000 claims description 4
- 230000000694 effects Effects 0.000 abstract description 4
- 239000000126 substance Substances 0.000 abstract 1
- 239000012072 active phase Substances 0.000 description 18
- 238000012935 Averaging Methods 0.000 description 6
- 238000013461 design Methods 0.000 description 5
- 230000007423 decrease Effects 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 238000013139 quantization Methods 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000003584 silencer Effects 0.000 description 2
- 238000012952 Resampling Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000012731 temporal analysis Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/012—Comfort noise or silence coding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/002—Dynamic bit allocation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Soundproofing, Sound Blocking, And Sound Damping (AREA)
- Noise Elimination (AREA)
- Circuit For Audible Band Transducer (AREA)
- Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
Abstract
Изобретение относится к средствам для генерирования комфортного шума с высоким спектрально-временным разрешением. Технический результат заключается в повышении качества аудиосигнала посредством добавления комфортного шума. Декодируют битовый поток для получения из него выходного аудиосигнала. Битовый поток содержит активную фазу, за которой следует неактивная фаза. Битовый поток имеет закодированный в нем кадр дескриптора вставки молчания, который описывает спектр фонового шума. Аудиодекодер содержит декодер дескриптора вставки молчания, выполненный с возможностью декодирования кадра дескриптора вставки молчания для восстановления спектра фонового шума; устройство декодирования, выполненное с возможностью восстановления выходного аудиосигнала из битового потока во время активной фазы; спектральный преобразователь, выполненный с возможностью определения спектра выходного аудиосигнала; устройство оценивателя шума; преобразователь разрешения; устройство оценки спектра комфортного шума и генератор комфортного шума. 4 н. и 15 з.п. ф-лы, 5 ил.
Description
Настоящее изобретение относится к обработке аудиосигналов, и в частности к добавлению комфортного шума к аудиосигналам
Генераторы комфортного шума обычно используются при прерывистой передаче (DTX) аудиосигналов, в частности аудиосигналов, содержащих речь. В таком режиме аудиосигнал сначала классифицируется на активные и неактивные кадры детектором голосовой активности (VAD). Основываясь на результате VAD, только активные кадры речи кодируются и передаются с номинальной скоростью передачи в битах. Во время длинных пауз, где присутствует только фоновый шум, скорость передачи в битах понижается или становится равной нулю, и фоновый шум кодируется эпизодически и параметрически, используя кадры дескриптора вставки молчания (кадры SID). Средняя скорость передачи в битах тогда существенно уменьшается.
Шум генерируется во время неактивных кадров на стороне декодера генератором комфортного шума (CNG). На практике размер кадра SID очень ограничен. Поэтому, количество параметров, описывающих фоновый шум, должно поддерживаться максимально малым. С этой целью, оценка шума не применяется непосредственно на выходе спектральных преобразований. Вместо этого, она применяется при более низком спектральном разрешении посредством усреднения входного энергетического спектра среди групп полос, например, по масштабу Барка. Усреднение может достигаться или арифметическим, или геометрическим способом. К сожалению, ограниченное количество параметров, передаваемых в кадрах SID, не позволяет захватывать структуру спектра высокого разрешения фонового шума. Следовательно, только посредством CNG может воспроизводиться только плавная спектральная огибающая шума. Когда VAD запускает кадр CNG, расхождение между плавным спектром восстановленного комфортного шума и спектром фактического фонового шума может стать очень слышимым на переходах между активными кадрами (содержащими нормальное кодирование и декодирование зашумленных участков речи сигнала) и кадрами CNG.
Задачей настоящего изобретения является обеспечение улучшенных принципов обработки аудиосигналов. Более конкретно, задачей настоящего изобретения является обеспечение улучшенных принципов добавления комфортного шума к аудиосигналам. Задача настоящего изобретения достигается посредством аудиодекодера по п. 1 формулы изобретения, системы по п. 17 формулы изобретения, способа по п. 18 формулы изобретения и компьютерной программы по п. 19 формулы изобретения.
В одном аспекте изобретение обеспечивает аудиодекодер, выполненный с возможностью декодирования битового потока для получения из него выходных аудиосигналов, причем битовый поток содержит по меньшей мере активную фазу, за которой следует по меньшей мере неактивная фаза, в котором в битовом потоке закодирован по меньшей мере кадр дескриптора вставки молчания, который описывает спектр фонового шума, причем аудиодекодер содержит:
декодер дескриптора вставки молчания, выполненный с возможностью декодирования кадра дескриптора вставки молчания для восстановления спектра фонового шума;
устройство декодирования, выполненное с возможностью восстановления выходного аудиосигнала из битового потока во время активной фазы;
спектральный преобразователь, выполненный с возможностью определения спектра выходного аудиосигнала;
устройство оценивателя шума, выполненное с возможностью определения первого спектра шума выходного аудиосигнала, основываясь на спектре выходного аудиосигнала, обеспечиваемого спектральным преобразователем, в котором первый спектр шума выходного аудиосигнала имеет более высокое спектральное разрешение, чем спектр фонового шума, обеспечиваемый декодером дескриптора вставки молчания;
преобразователь разрешения, выполненный с возможностью установления второго спектра шума выходного аудиосигнала, основываясь на первом спектре шума выходного аудиосигнала, в котором второй спектр шума выходного аудиосигнала имеет такое же спектральное разрешение, что и спектр фонового шума, обеспечиваемый декодером дескриптора вставки молчания;
устройство оценки спектра комфортного шума, имеющее устройство вычисления масштабных коэффициентов, выполненное с возможностью вычисления масштабных коэффициентов для спектра для комфортного шума, основываясь на спектре фонового шума, обеспечиваемом декодером дескриптора вставки молчания, и основываясь на втором спектре шума выходного аудиосигнала, обеспечиваемом преобразователем разрешения, и имеющее генератор спектра комфортного шума, выполненный с возможностью вычисления спектра для комфортного шума, основываясь на масштабных коэффициентах; и
генератор комфортного шума, выполненный с возможностью получения комфортного шума во время неактивной фазы, основываясь на спектре для комфортного шума.
Битовый поток содержит активные фазы и неактивные фазы, в котором активная фаза представляет собой фазу, которая содержит полезные компоненты аудиоинформации, такой как речь или музыка, тогда как неактивная фаза представляет собой фазу, которая не содержит никаких полезных компонентов аудиоинформации. Неактивные фазы обычно происходят во время пауз, когда не присутствуют полезные компоненты, такие как музыка или речь. Поэтому, неактивные фазы обычно содержат только фоновый шум. Информация в битовом потоке, содержащем кодированный аудиосигнал, вставляется в так называемые кадры, причем каждый из этих кадров содержит аудиоинформацию, ссылающуюся на некоторый момент времени. Во время активных фаз активные кадры, содержащие аудиоинформацию, включающую в себя аудиоинформацию, касающуюся полезного сигнала, могут передаваться в битовом потоке. В противоположность этому, во время неактивных фаз кадры дескриптора вставки молчания, содержащие информацию о шуме, могут передаваться в битовом потоке с меньшей средней скоростью передачи в битах по сравнению со средней скоростью передачи в битах активных фаз.
Декодер дескриптора вставки молчания выполнен с возможностью декодирования кадров дескриптора вставки молчания для восстановления спектра фонового шума. Однако этот спектр фонового шума не позволяет захватывать структуру спектра высокого разрешения фонового шума из-за ограниченного количества параметров, передаваемых в кадрах дескриптора вставки молчания.
Устройством декодирования может быть устройство или компьютерная программа, способные декодировать битовый поток аудио, который представляет собой поток цифровых данных, содержащий аудиоинформацию, во время активных фаз. Процесс декодирования может приводить к цифровому декодированному выходному аудиосигналу, который может подаваться на цифроаналоговый (D/A) преобразователь для получения аналогового аудиосигнала, который затем может подаваться на громкоговоритель для получения звукового сигнала.
Спектральный преобразователь может получать спектр выходного аудиосигнала, который имеет существенно более высокое спектральное разрешение, чем спектр фонового шума, обеспечиваемый декодером дескриптора вставки молчания.
Поэтому, оцениватель шума может определять первый спектр шума выходного аудиосигнала, основываясь на спектре выходного аудиосигнала, обеспечиваемом спектральным преобразователем, в котором первый спектр шума выходного аудиосигнала имеет более высокое спектральное разрешение, чем спектр фонового шума, обеспечиваемый декодером дескриптора вставки молчания.
Кроме того, преобразователь разрешения может устанавливать второй спектр шума выходного аудиосигнала, основываясь на первом спектре шума выходного аудиосигнала, в котором второй спектр шума выходного аудиосигнала имеет такое же спектральное разрешение, что и спектр фонового шума, обеспечиваемый декодером дескриптора вставки молчания.
Устройство вычисления масштабных коэффициентов может легко вычислять масштабные коэффициенты для спектра для комфортного шума, основываясь на спектре фонового шума, обеспечиваемом декодером дескриптора вставки молчания, и основываясь на втором спектре шума выходного аудиосигнала, обеспечиваемом преобразователем разрешения, так как спектр фонового шума, обеспечиваемый декодером дескриптора вставки молчания, и второй спектр шума выходного аудиосигнала имеют одинаковое спектральное разрешение.
Генератор спектра комфортного шума может устанавливать спектр для комфортного шума, основываясь на масштабных коэффициентах и основываясь на первом спектре шума выходного аудиосигнала, обеспечиваемом устройством оценки шума.
Кроме того, генератор комфортного шума может получать комфортный шум во время неактивной фазы, основываясь на спектре комфортного шума.
Оценки шума, полученные на декодере, содержат информацию о спектральной структуре фонового шума, которая является более точной, чем информация о гладкой спектральной огибающей фонового шума, содержащейся в кадрах SID. Однако эти оценки не могут обновляться во время неактивных фаз, так как оценка шума выполняется над декодированным выходным аудиосигналом во время активных фаз. В противоположность этому, кадры SID доставляют новую информацию о спектральной огибающей во время неактивных фаз. Декодер согласно изобретению объединяет эти два источника информации. Масштабные коэффициенты могут обновляться во время активных фаз в зависимости от оценок шума на стороне декодера и во время неактивных фаз в зависимости от оценок шума, содержащихся в кадрах SID. Непрерывное обновление масштабных коэффициентов гарантирует, что нет внезапных изменений характеристик получаемого комфортного шума.
Так как спектр фонового шума, содержащийся в кадрах SID, и второй спектр шума выходного аудиосигнала имеют одинаковое спектральное разрешение, обновление масштабных коэффициентов и, следовательно, комфортного шума может легко выполняться, так как для каждой группы частотных полос спектра фонового шума, содержащегося в кадрах SID, существует точно одна группа частотных полос во втором спектре шума выходного аудиосигнала. Необходимо отметить, что в предпочтительном варианте осуществления группы частотных полос спектра фонового шума, содержащегося в кадрах SID, и группы частотных полос второго спектра шума выходного аудиосигнала соответствуют друг другу.
Кроме того, так как спектр фонового шума, содержащийся в кадрах SID, и второй спектр шума выходного аудиосигнала имеют одинаковое спектральное разрешение, обновление масштабных коэффициентов не создает или создает только едва слышимые помехи.
Согласно предпочтительному варианту осуществления изобретения спектральный анализатор содержит устройство быстрого преобразования Фурье. Быстрое преобразование Фурье (FFT) представляет собой алгоритм для вычисления дискретного преобразования Фурье (DFT), и его обратного преобразования, который требует только низких вычислительных затрат. Поэтому, устройство быстрого преобразования Фурье может легко вычислять спектр выходного аудиосигнала.
Согласно предпочтительному варианту осуществления изобретения устройство оценивателя шума в декодере содержит устройство преобразователя, выполненное с возможностью преобразования спектра выходного аудиосигнала в преобразованный спектр выходного аудиосигнала, который, в основном, имеет значительно меньшее спектральное разрешение. Посредством обеспечения преобразованного спектра выходного аудиосигнала может уменьшаться сложность последующих вычислительных этапов.
Согласно предпочтительному варианту осуществления изобретения устройство оценивателя шума содержит оцениватель шума, выполненный с возможностью определения первого спектра шума выходного аудиосигнала, основываясь на преобразованном спектре выходного аудиосигнала, обеспечиваемом устройством преобразователя. Когда преобразованный спектр выходного аудиосигнала используется в качестве основы для оценки шума в декодере, вычислительные затраты могут уменьшаться без снижения качества оценки шума.
Согласно предпочтительному варианту осуществления изобретения устройство вычисления масштабных коэффициентов выполнено с возможностью вычисления масштабных коэффициентов по формуле , в которой обозначает масштабный коэффициент для группы i частотных полос комфортного шума, в которой обозначает уровень группы i частотных полос спектра фонового шума, содержащегося в кадрах SID, в которой обозначает уровень группы i частотных полос второго спектра шума выходного аудиосигнала, в которой i=0, …, LLR-1, в которой LLR представляет собой количество групп частотных полос спектра фонового шума, содержащегося в кадрах SID, и второго спектра шума выходного аудиосигнала. Посредством этих признаков могут легко вычисляться масштабные коэффициенты.
Согласно предпочтительному варианту осуществления изобретения генератор спектра комфортного шума выполнен с возможностью вычисления спектра комфортного шума, основываясь на масштабных коэффициентах и основываясь на первом спектре шума выходного аудиосигнала, обеспечиваемом устройством оценки шума. Посредством этих признаков спектр комфортного шума может вычисляться таким образом, что он имеет спектральное разрешение первого спектра шума выходного аудиосигнала, которое, в основном, значительно выше спектрального разрешения, полученного из кадров SID.
Согласно предпочтительному варианту осуществления изобретения генератор спектра комфортного шума выполнен с возможностью вычисления спектра комфортного шума по формуле , в которой обозначает уровень частотной полосы k спектра комфортного шума, в которой обозначает масштабный коэффициент группы i частотных полос спектра фонового шума, содержащегося в кадрах SID, и второго спектра шума выходного аудиосигнала, в которой обозначает уровень частотной полосы k первого спектра шума выходного аудиосигнала, в которой k=bLR(i), …, bLR(i+1)-1, в которой bLR(i) представляет собой первую частотную полосу одной из групп частотных полос, в которой i=0, …, LLR-1, в которой LLR представляет собой количество групп частотных полос спектра фонового шума, содержащегося в кадрах SID, и второго спектра шума выходного аудиосигнала. Посредством этих признаков спектр комфортного шума может легко вычисляться с высоким разрешением.
Согласно предпочтительному варианту осуществления изобретения преобразователь разрешения содержит первую ступень преобразователя, выполненную с возможностью установления третьего спектра шума выходного аудиосигнала, основываясь на первом спектре шума выходного аудиосигнала, в котором спектральное разрешение третьего спектра шума выходного аудиосигнала выше или такое же, что и спектральное разрешение первого спектра шума выходного аудиосигнала, и в котором преобразователь разрешения содержит вторую ступень преобразователя, выполненную с возможностью установления второго спектра шума выходного аудиосигнала.
Согласно предпочтительному варианту осуществления изобретения генератор спектра комфортного шума выполнен с возможностью вычисления спектра комфортного шума, основываясь на масштабных коэффициентах и основываясь на третьем спектре шума выходного аудиосигнала, обеспечиваемом первой ступенью преобразователя в преобразователе разрешения. Посредством этих признаков спектр комфортного шума может быть получен во время неактивных фаз, который имеет более высокое спектральное разрешение, чем спектральное разрешение первого спектра шума выходного аудиосигнала во время активных фаз.
Согласно предпочтительному варианту осуществления изобретения генератор спектра комфортного шума выполнен с возможностью вычисления спектра комфортного шума по формуле , в которой обозначает уровень частотной полосы k спектра комфортного шума, в которой обозначает масштабный коэффициент группы i частотных полос спектра фонового шума, содержащегося в кадрах SID, и второго спектра шума выходного аудиосигнала, в которой обозначает уровень частотной полосы k третьего спектра шума выходного аудиосигнала, в которой k=bLR(i), …, bLR(i+1)-1, в которой bLR(i) представляет собой первую частотную полосу группы частотных полос, в которой i=0, …, LLR-1, в которой LLR представляет собой количество групп частотных полос спектра фонового шума, содержащегося в кадрах SID, и второго спектра шума выходного аудиосигнала. Посредством этих признаков спектр комфортного шума может легко вычисляться с высоким разрешением.
Согласно предпочтительному варианту осуществления изобретения генератор комфортного шума содержит первый быстрый преобразователь Фурье, выполненный с возможностью регулировки уровней частотных полос комфортного шума в области быстрого преобразования Фурье, и второй быстрый преобразователь Фурье для получения по меньшей мере части комфортного шума, основываясь на выходном сигнале первого быстрого преобразователя Фурье. Посредством этих признаков может легко получаться фоновый шум.
Согласно предпочтительному варианту осуществления изобретения устройство декодирования содержит основной декодер, выполненный с возможностью получения выходного аудиосигнала во время активной фазы. Посредством этих признаков может достигаться простая конструкция декодера, который подходит для узкополосных (NB) и широкополосных (WB) применений.
Согласно предпочтительному варианту осуществления изобретения устройство декодирования содержит основной декодер, выполненный с возможностью получения аудиосигнала, и модуль расширения полосы частот, выполненный с возможностью получения выходного аудиосигнала, основываясь на аудиосигнале, обеспечиваемом основным декодером. Посредством этих признаков может достигаться простая конструкция декодера, который пригоден для суперширокополосных (SWB) применений.
Согласно предпочтительному варианту осуществления изобретения модуль расширения полосы частот содержит декодер копирования спектральной полосы, анализатор квадратурного зеркального фильтра и/или синтезатор квадратурного зеркального фильтра.
Согласно предпочтительному варианту осуществления изобретения комфортный шум, обеспечиваемый быстрым преобразователем Фурье, подается на модуль расширения полосы частот. Посредством этого признака комфортный шум, обеспечиваемый быстрым преобразователем Фурье, может преобразовываться в комфортный шум с большей полосой частот.
Согласно предпочтительному варианту осуществления изобретения генератор комфортного шума содержит устройство регулятора квадратурного зеркального фильтра, выполненное с возможностью регулировки уровней частотных полос комфортного шума в области квадратурного зеркального фильтра, причем выходной сигнал синтезатора квадратурного зеркального фильтра подается на модуль расширения полосы частот. Посредством этих признаков информация о шуме, передаваемая кадрами дескриптора вставки молчания, относящимися к частотам шума выше полосы частот основного декодера, может использоваться для дополнительного улучшения комфортного шума.
В другом аспекте изобретение относится к системе, содержащей декодер и кодер, в которой декодер разработан согласно изобретению.
В другом аспекте изобретение относится к способу декодирования битового потока аудио для получения из него выходного аудиосигнала, причем битовый поток содержит по меньшей мере активную фазу, за которой следует по меньшей мере неактивная фаза, в котором битовый поток имеет кодированный в нем по меньшей мере кадр дескриптора вставки молчания, который описывает спектр фонового шума, причем способ содержит этапы:
декодирования кадра дескриптора вставки молчания для восстановления спектра фонового шума;
восстановления выходного аудиосигнала из битового потока во время активной фазы;
определения спектра выходного аудиосигнала;
определения первого спектра шума выходного аудиосигнала, основываясь на спектре выходного аудиосигнала, в котором первый спектр шума выходного аудиосигнала имеет более высокое спектральное разрешение, чем спектр фонового шума, обеспечиваемый декодером дескриптора вставки молчания;
установления второго спектра шума выходного аудиосигнала, основываясь на первом спектре шума выходного аудиосигнала, в котором второй спектр шума выходного аудиосигнала имеет такое же спектральное разрешение, что и спектр фонового шума, обеспечиваемый декодером дескриптора вставки молчания;
вычисления масштабных коэффициентов для спектра для комфортного шума, основываясь на спектре фонового шума, обеспечиваемом декодером дескриптора вставки молчания, и основываясь на втором спектре шума выходного аудиосигнала; и
получения комфортного шума во время неактивной фазы, основываясь на спектре комфортного шума.
В другом аспекте изобретение относится к компьютерной программе для выполнения, при выполнении на компьютере или процессоре, обладающими признаками изобретения способа.
Предпочтительные варианты осуществления изобретения ниже описываются в отношении прилагаемых чертежей, на которых:
фиг. 1 иллюстрирует первый вариант осуществления декодера согласно изобретению;
фиг. 2 иллюстрирует второй вариант осуществления декодера согласно изобретению;
фиг. 3 иллюстрирует третий вариант осуществления декодера согласно изобретению;
фиг. 4 иллюстрирует первый вариант осуществления кодера, пригодного для обладающей признаками изобретения системы; и
фиг. 5 иллюстрирует второй вариант осуществления кодера, пригодного для обладающей признаками изобретения системы.
Фиг. 1 иллюстрирует первый вариант осуществления декодера 1 согласно изобретению. Аудиодекодер 1, изображенный на фиг. 1, выполнен с возможностью декодирования битового потока BS для получения из него выходного аудиосигнала OS, причем битовый поток BS содержит по меньшей мере активную фазу, за которой следует по меньшей мере неактивная фаза, в котором битовый поток BS имеет кодированный в нем по меньшей мере кадр SI дескриптора вставки молчания, который описывает спектр SBN фонового шума, причем аудиодекодер 1 содержит:
устройство 2 декодирования, выполненное с возможностью восстановления выходного аудиосигнала OS из битового потока BS во время активной фазы;
декодер 3 дескриптора вставки молчания, выполненный с возможностью декодирования кадра SI дескриптора вставки молчания для восстановления спектра SBN фонового шума;
спектральный преобразователь 4, выполненный с возможностью определения спектра SAS выходного аудиосигнала OS;
устройство 5 оценивателя шума, выполненное с возможностью определения первого спектра SN1 шума выходного аудиосигнала OS, основываясь на спектре SAS выходного аудиосигнала AS, обеспечиваемом спектральным преобразователем 4, в котором первый спектр SN1 шума выходного аудиосигнала OS имеет более высокое спектральное разрешение, чем спектр SBN фонового шума;
преобразователь 6 разрешения, выполненный с возможностью установления второго спектра SN2 шума выходного аудиосигнала OS, основываясь на первом спектре SN1 шума выходного аудиосигнала OS, в котором второй спектр SN2 шума выходного аудиосигнала OS имеет такое же спектральное разрешение, что и спектр SBN фонового шума;
устройство 7 оценки спектра комфортного шума, имеющее устройство 7a вычисления масштабных коэффициентов, выполненное с возможностью вычисления масштабных коэффициентов SF для спектра SCN для комфортного шума CN, основываясь на спектре SBN фонового шума, обеспечиваемом декодером 3 дескриптора вставки молчания, и основываясь на втором спектре SN2 шума выходного аудиосигнала OS, обеспечиваемом преобразователем 6 разрешения, и имеющее генератор 7b спектра комфортного шума, выполненный с возможностью вычисления спектра SCN для комфортного шума CN, основываясь на масштабных коэффициентах SF; и
генератор 8 комфортного шума, выполненный с возможностью получения комфортного шума CN во время неактивной фазы, основываясь на спектре SCN для комфортного шума CN.
Битовый поток BS содержит активные фазы и неактивные фазы, причем активная фаза представляет собой фазу, которая содержит полезные компоненты аудиоинформации, такие как речь или музыку, тогда как неактивная фаза представляет собой фазу, которая не содержит никаких полезных компонентов аудиоинформации.
Неактивные фазы обычно происходят во время пауз, где не присутствуют полезные компоненты, такие как музыка или речь. Поэтому, неактивные фазы обычно содержат исключительно фоновый шум. Информация в битовом потоке BS, содержащем кодированный аудиосигнал, встраивается в так называемые кадры, причем каждый из этих кадров содержит аудиоинформацию, ссылающуюся на некоторый момент времени. Во время активных фаз кадры, содержащие аудиоинформацию, включающую в себя аудиоинформацию, касающуюся полезного сигнала, могут передаваться в битовом потоке BS. В противоположность этому, во время неактивных фаз кадры SI дескриптора вставки молчания, содержащие информацию о шуме, могут передаваться в битовом потоке с меньшей средней скоростью передачи в битах по сравнению со средней скоростью передачи в битах активных фаз.
Устройство 2 декодирования может представлять собой устройство или компьютерную программу, способную декодировать битовой поток BS аудио, который представляет собой поток цифровых данных, содержащий аудиоинформацию, во время активных фаз. Процесс декодирования может приводить к цифровому декодированному выходному аудиосигналу OS, который может подаваться на D/A-преобразователь для получения аналогового аудиосигнала, который затем может подаваться на громкоговоритель для получения звукового сигнала.
Декодер 3 дескриптора вставки молчания выполнен с возможностью декодирования кадров SI дескриптора вставки молчания для восстановления спектра SBN фонового шума. Однако спектр SBN фонового шума не позволяет захватывать структуру спектра высокого разрешения фонового шума из-за ограниченного количества параметров, передаваемых в кадрах SI дескриптора вставки молчания.
Спектральный преобразователь 4 может получать спектр SAS выходного аудиосигнала OS, который имеет существенно более высокое спектральное разрешение, чем спектр SBN фонового шума, обеспечиваемый декодером 3 дескриптора вставки молчания.
Поэтому, оцениватель 10 шума может определять первый спектр SN1 шума выходного аудиосигнала OS, основываясь на спектре SAS выходного аудиосигнала OS, обеспечиваемом спектральным преобразователем 4, причем первый спектр SN1 шума выходного аудиосигнала OS имеет более высокое спектральное разрешение, чем спектр фонового шума SBN.
Кроме того, преобразователь 6 разрешения может устанавливать второй спектр SN2 шума выходного аудиосигнала OS, основываясь на первом спектре SN1 шума выходного аудиосигнала OS, причем второй спектр SN2 шума выходного аудиосигнала OS имеет такое же спектральное разрешение, что и спектр фонового шума SBN.
Устройство 7a вычисления масштабных коэффициентов может легко вычислять масштабные коэффициенты SF для спектра SCN для комфортного шума CN, основываясь на спектре SBN фонового шума, обеспечиваемом декодером 3 дескриптора вставки молчания, и основываясь на втором спектре SN2 шума выходного аудиосигнала OS, обеспечиваемом преобразователем 6 разрешения, так как спектр SBN фонового шума и второй спектр SN2 шума выходного аудиосигнала OS имеют одинаковое спектральное разрешение.
Генератор 7b спектра комфортного шума может устанавливать спектр SCN для комфортного шума CN, основываясь на масштабных коэффициентах SF.
Кроме того, генератор 8 комфортного шума может получать комфортный шум CN во время неактивной фазы, основываясь на спектре SCN для комфортного шума.
Оценки шума, полученные в декодере 1, содержат информацию о спектральной структуре фонового шума, которая более точная, чем информация о спектральной структуре фонового шума, содержащаяся в кадрах SI SID. Однако эти оценки не могут адаптироваться во время неактивных фаз, так как оценка шума выполняется по декодированному выходному аудиосигналу OS. В противоположность этому, кадры SID доставляют новую информацию о спектральной огибающей с регулярными интервалами во время неактивных фаз. Декодер 1 согласно изобретению объединяет эти два источника информации. Масштабные коэффициенты SF могут обновляться во время активных фаз в зависимости от оценок шума на стороне декодера и во время неактивных фаз в зависимости от оценок шума, содержащихся в кадрах SI SID. Непрерывное обновление масштабных коэффициентов SF гарантирует, что нет внезапных изменений характеристик получаемого комфортного шума CN.
Так как спектр SBN фонового шума, содержащийся в кадрах SI SID, и второй спектр SN2 шума выходного аудиосигнала OS имеют одинаковое спектральное разрешение, обновление масштабных коэффициентов SF и, следовательно, комфортного шума CN может легко выполняться, так как для каждой группы частотных полос спектра SBN фонового шума, содержащегося в кадрах SI SID, точно одна группа частотных полос существует во втором спектре SN2 шума выходного аудиосигнала OS. Необходимо отметить, что в предпочтительном варианте осуществления группы частотных полос спектра фонового шума, содержащегося в кадрах SI SID, и группы частотных полос второго спектра SN2 шума выходного аудиосигнала OS соответствуют друг другу.
Кроме того, так как спектр SBN фонового шума, содержащийся в кадрах SI SID, и второй спектр SN2 шума выходного аудиосигнала OS имеют одинаковое спектральное разрешение, обновление масштабных коэффициентов SF не создает или создает только едва слышимые помехи.
Согласно предпочтительному варианту осуществления изобретения спектральный анализатор 4 содержит устройство быстрого преобразования Фурье. Быстрое преобразование Фурье (FFT) представляет собой алгоритм для вычисления дискретного преобразования Фурье (DFT), и его обратного преобразования, который требует только низких вычислительных затрат. Поэтому, устройство быстрого преобразования Фурье может легко вычислять спектр SAS выходного аудиосигнала OS.
Согласно предпочтительному варианту осуществления изобретения устройство 5 оценивателя шума содержит устройство 9 преобразователя, выполненное с возможностью преобразования спектра SAS выходного аудиосигнала OS в преобразованный спектр CSA выходного аудиосигнала OS, который имеет такое же спектральное разрешение, что и основной декодер 17. Как правило, спектральное разрешение спектра SAS выходного аудиосигнала OS, полученного спектральным преобразователем 4, значительно выше, чем спектральное разрешение основного декодера 17. Посредством обеспечения преобразованного спектра CSA выходного аудиосигнала OS может уменьшаться сложность последующих вычислительных этапов.
Согласно предпочтительному варианту осуществления изобретения устройство 5 оценивателя шума содержит оцениватель 10 шума, выполненный с возможностью определения первого спектра SN1 шума выходного аудиосигнала OS, основываясь на преобразованном спектре CAS выходного аудиосигнала OS, обеспечиваемом устройством 9 преобразователя. Когда преобразованный спектр CSA выходного аудиосигнала OS используется в качестве основы для оценки шума в декодере, вычислительные затраты могут уменьшаться без снижения качества оценки шума.
Согласно предпочтительному варианту осуществления изобретения устройство 7a вычисления масштабных коэффициентов выполнено с возможностью вычисления масштабных коэффициентов SF по формуле , в которой обозначает масштабный коэффициент SF для группы i частотных полос комфортного шума CN, в которой обозначает уровень группы i частотных полос спектра SBN фонового шума, в которой обозначает уровень группы i частотных полос второго спектра SN2 шума выходного аудиосигнала, в которой i=0, …, LLR-1, в которой LLR представляет собой количество групп частотных полос спектра SBN фонового шума, и второго спектра SN2 шума выходного аудиосигнала OS. Посредством этих признаков могут легко вычисляться масштабные коэффициенты SF.
Согласно предпочтительному варианту осуществления изобретения генератор 7b спектра комфортного шума выполнен с возможностью вычисления спектра SCN комфортного шума CN, основываясь на масштабных коэффициентах SF и основываясь на первом спектре SN1 шума выходного аудиосигнала OS, обеспечиваемом устройством 5 оценки шума. Посредством этих признаков спектр SCN комфортного шума может вычисляться таким образом, что он имеет спектральное разрешение первого спектра SN1 шума выходного аудиосигнала OS.
Согласно предпочтительному варианту осуществления изобретения генератор 7b спектра комфортного шума выполнен с возможностью вычисления спектра SCN комфортного шума CN по формуле , в которой обозначает уровень частотной полосы k спектра SCN комфортного шума CN, в которой обозначает масштабный коэффициент SF группы i частотных полос спектра SBN фонового шума и второго спектра SN2 шума выходного аудиосигнала OS, в которой обозначает уровень частотной полосы k первого спектра SN1 шума выходного аудиосигнала OS, в которой k=bLR(i), …, bLR(i+1)-1, в которой bLR(i) представляет собой первую частотную полосу одной из групп частотных полос, в которой i=0, …, LLR-1, в которой LLR представляет собой количество групп частотных полос спектра SBN фонового шума и второго спектра SN2 шума выходного аудиосигнала. Посредством этих признаков спектр SCN комфортного шума CN может легко вычисляться с высоким разрешением.
Согласно предпочтительному варианту осуществления изобретения преобразователь 6 разрешения содержит первую ступень 11 преобразователя, выполненную с возможностью установления третьего спектра SN3 шума выходного аудиосигнала OS, основываясь на первом спектре SN1 шума выходного аудиосигнала OS, в котором спектральное разрешение третьего спектра SN3 шума выходного аудиосигнала OS такое же или выше спектрального разрешения первого спектра SN1 шума выходного аудиосигнала OS, и в котором преобразователь 6 разрешения содержит вторую ступень 12 преобразователя, выполненную с возможностью установления второго спектра SN2 шума выходного аудиосигнала OS.
Согласно предпочтительному варианту осуществления изобретения генератор 7b спектра комфортного шума выполнен с возможностью вычисления спектра SCN комфортного шума CN, основываясь на масштабных коэффициентах SF и основываясь на третьем спектре SN3 шума выходного аудиосигнала OS, обеспечиваемом первой ступенью 11 преобразователя в преобразователе 6 разрешения. Посредством этих признаков может быть получен спектр SCN комфортного шума, который имеет более высокое спектральное разрешение, чем спектр SBN фонового шума, обеспечиваемый декодером 3 дескриптора вставки молчания.
Согласно предпочтительному варианту осуществления изобретения генератор 7b спектра комфортного шума выполнен с возможностью вычисления спектра SCN комфортного шума по формуле , в которой обозначает уровень частотной полосы k спектра SCN комфортного шума CN, в которой обозначает масштабный коэффициент SF группы i частотных полос спектра SCN фонового шума и второго спектра SN2 шума выходного аудиосигнала OS, в которой обозначает уровень частотной полосы k третьего спектра SN3 шума выходного аудиосигнала OS, в которой k=bLR(i), …, bLR(i+1)-1, в которой bLR(i) представляет собой первую частотную полосу группы частотных полос, в которой i=0, …, LLR-1, в которой LLR представляет собой количество групп частотных полос спектра SBN фонового шума и второго спектра SN2 шума выходного аудиосигнала OS. Посредством этих признаков спектр SCN комфортного шума может легко вычисляться с высоким разрешением.
Согласно предпочтительному варианту осуществления изобретения генератор 8 комфортного шума содержит первый быстрый преобразователь 15 Фурье, выполненный с возможностью регулировки уровней частотных полос комфортного шума CN в области быстрого преобразования Фурье, и второй быстрый преобразователь 16 Фурье для получения по меньшей мере части комфортного шума CN, основываясь на выходном сигнале первого быстрого преобразователя 15 Фурье. Посредством этих признаков может легко получаться комфортный шум.
Согласно предпочтительному варианту осуществления изобретения устройство 2 декодирования содержит основной декодер 17, выполненный с возможностью получения выходного аудиосигнала OS во время активной фазы. Посредством этих признаков может достигаться простая конструкция декодера, который подходит для узкополосных (NB) и широкополосных (WB) применений.
Согласно предпочтительному варианту осуществления изобретения аудиодекодер 1 содержит устройство 18 считывания заголовка, которое выполнено с возможностью различения активных фаз и неактивных фаз. Устройство 18 считывания заголовка дополнительно выполнено с возможностью переключения устройства 19 переключения таким образом, что битовый поток BS во время активных фаз подается на основной декодер 17, и что кадры дескриптора вставки молчания во время неактивных фаз подаются на декодер 3 дескриптора вставки молчания. Следовательно, флаг неактивной фазы передается на генератор 8 фонового шума, так что может запускаться генерирование комфортного шума CN.
Фиг. 2 иллюстрирует второй вариант осуществления аудиодекодера 1 согласно изобретению. Декодер, изображенный на фиг. 2, основывается на декодере 1 по фиг. 1. Ниже объясняются только различия. Аудиодекодер 1 второго варианта осуществления изобретения содержит модуль 20 расширения полосы частот, на который подается выходной сигнал основного декодера 17. Модуль 20 расширения полосы частот выполнен с возможностью получения выходного сигнала EOS с расширенной полосой частот, основываясь на выходном аудиосигнале OS. Посредством этих признаков может достигаться простая конструкция декодера 1, который пригоден для суперширокополосных (SWB) применений.
Согласно предпочтительному варианту осуществления изобретения комфортный шум CN, обеспечиваемый быстрым преобразователем 16 Фурье, подается на модуль 20 расширения полосы частот. Посредством этого признака комфортный шум CN, обеспечиваемый быстрым преобразователем 16 Фурье, может преобразовываться в комфортный шум CN с большей полосой частот.
Согласно предпочтительному варианту осуществления изобретения генератор 8 комфортного шума содержит устройство 24 регулятора квадратурного зеркального фильтра, выполненное с возможностью регулировки уровней частотных полос комфортного шума CN в области квадратурного зеркального фильтра, причем выходной сигнал синтезатора 24 квадратурного зеркального фильтра подается на модуль 20 расширения полосы частот в качестве дополнительного комфортного шума CN’. Уровни квадратурного зеркального фильтра (QMF), содержащиеся в кадрах SI дескриптора вставки молчания, могут подаваться на устройство 24 синтезатора квадратурного зеркального фильтра. Посредством этих признаков информация о шуме, передаваемая кадрами SI дескриптора вставки молчания, относящаяся к частотам шума выше полосы частот основного декодера 17, может использоваться для дополнительного улучшения комфортного шума CN.
Согласно предпочтительному варианту осуществления изобретения модуль 20 расширения полосы частот содержит декодер 21 копирования спектральной полосы, анализатор 22 квадратурного зеркального фильтра и/или синтезатор 23 квадратурного зеркального фильтра.
Фиг. 3 иллюстрирует третий вариант осуществления декодера 1 согласно изобретению. Декодер 1 по фиг. 3 основывается на декодере 1 по фиг. 2. В нижеследующем описываются только различия.
Согласно предпочтительному варианту осуществления изобретения устройство 2 декодирования содержит основной декодер 17, выполненный с возможностью получения аудиосигнала AS, и модуль 20 расширения полосы частот, выполненный с возможностью получения выходного аудиосигнала OS, основываясь на аудиосигнале AS, обеспечиваемом основным декодером 17. Посредством этих признаков может достигаться простая конструкция декодера, который пригоден для суперширокополосных (SWB) применений.
В принципе, модуль 20 расширения полосы частот по фиг. 3 является таким же, что и модуль 20 расширения полосы частот по фиг. 2. Однако в третьем варианте осуществления аудиодекодера 1 согласно изобретению модуль 20 расширения полосы частот используется для получения выходного аудиосигнала OS, который подается на спектральный преобразователь 4. Посредством этих признаков вся полоса частот может использоваться для получения комфортного шума.
Что касается трех вариантов осуществлении аудиодекодера согласно изобретению, то можно добавить: На стороне декодера случайный генератор 8 может применяться для возбуждения каждой индивидуальной спектральной полосы в области FFT, а также в области QMF для режимов SWB. Амплитуда случайных последовательностей должна индивидуально вычисляться в каждой полосе, так что спектр генерируемого комфортного шума CN имеет сходство со спектром фактического фонового шума, присутствующего в битовом потоке.
Оценки шума с высоким разрешением, полученные в декодере 1, захватывают информацию о структуре спектра высокого разрешения фонового шума. Однако эти оценки не могут адаптироваться во время неактивных фаз, так как оценка шума выполняется по декодированному сигналу OS. В противоположность этому, кадры SI SID доставляют новую информацию о спектральной огибающей с регулярными интервалами во время неактивных фаз. Настоящий декодер 1 объединяет эти два источника информации в попытке воспроизведения структуры спектра высокого разрешения, захваченной из фонового шума, присутствующего во время активных фаз, в то же время обновляя только спектральную огибающую комфортного шума CN во время неактивных частей при помощи информации SID.
Для достижения этой цели дополнительный оцениватель 5 шума используется в декодере 1, как показано на фиг. 1-3. Следовательно, оценка шума выполняется на обеих сторонах системы передачи, но применяя более высокое спектральное разрешение в декодере 1, чем в кодере 100. Одним путем получения высокого спектрального разрешения в декодере 1 является просто принятие во внимание индивидуально каждой спектральной полосы (полное разрешение) вместо группирования их посредством усреднения подобно кодеру 100. Альтернативно, может быть получен компромисс между спектральным разрешением и вычислительной сложностью посредством выполнения группирования спектра также в декодере 1, но, используя увеличенное количество спектральных групп по сравнению с кодером 100, получая, таким образом, квантование с меньшим шагом оси частот в декодере.
Отметьте, что оценка шума на стороне декодера работает по декодированному сигналу OS. В системе на основе DTX она должна, поэтому, быть способна работать только во время активных фаз, т.е. обязательно над содержимым с чистой речью или речью с шумами (в противоположность только шуму).
Энергетический спектр шума с высоким разрешением (HR), вычисленный в декодере, может сначала интерполироваться (например, используя линейную интерполяцию) для получения энергетического спектра с полным разрешением (FR). Он затем может преобразовываться в энергетический спектр с низким разрешением (LR) посредством спектрального группирования (т.е. усреднения), как это делается в кодере. Энергетический спектр проявляет, поэтому, такое же спектральное разрешение, что и уровни шума, полученные из кадров SI SID. Сравнивая спектры и шума с низким разрешением, спектр шума с полным разрешением может, в конечном счете, масштабироваться для получения энергетического спектра с полным разрешением следующим образом:
где LLR представляет собой количество спектральных групп, используемых оценкой шума с низким разрешением в кодере, и bLR(i) обозначает первую спектральную полосу i-ой спектральной группы, i=0, …, LLR-1. Энергетический спектр шума с полным разрешением может, в конечном счете, использоваться для точной регулировки уровня комфортного шума, генерируемого в каждой индивидуальной полосе FFT или QMF (последний только для режимов SWB).
На фиг. 1 и 2 вышеприведенный механизм применяется только к коэффициентам FFT. Следовательно, для систем SWB он не применяется в полосах QMF, захватывающих высокочастотное содержимое, отбрасываемое основным уровнем. Так как эти частоты с учетом восприятия являются менее существенными, является, как правило, достаточным воспроизведение плавной спектральной огибающей шума для этих частот.
Чтобы регулировать уровень комфортного шума, применяемого в области QMF для частот, которые находятся выше полосы частот основного уровня в режимах SWB, система основывается исключительно на информации, передаваемой кадрами SID. Модуль SBR, таким образом, обходится, когда VAD запускает кадр CNG. В режимах WB модуль CNG не учитывает полосы QMF, так как применяется слепое расширение полосы частот для восстановления требуемой полосы частот.
Тем не менее, схема легко может быть расширена для охвата всей полосы частот посредством применения оценивателя шума на стороне декодера на выходе модуля расширения полосы частот вместо применения ее на выходе основного декодера. Это расширение, как показано на фиг. 3, вызывает повышение вычислительной сложности, так как также должны учитываться высокие частоты, захватываемые блоком фильтров QMF.
Фиг. 4 иллюстрирует первый вариант осуществления кодера 100, пригодного для обладающей признаками изобретения системы. Входной аудиосигнал IS подается на первый спектральный преобразователь 25, выполненный с возможностью пересылки этого сигнала IS временной области в частотную область. Первый спектральный преобразователь 25 может представлять собой анализатор квадратурного зеркального фильтра. Выходной сигнал первого спектрального преобразователя 25 подается на второй спектральный преобразователь 26, который выполнен с возможностью пересылки выходного сигнала первого спектрального преобразователя 25 в область. Второй спектральный преобразователь 26 может представлять собой синтезатор квадратурного зеркального фильтра. Выходной сигнал второго спектрального преобразователя 26 подается на третий спектральный преобразователь 27, которым может быть устройство быстрого преобразования Фурье. Выходной сигнал третьего спектрального преобразователя 27 подается на устройство 28 оценивателя шума, который состоит из устройства 29 преобразования и оценивателя 30 шума.
Кроме того, кодер 100 содержит детектор 31 активности сигнала, который выполнен с возможностью переключения устройства 32 переключения таким образом, что во время активных фаз входной сигнал подается на основной кодер 33 и что в кадрах SID во время неактивных фаз оценка шума, создаваемая устройством 28 оценки шума, подается на кодер 35 дескриптора вставки молчания. Кроме того, в неактивные фазы флаг неактивности подается на обновитель 34 основного уровня.
Кодер 100 дополнительно содержит устройство 36 получения битового потока, которое принимает кадры SI дескриптора вставки молчания от кодера 35 дескриптора вставки молчания и кодированный входной сигнал ISE от основного кодера 33 для получения из него битового потока BS.
Фиг. 5 иллюстрирует второй вариант осуществления кодера 100, пригодного для обладающей признаками изобретения системы, который основывается на кодере 100 первого варианта осуществления. Дополнительные признаки второго варианта осуществления кратко объясняются ниже. Выходной сигнал первого преобразователя 25 также подается на устройство 28 оценивателя шума. Кроме того, во время активных фаз кодер 37 копирования спектральной полосы получает сигнал ES улучшения, который содержит информацию о более высоких частотах во входном аудиосигнале IS. Этот сигнал 37 улучшения также пересылается на устройство 36 получения битового потока для встраивания этого сигнала ES улучшения в битовый поток BS.
Что касается кодеров, показанных на фиг. 4 и 5, то может быть добавлена следующая информация: В случае, когда VAD запускает фазу CNG, передаются кадры SID, содержащие информацию о входном фоновом шуме. Она должна дать возможность декодеру генерировать искусственный шум, имеющий сходство с фактическим фоновым шумом с точки зрения спектрально-временных характеристик. С этой целью, оцениватель 28 шума применяется на стороне кодера для отслеживания спектральной формы фонового шума, присутствующего во входном сигнале IS, как показано на фиг. 4 и 5.
В принципе, оценка шума может применяться с любым инструментальным средством спектрально-временного анализа, разбивающим сигнал временной области на многочисленные спектральные полосы, до тех пор, пока он проявляет достаточное спектральное разрешение. В настоящей системе блок фильтров QMF используется в качестве инструментального средства повторной выборки для понижающей дискретизации входного сигнала до частоты дискретизации основного уровня. Он проявляет существенно меньшее спектральное разрешение, чем FFT, которое применяется к сигналу основного уровня с пониженной дискретизацией.
Так как основной кодер 33 уже охватывает всю полосу частот NB, и так как режимы WB основываются на слепом расширении полосы частот, частоты выше полосы частот основного уровня являются несущественными и могут просто отбрасываться для систем NB и WB. В режимах SWB, в противоположность этому, эти частоты захватываются верхними полосами QMF и должны явно приниматься во внимание.
Размер кадра SI SID очень ограничен на практике. Поэтому, количество параметров, описывающих фоновый шум, должно поддерживаться минимально возможным. С этой целью, оценка шума не применяется непосредственно в выходном сигнале спектральных преобразований. Вместо этого, она применяется при более низком спектральном разрешении посредством усреднения входного энергетического спектра среди групп полос, например, следуя масштабу Барка. Усреднение может достигаться или арифметическим, или геометрическим образом. В случае SWB спектральное группирование осуществляется для областей FFT и QMF отдельно, тогда как режимы NB и WB основываются только на области FFT.
Отметьте, что снижение спектрального разрешения также является полезным с точки зрения вычислительной сложности, так как необходимо, чтобы оценка шума применялась только к малому количеству спектральных групп вместо принятия во внимание каждой полосы спектра индивидуально.
Оцененные уровни шума (один для каждой спектральной группы) может совместно кодироваться в кадрах SID, используя методы векторного квантования. В режимах NB и WB применяется только область FFT. В противоположность этому, для режимов SWB кодирование кадров SID может выполняться для обеих областей FFT и QMF совместно, используя векторное квантование, т.е. обращаясь к единственной кодовой книге, охватывающей обе области.
Хотя некоторые аспекты были описаны в контексте устройства, ясно, что эти аспекты также представляют описание соответствующего способа, где блок или устройство соответствует этапу способа или признаку этапа способа. Аналогично, аспекты, описанные в контексте этапа способа, также представляют описание соответствующего блока или элемента или признака соответствующего устройства. Некоторые или все этапы способа могут выполняться посредством (или используя) устройство аппаратных средств, подобное, например, микропроцессору, программируемому компьютеру или электронной схеме. В некоторых вариантах осуществления некоторый один или несколько из наиболее важных этапов способа могут выполняться таким устройством.
В зависимости от некоторых требований к реализации варианты осуществления изобретения могут быть реализованы аппаратными или программными средствами. Реализация может выполняться с использованием долговременной запоминающей среды, такой как цифровая запоминающая среда, например дискета, цифровой многофункциональный диск (DVD), диск Blu-Ray, компакт-диск (CD), постоянное запоминающее устройство (ROM), программируемое ROM (PROM) и стираемое программируемое ROM (EPROM), электрически стираемое программируемое ROM (EEPROM) или флэш-память, имеющие хранимые на них сигналы управления, считываемые электронным образом, которые взаимодействуют (или способны взаимодействовать) с программируемой компьютерной системой, так что выполняется соответствующий способ. Поэтому, цифровая запоминающая среда может быть считываемой компьютером.
Некоторые варианты осуществления согласно изобретению содержат носитель данных, имеющий сигналы управления, считываемые электронным образом, которые способны взаимодействовать с программируемой компьютерной системой, так что выполняется один из способов, описанных в данном документе.
Как правило, варианты осуществления настоящего изобретения могут быть реализованы в виде продукта компьютерной программы с программным кодом, причем программный код является действующим для выполнения одного из способов, когда продукт компьютерной программы выполняется на компьютере. Программный код, например, может храниться на машиносчитываемом носителе.
Другие варианты осуществления содержат компьютерную программу для выполнения одного из способов, описанных в данном документе, хранимую на машиносчитываемом носителе.
Другими словами, вариант осуществления обладающего признаками изобретения способа, поэтому, представляет собой компьютерную программу, имеющую программный код для выполнения одного из способов, описанных в данном документе, когда компьютерная программа выполняется на компьютере.
Другой вариант осуществления обладающего признаками изобретения способа, поэтому, представляет собой носитель данных (или цифровую запоминающую среду, или считываемую компьютером среду), содержащий записанную на нем компьютерную программу для выполнения одного из способов, описанных в данном документе. Носитель данных, цифровая запоминающая среда или записанная среда обычно являются материальными и/или долговременными.
Другой вариант осуществления обладающими признаками изобретения способа, поэтому, представляет собой поток данных или последовательность сигналов, представляющих компьютерную программу для выполнения одного из способов, описанных в данном документе. Поток данных или последовательность сигналов, например, могут быть выполнены с возможностью пересылки по соединению передачи данных, например, по Интернету.
Другой вариант осуществления содержит средство обработки, например, компьютер или программируемое логическое устройство, выполненное с возможностью, или приспособленное для, выполнения одного из способов, описанных в данном документе.
Другой вариант осуществления содержит компьютер, имеющий установленную на нем компьютерную программу для выполнения одного из способов, описанных в данном документе.
Другой вариант осуществления согласно изобретению содержит устройство или систему, выполненную с возможностью пересылки (например, электронным или оптическим образом) компьютерной программы для выполнения одного из способов, описанных в данном документе, на приемник. Приемником, например, может быть компьютер, мобильное устройство, устройство памяти или т.п. Устройство или система, например, могут содержать файловый сервер для пересылки компьютерной программы на приемник.
В некоторых вариантах осуществления программируемое логическое устройство (например, программируемая вентильная матрица) может использоваться для выполнения некоторых или всех функциональных возможностей способов, описанных в данном документе. В некоторых вариантах осуществления программируемая вентильная матрица может взаимодействовать с микропроцессором, чтобы выполнять один из способов, описанных в данном документе. Как правило, способы предпочтительно выполняются любым устройством аппаратных средств.
Вышеописанные варианты осуществления являются просто иллюстративными для принципов настоящего изобретения. Понятно, что модификации и варианты устройств и подробностей, описанных в данном документе, очевидны для специалиста в данной области техники. Поэтому, предполагается, что изобретение ограничивается только объемом рассматриваемой формулы изобретения и не конкретными подробностями, представленными посредством описания и объяснения вариантов осуществления в данном документе.
ССЫЛОЧНЫЕ ПОЗИЦИИ
1 – аудиодекодер
2 – устройство декодирования
3 – декодер дескриптора вставки молчания
4 – спектральный преобразователь
5 – устройство оценивателя шума
6 – преобразователь разрешения
7 – устройство оценки спектра комфортного шума
7a – устройство вычисления масштабных коэффициентов
7b – генератор спектра комфортного шума
8 – генератор комфортного шума
9 – устройство преобразователя
10 – оцениватель шума
11 – первая ступень преобразователя
12 – вторая ступень преобразователя
15 – первый быстрый преобразователь Фурье
16 – второй быстрый анализатор Фурье
17 – основной декодер
18 – устройство считывания заголовка
19 – устройство переключения
20 – модуль расширения полосы частот
21 – декодер копирования спектральной полосы
22 – анализатор квадратурного зеркального фильтра
23 – синтезатор квадратурного зеркального фильтра
24 – устройство регулятора квадратурного зеркального фильтра
25 – первый спектральный преобразователь
26 – второй спектральный преобразователь
27 – третий спектральный преобразователь
28 – устройство оценивателя шума
29 – устройство преобразователя
30 – оцениватель шума
31 – детектор активности сигнала
32 – устройство переключения
33 – основной кодер
34 – обновитель основного уровня
35 – кодер дескриптора вставки молчания
36 – устройство получения битового потока
37 – кодер копирования спектральной полосы
100 – кодер
BS – битовый поток
OS – выходной аудиосигнал
SI – кадр дескриптора вставки молчания
SBN – спектр фонового шума
SAS – спектр аудиосигнала
SN1 – первый спектр шума аудиосигнала
SN2 – второй спектр шума аудиосигнала
SF – масштабные коэффициенты
SCN – спектр комфортного шума
CN – комфортный шум
AS – выходной сигнал
CSA – преобразованный спектр аудиосигнала
SN3 – третий спектр шума аудиосигнала
EOS – выходной сигнал с расширенной полосой частот
IS – входной аудиосигнал
ISE – кодированный входной сигнал
ES – сигнал улучшения
Claims (33)
1. Аудиодекодер для декодирования битового потока (BS) для получения из него выходного аудиосигнала (OS), причем битовый поток (BS) содержит по меньшей мере активную фазу, за которой следует по меньшей мере неактивная фаза, в котором битовый поток (BS) имеет закодированный в нем по меньшей мере кадр (SI) дескриптора вставки молчания, который описывает спектр фонового шума (SBN), причем аудиодекодер (1) содержит:
декодер (3) дескриптора вставки молчания, выполненный с возможностью декодирования кадра (SI) дескриптора вставки молчания для восстановления спектра (SBN) фонового шума;
устройство (2) декодирования, выполненное с возможностью восстановления выходного аудиосигнала (OS) из битового потока во время активной фазы;
спектральный преобразователь (4), выполненный с возможностью определения спектра (SAS) выходного аудиосигнала (OS);
устройство (5) оценивателя шума, выполненное с возможностью определения первого спектра (SN1) шума выходного аудиосигнала (OS), основываясь на спектре (SAS) выходного аудиосигнала (OS), обеспечиваемом спектральным преобразователем (4), в котором первый спектр (SN1) шума выходного аудиосигнала (OS) имеет более высокое спектральное разрешение, чем спектр (SBN) фонового шума;
преобразователь (6) разрешения, выполненный с возможностью установления второго спектра (SN2) шума выходного аудиосигнала (OS), основываясь на первом спектре (SN1) шума выходного аудиосигнала (OS), в котором второй спектр (SN2) шума выходного аудиосигнала (OS) имеет такое же спектральное разрешение, что и спектр (SBN) фонового шума;
устройство (7) оценки спектра комфортного шума, имеющее устройство (7a) вычисления масштабных коэффициентов, выполненное с возможностью вычисления масштабных коэффициентов (SF) для спектра (SCN) для комфортного шума (CN), основываясь на спектре (SBN) фонового шума, обеспечиваемом декодером (3) дескриптора вставки молчания, и основываясь на втором спектре (SN2) шума выходного аудиосигнала (OS), обеспечиваемом преобразователем (6) разрешения, и имеющее генератор (7b) спектра комфортного шума, выполненный с возможностью вычисления спектра (SCN) для комфортного шума (CN), основываясь на масштабных коэффициентах (SF); и
генератор (8) комфортного шума, выполненный с возможностью получения комфортного шума (CN) во время неактивной фазы, основываясь на спектре (SCN) для комфортного шума (CN).
2. Аудиодекодер по п. 1, в котором спектральный анализатор (4) содержит устройство (4) быстрого преобразования Фурье.
3. Аудиодекодер по п. 1, в котором устройство (5) оценивателя шума содержит устройство (9) преобразователя, выполненное с возможностью преобразования спектра (SAS) выходного аудиосигнала (OS) в преобразованный спектр (CSA) выходного аудиосигнала (OS), который имеет такое же или меньшее спектральное разрешение, чем спектр (SAS) выходного аудиосигнала, и более высокое спектральное разрешение, чем спектр (SBN) фонового шума.
4. Аудиодекодер по п. 3, в котором устройство (5) оценивателя шума содержит оцениватель (10) шума, выполненный с возможностью определения первого спектра (SN1) шума выходного аудиосигнала (OS), основываясь на преобразованном спектре (CSA) выходного аудиосигнала (OS), обеспечиваемом устройством (9) преобразователя.
5. Аудиодекодер по п. 1, в котором устройство (7a) вычисления масштабных коэффициентов выполнено с возможностью вычисления масштабных коэффициентов (SF) по формуле , в которой обозначает масштабный коэффициент (SF) для группы i частотных полос спектра (SCN) комфортного шума (CN), в которой обозначает уровень группы i частотных полос спектра (SBN) фонового шума, в которой обозначает уровень группы i частотных полос второго спектра (SN2) шума выходного аудиосигнала (OS), в которой i=0, …, LLR-1, в которой LLR представляет собой количество групп частотных полос спектра (SBN) фонового шума и второго спектра (SN2) шума выходного аудиосигнала (OS).
6. Аудиодекодер по п. 1, в котором генератор (7b) спектра комфортного шума выполнен с возможностью вычисления спектра комфортного шума (SCN), основываясь на масштабных коэффициентах (SF) и основываясь на первом спектре (SN1) шума выходного аудиосигнала (OS), обеспечиваемом устройством (5) оценки шума.
7. Аудиодекодер по п. 1, в котором генератор (7b) спектра комфортного шума выполнен с возможностью вычисления спектра (SCN) комфортного шума по формуле , в которой обозначает уровень частотной полосы k спектра комфортного шума (SCN), в которой обозначает масштабный коэффициент (SF) группы i частотных полос спектра (SBN) фонового шума и второго спектра (SN2) шума выходного аудиосигнала, в которой обозначает уровень частотной полосы k первого спектра (SN1) шума выходного аудиосигнала (OS), в которой k=bLR(i), …, bLR(i+1)-1, в которой bLR(i) представляет собой первую частотную полосу одной из групп частотных полос, в которой i=0, …, LLR-1, в которой LLR представляет собой количество групп частотных полос спектра (SBN) фонового шума и второго спектра (SN2) шума выходного аудиосигнала (OS).
8. Аудиодекодер по п. 1, в котором преобразователь (6) разрешения содержит первую ступень (11) преобразователя, выполненную с возможностью установления третьего спектра (SN3) шума выходного аудиосигнала (OS), основываясь на первом спектре (SN1) шума выходного аудиосигнала (OS), в котором спектральное разрешение третьего спектра (SN3) шума выходного аудиосигнала (OS) такое же или выше спектрального разрешения первого спектра (SN1) шума выходного аудиосигнала (OS) и в котором преобразователь (6) разрешения содержит вторую ступень (12) преобразователя, выполненную с возможностью установления второго спектра (SN2) шума выходного аудиосигнала (OS).
9. Аудиодекодер по п. 8, в котором генератор (7b) спектра комфортного шума выполнен с возможностью вычисления спектра комфортного шума (SCN), основываясь на масштабных коэффициентах (SF) и основываясь на третьем спектре (SN3) шума выходного аудиосигнала (OS), обеспечиваемом первой ступенью (11) преобразователя в преобразователе (6) разрешения.
10. Аудиодекодер по п. 8, в котором генератор (7b) спектра комфортного шума выполнен с возможностью вычисления спектра (SCN) комфортного шума по формуле , в которой обозначает уровень частотной полосы k спектра комфортного шума (SCN), в которой обозначает масштабный коэффициент (SF) группы i частотных полос спектра (SBN) фонового шума и второго спектра (SN2) шума выходного аудиосигнала, в которой обозначает уровень частотной полосы k третьего спектра (SN3) шума выходного аудиосигнала (OS), в которой k=bLR(i), …, bLR(i+1)-1, в которой bLR(i) представляет собой первую частотную полосу группы частотных полос, в которой i=0, …, LLR-1, в которой LLR представляет собой количество групп частотных полос спектра (SBN) фонового шума и второго спектра (SN2) шума выходного аудиосигнала (OS).
11. Аудиодекодер по п. 1, в котором генератор (8) комфортного шума содержит первый быстрый преобразователь (15) Фурье, выполненный с возможностью регулировки уровней частотных полос комфортного шума (CN) в области быстрого преобразования Фурье, и второй быстрый преобразователь (16) Фурье для получения по меньшей мере части комфортного шума, основываясь на выходном сигнале первого быстрого преобразователя (15) Фурье.
12. Аудиодекодер по п. 1, в котором устройство (2) декодирования содержит основной декодер (17), выполненный с возможностью получения выходного аудиосигнала (OS) во время активной фазы.
13. Аудиодекодер по п. 1, в котором устройство (2) декодирования содержит основной декодер (17), выполненный с возможностью получения аудиосигнала (AS), и модуль (20) расширения полосы частот, выполненный с возможностью получения выходного аудиосигнала (OS), основываясь на аудиосигнале (AS), обеспечиваемом основным декодером (17).
14. Аудиодекодер по п. 13, в котором модуль (20) расширения полосы частот содержит декодер (21) копирования спектральной полосы, анализатор (22) квадратурного зеркального фильтра и/или синтезатор (23) квадратурного зеркального фильтра.
15. Аудиодекодер по п. 13, в котором комфортный шум (CN), обеспечиваемый быстрым синтезатором (15) Фурье, подается на модуль (17) расширения полосы частот.
16. Аудиодекодер по п. 13, в котором генератор (8) комфортного шума содержит устройство (24) регулятора квадратурного зеркального фильтра, выполненное с возможностью регулировки уровней частотных полос комфортного шума (CN) в области квадратурного зеркального фильтра, причем выходной сигнал синтезатора (24) квадратурного зеркального фильтра подается на модуль (20) расширения полосы частот.
17. Система для получения битового потока и декодирования битового потока, содержащая декодер (1) и кодер (100), в которой декодер (1) выполнен по одному из пп. 1-16.
18. Способ декодирования битового потока (BS) аудио для получения из него выходного аудиосигнала (OS), причем битовый поток (BS) содержит по меньшей мере активную фазу, за которой следует по меньшей мере неактивная фаза, в котором битовый поток (BS) имеет кодированный в нем по меньшей мере кадр (SI) дескриптора вставки молчания, который описывает спектр фонового шума (SBN), причем способ содержит этапы:
декодирования кадра (SI) дескриптора вставки молчания для восстановления спектра (SBN) фонового шума;
восстановления выходного аудиосигнала (OS) из битового потока во время активной фазы;
определения спектра (SAS) выходного аудиосигнала (OS);
определения первого спектра (SN1) шума выходного аудиосигнала (OS), основываясь на спектре (SAS) выходного аудиосигнала (OS), в котором первый спектр (SN1) шума выходного аудиосигнала (OS) имеет более высокое спектральное разрешение, чем спектр (SBN) фонового шума;
установления второго спектра (SN2) шума выходного аудиосигнала (OS), основываясь на первом спектре (SN1) шума выходного аудиосигнала (OS), в котором второй спектр (SN2) шума выходного аудиосигнала (OS) имеет такое же спектральное разрешение, что и спектр (SBN) фонового шума;
вычисления масштабных коэффициентов для спектра (SCN) для комфортного шума (CN), основываясь на спектре (SBN) фонового шума и основываясь на втором спектре (SN2) шума выходного аудиосигнала (OS); и
получения комфортного шума (CN) во время неактивной фазы, основываясь на спектре (SCN) для комфортного шума (CN).
19. Машиночитаемый носитель, содержащий компьютерную программу для выполнения способа по п. 18 при исполнении ее на компьютере или процессоре.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201261740857P | 2012-12-21 | 2012-12-21 | |
US61/740,857 | 2012-12-21 | ||
PCT/EP2013/077525 WO2014096279A1 (en) | 2012-12-21 | 2013-12-19 | Generation of a comfort noise with high spectro-temporal resolution in discontinuous transmission of audio signals |
Publications (2)
Publication Number | Publication Date |
---|---|
RU2015129691A RU2015129691A (ru) | 2017-01-26 |
RU2650025C2 true RU2650025C2 (ru) | 2018-04-06 |
Family
ID=49949638
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2015129691A RU2650025C2 (ru) | 2012-12-21 | 2013-12-19 | Генерирование комфортного шума с высоким спектрально-временным разрешением при прерывистой передаче аудиосигналов |
Country Status (20)
Country | Link |
---|---|
US (1) | US9583114B2 (ru) |
EP (1) | EP2936487B1 (ru) |
JP (1) | JP6180544B2 (ru) |
KR (1) | KR101690899B1 (ru) |
CN (1) | CN104871242B (ru) |
AR (1) | AR094278A1 (ru) |
AU (1) | AU2013366642B2 (ru) |
BR (1) | BR112015014212B1 (ru) |
CA (1) | CA2894625C (ru) |
ES (1) | ES2588156T3 (ru) |
HK (1) | HK1216448A1 (ru) |
MX (1) | MX344169B (ru) |
MY (1) | MY171106A (ru) |
PL (1) | PL2936487T3 (ru) |
PT (1) | PT2936487T (ru) |
RU (1) | RU2650025C2 (ru) |
SG (1) | SG11201504810YA (ru) |
TW (1) | TWI539445B (ru) |
WO (1) | WO2014096279A1 (ru) |
ZA (1) | ZA201505193B (ru) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
USD589322S1 (en) | 2006-10-05 | 2009-03-31 | Lowe's Companies, Inc. | Tool handle |
CN103187065B (zh) * | 2011-12-30 | 2015-12-16 | 华为技术有限公司 | 音频数据的处理方法、装置和系统 |
CA2894625C (en) | 2012-12-21 | 2017-11-07 | Anthony LOMBARD | Generation of a comfort noise with high spectro-temporal resolution in discontinuous transmission of audio signals |
MY178710A (en) | 2012-12-21 | 2020-10-20 | Fraunhofer Ges Forschung | Comfort noise addition for modeling background noise at low bit-rates |
EP2980790A1 (en) * | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for comfort noise generation mode selection |
EP2980801A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Method for estimating noise in an audio signal, noise estimator, audio encoder, audio decoder, and system for transmitting audio signals |
US10325588B2 (en) * | 2017-09-28 | 2019-06-18 | International Business Machines Corporation | Acoustic feature extractor selected according to status flag of frame of acoustic signal |
US10805191B2 (en) | 2018-12-14 | 2020-10-13 | At&T Intellectual Property I, L.P. | Systems and methods for analyzing performance silence packets |
GB2595891A (en) * | 2020-06-10 | 2021-12-15 | Nokia Technologies Oy | Adapting multi-source inputs for constant rate encoding |
CN116075889A (zh) | 2020-08-31 | 2023-05-05 | 弗劳恩霍夫应用研究促进协会 | 依赖混合噪声信号的多声道信号产生器、音频编码器及相关方法 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1229520A2 (en) * | 2000-10-31 | 2002-08-07 | Telogy Networks Inc. | Silence insertion descriptor (sid) frame detection with human auditory perception compensation |
RU2237296C2 (ru) * | 1998-11-23 | 2004-09-27 | Телефонактиеболагет Лм Эрикссон (Пабл) | Кодирование речи с функцией изменения комфортного шума для повышения точности воспроизведения |
US6873604B1 (en) * | 2000-07-31 | 2005-03-29 | Cisco Technology, Inc. | Method and apparatus for transitioning comfort noise in an IP-based telephony system |
WO2006136901A2 (en) * | 2005-06-18 | 2006-12-28 | Nokia Corporation | System and method for adaptive transmission of comfort noise parameters during discontinuous speech transmission |
WO2010040522A2 (en) * | 2008-10-08 | 2010-04-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e. V. | Multi-resolution switched audio encoding/decoding scheme |
WO2010148516A1 (en) * | 2009-06-23 | 2010-12-29 | Voiceage Corporation | Forward time-domain aliasing cancellation with application in weighted or original signal domain |
WO2012110482A2 (en) * | 2011-02-14 | 2012-08-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Noise generation in audio codecs |
RU2461898C2 (ru) * | 2008-03-26 | 2012-09-20 | Хуавэй Текнолоджиз Ко., Лтд. | Способ и устройство для кодирования и декодирования |
Family Cites Families (32)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5537509A (en) * | 1990-12-06 | 1996-07-16 | Hughes Electronics | Comfort noise generation for digital communication systems |
DE69232202T2 (de) | 1991-06-11 | 2002-07-25 | Qualcomm, Inc. | Vocoder mit veraendlicher bitrate |
US5630016A (en) * | 1992-05-28 | 1997-05-13 | Hughes Electronics | Comfort noise generation for digital communication systems |
US5657422A (en) | 1994-01-28 | 1997-08-12 | Lucent Technologies Inc. | Voice activity detection driven noise remediator |
FI101439B1 (fi) * | 1995-04-13 | 1998-06-15 | Nokia Telecommunications Oy | Transkooderi, jossa on tandem-koodauksen esto |
JP3252782B2 (ja) | 1998-01-13 | 2002-02-04 | 日本電気株式会社 | モデム信号対応音声符号化復号化装置 |
US6122611A (en) | 1998-05-11 | 2000-09-19 | Conexant Systems, Inc. | Adding noise during LPC coded voice activity periods to improve the quality of coded speech coexisting with background noise |
US6424938B1 (en) | 1998-11-23 | 2002-07-23 | Telefonaktiebolaget L M Ericsson | Complex signal activity detection for improved speech/noise classification of an audio signal |
US8583427B2 (en) * | 1999-11-18 | 2013-11-12 | Broadcom Corporation | Voice and data exchange over a packet based network with voice detection |
US20070110042A1 (en) * | 1999-12-09 | 2007-05-17 | Henry Li | Voice and data exchange over a packet based network |
JP2001318694A (ja) | 2000-05-10 | 2001-11-16 | Toshiba Corp | 信号処理装置、信号処理方法および記録媒体 |
US6615169B1 (en) * | 2000-10-18 | 2003-09-02 | Nokia Corporation | High frequency enhancement layer coding in wideband speech codec |
US20030120484A1 (en) | 2001-06-12 | 2003-06-26 | David Wong | Method and system for generating colored comfort noise in the absence of silence insertion description packets |
CA2388439A1 (en) | 2002-05-31 | 2003-11-30 | Voiceage Corporation | A method and device for efficient frame erasure concealment in linear predictive based speech codecs |
CN1703736A (zh) * | 2002-10-11 | 2005-11-30 | 诺基亚有限公司 | 用于源控制可变比特率宽带语音编码的方法和装置 |
JP4311541B2 (ja) | 2003-10-06 | 2009-08-12 | アルパイン株式会社 | オーディオ信号圧縮装置 |
US7649988B2 (en) * | 2004-06-15 | 2010-01-19 | Acoustic Technologies, Inc. | Comfort noise generator using modified Doblinger noise estimate |
US7454010B1 (en) * | 2004-11-03 | 2008-11-18 | Acoustic Technologies, Inc. | Noise reduction and comfort noise gain control using bark band weiner filter and linear attenuation |
US7610197B2 (en) | 2005-08-31 | 2009-10-27 | Motorola, Inc. | Method and apparatus for comfort noise generation in speech communication systems |
US8139777B2 (en) * | 2007-10-31 | 2012-03-20 | Qnx Software Systems Co. | System for comfort noise injection |
US8483854B2 (en) | 2008-01-28 | 2013-07-09 | Qualcomm Incorporated | Systems, methods, and apparatus for context processing using multiple microphones |
DE102008009719A1 (de) * | 2008-02-19 | 2009-08-20 | Siemens Enterprise Communications Gmbh & Co. Kg | Verfahren und Mittel zur Enkodierung von Hintergrundrauschinformationen |
US20090222268A1 (en) * | 2008-03-03 | 2009-09-03 | Qnx Software Systems (Wavemakers), Inc. | Speech synthesis system having artificial excitation signal |
CA2836871C (en) | 2008-07-11 | 2017-07-18 | Stefan Bayer | Time warp activation signal provider, audio signal encoder, method for providing a time warp activation signal, method for encoding an audio signal and computer programs |
WO2011049515A1 (en) | 2009-10-19 | 2011-04-28 | Telefonaktiebolaget Lm Ericsson (Publ) | Method and voice activity detector for a speech encoder |
SI3239979T1 (sl) | 2010-10-25 | 2024-09-30 | Voiceage Evs Llc | Kodiranje generičnih zvočnih signalov pri nizkih bitnih hitrostih in majhni zakasnitvi |
EP3493205B1 (en) | 2010-12-24 | 2020-12-23 | Huawei Technologies Co., Ltd. | Method and apparatus for adaptively detecting a voice activity in an input audio signal |
PL2676264T3 (pl) * | 2011-02-14 | 2015-06-30 | Fraunhofer Ges Forschung | Koder audio estymujący szum tła podczas faz aktywnych |
US20120237048A1 (en) | 2011-03-14 | 2012-09-20 | Continental Automotive Systems, Inc. | Apparatus and method for echo suppression |
CN107195313B (zh) | 2012-08-31 | 2021-02-09 | 瑞典爱立信有限公司 | 用于语音活动性检测的方法和设备 |
CA2894625C (en) | 2012-12-21 | 2017-11-07 | Anthony LOMBARD | Generation of a comfort noise with high spectro-temporal resolution in discontinuous transmission of audio signals |
US9106196B2 (en) | 2013-06-20 | 2015-08-11 | 2236008 Ontario Inc. | Sound field spatial stabilizer with echo spectral coherence compensation |
-
2013
- 2013-12-19 CA CA2894625A patent/CA2894625C/en active Active
- 2013-12-19 MY MYPI2015001606A patent/MY171106A/en unknown
- 2013-12-19 EP EP13819029.3A patent/EP2936487B1/en active Active
- 2013-12-19 WO PCT/EP2013/077525 patent/WO2014096279A1/en active Application Filing
- 2013-12-19 ES ES13819029.3T patent/ES2588156T3/es active Active
- 2013-12-19 BR BR112015014212-5A patent/BR112015014212B1/pt active IP Right Grant
- 2013-12-19 CN CN201380067152.7A patent/CN104871242B/zh active Active
- 2013-12-19 PL PL13819029.3T patent/PL2936487T3/pl unknown
- 2013-12-19 AU AU2013366642A patent/AU2013366642B2/en active Active
- 2013-12-19 RU RU2015129691A patent/RU2650025C2/ru active
- 2013-12-19 PT PT138190293T patent/PT2936487T/pt unknown
- 2013-12-19 JP JP2015548605A patent/JP6180544B2/ja active Active
- 2013-12-19 SG SG11201504810YA patent/SG11201504810YA/en unknown
- 2013-12-19 KR KR1020157019048A patent/KR101690899B1/ko active IP Right Grant
- 2013-12-19 MX MX2015007434A patent/MX344169B/es active IP Right Grant
- 2013-12-20 TW TW102147454A patent/TWI539445B/zh active
- 2013-12-20 AR ARP130105026A patent/AR094278A1/es active IP Right Grant
-
2015
- 2015-06-19 US US14/744,715 patent/US9583114B2/en active Active
- 2015-07-20 ZA ZA2015/05193A patent/ZA201505193B/en unknown
-
2016
- 2016-04-18 HK HK16104369.7A patent/HK1216448A1/zh unknown
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2237296C2 (ru) * | 1998-11-23 | 2004-09-27 | Телефонактиеболагет Лм Эрикссон (Пабл) | Кодирование речи с функцией изменения комфортного шума для повышения точности воспроизведения |
US6873604B1 (en) * | 2000-07-31 | 2005-03-29 | Cisco Technology, Inc. | Method and apparatus for transitioning comfort noise in an IP-based telephony system |
EP1229520A2 (en) * | 2000-10-31 | 2002-08-07 | Telogy Networks Inc. | Silence insertion descriptor (sid) frame detection with human auditory perception compensation |
WO2006136901A2 (en) * | 2005-06-18 | 2006-12-28 | Nokia Corporation | System and method for adaptive transmission of comfort noise parameters during discontinuous speech transmission |
RU2461898C2 (ru) * | 2008-03-26 | 2012-09-20 | Хуавэй Текнолоджиз Ко., Лтд. | Способ и устройство для кодирования и декодирования |
WO2010040522A2 (en) * | 2008-10-08 | 2010-04-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e. V. | Multi-resolution switched audio encoding/decoding scheme |
WO2010148516A1 (en) * | 2009-06-23 | 2010-12-29 | Voiceage Corporation | Forward time-domain aliasing cancellation with application in weighted or original signal domain |
WO2012110482A2 (en) * | 2011-02-14 | 2012-08-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Noise generation in audio codecs |
Also Published As
Publication number | Publication date |
---|---|
AR094278A1 (es) | 2015-07-22 |
HK1216448A1 (zh) | 2016-11-11 |
ES2588156T3 (es) | 2016-10-31 |
MY171106A (en) | 2019-09-25 |
MX344169B (es) | 2016-12-07 |
EP2936487A1 (en) | 2015-10-28 |
TW201428734A (zh) | 2014-07-16 |
PT2936487T (pt) | 2016-09-23 |
JP2016500452A (ja) | 2016-01-12 |
JP6180544B2 (ja) | 2017-08-16 |
TWI539445B (zh) | 2016-06-21 |
ZA201505193B (en) | 2016-07-27 |
MX2015007434A (es) | 2015-09-16 |
WO2014096279A1 (en) | 2014-06-26 |
EP2936487B1 (en) | 2016-06-22 |
CN104871242B (zh) | 2017-10-24 |
CA2894625A1 (en) | 2014-06-26 |
RU2015129691A (ru) | 2017-01-26 |
AU2013366642A1 (en) | 2015-07-02 |
KR101690899B1 (ko) | 2016-12-28 |
CA2894625C (en) | 2017-11-07 |
CN104871242A (zh) | 2015-08-26 |
PL2936487T3 (pl) | 2016-12-30 |
US20150287415A1 (en) | 2015-10-08 |
US9583114B2 (en) | 2017-02-28 |
SG11201504810YA (en) | 2015-07-30 |
BR112015014212B1 (pt) | 2021-10-19 |
KR20150096494A (ko) | 2015-08-24 |
AU2013366642B2 (en) | 2016-09-22 |
BR112015014212A2 (pt) | 2017-08-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2650025C2 (ru) | Генерирование комфортного шума с высоким спектрально-временным разрешением при прерывистой передаче аудиосигналов | |
JP7345694B2 (ja) | 高周波再構成の際のオーディオ信号処理 | |
US10115407B2 (en) | Method and apparatus for encoding and decoding high frequency signal | |
US8918196B2 (en) | Method for weighted overlap-add | |
JP6849619B2 (ja) | 低ビットレートで背景ノイズをモデル化するためのコンフォートノイズ付加 | |
US20050096917A1 (en) | Methods for improving high frequency reconstruction | |
RU2612589C2 (ru) | Низкочастотное акцентирование для основанного на lpc кодирования в частотной области | |
KR20110139294A (ko) | 오디오 신호 조작 장치 및 방법 | |
US20090192789A1 (en) | Method and apparatus for encoding/decoding audio signals | |
RU2648953C2 (ru) | Наполнение шумом без побочной информации для celp-подобных кодеров | |
US11380341B2 (en) | Selecting pitch lag |