RU2402826C2 - Способы и устройство кодирования и декодирования части речевого сигнала диапазона высоких частот - Google Patents
Способы и устройство кодирования и декодирования части речевого сигнала диапазона высоких частот Download PDFInfo
- Publication number
- RU2402826C2 RU2402826C2 RU2007140383/09A RU2007140383A RU2402826C2 RU 2402826 C2 RU2402826 C2 RU 2402826C2 RU 2007140383/09 A RU2007140383/09 A RU 2007140383/09A RU 2007140383 A RU2007140383 A RU 2007140383A RU 2402826 C2 RU2402826 C2 RU 2402826C2
- Authority
- RU
- Russia
- Prior art keywords
- signal
- frequency range
- narrowband
- high frequency
- highband
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
- G10L19/0208—Subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
- G10L21/0388—Details of processing therefor
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
- G10L19/038—Vector quantisation, e.g. TwinVQ audio
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0232—Processing in the frequency domain
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
Abstract
Изобретение относится к обработке речевого сигнала. Широкополосный речевой кодер, согласно одному варианту осуществления, включает в себя кодер диапазона низких частот и кодер диапазона высоких частот. Кодер диапазона низких частот выполнен с возможностью кодирования части широкополосного речевого сигнала диапазона низких частот как набор параметров фильтра и кодированный сигнал возбуждения. Кодер диапазона высоких частот выполнен с возможностью вычисления значений параметров кодирования, которые задают спектральную огибающую и временную огибающую части широкополосного речевого сигнала диапазона высоких частот. Временная огибающая основана на сигнале возбуждения диапазона высоких частот, полученном из кодированного сигнала возбуждения. В одном таком примере временная огибающая основана на разности уровней между частью в диапазоне высоких частот и синтезированным сигналом диапазона высоких частот, причем синтезированный сигнал диапазона высоких частот генерируется согласно сигналу возбуждения диапазона высоких частот и набору параметров фильтра диапазона высоких частот. Технический результат - обеспечение расширения узкополосного речевого кодера для поддержки передачи и/или сохранения широкополосных речевых сигналов при увеличении пропускной способности. 5 н. и 26 з.п. ф-лы, 46 ил.
Description
Область техники, к которой относится изобретение
Данное изобретение относится к обработке сигнала.
Уровень техники
Голосовая связь посредством коммутируемой телефонной сети общего пользования (PSTN) традиционно ограничена по пропускной способности частотным диапазоном 300-3400 кГц. Новые сети для голосовой связи, например сети сотовой связи и передачи голоса по IP (Интернет-протокол, VoIP), могут не иметь такие же ограничения по пропускной способности, и может оказаться желательно передавать и принимать по таким сетям голосовые передачи, которые включают в себя широкий частотный диапазон. Например, может оказаться желательно поддерживать частотный диапазон звука с нижней границей до 50 Гц и/или верхней границей до 7 или 8 кГц. Также может оказаться желательно поддерживать другие приложения, например высококачественную аудио- или аудио/видеоконференцсвязь, которая может иметь аудиоречевой контент в диапазонах, выходящих за пределы традиционных ограничений PSTN.
Расширение диапазона, поддерживаемого речевым кодером, на более высокие частоты может повысить разборчивость речи. Например, информация, которая дифференцирует фрикативные звуки, например 'с' и 'ф', увеличивается на высоких частотах. Расширение диапазона высоких частот (ДВЧ) также может повысить другие качества речи, например присутствие. Например, даже вокализованный гласный звук может иметь спектральную энергию значительно выше ограничения PSTN.
Один подход к широкополосному речевому кодированию предусматривает распространение техники узкополосного речевого кодирования (например, способной кодировать диапазон 0-4 кГц) на широкий спектр. Например, речевой сигнал можно дискретизировать на более высокой частоте, чтобы он включал в себя высокочастотные компоненты, и технику узкополосного кодирования можно перестроить для использования большего количества коэффициентов фильтра, представляющих этот широкополосный сигнал. Техники узкополосного кодирования, например CELP (линейное прогнозирование с кодовым возбуждением), требуют большого объема вычислений, однако широкополосный CELP-кодер может требовать слишком много циклов обработки, чтобы иметь практическое применение во многих мобильных и иных встроенных приложениях. Кодирование всего спектра широкополосного сигнала для достижения нужного качества с использованием такой техники также может приводить к неприемлемо большому увеличению ширины полосы. Кроме того, потребовалось бы перекодирование такого кодированного сигнала прежде, чем передать даже его узкополосную часть и/или декодировать посредством системы, которая поддерживает только узкополосное кодирование.
Другой подход к широкополосному речевому кодированию предусматривает экстраполяцию спектральной огибающей диапазона высоких частот из кодированной узкополосной спектральной огибающей. Хотя такой подход можно реализовать без увеличения ширины полосы и без необходимости в перекодировании, грубую спектральную огибающую или формантную структуру части речевого сигнала диапазона высоких частот, в общем случае, невозможно точно прогнозировать на основании спектральной огибающей узкополосной части.
Может оказаться желательно реализовать широкополосное речевое кодирование так, чтобы, по меньшей мере, узкополосную часть кодированного сигнала можно было передавать по узкополосному каналу (например, каналу PSTN) без перекодирования или другого значительного изменения. Эффективность широкополосного расширения кодирования также может быть желательной, например, во избежание значительного сокращения количества пользователей, которые могут обслуживаться в приложениях, например беспроводной сотовой телефонной сети и вещании по беспроводным и проводным каналам.
Сущность изобретения
Согласно одному варианту осуществления, способ кодирования части речевого сигнала диапазона высоких частот, имеющего часть в диапазоне низких частот и часть в диапазоне высоких частот, содержит этапы, на которых вычисляют совокупность параметров фильтра, характеризующих спектральную огибающую части в диапазоне высоких частот; вычисляют спектрально расширенный сигнал путем расширения спектра сигнала, полученного из части в диапазоне низких частот; генерируют синтезированный сигнал диапазона высоких частот согласно (A) сигналу возбуждения диапазона высоких частот, основанному на спектрально расширенном сигнале, и (B) совокупности параметров фильтра; и вычисляют огибающую усиления на основании соотношения между частью в диапазоне высоких частот и сигналом, основанным на части в диапазоне низких частот.
Согласно одному варианту осуществления, способ обработки речи включает в себя этапы, на которых генерируют сигнал возбуждения диапазона высоких частот на основании сигнала возбуждения диапазона низких частот; генерируют синтезированный сигнал диапазона высоких частот на основании речевого сигнала диапазона высоких частот и сигнала возбуждения диапазона высоких частот; и вычисляют совокупность коэффициентов усиления на основании соотношения между речевым сигналом диапазона высоких частот и сигналом, основанным на сигнале возбуждения диапазона низких частот.
Согласно другому варианту осуществления, способ декодирования части речевого сигнала диапазона высоких частот, имеющего часть в диапазоне низких частот и часть в диапазоне высоких частот, содержит этапы, на которых принимают совокупность параметров фильтра, характеризующих спектральную огибающую части в диапазоне высоких частот, и совокупность коэффициентов усиления, характеризующих временную огибающую части в диапазоне высоких частот; вычисляют спектрально расширенный сигнал путем расширения спектра сигнала, который основан на сигнале возбуждения диапазона низких частот; генерируют синтезированный сигнал диапазона высоких частот согласно (A) совокупности параметров фильтра и (B) сигналу возбуждения диапазона высоких частот, основанному на спектрально расширенном сигнале; и модулируют огибающую усиления синтезированного сигнала диапазона высоких частот согласно совокупности коэффициентов усиления.
Согласно еще одному варианту осуществления, устройство, выполненное с возможностью кодирования части речевого сигнала диапазона высоких частот, имеющего часть в диапазоне низких частот и часть в диапазоне высоких частот, содержит модуль анализа, выполненный с возможностью вычисления набора параметров фильтра, характеризующих спектральную огибающую части в диапазоне высоких частот; расширитель спектра, выполненный с возможностью вычисления спектрально расширенного сигнала путем расширения спектра сигнала, полученного из части в диапазоне низких частот; синтезирующий фильтр, выполненный с возможностью генерирования синтезированного сигнала диапазона высоких частот согласно (A) сигналу возбуждения диапазона высоких частот, основанному на спектрально расширенном сигнале, и (B) набору параметров фильтра; и калькулятор коэффициента усиления, выполненный с возможностью вычисления огибающей усиления на основании соотношения, изменяющегося со временем, между частью в диапазоне высоких частот и сигналом, основанным на части в диапазоне низких частот.
Согласно еще одному варианту осуществления, речевой декодер диапазона высоких частот выполнен с возможностью приема (A) совокупности параметров фильтра, характеризующих спектральную огибающую части речевого сигнала диапазона высоких частот, и (B) кодированного сигнала возбуждения диапазона низких частот, основанного на части речевого сигнала диапазона низких частот. Декодер включает в себя расширитель спектра, выполненный с возможностью вычисления спектрально расширенного сигнала путем расширения спектра сигнала, который основан на кодированном сигнале возбуждения диапазона низких частот; синтезирующий фильтр, выполненный с возможностью генерирования синтезированного сигнала диапазона высоких частот согласно (А) совокупности параметров фильтра, характеризующих спектральную огибающую части в диапазоне высоких частот, и (В) сигналу возбуждения диапазона высоких частот, основанному на спектрально расширенном сигнале; и элемент регулировки усиления, выполненный с возможностью модулирования огибающей усиления синтезированного сигнала диапазона высоких частот согласно совокупности коэффициентов усиления, характеризующих временную огибающую часть в диапазоне высоких частот.
Краткое описание чертежей
Фиг.1а - блок-схема речевого кодера А100 диапазона высоких частот согласно варианту осуществления.
Фиг.1b - блок-схема реализации А102 широкополосного речевого кодера А100.
Фиг.2а - блок-схема широкополосного речевого декодера В100 согласно варианту осуществления.
Фиг.2b - блок-схема реализации В102 широкополосного речевого декодера В100.
Фиг.3а - блок-схема реализации А112 блока (гребенки) фильтров А110.
Фиг.3b - блок-схема реализации В122 гребенки фильтров В120.
Фиг.4а - полоса частот диапазонов низких и высоких частот для одного примера гребенки фильтров А110.
Фиг.4b - полоса частот диапазонов низких и высоких частот для другого примера гребенки фильтров А110.
Фиг.4с - блок-схема реализации А114 гребенки фильтров А112.
Фиг.4d - блок-схема реализации В124 гребенки фильтров В122.
Фиг.5а - пример графика зависимости частоты от логарифмической амплитуды для речевого сигнала.
Фиг.5b - блок-схема базовой системы кодирования с линейным прогнозированием.
Фиг.6 - блок-схема реализации А122 узкополосного кодера А120.
Фиг.7 - блок-схема реализации В112 узкополосного декодера В110.
Фиг.8а - пример графика зависимости частоты от логарифмической амплитуды для остаточного сигнала для вокализованной речи.
Фиг.8b - пример графика зависимости времени от логарифмической амплитуды для остаточного сигнала для вокализованной речи.
Фиг.9 - блок-схема базовой системы кодирования с линейным прогнозированием, которая также осуществляет долгосрочное прогнозирование.
Фиг.10 - блок-схема реализации А202 кодера А200 диапазона высоких частот.
Фиг.11 - блок-схема реализации А302 генератора возбуждения А300 диапазона высоких частот.
Фиг.12 - блок-схема реализации А402 расширителя спектра А400.
Фиг. 12a - графики спектров сигнала в различных точках в одном примере операции расширения спектра.
Фиг. 12b - графики спектров сигнала в различных точках в другом примере операции расширения спектра.
Фиг. 13 - блок-схема реализации A304 генератора возбуждения A302 диапазона высоких частот.
Фиг. 14 - блок-схема реализации A306 генератора возбуждения A302 диапазона высоких частот.
Фиг. 15 - логическая блок-схема задачи (программного модуля) T100 вычисления огибающей.
Фиг. 16 - блок-схема реализации 492 объединителя 490.
Фиг. 17 иллюстрирует подход к вычислению показателя периодичности сигнала S30 диапазона высоких частот.
Фиг. 18 - блок-схема реализации A312 генератора возбуждения A302 диапазона высоких частот.
Фиг. 19 - блок-схема реализации A314 генератора возбуждения A302 диапазона высоких частот.
Фиг. 20 - блок-схема реализации A316 генератора возбуждения A302 диапазона высоких частот.
Фиг. 21 - логическая блок-схема задачи T200 вычисления коэффициента усиления.
Фиг. 22 - логическая блок-схема реализации T210 задачи T200 вычисления коэффициента усиления.
Фиг. 23a - диаграмма вырезающей функции.
Фиг. 23b - применение вырезающей функции, показанной на фиг. 23a, к подкадрам речевого сигнала.
Фиг. 24 - блок-схема реализации B202 декодера B200 диапазона высоких частот.
Фиг.25 - блок-схема реализации AD10 широкополосного речевого кодера А100.
Фиг.26а - схема реализации D122 линии задержки D120.
Фиг.26b - схема реализации D124 линии задержки D120.
Фиг.27 - схема реализации D130 линии задержки D120.
Фиг.28 - блок-схема реализации AD12 широкополосного речевого кодера AD10.
Фиг.29 - логическая блок-схема способа обработки сигнала MD100 согласно варианту осуществления.
Фиг.30 - логическая блок-схема способа М100 согласно варианту осуществления.
Фиг.31а - логическая блок-схема способа М200 согласно варианту осуществления.
Фиг.31b - логическая блок-схема для реализации М210 способа М200.
Фиг.32 - логическая блок-схема способа М300 согласно варианту осуществления.
Фиг.33 - блок-схема реализации А204 высокополосного кодера А200.
На чертежах и в прилагаемом описании одинаковые позиции обозначают одинаковые или аналогичные элементы или сигналы.
Подробное описание
Описанные здесь варианты осуществления включают в себя системы, способы и устройство, которые могут быть способны обеспечивать расширение узкополосного речевого кодера для поддержки передачи и/или сохранения широкополосных речевых сигналов при увеличении пропускной способности лишь примерно от 800 до 1000 бит/с (бит в секунду). Потенциальные преимущества таких реализаций включают в себя встроенное кодирование для поддержки совместимости с узкополосными системами, относительно легкое выделение и повторное выделение битов между каналами узкополосного кодирования и кодирования в диапазоне высоких частот, освобождение от операции широкополосного синтеза, требующего большого объема вычислений, и поддержку низкой частоты дискретизации для сигналов, обрабатываемых посредством процедур кодирования формы волны, требующих большого объема вычислений.
Если в явном виде не указано в контексте, термин "вычисление" используется здесь для указания любого из его обычных значений, например расчет, генерация и выбор из списка значений. Термин "содержащий", используемый в настоящем описании и формуле изобретения, не исключает других элементов или операций. Выражение "A основано на B" используется для указания любого из его обычных значений, в том числе случаев (i) "A равно B" и (ii) "A основано на, по меньшей мере, B". Термин "Интернет-протокол" включает в себя версию 4, описанную в IETF (Internet Engineering Task Force) RFC (Request for Comments) 791, и последующие версии, например версию 6.
На фиг. 1a показана блок-схема широкополосного речевого кодера A100 согласно варианту осуществления. Гребенка фильтров A110 способна фильтровать широкополосный речевой сигнал S10 для создания узкополосного сигнала S20 и сигнала S30 диапазона высоких частот. Узкополосный кодер A120 способен кодировать узкополосный сигнал S20 для создания узкополосных (NB) параметров фильтра S40 и узкополосного остаточного сигнала S50. Согласно приведенному здесь более подробному описанию, узкополосный кодер A120 обычно способен создавать узкополосные параметры фильтра S40 и кодированный узкополосный сигнал возбуждения S50 в виде индексов кодовой книги или в другой квантованной форме. Кодер A200 диапазона высоких частот способен кодировать сигнал S30 диапазона высоких частот согласно информации в кодированном узкополосном сигнале возбуждения S50 для создания параметров кодирования S60 диапазона высоких частот. Согласно приведенному здесь более подробному описанию, кодер A200 диапазона высоких частот обычно способен создавать параметры кодирования S60 диапазона высоких частот в виде индексов кодовой книги или в другой квантованной форме. В одном конкретном примере, широкополосный речевой кодер A100 способен кодировать широкополосный речевой сигнал S10 со скоростью около 8,55 кбит/с (килобит в секунду), при этом около 7,55 кбит/с используется для узкополосных параметров фильтра S40 и кодированного узкополосного сигнала возбуждения S50, и около 1 кбит/с используется для параметров кодирования S60 диапазона высоких частот.
Может оказаться желательно объединять кодированные узкополосный сигнал и сигнал диапазона высоких частот в единый битовый поток. Например, может оказаться желательно мультиплексировать кодированные сигналы друг с другом для передачи (например, по проводному, оптическому или беспроводному каналу связи) или для сохранения в виде кодированного широкополосного речевого сигнала. На фиг. 1b показана блок-схема реализации A102 широкополосного речевого кодера A100, который включает в себя мультиплексор A130, способный объединять параметры узкополосного фильтра S40, кодированный узкополосный сигнал возбуждения S50 и параметры фильтра S60 диапазона высоких частот в мультиплексированный сигнал S70.
Устройство, включающее в себя кодер A102, также может включать в себя схему, способную передавать мультиплексированный сигнал S70 в канал связи, например проводной, оптический или беспроводной канал. Такое устройство также может быть способно осуществлять одну или несколько канальных операций кодирования на сигнале, например кодирование с коррекцией ошибок (например, сверточное кодирование, совместимое по скорости) и/или кодирование с обнаружением ошибок (например, кодирование с циклической избыточностью) и/или кодирование на одном или нескольких уровнях сетевого протокола (например, Ethernet, TCP/IP, cdma2000).
Может оказаться желательно, чтобы мультиплексор A130 был способен внедрять кодированный узкополосный сигнал (включающий в себя узкополосные параметры фильтра S40 и кодированный узкополосный сигнал возбуждения S50) в виде разделяемого битового потока мультиплексированного сигнала S70, что позволило бы восстанавливать и декодировать кодированный узкополосный сигнал независимо от другой части мультиплексированного сигнала S70, например сигнала диапазона высоких частот и/или диапазона низких частот. Например, мультиплексированный сигнал S70 может быть построен так, что кодированный узкополосный сигнал можно восстанавливать, отбрасывая параметры фильтра S60 диапазона высоких частот. Еще одно потенциальное преимущество такой особенности в том, что она позволяет избегать необходимости в перекодировании кодированного широкополосного сигнала до передачи его в систему, которая поддерживает декодирование узкополосного сигнала, но не поддерживает декодирование части в диапазоне высоких частот.
На фиг.2a показана блок-схема широкополосного речевого декодера B100 согласно варианту осуществления. Узкополосный декодер B110 способен декодировать узкополосные параметры фильтра S40 и кодированный узкополосный сигнал возбуждения S50 для создания узкополосного сигнала S90. Декодер B200 диапазона высоких частот способен декодировать параметры кодирования S60 диапазона высоких частот согласно узкополосному сигналу возбуждения S80, на основании кодированного узкополосного сигнала возбуждения S50, для создания сигнала S100 диапазона высоких частот. В этом примере, узкополосный декодер B110 способен выдавать узкополосный сигнал возбуждения S80 на декодер B200 диапазона высоких частот. Гребенка фильтров B120 способна объединять узкополосный сигнал S90 и сигнал S100 диапазона высоких частот для создания широкополосного речевого сигнала S110.
На фиг.2b показана блок-схема реализации B102 широкополосного речевого декодера B100, который включает в себя демультиплексор B130, способный создавать кодированные сигналы S40, S50 и S60 из мультиплексированного сигнала S70. Устройство, включающее в себя декодер B102, может включать в себя схему, способную принимать мультиплексированный сигнал S70 из канала связи, например, проводного, оптического или беспроводного канала. Такое устройство также может быть способно осуществлять одну или несколько канальных операций декодирования на сигнале, например декодирование с коррекцией ошибок (например, сверточное декодирование, совместимое по скорости) и/или декодирование с обнаружением ошибок (например, декодирование с циклической избыточностью), и/или декодирование на одном или нескольких слоях сетевого протокола (например, Ethernet, TCP/IP, cdma2000).
Гребенка фильтров A110 способна фильтровать входной сигнал согласно схеме расщепленных диапазонов для создания низкочастотного поддиапазона и высокочастотного поддиапазона. В зависимости от критериев конструкции для конкретного приложения, поддиапазоны выходного сигнала могут иметь полосы равной или неравной ширины и могут быть перекрывающимися или неперекрывающимися. Возможна также конфигурация гребенки фильтров A110, которая создает более двух поддиапазонов. Например, такая гребенка фильтров может быть способна создавать один или несколько сигналов диапазона низких частот, которые включают в себя составляющие в частотном диапазоне с частотой ниже, чем в узкополосном сигнале S20 (например, в диапазоне 50-300 Гц). Такая гребенка фильтров также может быть способна создавать один или несколько дополнительных сигналов диапазона высоких частот, которые включают в себя составляющие в частотном диапазоне с частотой выше, чем в сигнале S30 диапазона высоких частот (например, в диапазоне 14-20, 16-20 или 16-32 кГц). В таком случае, можно реализовать широкополосный речевой кодер A100 для отдельного кодирования этого/их сигнала или сигналов, и мультиплексор A130 может быть способен включать в себя дополнительный/е кодированный/е сигнал или сигналы в мультиплексированном сигнале S70 (например, в качестве отдельной части).
На фиг.3a показана блок-схема реализации A112 гребенки фильтров A110, которая способна создавать сигналы двух поддиапазонов, имеющих сниженные частоты дискретизации. Гребенка фильтров A110 способна принимать широкополосный речевой сигнал S10, имеющий высокочастотную (или диапазона высоких частот) часть и низкочастотную (или диапазона низких частот) часть. Гребенка фильтров A112 включает в себя тракт обработки диапазона низких частот, способный принимать широкополосный речевой сигнал S10 и создавать узкополосный речевой сигнал S20, и тракт обработки диапазона высоких частот, способный принимать широкополосный речевой сигнал S10 и создавать речевой сигнал S30 диапазона высоких частот. Фильтр 110 нижних частот фильтрует широкополосный речевой сигнал S10, пропуская выбранный низкочастотный поддиапазон, и фильтр 130 верхних частот фильтрует широкополосный речевой сигнал S10, пропуская выбранный высокочастотный поддиапазон. Поскольку сигналы обоих поддиапазонов имеют более узкие полосы, чем широкополосный речевой сигнал S10, их частоты дискретизации можно снизить до некоторой степени без потери информации. Блок 120 понижения частоты дискретизации снижает частоту дискретизации низкочастотного сигнала согласно нужному коэффициенту децимации (например, путем удаления выборок сигнала и/или замены выборок средними значениями), и блок 140 понижения частоты дискретизации аналогично снижет частоту дискретизации высокочастотного сигнала согласно другому нужному коэффициенту децимации.
На фиг.3b показана блок-схема соответствующей реализации B122 гребенки фильтров B120. Блок 150 повышения частоты дискретизации повышает частоту дискретизации узкополосного сигнала S90 (например, путем вставки нулей и/или путем дублирования выборок), и фильтр 160 нижних частот фильтрует сигнал, преобразованный с повышением частоты дискретизации, пропуская только часть в диапазоне низких частот (например, для предотвращения помехи дискретизации). Аналогично, блок 170 повышения частоты дискретизации повышает частоту дискретизации сигнала S100 диапазона высоких частот, и фильтр 180 верхних частот фильтрует сигнал, преобразованный с повышением частоты дискретизации, пропуская только часть в диапазоне высоких частот. Затем два полосовых сигнала суммируются для формирования широкополосного речевого сигнала S110. В некоторых реализациях декодера B100, гребенка фильтров B120 способна создавать взвешенную сумму двух полосовых сигналов согласно одному или нескольким весовым коэффициентам, полученным и/или вычисленным декодером B200 диапазона высоких частот. Возможна также конфигурация гребенки фильтров B120, которая объединяет более двух полосовых сигналов.
Каждый из фильтров 110, 130, 160, 180 можно реализовать в виде фильтра с конечной импульсной характеристикой (FIR) или фильтра с бесконечной импульсной характеристикой (IIR). Частотные характеристики фильтров 110 и 130 кодера могут иметь переходные области симметричной или асимметричной формы между полосой заграждения и полосой пропускания. Аналогично, частотные характеристики фильтров 160 и 180 декодера могут иметь переходные области симметричной или асимметричной формы между полосой заграждения и полосой пропускания. Может оказаться желательно, но не строго обязательно, чтобы фильтр 110 нижних частот имел такую же характеристику, как фильтр 160 нижних частот, и чтобы фильтр 130 верхних частот имел такую же характеристику, как фильтр 180 верхних частот. В одном примере, две пары фильтров 110, 130 и 160, 180 образуют гребенку квадратурных зеркальных фильтров (QMF), причем пара фильтров 110, 130 имеют такие же коэффициенты, как пара фильтров 160, 180.
В типичном примере, фильтр 110 нижних частот имеет полосу пропускания, которая включает в себя ограниченный диапазон PSTN 300-3400 Гц (например, полосу от 0 до 4 кГц). На фиг. 4a и 4b показаны относительные ширины полосы широкополосного речевого сигнала S10, узкополосного сигнала S20 и сигнала S30 диапазона высоких частот в двух разных примерах реализации. В этих двух конкретных примерах, широкополосный речевой сигнал S10 имеет частоту дискретизации 16 кГц (представляющую частотные составляющие в диапазоне от 0 до 8 кГц), и узкополосный сигнал S20 имеет частоту дискретизации 8 кГц (представляющую частотные составляющие в диапазоне от 0 до 4 кГц).
В примере, приведенном на фиг. 4a, нет значительного перекрывания между двумя поддиапазонами. Сигнал S30 диапазона высоких частот, как показано в этом примере, можно получить с использованием фильтра 130 верхних частот с полосой пропускания 4-8 кГц. В таком случае, может оказаться желательно снизить частоту дискретизации до 8 кГц посредством преобразования с понижением частоты дискретизации фильтрованного сигнала с коэффициентом два. Такая операция, которая, предположительно, значительно снижает вычислительную сложность дальнейших операций обработка сигнала, смещает энергию полосы пропускания в диапазон от 0 до 4 кГц без потери информации.
В альтернативном примере, показанном на фиг. 4b, верхний и нижний поддиапазоны имеют заметное перекрытие, вследствие чего область от 3,5 до 4 кГц описывается сигналами обоих поддиапазонов. Сигнал S30 диапазона высоких частот, представленный в этом примере, можно получить с использованием фильтра 130 верхних частот с полосой пропускания 3,5-7 кГц. В таком случае, может оказаться желательно снизить частоту дискретизации до 7 кГц путем преобразования с понижением частоты дискретизации фильтрованного сигнала с коэффициентом 16/7. Такая операция, которая, предположительно, значительно снижает вычислительную сложность дальнейших операций обработка сигнала, смещает энергию полосы пропускания в диапазон от 0 до 3,5 кГц без потери информации.
В обычной телефонной трубке для телефонной связи, один или несколько преобразователей (т.е. микрофон и телефон или громкоговоритель) страдает недостатком ощутимой характеристики в частотном диапазоне 7-8 кГц. В примере, приведенном на фиг. 4b, часть широкополосного речевого сигнала S10 от 7 до 8 кГц не включена в кодированный сигнал. Другие конкретные примеры фильтра 130 верхних частот имеют полосы пропускания 3,5-7,5 кГц и 3,5-8 кГц.
В некоторых реализациях, обеспечение перекрытия между поддиапазонами, как в примере, приведенном на фиг. 4b, позволяет использовать фильтр нижних частот и/или верхних частот, имеющий плавный спад характеристики в области перекрытия. Такие фильтры обычно легче проектировать, требуют меньшей сложности вычислений и/или вносят меньшую задержку по сравнению с фильтрами с более резкими или "крутыми" характеристиками. Для фильтров, имеющих резкие переходные области, свойственны более высокие боковые полосы (что может приводить к помехе дискретизации), чем у фильтров аналогичного порядка, которые имеют плавный спад характеристики. Фильтры, имеющие резкие переходные области, могут также иметь длинные импульсные характеристики, которые могут приводить к звенящим искажениям. Для реализаций гребенки фильтров, имеющей один или несколько IIR-фильтров, допускающей плавный спад характеристики в области перекрытия, можно использовать фильтр или фильтры, чьи полюсы удалены от единичной окружности, что может играть важную роль для обеспечения устойчивой реализации с фиксированной точкой.
Перекрытие поддиапазонов допускает плавное смешивание нижнего диапазона и верхнего диапазона, что может приводить к уменьшению количества слышимых искажений, снижению помехи дискретизации и/или менее заметному переходу от одного диапазона к другому. Кроме того, эффективность кодирования узкополосного кодера A120 (например, кодера, воспроизводящего форму сигнала) может снижаться с увеличением частоты. Например, качество кодирование узкополосного кодера может снижаться на малых битовых скоростях, особенно при наличии фонового шума. В таких случаях, обеспечение перекрытия поддиапазонов может повысить качество воспроизводимых частотных составляющих в области перекрытия.
Кроме того, перекрытие поддиапазонов допускает плавное смешивание нижнего диапазона и верхнего диапазона, что может приводить к уменьшению количества слышимых искажений, снижению помехи дискретизации и/или менее заметному переходу от одного диапазона к другому. Такая мера может быть особенно желательной для реализации, в которой узкополосный кодер A120 и кодер A200 диапазона высоких частот действуют согласно разным методологиям кодирования. Например, разные техники кодирования могут создавать сигналы, звучащие совершенно по-разному. Кодер, который кодирует спектральную огибающую в виде индексов кодовой книги, может формировать сигнал, имеющий другое звучание, чем кодер, который кодирует амплитудный спектр. Временной кодер (например, кодер на основе импульсно-кодовой модуляции или ИКМ) может формировать сигнал, имеющий другое звучание, чем частотный кодер. Кодер, который кодирует сигнал посредством представления спектральной огибающей и соответствующего остаточного сигнала, может формировать сигнал, имеющий другое звучание, чем кодер, который кодирует сигнал посредством только представления спектральной огибающей. Кодер, который кодирует сигнал в виде представления его формы волны, может создавать выходной сигнал, имеющий другое звучание, чем от синусоидального кодера. В таких случаях, использование фильтров, имеющих резкие переходные области для задания неперекрывающихся поддиапазонов, может приводить к резкому и легко воспринимаемому переходу между поддиапазонами в синтезированном широкополосном сигнале.
Хотя гребенки фильтров QMF, имеющие взаимодополняющие перекрывающиеся частотные характеристики, часто используются в поддиапазонных методиках, такие фильтры непригодны для, по меньшей мере, некоторых из описанных здесь реализаций широкополосного кодирования. Гребенка фильтров QMF на кодере способна создавать значительную помеху дискретизации, которая подавляется соответствующей гребенкой фильтров QMF на декодере. Такая конфигурация может не подходить для приложения, в котором сигнал подвергается значительному искажению между гребенками фильтров, поскольку искажение может снижать эффективность подавления помехи дискретизации. Например, описанные здесь приложения включают в себя реализации кодирования, способные работать на очень низких битовых скоростях. Вследствие очень низкой битовой скорости, велика вероятность того, что декодированный сигнал окажется значительно искаженным по сравнению с исходным сигналом, поэтому использование гребенок фильтров QMF может приводить к неподавленной помехе дискретизации. Приложения, в которых используются гребенки фильтров QMF, обычно имеют более высокие битовые скорости (например, свыше 12 кбит/с для AMR и 64 кбит/с для G.722).
Дополнительно, кодер может быть способен создавать синтезированный сигнал, который, по восприятию, подобен исходному сигналу, но, в действительности, значительно отличается от исходного сигнала. Например, описанный здесь кодер, который выводит возбуждение диапазона высоких частот из узкополосного остатка, может создавать такой сигнал, поскольку фактический остаток диапазона высоких частот может полностью отсутствовать в декодированном сигнале. Использование гребёнок фильтров QMF в таких приложениях может приводить к значительной степени искажения, обусловленного неподавленной помехой дискретизации.
Величину искажения, обусловленного помехой дискретизации QMF, можно снизить, если поддиапазон, подверженный влиянию, узок, поскольку эффект помехи дискретизации ограничивается шириной полосы, равной ширине поддиапазона. Однако в описанных здесь примерах, где каждый поддиапазон включает в себя около половины полосы широкополосного диапазона, искажение, обусловленное неподавленной помехой дискретизации, может оказывать влияние на значительную часть сигнала. На качество сигнала также может влиять положение полосы частот, в которой имеет место неподавленная помеха дискретизации. Например, искажение, создаваемое вблизи центра широкополосного речевого сигнала (например, между 3 и 4 кГц) может быть гораздо менее желательно, чем искажение, возникающее вблизи края сигнала (например, свыше 6 кГц).
Хотя характеристики фильтров гребенки фильтров QMF строго связаны друг с другом, части диапазонов низких и высоких частот гребёнок фильтров A110 и B120 могут быть способны иметь спектры, которые никак не связаны друг с другом за исключением перекрытия двух поддиапазонов. Мы определяем перекрытие двух поддиапазонов как расстояние от точки, в которой частотная характеристика фильтра диапазона высоких частот падает до -20 дБ, до точки, в которой частотная характеристика фильтра диапазона низких частот падает до -20 дБ. В различных примерах гребенки фильтров A110 и/или B120, это перекрытие занимает диапазон от около 200 Гц до около 1 кГц. Диапазон от около 400 до около 600 Гц может представлять желаемый компромисс между эффективностью кодирования и воспринимаемой гладкостью. В одном конкретном примере, упомянутом выше, перекрытие составляет около 500 Гц.
Может оказаться желательно реализовать гребенку фильтров A112 и/или B122 для осуществления операций, показанных на фиг. 4a и 4b, в виде нескольких каскадов. Например, на фиг. 4c показана блок-схема реализации A114 гребенки фильтров A112, которая осуществляет функциональный эквивалент операций высокочастотной фильтрации и преобразования с понижением частоты дискретизации с использованием ряда операций интерполяции, повторной дискретизации, децимации и других операций. Такая реализация допускает упрощение конструирования и/или позволяет сокращать функциональные блоки логики и/или кода. Например, один и тот же функциональный блок можно использовать для осуществления операций децимации до 14 кГц и децимации до 7 кГц, как показано на фиг. 4c. Операцию обращения спектра можно реализовать посредством умножения сигнала на функцию e jnπ или последовательность (-1)n, которая попеременно принимает значения +1 и -1. Операцию формирования спектра можно реализовать посредством фильтра нижних частот, способного формировать сигнал для получения нужной общей характеристики фильтра.
Заметим, что вследствие операции обращения спектра, спектр сигнала S30 диапазона высоких частот переворачивается.
Последующие операции в кодере и соответствующем декодере могут быть организованы соответственно. Например, описанный здесь генератор возбуждения A300 диапазона высоких частот может быть способен создавать сигнал возбуждения S120 диапазона высоких частот, который также имеет спектрально обращенную форму.
На фиг.4d показана блок-схема реализации В124 гребенки фильтров В122, которая осуществляет функциональный эквивалент операций повышения частоты дискретизации и высокочастотной фильтрации с использованием ряда операций интерполяции, повторной дискретизации и других операций. Гребенка фильтров В124 включает в себя операцию обращения спектра в верхнем диапазоне, которая обращает аналогичную операцию, осуществляемую, например, в гребенке фильтров кодера, например в гребенке фильтров А114. В этом конкретном примере, гребенка фильтров В124 также включает в себя узкополосные режекторные фильтры в диапазоне высоких и низких частот, которые ослабляют составляющую сигнала на 7100 Гц, хотя такие фильтры являются необязательными и не всегда входят в состав устройства. Патентная заявка "SYSTEMS, METHODS, AND APPARATUS FOR SPEECH SIGNAL FILTERING", поданная совместно с данной заявкой, сейчас публикация US №2007/0088558, включает в себя дополнительное описание и чертежи, относящиеся к характеристикам элементов конкретных реализации гребенок фильтров А110 и В120, и этот материал включен, таким образом, посредством ссылки.
Узкополосный кодер А120 реализован согласно модели источник-фильтр, которая предусматривает кодирование входного речевого сигнала в виде (А) набора параметров, описывающих фильтр, и (В) сигнала возбуждения, предписывающего описанному фильтру создавать синтезированное воспроизведение входного речевого сигнала. На фиг. 5a показан пример спектральной огибающей речевого сигнала. Пики, характеризующие эту спектральную огибающую, представляют резонансы речевого тракта и называются формантами. Большинство речевых кодеров кодируют, по меньшей мере, эту грубую спектральную структуру в виде набора параметров, например коэффициентов фильтра.
На фиг. 5b показан пример базовой конфигурации источник-фильтр, применяемой для кодирования спектральной огибающей узкополосного сигнала S20. Модуль анализа вычисляет набор параметров, характеризующих фильтр, соответствующий звуку речи в течение периода времени (обычно 20 мс). Отбеливающий фильтр (также именуемый анализирующим фильтром или фильтром ошибок прогнозирования), настроенный согласно этим параметрам фильтра, удаляет спектральную огибающую для выравнивания спектральной характеристики сигнала. Полученный отбеленный сигнал (также именуемый остатком) имеет меньшую энергию и, таким образом, меньшую дисперсию и легче поддается кодированию, чем исходный речевой сигнал. Ошибки, возникающие при кодировании остаточного сигнала, также могут более равномерно распределяться по спектру. Параметры фильтра и остаток обычно квантуются для эффективной передачи по каналу. На декодере, синтезирующий фильтр, настроенный согласно параметрам фильтра, возбуждается сигналом, основанным на остатке, для создания синтезированной версии исходного звука речи. Синтезирующий фильтр обычно способен иметь передаточную функцию, обратную передаточной функции отбеливающего фильтра.
На фиг. 6 показана блок-схема базовой реализации A122 узкополосного кодера A120. В этом примере, модуль анализа 210 кодирования с линейным прогнозированием (LPC) кодирует спектральную огибающую узкополосного сигнала S20 в виде набора коэффициентов линейного прогнозирования (LP) (например, коэффициентов полюсного фильтра 1/A(z)). Модуль анализа обычно обрабатывает входной сигнал как ряд неперекрывающихся кадров, при этом для каждого кадра вычисляется новый набор коэффициентов. Период кадра - это, в общем случае, период, в течение которого сигнал, предположительно, является локально стационарным; типичный период составляет 20 миллисекунд (что эквивалентно 160 выборкам при частоте дискретизации 8 кГц). В одном примере, модуль анализа 210 LPC способен вычислять набор из десяти коэффициентов НЧ-фильтра для описания формантной структуры каждого 20-миллисекундного кадра. Также возможна реализация модуля анализа, обрабатывающего входной сигнал как ряд перекрывающихся кадров.
Модуль анализа может быть способен анализировать выборки каждого кадра напрямую, или выборки могут сначала взвешиваться согласно вырезающей функции (например, окну Хэмминга). Анализ также может осуществляться по окну, превышающему размер кадра, например 30-миллисекундному окну. Это окно может быть симметрично (например, 5-20-5, включая в себя 5 миллисекунд непосредственно до и после 20-миллисекундного кадра) или асимметричным (например, 10-20, включая в себя последние 10 миллисекунд предыдущего кадра). Модуль анализа LPC обычно способен вычислять коэффициенты НЧ-фильтра с использованием рекурсивного метода Левинсона-Дурбина или алгоритма Леру-Гегюна. В другой реализации модуль анализа может быть способен вычислять набор коэффициентов косинусного преобразования Фурье для каждого кадра вместо набора коэффициентов НЧ-фильтра.
Выходную скорость кодера A120 можно значительно снижать, с относительно небольшим влиянием на качество воспроизведения, благодаря квантованию параметров фильтра. Коэффициенты фильтра линейного прогнозирования трудно эффективно квантовать, и их обычно отображают в другое представление, например линейные спектральные пары (LSP) или линейные спектральные частоты (LSF), для квантования и/или энтропийного кодирования. В примере, приведенном на фиг. 6, преобразование 220 коэффициентов LP-фильтра в LSF преобразует набор коэффициентов НЧ-фильтра в соответствующий набор LSF. Другие взаимно-однозначные представления коэффициентов НЧ-фильтра включают в себя коэффициенты PARCOR; значения логарифмического отношения площадей; иммитансные спектральные пары (ISP); и иммитансные спектральные частоты (ISF), которые используются в кодеке AMR-WB (Adaptive Multirate-Wideband) GSM (Глобальной системы мобильной связи). Обычно преобразование между набором коэффициентов НЧ-фильтра и соответствующим набором LSFs обратимо, но варианты осуществления также включают в себя реализации кодера A120, в которых преобразование невозможно обратить без ошибки.
Квантователь 230 способен квантовать набор узкополосных LSF (или других представлений коэффициентов), и узкополосный кодер A122 способен выводить результат этого квантования в виде узкополосных параметров фильтра S40. Такой квантователь обычно включает в себя векторный квантователь, который кодирует входной как индекс к соответствующей векторной записи в таблице или кодовой книге.
Согласно фиг. 6, узкополосный кодер A122 также генерирует остаточный сигнал, пропуская узкополосный сигнал S20 через отбеливающий фильтр 260 (также именуемый анализирующим фильтром или фильтром ошибок прогнозирования), настроенный согласно набору коэффициентов фильтра. В этом конкретном примере, отбеливающий фильтр 260 реализован как FIR-фильтр, хотя можно также использовать реализации IIR. Этот остаточный сигнал обычно содержит важную, с точки зрения восприятия, информацию речевого кадра, например долговременную структуру, связанную с основным тоном, которая не представлена в узкополосных параметрах фильтра S40. Квантователь 270 способен вычислять квантованное представление этого остаточного сигнала для вывода в качестве кодированного узкополосного сигнала возбуждения S50. Такой квантователь обычно включает в себя векторный квантователь, который кодирует входной как индекс к соответствующей векторной записи в таблице или кодовой книге. Альтернативно, такой квантователь может быть способен передавать один или несколько параметров, из которых на декодере можно динамически генерировать вектор, вместо того чтобы извлекать его из хранилища, как в методе разреженной кодовой книги. Такой способ используется в таких схемах кодирования, как алгебраическое CELP (линейное прогнозирование с кодовым возбуждением), и таких кодеках, как 3GPP2 (Third Generation Partnership 2) EVRC (Enhanced Variable Rate Codec).
Желательно, чтобы узкополосный кодер A120 генерировал кодированный узкополосный сигнал возбуждения согласно тем же значениям параметров фильтра, которые будут доступны соответствующему узкополосному декодеру. Таким образом, результирующий кодированный узкополосный сигнал возбуждения уже может в некоторой степени отвечать за неидеальности в этих значениях параметров, например ошибки квантования. Соответственно, желательно настроить отбеливающий фильтр с использованием тех же значений коэффициентов, которые будут доступны на декодере. В базовом примере кодера A122, показанном на фиг. 6, обратный квантователь 240 деквантует узкополосные параметры кодирования S40, преобразование LSF в коэффициенты LP-фильтра 250 отображает результирующие значения обратно в соответствующий набор коэффициентов НЧ-фильтра, и этот набор коэффициентов используется для настройки отбеливающего фильтра 260 для генерации остаточного сигнала, который квантуется квантователем 270.
Некоторые реализации узкополосного кодера A120 способны вычислять кодированный узкополосный сигнал возбуждения S50 путем идентификации одного из набора векторов кодовой книги, который лучше всех совпадает с остаточным сигналом. Однако заметим, что этот узкополосный кодер A120 также может реализовать для вычисления квантованного представления остаточного сигнала без фактической генерации остаточного сигнала. Например, узкополосный кодер A120 может быть способен использовать некоторое количество векторов кодовой книги для генерации соответствующих синтезированных сигналов (например, согласно текущему набору параметров фильтра), и выбирать вектор кодовой книги, связанный с генерированным сигналом, который лучше всех совпадает с исходным узкополосным сигналом S20 в перцептивно-взвешенной области.
На фиг.7 показана блок-схема реализации В112 узкополосного декодера В110. Обратный квантователь 310 деквантует узкополосные параметры фильтра S40 (в этом случае, в набор LSF), и преобразование LSF в коэффициенты LP-фильтра 320 преобразует LSF в набор коэффициентов фильтра (например, как описано выше со ссылкой на обратный квантователь 240 и преобразование 250 узкополосного кодера А122). Обратный квантователь 340 деквантует кодированный узкополосный сигнал возбуждения S50 для создания узкополосного сигнала возбуждения S80. На основании коэффициентов фильтра и узкополосного сигнала возбуждения S80, узкополосный синтезирующий фильтр 330 синтезирует узкополосный сигнал S90. Иными словами, узкополосный синтезирующий фильтр 330 способен формировать спектр узкополосного сигнала возбуждения S80 согласно деквантованным коэффициентам фильтра для создания узкополосного сигнала S90. Узкополосный декодер В112 также выдает узкополосный сигнал возбуждения S80 на кодер А200 диапазона высоких частот, который использует его для описанного здесь вывода сигнала возбуждения S120 диапазона высоких частот. В некоторых реализациях, описанных ниже, узкополосный декодер В110 может быть способен выдавать на декодер В200 диапазона высоких частот дополнительную информацию, связанную с узкополосным сигналом, например наклон спектра, коэффициент усиления и интервал основного тона, и речевой режим.
Система узкополосного кодера A122 и узкополосного декодера B112 является основным примером речевого кодека на основе анализа через синтез. Кодирование на основе линейного прогнозирования с кодовым возбуждением (CELP) является одним популярным семейством методов кодирования на основе анализа посредством синтеза, и реализации таких кодеров могут осуществлять кодирование на основе формы сигнала остатка, в том числе операции выбора записей из фиксированной и адаптивной кодовых книг, операции минимизации ошибок и/или операции перцептивного взвешивания. Другие реализации кодирования на основе анализа посредством синтеза включают в себя кодирование на основе линейного прогнозирования со смешанным возбуждением (MELP), алгебраического CELP (ACELP), релаксационного CELP (RCELP), регулярного импульсного возбуждения (RPE), многоимпульсного CELP (MPE) и линейного прогнозирования с возбуждением векторной суммой (VSELP). Родственные способы кодирования включают в себя кодирование на основе многополосного возбуждения (MBE) и интерполяции формы сигнала-прототипа (PWI). Примеры стандартных речевых кодеков на основе анализа через синтез включают в себя полноскоростной кодек ETSI (European Telecommunications Standards Institute)-GSM (GSM 06.10), который использует линейное прогнозирование с возбуждением остаточным сигналом (RELP); усовершенствованный полноскоростной кодек GSM (ETSI-GSM 06.60); стандартный кодер со скоростью 11,8 кбит/с согласно ITU (International Telecommunication Union) G.729 Приложение E; кодеки IS (Interim Standard)-641 для IS-136 (схема множественного доступа с кодовым разделением); адаптивные многоскоростные кодеки GSM (GSM-AMR); и кодек 4GV™ (Fourth-Generation Vocoder™) (QUALCOMM Incorporated, Сан-Диего, Калифорния). Узкополосный кодер A120 и соответствующий декодер B110 можно реализовать согласно любой из этих технологий или любой другой технологии речевого кодирования (известно или перспективной), которая представляет речевой сигнал в виде (A) набора параметров, которые описывают фильтр, и (B) сигнала возбуждения, используемого для предписания описанному фильтру воспроизводить речевой сигнал.
Даже после того, как отбеливающий фильтр удалит грубую спектральную огибающую из узкополосного сигнала S20, может оставаться заметный объем тонкой гармонической структуры, особенно для вокализованной речи. На фиг. 8a показан график спектра одного примера остаточного сигнала, который может быть создан отбеливающим фильтром, для вокализованного сигнала, например гласного звука. Периодическая структура, наблюдаемая в этом примере, относится к основному тону, и другие вокализованные звуки, произносимые тем же диктором, могут иметь разные формантные структуры, но аналогичные структуры основного тона. На фиг. 8b показан график зависимости амплитуды от времени в одном примере такого остаточного сигнала, где показана последовательность импульсов основного тона во времени.
Эффективность кодирования и/или качество речи можно повысить с использованием одного или нескольких значений параметра для кодирования характеристик структуры основного тона. Одной важной характеристикой структуры основного тона является частота первой гармоники (также именуемая основной частотой), которая обычно находится в диапазоне от 60 до 400 Гц. Эта характеристика обычно кодируется как величина, обратная основной частоте, также именуемая интервалом основного тона. Интервал основного тона указывает количество выборок в одном периоде основного тона и может кодироваться как один или несколько индексов кодовой книги. Для речевых сигналов дикторов-мужчин характерны более длительные интервалы основного тона, чем речевые сигналы дикторов-женщин.
Другой характеристикой сигнала, связанной со структурой основного тона, является периодичность, которая указывает интенсивность гармонической структуры или, иными словами, степень гармоничности или негармоничности сигнала. Двумя типичными признаками периодичности являются прохождения через нуль и нормированные автокорреляционные функции (NACF). О периодичности также может свидетельствовать коэффициент усиления основного тона, который обычно кодируется как коэффициент усиления кодовой книги (например, квантованный коэффициент усиления адаптивной кодовой книги).
Узкополосный кодер A120 может включать в себя один или несколько модулей, способных кодировать долговременную гармоническую структуру узкополосного сигнала S20. Согласно фиг. 9, одна типичная структура CELP, которую можно использовать, включает в себя модуль анализа LPC с открытым циклом, который кодирует краткосрочные характеристики или грубую спектральную огибающую, после которого следует каскад анализа долгосрочного прогнозирования с замкнутым циклом, который кодирует тонкую структуру основного тона или гармоник. Краткосрочные характеристики кодируются как коэффициенты фильтра, и долгосрочные характеристики кодируются как значения параметров, например интервал основного тона и коэффициент усиления основного тона. Например, узкополосный кодер A120 может быть способен выводить кодированный узкополосный сигнал возбуждения S50 в форме, которая включает в себя один или несколько индексов кодовой книги (например, индекс фиксированной кодовой книги и индекс адаптивной кодовой книги) и соответствующие значения коэффициента усиления. Вычисление этого квантованного представления узкополосного остаточного сигнала (например, квантователем 270) может включать в себя выбор таких индексов и вычисление таких значений. Кодирование структуры основного тона также может включать в себя интерполяцию формы сигнала-прототипа основного тона, каковая операция может включать в себя вычисление разницы между последовательными импульсами основного тона. Моделирование долговременной структуры можно блокировать для кадров, соответствующих невокализованной речи, которая обычно шумоподобна и неструктурирована.
Реализация узкополосного декодера B110 согласно структуре, показанной на фиг. 9, может быть способна выдавать узкополосный сигнал возбуждения S80 на декодер B200 диапазона высоких частот после восстановления долговременной структуры (основного тона или гармонической структуры). Например, такой декодер может быть способен выводить узкополосный сигнал возбуждения S80 в качестве деквантованной версии кодированного узкополосного сигнала возбуждения S50. Конечно, можно также реализовать узкополосный декодер B110, чтобы декодер B200 диапазона высоких частот осуществлял деквантование кодированного узкополосного сигнала возбуждения S50 для получения узкополосного сигнала возбуждения S80.
В реализации широкополосного речевого кодера A100 согласно схеме, показанной на фиг. 9, кодер A200 диапазона высоких частот может быть способен принимать узкополосный сигнал возбуждения, создаваемый краткосрочным анализом или отбеливающим фильтром. Иными словами, узкополосный кодер A120 может быть способен выдавать узкополосный сигнал возбуждения на кодер A200 диапазона высоких частот до кодирования долговременной структуры. Однако желательно, чтобы кодер A200 диапазона высоких частот принимал из узкополосного канала ту же информацию кодирования, который будет принимать декодер B200 диапазона высоких частот, так что параметры кодирования, сформированные кодером A200 диапазона высоких частот, уже могут в некоторой степени отвечать за неидеальности в этой информации. Таким образом, может быть предпочтительно, чтобы кодер A200 диапазона высоких частот реконструировал узкополосный сигнал возбуждения S80 из того же параметризованного и/или квантованного кодированного узкополосного сигнала возбуждения S50, который выводится широкополосным речевым кодером A100. Одно потенциальное преимущество такого подхода состоит в более точном вычислении коэффициентов усиления S60b диапазона высоких частот, описанном ниже.
Помимо параметров, характеризующих кратковременную и/или долговременную структуру узкополосного сигнала S20, узкополосный кодер A120 может создавать значения параметров, которые относятся к другим характеристикам узкополосного сигнала S20. Эти значения, которые могут быть подходящим образом квантованы для вывода широкополосным речевым кодером A100, можно включать в узкополосные параметры фильтра S40 или выводить отдельно. Кодер A200 диапазона высоких частот также может быть способен вычислять параметры кодирования S60 диапазона высоких частот согласно одному или нескольким из этих дополнительных параметров (например, после деквантования). На широкополосном речевом декодере B100, декодер B200 диапазона высоких частот может быть способен принимать значения параметра через узкополосный декодер B110 (например, после деквантования). Альтернативно, декодер B200 диапазона высоких частот может быть способен принимать (и, возможно, деквантовать) значения параметра напрямую.
В одном примере дополнительных узкополосных параметров кодирования, узкополосный кодер A120 создает значения наклона спектра и параметров речевого режима для каждого кадра. Наклон спектра связан с формой спектральной огибающей по полосе пропускания и обычно представлен квантованным первым коэффициентом отражения. Для большинства вокализованных звуков спектральная энергия снижается с увеличением частоты, так что первый коэффициент отражения отрицателен и может достигать -1. Большинство невокализованных звуков имеет спектр, который является либо плоским, в результате чего первый коэффициент отражения близок к нулю, либо имеет больше энергии на высоких частотах, в результате чего первый коэффициент отражения положителен и может достигать +1.
Речевой режим (также именуемый режимом вокализации) указывает, представляет ли текущий кадр вокализованную или невокализованную речь. Этот параметр может иметь двоичное значение, основанное на одном или нескольких показателях периодичности (например, прохождениях через нуль, NACF, коэффициенте усиления основного тона) и/или речевой активности для кадра, например соотношении между таким показателем и пороговым значением. В других реализациях, параметр речевого режима имеет один или несколько других состояний для указания таких режимов, как молчание или фоновый шум, или переход между молчанием и вокализованной речью.
Кодер A200 диапазона высоких частот способен кодировать сигнал S30 диапазона высоких частот согласно модели источник-фильтр, причем возбуждение для этого фильтра базируется на кодированном узкополосном сигнале возбуждения. На фиг. 10 показана блок-схема реализации A202 кодера A200 диапазона высоких частот, который способен создавать поток параметров кодирования S60 диапазона высоких частот, включающих в себя параметры фильтра S60a диапазона высоких частот и коэффициенты усиления S60b диапазона высоких частот. Генератор возбуждения A300 диапазона высоких частот выводит сигнал возбуждения S120 диапазона высоких частот из кодированного узкополосного сигнала возбуждения S50. Модуль анализа A210 формирует набор значений параметра, характеризующих спектральную огибающую сигнала S30 диапазона высоких частот. В этом конкретном примере, модуль анализа A210 способен осуществлять анализ LPC для формирования набора коэффициентов НЧ-фильтра для каждого кадра сигнала S30 диапазона высоких частот. Преобразование 410 коэффициентов фильтра линейного прогнозирования в LSF преобразует набор коэффициентов НЧ-фильтра в соответствующий набор LSF. Как отмечено выше со ссылкой на модуль анализа 210 и преобразование 220, модуль анализа A210 и/или преобразование 410 могут быть способны использовать другие наборы коэффициентов (например, коэффициентов косинусного преобразования Фурье) и/или представлений коэффициентов (например, ISP).
Квантователь 420 способен квантовать набор LSF диапазона высоких частот (или другого представления коэффициентов, например ISP), и кодер A202 диапазона высоких частот способен выводить результат этого квантования в виде параметров фильтра S60a диапазона высоких частот. Такой квантователь обычно включает в себя векторный квантователь, который кодирует входной вектор как индекс к соответствующей векторной записи в таблице или кодовой книге.
Кодер A202 диапазона высоких частот также включает в себя синтезирующий фильтр A220, способный формировать синтезированный сигнал S130 диапазона высоких частот согласно сигналу возбуждения S120 диапазона высоких частот и кодированной спектральной огибающей (например, набору коэффициентов НЧ-фильтра), созданной модулем анализа A210. Синтезирующий фильтр A220 обычно реализован в виде IIR-фильтра, хотя можно использовать также реализации FIR. В конкретном примере, синтезирующий фильтр A220 реализован в виде линейного авторегрессивного фильтра шестого порядка.
Калькулятор A230 коэффициента усиления диапазона высоких частот вычисляет одну или несколько разностей между уровнями исходного сигнала S30 диапазона высоких частот и синтезированного сигнала S130 диапазона высоких частот для задания огибающей усиления для кадра. Квантователь 430, который можно реализовать как векторный квантователь, который кодирует входной вектор как индекс к соответствующей векторной записи в таблице или кодовой книге, квантует значение или значения, задающее/ие огибающую усиления, и кодер A202 диапазона высоких частот способен выводить результат этого квантования как коэффициенты усиления S60b диапазона высоких частот.
В реализации, показанной на фиг. 10, синтезирующий фильтр A220 способен принимать коэффициенты фильтра от модуля анализа A210. Альтернативная реализация кодера A202 диапазона высоких частот включает в себя обратный квантователь и обратное преобразование, способные декодировать коэффициенты фильтра из параметров фильтра S60a диапазона высоких частот, и, в этом случае, синтезирующий фильтр A220 должен, вместо этого, принимать декодированные коэффициенты фильтра. Такая альтернативная конфигурация может поддерживать более точное вычисление огибающей усиления калькулятором A230 коэффициента усиления диапазона высоких частот.
В одном конкретном примере, модуль анализа A210 и калькулятор A230 коэффициента усиления диапазона высоких частот выводят набор из шести LSF и набор пяти значений коэффициента усиления на кадр, соответственно, что позволяет добиться широкополосного расширения узкополосного сигнала S20 с помощью только одиннадцати дополнительных значений на кадр. Ухо менее чувствительно к частотным искажениям на высоких частотах, благодаря чему кодирование в диапазоне высоких частот при низком порядке LPC может создавать сигнал, имеющий воспринимаемое качество, совместимое с узкополосным кодированием на более высоком порядке LPC. Типичная реализация кодера A200 диапазона высоких частот может быть способна выводить от 8 до 12 битов на кадр для высококачественной реконструкции спектральной огибающей и еще от 8 до 12 битов на кадр для высококачественной реконструкции временной огибающей. В другом конкретном примере, модуль анализа A210 выводит набор из восьми LSF на кадр.
Некоторые реализации кодера A200 диапазона высоких частот способны создавать сигнал возбуждения S120 диапазона высоких частот, генерируя случайный шумовой сигнал, имеющий частотные составляющие диапазона высоких частот и модулируя по амплитуде шумовой сигнал согласно огибающей во временном измерении узкополосного сигнала S20, узкополосного сигнала возбуждения S80 или сигнала S30 диапазона высоких частот. Однако, хотя такой шумовой способ может давать адекватные результаты для невокализованных звуков, его применение может оказаться нежелательным для вокализованных звуков, остатки которых обычно являются гармоническими и, следовательно, имеют некоторую периодическую структуру.
Генератор возбуждения A300 диапазона высоких частот способен генерировать сигнал возбуждения S120 диапазона высоких частот, расширяя спектр узкополосного сигнала возбуждения S80 на частотный диапазон диапазона высоких частот. На фиг. 11 показана блок-схема реализации A302 генератора возбуждения A300 диапазона высоких частот. Обратный квантователь 450 способен деквантовать кодированный узкополосный сигнал возбуждения S50 для создания узкополосного сигнала возбуждения 380. Расширитель спектра А400 способен создавать гармонически расширенный сигнал S160 на основании узкополосного сигнала возбуждения 380. Объединитель 470 способен объединять случайный шумовой сигнал, генерируемый генератором 480 шума, и огибающую во временном измерении, вычисляемую калькулятором 460 огибающей для создания модулированного шумового сигнала S170. Объединитель 490 способен смешивать гармонически расширенный сигнал S160 и модулированный шумовой сигнал S170 для создания сигнала возбуждения S120 диапазона высоких частот.
В одном примере, расширитель спектра А400 способен осуществлять операцию спектрального наложения (также именуемую зеркальным отражением) на узкополосном сигнале возбуждения 380 для создания гармонически расширенного сигнала S160. Спектральное наложение может осуществляться путем заполнения нулями сигнала возбуждения S80 с последующим применением фильтра верхних частот для сохранения помехи дискретизации. В другом примере, расширитель спектра А400 способен создавать гармонически расширенный сигнал S160 путем переноса спектра узкополосного сигнала возбуждения S80 в верхний диапазон (например, путем повышения частоты дискретизации с последующим умножением на косинусоидальный сигнал постоянной частоты).
Способы спектрального наложения и переноса могут создавать спектрально расширенные сигналы, гармоническая структура которых имеет нарушение непрерывности с исходной гармонической структурой узкополосного сигнала возбуждения S80 по фазе и/или частоте. Например, такие способы могут создавать сигналы, пики которых, в общем случае, не соответствуют кратным основной частоты, что может вызывать искажения с металлическим призвуком в реконструированном речевом сигнале. Этим способам также свойственно создавать высокочастотные гармоники, имеющие неестественно сильные тональные характеристики. Кроме того, поскольку сигналы PSTN допускают дискретизацию на 8 кГц, но ограничены по полосе частотой 3400 Гц, верхний спектр узкополосного сигнала возбуждения S80 может содержать мало или вовсе не содержать энергии, в результате чего расширенный сигнал, генерируемый согласно операции спектрального наложения или спектрального переноса, может иметь спектральный провал на частотах выше 3400 Гц.
Другие способы генерации гармонически расширенного сигнала S160 включают в себя идентификацию одной или нескольких основных частот узкополосного сигнала возбуждения S80 и генерацию гармонических тонов согласно этой информации. Например, гармоническая структура сигнала возбуждения может характеризоваться основной частотой совместно с информацией амплитуды и фазы. Другая реализация генератора возбуждения A300 диапазона высоких частот генерирует гармонически расширенный сигнал S160 на основании основной частоты и амплитуды (указанной, например, интервалом основного тона и коэффициентом усиления основного тона). Однако, если гармонически расширенный сигнал не когерентен по фазе с узкополосным сигналом возбуждения S80, качество результирующей декодированной речи может быть неприемлемым.
Нелинейную функцию можно использовать для создания сигнала возбуждения диапазона высоких частот, который когерентен по фазе с узкополосным возбуждением и сохраняет гармоническую структуру без разрыва по фазе. Нелинейная функция может также обеспечивать повышенный уровень шума между высокочастотными гармониками, что обеспечивает более естественное звучание, чем тональные высокочастотные гармоники, создаваемые, например, способами спектрального наложения и спектрального переноса. Типичные нелинейные функции без запоминания, которые могут применяться в различных реализациях расширителя спектра A400, включают в себя функцию абсолютного значения (также именуемую двухполупериодным выпрямлением), однополупериодное выпрямление, возведение в квадрат, возведение в куб и отсечение. Другие реализации расширителя спектра A400 могут быть способны применять нелинейную функцию с запоминанием.
На фиг. 12 показана блок-схема реализации A402 расширителя спектра A400, который способен применять нелинейную функцию для расширения спектра узкополосного сигнала возбуждения S80. Блок 510 повышения частоты дискретизации способен преобразовывать с повышением частоты дискретизации узкополосный сигнал возбуждения S80. Может оказаться желательно преобразовывать сигнал с достаточным повышением частоты дискретизации для минимизации помехи дискретизации после применения нелинейной функции. В одном конкретном примере, блок повышения частоты дискретизации 510 преобразует с повышением частоты дискретизации сигнал с коэффициентом восемь. Блок повышения частоты дискретизации 510 может быть способен осуществлять операцию повышения частоты дискретизации путем вставки нулей в входной сигнал и низкочастотной фильтрации результата. Калькулятор 520 нелинейной функции способен применять нелинейную функцию к сигналу, преобразованному с повышением частоты дискретизации. Одно потенциальное преимущество функции абсолютного значения над другими нелинейными функциями для расширения спектра, например квадратичной функцией, состоит в отсутствии необходимости в нормализации энергии. В некоторых реализациях, функцию абсолютного значения можно эффективно применять, отбрасывая или очищая знаковый бит каждой выборки. Калькулятор 520 нелинейной функции также может быть способен осуществлять амплитудную трансформацию преобразованного с повышением частоты дискретизации или спектрально расширенного сигнала.
Блок 530 понижения частоты дискретизации способен преобразовывать с понижением частоты дискретизации спектрально расширенный результат применения нелинейной функции. Может оказаться желательно, чтобы блок 530 понижения частоты дискретизации осуществлял операцию полосовой фильтрации для выбора нужной полосы частот спектрально расширенного сигнала до снижения частоты дискретизации (например, для снижения или устранения подмены или повреждения ненужным изображением). Также может быть желательно, чтобы блок 530 понижения частоты дискретизации снижал частоту дискретизации в более чем в один этап.
На фиг. 12a показана диаграмма спектров сигнала в различных точках в одном примере операции расширения спектра, где масштаб частоты одинаков для различных графиков. График (a) демонстрирует спектр одного примера узкополосного сигнала возбуждения S80. График (b) демонстрирует спектр после повышения частоты дискретизации сигнала S80 с коэффициентом восемь. График (c) демонстрирует пример расширенного спектра после применения нелинейной функции. График (d) демонстрирует спектр после низкочастотной фильтрации. В этом примере, полоса пропускания доходит до верхней частотной границы сигнала S30 диапазона высоких частот (например, 7 кГц или 8 кГц).
График (e) демонстрирует спектр после первого этапа преобразования с понижением частоты дискретизации, на котором частота дискретизации снижается с коэффициентом четыре для получения широкополосного сигнала. График (f) демонстрирует спектр после операции высокочастотной фильтрации для выбора части расширенного сигнала диапазона высоких частот, и график (g) демонстрирует спектр после второго этапа преобразования с понижением частоты дискретизации, на котором частота дискретизации снижается с коэффициентом два. В одном конкретном примере, блок 530 понижения частоты дискретизации осуществляет высокочастотную фильтрацию и второй этап преобразования с понижением частоты дискретизации, пропуская широкополосный сигнал через фильтр 130 верхних частот и блок 140 понижения частоты дискретизации гребенки фильтров A112 (или другие структуры или процедуры, имеющие такую же характеристику) для создания спектрально расширенного сигнала, имеющего частотный диапазон и частоту дискретизации сигнала S30 диапазона высоких частот.
Из графика (g) следует, что преобразование с понижением частоты дискретизации высокочастотного сигнала, показанного на графике (f), приводит к обращению его спектра. В этом примере, блок 530 понижения частоты дискретизации также способен осуществлять операцию обращения спектра на сигнале. График (h) демонстрирует результат применения операции обращения спектра, которая может осуществляться посредством умножения сигнала на функцию e jnπ или последовательность (-1)n, которая попеременно принимает значения +1 и -1. Такая операция эквивалентна сдвигу цифрового спектра сигнала в частотном измерении на расстояние π. Заметим, что такой же результат можно получить, применяя операции преобразования с понижением частоты дискретизации и обращения спектра в другом порядке. Операции повышения частоты дискретизации и/или преобразования с понижением частоты дискретизации также могут быть способны включать в себя повторную дискретизацию для получения спектрально расширенного сигнала, имеющего частоту дискретизации сигнала S30 диапазона высоких частот (например, 7 кГц).
Как отмечено выше, гребенки фильтров A110 и B120 можно реализовать так, что один или оба из узкополосного и сигналов S20, S30 диапазона высоких частот, имеющих спектрально обращенную форму на выходе гребенки фильтров A110, будет кодироваться и декодироваться в спектрально обращенной форме и снова подвергаться обращению спектра на гребенке фильтров B120 до вывода в широкополосный речевой сигнал S110. В таком случае, конечно, операция обращения спектра, показанная на фиг. 12a, будет не нужна, что было бы желательно для того, чтобы сигнал возбуждения S120 диапазона высоких частот также имел спектрально обращенную форму.
Различные задачи повышения частоты дискретизации и преобразования с понижением частоты дискретизации операции расширения спектра, осуществляемой расширителем спектра A402, можно конфигурировать по-разному. Например, на фиг. 12b показана диаграмма спектров сигнала в различных точках в другом примере операции расширения спектра, где масштаб частоты одинаков для различных графиков. График (a) демонстрирует спектр одного примера узкополосного сигнала возбуждения S80. График (b) демонстрирует спектр после повышения частоты дискретизации сигнала S80 с коэффициентом два. График (c) демонстрирует пример расширенного спектра после применения нелинейной функции. В этом случае, помеха дискретизации, которая может возникать на более высоких частотах, приемлема.
График (d) демонстрирует спектр после операции обращения спектра. График (e) демонстрирует спектр после одного этапа преобразования с понижением частоты дискретизации, на котором частота дискретизации снижается с коэффициентом два для получения нужного спектрально расширенного сигнала. В этом примере, сигнал находится в спектрально обращенной форме и его можно использовать в реализации кодера A200 диапазона высоких частот, который обрабатывал сигнал S30 диапазона высоких частот в такой форме.
Спектрально расширенный сигнал, созданный калькулятором 520 нелинейной функции, с большой вероятностью имеет ярко выраженный спад амплитуды с ростом частоты. Расширитель спектра A402 включает в себя выравниватель спектра 540, способный осуществлять операцию отбеливания на сигнале, преобразованном с понижением частоты дискретизации. Выравниватель спектра 540 может быть способен осуществлять операцию фиксированного отбеливания или осуществлять операцию адаптивного отбеливания. В конкретном примере адаптивного отбеливания, выравниватель спектра 540 включает в себя модуль анализа LPC, способный вычислять набор из четырех коэффициентов фильтра из сигнала, преобразованного с понижением частоты дискретизации, и анализирующий фильтр четвертого порядка, способный отбеливать сигнал согласно этим коэффициентам. Другие реализации расширителя спектра A400 включают в себя конфигурации, в которых выравниватель спектра 540 обрабатывает спектрально расширенный сигнал до блока 530 понижения частоты дискретизации.
Генератор возбуждения A300 диапазона высоких частот можно реализовать для вывода гармонически расширенного сигнала S160 как сигнал возбуждения S120 диапазона высоких частот. Однако, в ряде случаев, использование только гармонически расширенного сигнала в качестве возбуждения диапазона высоких частот может приводить к слышимым искажениям. Гармоническая структура речи, в общем случае, менее ярко выражена в верхнем диапазоне, чем в нижнем диапазоне, и использование слишком гармонической структуры в сигнале возбуждения диапазона высоких частот может приводить к взрывному звуку. Это искажение может быть особенно заметным в речевых сигналах дикторов-женщин.
Варианты осуществления включают в себя реализации генератора возбуждения A300 диапазона высоких частот, которые способны смешивать гармонически расширенный сигнал S160 с шумовым сигналом. Согласно фиг. 11, генератор возбуждения A302 диапазона высоких частот включает в себя генератор шума 480, который способен создавать случайный шумовой сигнал. В одном примере, генератор шума 480 способен создавать белый псевдослучайный шумовой сигнал с единичной дисперсией, хотя, в других реализациях, шумовой сигнал не обязан быть белым и может иметь плотность мощности, изменяющуюся с частотой. Может оказаться желательно, чтобы генератор шума 480 был способен выводить шумовой сигнал как детерминированную функцию, чтобы его состояние можно было дублировать на декодере. Например, генератор шума 480 может быть способен выводить шумовой сигнал как детерминированную функцию информации, закодированной ранее в том же кадре, например узкополосные параметры фильтра S40 и/или кодированный узкополосный сигнал возбуждения S50.
До смешивания с гармонически расширенным сигналом S160, случайный шумовой сигнал, созданный генератором шума 480, можно модулировать по амплитуде, чтобы он имел огибающую во временном измерении, которая аппроксимирует распределение энергии по времени узкополосного сигнала S20, сигнала S30 диапазона высоких частот, узкополосного сигнала возбуждения S80 или гармонически расширенного сигнала S160. Согласно фиг. 11, генератор возбуждения A302 диапазона высоких частот включает в себя объединитель 470, способный модулировать по амплитуде шумовой сигнал, создаваемый генератором шума 480, согласно огибающей во временном измерении, вычисленной калькулятором огибающей 460. Например, объединитель 470 можно реализовать в виде умножителя, способного масштабировать выходной сигнал генератора шума 480 согласно огибающей во временном измерении, вычисленной калькулятором огибающей 460, для создания модулированного шумового сигнала S170.
В реализации A304 генератора возбуждения A302 диапазона высоких частот, показанной в блок-схеме, изображенной на фиг. 13, калькулятор огибающей 460 способен вычислять огибающую гармонически расширенного сигнала S160. В реализации A306 генератора возбуждения A302 диапазона высоких частот, показанной в блок-схеме, изображенной на фиг. 14, калькулятор огибающей 460 способен вычислять огибающую узкополосного сигнала возбуждения S80. Другие реализации генератора возбуждения A302 диапазона высоких частот, так или иначе, могут быть способны добавлять шум к гармонически расширенному сигналу S160 согласно положениям узкополосных импульсов основного тона во времени.
Калькулятор огибающей 460 может быть способен осуществлять вычисление огибающей как задачу, которая включает в себя ряд подзадач. На фиг. 15 показана логическая блок-схема примера T100 такой задачи. Подзадача T110 вычисляет квадрат каждой выборки кадра сигнала, огибающую которой нужно моделировать (например, узкополосного сигнала возбуждения S80 или гармонически расширенного сигнала S160), для создания последовательности квадратов значений. Подзадача T120 осуществляет операцию сглаживания на последовательности квадратов значений. В одном примере, подзадача T120 применяет IIR-фильтр нижних частот первого порядка к последовательности согласно выражению
где x - входной сигнал фильтра, y - выходной сигнал фильтра, n -индекс во временном измерении, и a - коэффициент сглаживания, имеющий значение между 0,5 и 1. Значение коэффициента сглаживания a может быть фиксированным или, в альтернативной реализации, адаптивным согласно указанию шума во входном сигнале, в результате чего a оказывается ближе к 1 в отсутствие шума и ближе к 0,5 при наличии шума. Подзадача T130 применяет функцию квадратного корня к каждой выборке сглаженной последовательности для создания огибающей во временном измерении.
Такая реализация калькулятора огибающей 460 может быть способна осуществлять различные подзадачи задачи T100 последовательно и/или параллельно. В других реализациях задачи T100, подзадаче T110 может предшествовать операция полосовой фильтрации, способная выбирать нужную частотную часть сигнала, огибающую которого нужно моделировать, например диапазон 3-4 кГц.
Объединитель 490 способен смешивать гармонически расширенный сигнал S160 и модулированный шумовой сигнал S170 для создания сигнала возбуждения S120 диапазона высоких частот. Реализации объединителя 490 могут быть способны, например, вычислять сигнал возбуждения S120 диапазона высоких частот как сумму гармонически расширенного сигнала S160 и модулированного шумового сигнала S170. Такая реализация объединителя 490 может быть способна вычислять сигнал возбуждения S120 диапазона высоких частот как взвешенную сумму с применением весового коэффициента к гармонически расширенному сигналу S160 и/или к модулированному шумовому сигналу S170 для суммирования. Каждый такой весовой коэффициент можно вычислять согласно одному или нескольким критериям, и он может иметь фиксированное значение или, альтернативно, адаптивное значение, вычисляемое для каждого кадра или подкадра.
На фиг. 16 показана блок-схема реализации 492 объединителя 490, который способен вычислять сигнал возбуждения S120 диапазона высоких частот в виде взвешенной суммы гармонически расширенного сигнала S160 и модулированного шумового сигнала S170. Объединитель 492 способен взвешивать гармонически расширенный сигнал S160 согласно весовому коэффициенту гармонического сигнала S180, взвешивать модулированный шумовой сигнал S170 согласно весовому коэффициенту шума S190 и выводить сигнал возбуждения S120 диапазона высоких частот как сумму взвешенных сигналов. В этом примере, объединитель 492 включает в себя калькулятор 550 весовых коэффициентов, который способен вычислять весовой коэффициент гармонического сигнала S180 и весовой коэффициент шума S190.
Калькулятор 550 весовых коэффициентов может быть способен вычислять весовые коэффициенты S180 и S190 согласно нужному отношению гармонического контента к шумовому контенту в сигнале возбуждения S120 диапазона высоких частот. Например, может оказаться желательно, чтобы объединитель 492 создавал сигнал возбуждения S120 диапазона высоких частот, имеющий отношение энергии гармоник к энергии шума, близкое к соответствующему отношению в сигнале S30 диапазона высоких частот. В некоторых реализациях калькулятора 550 весовых коэффициентов, весовые коэффициенты S180, S190 вычисляются согласно одному или нескольким параметрам, связанным с периодичностью узкополосного сигнала S20 или узкополосного остаточного сигнала, например коэффициенту усиления основного тона и/или речевому режиму. Такая реализация калькулятора 550 весовых коэффициентов может быть способна, например, присваивать весовому коэффициенту гармонического сигнала S180 значение, пропорциональное коэффициенту усиления основного тона, и/или присваивать весовому коэффициенту шума S190 для невокализованных речевых сигналов более высокое значение, чем для вокализованных речевых сигналов.
В других реализациях, калькулятор 550 весовых коэффициентов способен вычислять значения весового коэффициента гармонического сигнала S180 и/или весового коэффициента шума S190 согласно показателю периодичности сигнала S30 диапазона высоких частот. В одном таком примере, калькулятор весовых коэффициентов 550 вычисляет весовой коэффициент гармонического сигнала S180 как максимальное значение коэффициента автокорреляции сигнала S30 диапазона высоких частот для текущего кадра или подкадра, где автокорреляция осуществляется по диапазону поиска, который включает в себя задержку в один интервал основного тона и не включает в себя задержку в нуль выборок. На фиг. 17 показан пример такого диапазона поиска длиной в n выборок, центр которого соответствует задержке в один интервал основного тона и ширина которого не превышает один интервал основного тона.
На фиг. 17 также показан пример другого подхода, согласно которому калькулятор 550 весовых коэффициентов вычисляет показатель периодичности сигнала S30 диапазона высоких частот в несколько этапов. На первом этапе, текущий кадр делится на некоторое количество подкадров, и задержка, при которой коэффициент автокорреляции достигает максимума, определяется отдельно для каждого подкадра. Как отмечено выше, автокорреляция осуществляется в диапазоне поиска, который включает в себя задержку в один интервал основного тона и не включает в себя задержку в нуль выборок.
На втором этапе, задержанный кадр строится посредством применения соответствующей определенной задержки для каждого подкадра, сочленения полученных подкадров для построения кадра с оптимальной задержкой и вычисления весового коэффициента гармонического сигнала S180 в качестве коэффициента корреляции между исходным кадром и кадром с оптимальной задержкой. Альтернативно, калькулятор 550 весовых коэффициентов вычисляет весовой коэффициент гармонического сигнала S180 как среднее максимальных коэффициентов автокорреляции, полученных на первом этапе для каждого подкадра. Реализации калькулятора 550 весовых коэффициентов также могут быть способны масштабировать коэффициент корреляции и/или объединять его с другим значением для вычисления значения весового коэффициента гармонического сигнала S180.
Может оказаться желательно, чтобы калькулятор 550 весовых коэффициентов вычислял показатель периодичности сигнала S30 диапазона высоких частот только в случаях, когда, так или иначе, указано наличие периодичности в кадре. Например, калькулятор 550 весовых коэффициентов может быть способен вычислять показатель периодичности сигнала S30 диапазона высоких частот согласно соотношению между другим указателем периодичности текущего кадра, например коэффициентом усиления основного тона, и пороговым значением. В одном примере, калькулятор весовых коэффициентов 550 способен осуществлять операцию автокорреляции на сигнале S30 диапазона высоких частот, только если коэффициент усиления основного тона кадра (например, коэффициент усиления адаптивной кодовой книги узкополосного остатка) имеет значение более 0,5 (альтернативно, по меньшей мере, 0,5). В другом примере, калькулятор весовых коэффициентов 550 способен осуществлять операцию автокорреляции на сигнале S30 диапазона высоких частот только для кадров, имеющих конкретные состояния речевого режима (например, только для вокализованных сигналов). В таких случаях, калькулятор весовых коэффициентов 550 может быть способен присваивать весовой коэффициент, принятый по умолчанию, для кадров, имеющих другие состояния речевого режима и/или меньшие значения коэффициента усиления основного тона.
Варианты осуществления включают в себя дополнительные реализации калькулятора 550 весовых коэффициентов, которые способны вычислять весовые коэффициенты согласно характеристикам, отличным от периодичности или дополнительным к ней. Например, такая реализация может быть способна присваивать коэффициенту усиления шума S190 для речевых сигналов, имеющих большой интервал основного тона, более высокое значение, чем для речевых сигналов, имеющих малый интервал основного тона. Другая такая реализация калькулятора 550 весовых коэффициентов способна определять показатель гармоничности широкополосного речевого сигнала S10 или сигнала S30 диапазона высоких частот согласно мере энергии сигнала на частотах, кратных основной частоте, относительно энергии сигнала других частотных составляющих.
Некоторые реализации широкополосного речевого кодера A100 способны выводить индикацию периодичности или гармоничности (например, однобитовый флаг, указывающий, является ли кадр гармоническим или негармоническим) на основании коэффициента усиления основного тона и/или другого описанного здесь показателя периодичности или гармоничности. В одном примере, соответствующий широкополосный речевой декодер B100 использует эту индикацию для настройки такой операции, как, например, вычисление весового коэффициента. В другом примере, такая индикация используется на кодере и/или декодере при вычислении значения параметра речевого режима.
Может оказаться желательно, чтобы генератор возбуждения A302 диапазона высоких частот генерировал сигнал возбуждения S120 диапазона высоких частот таким образом, чтобы конкретные значения весовых коэффициентов S180 и S190 не оказывали существенного влияния на энергию сигнала возбуждения. В таком случае, калькулятор 550 весовых коэффициентов может быть способен вычислять значение весового коэффициента гармонического сигнала S180 или весового коэффициента шума S190 (или принимать такое значение из хранилища или другого элемента кодера A200 диапазона высоких частот) и выводить значение другого весового коэффициента согласно, например, выражению
где W harmonic обозначает весовой коэффициент гармонического сигнала S180 и W noise обозначает весовой коэффициент шума S190. Альтернативно, калькулятор 550 весовых коэффициентов может быть способен выбирать, согласно значению показателя периодичности текущего кадра или подкадра, соответствующую одну из совокупности пар весовых коэффициентов S180, S190, где пары заранее вычислены в соответствии с постоянным отношением энергий, например, выражением (2). Для реализации калькулятора 550 весовых коэффициентов, в котором справедливо выражение (2), типичные значения весового коэффициента гармонического сигнала S180 составляют от около 0,7 до около 1,0, и типичные значения весового коэффициента шума S190 составляют от около 0,1 до около 0,7. Другие реализации калькулятора 550 весовых коэффициентов могут быть способны действовать согласно версии выражения (2), модифицированной согласно нужному основополагающему взвешиванию между гармонически расширенным сигналом S160 и модулированным шумовым сигналом S170.
Искажения могут возникать в синтезированном речевом сигнале, когда разреженная кодовая книга (записи которой в большинстве своем имеют нулевые значения) использовалась для вычисления квантованного представления остатка. Разреженность кодовой книги имеет место, в основном, когда узкополосный сигнал кодируется с низкой битовой скоростью. Искажения, обусловленные разреженностью кодовой книги, обычно являются квазипериодическими во времени и возникают, в основном, на частотах свыше 3 кГц. Поскольку человеческое ухо имеет повышенное временное разрешение на более высоких частотах, эти искажения могут быть более заметны в верхнем диапазоне.
Варианты осуществления включают в себя реализации генератора возбуждения A300 диапазона высоких частот, которые способны осуществлять фильтрацию для устранения разряжения. На фиг. 18 показана блок-схема реализации A312 генератора возбуждения A302 диапазона высоких частот, которая включает в себя фильтр 600 для устранения разряжения, способный фильтровать деквантованный узкополосный сигнал возбуждения, создаваемый обратным квантователем 450. На фиг. 19 показана блок-схема реализации A314 генератора возбуждения A302 диапазона высоких частот, которая включает в себя фильтр 600 для устранения разряжения, способный фильтровать спектрально расширенный сигнал, создаваемый расширителем спектра A400. На фиг. 20 показана блок-схема реализации A316 генератора возбуждения A302 диапазона высоких частот, которая включает в себя фильтр 600 для устранения разряжения, способный фильтровать выходной сигнал объединителя 490 для создания сигнала возбуждения S120 диапазона высоких частот. Конечно, возможны и, таким образом, явно раскрыты реализации генератора возбуждения A300 диапазона высоких частот, объединяющие особенности любой из реализаций A304 и A306 с особенностями любой из реализаций A312, A314 и A316. Фильтр 600 для устранения разряжения также может быть предусмотрен в расширителе спектра A400: например, после любого из элементов 510, 520, 530 и 540 в расширителе спектра A402. Заметим, что фильтр 600 для устранения разряжения также можно использовать с реализациями расширителя спектра A400, которые осуществляют спектральное наложение, спектральный перенос или гармоническое расширение.
Фильтр 600 для устранения разряжения может быть способен изменять фазу поступающего на него сигнала. Например, может оказаться желательно, чтобы фильтр 600 для устранения разряжения был настроен и размещен так, чтобы рандомизировать фазу сигнала возбуждения S120 диапазона высоких частот, или иным образом обеспечивает ее более равномерное распределение, по времени. Также может быть желательно, чтобы спектральная характеристика фильтра 600 для устранения разряжения была плоской, чтобы амплитудно-частотная характеристика фильтрованного сигнала не претерпевала значительных изменений. В одном примере, фильтр 600 для устранения разряжения реализован в виде всечастотного фильтра, передаточная функция которого выражается следующим образом:
Такой фильтр, в частности позволяет так распределить энергию входного сигнала, чтобы она больше не концентрировалась лишь в нескольких выборках.
Искажения, обусловленные разреженностью кодовой книги, обычно более заметны для шумоподобных сигналов, где остаток включает в себя меньше информации основного тона, а также для речи в фоновом шуме. Разреженность обычно вызывает меньшие искажения в случаях, когда возбуждение имеет долговременную структуру, и, действительно, изменение фазы может приводить к зашумлению вокализованных сигналов. Таким образом, может оказаться желательно настроить фильтр 600 для устранения разряжения на блокировку невокализованных сигналов и пропускание, по меньшей мере, некоторых вокализованных сигналов без изменения. Невокализованные сигналы характеризуются низким коэффициентом усиления основного тона (например, квантованным узкополосным коэффициентом усиления адаптивной кодовой книги) и близким к нулю или положительным наклоном спектра (например, квантованным первым коэффициентом отражения), что свидетельствует о том, что спектральная огибающая является плоской или возрастает с увеличением частоты. Типичные реализации фильтра для устранения разряжения 600 способны фильтровать невокализованные звуки (например, указанные значением наклона спектра), фильтровать вокализованные звуки, когда коэффициент усиления основного тона ниже порогового значения (альтернативно, не превышает пороговое значение), и, в противном случае, пропускать сигнал без изменения.
Другие реализации фильтра 600 для устранения разряжения включают в себя два или более фильтра, которые способны иметь разные максимальные углы изменения фазы (например, до 180 градусов). В таком случае, фильтр 600 для устранения разряжения может быть способен делать выбор из этих составляющих фильтров согласно значению коэффициента усиления основного тона (например, квантованного коэффициента усиления адаптивной кодовой книги или LTP), чтобы больший максимальный угол изменения фазы использовался для кадров, имеющих более низкие значения коэффициента усиления основного тона. Реализация фильтра 600 для устранения разряжения также может включать в себя разные составляющие фильтры, которые способны изменять фазу в более или менее широком частотном спектре, чтобы фильтр, способный изменять фазу в более широком частотном диапазоне входного сигнала, использовался для кадров, имеющих более низкие значения коэффициента усиления основного тона.
Для точного воспроизведения кодированного речевого сигнала, может оказаться желательно, чтобы отношение между уровнями части диапазона высоких частот и узкополосной части синтезированного широкополосного речевого сигнала S100 было близким к соответствующему отношению в исходном широкополосном речевом сигнале S10. Помимо спектральной огибающей, представленной параметрами кодирования S60a диапазона высоких частот, кодер A200 диапазона высоких частот может быть способен характеризовать сигнал S30 диапазона высоких частот путем задания временной огибающей или огибающей усиления. Согласно фиг. 10, кодер A202 диапазона высоких частот включает в себя калькулятор коэффициента усиления A230 диапазона высоких частот, который способен и призван вычислять один или несколько коэффициентов усиления согласно соотношению между сигналом S30 диапазона высоких частот и синтезированным сигналом S130 диапазона высоких частот, например, разности или отношению между энергиями двух сигналов на протяжении кадра или некоторой его части. В других реализациях кодера A202 диапазона высоких частот, калькулятор коэффициента усиления A230 диапазона высоких частот может иметь аналогичную конфигурацию, предназначен для вычисления огибающей усиления согласно такому изменяющемуся со временем соотношению между сигналом S30 диапазона высоких частот и узкополосным сигналом возбуждения S80 или сигналом возбуждения S120 диапазона высоких частот.
Временные огибающие узкополосного сигнала возбуждения S80 и сигнала S30 диапазона высоких частот с большой степенью вероятности сходны. Поэтому кодирование огибающей усиления, которое основано на соотношении между сигналом S30 диапазона высоких частот и узкополосным сигналом возбуждения S80 (или сигналом, выведенным из него, например сигналом возбуждения S120 диапазона высоких частот или синтезированным сигналом S130 диапазона высоких частот), будет, в общем случае, более эффективным, чем кодирование огибающей усиления, основанное только на сигнале S30 диапазона высоких частот. В типичной реализации, кодер A202 диапазона высоких частот способен выводить квантованный индекс размером от восьми до двенадцати битов, который указывает пять коэффициентов усиления для каждого кадра.
Калькулятор коэффициента усиления A230 диапазона высоких частот может быть способен осуществлять вычисление коэффициента усиления как задачу, которая включает в себя одну или несколько последовательностей подзадач. На фиг. 21 показана логическая блок-схема примера T200 такой задачи, которая вычисляет значение коэффициента усиления для соответствующего подкадра согласно относительной энергии сигнала S30 диапазона высоких частот и синтезированного сигнала S130 диапазона высоких частот. Задачи 220a и 220b вычисляют энергии соответствующих подкадров соответствующих сигналов. Например, задачи 220a и 220b могут быть способны вычислять энергию как сумму квадратов выборок соответствующего подкадра. Задача T230 вычисляет коэффициент усиления для подкадра как квадратный корень отношения этих энергий. В этом примере, задача T230 вычисляет коэффициент усиления как квадратный корень отношения энергии сигнала S30 диапазона высоких частот к энергии синтезированного сигнала S130 диапазона высоких частот на протяжении подкадра.
Может оказаться желательно, чтобы калькулятор коэффициента усиления A230 в диапазоне высоких частот был способен вычислять энергии подкадров согласно вырезающей функции. На фиг. 22 показана логическая блок-схема такой реализации T210 задачи T200 вычисления коэффициента усиления. Задача T215a применяет вырезающую функцию к сигналу S30 диапазона высоких частот, и задача T215b применяет ту же вырезающую функцию к синтезированному сигналу S130 диапазона высоких частот. Реализации 222a и 222b задач 220a и 220b вычисляют энергии соответствующих окон, и задача T230 вычисляет коэффициент усиления для подкадра как квадратный корень отношения энергий.
Может оказаться желательно применять вырезающую функцию, которая перекрывает соседние подкадры. Например, вырезающая функция, которая создает коэффициенты усиления, которые можно применять в режиме сложения с перекрытием, может способствовать снижению или устранению нарушения непрерывности между подкадрами. В одном примере, калькулятор коэффициента усиления A230 в диапазоне высоких частот способен применять трапецеидальную вырезающую функцию, показанную на фиг. 23a, в которой окно перекрывает каждый из двух соседних подкадров на одну миллисекунду. На фиг. 23b показано применение этой вырезающей функции к каждому из пяти подкадров 20-миллисекундного кадра. Другие реализации калькулятора коэффициента усиления A230 в диапазоне высоких частот могут быть способны применять вырезающие функции, имеющие разные периоды перекрытия и/или разные формы окна (например, прямоугольную, хэммингову), которые могут быть симметричными или асимметричными. Реализация калькулятора коэффициента усиления A230 в диапазоне высоких частот также может быть способна применять разные вырезающие функции к разным подкадрам в кадре и/или кадр может включать в себя подкадры разной длины.
В качестве примеров конкретных реализаций, без ограничения, представлены следующие значения. Для этих случаев предполагается 20-миллисекундный кадр, хотя можно использовать кадр любой другой длины. Для сигнала диапазона высоких частот, дискретизированного на 7 кГц, каждый кадр имеет 140 выборок. Если такой кадр разделить на пять подкадров равной длины, каждый подкадр будет иметь 28 выборок, и окно, показанное на фиг. 23a, будет иметь ширину 42 выборки. Для сигнала диапазона высоких частот, дискретизированного на 8 кГц, каждый кадр имеет 160 выборок. Если такой кадр разделить на пять подкадров равной длины, каждый подкадр будет иметь 32 выборки, и окно, показанное на фиг. 23a, будет иметь ширину 48 выборок. В других реализациях можно использовать подкадры любой ширины, и даже можно реализовать калькулятор коэффициента усиления A230 в диапазоне высоких частот, способный создавать разные коэффициенты усиления для разных выборок кадра.
На фиг. 24 показана блок-схема реализации B202 декодера B200 диапазона высоких частот. Декодер B202 диапазона высоких частот включает в себя генератор возбуждения B300 диапазона высоких частот, который способен создавать сигнал возбуждения S120 диапазона высоких частот на основании узкополосного сигнала возбуждения S80. В зависимости от конкретных выборов конструкции системы, генератор возбуждения B300 диапазона высоких частот можно реализовать согласно любой из описанных здесь реализаций генератора возбуждения A300 диапазона высоких частот. Обычно желательно реализовать генератор возбуждения B300 диапазона высоких частот, имеющий такую же характеристику, как генератор возбуждения диапазона высоких частот кодера диапазона высоких частот конкретной системы кодирования. Однако, поскольку узкополосный декодер B110 обычно осуществляет деквантование кодированного узкополосного сигнала возбуждения S50, в большинстве случаев можно реализовать генератор возбуждения B300 диапазона высоких частот, принимающий узкополосный сигнал возбуждения S80 от узкополосного декодера B110 и не обязательно включающий в себя обратный квантователь, способный деквантовать кодированный узкополосный сигнал возбуждения S50. Также можно реализовать узкополосный декодер B110, включающий в себя вариант фильтра 600 для устранения разряжения, способного фильтровать деквантованный узкополосный сигнал возбуждения прежде, чем он поступит на узкополосный синтезирующий фильтр, например фильтр 330.
Обратный квантователь 560 способен деквантовать параметры фильтра S60a диапазона высоких частот (в этом примере, в набор LSF), и преобразование LSF в коэффициенты LP-фильтра 570 способно преобразовывать LSF в набор коэффициентов фильтра (например, как описано выше со ссылкой на обратный квантователь 240 и преобразование 250 узкополосного кодера А122). В других реализациях, как отмечено выше, можно использовать разные наборы коэффициентов (например, коэффициенты косинусного преобразования Фурье) и/или представления коэффициентов (например, ISP). Синтезирующий фильтр В202 диапазона высоких частот способен создавать синтезированный сигнал диапазона высоких частот согласно сигналу возбуждения S120 диапазона высоких частот и набору коэффициентов фильтра. Для системы, в которой кодер диапазона высоких частот включает в себя синтезирующий фильтр (например, как в описанном выше примере кодера А202), может оказаться желательно реализовать синтезирующий фильтр В202 диапазона высоких частот, имеющий такую же характеристику (например, такую же передаточную функцию), как у синтезирующего фильтра.
Декодер В202 диапазона высоких частот также включает в себя обратный квантователь 580, способный деквантовать коэффициенты усиления S60b в диапазоне высоких частот, и элемент регулировки усиления 590 (например, умножитель или усилитель), способный и призванный применять деквантованные коэффициенты усиления к синтезированному сигналу диапазона высоких частот для создания сигнала S100 диапазона высоких частот. В случае, когда огибающая усиления кадра задана более чем одним коэффициентом усиления, элемент регулировки усиления 590 может включать в себя логику, способную применять коэффициенты усиления к соответствующим подкадрам, возможно, согласно вырезающей функции, которая может отличаться или не отличаться от вырезающей функции, применяемой калькулятором коэффициента усиления (например, калькулятором коэффициента усиления A230 в диапазоне высоких частот) соответствующего кодера диапазона высоких частот. В других реализациях декодера B202 диапазона высоких частот, элемент регулировки усиления 590 имеет аналогичную конфигурацию, но призван применять деквантованные коэффициенты усиления к узкополосному сигналу возбуждения S80 или к сигналу возбуждения S120 диапазона высоких частот.
Как отмечено выше, может оказаться желательно получать одно и то же состояние в кодере диапазона высоких частот и декодере диапазона высоких частот (например, с использованием деквантованных значений при кодировании). Таким образом, в системе кодирования согласно такой реализации, может оказаться желательно гарантировать одно и то же состояние для соответствующих генераторов шума в генераторах возбуждения A300 и B300 диапазона высоких частот. Например, генераторы возбуждения A300 и B300 диапазона высоких частот такой реализации могут иметь такую конфигурацию, что состояние генератора шума является детерминированной функцией информации, уже закодированной в том же кадре (например, узкополосных параметров фильтра S40 или их части и/или кодированного узкополосного сигнала возбуждения S50 или его части).
Один или несколько квантователей описанных здесь элементов (например, квантователь 230, 420 или 430) может быть способен осуществлять классифицированное векторное квантование. Например, такой квантователь может быть способен выбирать одну из набора кодовых книг на основании информации, уже закодированной в том же кадре на узкополосном канале и/или на канале диапазона высоких частот. Такая техника обычно обеспечивает повышение эффективности кодирования за счет хранения дополнительных кодовых книг.
Как описано выше, например, со ссылкой на фиг. 8 и 9, значительный объем периодической структуры может оставаться в остаточном сигнале после удаления грубой спектральной огибающей из узкополосного речевого сигнала S20. Например, остаточный сигнал может содержать последовательность приблизительно периодических импульсов или пиков во времени. Появление такой структуры, которая обычно связана с основным тоном, особенно вероятно в вокализованных речевых сигналах. Вычисление квантованного представления узкополосного остаточного сигнала может включать в себя кодирование этой структуры основного тона согласно модели долговременной периодичности, представленной, например, одной или несколькими кодовыми книгами.
Структура основного тона фактического остаточного сигнала может не точно совпадать с моделью периодичности. Например, остаточный сигнал может включать в себя небольшие флуктуации регулярности размещения импульсов основного тона, в результате чего расстояния между последовательными импульсами основного тона в кадре не точно равны, и структура не является вполне регулярной. Эти нерегулярности снижают эффективность кодирования.
Некоторые реализации узкополосного кодера A120 способны осуществлять регуляризацию структуры основного тона за счет применения адаптивного преобразования временного масштаба к остатку до или в ходе квантования или иного включения адаптивного преобразования временного масштаба в кодированный сигнал возбуждения. Например, такой кодер может быть способен выбирать или иначе вычислять степень трансформации во времени (например, согласно одному или нескольким критериям перцептивного взвешивания и/или минимизации ошибки), благодаря чему результирующий сигнал возбуждения оптимально согласуется с моделью долговременной периодичности. Регуляризация структуры основного тона осуществляется разновидностью кодеров CELP, именуемой кодерами на основе релаксационного линейного прогнозирования с кодовым возбуждением (RCELP).
Кодер RCELP обычно способен осуществлять преобразование временного масштаба в виде адаптивного временного сдвига. Этот временной сдвиг может представлять собой задержку в пределах от нескольких миллисекунд с отрицательным знаком до нескольких миллисекунд с положительным знаком и обычно изменяется плавно во избежание слышимых нарушений непрерывности. В некоторых реализациях, такой кодер способен применять регуляризацию в кусочно-линейном режиме, в котором каждый кадр или подкадр трансформируется с соответствующим фиксированным временным сдвигом. В других реализациях, кодер способен применять регуляризацию в виде непрерывной функции трансформации, в результате чего кадр или подкадр трансформируется согласно контуру основного тона (также именуемому траекторией основного тона). В ряде случаев (например, как описано в опубликованной патентной заявке США № 2004/0098255), кодер способен обеспечивать преобразование временного масштаба в кодированном сигнале возбуждения путем применения сдвига к перцептивно взвешенному входному сигналу, который используется для вычисления кодированного сигнала возбуждения.
Кодер вычисляет кодированный сигнал возбуждения, который регуляризуется и квантуется, и декодер деквантует кодированный сигнал возбуждения для получения сигнала возбуждения, который используется для синтеза декодированного речевого сигнала. Таким образом, декодированный выходной сигнал демонстрирует такую же изменяющуюся задержку, которая была внесена в кодированный сигнал возбуждения посредством регуляризации. Обычно на декодер не передается никакой информации, указывающей объемы регуляризации.
Регуляризация облегчает кодирование остаточного сигнала, что повышает эффективность кодирования из долгосрочного предсказателя и, таким образом, повышает общую эффективность кодирования, обычно без генерации искажений. Может оказаться желательно осуществлять регуляризацию только на вокализованных кадрах. Например, узкополосный кодер A124 может быть способен сдвигать только те кадры или подкадры, которые имеют долговременную структуру, например вокализованные сигналы. Также может оказаться желательно осуществлять регуляризацию только на подкадрах, которые включают в себя энергию импульсов основного тона. Различные реализации кодирования RCELP описаны в патентах США № 5,704,003 (Kleijn и др.) и 6,879,955 (Rao) и в опубликованной патентной заявке США № 2004/0098255 (Kovesi и др.). Существующие реализации кодеров RCELP включают в себя Enhanced Variable Rate Codec (EVRC), описанный в Telecommunications Industry Association (TIA) IS-127, и Third Generation Partnership Project 2 (3GPP2) Selectable Mode Vocoder (SMV).
К сожалению, регуляризация может создавать проблемы для широкополосного речевого кодера, в котором возбуждение в диапазоне высоких частот получается из кодированного узкополосного сигнала возбуждения (например, система, включающая в себя широкополосный речевой кодер A100 и широкополосный речевой декодер B100). В силу того, что он выводится из сигнала с трансформированной временной шкалой, сигнал возбуждения диапазона высоких частот обычно имеет иной временной профиль, чем исходный речевой сигнал диапазона высоких частот. Иными словами, сигнал возбуждения диапазона высоких частот выпадает из синхронизма с исходным речевым сигналом диапазона высоких частот.
Рассогласование по времени между трансформированным сигналом возбуждения диапазона высоких частот и исходным речевым сигналом диапазона высоких частот может вызвать ряд проблем. Например, трансформированный сигнал возбуждения диапазона высоких частот уже не может обеспечивать подходящее исходное возбуждение для синтезирующего фильтра, который настроен согласно параметрам фильтра, извлеченным из исходного речевого сигнала диапазона высоких частот. В результате, синтезированный сигнал диапазона высоких частот может содержать слышимые искажения, которые снижают воспринимаемое качество декодированного широкополосного речевого сигнала.
Рассогласование по времени также может приводить к снижению эффективности кодирования огибающей усиления. Как отмечено выше, с высокой степенью вероятности существует корреляция между временными огибающими узкополосного сигнала возбуждения S80 и сигналом S30 диапазона высоких частот. Благодаря кодированию огибающей усиления сигнала диапазона высоких частот согласно соотношению между этими двумя временными огибающими, можно реализовать повышение эффективности кодирования по сравнению с кодированием непосредственно огибающей усиления. Однако, благодаря регуляризации кодированного узкополосного сигнала возбуждения, эту корреляцию можно ослабить. Рассогласование по времени между узкополосным сигналом возбуждения S80 и сигналом S30 диапазона высоких частот может привести к появлению флуктуаций коэффициентов усиления S60b в диапазоне высоких частот и падению эффективности кодирования.
Варианты осуществления включают в себя способы широкополосного речевого кодирования, которые предусматривают осуществление преобразования временного масштаба речевого сигнала диапазона высоких частот согласно преобразованию временного масштаба, включенного в соответствующий кодированный узкополосный сигнал возбуждения. Потенциальные преимущества таких способов включают в себя повышение качества декодированного широкополосного речевого сигнала и/или повышение эффективности кодирования огибающей усиления в диапазоне высоких частот.
На фиг. 25 показана блок-схема реализации AD10 широкополосного речевого кодера A100. Кодер AD10 включает в себя реализацию A124 узкополосного кодера A120, который способен осуществлять регуляризацию в ходе вычисления кодированного узкополосного сигнала возбуждения S50. Например, узкополосный кодер A124 может быть настроен согласно одному или нескольким из рассмотренных выше реализаций RCELP.
Узкополосный кодер A124 также способен выводить сигнал SD10 данных регуляризации, который указывает степень применяемого преобразования временного масштаба. Для различных случаев, когда узкополосный кодер A124 способен применять фиксированный временной сдвиг к каждому кадру или подкадру, сигнал SD10 данных регуляризации может включать в себя ряд значений, указывающих величину каждого временного сдвига как целое или нецелое значение, выраженное в выборках, миллисекундах или другом приращении времени. В случае, когда узкополосный кодер A124 способен иначе изменять временную шкалу кадра или другой последовательности выборок (например, сжимая одну часть и растягивая другую часть), сигнал SD10 информации регуляризации может включать в себя соответствующее описание изменения, например набор параметров функции. В одном конкретном примере, узкополосный кодер A124 способен делить кадр на три подкадра и вычислять фиксированный временной сдвиг для каждого подкадра, поэтому сигнал SD10 данных регуляризации указывает три величины временного сдвига для каждого регуляризованного кадра кодированного узкополосного сигнала.
Широкополосный речевой кодер AD10 включает в себя линию задержки D120, способную обеспечивать опережение или отставание частей речевого сигнала S30 диапазона высоких частот, согласно величинам задержки, указанным во входном сигнале, для создания речевого сигнала S30a диапазона высоких частот с трансформированной временной шкалой. В примере, показанном на фиг. 25, линия задержки D120 способна трансформировать временную шкалу речевого сигнала S30 диапазона высоких частот согласно трансформации, указанной в сигнале SD10 данных регуляризации. Таким образом, преобразование временного масштаба той же величины, которая была включена в кодированный узкополосный сигнал возбуждения S50, применяется к соответствующей части речевого сигнала S30 диапазона высоких частот до анализа. Хотя в этом примере линия задержки D120 показана как элемент, отдельный от кодера A200 диапазона высоких частот, в других реализациях линия задержки D120 обеспечена как часть кодера диапазона высоких частот.
Другие реализации кодера A200 диапазона высоких частот могут быть способны осуществлять спектральный анализ (например, анализ LPC) нетрансформированного речевого сигнала S30 диапазона высоких частот и осуществлять преобразование временного масштаба речевого сигнала S30 диапазона высоких частот до вычисления параметров усиления S60b диапазона высоких частот. Такой кодер может включать в себя, например, реализацию линии задержки D120, призванной осуществлять преобразование временного масштаба. В таких случаях, однако, параметры фильтра S60a диапазона высоких частот, основанные на анализе нетрансформированного сигнала S30, могут описывать спектральную огибающую, рассогласованную по времени с сигналом возбуждения S120 диапазона высоких частот.
Линия задержки D120 может быть настроена согласно любой комбинации логических элементов и элементов хранения, пригодной для применения нужных операций преобразования временного масштаба к речевому сигналу S30 диапазона высоких частот. Например, линия задержки D120 может быть способна считывать речевой сигнал S30 диапазона высоких частот из буфера согласно нужным временным сдвигам. На фиг. 26a показана схема такой реализации D122 линии задержки D120, которая включает в себя сдвиговый регистр SR1. Сдвиговый регистр SR1 это буфер некоторой длины m, который способен принимать и сохранять m самых последних выборок речевого сигнала S30 диапазона высоких частот. Значение m равно, по меньшей мере, сумме максимальных поддерживаемых положительного ("опережение") и отрицательного ("отставание") временных сдвигов. Может оказаться удобно, чтобы значение m было равно длине кадра или подкадра сигнала S30 диапазона высоких частот.
Линия задержки D122 способна выводить сигнал S30a диапазона высоких частот с трансформированной временной шкалой из ячейки смещения OL сдвигового регистра SR1. Позиция ячейка смещения OL варьируется относительно опорной позиции (нулевого временного сдвига) согласно текущему временному сдвигу, указанному, например, сигналом SD10 данных регуляризации. Линия задержки D122 может быть способна поддерживать равные пределы опережения и отставания или, альтернативно, один предел больше другого, в результате чего в одном направлении может осуществлять больший сдвиг, чем в другом. На фиг. 26a показан конкретный пример, где временной сдвиг в положительном направлении больше, чем в отрицательном. Линия задержки D122 может быть способна выводить одновременно одну или несколько выборок (в зависимости, например, от ширины выходной шины).
Временной сдвиг регуляризации, имеющий величину свыше нескольких миллисекунд, может приводить к слышимым искажениям в декодированном сигнале. Обычно величина временного сдвига регуляризации, осуществляемого узкополосным кодером A124, не превышает нескольких миллисекунд, поэтому временные сдвиги, указанные в сигнале данных регуляризации SD10, ограничены. Однако в таких случаях может оказаться желательным, чтобы линия задержки D122 была способна налагать максимальное ограничение на временные сдвиги в положительном и/или отрицательном направлении (например, для обеспечения более жесткого ограничения, чем налагаемое узкополосным кодером).
На фиг. 26b показана схема реализации D124 линии задержки D122, которая включает в себя окно сдвига SW. В этом примере, позиция ячейки смещения OL ограничивается окном сдвига SW. Хотя на фиг. 26b показан случай, когда длина буфера m больше ширины окна сдвига SW, линию задержки D124 также можно реализовать с шириной окна сдвига SW равной m.
В других реализациях, линия задержки D120 способна записывать речевой сигнал S30 диапазона высоких частот в буфер согласно нужным временным сдвигам. На фиг. 27 показана схема такой реализации D130 линии задержки D120, которая включает в себя два сдвиговых регистра SR2 и SR3, способных принимать и сохранять речевой сигнал S30 диапазона высоких частот. Линия задержки D130 способна записывать кадр или подкадр из сдвигового регистра SR2 в сдвиговый регистр SR3 согласно временному сдвигу, указанному, например, в сигнале SD10 данных регуляризации. Сдвиговый регистр SR3 организован как буфер FIFO, призванный выводить сигнал S30а диапазона высоких частот с трансформированной временной шкалой.
В конкретном примере, показанном на фиг.27, сдвиговый регистр SR2 включает в себя участок кадрового буфера FBI и участок буфера задержки DB, и сдвиговый регистр SR3 включает в себя участок кадрового буфера FB2, участок опережающего буфера АВ и участок отстающего буфера RB. Длины опережающего буфера АВ и отстающего буфера RB могут быть равны, или один может быть больше другого, в результате чего в одном направлении поддерживается больший сдвиг, чем в другом. Буфер задержки DB и участок отстающего буфера RB могут быть иметь одинаковую длину. Альтернативно, буфер задержки DB можно сделать короче отстающего буфера RB для учета интервала времени, необходимого для переноса выборок из кадрового буфера FBI в сдвиговый регистр SR3, который может включать в себя другие операции обработки, например трансформацию выборок до сохранения в сдвиговом регистре SR3.
В примере, приведенном на фиг.27, кадровый буфер FBI способен иметь длину, равную длине одного кадра сигнала S30 диапазона высоких частот. В другом примере, кадровый буфер FBI способен иметь длину, равную длине одного подкадра сигнала S30 диапазона высоких частот. В таком случае, линия задержки D130 может быть способна включать в себя логику для применения одинаковой (например, средней) задержки ко всем подкадрам сдвигаемого кадра. Линия задержки D130 также может включать в себя логику для усреднения значений из кадрового буфера FBI со значениями, подлежащими перезаписи в отстающий буфер RB или опережающий буфер АВ. В еще одном примере, сдвиговый регистр SR3 может быть способен принимать значения сигнала S30 диапазона высоких частот только через кадровый буфер FB1, и, в таком случае, линия задержки D130 может включать в себя логику для интерполяции по зазорам между последовательными кадрами или подкадрами, записанными в сдвиговый регистр SR3. В других реализациях, линия задержки D130 может быть способна осуществлять операцию трансформации на выборках из кадрового буфера FB1 до записи их в сдвиговый регистр SR3 (например, согласно функции, описанной сигналом SD10 данных регуляризации).
Может оказаться желательно, чтобы линия задержки D120 применяла преобразование временного масштаба, основанное на, но не идентичное, трансформации, заданной сигналом SD10 данных регуляризации. На фиг. 28 показана блок-схема реализации AD12 широкополосного речевого кодера AD10, который включает в себя блок D110 отображения значений задержки. Блок D110 отображения значений задержки способен отображать трансформацию, указанную в сигнале SD10 данных регуляризации, в отображенные значения задержки SD10a. Линия задержки D120 призвана создавать речевой сигнал S30a диапазона высоких частот с трансформированной временной шкалой согласно трансформации, указанной отображенными значениям задержки SD10a.
Временной сдвиг, применяемый узкополосным кодером, предположительно, развивается плавно по времени. Поэтому обычно бывает достаточно вычислить средний узкополосный временной сдвиг, применяемый к подкадрам на протяжении кадра речи, и сдвинуть соответствующий кадр речевого сигнала S30 диапазона высоких частот согласно этому среднему значению. В одном таком примере, блок D110 отображения значений задержки способен вычислять среднее для значений задержки подкадров для каждого кадра, и линия задержки D120 способна применять вычисленное среднее к соответствующему кадру сигнала S30 диапазона высоких частот. В других примерах, можно вычислять и применять среднее по более короткому периоду (например, двум подкадрам или половине кадра) или более долгому периоду (например, двум кадрам). В случае, когда среднее является нецелым количеством выборок, блок D110 отображения значений задержки может быть способен округлять значение до целого количества выборок прежде, чем вывести его на линию задержки D120.
Узкополосный кодер A124 может быть способен включать в себя временной сдвиг регуляризации, равный нецелому количеству выборок в кодированном узкополосном сигнале возбуждения. В таком случае, может оказаться желательно, чтобы блок D110 отображения значений задержки был способен округлять узкополосный временной сдвиг до целого количества выборок и чтобы линия задержки D120 применяла округленный временной сдвиг к речевому сигналу S30 диапазона высоких частот.
В некоторых реализациях широкополосного речевого кодера AD10, частоты дискретизации узкополосного речевого сигнала S20 и речевого сигнала S30 диапазона высоких частот могут отличаться. В таких случаях, блок D110 отображения значений задержки может быть способен регулировать величины временного сдвига, указанные в сигнале SD10 данных регуляризации для учета разности между частотами дискретизации узкополосного речевого сигнала S20 (или узкополосного сигнала возбуждения S80) и речевого сигнала S30 диапазона высоких частот. Например, блок D110 отображения значений задержки может быть способен масштабировать величины временного сдвига согласно отношению частот дискретизации. В одном конкретном примере, как отмечено выше, узкополосный речевой сигнал S20 дискретизирован на 8 кГц, и речевой сигнал S30 диапазона высоких частот дискретизирован на 7 кГц. В этом случае, блок D110 отображения значений задержки способен изменять величину каждого сдвига на 7/8. Реализации блока D110 отображения значений задержки также могут быть способны осуществлять такую операцию масштабирования совместно с округлением до целого и/или описанную здесь операцию усреднения временного сдвига.
В еще одной реализации, линия задержки D120 способна иначе изменять временную шкалу кадра или другой последовательности выборок (например, сжимая одну часть и растягивая другую часть). Например, узкополосный кодер A124 может быть способен осуществлять регуляризацию согласно такой функции, как контур или траектория основного тона. В таком случае, сигнал SD10 данных регуляризации может включать в себя соответствующее описание функции, например набор параметров, и линия задержки D120 может включать в себя логику, способную трансформировать кадры или подкадры речевого сигнала S30 диапазона высоких частот согласно функции. В других реализациях, блок отображения значений задержки D110 способен усреднять, масштабировать и/или округлять функцию до ее применения к речевому сигналу S30 диапазона высоких частот линией задержки D120. Например, блок D110 отображения значений задержки может быть способен вычислять одно или несколько значений задержки согласно функции, причем каждое значение задержки указывает количество выборок, которые затем применяются линией задержки D120 для трансформации временного масштаба одного или нескольких соответствующих кадров или подкадров речевого сигнала S30 диапазона высоких частот.
На фиг. 29 показана логическая блок-схема способа MD100 преобразования временного масштаба речевого сигнала диапазона высоких частот согласно преобразованию временного масштаба, включенному в соответствующий кодированный узкополосный сигнал возбуждения. Задача TD100 обрабатывает широкополосный речевой сигнал для получения узкополосного речевого сигнала и речевого сигнала диапазона высоких частот. Например, задача TD100 может быть способна фильтровать широкополосный речевой сигнал с использованием гребенки фильтров, имеющей фильтры нижних и верхних частот, например реализации гребенки фильтров A110. Задача TD200 кодирует узкополосный речевой сигнал в, по меньшей мере, кодированный узкополосный сигнал возбуждения и совокупность параметров узкополосного фильтра. Кодированный узкополосный сигнал возбуждения и/или параметры фильтра могут быть квантованными, и кодированный узкополосный речевой сигнал также может включать в себя другие параметры, например параметр речевого режима. Задача TD200 также включает в себя преобразование временного масштаба в кодированном узкополосном сигнале возбуждения.
Задача TD300 генерирует сигнал возбуждения диапазона высоких частот на основании узкополосного сигнала возбуждения. В этом случае, узкополосный сигнал возбуждения основан на кодированном узкополосном сигнале возбуждения. Согласно, по меньшей мере, сигналу возбуждения диапазона высоких частот, задача TD400 кодирует речевой сигнал диапазона высоких частот в, по меньшей мере, совокупность параметров фильтра диапазона высоких частот. Например, задача TD400 может быть способна кодировать речевой сигнал диапазона высоких частот в совокупность квантованных LSF. Задача TD500 применяет временной сдвиг к речевому сигналу диапазона высоких частот, который основан на информации, связанной с преобразованием временного масштаба, включенным в кодированный узкополосный сигнал возбуждения.
Задача TD400 может быть способна осуществлять спектральный анализ (например, анализ LPC) на речевом сигнале диапазона высоких частот, и/или вычислять огибающую усиления речевого сигнала диапазона высоких частот. В таких случаях, задача TD500 может быть способна применять временной сдвиг к речевому сигналу диапазона высоких частот до анализа и/или вычисления огибающей усиления.
Другие реализации широкополосного речевого кодера A100 способны обращать преобразование временного масштаба сигнала возбуждения S120 диапазона высоких частот, обусловленного преобразованием временного масштаба, включенным в кодированный узкополосный сигнал возбуждения. Например, можно реализовать генератор возбуждения A300 диапазона высоких частот, включающий в себя реализацию линии задержки D120, которая способна принимать сигнал SD10 данных регуляризации или отображенные значения задержки SD10a и применять соответствующий обратный временной сдвиг к узкополосному сигналу возбуждения S80 и/или к последующему сигналу на его основе, например гармонически расширенному сигналу S160 или сигналу возбуждения S120 диапазона высоких частот.
Дополнительные реализации широкополосного речевого кодера могут быть способны кодировать узкополосный речевой сигнал S20 и речевой сигнал S30 диапазона высоких частот независимо друг от друга, в результате чего речевой сигнал S30 диапазона высоких частот кодируется как представление спектральной огибающей в диапазоне высоких частот и сигнала возбуждения диапазона высоких частот. Такая реализация может быть способна осуществлять преобразование временного масштаба остаточного сигнала диапазона высоких частот или иначе включать преобразование временного масштаба в кодированный сигнал возбуждения диапазона высоких частот, согласно информации, связанной с преобразованием временного масштаба, включенным в кодированный узкополосный сигнал возбуждения. Например, кодер диапазона высоких частот может включать в себя реализацию описанных здесь линии задержки D120 и/или блока D110 отображения значений задержки, которые способны применять преобразование временного масштаба к остаточному сигналу диапазона высоких частот. Потенциальные преимущества такой операции включают в себя более эффективное кодирование остаточного сигнала диапазона высоких частот и лучшее совпадение между синтезированными узкополосным и речевыми сигналами диапазона высоких частот.
Как отмечено выше, описанные здесь варианты осуществления включают в себя реализации, которые можно использовать для осуществления встроенного кодирования, поддержки совместимости с узкополосными системами и избавления необходимости в перекодировании. Поддержка кодирования в диапазоне высоких частот также может служить для дифференциации, в зависимости от стоимости, между микросхемами, наборами микросхем, устройствами и/или сетями, имеющими широкополосную поддержку с обратной совместимостью, и имеющими только узкополосную поддержку. Описанную здесь поддержку кодирования в диапазоне высоких частот также можно использовать совместно с техникой для поддержки кодирования в диапазона низких частот, и система, способ или устройство согласно такому вариант осуществления может поддерживать кодирование частотных составляющих от, например, около 50 или 100 Гц до около 7 или 8 кГц.
Как отмечено выше, добавление поддержки диапазона высоких частот к речевому кодеру может повысить разборчивость речи, особенно в отношении различения фрикативных звуков. Хотя слушатель-человек обычно может различать такие звуки на основании конкретного контекста, поддержка диапазона высоких частот может служить мощным вспомогательным средством в распознавании речи и других приложениях машинной интерпретации, например системах для автоматической навигации по голосовому меню и/или автоматической обработке вызова.
Устройство согласно варианту осуществления можно встроить в портативное устройство беспроводной связи, например сотовый телефон или карманный персональный компьютер (PDA). Альтернативно, такое устройство может входить в состав другого устройства связи, например телефонной трубки VoIP, персонального компьютера, способного поддерживать связь по стандарту VoIP, или сетевого устройства, способного маршрутизировать телефонные или VoIP вызовы. Например, устройство согласно варианту осуществления можно реализовать в виде микросхемы или набора микросхем для устройства связи. В зависимости от конкретного применения, такое устройство также может включать в себя такие особенности, как аналого-цифровое и/или цифроаналоговое преобразование речевого сигнала, схему для осуществления усиления и/или другой операции обработки сигнала на речевом сигнале и/или радиочастотную схему для передачи и/или приема кодированного речевого сигнала.
Мы в явном виде предполагаем, что варианты осуществления могут включать в себя и/или использовать одну или несколько других особенностей, раскрытых в предварительных патентных заявках США №№60/667,901 и 60/673,965 (сейчас публикации U.S. №2006/0282263, 2007/0088558, 2007/0088541, 2006/0277042, 2007/0088542, 2006/0277038, 2006/0271356 и 2008/0126086), приоритет которых испрашивает настоящая заявка. Такие особенности включают в себя удаление высокоэнергичных импульсов малой длительности, которые возникают в верхнем диапазоне и, по существу, отсутствуют в узком диапазоне. Такие особенности включают в себя фиксированное или адаптивное сглаживание представлений коэффициентов, например LSF диапазона высоких частот. Такие особенности включают в себя фиксированное или адаптивное преобразование формы шума, связанного с квантованием представлений коэффициентов, например LSF. Такие особенности также включают в себя фиксированное или адаптивное сглаживание огибающей усиления и адаптивное ослабление огибающей усиления.
Вышеприведенное представление описанных вариантов осуществления обеспечено для того, чтобы специалисты в данной области могли использовать настоящее изобретение. Возможны различные модификации этих вариантов осуществления, и представленные здесь общие принципы применимы и к другим вариантам осуществления. Например, вариант осуществления можно реализовать полностью или частично в виде электронной схемы, в виде конфигурации схем, скомпонованной на специализированной интегральной схеме, или в виде программно-аппаратного обеспечения, загруженного в энергонезависимое запоминающее устройство, или программного обеспечения, загружаемого из или на носитель данных в виде машинно-считываемого кода, причем такой код представляет собой команды, выполняемые матрицей логических элементов, например микропроцессором или другим блоком цифровой обработки сигнала. Носитель данных может представлять собой матрицу элементов хранения, например полупроводниковое ЗУ (которое может включать в себя, без ограничения, динамическое или статическое ОЗУ (оперативное ЗУ), ПЗУ (постоянное ЗУ), и/или флэш-память), или сегнетоэлектрическое ЗУ, магниторезистивное ЗУ, ЗУ на аморфных полупроводниках, полимерное ЗУ или ЗУ на основе фазовых переходов; или дисковый носитель, например магнитный или оптический диск. Термин "программное обеспечение" следует понимать в смысле, включающем в себя исходный код, код на языке ассемблера, машинный код, двоичный код, зашитую программу, макрокод, микрокод, один или несколько наборов или последовательностей команд, выполняемых матрицей логических элементов, и любую комбинацию таких примеров.
Различные элементы реализации генераторов возбуждения A300 и В300 диапазона высоких частот, кодера А200 диапазона высоких частот, декодера B200 диапазона высоких частот, широкополосного речевого кодера A100 и широкополосного речевого декодера B100 можно реализовать в виде электронных и/или оптических устройств, размещенных, например, на одной и той же микросхеме или на двух или более микросхемах в наборе микросхем, хотя возможны и другие конфигурации без такого ограничения. Один или несколько элементов такого устройства можно реализовать полностью или частично в виде одного или нескольких наборов команд, предназначенных для выполнения на одной или нескольких фиксированных или программируемых матрицах логических элементов (например, транзисторов, вентилей), например микропроцессорах, встроенных процессорах, основных услугах IP, цифровых сигнальных процессорах, FPGA (вентильных матрицах, программируемых пользователем), ASSP (специализированных стандартных продуктах) и ASIC (специализированных интегральных схемах). Один или несколько таких элементов также могут быть объединены в общую структуру (например, процессор, используемый для выполнения частей кода, соответствующих разным элементам, в разное время, набор команд, выполняемых для осуществления задач, соответствующих разным элементам, в разное время, или конфигурацию электронных и/или оптических устройств, осуществляющих операции для разных элементов в разное время). Кроме того, один или несколько таких элементов можно использовать для осуществления задач или выполнения других наборов команд, которые непосредственно не связаны с работой устройства, например задачи, относящейся к другой операции устройства или системы, в которую встроено устройство.
На фиг. 30 показана логическая блок-схема способа M100, согласно варианту осуществления, кодирования части речевого сигнала диапазона высоких частот, имеющего узкополосную часть и часть в диапазоне высоких частот. Задача X100 вычисляет набор параметров фильтра, характеризующих спектральную огибающую части в диапазоне высоких частот. Задача X200 вычисляет спектрально расширенный сигнал путем применения нелинейной функции к сигналу, полученному из узкополосной части. Задача X300 генерирует синтезированный сигнал диапазона высоких частот согласно (A) набору параметров фильтра и (B) сигналу возбуждения диапазона высоких частот, основанному на спектрально расширенном сигнале. Задача X400 вычисляет огибающую усиления на основании соотношения между (C) энергией части в диапазоне высоких частот и (D) энергией сигнала, полученного из узкополосной части.
На фиг. 31a показана логическая блок-схема способа M200 генерации сигнала возбуждения диапазона высоких частот согласно варианту осуществления. Задача Y100 вычисляет гармонически расширенный сигнал путем применения нелинейной функции к узкополосному сигналу возбуждения, полученному из узкополосной части речевого сигнала. Задача Y200 смешивает гармонически расширенный сигнал с модулированным шумовым сигналом для генерации сигнала возбуждения диапазона высоких частот. На фиг. 31b показана логическая блок-схема способа M210 генерации сигнала возбуждения диапазона высоких частот согласно другому варианту осуществления, включающего в себя задачи Y300 и Y400. Задача Y300 вычисляет огибающую во временном измерении в виде распределения энергии по времени для одного из узкополосного сигнала возбуждения и гармонически расширенного сигнала. Задача Y400 модулирует шумовой сигнал согласно огибающей во временном измерении для создания модулированного шумового сигнала.
На фиг. 32 показана логическая блок-схема способа M300 согласно варианту осуществления, декодирования части речевого сигнала диапазона высоких частот, имеющего узкополосную часть и часть в диапазоне высоких частот. Задача Z100 принимает набор параметров фильтра, характеризующих спектральную огибающую части в диапазоне высоких частот, и набор коэффициентов усиления, характеризующих временную огибающую части в диапазоне высоких частот. Задача Z200 вычисляет спектрально расширенный сигнал путем применения нелинейной функции к сигналу, полученному из узкополосной части. Задача Z300 генерирует синтезированный сигнал диапазона высоких частот согласно (A) набору параметров фильтра и (B) сигналу возбуждения диапазона высоких частот, основанному на спектрально расширенном сигнале. Задача Z400 модулирует огибающую усиления синтезированного сигнала диапазона высоких частот на основании набора коэффициентов усиления. Например, задача Z400 может быть способна модулировать огибающую усиления синтезированного сигнала диапазона высоких частот путем применения набора коэффициентов усиления к сигналу возбуждения, полученному из узкополосной части, к спектрально расширенному сигналу, к сигналу возбуждения диапазона высоких частот или к синтезированному сигналу диапазона высоких частот.
Варианты осуществления также включают в себя дополнительные способы речевого кодирования, кодирования и декодирования, отчетливо раскрытые здесь, например, посредством описаний структурных вариантов осуществления, способных осуществлять такие способы. Каждый из этих способов также может быть материально реализован (например, на одном или нескольких из вышеперечисленных носителей данных) в виде одного или нескольких наборов команд, считываемых и/или выполняемых машиной, включая матрицу логических элементов (например, процессор, микропроцессор, микроконтроллер или другой конечный автомат). Таким образом, настоящее изобретение не предусматривает ограничение вышеописанными вариантами осуществления, но подлежит рассмотрению в широчайшем объеме, согласующемся с принципами и новыми признаками, раскрытыми здесь любым образом, в том числе в приложенной формуле изобретения, которая составляет часть первоначального раскрытия.
Claims (31)
1. Способ кодирования части речевого сигнала диапазона высоких частот, имеющего узкополосную часть и часть в диапазоне высоких частот, содержащий этапы, на которых
вычисляют набор параметров фильтра, характеризующих спектральную огибающую части в диапазоне высоких частот,
вычисляют спектрально расширенный сигнал путем расширения спектра сигнала, полученного из узкополосной части, и
вычисляют огибающую усиления на основании соотношения между частью в диапазоне высоких частот и сигналом, основанным на узкополосной части.
вычисляют набор параметров фильтра, характеризующих спектральную огибающую части в диапазоне высоких частот,
вычисляют спектрально расширенный сигнал путем расширения спектра сигнала, полученного из узкополосной части, и
вычисляют огибающую усиления на основании соотношения между частью в диапазоне высоких частот и сигналом, основанным на узкополосной части.
2. Способ по п.1, в котором на этапе расширения спектра сигнала, полученного из узкополосной части, применяют нелинейную функцию к сигналу.
3. Способ по любому из п.1 или 2, в котором упомянутое соотношение является соотношением между энергией части в диапазоне высоких частот и энергией сигнала, основанного на узкополосной части.
4. Способ по п.1, содержащий этапы, на которых генерируют сигнал возбуждения диапазона высоких частот, основанный на спектрально расширенном сигнале, и генерируют синтезированный сигнал диапазона высоких частот согласно набору параметров фильтра и сигналу возбуждения диапазона высоких частот, и
в котором сигнал, основанный на узкополосной части, является синтезированным сигналом диапазона высоких частот.
в котором сигнал, основанный на узкополосной части, является синтезированным сигналом диапазона высоких частот.
5. Способ по п.1, содержащий этап, на котором генерируют сигнал возбуждения диапазона высоких частот посредством смешивания гармонически расширенного сигнала, основанного на спектрально расширенном сигнале, и модулированного шумового сигнала.
6. Способ по п.5, в котором этап, на котором генерируют сигнал возбуждения диапазона высоких частот, заключается в том, что
вычисляют огибающую во временном измерении одного сигнала из гармонически расширенного сигнала и узкополосного сигнала возбуждения, полученного из узкополосной части; и
модулируют по амплитуде шумовой сигнал в соответствии с огибающей во временном измерении для получения модулированного шумового сигнала.
вычисляют огибающую во временном измерении одного сигнала из гармонически расширенного сигнала и узкополосного сигнала возбуждения, полученного из узкополосной части; и
модулируют по амплитуде шумовой сигнал в соответствии с огибающей во временном измерении для получения модулированного шумового сигнала.
7. Способ по любому из пп.5 или 6, в котором сигнал, основанный на узкополосной части, является одним из узкополосного сигнала возбуждения, сигнала возбуждения диапазона высоких частот и синтезированного сигнала диапазона высоких частот.
8. Способ по п.1, в котором сигнал, основанный на узкополосной части, является одним из узкополосного сигнала возбуждения, сигнала возбуждения диапазона высоких частот и синтезированного сигнала диапазона высоких частот.
9. Способ по п.1, в котором сигнал, основанный на узкополосной части, является основанным на узкополосном сигнале возбуждения, полученном из узкополосной части.
10. Способ по п.1, в котором расширение спектра сигнала, полученного из узкополосной части, заключается в том, что расширяют спектр сигнала в диапазон частот части диапазона высоких частот.
11. Способ по п.1, содержащий этап, на котором создают поток параметров кодирования диапазона высоких частот, включающих в себя набор параметров фильтра и набор коэффициентов усиления.
12. Способ по п.1, в котором на этапе вычисления огибающей усиления вычисляют набор коэффициентов усиления, и
в котором каждый из набора коэффициентов усиления соответствует различному одному из серии последовательных подкадров кадра части диапазона высоких частот.
в котором каждый из набора коэффициентов усиления соответствует различному одному из серии последовательных подкадров кадра части диапазона высоких частот.
13. Способ по п.1, в котором этап вычисления набора коэффициентов усиления заключается в том, что для каждого из набора коэффициентов усиления вычисляют энергию соответствующего подкадра части диапазона высоких частот, используя вырезающую функцию, которая перекрывает соседние подкадры части диапазона высоких частот.
14. Способ обработки речевого сигнала, содержащий этапы, на которых
генерируют сигнал возбуждения диапазона высоких частот на основании узкополосного сигнала возбуждения,
генерируют синтезированный сигнал диапазона высоких частот на основании сигнала возбуждения диапазона высоких частот и кодированной спектральной огибающей речевого сигнала диапазона высоких частот и
вычисляют набор коэффициентов усиления на основании соотношения между речевым сигналом диапазона высоких частот и сигналом, основанным на узкополосном сигнале возбуждения,
причем каждый из набора коэффициентов усиления соответствует различному одному из серии последовательных подкадров кадра речевого сигнала диапазона высоких частот.
генерируют сигнал возбуждения диапазона высоких частот на основании узкополосного сигнала возбуждения,
генерируют синтезированный сигнал диапазона высоких частот на основании сигнала возбуждения диапазона высоких частот и кодированной спектральной огибающей речевого сигнала диапазона высоких частот и
вычисляют набор коэффициентов усиления на основании соотношения между речевым сигналом диапазона высоких частот и сигналом, основанным на узкополосном сигнале возбуждения,
причем каждый из набора коэффициентов усиления соответствует различному одному из серии последовательных подкадров кадра речевого сигнала диапазона высоких частот.
15. Способ по п.14, в котором каждый из набора коэффициентов усиления основан на соотношении между энергией соответствующего подкадра речевого сигнала диапазона высоких частот и энергией соответствующей части во временном измерении сигнала, основанного на узкополосном сигнале возбуждения.
16. Способ по п.14, в котором упомянутое соотношение является соотношением между речевым сигналом диапазона высоких частот и синтезированным сигналом диапазона высоких частот.
17. Способ по п.16, в котором каждый из набора коэффициентов усиления основан на соотношении между энергией соответствующего подкадра речевого сигнала диапазона высоких частот и энергией соответствующей части во временном измерении синтезированного сигнала диапазона высоких частот.
18. Способ по любому из пп.14 или 15, в котором сигнал, основанный на узкополосном сигнале возбуждения, является одним из узкополосного сигнала возбуждения, сигнала возбуждения диапазона высоких частот и синтезированного сигнала диапазона высоких частот.
19. Способ декодирования части речевого сигнала диапазона высоких частот, имеющего узкополосную часть и часть в диапазоне высоких частот, содержащий этапы, на которых
принимают набор параметров фильтра, характеризующих спектральную огибающую части в диапазоне высоких частот, и набор коэффициентов усиления, характеризующих временную огибающую части в диапазоне высоких частот,
вычисляют спектрально расширенный сигнал путем расширения спектра сигнала, который основан на узкополосном сигнале возбуждения, полученного из узкополосной части,
генерируют синтезированный сигнал диапазона высоких частот согласно (А) набору параметров фильтра и (В) сигналу возбуждения диапазона высоких частот на основании спектрально расширенного сигнала и
модулируют огибающую усиления синтезированного сигнала диапазона высоких частот согласно набору коэффициентов усиления.
принимают набор параметров фильтра, характеризующих спектральную огибающую части в диапазоне высоких частот, и набор коэффициентов усиления, характеризующих временную огибающую части в диапазоне высоких частот,
вычисляют спектрально расширенный сигнал путем расширения спектра сигнала, который основан на узкополосном сигнале возбуждения, полученного из узкополосной части,
генерируют синтезированный сигнал диапазона высоких частот согласно (А) набору параметров фильтра и (В) сигналу возбуждения диапазона высоких частот на основании спектрально расширенного сигнала и
модулируют огибающую усиления синтезированного сигнала диапазона высоких частот согласно набору коэффициентов усиления.
20. Способ по п.19, в котором на этапе расширения спектра сигнала, основанного на узкополосном сигнале возбуждения, применяют нелинейную функцию к сигналу.
21. Способ по любому из пп.19 или 20, в котором на этапе модуляции огибающей усиления изменяют согласно набору коэффициентов усиления амплитуду с течением времени для, по меньшей мере, одного из сигнала, который основан на узкополосном сигнале возбуждения, спектрально расширенного сигнала, сигнала возбуждения диапазона высоких частот и синтезированного сигнала диапазона высоких частот.
22. Устройство, выполненное с возможностью кодирования речевого сигнала диапазона высоких частот в соответствии с информацией в узкополосном кодированном сигнале, содержащее
модуль анализа, выполненный с возможностью создания набора значений параметров, характеризующих спектральную огибающую речевого сигнала в диапазоне высоких частот,
генератор возбуждения диапазона высоких частот, выполненный с возможностью генерирования сигнала возбуждения диапазона высоких частот, основанного на спектрально расширенном сигнале, причем генератор возбуждения диапазона высоких частот включает в себя расширитель спектра, выполненный с возможностью вычисления спектрально расширенного сигнала путем расширения спектра узкополосного сигнала возбуждения, полученного из узкополосного кодированного сигнала, в диапазон частот части диапазона высоких частот, и
калькулятор коэффициента усиления, выполненный с возможностью вычисления огибающей усиления на основании соотношения, изменяющегося со временем, между речевым сигналом диапазона высоких частот и сигналом, основанным на узкополосном сигнале возбуждения.
модуль анализа, выполненный с возможностью создания набора значений параметров, характеризующих спектральную огибающую речевого сигнала в диапазоне высоких частот,
генератор возбуждения диапазона высоких частот, выполненный с возможностью генерирования сигнала возбуждения диапазона высоких частот, основанного на спектрально расширенном сигнале, причем генератор возбуждения диапазона высоких частот включает в себя расширитель спектра, выполненный с возможностью вычисления спектрально расширенного сигнала путем расширения спектра узкополосного сигнала возбуждения, полученного из узкополосного кодированного сигнала, в диапазон частот части диапазона высоких частот, и
калькулятор коэффициента усиления, выполненный с возможностью вычисления огибающей усиления на основании соотношения, изменяющегося со временем, между речевым сигналом диапазона высоких частот и сигналом, основанным на узкополосном сигнале возбуждения.
23. Устройство по п.22, в котором расширитель спектра выполнен с возможностью расширения спектра узкополосного сигнала возбуждения путем применения нелинейной функции к сигналу.
24. Устройство по любому из пп.22 или 23, в котором соотношение, изменяющееся со временем, является соотношением, изменяющимся со временем, между энергией речевого сигнала диапазона высоких частот и энергией сигнала, основанного на узкополосном сигнале возбуждения.
25. Устройство по п.22, содержащее синтезирующий фильтр, выполненный с возможностью генерирования синтезированного сигнала диапазона высоких частот согласно сигналу возбуждения диапазона высоких частот и набору значений параметров, и
причем сигнал, основанный на узкополосном сигнале возбуждения, является синтезированным сигналом диапазона высоких частот.
причем сигнал, основанный на узкополосном сигнале возбуждения, является синтезированным сигналом диапазона высоких частот.
26. Устройство по п.22, в котором калькулятор коэффициента усиления выполнен с возможностью вычисления огибающей усиления как набора коэффициентов усиления,
причем каждый из набора коэффициентов усиления основан на соотношении между энергией части во временном измерении речевого сигнала диапазона высоких частот и энергией соответствующей части во временном измерении синтезированного сигнала диапазона высоких частот.
причем каждый из набора коэффициентов усиления основан на соотношении между энергией части во временном измерении речевого сигнала диапазона высоких частот и энергией соответствующей части во временном измерении синтезированного сигнала диапазона высоких частот.
27. Устройство по п.22, содержащее сотовый телефон.
28. Декодер речевого сигнала диапазона высоких частот, выполненный с возможностью приема набора параметров фильтра, характеризующих спектральную огибающую части речевого сигнала диапазона высоких частот, и узкополосного сигнала возбуждения, основанного на узкополосной части речевого сигнала, содержащий
генератор возбуждения диапазона высоких частот, выполненный с возможностью генерирования сигнала возбуждения диапазона высоких частот на основании спектрально расширенного сигнала, причем генератор возбуждения диапазона высоких частот включает в себя расширитель спектра, выполненный с возможностью вычисления спектрально расширенного сигнала путем расширения спектра узкополосного сигнала возбуждения,
синтезирующий фильтр, выполненный с возможностью генерирования синтезированного сигнала диапазона высоких частот согласно набору параметров фильтра и сигналу возбуждения диапазона высоких частот, и
элемент регулировки усиления, выполненный с возможностью модулирования огибающей усиления синтезированного сигнала диапазона высоких частот согласно набору коэффициентов усиления, характеризующих временную огибающую части в диапазоне высоких частот.
генератор возбуждения диапазона высоких частот, выполненный с возможностью генерирования сигнала возбуждения диапазона высоких частот на основании спектрально расширенного сигнала, причем генератор возбуждения диапазона высоких частот включает в себя расширитель спектра, выполненный с возможностью вычисления спектрально расширенного сигнала путем расширения спектра узкополосного сигнала возбуждения,
синтезирующий фильтр, выполненный с возможностью генерирования синтезированного сигнала диапазона высоких частот согласно набору параметров фильтра и сигналу возбуждения диапазона высоких частот, и
элемент регулировки усиления, выполненный с возможностью модулирования огибающей усиления синтезированного сигнала диапазона высоких частот согласно набору коэффициентов усиления, характеризующих временную огибающую части в диапазоне высоких частот.
29. Декодер по п.28, в котором расширитель спектра выполнен с возможностью расширения спектра узкополосного сигнала возбуждения путем применения нелинейной функции к сигналу.
30. Декодер по п.28, в котором элемент регулировки усиления выполнен с возможностью модулирования огибающей усиления посредством изменения согласно набору коэффициентов усиления амплитуды с течением времени, по меньшей мере, одного из узкополосного сигнала возбуждения, спектрально расширенного сигнала, сигнала возбуждения диапазона высоких частот и синтезированного сигнала диапазона высоких частот.
31. Декодер по любому из пп.28-30, в котором элемент регулировки усиления содержит, по меньшей мере, один из умножителя и усилителя.
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US66790105P | 2005-04-01 | 2005-04-01 | |
US60/667,901 | 2005-04-01 | ||
US67396505P | 2005-04-22 | 2005-04-22 | |
US60/673,965 | 2005-04-22 |
Publications (2)
Publication Number | Publication Date |
---|---|
RU2007140383A RU2007140383A (ru) | 2009-05-10 |
RU2402826C2 true RU2402826C2 (ru) | 2010-10-27 |
Family
ID=36588741
Family Applications (9)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2007140406/09A RU2390856C2 (ru) | 2005-04-01 | 2006-04-03 | Системы, способы и устройства для подавления высокополосных всплесков |
RU2007140381/09A RU2386179C2 (ru) | 2005-04-01 | 2006-04-03 | Способ и устройство для кодирования речевых сигналов с расщеплением полосы |
RU2007140382/09A RU2381572C2 (ru) | 2005-04-01 | 2006-04-03 | Системы, способы и устройство широкополосного речевого кодирования |
RU2009131435/08A RU2491659C2 (ru) | 2005-04-01 | 2006-04-03 | Системы, способы и устройства для высокополосного предыскажения шкалы времени |
RU2007140429/09A RU2387025C2 (ru) | 2005-04-01 | 2006-04-03 | Способ и устройство для векторного квантования спектрального представления огибающей |
RU2007140383/09A RU2402826C2 (ru) | 2005-04-01 | 2006-04-03 | Способы и устройство кодирования и декодирования части речевого сигнала диапазона высоких частот |
RU2007140394/09A RU2413191C2 (ru) | 2005-04-01 | 2006-04-03 | Системы, способы и устройства для устраняющей разреженность фильтрации |
RU2007140365/09A RU2376657C2 (ru) | 2005-04-01 | 2006-04-03 | Системы, способы и устройства для высокополосного предыскажения шкалы времени |
RU2007140426/09A RU2402827C2 (ru) | 2005-04-01 | 2006-04-03 | Системы, способы и устройство для генерирования возбуждения в диапазоне высоких частот |
Family Applications Before (5)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2007140406/09A RU2390856C2 (ru) | 2005-04-01 | 2006-04-03 | Системы, способы и устройства для подавления высокополосных всплесков |
RU2007140381/09A RU2386179C2 (ru) | 2005-04-01 | 2006-04-03 | Способ и устройство для кодирования речевых сигналов с расщеплением полосы |
RU2007140382/09A RU2381572C2 (ru) | 2005-04-01 | 2006-04-03 | Системы, способы и устройство широкополосного речевого кодирования |
RU2009131435/08A RU2491659C2 (ru) | 2005-04-01 | 2006-04-03 | Системы, способы и устройства для высокополосного предыскажения шкалы времени |
RU2007140429/09A RU2387025C2 (ru) | 2005-04-01 | 2006-04-03 | Способ и устройство для векторного квантования спектрального представления огибающей |
Family Applications After (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2007140394/09A RU2413191C2 (ru) | 2005-04-01 | 2006-04-03 | Системы, способы и устройства для устраняющей разреженность фильтрации |
RU2007140365/09A RU2376657C2 (ru) | 2005-04-01 | 2006-04-03 | Системы, способы и устройства для высокополосного предыскажения шкалы времени |
RU2007140426/09A RU2402827C2 (ru) | 2005-04-01 | 2006-04-03 | Системы, способы и устройство для генерирования возбуждения в диапазоне высоких частот |
Country Status (24)
Country | Link |
---|---|
US (8) | US8244526B2 (ru) |
EP (8) | EP1864281A1 (ru) |
JP (8) | JP5129115B2 (ru) |
KR (8) | KR100956876B1 (ru) |
CN (1) | CN102411935B (ru) |
AT (4) | ATE492016T1 (ru) |
AU (8) | AU2006252957B2 (ru) |
BR (8) | BRPI0608270A2 (ru) |
CA (8) | CA2602806C (ru) |
DE (4) | DE602006017050D1 (ru) |
DK (2) | DK1864101T3 (ru) |
ES (3) | ES2636443T3 (ru) |
HK (5) | HK1113848A1 (ru) |
IL (8) | IL186438A (ru) |
MX (8) | MX2007012191A (ru) |
NO (7) | NO20075511L (ru) |
NZ (6) | NZ562183A (ru) |
PL (4) | PL1864282T3 (ru) |
PT (2) | PT1864282T (ru) |
RU (9) | RU2390856C2 (ru) |
SG (4) | SG161224A1 (ru) |
SI (1) | SI1864282T1 (ru) |
TW (8) | TWI319565B (ru) |
WO (8) | WO2006107833A1 (ru) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2490727C2 (ru) * | 2011-11-28 | 2013-08-20 | Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования "Уральский государственный университет путей сообщения" (УрГУПС) | Способ передачи речевых сигналов (варианты) |
RU2562771C2 (ru) * | 2011-02-16 | 2015-09-10 | Долби Лабораторис Лайсэнзин Корпорейшн | Способы и системы генерирования коэффициентов фильтра и конфигурирования фильтров |
RU2575389C2 (ru) * | 2011-03-04 | 2016-02-20 | Телефонактиеболагет Л М Эрикссон (Пабл) | Коррекция коэффициента усиления после квантования при кодировании аудио |
RU2599966C2 (ru) * | 2011-02-18 | 2016-10-20 | Нтт Докомо, Инк. | Декодер речи, кодер речи, способ декодирования речи, способ кодирования речи, программа декодирования речи и программа кодирования речи |
RU2604425C2 (ru) * | 2013-02-15 | 2016-12-10 | Хуавэй Текнолоджиз Ко., Лтд. | Система и способ возбуждения смешанной кодовой книги для кодирования речи |
US10460738B2 (en) | 2016-03-15 | 2019-10-29 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Encoding apparatus for processing an input signal and decoding apparatus for processing an encoded signal |
Families Citing this family (317)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7987095B2 (en) * | 2002-09-27 | 2011-07-26 | Broadcom Corporation | Method and system for dual mode subband acoustic echo canceller with integrated noise suppression |
US7619995B1 (en) * | 2003-07-18 | 2009-11-17 | Nortel Networks Limited | Transcoders and mixers for voice-over-IP conferencing |
JP4679049B2 (ja) * | 2003-09-30 | 2011-04-27 | パナソニック株式会社 | スケーラブル復号化装置 |
US7668712B2 (en) * | 2004-03-31 | 2010-02-23 | Microsoft Corporation | Audio encoding and decoding with intra frames and adaptive forward error correction |
EP1744139B1 (en) * | 2004-05-14 | 2015-11-11 | Panasonic Intellectual Property Corporation of America | Decoding apparatus and method thereof |
JP4698593B2 (ja) * | 2004-07-20 | 2011-06-08 | パナソニック株式会社 | 音声復号化装置および音声復号化方法 |
CN101873267B (zh) * | 2004-08-30 | 2012-10-24 | 高通股份有限公司 | 用于语音ip传输的自适应去抖动缓冲器 |
US8085678B2 (en) * | 2004-10-13 | 2011-12-27 | Qualcomm Incorporated | Media (voice) playback (de-jitter) buffer adjustments based on air interface |
US8155965B2 (en) * | 2005-03-11 | 2012-04-10 | Qualcomm Incorporated | Time warping frames inside the vocoder by modifying the residual |
US8355907B2 (en) * | 2005-03-11 | 2013-01-15 | Qualcomm Incorporated | Method and apparatus for phase matching frames in vocoders |
WO2006103488A1 (en) * | 2005-03-30 | 2006-10-05 | Nokia Corporation | Source coding and/or decoding |
TWI319565B (en) | 2005-04-01 | 2010-01-11 | Qualcomm Inc | Methods, and apparatus for generating highband excitation signal |
US9043214B2 (en) * | 2005-04-22 | 2015-05-26 | Qualcomm Incorporated | Systems, methods, and apparatus for gain factor attenuation |
DK1869671T3 (da) * | 2005-04-28 | 2009-10-19 | Siemens Ag | Fremgangsmåde og anordning til stöjundertrykkelse |
US7177804B2 (en) * | 2005-05-31 | 2007-02-13 | Microsoft Corporation | Sub-band voice codec with multi-stage codebooks and redundant coding |
US7707034B2 (en) * | 2005-05-31 | 2010-04-27 | Microsoft Corporation | Audio codec post-filter |
US7831421B2 (en) * | 2005-05-31 | 2010-11-09 | Microsoft Corporation | Robust decoder |
DE102005032724B4 (de) * | 2005-07-13 | 2009-10-08 | Siemens Ag | Verfahren und Vorrichtung zur künstlichen Erweiterung der Bandbreite von Sprachsignalen |
US20100131276A1 (en) * | 2005-07-14 | 2010-05-27 | Koninklijke Philips Electronics, N.V. | Audio signal synthesis |
WO2007013973A2 (en) * | 2005-07-20 | 2007-02-01 | Shattil, Steve | Systems and method for high data rate ultra wideband communication |
KR101171098B1 (ko) * | 2005-07-22 | 2012-08-20 | 삼성전자주식회사 | 혼합 구조의 스케일러블 음성 부호화 방법 및 장치 |
US8326614B2 (en) * | 2005-09-02 | 2012-12-04 | Qnx Software Systems Limited | Speech enhancement system |
CA2558595C (en) * | 2005-09-02 | 2015-05-26 | Nortel Networks Limited | Method and apparatus for extending the bandwidth of a speech signal |
CN101273404B (zh) * | 2005-09-30 | 2012-07-04 | 松下电器产业株式会社 | 语音编码装置以及语音编码方法 |
JP4954080B2 (ja) | 2005-10-14 | 2012-06-13 | パナソニック株式会社 | 変換符号化装置および変換符号化方法 |
JPWO2007043643A1 (ja) * | 2005-10-14 | 2009-04-16 | パナソニック株式会社 | 音声符号化装置、音声復号装置、音声符号化方法、及び音声復号化方法 |
JP4876574B2 (ja) * | 2005-12-26 | 2012-02-15 | ソニー株式会社 | 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体 |
EP1852848A1 (en) * | 2006-05-05 | 2007-11-07 | Deutsche Thomson-Brandt GmbH | Method and apparatus for lossless encoding of a source signal using a lossy encoded data stream and a lossless extension data stream |
US8949120B1 (en) | 2006-05-25 | 2015-02-03 | Audience, Inc. | Adaptive noise cancelation |
US8135047B2 (en) | 2006-07-31 | 2012-03-13 | Qualcomm Incorporated | Systems and methods for including an identifier with a packet associated with a speech signal |
US8260609B2 (en) * | 2006-07-31 | 2012-09-04 | Qualcomm Incorporated | Systems, methods, and apparatus for wideband encoding and decoding of inactive frames |
US8725499B2 (en) * | 2006-07-31 | 2014-05-13 | Qualcomm Incorporated | Systems, methods, and apparatus for signal change detection |
US8532984B2 (en) | 2006-07-31 | 2013-09-10 | Qualcomm Incorporated | Systems, methods, and apparatus for wideband encoding and decoding of active frames |
US7987089B2 (en) * | 2006-07-31 | 2011-07-26 | Qualcomm Incorporated | Systems and methods for modifying a zero pad region of a windowed frame of an audio signal |
US20080046236A1 (en) * | 2006-08-15 | 2008-02-21 | Broadcom Corporation | Constrained and Controlled Decoding After Packet Loss |
US8706507B2 (en) | 2006-08-15 | 2014-04-22 | Dolby Laboratories Licensing Corporation | Arbitrary shaping of temporal noise envelope without side-information utilizing unchanged quantization |
US8239190B2 (en) * | 2006-08-22 | 2012-08-07 | Qualcomm Incorporated | Time-warping frames of wideband vocoder |
US8046218B2 (en) * | 2006-09-19 | 2011-10-25 | The Board Of Trustees Of The University Of Illinois | Speech and method for identifying perceptual features |
JP4972742B2 (ja) * | 2006-10-17 | 2012-07-11 | 国立大学法人九州工業大学 | 高域信号補間方法及び高域信号補間装置 |
EP4300825A3 (en) | 2006-10-25 | 2024-03-20 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for generating time-domain audio samples |
US8639500B2 (en) * | 2006-11-17 | 2014-01-28 | Samsung Electronics Co., Ltd. | Method, medium, and apparatus with bandwidth extension encoding and/or decoding |
KR101565919B1 (ko) | 2006-11-17 | 2015-11-05 | 삼성전자주식회사 | 고주파수 신호 부호화 및 복호화 방법 및 장치 |
KR101375582B1 (ko) | 2006-11-17 | 2014-03-20 | 삼성전자주식회사 | 대역폭 확장 부호화 및 복호화 방법 및 장치 |
US8005671B2 (en) * | 2006-12-04 | 2011-08-23 | Qualcomm Incorporated | Systems and methods for dynamic normalization to reduce loss in precision for low-level signals |
GB2444757B (en) * | 2006-12-13 | 2009-04-22 | Motorola Inc | Code excited linear prediction speech coding |
US20080147389A1 (en) * | 2006-12-15 | 2008-06-19 | Motorola, Inc. | Method and Apparatus for Robust Speech Activity Detection |
FR2911031B1 (fr) * | 2006-12-28 | 2009-04-10 | Actimagine Soc Par Actions Sim | Procede et dispositif de codage audio |
FR2911020B1 (fr) * | 2006-12-28 | 2009-05-01 | Actimagine Soc Par Actions Sim | Procede et dispositif de codage audio |
KR101379263B1 (ko) * | 2007-01-12 | 2014-03-28 | 삼성전자주식회사 | 대역폭 확장 복호화 방법 및 장치 |
US7873064B1 (en) * | 2007-02-12 | 2011-01-18 | Marvell International Ltd. | Adaptive jitter buffer-packet loss concealment |
US8032359B2 (en) * | 2007-02-14 | 2011-10-04 | Mindspeed Technologies, Inc. | Embedded silence and background noise compression |
GB0704622D0 (en) * | 2007-03-09 | 2007-04-18 | Skype Ltd | Speech coding system and method |
KR101411900B1 (ko) * | 2007-05-08 | 2014-06-26 | 삼성전자주식회사 | 오디오 신호의 부호화 및 복호화 방법 및 장치 |
US9653088B2 (en) * | 2007-06-13 | 2017-05-16 | Qualcomm Incorporated | Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding |
DK3591650T3 (da) | 2007-08-27 | 2021-02-15 | Ericsson Telefon Ab L M | Fremgangsmåde og indretning til udfyldning af spektrale huller |
FR2920545B1 (fr) * | 2007-09-03 | 2011-06-10 | Univ Sud Toulon Var | Procede de trajectographie de plusieurs cetaces par acoustique passive |
RU2449386C2 (ru) * | 2007-11-02 | 2012-04-27 | Хуавэй Текнолоджиз Ко., Лтд. | Способ и устройство для аудиодекодирования |
CA2704812C (en) * | 2007-11-06 | 2016-05-17 | Nokia Corporation | An encoder for encoding an audio signal |
WO2009059632A1 (en) * | 2007-11-06 | 2009-05-14 | Nokia Corporation | An encoder |
CN101896968A (zh) * | 2007-11-06 | 2010-11-24 | 诺基亚公司 | 音频编码装置及其方法 |
KR101444099B1 (ko) * | 2007-11-13 | 2014-09-26 | 삼성전자주식회사 | 음성 구간 검출 방법 및 장치 |
US8504377B2 (en) * | 2007-11-21 | 2013-08-06 | Lg Electronics Inc. | Method and an apparatus for processing a signal using length-adjusted window |
US8050934B2 (en) * | 2007-11-29 | 2011-11-01 | Texas Instruments Incorporated | Local pitch control based on seamless time scale modification and synchronized sampling rate conversion |
US8688441B2 (en) * | 2007-11-29 | 2014-04-01 | Motorola Mobility Llc | Method and apparatus to facilitate provision and use of an energy value to determine a spectral envelope shape for out-of-signal bandwidth content |
TWI356399B (en) * | 2007-12-14 | 2012-01-11 | Ind Tech Res Inst | Speech recognition system and method with cepstral |
KR101439205B1 (ko) * | 2007-12-21 | 2014-09-11 | 삼성전자주식회사 | 오디오 매트릭스 인코딩 및 디코딩 방법 및 장치 |
WO2009084221A1 (ja) * | 2007-12-27 | 2009-07-09 | Panasonic Corporation | 符号化装置、復号装置およびこれらの方法 |
KR101413968B1 (ko) * | 2008-01-29 | 2014-07-01 | 삼성전자주식회사 | 오디오 신호의 부호화, 복호화 방법 및 장치 |
KR101413967B1 (ko) * | 2008-01-29 | 2014-07-01 | 삼성전자주식회사 | 오디오 신호의 부호화 방법 및 복호화 방법, 및 그에 대한 기록 매체, 오디오 신호의 부호화 장치 및 복호화 장치 |
DE102008015702B4 (de) * | 2008-01-31 | 2010-03-11 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zur Bandbreitenerweiterung eines Audiosignals |
US8433582B2 (en) * | 2008-02-01 | 2013-04-30 | Motorola Mobility Llc | Method and apparatus for estimating high-band energy in a bandwidth extension system |
US20090201983A1 (en) * | 2008-02-07 | 2009-08-13 | Motorola, Inc. | Method and apparatus for estimating high-band energy in a bandwidth extension system |
WO2009116815A2 (en) * | 2008-03-20 | 2009-09-24 | Samsung Electronics Co., Ltd. | Apparatus and method for encoding and decoding using bandwidth extension in portable terminal |
US8983832B2 (en) * | 2008-07-03 | 2015-03-17 | The Board Of Trustees Of The University Of Illinois | Systems and methods for identifying speech sound features |
CA2729665C (en) * | 2008-07-10 | 2016-11-22 | Voiceage Corporation | Variable bit rate lpc filter quantizing and inverse quantizing device and method |
BRPI0904958B1 (pt) | 2008-07-11 | 2020-03-03 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Aparelho e método para calcular dados de extensão de largura de banda usando um quadro controlado por inclinação espectral |
CA2836871C (en) | 2008-07-11 | 2017-07-18 | Stefan Bayer | Time warp activation signal provider, audio signal encoder, method for providing a time warp activation signal, method for encoding an audio signal and computer programs |
MY154452A (en) * | 2008-07-11 | 2015-06-15 | Fraunhofer Ges Forschung | An apparatus and a method for decoding an encoded audio signal |
KR101614160B1 (ko) * | 2008-07-16 | 2016-04-20 | 한국전자통신연구원 | 포스트 다운믹스 신호를 지원하는 다객체 오디오 부호화 장치 및 복호화 장치 |
WO2010011963A1 (en) * | 2008-07-25 | 2010-01-28 | The Board Of Trustees Of The University Of Illinois | Methods and systems for identifying speech sounds using multi-dimensional analysis |
US8463412B2 (en) * | 2008-08-21 | 2013-06-11 | Motorola Mobility Llc | Method and apparatus to facilitate determining signal bounding frequencies |
WO2010028299A1 (en) * | 2008-09-06 | 2010-03-11 | Huawei Technologies Co., Ltd. | Noise-feedback for spectral envelope quantization |
US8352279B2 (en) * | 2008-09-06 | 2013-01-08 | Huawei Technologies Co., Ltd. | Efficient temporal envelope coding approach by prediction between low band signal and high band signal |
WO2010028292A1 (en) * | 2008-09-06 | 2010-03-11 | Huawei Technologies Co., Ltd. | Adaptive frequency prediction |
US8532998B2 (en) | 2008-09-06 | 2013-09-10 | Huawei Technologies Co., Ltd. | Selective bandwidth extension for encoding/decoding audio/speech signal |
WO2010028301A1 (en) * | 2008-09-06 | 2010-03-11 | GH Innovation, Inc. | Spectrum harmonic/noise sharpness control |
KR101178801B1 (ko) * | 2008-12-09 | 2012-08-31 | 한국전자통신연구원 | 음원분리 및 음원식별을 이용한 음성인식 장치 및 방법 |
US20100070550A1 (en) * | 2008-09-12 | 2010-03-18 | Cardinal Health 209 Inc. | Method and apparatus of a sensor amplifier configured for use in medical applications |
WO2010031049A1 (en) * | 2008-09-15 | 2010-03-18 | GH Innovation, Inc. | Improving celp post-processing for music signals |
WO2010031003A1 (en) * | 2008-09-15 | 2010-03-18 | Huawei Technologies Co., Ltd. | Adding second enhancement layer to celp based core layer |
EP2169670B1 (en) * | 2008-09-25 | 2016-07-20 | LG Electronics Inc. | An apparatus for processing an audio signal and method thereof |
EP2182513B1 (en) * | 2008-11-04 | 2013-03-20 | Lg Electronics Inc. | An apparatus for processing an audio signal and method thereof |
DE102008058496B4 (de) * | 2008-11-21 | 2010-09-09 | Siemens Medical Instruments Pte. Ltd. | Filterbanksystem mit spezifischen Sperrdämpfungsanteilen für eine Hörvorrichtung |
GB0822537D0 (en) | 2008-12-10 | 2009-01-14 | Skype Ltd | Regeneration of wideband speech |
US9947340B2 (en) * | 2008-12-10 | 2018-04-17 | Skype | Regeneration of wideband speech |
GB2466201B (en) * | 2008-12-10 | 2012-07-11 | Skype Ltd | Regeneration of wideband speech |
WO2010070770A1 (ja) * | 2008-12-19 | 2010-06-24 | 富士通株式会社 | 音声帯域拡張装置及び音声帯域拡張方法 |
GB2466669B (en) * | 2009-01-06 | 2013-03-06 | Skype | Speech coding |
GB2466672B (en) * | 2009-01-06 | 2013-03-13 | Skype | Speech coding |
GB2466675B (en) | 2009-01-06 | 2013-03-06 | Skype | Speech coding |
GB2466670B (en) * | 2009-01-06 | 2012-11-14 | Skype | Speech encoding |
GB2466673B (en) | 2009-01-06 | 2012-11-07 | Skype | Quantization |
GB2466674B (en) | 2009-01-06 | 2013-11-13 | Skype | Speech coding |
GB2466671B (en) | 2009-01-06 | 2013-03-27 | Skype | Speech encoding |
PL3598447T3 (pl) | 2009-01-16 | 2022-02-14 | Dolby International Ab | Transpozycja harmonicznych rozszerzona o iloczyn wektorowy |
US8463599B2 (en) * | 2009-02-04 | 2013-06-11 | Motorola Mobility Llc | Bandwidth extension method and apparatus for a modified discrete cosine transform audio coder |
EP2407965B1 (en) * | 2009-03-31 | 2012-12-12 | Huawei Technologies Co., Ltd. | Method and device for audio signal denoising |
JP4932917B2 (ja) * | 2009-04-03 | 2012-05-16 | 株式会社エヌ・ティ・ティ・ドコモ | 音声復号装置、音声復号方法、及び音声復号プログラム |
JP4921611B2 (ja) * | 2009-04-03 | 2012-04-25 | 株式会社エヌ・ティ・ティ・ドコモ | 音声復号装置、音声復号方法、及び音声復号プログラム |
CN102460574A (zh) * | 2009-05-19 | 2012-05-16 | 韩国电子通信研究院 | 用于使用层级正弦脉冲编码对音频信号进行编码和解码的方法和设备 |
US8000485B2 (en) * | 2009-06-01 | 2011-08-16 | Dts, Inc. | Virtual audio processing for loudspeaker or headphone playback |
CN101609680B (zh) * | 2009-06-01 | 2012-01-04 | 华为技术有限公司 | 压缩编码和解码的方法、编码器和解码器以及编码装置 |
KR20110001130A (ko) * | 2009-06-29 | 2011-01-06 | 삼성전자주식회사 | 가중 선형 예측 변환을 이용한 오디오 신호 부호화 및 복호화 장치 및 그 방법 |
WO2011029484A1 (en) * | 2009-09-14 | 2011-03-17 | Nokia Corporation | Signal enhancement processing |
US9595257B2 (en) * | 2009-09-28 | 2017-03-14 | Nuance Communications, Inc. | Downsampling schemes in a hierarchical neural network structure for phoneme recognition |
US8452606B2 (en) * | 2009-09-29 | 2013-05-28 | Skype | Speech encoding using multiple bit rates |
JP5754899B2 (ja) * | 2009-10-07 | 2015-07-29 | ソニー株式会社 | 復号装置および方法、並びにプログラム |
BR112012009446B1 (pt) | 2009-10-20 | 2023-03-21 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V | Método e aparelho de armazenamento de dados |
EP2704143B1 (en) * | 2009-10-21 | 2015-01-07 | Panasonic Intellectual Property Corporation of America | Apparatus, method and computer program for audio signal processing |
ES2805349T3 (es) | 2009-10-21 | 2021-02-11 | Dolby Int Ab | Sobremuestreo en un banco de filtros de reemisor combinado |
US8484020B2 (en) | 2009-10-23 | 2013-07-09 | Qualcomm Incorporated | Determining an upperband signal from a narrowband signal |
CN102612712B (zh) * | 2009-11-19 | 2014-03-12 | 瑞典爱立信有限公司 | 低频带音频信号的带宽扩展 |
CA2780971A1 (en) * | 2009-11-19 | 2011-05-26 | Telefonaktiebolaget L M Ericsson (Publ) | Improved excitation signal bandwidth extension |
US8489393B2 (en) * | 2009-11-23 | 2013-07-16 | Cambridge Silicon Radio Limited | Speech intelligibility |
US9838784B2 (en) | 2009-12-02 | 2017-12-05 | Knowles Electronics, Llc | Directional audio capture |
RU2464651C2 (ru) * | 2009-12-22 | 2012-10-20 | Общество с ограниченной ответственностью "Спирит Корп" | Способ и устройство многоуровневого масштабируемого устойчивого к информационным потерям кодирования речи для сетей с коммутацией пакетов |
US20110167445A1 (en) * | 2010-01-06 | 2011-07-07 | Reams Robert W | Audiovisual content channelization system |
US8326607B2 (en) * | 2010-01-11 | 2012-12-04 | Sony Ericsson Mobile Communications Ab | Method and arrangement for enhancing speech quality |
PT2524371T (pt) | 2010-01-12 | 2017-03-15 | Fraunhofer Ges Forschung | Codificador de áudio, descodificador de áudio, método de codificação de uma informação de áudio, método de descodificação de uma informação de áudio e programa de computador que utiliza uma tabela hash que descreve tanto valores de estado significativos como limites de intervalo |
US8699727B2 (en) | 2010-01-15 | 2014-04-15 | Apple Inc. | Visually-assisted mixing of audio using a spectral analyzer |
US9525569B2 (en) * | 2010-03-03 | 2016-12-20 | Skype | Enhanced circuit-switched calls |
CN102884572B (zh) | 2010-03-10 | 2015-06-17 | 弗兰霍菲尔运输应用研究公司 | 音频信号解码器、音频信号编码器、用以将音频信号解码的方法、及用以将音频信号编码的方法 |
US8700391B1 (en) * | 2010-04-01 | 2014-04-15 | Audience, Inc. | Low complexity bandwidth expansion of speech |
CN102870156B (zh) * | 2010-04-12 | 2015-07-22 | 飞思卡尔半导体公司 | 音频通信设备、输出音频信号的方法和通信系统 |
BR112012026326B1 (pt) * | 2010-04-13 | 2021-05-04 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V | método e codificador e decodificador para representação com amostragem precisa de um sinal de áudio |
JP5850216B2 (ja) | 2010-04-13 | 2016-02-03 | ソニー株式会社 | 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム |
JP5609737B2 (ja) | 2010-04-13 | 2014-10-22 | ソニー株式会社 | 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム |
JP5652658B2 (ja) | 2010-04-13 | 2015-01-14 | ソニー株式会社 | 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム |
US9443534B2 (en) * | 2010-04-14 | 2016-09-13 | Huawei Technologies Co., Ltd. | Bandwidth extension system and approach |
MX2012011943A (es) * | 2010-04-14 | 2013-01-24 | Voiceage Corp | Libro de códigos de innovacion combinado, flexible y escalable para uso en codificador y decodificador celp. |
MX2012011828A (es) * | 2010-04-16 | 2013-02-27 | Fraunhofer Ges Forschung | Aparato, metodo y programa de computadora para generar una señal de banda amplia que utiliza extension de ancho de banda guiada y extension oculta de ancho de banda. |
US8473287B2 (en) | 2010-04-19 | 2013-06-25 | Audience, Inc. | Method for jointly optimizing noise reduction and voice quality in a mono or multi-microphone system |
US8538035B2 (en) | 2010-04-29 | 2013-09-17 | Audience, Inc. | Multi-microphone robust noise suppression |
US8798290B1 (en) | 2010-04-21 | 2014-08-05 | Audience, Inc. | Systems and methods for adaptive signal equalization |
US8781137B1 (en) | 2010-04-27 | 2014-07-15 | Audience, Inc. | Wind noise detection and suppression |
US9378754B1 (en) | 2010-04-28 | 2016-06-28 | Knowles Electronics, Llc | Adaptive spatial classifier for multi-microphone systems |
US9558755B1 (en) | 2010-05-20 | 2017-01-31 | Knowles Electronics, Llc | Noise suppression assisted automatic speech recognition |
KR101660843B1 (ko) * | 2010-05-27 | 2016-09-29 | 삼성전자주식회사 | Lpc 계수 양자화를 위한 가중치 함수 결정 장치 및 방법 |
US8600737B2 (en) * | 2010-06-01 | 2013-12-03 | Qualcomm Incorporated | Systems, methods, apparatus, and computer program products for wideband speech coding |
ES2372202B2 (es) * | 2010-06-29 | 2012-08-08 | Universidad De Málaga | Sistema de reconocimiento de sonidos de bajo consumo. |
KR102079000B1 (ko) | 2010-07-02 | 2020-02-19 | 돌비 인터네셔널 에이비 | 선택적인 베이스 포스트 필터 |
US8447596B2 (en) | 2010-07-12 | 2013-05-21 | Audience, Inc. | Monaural noise suppression based on computational auditory scene analysis |
JP5589631B2 (ja) * | 2010-07-15 | 2014-09-17 | 富士通株式会社 | 音声処理装置、音声処理方法および電話装置 |
WO2012008891A1 (en) * | 2010-07-16 | 2012-01-19 | Telefonaktiebolaget L M Ericsson (Publ) | Audio encoder and decoder and methods for encoding and decoding an audio signal |
JP5777041B2 (ja) * | 2010-07-23 | 2015-09-09 | 沖電気工業株式会社 | 帯域拡張装置及びプログラム、並びに、音声通信装置 |
JP6075743B2 (ja) | 2010-08-03 | 2017-02-08 | ソニー株式会社 | 信号処理装置および方法、並びにプログラム |
WO2012031125A2 (en) | 2010-09-01 | 2012-03-08 | The General Hospital Corporation | Reversal of general anesthesia by administration of methylphenidate, amphetamine, modafinil, amantadine, and/or caffeine |
ES2933477T3 (es) * | 2010-09-16 | 2023-02-09 | Dolby Int Ab | Transposición armónica basada en bloque de subbanda mejorado de producto cruzado |
JP5707842B2 (ja) | 2010-10-15 | 2015-04-30 | ソニー株式会社 | 符号化装置および方法、復号装置および方法、並びにプログラム |
US8924200B2 (en) | 2010-10-15 | 2014-12-30 | Motorola Mobility Llc | Audio signal bandwidth extension in CELP-based speech coder |
WO2012053149A1 (ja) * | 2010-10-22 | 2012-04-26 | パナソニック株式会社 | 音声分析装置、量子化装置、逆量子化装置、及びこれらの方法 |
JP5743137B2 (ja) * | 2011-01-14 | 2015-07-01 | ソニー株式会社 | 信号処理装置および方法、並びにプログラム |
US9767823B2 (en) | 2011-02-07 | 2017-09-19 | Qualcomm Incorporated | Devices for encoding and detecting a watermarked signal |
US9767822B2 (en) | 2011-02-07 | 2017-09-19 | Qualcomm Incorporated | Devices for encoding and decoding a watermarked signal |
SG192721A1 (en) | 2011-02-14 | 2013-09-30 | Fraunhofer Ges Forschung | Apparatus and method for encoding and decoding an audio signal using an aligned look-ahead portion |
AU2012217215B2 (en) | 2011-02-14 | 2015-05-14 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for error concealment in low-delay unified speech and audio coding (USAC) |
CA2903681C (en) | 2011-02-14 | 2017-03-28 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Audio codec using noise synthesis during inactive phases |
AU2012217216B2 (en) | 2011-02-14 | 2015-09-17 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for coding a portion of an audio signal using a transient detection and a quality result |
CN103477386B (zh) * | 2011-02-14 | 2016-06-01 | 弗劳恩霍夫应用研究促进协会 | 音频编解码器中的噪声产生 |
CA2799343C (en) | 2011-02-14 | 2016-06-21 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Information signal representation using lapped transform |
AU2012217269B2 (en) | 2011-02-14 | 2015-10-22 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for processing a decoded audio signal in a spectral domain |
TWI488176B (zh) | 2011-02-14 | 2015-06-11 | Fraunhofer Ges Forschung | 音訊信號音軌脈衝位置之編碼與解碼技術 |
MX2013009345A (es) | 2011-02-14 | 2013-10-01 | Fraunhofer Ges Forschung | Codificacion y decodificacion de posiciones de los pulsos de las pistas de una señal de audio. |
WO2012122397A1 (en) | 2011-03-09 | 2012-09-13 | Srs Labs, Inc. | System for dynamically creating and rendering audio objects |
US9842168B2 (en) | 2011-03-31 | 2017-12-12 | Microsoft Technology Licensing, Llc | Task driven user intents |
US9760566B2 (en) | 2011-03-31 | 2017-09-12 | Microsoft Technology Licensing, Llc | Augmented conversational understanding agent to identify conversation context between two humans and taking an agent action thereof |
US10642934B2 (en) | 2011-03-31 | 2020-05-05 | Microsoft Technology Licensing, Llc | Augmented conversational understanding architecture |
US9298287B2 (en) | 2011-03-31 | 2016-03-29 | Microsoft Technology Licensing, Llc | Combined activation for natural user interface systems |
US9244984B2 (en) | 2011-03-31 | 2016-01-26 | Microsoft Technology Licensing, Llc | Location based conversational understanding |
JP5704397B2 (ja) * | 2011-03-31 | 2015-04-22 | ソニー株式会社 | 符号化装置および方法、並びにプログラム |
US9064006B2 (en) | 2012-08-23 | 2015-06-23 | Microsoft Technology Licensing, Llc | Translating natural language utterances to keyword search queries |
CN102811034A (zh) | 2011-05-31 | 2012-12-05 | 财团法人工业技术研究院 | 信号处理装置及信号处理方法 |
JP5986565B2 (ja) * | 2011-06-09 | 2016-09-06 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 音声符号化装置、音声復号装置、音声符号化方法及び音声復号方法 |
US9070361B2 (en) | 2011-06-10 | 2015-06-30 | Google Technology Holdings LLC | Method and apparatus for encoding a wideband speech signal utilizing downmixing of a highband component |
MX370012B (es) * | 2011-06-30 | 2019-11-28 | Samsung Electronics Co Ltd | Aparato y método para generar señal extendida de ancho de banda. |
US9059786B2 (en) * | 2011-07-07 | 2015-06-16 | Vecima Networks Inc. | Ingress suppression for communication systems |
JP5942358B2 (ja) | 2011-08-24 | 2016-06-29 | ソニー株式会社 | 符号化装置および方法、復号装置および方法、並びにプログラム |
RU2486636C1 (ru) * | 2011-11-14 | 2013-06-27 | Федеральное государственное военное образовательное учреждение высшего профессионального образования "Военный авиационный инженерный университет" (г. Воронеж) Министерства обороны Российской Федерации | Способ генерации высокочастотных сигналов и устройство его реализации |
RU2486637C1 (ru) * | 2011-11-15 | 2013-06-27 | Федеральное государственное военное образовательное учреждение высшего профессионального образования "Военный авиационный инженерный университет" (г. Воронеж) Министерства обороны Российской Федерации | Способ генерации и частотной модуляции высокочастотных сигналов и устройство его реализации |
RU2486638C1 (ru) * | 2011-11-15 | 2013-06-27 | Федеральное государственное военное образовательное учреждение высшего профессионального образования "Военный авиационный инженерный университет" (г. Воронеж) Министерства обороны Российской Федерации | Способ генерации высокочастотных сигналов и устройство его реализации |
RU2496222C2 (ru) * | 2011-11-17 | 2013-10-20 | Федеральное государственное образовательное учреждение высшего профессионального образования "Военный авиационный инженерный университет" (г. Воронеж) Министерства обороны Российской Федерации | Способ генерации и частотной модуляции высокочастотных сигналов и устройство его реализации |
RU2486639C1 (ru) * | 2011-11-21 | 2013-06-27 | Федеральное государственное военное образовательное учреждение высшего профессионального образования "Военный авиационный инженерный университет" (г. Воронеж) Министерства обороны Российской Федерации | Способ генерации и частотной модуляции высокочастотных сигналов и устройство его реализации |
RU2496192C2 (ru) * | 2011-11-21 | 2013-10-20 | Федеральное государственное военное образовательное учреждение высшего профессионального образования "Военный авиационный инженерный университет" (г. Воронеж) Министерства обороны Российской Федерации | Способ генерации и частотной модуляции высокочастотных сигналов и устройство его реализации |
RU2487443C1 (ru) * | 2011-11-29 | 2013-07-10 | Федеральное государственное военное образовательное учреждение высшего профессионального образования "Военный авиационный инженерный университет" (г. Воронеж) Министерства обороны Российской Федерации | Способ согласования комплексных сопротивлений и устройство его реализации |
JP5817499B2 (ja) * | 2011-12-15 | 2015-11-18 | 富士通株式会社 | 復号装置、符号化装置、符号化復号システム、復号方法、符号化方法、復号プログラム、及び符号化プログラム |
US9082398B2 (en) * | 2012-02-28 | 2015-07-14 | Huawei Technologies Co., Ltd. | System and method for post excitation enhancement for low bit rate speech coding |
US9437213B2 (en) * | 2012-03-05 | 2016-09-06 | Malaspina Labs (Barbados) Inc. | Voice signal enhancement |
CN104321815B (zh) * | 2012-03-21 | 2018-10-16 | 三星电子株式会社 | 用于带宽扩展的高频编码/高频解码方法和设备 |
EP4274235A3 (en) | 2012-03-29 | 2024-01-10 | Telefonaktiebolaget LM Ericsson (publ) | Vector quantizer |
US10448161B2 (en) | 2012-04-02 | 2019-10-15 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for gestural manipulation of a sound field |
JP5998603B2 (ja) * | 2012-04-18 | 2016-09-28 | ソニー株式会社 | 音検出装置、音検出方法、音特徴量検出装置、音特徴量検出方法、音区間検出装置、音区間検出方法およびプログラム |
KR101343768B1 (ko) * | 2012-04-19 | 2014-01-16 | 충북대학교 산학협력단 | 스펙트럼 변화 패턴을 이용한 음성 및 오디오 신호 분류방법 |
RU2504894C1 (ru) * | 2012-05-17 | 2014-01-20 | Федеральное государственное военное образовательное учреждение высшего профессионального образования "Военный авиационный инженерный университет" (г. Воронеж) Министерства обороны Российской Федерации | Способ демодуляции фазомодулированных и частотно-модулированных сигналов и устройство его реализации |
RU2504898C1 (ru) * | 2012-05-17 | 2014-01-20 | Федеральное государственное военное образовательное учреждение высшего профессионального образования "Военный авиационный инженерный университет" (г. Воронеж) Министерства обороны Российской Федерации | Способ демодуляции фазомодулированных и частотно-модулированных сигналов и устройство его реализации |
US20140006017A1 (en) * | 2012-06-29 | 2014-01-02 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for generating obfuscated speech signal |
WO2014035328A1 (en) | 2012-08-31 | 2014-03-06 | Telefonaktiebolaget L M Ericsson (Publ) | Method and device for voice activity detection |
WO2014046916A1 (en) | 2012-09-21 | 2014-03-27 | Dolby Laboratories Licensing Corporation | Layered approach to spatial audio coding |
WO2014062859A1 (en) * | 2012-10-16 | 2014-04-24 | Audiologicall, Ltd. | Audio signal manipulation for speech enhancement before sound reproduction |
KR101413969B1 (ko) | 2012-12-20 | 2014-07-08 | 삼성전자주식회사 | 오디오 신호의 복호화 방법 및 장치 |
CN103928031B (zh) | 2013-01-15 | 2016-03-30 | 华为技术有限公司 | 编码方法、解码方法、编码装置和解码装置 |
SG11201505903UA (en) | 2013-01-29 | 2015-08-28 | Fraunhofer Ges Forschung | Apparatus and method for synthesizing an audio signal, decoder, encoder, system and computer program |
CN103971693B (zh) | 2013-01-29 | 2017-02-22 | 华为技术有限公司 | 高频带信号的预测方法、编/解码设备 |
CN105264599B (zh) * | 2013-01-29 | 2019-05-10 | 弗劳恩霍夫应用研究促进协会 | 音频编码器、音频解码器、提供编码音频信息的方法 |
US9728200B2 (en) | 2013-01-29 | 2017-08-08 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for adaptive formant sharpening in linear prediction coding |
US20140213909A1 (en) * | 2013-01-31 | 2014-07-31 | Xerox Corporation | Control-based inversion for estimating a biological parameter vector for a biophysics model from diffused reflectance data |
US9601125B2 (en) * | 2013-02-08 | 2017-03-21 | Qualcomm Incorporated | Systems and methods of performing noise modulation and gain adjustment |
US9741350B2 (en) | 2013-02-08 | 2017-08-22 | Qualcomm Incorporated | Systems and methods of performing gain control |
US9711156B2 (en) * | 2013-02-08 | 2017-07-18 | Qualcomm Incorporated | Systems and methods of performing filtering for gain determination |
US9336789B2 (en) * | 2013-02-21 | 2016-05-10 | Qualcomm Incorporated | Systems and methods for determining an interpolation factor set for synthesizing a speech signal |
WO2014136629A1 (ja) * | 2013-03-05 | 2014-09-12 | 日本電気株式会社 | 信号処理装置、信号処理方法および信号処理プログラム |
EP2784775B1 (en) * | 2013-03-27 | 2016-09-14 | Binauric SE | Speech signal encoding/decoding method and apparatus |
CN110265047B (zh) * | 2013-04-05 | 2021-05-18 | 杜比国际公司 | 音频信号的解码方法和解码器、介质以及编码方法 |
KR102150496B1 (ko) * | 2013-04-05 | 2020-09-01 | 돌비 인터네셔널 에이비 | 오디오 인코더 및 디코더 |
CN105264600B (zh) | 2013-04-05 | 2019-06-07 | Dts有限责任公司 | 分层音频编码和传输 |
BR112015031181A2 (pt) * | 2013-06-21 | 2017-07-25 | Fraunhofer Ges Forschung | aparelho e método que realizam conceitos aperfeiçoados para tcx ltp |
EP3011560B1 (en) | 2013-06-21 | 2018-08-01 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio decoder having a bandwidth extension module with an energy adjusting module |
FR3007563A1 (fr) * | 2013-06-25 | 2014-12-26 | France Telecom | Extension amelioree de bande de frequence dans un decodeur de signaux audiofrequences |
WO2014210549A1 (en) | 2013-06-27 | 2014-12-31 | The General Hospital Corporation | Systems and methods for tracking non-stationary spectral structure and dynamics in physiological data |
WO2014210527A1 (en) * | 2013-06-28 | 2014-12-31 | The General Hospital Corporation | System and method to infer brain state during burst suppression |
CN104282308B (zh) * | 2013-07-04 | 2017-07-14 | 华为技术有限公司 | 频域包络的矢量量化方法和装置 |
FR3008533A1 (fr) | 2013-07-12 | 2015-01-16 | Orange | Facteur d'echelle optimise pour l'extension de bande de frequence dans un decodeur de signaux audiofrequences |
EP2830059A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Noise filling energy adjustment |
BR112016004299B1 (pt) | 2013-08-28 | 2022-05-17 | Dolby Laboratories Licensing Corporation | Método, aparelho e meio de armazenamento legível por computador para melhora de fala codificada paramétrica e codificada com forma de onda híbrida |
TWI557726B (zh) * | 2013-08-29 | 2016-11-11 | 杜比國際公司 | 用於決定音頻信號的高頻帶信號的主比例因子頻帶表之系統和方法 |
EP4166072A1 (en) | 2013-09-13 | 2023-04-19 | The General Hospital Corporation | Systems and methods for improved brain monitoring during general anesthesia and sedation |
CN105531762B (zh) | 2013-09-19 | 2019-10-01 | 索尼公司 | 编码装置和方法、解码装置和方法以及程序 |
CN104517610B (zh) * | 2013-09-26 | 2018-03-06 | 华为技术有限公司 | 频带扩展的方法及装置 |
CN105761723B (zh) | 2013-09-26 | 2019-01-15 | 华为技术有限公司 | 一种高频激励信号预测方法及装置 |
US9224402B2 (en) | 2013-09-30 | 2015-12-29 | International Business Machines Corporation | Wideband speech parameterization for high quality synthesis, transformation and quantization |
US9620134B2 (en) * | 2013-10-10 | 2017-04-11 | Qualcomm Incorporated | Gain shape estimation for improved tracking of high-band temporal characteristics |
US10083708B2 (en) * | 2013-10-11 | 2018-09-25 | Qualcomm Incorporated | Estimation of mixing factors to generate high-band excitation signal |
US9384746B2 (en) * | 2013-10-14 | 2016-07-05 | Qualcomm Incorporated | Systems and methods of energy-scaled signal processing |
KR102271852B1 (ko) | 2013-11-02 | 2021-07-01 | 삼성전자주식회사 | 광대역 신호 생성방법 및 장치와 이를 채용하는 기기 |
EP2871641A1 (en) * | 2013-11-12 | 2015-05-13 | Dialog Semiconductor B.V. | Enhancement of narrowband audio signals using a single sideband AM modulation |
KR20160087827A (ko) | 2013-11-22 | 2016-07-22 | 퀄컴 인코포레이티드 | 고대역 코딩에서의 선택적 위상 보상 |
US10163447B2 (en) * | 2013-12-16 | 2018-12-25 | Qualcomm Incorporated | High-band signal modeling |
RU2764260C2 (ru) | 2013-12-27 | 2022-01-14 | Сони Корпорейшн | Устройство и способ декодирования |
CN103714822B (zh) * | 2013-12-27 | 2017-01-11 | 广州华多网络科技有限公司 | 基于silk编解码器的子带编解码方法及装置 |
FR3017484A1 (fr) * | 2014-02-07 | 2015-08-14 | Orange | Extension amelioree de bande de frequence dans un decodeur de signaux audiofrequences |
US9564141B2 (en) | 2014-02-13 | 2017-02-07 | Qualcomm Incorporated | Harmonic bandwidth extension of audio signals |
JP6281336B2 (ja) * | 2014-03-12 | 2018-02-21 | 沖電気工業株式会社 | 音声復号化装置及びプログラム |
JP6035270B2 (ja) * | 2014-03-24 | 2016-11-30 | 株式会社Nttドコモ | 音声復号装置、音声符号化装置、音声復号方法、音声符号化方法、音声復号プログラム、および音声符号化プログラム |
BR112016019838B1 (pt) * | 2014-03-31 | 2023-02-23 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Codificador de áudio, decodificador de áudio, método de codificação, método de decodificação e mídia de registro legível por computador não transitória |
US9542955B2 (en) | 2014-03-31 | 2017-01-10 | Qualcomm Incorporated | High-band signal coding using multiple sub-bands |
US9697843B2 (en) * | 2014-04-30 | 2017-07-04 | Qualcomm Incorporated | High band excitation signal generation |
CN106409304B (zh) * | 2014-06-12 | 2020-08-25 | 华为技术有限公司 | 一种音频信号的时域包络处理方法及装置、编码器 |
CN105336338B (zh) | 2014-06-24 | 2017-04-12 | 华为技术有限公司 | 音频编码方法和装置 |
US9984699B2 (en) * | 2014-06-26 | 2018-05-29 | Qualcomm Incorporated | High-band signal coding using mismatched frequency ranges |
US9583115B2 (en) * | 2014-06-26 | 2017-02-28 | Qualcomm Incorporated | Temporal gain adjustment based on high-band signal characteristic |
CN105225670B (zh) * | 2014-06-27 | 2016-12-28 | 华为技术有限公司 | 一种音频编码方法和装置 |
US9721584B2 (en) * | 2014-07-14 | 2017-08-01 | Intel IP Corporation | Wind noise reduction for audio reception |
EP2980798A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Harmonicity-dependent controlling of a harmonic filter tool |
EP2980794A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder and decoder using a frequency domain processor and a time domain processor |
EP2980795A1 (en) * | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoding and decoding using a frequency domain processor, a time domain processor and a cross processor for initialization of the time domain processor |
EP2980792A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for generating an enhanced signal using independent noise-filling |
WO2016024853A1 (ko) * | 2014-08-15 | 2016-02-18 | 삼성전자 주식회사 | 음질 향상 방법 및 장치, 음성 복호화방법 및 장치와 이를 채용한 멀티미디어 기기 |
CN104217730B (zh) * | 2014-08-18 | 2017-07-21 | 大连理工大学 | 一种基于k‑svd的人工语音带宽扩展方法及装置 |
US9978388B2 (en) | 2014-09-12 | 2018-05-22 | Knowles Electronics, Llc | Systems and methods for restoration of speech components |
TWI550945B (zh) * | 2014-12-22 | 2016-09-21 | 國立彰化師範大學 | 具有急遽過渡帶的複合濾波器之設計方法及其串聯式複合濾波器 |
US9595269B2 (en) * | 2015-01-19 | 2017-03-14 | Qualcomm Incorporated | Scaling for gain shape circuitry |
US9668048B2 (en) | 2015-01-30 | 2017-05-30 | Knowles Electronics, Llc | Contextual switching of microphones |
CN107517593B (zh) * | 2015-02-26 | 2021-03-12 | 弗劳恩霍夫应用研究促进协会 | 用于使用目标时域包络来处理音频信号以获得经处理的音频信号的装置和方法 |
US10847170B2 (en) * | 2015-06-18 | 2020-11-24 | Qualcomm Incorporated | Device and method for generating a high-band signal from non-linearly processed sub-ranges |
US9837089B2 (en) * | 2015-06-18 | 2017-12-05 | Qualcomm Incorporated | High-band signal generation |
US9407989B1 (en) | 2015-06-30 | 2016-08-02 | Arthur Woodrow | Closed audio circuit |
US9830921B2 (en) * | 2015-08-17 | 2017-11-28 | Qualcomm Incorporated | High-band target signal control |
WO2017064264A1 (en) * | 2015-10-15 | 2017-04-20 | Huawei Technologies Co., Ltd. | Method and appratus for sinusoidal encoding and decoding |
NO20151400A1 (en) | 2015-10-15 | 2017-01-23 | St Tech As | A system for isolating an object |
MX371223B (es) | 2016-02-17 | 2020-01-09 | Fraunhofer Ges Forschung | Post-procesador, pre-procesador, codificador de audio, decodificador de audio y metodos relacionados para mejorar el procesamiento de transitorios. |
PT3443557T (pt) * | 2016-04-12 | 2020-08-27 | Fraunhofer Ges Forschung | Codificador de áudio para codificar um sinal de áudio, método para codificar um sinal de áudio e programa de computador sob consideração de uma região espectral de pico detetada numa banda de frequência superior |
US20170330575A1 (en) * | 2016-05-10 | 2017-11-16 | Immersion Services LLC | Adaptive audio codec system, method and article |
US10756755B2 (en) * | 2016-05-10 | 2020-08-25 | Immersion Networks, Inc. | Adaptive audio codec system, method and article |
US10699725B2 (en) * | 2016-05-10 | 2020-06-30 | Immersion Networks, Inc. | Adaptive audio encoder system, method and article |
AU2017262757B2 (en) * | 2016-05-10 | 2022-04-07 | Immersion Services LLC | Adaptive audio codec system, method, apparatus and medium |
US10770088B2 (en) * | 2016-05-10 | 2020-09-08 | Immersion Networks, Inc. | Adaptive audio decoder system, method and article |
US10264116B2 (en) * | 2016-11-02 | 2019-04-16 | Nokia Technologies Oy | Virtual duplex operation |
KR102507383B1 (ko) * | 2016-11-08 | 2023-03-08 | 한국전자통신연구원 | 직사각형 윈도우를 이용한 스테레오 정합 방법 및 스테레오 정합 시스템 |
WO2018102402A1 (en) | 2016-11-29 | 2018-06-07 | The General Hospital Corporation | Systems and methods for analyzing electrophysiological data from patients undergoing medical treatments |
ES2950009T3 (es) * | 2017-01-06 | 2023-10-04 | Ericsson Telefon Ab L M | Métodos y aparatos para señalizar y determinar desplazamientos de señal de referencia |
KR20180092582A (ko) * | 2017-02-10 | 2018-08-20 | 삼성전자주식회사 | Wfst 디코딩 시스템, 이를 포함하는 음성 인식 시스템 및 wfst 데이터 저장 방법 |
US10553222B2 (en) * | 2017-03-09 | 2020-02-04 | Qualcomm Incorporated | Inter-channel bandwidth extension spectral mapping and adjustment |
US10304468B2 (en) * | 2017-03-20 | 2019-05-28 | Qualcomm Incorporated | Target sample generation |
TWI807562B (zh) * | 2017-03-23 | 2023-07-01 | 瑞典商都比國際公司 | 用於音訊信號之高頻重建的諧波轉置器的回溯相容整合 |
US10825467B2 (en) * | 2017-04-21 | 2020-11-03 | Qualcomm Incorporated | Non-harmonic speech detection and bandwidth extension in a multi-source environment |
US20190051286A1 (en) * | 2017-08-14 | 2019-02-14 | Microsoft Technology Licensing, Llc | Normalization of high band signals in network telephony communications |
KR102438549B1 (ko) * | 2017-10-27 | 2022-08-31 | 테라웨이브, 엘엘씨 | 인코딩된 정현파 파형들을 이용한 고 스펙트럼 효율의 데이터 통신 시스템을 위한 수신기 |
US11876659B2 (en) | 2017-10-27 | 2024-01-16 | Terawave, Llc | Communication system using shape-shifted sinusoidal waveforms |
CN109729553B (zh) * | 2017-10-30 | 2021-12-28 | 成都鼎桥通信技术有限公司 | Lte集群通信系统的语音业务处理方法及设备 |
EP3483879A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Analysis/synthesis windowing function for modulated lapped transformation |
EP3483880A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Temporal noise shaping |
EP3483884A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Signal filtering |
WO2019091576A1 (en) | 2017-11-10 | 2019-05-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits |
EP3483883A1 (en) * | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio coding and decoding with selective postfiltering |
EP3483886A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Selecting pitch lag |
WO2019091573A1 (en) | 2017-11-10 | 2019-05-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding and decoding an audio signal using downsampling or interpolation of scale parameters |
EP3483878A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio decoder supporting a set of different loss concealment tools |
EP3483882A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Controlling bandwidth in encoders and/or decoders |
US10460749B1 (en) * | 2018-06-28 | 2019-10-29 | Nuvoton Technology Corporation | Voice activity detection using vocal tract area information |
US10847172B2 (en) * | 2018-12-17 | 2020-11-24 | Microsoft Technology Licensing, Llc | Phase quantization in a speech encoder |
US10957331B2 (en) | 2018-12-17 | 2021-03-23 | Microsoft Technology Licensing, Llc | Phase reconstruction in a speech decoder |
WO2020171034A1 (ja) * | 2019-02-20 | 2020-08-27 | ヤマハ株式会社 | 音信号生成方法、生成モデルの訓練方法、音信号生成システムおよびプログラム |
CN110610713B (zh) * | 2019-08-28 | 2021-11-16 | 南京梧桐微电子科技有限公司 | 一种声码器余量谱幅度参数重构方法及系统 |
US11380343B2 (en) | 2019-09-12 | 2022-07-05 | Immersion Networks, Inc. | Systems and methods for processing high frequency audio signal |
TWI723545B (zh) * | 2019-09-17 | 2021-04-01 | 宏碁股份有限公司 | 語音處理方法及其裝置 |
US11295751B2 (en) | 2019-09-20 | 2022-04-05 | Tencent America LLC | Multi-band synchronized neural vocoder |
KR102201169B1 (ko) * | 2019-10-23 | 2021-01-11 | 성균관대학교 산학협력단 | 메타 표면의 반사 계수를 제어하기 위한 시간 부호 생성 방법, 메타 표면의 반사 계수를 제어하기 위한 시공간 부호 생성 방법, 이를 실행하는 컴퓨터 프로그램이 저장된 컴퓨터 판독 가능한 기록매체, 및 이를 이용한 메타 표면의 신호 변조 방법 |
CN114548442B (zh) * | 2022-02-25 | 2022-10-21 | 万表名匠(广州)科技有限公司 | 一种基于互联网技术的腕表维修管理系统 |
Family Cites Families (148)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US321993A (en) * | 1885-07-14 | Lantern | ||
US526468A (en) * | 1894-09-25 | Charles d | ||
US525147A (en) * | 1894-08-28 | Steam-cooker | ||
US596689A (en) * | 1898-01-04 | Hose holder or support | ||
US1126620A (en) * | 1911-01-30 | 1915-01-26 | Safety Car Heating & Lighting | Electric regulation. |
US1089258A (en) * | 1914-01-13 | 1914-03-03 | James Arnot Paterson | Facing or milling machine. |
US1300833A (en) * | 1918-12-12 | 1919-04-15 | Moline Mill Mfg Company | Idler-pulley structure. |
US1498873A (en) * | 1924-04-19 | 1924-06-24 | Bethlehem Steel Corp | Switch stand |
US2073913A (en) * | 1934-06-26 | 1937-03-16 | Wigan Edmund Ramsay | Means for gauging minute displacements |
US2086867A (en) * | 1936-06-19 | 1937-07-13 | Hall Lab Inc | Laundering composition and process |
US3044777A (en) * | 1959-10-19 | 1962-07-17 | Fibermold Corp | Bowling pin |
US3158693A (en) | 1962-08-07 | 1964-11-24 | Bell Telephone Labor Inc | Speech interpolation communication system |
US3855416A (en) | 1972-12-01 | 1974-12-17 | F Fuller | Method and apparatus for phonation analysis leading to valid truth/lie decisions by fundamental speech-energy weighted vibratto component assessment |
US3855414A (en) * | 1973-04-24 | 1974-12-17 | Anaconda Co | Cable armor clamp |
JPS59139099A (ja) | 1983-01-31 | 1984-08-09 | 株式会社東芝 | 音声区間検出装置 |
US4616659A (en) | 1985-05-06 | 1986-10-14 | At&T Bell Laboratories | Heart rate detection utilizing autoregressive analysis |
US4630305A (en) * | 1985-07-01 | 1986-12-16 | Motorola, Inc. | Automatic gain selector for a noise suppression system |
US4747143A (en) * | 1985-07-12 | 1988-05-24 | Westinghouse Electric Corp. | Speech enhancement system having dynamic gain control |
NL8503152A (nl) * | 1985-11-15 | 1987-06-01 | Optische Ind De Oude Delft Nv | Dosismeter voor ioniserende straling. |
US4862168A (en) * | 1987-03-19 | 1989-08-29 | Beard Terry D | Audio digital/analog encoding and decoding |
US4805193A (en) * | 1987-06-04 | 1989-02-14 | Motorola, Inc. | Protection of energy information in sub-band coding |
US4852179A (en) | 1987-10-05 | 1989-07-25 | Motorola, Inc. | Variable frame rate, fixed bit rate vocoding method |
JP2707564B2 (ja) | 1987-12-14 | 1998-01-28 | 株式会社日立製作所 | 音声符号化方式 |
US5285520A (en) * | 1988-03-02 | 1994-02-08 | Kokusai Denshin Denwa Kabushiki Kaisha | Predictive coding apparatus |
CA1321645C (en) | 1988-09-28 | 1993-08-24 | Akira Ichikawa | Method and system for voice coding based on vector quantization |
US5086475A (en) | 1988-11-19 | 1992-02-04 | Sony Corporation | Apparatus for generating, recording or reproducing sound source data |
JPH02244100A (ja) * | 1989-03-16 | 1990-09-28 | Ricoh Co Ltd | 駆動音源信号生成装置 |
HU216669B (hu) | 1990-09-19 | 1999-08-30 | Koninklijke Philips Electronics N.V. | Információhordozó fő adatállománnyal és vezérlőállománnyal, eljárás és készülék ezen állományok rögzítésére, valamint készülék azok kiolvasására |
JP2779886B2 (ja) | 1992-10-05 | 1998-07-23 | 日本電信電話株式会社 | 広帯域音声信号復元方法 |
JP3191457B2 (ja) * | 1992-10-31 | 2001-07-23 | ソニー株式会社 | 高能率符号化装置、ノイズスペクトル変更装置及び方法 |
US5455888A (en) | 1992-12-04 | 1995-10-03 | Northern Telecom Limited | Speech bandwidth extension method and apparatus |
WO1995001680A1 (fr) | 1993-06-30 | 1995-01-12 | Sony Corporation | Dispositif de codage de signaux numeriques, son dispositif de decodage, et son support d'enregistrement |
WO1995010760A2 (en) | 1993-10-08 | 1995-04-20 | Comsat Corporation | Improved low bit rate vocoders and methods of operation therefor |
US5684920A (en) * | 1994-03-17 | 1997-11-04 | Nippon Telegraph And Telephone | Acoustic signal transform coding method and decoding method having a high efficiency envelope flattening method therein |
US5487087A (en) | 1994-05-17 | 1996-01-23 | Texas Instruments Incorporated | Signal quantizer with reduced output fluctuation |
US5797118A (en) * | 1994-08-09 | 1998-08-18 | Yamaha Corporation | Learning vector quantization and a temporary memory such that the codebook contents are renewed when a first speaker returns |
JP2770137B2 (ja) * | 1994-09-22 | 1998-06-25 | 日本プレシジョン・サーキッツ株式会社 | 波形データ圧縮装置 |
US5699477A (en) | 1994-11-09 | 1997-12-16 | Texas Instruments Incorporated | Mixed excitation linear prediction with fractional pitch |
FI97182C (fi) | 1994-12-05 | 1996-10-25 | Nokia Telecommunications Oy | Menetelmä vastaanotettujen huonojen puhekehysten korvaamiseksi digitaalisessa vastaanottimessa sekä digitaalisen tietoliikennejärjestelmän vastaanotin |
JP3365113B2 (ja) * | 1994-12-22 | 2003-01-08 | ソニー株式会社 | 音声レベル制御装置 |
JP2956548B2 (ja) * | 1995-10-05 | 1999-10-04 | 松下電器産業株式会社 | 音声帯域拡大装置 |
JP2798003B2 (ja) | 1995-05-09 | 1998-09-17 | 松下電器産業株式会社 | 音声帯域拡大装置および音声帯域拡大方法 |
DE69619284T3 (de) | 1995-03-13 | 2006-04-27 | Matsushita Electric Industrial Co., Ltd., Kadoma | Vorrichtung zur Erweiterung der Sprachbandbreite |
JP3189614B2 (ja) | 1995-03-13 | 2001-07-16 | 松下電器産業株式会社 | 音声帯域拡大装置 |
US5706395A (en) | 1995-04-19 | 1998-01-06 | Texas Instruments Incorporated | Adaptive weiner filtering using a dynamic suppression factor |
US6263307B1 (en) * | 1995-04-19 | 2001-07-17 | Texas Instruments Incorporated | Adaptive weiner filtering using line spectral frequencies |
JP3334419B2 (ja) * | 1995-04-20 | 2002-10-15 | ソニー株式会社 | ノイズ低減方法及びノイズ低減装置 |
US5699485A (en) | 1995-06-07 | 1997-12-16 | Lucent Technologies Inc. | Pitch delay modification during frame erasures |
US5704003A (en) | 1995-09-19 | 1997-12-30 | Lucent Technologies Inc. | RCELP coder |
US6097824A (en) * | 1997-06-06 | 2000-08-01 | Audiologic, Incorporated | Continuous frequency dynamic range audio compressor |
EP0768569B1 (en) * | 1995-10-16 | 2003-04-02 | Agfa-Gevaert | New class of yellow dyes for use in photographic materials |
JP3707116B2 (ja) | 1995-10-26 | 2005-10-19 | ソニー株式会社 | 音声復号化方法及び装置 |
US5737716A (en) | 1995-12-26 | 1998-04-07 | Motorola | Method and apparatus for encoding speech using neural network technology for speech classification |
JP3073919B2 (ja) * | 1995-12-30 | 2000-08-07 | 松下電器産業株式会社 | 同期装置 |
US5689615A (en) | 1996-01-22 | 1997-11-18 | Rockwell International Corporation | Usage of voice activity detection for efficient coding of speech |
TW307960B (en) | 1996-02-15 | 1997-06-11 | Philips Electronics Nv | Reduced complexity signal transmission system |
DE69730779T2 (de) | 1996-06-19 | 2005-02-10 | Texas Instruments Inc., Dallas | Verbesserungen bei oder in Bezug auf Sprachkodierung |
JP3246715B2 (ja) * | 1996-07-01 | 2002-01-15 | 松下電器産業株式会社 | オーディオ信号圧縮方法,およびオーディオ信号圧縮装置 |
CN1170268C (zh) * | 1996-11-07 | 2004-10-06 | 松下电器产业株式会社 | 声音编码或解码装置及方法 |
US6009395A (en) * | 1997-01-02 | 1999-12-28 | Texas Instruments Incorporated | Synthesizer and method using scaled excitation signal |
US6202046B1 (en) | 1997-01-23 | 2001-03-13 | Kabushiki Kaisha Toshiba | Background noise/speech classification method |
US6041297A (en) | 1997-03-10 | 2000-03-21 | At&T Corp | Vocoder for coding speech by using a correlation between spectral magnitudes and candidate excitations |
US5890126A (en) | 1997-03-10 | 1999-03-30 | Euphonics, Incorporated | Audio data decompression and interpolation apparatus and method |
EP0878790A1 (en) | 1997-05-15 | 1998-11-18 | Hewlett-Packard Company | Voice coding system and method |
SE512719C2 (sv) | 1997-06-10 | 2000-05-02 | Lars Gustaf Liljeryd | En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion |
US6889185B1 (en) * | 1997-08-28 | 2005-05-03 | Texas Instruments Incorporated | Quantization of linear prediction coefficients using perceptual weighting |
US6122384A (en) * | 1997-09-02 | 2000-09-19 | Qualcomm Inc. | Noise suppression system and method |
US6029125A (en) * | 1997-09-02 | 2000-02-22 | Telefonaktiebolaget L M Ericsson, (Publ) | Reducing sparseness in coded speech signals |
US6231516B1 (en) * | 1997-10-14 | 2001-05-15 | Vacusense, Inc. | Endoluminal implant with therapeutic and diagnostic capability |
JPH11205166A (ja) | 1998-01-19 | 1999-07-30 | Mitsubishi Electric Corp | ノイズ検出装置 |
US6301556B1 (en) | 1998-03-04 | 2001-10-09 | Telefonaktiebolaget L M. Ericsson (Publ) | Reducing sparseness in coded speech signals |
US6385573B1 (en) | 1998-08-24 | 2002-05-07 | Conexant Systems, Inc. | Adaptive tilt compensation for synthesized speech residual |
US6449590B1 (en) * | 1998-08-24 | 2002-09-10 | Conexant Systems, Inc. | Speech encoder using warping in long term preprocessing |
JP4170458B2 (ja) | 1998-08-27 | 2008-10-22 | ローランド株式会社 | 波形信号の時間軸圧縮伸長装置 |
US6353808B1 (en) * | 1998-10-22 | 2002-03-05 | Sony Corporation | Apparatus and method for encoding a signal as well as apparatus and method for decoding a signal |
KR20000047944A (ko) | 1998-12-11 | 2000-07-25 | 이데이 노부유끼 | 수신장치 및 방법과 통신장치 및 방법 |
JP4354561B2 (ja) | 1999-01-08 | 2009-10-28 | パナソニック株式会社 | オーディオ信号符号化装置及び復号化装置 |
US6223151B1 (en) | 1999-02-10 | 2001-04-24 | Telefon Aktie Bolaget Lm Ericsson | Method and apparatus for pre-processing speech signals prior to coding by transform-based speech coders |
US6829360B1 (en) | 1999-05-14 | 2004-12-07 | Matsushita Electric Industrial Co., Ltd. | Method and apparatus for expanding band of audio signal |
US6604070B1 (en) * | 1999-09-22 | 2003-08-05 | Conexant Systems, Inc. | System of encoding and decoding speech signals |
JP4792613B2 (ja) | 1999-09-29 | 2011-10-12 | ソニー株式会社 | 情報処理装置および方法、並びに記録媒体 |
US6556950B1 (en) | 1999-09-30 | 2003-04-29 | Rockwell Automation Technologies, Inc. | Diagnostic method and apparatus for use with enterprise control |
US6715125B1 (en) * | 1999-10-18 | 2004-03-30 | Agere Systems Inc. | Source coding and transmission with time diversity |
WO2001037263A1 (en) | 1999-11-16 | 2001-05-25 | Koninklijke Philips Electronics N.V. | Wideband audio transmission system |
CA2290037A1 (en) * | 1999-11-18 | 2001-05-18 | Voiceage Corporation | Gain-smoothing amplifier device and method in codecs for wideband speech and audio signals |
US7260523B2 (en) | 1999-12-21 | 2007-08-21 | Texas Instruments Incorporated | Sub-band speech coding system |
WO2001052241A1 (en) | 2000-01-11 | 2001-07-19 | Matsushita Electric Industrial Co., Ltd. | Multi-mode voice encoding device and decoding device |
US6757395B1 (en) * | 2000-01-12 | 2004-06-29 | Sonic Innovations, Inc. | Noise reduction apparatus and method |
US6704711B2 (en) | 2000-01-28 | 2004-03-09 | Telefonaktiebolaget Lm Ericsson (Publ) | System and method for modifying speech signals |
US6732070B1 (en) | 2000-02-16 | 2004-05-04 | Nokia Mobile Phones, Ltd. | Wideband speech codec using a higher sampling rate in analysis and synthesis filtering than in excitation searching |
JP3681105B2 (ja) | 2000-02-24 | 2005-08-10 | アルパイン株式会社 | データ処理方式 |
FI119576B (fi) * | 2000-03-07 | 2008-12-31 | Nokia Corp | Puheenkäsittelylaite ja menetelmä puheen käsittelemiseksi, sekä digitaalinen radiopuhelin |
US6523003B1 (en) | 2000-03-28 | 2003-02-18 | Tellabs Operations, Inc. | Spectrally interdependent gain adjustment techniques |
US6757654B1 (en) | 2000-05-11 | 2004-06-29 | Telefonaktiebolaget Lm Ericsson | Forward error correction in speech coding |
DE60118627T2 (de) | 2000-05-22 | 2007-01-11 | Texas Instruments Inc., Dallas | Vorrichtung und Verfahren zur Breitbandcodierung von Sprachsignalen |
US7136810B2 (en) * | 2000-05-22 | 2006-11-14 | Texas Instruments Incorporated | Wideband speech coding system and method |
US7330814B2 (en) * | 2000-05-22 | 2008-02-12 | Texas Instruments Incorporated | Wideband speech coding with modulated noise highband excitation system and method |
JP2002055699A (ja) * | 2000-08-10 | 2002-02-20 | Mitsubishi Electric Corp | 音声符号化装置および音声符号化方法 |
MXPA02003990A (es) * | 2000-08-25 | 2002-10-23 | Koninkl Philips Electronics Nv | Metodo y apatao para reducir la longitud de palabra de una senal digital de entrada y metodo y aparato para recobrar la senal digital de entrada. |
US6515889B1 (en) * | 2000-08-31 | 2003-02-04 | Micron Technology, Inc. | Junction-isolated depletion mode ferroelectric memory |
US7386444B2 (en) * | 2000-09-22 | 2008-06-10 | Texas Instruments Incorporated | Hybrid speech coding and system |
US6947888B1 (en) * | 2000-10-17 | 2005-09-20 | Qualcomm Incorporated | Method and apparatus for high performance low bit-rate coding of unvoiced speech |
JP2002202799A (ja) * | 2000-10-30 | 2002-07-19 | Fujitsu Ltd | 音声符号変換装置 |
JP3558031B2 (ja) * | 2000-11-06 | 2004-08-25 | 日本電気株式会社 | 音声復号化装置 |
CN1216368C (zh) * | 2000-11-09 | 2005-08-24 | 皇家菲利浦电子有限公司 | 用于扩展语音信号的频率范围的方法和系统 |
SE0004163D0 (sv) | 2000-11-14 | 2000-11-14 | Coding Technologies Sweden Ab | Enhancing perceptual performance of high frequency reconstruction coding methods by adaptive filtering |
SE0004187D0 (sv) | 2000-11-15 | 2000-11-15 | Coding Technologies Sweden Ab | Enhancing the performance of coding systems that use high frequency reconstruction methods |
CN1200403C (zh) | 2000-11-30 | 2005-05-04 | 松下电器产业株式会社 | 线性预测编码参数的矢量量化装置 |
GB0031461D0 (en) | 2000-12-22 | 2001-02-07 | Thales Defence Ltd | Communication sets |
US20040204935A1 (en) | 2001-02-21 | 2004-10-14 | Krishnasamy Anandakumar | Adaptive voice playout in VOP |
JP2002268698A (ja) | 2001-03-08 | 2002-09-20 | Nec Corp | 音声認識装置と標準パターン作成装置及び方法並びにプログラム |
US20030028386A1 (en) * | 2001-04-02 | 2003-02-06 | Zinser Richard L. | Compressed domain universal transcoder |
SE522553C2 (sv) * | 2001-04-23 | 2004-02-17 | Ericsson Telefon Ab L M | Bandbreddsutsträckning av akustiska signaler |
CN1529882A (zh) | 2001-05-11 | 2004-09-15 | 西门子公司 | 用于扩展窄带滤波的语音信号、特别是由通信设备发送的语音信号的带宽的方法 |
US7174135B2 (en) * | 2001-06-28 | 2007-02-06 | Koninklijke Philips Electronics N. V. | Wideband signal transmission system |
US6879955B2 (en) | 2001-06-29 | 2005-04-12 | Microsoft Corporation | Signal modification based on continuous time warping for low bit rate CELP coding |
JP2003036097A (ja) | 2001-07-25 | 2003-02-07 | Sony Corp | 情報検出装置及び方法、並びに情報検索装置及び方法 |
TW525147B (en) | 2001-09-28 | 2003-03-21 | Inventec Besta Co Ltd | Method of obtaining and decoding basic cycle of voice |
US6988066B2 (en) * | 2001-10-04 | 2006-01-17 | At&T Corp. | Method of bandwidth extension for narrow-band speech |
US6895375B2 (en) | 2001-10-04 | 2005-05-17 | At&T Corp. | System for bandwidth extension of Narrow-band speech |
TW526468B (en) | 2001-10-19 | 2003-04-01 | Chunghwa Telecom Co Ltd | System and method for eliminating background noise of voice signal |
JP4245288B2 (ja) * | 2001-11-13 | 2009-03-25 | パナソニック株式会社 | 音声符号化装置および音声復号化装置 |
JP2005509928A (ja) * | 2001-11-23 | 2005-04-14 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | オーディオ信号帯域幅拡張 |
CA2365203A1 (en) * | 2001-12-14 | 2003-06-14 | Voiceage Corporation | A signal modification method for efficient coding of speech signals |
US6751587B2 (en) * | 2002-01-04 | 2004-06-15 | Broadcom Corporation | Efficient excitation quantization in noise feedback coding with general noise shaping |
JP4290917B2 (ja) * | 2002-02-08 | 2009-07-08 | 株式会社エヌ・ティ・ティ・ドコモ | 復号装置、符号化装置、復号方法、及び、符号化方法 |
JP3826813B2 (ja) | 2002-02-18 | 2006-09-27 | ソニー株式会社 | ディジタル信号処理装置及びディジタル信号処理方法 |
JP3646939B1 (ja) * | 2002-09-19 | 2005-05-11 | 松下電器産業株式会社 | オーディオ復号装置およびオーディオ復号方法 |
JP3756864B2 (ja) | 2002-09-30 | 2006-03-15 | 株式会社東芝 | 音声合成方法と装置及び音声合成プログラム |
KR100841096B1 (ko) * | 2002-10-14 | 2008-06-25 | 리얼네트웍스아시아퍼시픽 주식회사 | 음성 코덱에 대한 디지털 오디오 신호의 전처리 방법 |
US20040098255A1 (en) | 2002-11-14 | 2004-05-20 | France Telecom | Generalized analysis-by-synthesis speech coding method, and coder implementing such method |
US7242763B2 (en) | 2002-11-26 | 2007-07-10 | Lucent Technologies Inc. | Systems and methods for far-end noise reduction and near-end noise compensation in a mixed time-frequency domain compander to improve signal quality in communications systems |
CA2415105A1 (en) * | 2002-12-24 | 2004-06-24 | Voiceage Corporation | A method and device for robust predictive vector quantization of linear prediction parameters in variable bit rate speech coding |
KR100480341B1 (ko) * | 2003-03-13 | 2005-03-31 | 한국전자통신연구원 | 광대역 저전송률 음성 신호의 부호화기 |
ATE368279T1 (de) * | 2003-05-01 | 2007-08-15 | Nokia Corp | Verfahren und vorrichtung zur quantisierung des verstärkungsfaktors in einem breitbandsprachkodierer mit variabler bitrate |
JP4212591B2 (ja) * | 2003-06-30 | 2009-01-21 | 富士通株式会社 | オーディオ符号化装置 |
US20050004793A1 (en) * | 2003-07-03 | 2005-01-06 | Pasi Ojala | Signal adaptation for higher band coding in a codec utilizing band split coding |
FI118550B (fi) | 2003-07-14 | 2007-12-14 | Nokia Corp | Parannettu eksitaatio ylemmän kaistan koodaukselle koodekissa, joka käyttää kaistojen jakoon perustuvia koodausmenetelmiä |
US7428490B2 (en) | 2003-09-30 | 2008-09-23 | Intel Corporation | Method for spectral subtraction in speech enhancement |
US7698292B2 (en) * | 2003-12-03 | 2010-04-13 | Siemens Aktiengesellschaft | Tag management within a decision, support, and reporting environment |
KR100587953B1 (ko) * | 2003-12-26 | 2006-06-08 | 한국전자통신연구원 | 대역-분할 광대역 음성 코덱에서의 고대역 오류 은닉 장치 및 그를 이용한 비트스트림 복호화 시스템 |
CA2454296A1 (en) * | 2003-12-29 | 2005-06-29 | Nokia Corporation | Method and device for speech enhancement in the presence of background noise |
JP4259401B2 (ja) | 2004-06-02 | 2009-04-30 | カシオ計算機株式会社 | 音声処理装置及び音声符号化方法 |
US8000967B2 (en) * | 2005-03-09 | 2011-08-16 | Telefonaktiebolaget Lm Ericsson (Publ) | Low-complexity code excited linear prediction encoding |
US8155965B2 (en) | 2005-03-11 | 2012-04-10 | Qualcomm Incorporated | Time warping frames inside the vocoder by modifying the residual |
TWI319565B (en) * | 2005-04-01 | 2010-01-11 | Qualcomm Inc | Methods, and apparatus for generating highband excitation signal |
ES2350494T3 (es) | 2005-04-01 | 2011-01-24 | Qualcomm Incorporated | Procedimiento y aparatos para codificar y decodificar una parte de banda alta de una señal de habla. |
US9043214B2 (en) | 2005-04-22 | 2015-05-26 | Qualcomm Incorporated | Systems, methods, and apparatus for gain factor attenuation |
-
2006
- 2006-04-03 TW TW095111851A patent/TWI319565B/zh active
- 2006-04-03 PL PL06740358T patent/PL1864282T3/pl unknown
- 2006-04-03 JP JP2008504475A patent/JP5129115B2/ja active Active
- 2006-04-03 RU RU2007140406/09A patent/RU2390856C2/ru active
- 2006-04-03 JP JP2008504482A patent/JP5161069B2/ja active Active
- 2006-04-03 SG SG201002303-4A patent/SG161224A1/en unknown
- 2006-04-03 NZ NZ562183A patent/NZ562183A/en unknown
- 2006-04-03 SG SG201004741-3A patent/SG163555A1/en unknown
- 2006-04-03 RU RU2007140381/09A patent/RU2386179C2/ru active
- 2006-04-03 DE DE602006017050T patent/DE602006017050D1/de active Active
- 2006-04-03 NZ NZ562188A patent/NZ562188A/en not_active IP Right Cessation
- 2006-04-03 BR BRPI0608270-0A patent/BRPI0608270A2/pt not_active Application Discontinuation
- 2006-04-03 CA CA2602806A patent/CA2602806C/en active Active
- 2006-04-03 JP JP2008504477A patent/JP5129116B2/ja active Active
- 2006-04-03 WO PCT/US2006/012227 patent/WO2006107833A1/en active Application Filing
- 2006-04-03 DE DE602006017673T patent/DE602006017673D1/de active Active
- 2006-04-03 BR BRPI0608305-6A patent/BRPI0608305B1/pt active IP Right Grant
- 2006-04-03 CA CA2602804A patent/CA2602804C/en active Active
- 2006-04-03 TW TW095111797A patent/TWI316225B/zh active
- 2006-04-03 RU RU2007140382/09A patent/RU2381572C2/ru active
- 2006-04-03 MX MX2007012191A patent/MX2007012191A/es active IP Right Grant
- 2006-04-03 AT AT06740357T patent/ATE492016T1/de not_active IP Right Cessation
- 2006-04-03 DK DK06784345.8T patent/DK1864101T3/da active
- 2006-04-03 BR BRPI0608269A patent/BRPI0608269B8/pt active IP Right Grant
- 2006-04-03 MX MX2007012189A patent/MX2007012189A/es active IP Right Grant
- 2006-04-03 WO PCT/US2006/012228 patent/WO2006107834A1/en active Application Filing
- 2006-04-03 TW TW095111800A patent/TWI321777B/zh active
- 2006-04-03 EP EP06740352A patent/EP1864281A1/en not_active Withdrawn
- 2006-04-03 US US11/397,433 patent/US8244526B2/en active Active
- 2006-04-03 EP EP06740357A patent/EP1866915B1/en active Active
- 2006-04-03 SG SG201002300-0A patent/SG161223A1/en unknown
- 2006-04-03 CA CA2603246A patent/CA2603246C/en active Active
- 2006-04-03 JP JP2008504479A patent/JP5203930B2/ja active Active
- 2006-04-03 PT PT67403584T patent/PT1864282T/pt unknown
- 2006-04-03 AU AU2006252957A patent/AU2006252957B2/en active Active
- 2006-04-03 KR KR1020077025290A patent/KR100956876B1/ko active IP Right Grant
- 2006-04-03 AT AT06740355T patent/ATE482449T1/de not_active IP Right Cessation
- 2006-04-03 JP JP2008504474A patent/JP5203929B2/ja active Active
- 2006-04-03 CN CN201110326747.2A patent/CN102411935B/zh active Active
- 2006-04-03 RU RU2009131435/08A patent/RU2491659C2/ru active
- 2006-04-03 BR BRPI0608306-4A patent/BRPI0608306A2/pt not_active Application Discontinuation
- 2006-04-03 BR BRPI0609530-5A patent/BRPI0609530B1/pt active IP Right Grant
- 2006-04-03 PT PT06784345T patent/PT1864101E/pt unknown
- 2006-04-03 EP EP06784345A patent/EP1864101B1/en active Active
- 2006-04-03 RU RU2007140429/09A patent/RU2387025C2/ru active
- 2006-04-03 SI SI200632188T patent/SI1864282T1/sl unknown
- 2006-04-03 US US11/397,871 patent/US8140324B2/en active Active
- 2006-04-03 NZ NZ562190A patent/NZ562190A/en not_active IP Right Cessation
- 2006-04-03 EP EP06740354A patent/EP1866914B1/en active Active
- 2006-04-03 WO PCT/US2006/012234 patent/WO2006130221A1/en active Application Filing
- 2006-04-03 KR KR1020077025432A patent/KR100956525B1/ko active IP Right Grant
- 2006-04-03 CA CA2603219A patent/CA2603219C/en active Active
- 2006-04-03 DK DK06740358.4T patent/DK1864282T3/en active
- 2006-04-03 MX MX2007012184A patent/MX2007012184A/es active IP Right Grant
- 2006-04-03 AT AT06740351T patent/ATE485582T1/de not_active IP Right Cessation
- 2006-04-03 MX MX2007012183A patent/MX2007012183A/es active IP Right Grant
- 2006-04-03 JP JP2008504478A patent/JP5129117B2/ja active Active
- 2006-04-03 PL PL06740355T patent/PL1869673T3/pl unknown
- 2006-04-03 NZ NZ562185A patent/NZ562185A/en not_active IP Right Cessation
- 2006-04-03 KR KR1020077025400A patent/KR100956877B1/ko active IP Right Grant
- 2006-04-03 BR BRPI0607690A patent/BRPI0607690A8/pt not_active Application Discontinuation
- 2006-04-03 NZ NZ562182A patent/NZ562182A/xx not_active IP Right Cessation
- 2006-04-03 WO PCT/US2006/012230 patent/WO2006107836A1/en active Application Filing
- 2006-04-03 CA CA2603187A patent/CA2603187C/en active Active
- 2006-04-03 AU AU2006232358A patent/AU2006232358B2/en not_active Expired - Fee Related
- 2006-04-03 US US11/397,505 patent/US8332228B2/en active Active
- 2006-04-03 RU RU2007140383/09A patent/RU2402826C2/ru active
- 2006-04-03 BR BRPI0607691A patent/BRPI0607691B1/pt active IP Right Grant
- 2006-04-03 CA CA2603231A patent/CA2603231C/en active Active
- 2006-04-03 WO PCT/US2006/012235 patent/WO2006107840A1/en active Application Filing
- 2006-04-03 MX MX2007012187A patent/MX2007012187A/es active IP Right Grant
- 2006-04-03 WO PCT/US2006/012231 patent/WO2006107837A1/en active Application Filing
- 2006-04-03 JP JP2008504480A patent/JP5129118B2/ja active Active
- 2006-04-03 WO PCT/US2006/012232 patent/WO2006107838A1/en active Application Filing
- 2006-04-03 RU RU2007140394/09A patent/RU2413191C2/ru active
- 2006-04-03 EP EP06740355A patent/EP1869673B1/en active Active
- 2006-04-03 KR KR1020077025255A patent/KR100956624B1/ko active IP Right Grant
- 2006-04-03 KR KR1020077025447A patent/KR101019940B1/ko active IP Right Grant
- 2006-04-03 ES ES06740358.4T patent/ES2636443T3/es active Active
- 2006-04-03 BR BRPI0607646-7A patent/BRPI0607646B1/pt active IP Right Grant
- 2006-04-03 AU AU2006232361A patent/AU2006232361B2/en active Active
- 2006-04-03 WO PCT/US2006/012233 patent/WO2006107839A2/en active Application Filing
- 2006-04-03 AT AT06740354T patent/ATE459958T1/de not_active IP Right Cessation
- 2006-04-03 CA CA2603255A patent/CA2603255C/en active Active
- 2006-04-03 US US11/397,370 patent/US8078474B2/en active Active
- 2006-04-03 AU AU2006232362A patent/AU2006232362B2/en active Active
- 2006-04-03 TW TW095111819A patent/TWI321315B/zh active
- 2006-04-03 US US11/397,872 patent/US8069040B2/en active Active
- 2006-04-03 EP EP06740358.4A patent/EP1864282B1/en active Active
- 2006-04-03 EP EP06740351A patent/EP1869670B1/en active Active
- 2006-04-03 MX MX2007012182A patent/MX2007012182A/es active IP Right Grant
- 2006-04-03 US US11/397,794 patent/US8484036B2/en active Active
- 2006-04-03 ES ES06784345T patent/ES2391292T3/es active Active
- 2006-04-03 AU AU2006232363A patent/AU2006232363B2/en active Active
- 2006-04-03 NZ NZ562186A patent/NZ562186A/xx not_active IP Right Cessation
- 2006-04-03 RU RU2007140365/09A patent/RU2376657C2/ru active
- 2006-04-03 RU RU2007140426/09A patent/RU2402827C2/ru active
- 2006-04-03 TW TW095111804A patent/TWI321314B/zh active
- 2006-04-03 TW TW095111814A patent/TWI330828B/zh active
- 2006-04-03 ES ES06740354T patent/ES2340608T3/es active Active
- 2006-04-03 DE DE602006012637T patent/DE602006012637D1/de active Active
- 2006-04-03 JP JP2008504481A patent/JP4955649B2/ja active Active
- 2006-04-03 AU AU2006232357A patent/AU2006232357C1/en active Active
- 2006-04-03 MX MX2007012185A patent/MX2007012185A/es active IP Right Grant
- 2006-04-03 KR KR1020077025421A patent/KR100956524B1/ko active IP Right Grant
- 2006-04-03 EP EP06740356A patent/EP1864283B1/en active Active
- 2006-04-03 TW TW095111794A patent/TWI320923B/zh active
- 2006-04-03 TW TW095111852A patent/TWI324335B/zh active
- 2006-04-03 AU AU2006232364A patent/AU2006232364B2/en active Active
- 2006-04-03 PL PL06740357T patent/PL1866915T3/pl unknown
- 2006-04-03 AU AU2006232360A patent/AU2006232360B2/en active Active
- 2006-04-03 DE DE602006018884T patent/DE602006018884D1/de active Active
- 2006-04-03 MX MX2007012181A patent/MX2007012181A/es active IP Right Grant
- 2006-04-03 KR KR1020077025293A patent/KR100982638B1/ko active IP Right Grant
- 2006-04-03 KR KR1020077025422A patent/KR100956523B1/ko active IP Right Grant
- 2006-04-03 US US11/397,432 patent/US8364494B2/en active Active
- 2006-04-03 CA CA2603229A patent/CA2603229C/en active Active
- 2006-04-03 PL PL06784345T patent/PL1864101T3/pl unknown
- 2006-04-03 SG SG201004744-7A patent/SG163556A1/en unknown
- 2006-04-03 US US11/397,870 patent/US8260611B2/en active Active
-
2007
- 2007-10-07 IL IL186438A patent/IL186438A/en active IP Right Grant
- 2007-10-07 IL IL186442A patent/IL186442A/en active IP Right Grant
- 2007-10-07 IL IL186443A patent/IL186443A/en active IP Right Grant
- 2007-10-07 IL IL186439A patent/IL186439A0/en unknown
- 2007-10-07 IL IL186404A patent/IL186404A/en active IP Right Grant
- 2007-10-07 IL IL186441A patent/IL186441A0/en active IP Right Grant
- 2007-10-07 IL IL186436A patent/IL186436A0/en active IP Right Grant
- 2007-10-07 IL IL186405A patent/IL186405A/en active IP Right Grant
- 2007-10-31 NO NO20075511A patent/NO20075511L/no not_active Application Discontinuation
- 2007-10-31 NO NO20075512A patent/NO20075512L/no not_active Application Discontinuation
- 2007-10-31 NO NO20075503A patent/NO20075503L/no not_active Application Discontinuation
- 2007-10-31 NO NO20075515A patent/NO340566B1/no unknown
- 2007-10-31 NO NO20075510A patent/NO20075510L/no not_active Application Discontinuation
- 2007-10-31 NO NO20075514A patent/NO340434B1/no unknown
- 2007-10-31 NO NO20075513A patent/NO340428B1/no unknown
-
2008
- 2008-08-28 HK HK08109568.5A patent/HK1113848A1/xx unknown
- 2008-09-19 HK HK08110384.5A patent/HK1115023A1/xx unknown
- 2008-09-22 HK HK08110465.7A patent/HK1114901A1/xx unknown
- 2008-09-24 HK HK08110589.8A patent/HK1115024A1/xx unknown
- 2008-09-24 HK HK12110024.5A patent/HK1169509A1/xx unknown
Cited By (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9343076B2 (en) | 2011-02-16 | 2016-05-17 | Dolby Laboratories Licensing Corporation | Methods and systems for generating filter coefficients and configuring filters |
RU2562771C2 (ru) * | 2011-02-16 | 2015-09-10 | Долби Лабораторис Лайсэнзин Корпорейшн | Способы и системы генерирования коэффициентов фильтра и конфигурирования фильтров |
RU2651193C1 (ru) * | 2011-02-18 | 2018-04-18 | Нтт Докомо, Инк. | Декодер речи, кодер речи, способ декодирования речи, способ кодирования речи, программа декодирования речи и программа кодирования речи |
RU2707931C1 (ru) * | 2011-02-18 | 2019-12-02 | Нтт Докомо, Инк. | Декодер речи, кодер речи, способ декодирования речи, способ кодирования речи, программа декодирования речи и программа кодирования речи |
RU2599966C2 (ru) * | 2011-02-18 | 2016-10-20 | Нтт Докомо, Инк. | Декодер речи, кодер речи, способ декодирования речи, способ кодирования речи, программа декодирования речи и программа кодирования речи |
RU2742199C1 (ru) * | 2011-02-18 | 2021-02-03 | Нтт Докомо, Инк. | Декодер речи, кодер речи, способ декодирования речи, способ кодирования речи, программа декодирования речи и программа кодирования речи |
RU2630379C1 (ru) * | 2011-02-18 | 2017-09-07 | Нтт Докомо, Инк. | Декодер речи, кодер речи, способ декодирования речи, способ кодирования речи, программа декодирования речи и программа кодирования речи |
RU2718425C1 (ru) * | 2011-02-18 | 2020-04-02 | Нтт Докомо, Инк. | Декодер речи, кодер речи, способ декодирования речи, способ кодирования речи, программа декодирования речи и программа кодирования речи |
RU2674922C1 (ru) * | 2011-02-18 | 2018-12-13 | Нтт Докомо, Инк. | Декодер речи, кодер речи, способ декодирования речи, способ кодирования речи, программа декодирования речи и программа кодирования речи |
RU2575389C2 (ru) * | 2011-03-04 | 2016-02-20 | Телефонактиеболагет Л М Эрикссон (Пабл) | Коррекция коэффициента усиления после квантования при кодировании аудио |
RU2490727C2 (ru) * | 2011-11-28 | 2013-08-20 | Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования "Уральский государственный университет путей сообщения" (УрГУПС) | Способ передачи речевых сигналов (варианты) |
US9972325B2 (en) | 2012-02-17 | 2018-05-15 | Huawei Technologies Co., Ltd. | System and method for mixed codebook excitation for speech coding |
RU2633105C1 (ru) * | 2013-02-15 | 2017-10-11 | Хуавэй Текнолоджиз Ко., Лтд. | Система и способ возбуждения смешанной кодовой книги для кодирования речи |
RU2604425C2 (ru) * | 2013-02-15 | 2016-12-10 | Хуавэй Текнолоджиз Ко., Лтд. | Система и способ возбуждения смешанной кодовой книги для кодирования речи |
US10460738B2 (en) | 2016-03-15 | 2019-10-29 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Encoding apparatus for processing an input signal and decoding apparatus for processing an encoded signal |
RU2715026C1 (ru) * | 2016-03-15 | 2020-02-21 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Устройство кодирования для обработки входного сигнала и устройство декодирования для обработки кодированного сигнала |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2402826C2 (ru) | Способы и устройство кодирования и декодирования части речевого сигнала диапазона высоких частот |