RU2402826C2 - Способы и устройство кодирования и декодирования части речевого сигнала диапазона высоких частот - Google Patents

Способы и устройство кодирования и декодирования части речевого сигнала диапазона высоких частот Download PDF

Info

Publication number
RU2402826C2
RU2402826C2 RU2007140383/09A RU2007140383A RU2402826C2 RU 2402826 C2 RU2402826 C2 RU 2402826C2 RU 2007140383/09 A RU2007140383/09 A RU 2007140383/09A RU 2007140383 A RU2007140383 A RU 2007140383A RU 2402826 C2 RU2402826 C2 RU 2402826C2
Authority
RU
Russia
Prior art keywords
signal
frequency range
narrowband
high frequency
highband
Prior art date
Application number
RU2007140383/09A
Other languages
English (en)
Other versions
RU2007140383A (ru
Inventor
Кон Бернард ВОС (US)
Кон Бернард ВОС
Анантхападманабхан А. КАНДХАДАЙ (US)
Анантхападманабхан А. КАНДХАДАЙ
Original Assignee
Квэлкомм Инкорпорейтед
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=36588741&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=RU2402826(C2) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Квэлкомм Инкорпорейтед filed Critical Квэлкомм Инкорпорейтед
Publication of RU2007140383A publication Critical patent/RU2007140383A/ru
Application granted granted Critical
Publication of RU2402826C2 publication Critical patent/RU2402826C2/ru

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • G10L19/0208Subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • G10L21/0388Details of processing therefor
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • G10L19/038Vector quantisation, e.g. TwinVQ audio
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques

Abstract

Изобретение относится к обработке речевого сигнала. Широкополосный речевой кодер, согласно одному варианту осуществления, включает в себя кодер диапазона низких частот и кодер диапазона высоких частот. Кодер диапазона низких частот выполнен с возможностью кодирования части широкополосного речевого сигнала диапазона низких частот как набор параметров фильтра и кодированный сигнал возбуждения. Кодер диапазона высоких частот выполнен с возможностью вычисления значений параметров кодирования, которые задают спектральную огибающую и временную огибающую части широкополосного речевого сигнала диапазона высоких частот. Временная огибающая основана на сигнале возбуждения диапазона высоких частот, полученном из кодированного сигнала возбуждения. В одном таком примере временная огибающая основана на разности уровней между частью в диапазоне высоких частот и синтезированным сигналом диапазона высоких частот, причем синтезированный сигнал диапазона высоких частот генерируется согласно сигналу возбуждения диапазона высоких частот и набору параметров фильтра диапазона высоких частот. Технический результат - обеспечение расширения узкополосного речевого кодера для поддержки передачи и/или сохранения широкополосных речевых сигналов при увеличении пропускной способности. 5 н. и 26 з.п. ф-лы, 46 ил.

Description

Область техники, к которой относится изобретение
Данное изобретение относится к обработке сигнала.
Уровень техники
Голосовая связь посредством коммутируемой телефонной сети общего пользования (PSTN) традиционно ограничена по пропускной способности частотным диапазоном 300-3400 кГц. Новые сети для голосовой связи, например сети сотовой связи и передачи голоса по IP (Интернет-протокол, VoIP), могут не иметь такие же ограничения по пропускной способности, и может оказаться желательно передавать и принимать по таким сетям голосовые передачи, которые включают в себя широкий частотный диапазон. Например, может оказаться желательно поддерживать частотный диапазон звука с нижней границей до 50 Гц и/или верхней границей до 7 или 8 кГц. Также может оказаться желательно поддерживать другие приложения, например высококачественную аудио- или аудио/видеоконференцсвязь, которая может иметь аудиоречевой контент в диапазонах, выходящих за пределы традиционных ограничений PSTN.
Расширение диапазона, поддерживаемого речевым кодером, на более высокие частоты может повысить разборчивость речи. Например, информация, которая дифференцирует фрикативные звуки, например 'с' и 'ф', увеличивается на высоких частотах. Расширение диапазона высоких частот (ДВЧ) также может повысить другие качества речи, например присутствие. Например, даже вокализованный гласный звук может иметь спектральную энергию значительно выше ограничения PSTN.
Один подход к широкополосному речевому кодированию предусматривает распространение техники узкополосного речевого кодирования (например, способной кодировать диапазон 0-4 кГц) на широкий спектр. Например, речевой сигнал можно дискретизировать на более высокой частоте, чтобы он включал в себя высокочастотные компоненты, и технику узкополосного кодирования можно перестроить для использования большего количества коэффициентов фильтра, представляющих этот широкополосный сигнал. Техники узкополосного кодирования, например CELP (линейное прогнозирование с кодовым возбуждением), требуют большого объема вычислений, однако широкополосный CELP-кодер может требовать слишком много циклов обработки, чтобы иметь практическое применение во многих мобильных и иных встроенных приложениях. Кодирование всего спектра широкополосного сигнала для достижения нужного качества с использованием такой техники также может приводить к неприемлемо большому увеличению ширины полосы. Кроме того, потребовалось бы перекодирование такого кодированного сигнала прежде, чем передать даже его узкополосную часть и/или декодировать посредством системы, которая поддерживает только узкополосное кодирование.
Другой подход к широкополосному речевому кодированию предусматривает экстраполяцию спектральной огибающей диапазона высоких частот из кодированной узкополосной спектральной огибающей. Хотя такой подход можно реализовать без увеличения ширины полосы и без необходимости в перекодировании, грубую спектральную огибающую или формантную структуру части речевого сигнала диапазона высоких частот, в общем случае, невозможно точно прогнозировать на основании спектральной огибающей узкополосной части.
Может оказаться желательно реализовать широкополосное речевое кодирование так, чтобы, по меньшей мере, узкополосную часть кодированного сигнала можно было передавать по узкополосному каналу (например, каналу PSTN) без перекодирования или другого значительного изменения. Эффективность широкополосного расширения кодирования также может быть желательной, например, во избежание значительного сокращения количества пользователей, которые могут обслуживаться в приложениях, например беспроводной сотовой телефонной сети и вещании по беспроводным и проводным каналам.
Сущность изобретения
Согласно одному варианту осуществления, способ кодирования части речевого сигнала диапазона высоких частот, имеющего часть в диапазоне низких частот и часть в диапазоне высоких частот, содержит этапы, на которых вычисляют совокупность параметров фильтра, характеризующих спектральную огибающую части в диапазоне высоких частот; вычисляют спектрально расширенный сигнал путем расширения спектра сигнала, полученного из части в диапазоне низких частот; генерируют синтезированный сигнал диапазона высоких частот согласно (A) сигналу возбуждения диапазона высоких частот, основанному на спектрально расширенном сигнале, и (B) совокупности параметров фильтра; и вычисляют огибающую усиления на основании соотношения между частью в диапазоне высоких частот и сигналом, основанным на части в диапазоне низких частот.
Согласно одному варианту осуществления, способ обработки речи включает в себя этапы, на которых генерируют сигнал возбуждения диапазона высоких частот на основании сигнала возбуждения диапазона низких частот; генерируют синтезированный сигнал диапазона высоких частот на основании речевого сигнала диапазона высоких частот и сигнала возбуждения диапазона высоких частот; и вычисляют совокупность коэффициентов усиления на основании соотношения между речевым сигналом диапазона высоких частот и сигналом, основанным на сигнале возбуждения диапазона низких частот.
Согласно другому варианту осуществления, способ декодирования части речевого сигнала диапазона высоких частот, имеющего часть в диапазоне низких частот и часть в диапазоне высоких частот, содержит этапы, на которых принимают совокупность параметров фильтра, характеризующих спектральную огибающую части в диапазоне высоких частот, и совокупность коэффициентов усиления, характеризующих временную огибающую части в диапазоне высоких частот; вычисляют спектрально расширенный сигнал путем расширения спектра сигнала, который основан на сигнале возбуждения диапазона низких частот; генерируют синтезированный сигнал диапазона высоких частот согласно (A) совокупности параметров фильтра и (B) сигналу возбуждения диапазона высоких частот, основанному на спектрально расширенном сигнале; и модулируют огибающую усиления синтезированного сигнала диапазона высоких частот согласно совокупности коэффициентов усиления.
Согласно еще одному варианту осуществления, устройство, выполненное с возможностью кодирования части речевого сигнала диапазона высоких частот, имеющего часть в диапазоне низких частот и часть в диапазоне высоких частот, содержит модуль анализа, выполненный с возможностью вычисления набора параметров фильтра, характеризующих спектральную огибающую части в диапазоне высоких частот; расширитель спектра, выполненный с возможностью вычисления спектрально расширенного сигнала путем расширения спектра сигнала, полученного из части в диапазоне низких частот; синтезирующий фильтр, выполненный с возможностью генерирования синтезированного сигнала диапазона высоких частот согласно (A) сигналу возбуждения диапазона высоких частот, основанному на спектрально расширенном сигнале, и (B) набору параметров фильтра; и калькулятор коэффициента усиления, выполненный с возможностью вычисления огибающей усиления на основании соотношения, изменяющегося со временем, между частью в диапазоне высоких частот и сигналом, основанным на части в диапазоне низких частот.
Согласно еще одному варианту осуществления, речевой декодер диапазона высоких частот выполнен с возможностью приема (A) совокупности параметров фильтра, характеризующих спектральную огибающую части речевого сигнала диапазона высоких частот, и (B) кодированного сигнала возбуждения диапазона низких частот, основанного на части речевого сигнала диапазона низких частот. Декодер включает в себя расширитель спектра, выполненный с возможностью вычисления спектрально расширенного сигнала путем расширения спектра сигнала, который основан на кодированном сигнале возбуждения диапазона низких частот; синтезирующий фильтр, выполненный с возможностью генерирования синтезированного сигнала диапазона высоких частот согласно (А) совокупности параметров фильтра, характеризующих спектральную огибающую части в диапазоне высоких частот, и (В) сигналу возбуждения диапазона высоких частот, основанному на спектрально расширенном сигнале; и элемент регулировки усиления, выполненный с возможностью модулирования огибающей усиления синтезированного сигнала диапазона высоких частот согласно совокупности коэффициентов усиления, характеризующих временную огибающую часть в диапазоне высоких частот.
Краткое описание чертежей
Фиг.1а - блок-схема речевого кодера А100 диапазона высоких частот согласно варианту осуществления.
Фиг.1b - блок-схема реализации А102 широкополосного речевого кодера А100.
Фиг.2а - блок-схема широкополосного речевого декодера В100 согласно варианту осуществления.
Фиг.2b - блок-схема реализации В102 широкополосного речевого декодера В100.
Фиг.3а - блок-схема реализации А112 блока (гребенки) фильтров А110.
Фиг.3b - блок-схема реализации В122 гребенки фильтров В120.
Фиг.4а - полоса частот диапазонов низких и высоких частот для одного примера гребенки фильтров А110.
Фиг.4b - полоса частот диапазонов низких и высоких частот для другого примера гребенки фильтров А110.
Фиг.4с - блок-схема реализации А114 гребенки фильтров А112.
Фиг.4d - блок-схема реализации В124 гребенки фильтров В122.
Фиг.5а - пример графика зависимости частоты от логарифмической амплитуды для речевого сигнала.
Фиг.5b - блок-схема базовой системы кодирования с линейным прогнозированием.
Фиг.6 - блок-схема реализации А122 узкополосного кодера А120.
Фиг.7 - блок-схема реализации В112 узкополосного декодера В110.
Фиг.8а - пример графика зависимости частоты от логарифмической амплитуды для остаточного сигнала для вокализованной речи.
Фиг.8b - пример графика зависимости времени от логарифмической амплитуды для остаточного сигнала для вокализованной речи.
Фиг.9 - блок-схема базовой системы кодирования с линейным прогнозированием, которая также осуществляет долгосрочное прогнозирование.
Фиг.10 - блок-схема реализации А202 кодера А200 диапазона высоких частот.
Фиг.11 - блок-схема реализации А302 генератора возбуждения А300 диапазона высоких частот.
Фиг.12 - блок-схема реализации А402 расширителя спектра А400.
Фиг. 12a - графики спектров сигнала в различных точках в одном примере операции расширения спектра.
Фиг. 12b - графики спектров сигнала в различных точках в другом примере операции расширения спектра.
Фиг. 13 - блок-схема реализации A304 генератора возбуждения A302 диапазона высоких частот.
Фиг. 14 - блок-схема реализации A306 генератора возбуждения A302 диапазона высоких частот.
Фиг. 15 - логическая блок-схема задачи (программного модуля) T100 вычисления огибающей.
Фиг. 16 - блок-схема реализации 492 объединителя 490.
Фиг. 17 иллюстрирует подход к вычислению показателя периодичности сигнала S30 диапазона высоких частот.
Фиг. 18 - блок-схема реализации A312 генератора возбуждения A302 диапазона высоких частот.
Фиг. 19 - блок-схема реализации A314 генератора возбуждения A302 диапазона высоких частот.
Фиг. 20 - блок-схема реализации A316 генератора возбуждения A302 диапазона высоких частот.
Фиг. 21 - логическая блок-схема задачи T200 вычисления коэффициента усиления.
Фиг. 22 - логическая блок-схема реализации T210 задачи T200 вычисления коэффициента усиления.
Фиг. 23a - диаграмма вырезающей функции.
Фиг. 23b - применение вырезающей функции, показанной на фиг. 23a, к подкадрам речевого сигнала.
Фиг. 24 - блок-схема реализации B202 декодера B200 диапазона высоких частот.
Фиг.25 - блок-схема реализации AD10 широкополосного речевого кодера А100.
Фиг.26а - схема реализации D122 линии задержки D120.
Фиг.26b - схема реализации D124 линии задержки D120.
Фиг.27 - схема реализации D130 линии задержки D120.
Фиг.28 - блок-схема реализации AD12 широкополосного речевого кодера AD10.
Фиг.29 - логическая блок-схема способа обработки сигнала MD100 согласно варианту осуществления.
Фиг.30 - логическая блок-схема способа М100 согласно варианту осуществления.
Фиг.31а - логическая блок-схема способа М200 согласно варианту осуществления.
Фиг.31b - логическая блок-схема для реализации М210 способа М200.
Фиг.32 - логическая блок-схема способа М300 согласно варианту осуществления.
Фиг.33 - блок-схема реализации А204 высокополосного кодера А200.
На чертежах и в прилагаемом описании одинаковые позиции обозначают одинаковые или аналогичные элементы или сигналы.
Подробное описание
Описанные здесь варианты осуществления включают в себя системы, способы и устройство, которые могут быть способны обеспечивать расширение узкополосного речевого кодера для поддержки передачи и/или сохранения широкополосных речевых сигналов при увеличении пропускной способности лишь примерно от 800 до 1000 бит/с (бит в секунду). Потенциальные преимущества таких реализаций включают в себя встроенное кодирование для поддержки совместимости с узкополосными системами, относительно легкое выделение и повторное выделение битов между каналами узкополосного кодирования и кодирования в диапазоне высоких частот, освобождение от операции широкополосного синтеза, требующего большого объема вычислений, и поддержку низкой частоты дискретизации для сигналов, обрабатываемых посредством процедур кодирования формы волны, требующих большого объема вычислений.
Если в явном виде не указано в контексте, термин "вычисление" используется здесь для указания любого из его обычных значений, например расчет, генерация и выбор из списка значений. Термин "содержащий", используемый в настоящем описании и формуле изобретения, не исключает других элементов или операций. Выражение "A основано на B" используется для указания любого из его обычных значений, в том числе случаев (i) "A равно B" и (ii) "A основано на, по меньшей мере, B". Термин "Интернет-протокол" включает в себя версию 4, описанную в IETF (Internet Engineering Task Force) RFC (Request for Comments) 791, и последующие версии, например версию 6.
На фиг. 1a показана блок-схема широкополосного речевого кодера A100 согласно варианту осуществления. Гребенка фильтров A110 способна фильтровать широкополосный речевой сигнал S10 для создания узкополосного сигнала S20 и сигнала S30 диапазона высоких частот. Узкополосный кодер A120 способен кодировать узкополосный сигнал S20 для создания узкополосных (NB) параметров фильтра S40 и узкополосного остаточного сигнала S50. Согласно приведенному здесь более подробному описанию, узкополосный кодер A120 обычно способен создавать узкополосные параметры фильтра S40 и кодированный узкополосный сигнал возбуждения S50 в виде индексов кодовой книги или в другой квантованной форме. Кодер A200 диапазона высоких частот способен кодировать сигнал S30 диапазона высоких частот согласно информации в кодированном узкополосном сигнале возбуждения S50 для создания параметров кодирования S60 диапазона высоких частот. Согласно приведенному здесь более подробному описанию, кодер A200 диапазона высоких частот обычно способен создавать параметры кодирования S60 диапазона высоких частот в виде индексов кодовой книги или в другой квантованной форме. В одном конкретном примере, широкополосный речевой кодер A100 способен кодировать широкополосный речевой сигнал S10 со скоростью около 8,55 кбит/с (килобит в секунду), при этом около 7,55 кбит/с используется для узкополосных параметров фильтра S40 и кодированного узкополосного сигнала возбуждения S50, и около 1 кбит/с используется для параметров кодирования S60 диапазона высоких частот.
Может оказаться желательно объединять кодированные узкополосный сигнал и сигнал диапазона высоких частот в единый битовый поток. Например, может оказаться желательно мультиплексировать кодированные сигналы друг с другом для передачи (например, по проводному, оптическому или беспроводному каналу связи) или для сохранения в виде кодированного широкополосного речевого сигнала. На фиг. 1b показана блок-схема реализации A102 широкополосного речевого кодера A100, который включает в себя мультиплексор A130, способный объединять параметры узкополосного фильтра S40, кодированный узкополосный сигнал возбуждения S50 и параметры фильтра S60 диапазона высоких частот в мультиплексированный сигнал S70.
Устройство, включающее в себя кодер A102, также может включать в себя схему, способную передавать мультиплексированный сигнал S70 в канал связи, например проводной, оптический или беспроводной канал. Такое устройство также может быть способно осуществлять одну или несколько канальных операций кодирования на сигнале, например кодирование с коррекцией ошибок (например, сверточное кодирование, совместимое по скорости) и/или кодирование с обнаружением ошибок (например, кодирование с циклической избыточностью) и/или кодирование на одном или нескольких уровнях сетевого протокола (например, Ethernet, TCP/IP, cdma2000).
Может оказаться желательно, чтобы мультиплексор A130 был способен внедрять кодированный узкополосный сигнал (включающий в себя узкополосные параметры фильтра S40 и кодированный узкополосный сигнал возбуждения S50) в виде разделяемого битового потока мультиплексированного сигнала S70, что позволило бы восстанавливать и декодировать кодированный узкополосный сигнал независимо от другой части мультиплексированного сигнала S70, например сигнала диапазона высоких частот и/или диапазона низких частот. Например, мультиплексированный сигнал S70 может быть построен так, что кодированный узкополосный сигнал можно восстанавливать, отбрасывая параметры фильтра S60 диапазона высоких частот. Еще одно потенциальное преимущество такой особенности в том, что она позволяет избегать необходимости в перекодировании кодированного широкополосного сигнала до передачи его в систему, которая поддерживает декодирование узкополосного сигнала, но не поддерживает декодирование части в диапазоне высоких частот.
На фиг.2a показана блок-схема широкополосного речевого декодера B100 согласно варианту осуществления. Узкополосный декодер B110 способен декодировать узкополосные параметры фильтра S40 и кодированный узкополосный сигнал возбуждения S50 для создания узкополосного сигнала S90. Декодер B200 диапазона высоких частот способен декодировать параметры кодирования S60 диапазона высоких частот согласно узкополосному сигналу возбуждения S80, на основании кодированного узкополосного сигнала возбуждения S50, для создания сигнала S100 диапазона высоких частот. В этом примере, узкополосный декодер B110 способен выдавать узкополосный сигнал возбуждения S80 на декодер B200 диапазона высоких частот. Гребенка фильтров B120 способна объединять узкополосный сигнал S90 и сигнал S100 диапазона высоких частот для создания широкополосного речевого сигнала S110.
На фиг.2b показана блок-схема реализации B102 широкополосного речевого декодера B100, который включает в себя демультиплексор B130, способный создавать кодированные сигналы S40, S50 и S60 из мультиплексированного сигнала S70. Устройство, включающее в себя декодер B102, может включать в себя схему, способную принимать мультиплексированный сигнал S70 из канала связи, например, проводного, оптического или беспроводного канала. Такое устройство также может быть способно осуществлять одну или несколько канальных операций декодирования на сигнале, например декодирование с коррекцией ошибок (например, сверточное декодирование, совместимое по скорости) и/или декодирование с обнаружением ошибок (например, декодирование с циклической избыточностью), и/или декодирование на одном или нескольких слоях сетевого протокола (например, Ethernet, TCP/IP, cdma2000).
Гребенка фильтров A110 способна фильтровать входной сигнал согласно схеме расщепленных диапазонов для создания низкочастотного поддиапазона и высокочастотного поддиапазона. В зависимости от критериев конструкции для конкретного приложения, поддиапазоны выходного сигнала могут иметь полосы равной или неравной ширины и могут быть перекрывающимися или неперекрывающимися. Возможна также конфигурация гребенки фильтров A110, которая создает более двух поддиапазонов. Например, такая гребенка фильтров может быть способна создавать один или несколько сигналов диапазона низких частот, которые включают в себя составляющие в частотном диапазоне с частотой ниже, чем в узкополосном сигнале S20 (например, в диапазоне 50-300 Гц). Такая гребенка фильтров также может быть способна создавать один или несколько дополнительных сигналов диапазона высоких частот, которые включают в себя составляющие в частотном диапазоне с частотой выше, чем в сигнале S30 диапазона высоких частот (например, в диапазоне 14-20, 16-20 или 16-32 кГц). В таком случае, можно реализовать широкополосный речевой кодер A100 для отдельного кодирования этого/их сигнала или сигналов, и мультиплексор A130 может быть способен включать в себя дополнительный/е кодированный/е сигнал или сигналы в мультиплексированном сигнале S70 (например, в качестве отдельной части).
На фиг.3a показана блок-схема реализации A112 гребенки фильтров A110, которая способна создавать сигналы двух поддиапазонов, имеющих сниженные частоты дискретизации. Гребенка фильтров A110 способна принимать широкополосный речевой сигнал S10, имеющий высокочастотную (или диапазона высоких частот) часть и низкочастотную (или диапазона низких частот) часть. Гребенка фильтров A112 включает в себя тракт обработки диапазона низких частот, способный принимать широкополосный речевой сигнал S10 и создавать узкополосный речевой сигнал S20, и тракт обработки диапазона высоких частот, способный принимать широкополосный речевой сигнал S10 и создавать речевой сигнал S30 диапазона высоких частот. Фильтр 110 нижних частот фильтрует широкополосный речевой сигнал S10, пропуская выбранный низкочастотный поддиапазон, и фильтр 130 верхних частот фильтрует широкополосный речевой сигнал S10, пропуская выбранный высокочастотный поддиапазон. Поскольку сигналы обоих поддиапазонов имеют более узкие полосы, чем широкополосный речевой сигнал S10, их частоты дискретизации можно снизить до некоторой степени без потери информации. Блок 120 понижения частоты дискретизации снижает частоту дискретизации низкочастотного сигнала согласно нужному коэффициенту децимации (например, путем удаления выборок сигнала и/или замены выборок средними значениями), и блок 140 понижения частоты дискретизации аналогично снижет частоту дискретизации высокочастотного сигнала согласно другому нужному коэффициенту децимации.
На фиг.3b показана блок-схема соответствующей реализации B122 гребенки фильтров B120. Блок 150 повышения частоты дискретизации повышает частоту дискретизации узкополосного сигнала S90 (например, путем вставки нулей и/или путем дублирования выборок), и фильтр 160 нижних частот фильтрует сигнал, преобразованный с повышением частоты дискретизации, пропуская только часть в диапазоне низких частот (например, для предотвращения помехи дискретизации). Аналогично, блок 170 повышения частоты дискретизации повышает частоту дискретизации сигнала S100 диапазона высоких частот, и фильтр 180 верхних частот фильтрует сигнал, преобразованный с повышением частоты дискретизации, пропуская только часть в диапазоне высоких частот. Затем два полосовых сигнала суммируются для формирования широкополосного речевого сигнала S110. В некоторых реализациях декодера B100, гребенка фильтров B120 способна создавать взвешенную сумму двух полосовых сигналов согласно одному или нескольким весовым коэффициентам, полученным и/или вычисленным декодером B200 диапазона высоких частот. Возможна также конфигурация гребенки фильтров B120, которая объединяет более двух полосовых сигналов.
Каждый из фильтров 110, 130, 160, 180 можно реализовать в виде фильтра с конечной импульсной характеристикой (FIR) или фильтра с бесконечной импульсной характеристикой (IIR). Частотные характеристики фильтров 110 и 130 кодера могут иметь переходные области симметричной или асимметричной формы между полосой заграждения и полосой пропускания. Аналогично, частотные характеристики фильтров 160 и 180 декодера могут иметь переходные области симметричной или асимметричной формы между полосой заграждения и полосой пропускания. Может оказаться желательно, но не строго обязательно, чтобы фильтр 110 нижних частот имел такую же характеристику, как фильтр 160 нижних частот, и чтобы фильтр 130 верхних частот имел такую же характеристику, как фильтр 180 верхних частот. В одном примере, две пары фильтров 110, 130 и 160, 180 образуют гребенку квадратурных зеркальных фильтров (QMF), причем пара фильтров 110, 130 имеют такие же коэффициенты, как пара фильтров 160, 180.
В типичном примере, фильтр 110 нижних частот имеет полосу пропускания, которая включает в себя ограниченный диапазон PSTN 300-3400 Гц (например, полосу от 0 до 4 кГц). На фиг. 4a и 4b показаны относительные ширины полосы широкополосного речевого сигнала S10, узкополосного сигнала S20 и сигнала S30 диапазона высоких частот в двух разных примерах реализации. В этих двух конкретных примерах, широкополосный речевой сигнал S10 имеет частоту дискретизации 16 кГц (представляющую частотные составляющие в диапазоне от 0 до 8 кГц), и узкополосный сигнал S20 имеет частоту дискретизации 8 кГц (представляющую частотные составляющие в диапазоне от 0 до 4 кГц).
В примере, приведенном на фиг. 4a, нет значительного перекрывания между двумя поддиапазонами. Сигнал S30 диапазона высоких частот, как показано в этом примере, можно получить с использованием фильтра 130 верхних частот с полосой пропускания 4-8 кГц. В таком случае, может оказаться желательно снизить частоту дискретизации до 8 кГц посредством преобразования с понижением частоты дискретизации фильтрованного сигнала с коэффициентом два. Такая операция, которая, предположительно, значительно снижает вычислительную сложность дальнейших операций обработка сигнала, смещает энергию полосы пропускания в диапазон от 0 до 4 кГц без потери информации.
В альтернативном примере, показанном на фиг. 4b, верхний и нижний поддиапазоны имеют заметное перекрытие, вследствие чего область от 3,5 до 4 кГц описывается сигналами обоих поддиапазонов. Сигнал S30 диапазона высоких частот, представленный в этом примере, можно получить с использованием фильтра 130 верхних частот с полосой пропускания 3,5-7 кГц. В таком случае, может оказаться желательно снизить частоту дискретизации до 7 кГц путем преобразования с понижением частоты дискретизации фильтрованного сигнала с коэффициентом 16/7. Такая операция, которая, предположительно, значительно снижает вычислительную сложность дальнейших операций обработка сигнала, смещает энергию полосы пропускания в диапазон от 0 до 3,5 кГц без потери информации.
В обычной телефонной трубке для телефонной связи, один или несколько преобразователей (т.е. микрофон и телефон или громкоговоритель) страдает недостатком ощутимой характеристики в частотном диапазоне 7-8 кГц. В примере, приведенном на фиг. 4b, часть широкополосного речевого сигнала S10 от 7 до 8 кГц не включена в кодированный сигнал. Другие конкретные примеры фильтра 130 верхних частот имеют полосы пропускания 3,5-7,5 кГц и 3,5-8 кГц.
В некоторых реализациях, обеспечение перекрытия между поддиапазонами, как в примере, приведенном на фиг. 4b, позволяет использовать фильтр нижних частот и/или верхних частот, имеющий плавный спад характеристики в области перекрытия. Такие фильтры обычно легче проектировать, требуют меньшей сложности вычислений и/или вносят меньшую задержку по сравнению с фильтрами с более резкими или "крутыми" характеристиками. Для фильтров, имеющих резкие переходные области, свойственны более высокие боковые полосы (что может приводить к помехе дискретизации), чем у фильтров аналогичного порядка, которые имеют плавный спад характеристики. Фильтры, имеющие резкие переходные области, могут также иметь длинные импульсные характеристики, которые могут приводить к звенящим искажениям. Для реализаций гребенки фильтров, имеющей один или несколько IIR-фильтров, допускающей плавный спад характеристики в области перекрытия, можно использовать фильтр или фильтры, чьи полюсы удалены от единичной окружности, что может играть важную роль для обеспечения устойчивой реализации с фиксированной точкой.
Перекрытие поддиапазонов допускает плавное смешивание нижнего диапазона и верхнего диапазона, что может приводить к уменьшению количества слышимых искажений, снижению помехи дискретизации и/или менее заметному переходу от одного диапазона к другому. Кроме того, эффективность кодирования узкополосного кодера A120 (например, кодера, воспроизводящего форму сигнала) может снижаться с увеличением частоты. Например, качество кодирование узкополосного кодера может снижаться на малых битовых скоростях, особенно при наличии фонового шума. В таких случаях, обеспечение перекрытия поддиапазонов может повысить качество воспроизводимых частотных составляющих в области перекрытия.
Кроме того, перекрытие поддиапазонов допускает плавное смешивание нижнего диапазона и верхнего диапазона, что может приводить к уменьшению количества слышимых искажений, снижению помехи дискретизации и/или менее заметному переходу от одного диапазона к другому. Такая мера может быть особенно желательной для реализации, в которой узкополосный кодер A120 и кодер A200 диапазона высоких частот действуют согласно разным методологиям кодирования. Например, разные техники кодирования могут создавать сигналы, звучащие совершенно по-разному. Кодер, который кодирует спектральную огибающую в виде индексов кодовой книги, может формировать сигнал, имеющий другое звучание, чем кодер, который кодирует амплитудный спектр. Временной кодер (например, кодер на основе импульсно-кодовой модуляции или ИКМ) может формировать сигнал, имеющий другое звучание, чем частотный кодер. Кодер, который кодирует сигнал посредством представления спектральной огибающей и соответствующего остаточного сигнала, может формировать сигнал, имеющий другое звучание, чем кодер, который кодирует сигнал посредством только представления спектральной огибающей. Кодер, который кодирует сигнал в виде представления его формы волны, может создавать выходной сигнал, имеющий другое звучание, чем от синусоидального кодера. В таких случаях, использование фильтров, имеющих резкие переходные области для задания неперекрывающихся поддиапазонов, может приводить к резкому и легко воспринимаемому переходу между поддиапазонами в синтезированном широкополосном сигнале.
Хотя гребенки фильтров QMF, имеющие взаимодополняющие перекрывающиеся частотные характеристики, часто используются в поддиапазонных методиках, такие фильтры непригодны для, по меньшей мере, некоторых из описанных здесь реализаций широкополосного кодирования. Гребенка фильтров QMF на кодере способна создавать значительную помеху дискретизации, которая подавляется соответствующей гребенкой фильтров QMF на декодере. Такая конфигурация может не подходить для приложения, в котором сигнал подвергается значительному искажению между гребенками фильтров, поскольку искажение может снижать эффективность подавления помехи дискретизации. Например, описанные здесь приложения включают в себя реализации кодирования, способные работать на очень низких битовых скоростях. Вследствие очень низкой битовой скорости, велика вероятность того, что декодированный сигнал окажется значительно искаженным по сравнению с исходным сигналом, поэтому использование гребенок фильтров QMF может приводить к неподавленной помехе дискретизации. Приложения, в которых используются гребенки фильтров QMF, обычно имеют более высокие битовые скорости (например, свыше 12 кбит/с для AMR и 64 кбит/с для G.722).
Дополнительно, кодер может быть способен создавать синтезированный сигнал, который, по восприятию, подобен исходному сигналу, но, в действительности, значительно отличается от исходного сигнала. Например, описанный здесь кодер, который выводит возбуждение диапазона высоких частот из узкополосного остатка, может создавать такой сигнал, поскольку фактический остаток диапазона высоких частот может полностью отсутствовать в декодированном сигнале. Использование гребёнок фильтров QMF в таких приложениях может приводить к значительной степени искажения, обусловленного неподавленной помехой дискретизации.
Величину искажения, обусловленного помехой дискретизации QMF, можно снизить, если поддиапазон, подверженный влиянию, узок, поскольку эффект помехи дискретизации ограничивается шириной полосы, равной ширине поддиапазона. Однако в описанных здесь примерах, где каждый поддиапазон включает в себя около половины полосы широкополосного диапазона, искажение, обусловленное неподавленной помехой дискретизации, может оказывать влияние на значительную часть сигнала. На качество сигнала также может влиять положение полосы частот, в которой имеет место неподавленная помеха дискретизации. Например, искажение, создаваемое вблизи центра широкополосного речевого сигнала (например, между 3 и 4 кГц) может быть гораздо менее желательно, чем искажение, возникающее вблизи края сигнала (например, свыше 6 кГц).
Хотя характеристики фильтров гребенки фильтров QMF строго связаны друг с другом, части диапазонов низких и высоких частот гребёнок фильтров A110 и B120 могут быть способны иметь спектры, которые никак не связаны друг с другом за исключением перекрытия двух поддиапазонов. Мы определяем перекрытие двух поддиапазонов как расстояние от точки, в которой частотная характеристика фильтра диапазона высоких частот падает до -20 дБ, до точки, в которой частотная характеристика фильтра диапазона низких частот падает до -20 дБ. В различных примерах гребенки фильтров A110 и/или B120, это перекрытие занимает диапазон от около 200 Гц до около 1 кГц. Диапазон от около 400 до около 600 Гц может представлять желаемый компромисс между эффективностью кодирования и воспринимаемой гладкостью. В одном конкретном примере, упомянутом выше, перекрытие составляет около 500 Гц.
Может оказаться желательно реализовать гребенку фильтров A112 и/или B122 для осуществления операций, показанных на фиг. 4a и 4b, в виде нескольких каскадов. Например, на фиг. 4c показана блок-схема реализации A114 гребенки фильтров A112, которая осуществляет функциональный эквивалент операций высокочастотной фильтрации и преобразования с понижением частоты дискретизации с использованием ряда операций интерполяции, повторной дискретизации, децимации и других операций. Такая реализация допускает упрощение конструирования и/или позволяет сокращать функциональные блоки логики и/или кода. Например, один и тот же функциональный блок можно использовать для осуществления операций децимации до 14 кГц и децимации до 7 кГц, как показано на фиг. 4c. Операцию обращения спектра можно реализовать посредством умножения сигнала на функцию e jnπ или последовательность (-1)n, которая попеременно принимает значения +1 и -1. Операцию формирования спектра можно реализовать посредством фильтра нижних частот, способного формировать сигнал для получения нужной общей характеристики фильтра.
Заметим, что вследствие операции обращения спектра, спектр сигнала S30 диапазона высоких частот переворачивается.
Последующие операции в кодере и соответствующем декодере могут быть организованы соответственно. Например, описанный здесь генератор возбуждения A300 диапазона высоких частот может быть способен создавать сигнал возбуждения S120 диапазона высоких частот, который также имеет спектрально обращенную форму.
На фиг.4d показана блок-схема реализации В124 гребенки фильтров В122, которая осуществляет функциональный эквивалент операций повышения частоты дискретизации и высокочастотной фильтрации с использованием ряда операций интерполяции, повторной дискретизации и других операций. Гребенка фильтров В124 включает в себя операцию обращения спектра в верхнем диапазоне, которая обращает аналогичную операцию, осуществляемую, например, в гребенке фильтров кодера, например в гребенке фильтров А114. В этом конкретном примере, гребенка фильтров В124 также включает в себя узкополосные режекторные фильтры в диапазоне высоких и низких частот, которые ослабляют составляющую сигнала на 7100 Гц, хотя такие фильтры являются необязательными и не всегда входят в состав устройства. Патентная заявка "SYSTEMS, METHODS, AND APPARATUS FOR SPEECH SIGNAL FILTERING", поданная совместно с данной заявкой, сейчас публикация US №2007/0088558, включает в себя дополнительное описание и чертежи, относящиеся к характеристикам элементов конкретных реализации гребенок фильтров А110 и В120, и этот материал включен, таким образом, посредством ссылки.
Узкополосный кодер А120 реализован согласно модели источник-фильтр, которая предусматривает кодирование входного речевого сигнала в виде (А) набора параметров, описывающих фильтр, и (В) сигнала возбуждения, предписывающего описанному фильтру создавать синтезированное воспроизведение входного речевого сигнала. На фиг. 5a показан пример спектральной огибающей речевого сигнала. Пики, характеризующие эту спектральную огибающую, представляют резонансы речевого тракта и называются формантами. Большинство речевых кодеров кодируют, по меньшей мере, эту грубую спектральную структуру в виде набора параметров, например коэффициентов фильтра.
На фиг. 5b показан пример базовой конфигурации источник-фильтр, применяемой для кодирования спектральной огибающей узкополосного сигнала S20. Модуль анализа вычисляет набор параметров, характеризующих фильтр, соответствующий звуку речи в течение периода времени (обычно 20 мс). Отбеливающий фильтр (также именуемый анализирующим фильтром или фильтром ошибок прогнозирования), настроенный согласно этим параметрам фильтра, удаляет спектральную огибающую для выравнивания спектральной характеристики сигнала. Полученный отбеленный сигнал (также именуемый остатком) имеет меньшую энергию и, таким образом, меньшую дисперсию и легче поддается кодированию, чем исходный речевой сигнал. Ошибки, возникающие при кодировании остаточного сигнала, также могут более равномерно распределяться по спектру. Параметры фильтра и остаток обычно квантуются для эффективной передачи по каналу. На декодере, синтезирующий фильтр, настроенный согласно параметрам фильтра, возбуждается сигналом, основанным на остатке, для создания синтезированной версии исходного звука речи. Синтезирующий фильтр обычно способен иметь передаточную функцию, обратную передаточной функции отбеливающего фильтра.
На фиг. 6 показана блок-схема базовой реализации A122 узкополосного кодера A120. В этом примере, модуль анализа 210 кодирования с линейным прогнозированием (LPC) кодирует спектральную огибающую узкополосного сигнала S20 в виде набора коэффициентов линейного прогнозирования (LP) (например, коэффициентов полюсного фильтра 1/A(z)). Модуль анализа обычно обрабатывает входной сигнал как ряд неперекрывающихся кадров, при этом для каждого кадра вычисляется новый набор коэффициентов. Период кадра - это, в общем случае, период, в течение которого сигнал, предположительно, является локально стационарным; типичный период составляет 20 миллисекунд (что эквивалентно 160 выборкам при частоте дискретизации 8 кГц). В одном примере, модуль анализа 210 LPC способен вычислять набор из десяти коэффициентов НЧ-фильтра для описания формантной структуры каждого 20-миллисекундного кадра. Также возможна реализация модуля анализа, обрабатывающего входной сигнал как ряд перекрывающихся кадров.
Модуль анализа может быть способен анализировать выборки каждого кадра напрямую, или выборки могут сначала взвешиваться согласно вырезающей функции (например, окну Хэмминга). Анализ также может осуществляться по окну, превышающему размер кадра, например 30-миллисекундному окну. Это окно может быть симметрично (например, 5-20-5, включая в себя 5 миллисекунд непосредственно до и после 20-миллисекундного кадра) или асимметричным (например, 10-20, включая в себя последние 10 миллисекунд предыдущего кадра). Модуль анализа LPC обычно способен вычислять коэффициенты НЧ-фильтра с использованием рекурсивного метода Левинсона-Дурбина или алгоритма Леру-Гегюна. В другой реализации модуль анализа может быть способен вычислять набор коэффициентов косинусного преобразования Фурье для каждого кадра вместо набора коэффициентов НЧ-фильтра.
Выходную скорость кодера A120 можно значительно снижать, с относительно небольшим влиянием на качество воспроизведения, благодаря квантованию параметров фильтра. Коэффициенты фильтра линейного прогнозирования трудно эффективно квантовать, и их обычно отображают в другое представление, например линейные спектральные пары (LSP) или линейные спектральные частоты (LSF), для квантования и/или энтропийного кодирования. В примере, приведенном на фиг. 6, преобразование 220 коэффициентов LP-фильтра в LSF преобразует набор коэффициентов НЧ-фильтра в соответствующий набор LSF. Другие взаимно-однозначные представления коэффициентов НЧ-фильтра включают в себя коэффициенты PARCOR; значения логарифмического отношения площадей; иммитансные спектральные пары (ISP); и иммитансные спектральные частоты (ISF), которые используются в кодеке AMR-WB (Adaptive Multirate-Wideband) GSM (Глобальной системы мобильной связи). Обычно преобразование между набором коэффициентов НЧ-фильтра и соответствующим набором LSFs обратимо, но варианты осуществления также включают в себя реализации кодера A120, в которых преобразование невозможно обратить без ошибки.
Квантователь 230 способен квантовать набор узкополосных LSF (или других представлений коэффициентов), и узкополосный кодер A122 способен выводить результат этого квантования в виде узкополосных параметров фильтра S40. Такой квантователь обычно включает в себя векторный квантователь, который кодирует входной как индекс к соответствующей векторной записи в таблице или кодовой книге.
Согласно фиг. 6, узкополосный кодер A122 также генерирует остаточный сигнал, пропуская узкополосный сигнал S20 через отбеливающий фильтр 260 (также именуемый анализирующим фильтром или фильтром ошибок прогнозирования), настроенный согласно набору коэффициентов фильтра. В этом конкретном примере, отбеливающий фильтр 260 реализован как FIR-фильтр, хотя можно также использовать реализации IIR. Этот остаточный сигнал обычно содержит важную, с точки зрения восприятия, информацию речевого кадра, например долговременную структуру, связанную с основным тоном, которая не представлена в узкополосных параметрах фильтра S40. Квантователь 270 способен вычислять квантованное представление этого остаточного сигнала для вывода в качестве кодированного узкополосного сигнала возбуждения S50. Такой квантователь обычно включает в себя векторный квантователь, который кодирует входной как индекс к соответствующей векторной записи в таблице или кодовой книге. Альтернативно, такой квантователь может быть способен передавать один или несколько параметров, из которых на декодере можно динамически генерировать вектор, вместо того чтобы извлекать его из хранилища, как в методе разреженной кодовой книги. Такой способ используется в таких схемах кодирования, как алгебраическое CELP (линейное прогнозирование с кодовым возбуждением), и таких кодеках, как 3GPP2 (Third Generation Partnership 2) EVRC (Enhanced Variable Rate Codec).
Желательно, чтобы узкополосный кодер A120 генерировал кодированный узкополосный сигнал возбуждения согласно тем же значениям параметров фильтра, которые будут доступны соответствующему узкополосному декодеру. Таким образом, результирующий кодированный узкополосный сигнал возбуждения уже может в некоторой степени отвечать за неидеальности в этих значениях параметров, например ошибки квантования. Соответственно, желательно настроить отбеливающий фильтр с использованием тех же значений коэффициентов, которые будут доступны на декодере. В базовом примере кодера A122, показанном на фиг. 6, обратный квантователь 240 деквантует узкополосные параметры кодирования S40, преобразование LSF в коэффициенты LP-фильтра 250 отображает результирующие значения обратно в соответствующий набор коэффициентов НЧ-фильтра, и этот набор коэффициентов используется для настройки отбеливающего фильтра 260 для генерации остаточного сигнала, который квантуется квантователем 270.
Некоторые реализации узкополосного кодера A120 способны вычислять кодированный узкополосный сигнал возбуждения S50 путем идентификации одного из набора векторов кодовой книги, который лучше всех совпадает с остаточным сигналом. Однако заметим, что этот узкополосный кодер A120 также может реализовать для вычисления квантованного представления остаточного сигнала без фактической генерации остаточного сигнала. Например, узкополосный кодер A120 может быть способен использовать некоторое количество векторов кодовой книги для генерации соответствующих синтезированных сигналов (например, согласно текущему набору параметров фильтра), и выбирать вектор кодовой книги, связанный с генерированным сигналом, который лучше всех совпадает с исходным узкополосным сигналом S20 в перцептивно-взвешенной области.
На фиг.7 показана блок-схема реализации В112 узкополосного декодера В110. Обратный квантователь 310 деквантует узкополосные параметры фильтра S40 (в этом случае, в набор LSF), и преобразование LSF в коэффициенты LP-фильтра 320 преобразует LSF в набор коэффициентов фильтра (например, как описано выше со ссылкой на обратный квантователь 240 и преобразование 250 узкополосного кодера А122). Обратный квантователь 340 деквантует кодированный узкополосный сигнал возбуждения S50 для создания узкополосного сигнала возбуждения S80. На основании коэффициентов фильтра и узкополосного сигнала возбуждения S80, узкополосный синтезирующий фильтр 330 синтезирует узкополосный сигнал S90. Иными словами, узкополосный синтезирующий фильтр 330 способен формировать спектр узкополосного сигнала возбуждения S80 согласно деквантованным коэффициентам фильтра для создания узкополосного сигнала S90. Узкополосный декодер В112 также выдает узкополосный сигнал возбуждения S80 на кодер А200 диапазона высоких частот, который использует его для описанного здесь вывода сигнала возбуждения S120 диапазона высоких частот. В некоторых реализациях, описанных ниже, узкополосный декодер В110 может быть способен выдавать на декодер В200 диапазона высоких частот дополнительную информацию, связанную с узкополосным сигналом, например наклон спектра, коэффициент усиления и интервал основного тона, и речевой режим.
Система узкополосного кодера A122 и узкополосного декодера B112 является основным примером речевого кодека на основе анализа через синтез. Кодирование на основе линейного прогнозирования с кодовым возбуждением (CELP) является одним популярным семейством методов кодирования на основе анализа посредством синтеза, и реализации таких кодеров могут осуществлять кодирование на основе формы сигнала остатка, в том числе операции выбора записей из фиксированной и адаптивной кодовых книг, операции минимизации ошибок и/или операции перцептивного взвешивания. Другие реализации кодирования на основе анализа посредством синтеза включают в себя кодирование на основе линейного прогнозирования со смешанным возбуждением (MELP), алгебраического CELP (ACELP), релаксационного CELP (RCELP), регулярного импульсного возбуждения (RPE), многоимпульсного CELP (MPE) и линейного прогнозирования с возбуждением векторной суммой (VSELP). Родственные способы кодирования включают в себя кодирование на основе многополосного возбуждения (MBE) и интерполяции формы сигнала-прототипа (PWI). Примеры стандартных речевых кодеков на основе анализа через синтез включают в себя полноскоростной кодек ETSI (European Telecommunications Standards Institute)-GSM (GSM 06.10), который использует линейное прогнозирование с возбуждением остаточным сигналом (RELP); усовершенствованный полноскоростной кодек GSM (ETSI-GSM 06.60); стандартный кодер со скоростью 11,8 кбит/с согласно ITU (International Telecommunication Union) G.729 Приложение E; кодеки IS (Interim Standard)-641 для IS-136 (схема множественного доступа с кодовым разделением); адаптивные многоскоростные кодеки GSM (GSM-AMR); и кодек 4GV™ (Fourth-Generation Vocoder™) (QUALCOMM Incorporated, Сан-Диего, Калифорния). Узкополосный кодер A120 и соответствующий декодер B110 можно реализовать согласно любой из этих технологий или любой другой технологии речевого кодирования (известно или перспективной), которая представляет речевой сигнал в виде (A) набора параметров, которые описывают фильтр, и (B) сигнала возбуждения, используемого для предписания описанному фильтру воспроизводить речевой сигнал.
Даже после того, как отбеливающий фильтр удалит грубую спектральную огибающую из узкополосного сигнала S20, может оставаться заметный объем тонкой гармонической структуры, особенно для вокализованной речи. На фиг. 8a показан график спектра одного примера остаточного сигнала, который может быть создан отбеливающим фильтром, для вокализованного сигнала, например гласного звука. Периодическая структура, наблюдаемая в этом примере, относится к основному тону, и другие вокализованные звуки, произносимые тем же диктором, могут иметь разные формантные структуры, но аналогичные структуры основного тона. На фиг. 8b показан график зависимости амплитуды от времени в одном примере такого остаточного сигнала, где показана последовательность импульсов основного тона во времени.
Эффективность кодирования и/или качество речи можно повысить с использованием одного или нескольких значений параметра для кодирования характеристик структуры основного тона. Одной важной характеристикой структуры основного тона является частота первой гармоники (также именуемая основной частотой), которая обычно находится в диапазоне от 60 до 400 Гц. Эта характеристика обычно кодируется как величина, обратная основной частоте, также именуемая интервалом основного тона. Интервал основного тона указывает количество выборок в одном периоде основного тона и может кодироваться как один или несколько индексов кодовой книги. Для речевых сигналов дикторов-мужчин характерны более длительные интервалы основного тона, чем речевые сигналы дикторов-женщин.
Другой характеристикой сигнала, связанной со структурой основного тона, является периодичность, которая указывает интенсивность гармонической структуры или, иными словами, степень гармоничности или негармоничности сигнала. Двумя типичными признаками периодичности являются прохождения через нуль и нормированные автокорреляционные функции (NACF). О периодичности также может свидетельствовать коэффициент усиления основного тона, который обычно кодируется как коэффициент усиления кодовой книги (например, квантованный коэффициент усиления адаптивной кодовой книги).
Узкополосный кодер A120 может включать в себя один или несколько модулей, способных кодировать долговременную гармоническую структуру узкополосного сигнала S20. Согласно фиг. 9, одна типичная структура CELP, которую можно использовать, включает в себя модуль анализа LPC с открытым циклом, который кодирует краткосрочные характеристики или грубую спектральную огибающую, после которого следует каскад анализа долгосрочного прогнозирования с замкнутым циклом, который кодирует тонкую структуру основного тона или гармоник. Краткосрочные характеристики кодируются как коэффициенты фильтра, и долгосрочные характеристики кодируются как значения параметров, например интервал основного тона и коэффициент усиления основного тона. Например, узкополосный кодер A120 может быть способен выводить кодированный узкополосный сигнал возбуждения S50 в форме, которая включает в себя один или несколько индексов кодовой книги (например, индекс фиксированной кодовой книги и индекс адаптивной кодовой книги) и соответствующие значения коэффициента усиления. Вычисление этого квантованного представления узкополосного остаточного сигнала (например, квантователем 270) может включать в себя выбор таких индексов и вычисление таких значений. Кодирование структуры основного тона также может включать в себя интерполяцию формы сигнала-прототипа основного тона, каковая операция может включать в себя вычисление разницы между последовательными импульсами основного тона. Моделирование долговременной структуры можно блокировать для кадров, соответствующих невокализованной речи, которая обычно шумоподобна и неструктурирована.
Реализация узкополосного декодера B110 согласно структуре, показанной на фиг. 9, может быть способна выдавать узкополосный сигнал возбуждения S80 на декодер B200 диапазона высоких частот после восстановления долговременной структуры (основного тона или гармонической структуры). Например, такой декодер может быть способен выводить узкополосный сигнал возбуждения S80 в качестве деквантованной версии кодированного узкополосного сигнала возбуждения S50. Конечно, можно также реализовать узкополосный декодер B110, чтобы декодер B200 диапазона высоких частот осуществлял деквантование кодированного узкополосного сигнала возбуждения S50 для получения узкополосного сигнала возбуждения S80.
В реализации широкополосного речевого кодера A100 согласно схеме, показанной на фиг. 9, кодер A200 диапазона высоких частот может быть способен принимать узкополосный сигнал возбуждения, создаваемый краткосрочным анализом или отбеливающим фильтром. Иными словами, узкополосный кодер A120 может быть способен выдавать узкополосный сигнал возбуждения на кодер A200 диапазона высоких частот до кодирования долговременной структуры. Однако желательно, чтобы кодер A200 диапазона высоких частот принимал из узкополосного канала ту же информацию кодирования, который будет принимать декодер B200 диапазона высоких частот, так что параметры кодирования, сформированные кодером A200 диапазона высоких частот, уже могут в некоторой степени отвечать за неидеальности в этой информации. Таким образом, может быть предпочтительно, чтобы кодер A200 диапазона высоких частот реконструировал узкополосный сигнал возбуждения S80 из того же параметризованного и/или квантованного кодированного узкополосного сигнала возбуждения S50, который выводится широкополосным речевым кодером A100. Одно потенциальное преимущество такого подхода состоит в более точном вычислении коэффициентов усиления S60b диапазона высоких частот, описанном ниже.
Помимо параметров, характеризующих кратковременную и/или долговременную структуру узкополосного сигнала S20, узкополосный кодер A120 может создавать значения параметров, которые относятся к другим характеристикам узкополосного сигнала S20. Эти значения, которые могут быть подходящим образом квантованы для вывода широкополосным речевым кодером A100, можно включать в узкополосные параметры фильтра S40 или выводить отдельно. Кодер A200 диапазона высоких частот также может быть способен вычислять параметры кодирования S60 диапазона высоких частот согласно одному или нескольким из этих дополнительных параметров (например, после деквантования). На широкополосном речевом декодере B100, декодер B200 диапазона высоких частот может быть способен принимать значения параметра через узкополосный декодер B110 (например, после деквантования). Альтернативно, декодер B200 диапазона высоких частот может быть способен принимать (и, возможно, деквантовать) значения параметра напрямую.
В одном примере дополнительных узкополосных параметров кодирования, узкополосный кодер A120 создает значения наклона спектра и параметров речевого режима для каждого кадра. Наклон спектра связан с формой спектральной огибающей по полосе пропускания и обычно представлен квантованным первым коэффициентом отражения. Для большинства вокализованных звуков спектральная энергия снижается с увеличением частоты, так что первый коэффициент отражения отрицателен и может достигать -1. Большинство невокализованных звуков имеет спектр, который является либо плоским, в результате чего первый коэффициент отражения близок к нулю, либо имеет больше энергии на высоких частотах, в результате чего первый коэффициент отражения положителен и может достигать +1.
Речевой режим (также именуемый режимом вокализации) указывает, представляет ли текущий кадр вокализованную или невокализованную речь. Этот параметр может иметь двоичное значение, основанное на одном или нескольких показателях периодичности (например, прохождениях через нуль, NACF, коэффициенте усиления основного тона) и/или речевой активности для кадра, например соотношении между таким показателем и пороговым значением. В других реализациях, параметр речевого режима имеет один или несколько других состояний для указания таких режимов, как молчание или фоновый шум, или переход между молчанием и вокализованной речью.
Кодер A200 диапазона высоких частот способен кодировать сигнал S30 диапазона высоких частот согласно модели источник-фильтр, причем возбуждение для этого фильтра базируется на кодированном узкополосном сигнале возбуждения. На фиг. 10 показана блок-схема реализации A202 кодера A200 диапазона высоких частот, который способен создавать поток параметров кодирования S60 диапазона высоких частот, включающих в себя параметры фильтра S60a диапазона высоких частот и коэффициенты усиления S60b диапазона высоких частот. Генератор возбуждения A300 диапазона высоких частот выводит сигнал возбуждения S120 диапазона высоких частот из кодированного узкополосного сигнала возбуждения S50. Модуль анализа A210 формирует набор значений параметра, характеризующих спектральную огибающую сигнала S30 диапазона высоких частот. В этом конкретном примере, модуль анализа A210 способен осуществлять анализ LPC для формирования набора коэффициентов НЧ-фильтра для каждого кадра сигнала S30 диапазона высоких частот. Преобразование 410 коэффициентов фильтра линейного прогнозирования в LSF преобразует набор коэффициентов НЧ-фильтра в соответствующий набор LSF. Как отмечено выше со ссылкой на модуль анализа 210 и преобразование 220, модуль анализа A210 и/или преобразование 410 могут быть способны использовать другие наборы коэффициентов (например, коэффициентов косинусного преобразования Фурье) и/или представлений коэффициентов (например, ISP).
Квантователь 420 способен квантовать набор LSF диапазона высоких частот (или другого представления коэффициентов, например ISP), и кодер A202 диапазона высоких частот способен выводить результат этого квантования в виде параметров фильтра S60a диапазона высоких частот. Такой квантователь обычно включает в себя векторный квантователь, который кодирует входной вектор как индекс к соответствующей векторной записи в таблице или кодовой книге.
Кодер A202 диапазона высоких частот также включает в себя синтезирующий фильтр A220, способный формировать синтезированный сигнал S130 диапазона высоких частот согласно сигналу возбуждения S120 диапазона высоких частот и кодированной спектральной огибающей (например, набору коэффициентов НЧ-фильтра), созданной модулем анализа A210. Синтезирующий фильтр A220 обычно реализован в виде IIR-фильтра, хотя можно использовать также реализации FIR. В конкретном примере, синтезирующий фильтр A220 реализован в виде линейного авторегрессивного фильтра шестого порядка.
Калькулятор A230 коэффициента усиления диапазона высоких частот вычисляет одну или несколько разностей между уровнями исходного сигнала S30 диапазона высоких частот и синтезированного сигнала S130 диапазона высоких частот для задания огибающей усиления для кадра. Квантователь 430, который можно реализовать как векторный квантователь, который кодирует входной вектор как индекс к соответствующей векторной записи в таблице или кодовой книге, квантует значение или значения, задающее/ие огибающую усиления, и кодер A202 диапазона высоких частот способен выводить результат этого квантования как коэффициенты усиления S60b диапазона высоких частот.
В реализации, показанной на фиг. 10, синтезирующий фильтр A220 способен принимать коэффициенты фильтра от модуля анализа A210. Альтернативная реализация кодера A202 диапазона высоких частот включает в себя обратный квантователь и обратное преобразование, способные декодировать коэффициенты фильтра из параметров фильтра S60a диапазона высоких частот, и, в этом случае, синтезирующий фильтр A220 должен, вместо этого, принимать декодированные коэффициенты фильтра. Такая альтернативная конфигурация может поддерживать более точное вычисление огибающей усиления калькулятором A230 коэффициента усиления диапазона высоких частот.
В одном конкретном примере, модуль анализа A210 и калькулятор A230 коэффициента усиления диапазона высоких частот выводят набор из шести LSF и набор пяти значений коэффициента усиления на кадр, соответственно, что позволяет добиться широкополосного расширения узкополосного сигнала S20 с помощью только одиннадцати дополнительных значений на кадр. Ухо менее чувствительно к частотным искажениям на высоких частотах, благодаря чему кодирование в диапазоне высоких частот при низком порядке LPC может создавать сигнал, имеющий воспринимаемое качество, совместимое с узкополосным кодированием на более высоком порядке LPC. Типичная реализация кодера A200 диапазона высоких частот может быть способна выводить от 8 до 12 битов на кадр для высококачественной реконструкции спектральной огибающей и еще от 8 до 12 битов на кадр для высококачественной реконструкции временной огибающей. В другом конкретном примере, модуль анализа A210 выводит набор из восьми LSF на кадр.
Некоторые реализации кодера A200 диапазона высоких частот способны создавать сигнал возбуждения S120 диапазона высоких частот, генерируя случайный шумовой сигнал, имеющий частотные составляющие диапазона высоких частот и модулируя по амплитуде шумовой сигнал согласно огибающей во временном измерении узкополосного сигнала S20, узкополосного сигнала возбуждения S80 или сигнала S30 диапазона высоких частот. Однако, хотя такой шумовой способ может давать адекватные результаты для невокализованных звуков, его применение может оказаться нежелательным для вокализованных звуков, остатки которых обычно являются гармоническими и, следовательно, имеют некоторую периодическую структуру.
Генератор возбуждения A300 диапазона высоких частот способен генерировать сигнал возбуждения S120 диапазона высоких частот, расширяя спектр узкополосного сигнала возбуждения S80 на частотный диапазон диапазона высоких частот. На фиг. 11 показана блок-схема реализации A302 генератора возбуждения A300 диапазона высоких частот. Обратный квантователь 450 способен деквантовать кодированный узкополосный сигнал возбуждения S50 для создания узкополосного сигнала возбуждения 380. Расширитель спектра А400 способен создавать гармонически расширенный сигнал S160 на основании узкополосного сигнала возбуждения 380. Объединитель 470 способен объединять случайный шумовой сигнал, генерируемый генератором 480 шума, и огибающую во временном измерении, вычисляемую калькулятором 460 огибающей для создания модулированного шумового сигнала S170. Объединитель 490 способен смешивать гармонически расширенный сигнал S160 и модулированный шумовой сигнал S170 для создания сигнала возбуждения S120 диапазона высоких частот.
В одном примере, расширитель спектра А400 способен осуществлять операцию спектрального наложения (также именуемую зеркальным отражением) на узкополосном сигнале возбуждения 380 для создания гармонически расширенного сигнала S160. Спектральное наложение может осуществляться путем заполнения нулями сигнала возбуждения S80 с последующим применением фильтра верхних частот для сохранения помехи дискретизации. В другом примере, расширитель спектра А400 способен создавать гармонически расширенный сигнал S160 путем переноса спектра узкополосного сигнала возбуждения S80 в верхний диапазон (например, путем повышения частоты дискретизации с последующим умножением на косинусоидальный сигнал постоянной частоты).
Способы спектрального наложения и переноса могут создавать спектрально расширенные сигналы, гармоническая структура которых имеет нарушение непрерывности с исходной гармонической структурой узкополосного сигнала возбуждения S80 по фазе и/или частоте. Например, такие способы могут создавать сигналы, пики которых, в общем случае, не соответствуют кратным основной частоты, что может вызывать искажения с металлическим призвуком в реконструированном речевом сигнале. Этим способам также свойственно создавать высокочастотные гармоники, имеющие неестественно сильные тональные характеристики. Кроме того, поскольку сигналы PSTN допускают дискретизацию на 8 кГц, но ограничены по полосе частотой 3400 Гц, верхний спектр узкополосного сигнала возбуждения S80 может содержать мало или вовсе не содержать энергии, в результате чего расширенный сигнал, генерируемый согласно операции спектрального наложения или спектрального переноса, может иметь спектральный провал на частотах выше 3400 Гц.
Другие способы генерации гармонически расширенного сигнала S160 включают в себя идентификацию одной или нескольких основных частот узкополосного сигнала возбуждения S80 и генерацию гармонических тонов согласно этой информации. Например, гармоническая структура сигнала возбуждения может характеризоваться основной частотой совместно с информацией амплитуды и фазы. Другая реализация генератора возбуждения A300 диапазона высоких частот генерирует гармонически расширенный сигнал S160 на основании основной частоты и амплитуды (указанной, например, интервалом основного тона и коэффициентом усиления основного тона). Однако, если гармонически расширенный сигнал не когерентен по фазе с узкополосным сигналом возбуждения S80, качество результирующей декодированной речи может быть неприемлемым.
Нелинейную функцию можно использовать для создания сигнала возбуждения диапазона высоких частот, который когерентен по фазе с узкополосным возбуждением и сохраняет гармоническую структуру без разрыва по фазе. Нелинейная функция может также обеспечивать повышенный уровень шума между высокочастотными гармониками, что обеспечивает более естественное звучание, чем тональные высокочастотные гармоники, создаваемые, например, способами спектрального наложения и спектрального переноса. Типичные нелинейные функции без запоминания, которые могут применяться в различных реализациях расширителя спектра A400, включают в себя функцию абсолютного значения (также именуемую двухполупериодным выпрямлением), однополупериодное выпрямление, возведение в квадрат, возведение в куб и отсечение. Другие реализации расширителя спектра A400 могут быть способны применять нелинейную функцию с запоминанием.
На фиг. 12 показана блок-схема реализации A402 расширителя спектра A400, который способен применять нелинейную функцию для расширения спектра узкополосного сигнала возбуждения S80. Блок 510 повышения частоты дискретизации способен преобразовывать с повышением частоты дискретизации узкополосный сигнал возбуждения S80. Может оказаться желательно преобразовывать сигнал с достаточным повышением частоты дискретизации для минимизации помехи дискретизации после применения нелинейной функции. В одном конкретном примере, блок повышения частоты дискретизации 510 преобразует с повышением частоты дискретизации сигнал с коэффициентом восемь. Блок повышения частоты дискретизации 510 может быть способен осуществлять операцию повышения частоты дискретизации путем вставки нулей в входной сигнал и низкочастотной фильтрации результата. Калькулятор 520 нелинейной функции способен применять нелинейную функцию к сигналу, преобразованному с повышением частоты дискретизации. Одно потенциальное преимущество функции абсолютного значения над другими нелинейными функциями для расширения спектра, например квадратичной функцией, состоит в отсутствии необходимости в нормализации энергии. В некоторых реализациях, функцию абсолютного значения можно эффективно применять, отбрасывая или очищая знаковый бит каждой выборки. Калькулятор 520 нелинейной функции также может быть способен осуществлять амплитудную трансформацию преобразованного с повышением частоты дискретизации или спектрально расширенного сигнала.
Блок 530 понижения частоты дискретизации способен преобразовывать с понижением частоты дискретизации спектрально расширенный результат применения нелинейной функции. Может оказаться желательно, чтобы блок 530 понижения частоты дискретизации осуществлял операцию полосовой фильтрации для выбора нужной полосы частот спектрально расширенного сигнала до снижения частоты дискретизации (например, для снижения или устранения подмены или повреждения ненужным изображением). Также может быть желательно, чтобы блок 530 понижения частоты дискретизации снижал частоту дискретизации в более чем в один этап.
На фиг. 12a показана диаграмма спектров сигнала в различных точках в одном примере операции расширения спектра, где масштаб частоты одинаков для различных графиков. График (a) демонстрирует спектр одного примера узкополосного сигнала возбуждения S80. График (b) демонстрирует спектр после повышения частоты дискретизации сигнала S80 с коэффициентом восемь. График (c) демонстрирует пример расширенного спектра после применения нелинейной функции. График (d) демонстрирует спектр после низкочастотной фильтрации. В этом примере, полоса пропускания доходит до верхней частотной границы сигнала S30 диапазона высоких частот (например, 7 кГц или 8 кГц).
График (e) демонстрирует спектр после первого этапа преобразования с понижением частоты дискретизации, на котором частота дискретизации снижается с коэффициентом четыре для получения широкополосного сигнала. График (f) демонстрирует спектр после операции высокочастотной фильтрации для выбора части расширенного сигнала диапазона высоких частот, и график (g) демонстрирует спектр после второго этапа преобразования с понижением частоты дискретизации, на котором частота дискретизации снижается с коэффициентом два. В одном конкретном примере, блок 530 понижения частоты дискретизации осуществляет высокочастотную фильтрацию и второй этап преобразования с понижением частоты дискретизации, пропуская широкополосный сигнал через фильтр 130 верхних частот и блок 140 понижения частоты дискретизации гребенки фильтров A112 (или другие структуры или процедуры, имеющие такую же характеристику) для создания спектрально расширенного сигнала, имеющего частотный диапазон и частоту дискретизации сигнала S30 диапазона высоких частот.
Из графика (g) следует, что преобразование с понижением частоты дискретизации высокочастотного сигнала, показанного на графике (f), приводит к обращению его спектра. В этом примере, блок 530 понижения частоты дискретизации также способен осуществлять операцию обращения спектра на сигнале. График (h) демонстрирует результат применения операции обращения спектра, которая может осуществляться посредством умножения сигнала на функцию e jnπ или последовательность (-1)n, которая попеременно принимает значения +1 и -1. Такая операция эквивалентна сдвигу цифрового спектра сигнала в частотном измерении на расстояние π. Заметим, что такой же результат можно получить, применяя операции преобразования с понижением частоты дискретизации и обращения спектра в другом порядке. Операции повышения частоты дискретизации и/или преобразования с понижением частоты дискретизации также могут быть способны включать в себя повторную дискретизацию для получения спектрально расширенного сигнала, имеющего частоту дискретизации сигнала S30 диапазона высоких частот (например, 7 кГц).
Как отмечено выше, гребенки фильтров A110 и B120 можно реализовать так, что один или оба из узкополосного и сигналов S20, S30 диапазона высоких частот, имеющих спектрально обращенную форму на выходе гребенки фильтров A110, будет кодироваться и декодироваться в спектрально обращенной форме и снова подвергаться обращению спектра на гребенке фильтров B120 до вывода в широкополосный речевой сигнал S110. В таком случае, конечно, операция обращения спектра, показанная на фиг. 12a, будет не нужна, что было бы желательно для того, чтобы сигнал возбуждения S120 диапазона высоких частот также имел спектрально обращенную форму.
Различные задачи повышения частоты дискретизации и преобразования с понижением частоты дискретизации операции расширения спектра, осуществляемой расширителем спектра A402, можно конфигурировать по-разному. Например, на фиг. 12b показана диаграмма спектров сигнала в различных точках в другом примере операции расширения спектра, где масштаб частоты одинаков для различных графиков. График (a) демонстрирует спектр одного примера узкополосного сигнала возбуждения S80. График (b) демонстрирует спектр после повышения частоты дискретизации сигнала S80 с коэффициентом два. График (c) демонстрирует пример расширенного спектра после применения нелинейной функции. В этом случае, помеха дискретизации, которая может возникать на более высоких частотах, приемлема.
График (d) демонстрирует спектр после операции обращения спектра. График (e) демонстрирует спектр после одного этапа преобразования с понижением частоты дискретизации, на котором частота дискретизации снижается с коэффициентом два для получения нужного спектрально расширенного сигнала. В этом примере, сигнал находится в спектрально обращенной форме и его можно использовать в реализации кодера A200 диапазона высоких частот, который обрабатывал сигнал S30 диапазона высоких частот в такой форме.
Спектрально расширенный сигнал, созданный калькулятором 520 нелинейной функции, с большой вероятностью имеет ярко выраженный спад амплитуды с ростом частоты. Расширитель спектра A402 включает в себя выравниватель спектра 540, способный осуществлять операцию отбеливания на сигнале, преобразованном с понижением частоты дискретизации. Выравниватель спектра 540 может быть способен осуществлять операцию фиксированного отбеливания или осуществлять операцию адаптивного отбеливания. В конкретном примере адаптивного отбеливания, выравниватель спектра 540 включает в себя модуль анализа LPC, способный вычислять набор из четырех коэффициентов фильтра из сигнала, преобразованного с понижением частоты дискретизации, и анализирующий фильтр четвертого порядка, способный отбеливать сигнал согласно этим коэффициентам. Другие реализации расширителя спектра A400 включают в себя конфигурации, в которых выравниватель спектра 540 обрабатывает спектрально расширенный сигнал до блока 530 понижения частоты дискретизации.
Генератор возбуждения A300 диапазона высоких частот можно реализовать для вывода гармонически расширенного сигнала S160 как сигнал возбуждения S120 диапазона высоких частот. Однако, в ряде случаев, использование только гармонически расширенного сигнала в качестве возбуждения диапазона высоких частот может приводить к слышимым искажениям. Гармоническая структура речи, в общем случае, менее ярко выражена в верхнем диапазоне, чем в нижнем диапазоне, и использование слишком гармонической структуры в сигнале возбуждения диапазона высоких частот может приводить к взрывному звуку. Это искажение может быть особенно заметным в речевых сигналах дикторов-женщин.
Варианты осуществления включают в себя реализации генератора возбуждения A300 диапазона высоких частот, которые способны смешивать гармонически расширенный сигнал S160 с шумовым сигналом. Согласно фиг. 11, генератор возбуждения A302 диапазона высоких частот включает в себя генератор шума 480, который способен создавать случайный шумовой сигнал. В одном примере, генератор шума 480 способен создавать белый псевдослучайный шумовой сигнал с единичной дисперсией, хотя, в других реализациях, шумовой сигнал не обязан быть белым и может иметь плотность мощности, изменяющуюся с частотой. Может оказаться желательно, чтобы генератор шума 480 был способен выводить шумовой сигнал как детерминированную функцию, чтобы его состояние можно было дублировать на декодере. Например, генератор шума 480 может быть способен выводить шумовой сигнал как детерминированную функцию информации, закодированной ранее в том же кадре, например узкополосные параметры фильтра S40 и/или кодированный узкополосный сигнал возбуждения S50.
До смешивания с гармонически расширенным сигналом S160, случайный шумовой сигнал, созданный генератором шума 480, можно модулировать по амплитуде, чтобы он имел огибающую во временном измерении, которая аппроксимирует распределение энергии по времени узкополосного сигнала S20, сигнала S30 диапазона высоких частот, узкополосного сигнала возбуждения S80 или гармонически расширенного сигнала S160. Согласно фиг. 11, генератор возбуждения A302 диапазона высоких частот включает в себя объединитель 470, способный модулировать по амплитуде шумовой сигнал, создаваемый генератором шума 480, согласно огибающей во временном измерении, вычисленной калькулятором огибающей 460. Например, объединитель 470 можно реализовать в виде умножителя, способного масштабировать выходной сигнал генератора шума 480 согласно огибающей во временном измерении, вычисленной калькулятором огибающей 460, для создания модулированного шумового сигнала S170.
В реализации A304 генератора возбуждения A302 диапазона высоких частот, показанной в блок-схеме, изображенной на фиг. 13, калькулятор огибающей 460 способен вычислять огибающую гармонически расширенного сигнала S160. В реализации A306 генератора возбуждения A302 диапазона высоких частот, показанной в блок-схеме, изображенной на фиг. 14, калькулятор огибающей 460 способен вычислять огибающую узкополосного сигнала возбуждения S80. Другие реализации генератора возбуждения A302 диапазона высоких частот, так или иначе, могут быть способны добавлять шум к гармонически расширенному сигналу S160 согласно положениям узкополосных импульсов основного тона во времени.
Калькулятор огибающей 460 может быть способен осуществлять вычисление огибающей как задачу, которая включает в себя ряд подзадач. На фиг. 15 показана логическая блок-схема примера T100 такой задачи. Подзадача T110 вычисляет квадрат каждой выборки кадра сигнала, огибающую которой нужно моделировать (например, узкополосного сигнала возбуждения S80 или гармонически расширенного сигнала S160), для создания последовательности квадратов значений. Подзадача T120 осуществляет операцию сглаживания на последовательности квадратов значений. В одном примере, подзадача T120 применяет IIR-фильтр нижних частот первого порядка к последовательности согласно выражению
Figure 00000001
где x - входной сигнал фильтра, y - выходной сигнал фильтра, n -индекс во временном измерении, и a - коэффициент сглаживания, имеющий значение между 0,5 и 1. Значение коэффициента сглаживания a может быть фиксированным или, в альтернативной реализации, адаптивным согласно указанию шума во входном сигнале, в результате чего a оказывается ближе к 1 в отсутствие шума и ближе к 0,5 при наличии шума. Подзадача T130 применяет функцию квадратного корня к каждой выборке сглаженной последовательности для создания огибающей во временном измерении.
Такая реализация калькулятора огибающей 460 может быть способна осуществлять различные подзадачи задачи T100 последовательно и/или параллельно. В других реализациях задачи T100, подзадаче T110 может предшествовать операция полосовой фильтрации, способная выбирать нужную частотную часть сигнала, огибающую которого нужно моделировать, например диапазон 3-4 кГц.
Объединитель 490 способен смешивать гармонически расширенный сигнал S160 и модулированный шумовой сигнал S170 для создания сигнала возбуждения S120 диапазона высоких частот. Реализации объединителя 490 могут быть способны, например, вычислять сигнал возбуждения S120 диапазона высоких частот как сумму гармонически расширенного сигнала S160 и модулированного шумового сигнала S170. Такая реализация объединителя 490 может быть способна вычислять сигнал возбуждения S120 диапазона высоких частот как взвешенную сумму с применением весового коэффициента к гармонически расширенному сигналу S160 и/или к модулированному шумовому сигналу S170 для суммирования. Каждый такой весовой коэффициент можно вычислять согласно одному или нескольким критериям, и он может иметь фиксированное значение или, альтернативно, адаптивное значение, вычисляемое для каждого кадра или подкадра.
На фиг. 16 показана блок-схема реализации 492 объединителя 490, который способен вычислять сигнал возбуждения S120 диапазона высоких частот в виде взвешенной суммы гармонически расширенного сигнала S160 и модулированного шумового сигнала S170. Объединитель 492 способен взвешивать гармонически расширенный сигнал S160 согласно весовому коэффициенту гармонического сигнала S180, взвешивать модулированный шумовой сигнал S170 согласно весовому коэффициенту шума S190 и выводить сигнал возбуждения S120 диапазона высоких частот как сумму взвешенных сигналов. В этом примере, объединитель 492 включает в себя калькулятор 550 весовых коэффициентов, который способен вычислять весовой коэффициент гармонического сигнала S180 и весовой коэффициент шума S190.
Калькулятор 550 весовых коэффициентов может быть способен вычислять весовые коэффициенты S180 и S190 согласно нужному отношению гармонического контента к шумовому контенту в сигнале возбуждения S120 диапазона высоких частот. Например, может оказаться желательно, чтобы объединитель 492 создавал сигнал возбуждения S120 диапазона высоких частот, имеющий отношение энергии гармоник к энергии шума, близкое к соответствующему отношению в сигнале S30 диапазона высоких частот. В некоторых реализациях калькулятора 550 весовых коэффициентов, весовые коэффициенты S180, S190 вычисляются согласно одному или нескольким параметрам, связанным с периодичностью узкополосного сигнала S20 или узкополосного остаточного сигнала, например коэффициенту усиления основного тона и/или речевому режиму. Такая реализация калькулятора 550 весовых коэффициентов может быть способна, например, присваивать весовому коэффициенту гармонического сигнала S180 значение, пропорциональное коэффициенту усиления основного тона, и/или присваивать весовому коэффициенту шума S190 для невокализованных речевых сигналов более высокое значение, чем для вокализованных речевых сигналов.
В других реализациях, калькулятор 550 весовых коэффициентов способен вычислять значения весового коэффициента гармонического сигнала S180 и/или весового коэффициента шума S190 согласно показателю периодичности сигнала S30 диапазона высоких частот. В одном таком примере, калькулятор весовых коэффициентов 550 вычисляет весовой коэффициент гармонического сигнала S180 как максимальное значение коэффициента автокорреляции сигнала S30 диапазона высоких частот для текущего кадра или подкадра, где автокорреляция осуществляется по диапазону поиска, который включает в себя задержку в один интервал основного тона и не включает в себя задержку в нуль выборок. На фиг. 17 показан пример такого диапазона поиска длиной в n выборок, центр которого соответствует задержке в один интервал основного тона и ширина которого не превышает один интервал основного тона.
На фиг. 17 также показан пример другого подхода, согласно которому калькулятор 550 весовых коэффициентов вычисляет показатель периодичности сигнала S30 диапазона высоких частот в несколько этапов. На первом этапе, текущий кадр делится на некоторое количество подкадров, и задержка, при которой коэффициент автокорреляции достигает максимума, определяется отдельно для каждого подкадра. Как отмечено выше, автокорреляция осуществляется в диапазоне поиска, который включает в себя задержку в один интервал основного тона и не включает в себя задержку в нуль выборок.
На втором этапе, задержанный кадр строится посредством применения соответствующей определенной задержки для каждого подкадра, сочленения полученных подкадров для построения кадра с оптимальной задержкой и вычисления весового коэффициента гармонического сигнала S180 в качестве коэффициента корреляции между исходным кадром и кадром с оптимальной задержкой. Альтернативно, калькулятор 550 весовых коэффициентов вычисляет весовой коэффициент гармонического сигнала S180 как среднее максимальных коэффициентов автокорреляции, полученных на первом этапе для каждого подкадра. Реализации калькулятора 550 весовых коэффициентов также могут быть способны масштабировать коэффициент корреляции и/или объединять его с другим значением для вычисления значения весового коэффициента гармонического сигнала S180.
Может оказаться желательно, чтобы калькулятор 550 весовых коэффициентов вычислял показатель периодичности сигнала S30 диапазона высоких частот только в случаях, когда, так или иначе, указано наличие периодичности в кадре. Например, калькулятор 550 весовых коэффициентов может быть способен вычислять показатель периодичности сигнала S30 диапазона высоких частот согласно соотношению между другим указателем периодичности текущего кадра, например коэффициентом усиления основного тона, и пороговым значением. В одном примере, калькулятор весовых коэффициентов 550 способен осуществлять операцию автокорреляции на сигнале S30 диапазона высоких частот, только если коэффициент усиления основного тона кадра (например, коэффициент усиления адаптивной кодовой книги узкополосного остатка) имеет значение более 0,5 (альтернативно, по меньшей мере, 0,5). В другом примере, калькулятор весовых коэффициентов 550 способен осуществлять операцию автокорреляции на сигнале S30 диапазона высоких частот только для кадров, имеющих конкретные состояния речевого режима (например, только для вокализованных сигналов). В таких случаях, калькулятор весовых коэффициентов 550 может быть способен присваивать весовой коэффициент, принятый по умолчанию, для кадров, имеющих другие состояния речевого режима и/или меньшие значения коэффициента усиления основного тона.
Варианты осуществления включают в себя дополнительные реализации калькулятора 550 весовых коэффициентов, которые способны вычислять весовые коэффициенты согласно характеристикам, отличным от периодичности или дополнительным к ней. Например, такая реализация может быть способна присваивать коэффициенту усиления шума S190 для речевых сигналов, имеющих большой интервал основного тона, более высокое значение, чем для речевых сигналов, имеющих малый интервал основного тона. Другая такая реализация калькулятора 550 весовых коэффициентов способна определять показатель гармоничности широкополосного речевого сигнала S10 или сигнала S30 диапазона высоких частот согласно мере энергии сигнала на частотах, кратных основной частоте, относительно энергии сигнала других частотных составляющих.
Некоторые реализации широкополосного речевого кодера A100 способны выводить индикацию периодичности или гармоничности (например, однобитовый флаг, указывающий, является ли кадр гармоническим или негармоническим) на основании коэффициента усиления основного тона и/или другого описанного здесь показателя периодичности или гармоничности. В одном примере, соответствующий широкополосный речевой декодер B100 использует эту индикацию для настройки такой операции, как, например, вычисление весового коэффициента. В другом примере, такая индикация используется на кодере и/или декодере при вычислении значения параметра речевого режима.
Может оказаться желательно, чтобы генератор возбуждения A302 диапазона высоких частот генерировал сигнал возбуждения S120 диапазона высоких частот таким образом, чтобы конкретные значения весовых коэффициентов S180 и S190 не оказывали существенного влияния на энергию сигнала возбуждения. В таком случае, калькулятор 550 весовых коэффициентов может быть способен вычислять значение весового коэффициента гармонического сигнала S180 или весового коэффициента шума S190 (или принимать такое значение из хранилища или другого элемента кодера A200 диапазона высоких частот) и выводить значение другого весового коэффициента согласно, например, выражению
Figure 00000002
где W harmonic обозначает весовой коэффициент гармонического сигнала S180 и W noise обозначает весовой коэффициент шума S190. Альтернативно, калькулятор 550 весовых коэффициентов может быть способен выбирать, согласно значению показателя периодичности текущего кадра или подкадра, соответствующую одну из совокупности пар весовых коэффициентов S180, S190, где пары заранее вычислены в соответствии с постоянным отношением энергий, например, выражением (2). Для реализации калькулятора 550 весовых коэффициентов, в котором справедливо выражение (2), типичные значения весового коэффициента гармонического сигнала S180 составляют от около 0,7 до около 1,0, и типичные значения весового коэффициента шума S190 составляют от около 0,1 до около 0,7. Другие реализации калькулятора 550 весовых коэффициентов могут быть способны действовать согласно версии выражения (2), модифицированной согласно нужному основополагающему взвешиванию между гармонически расширенным сигналом S160 и модулированным шумовым сигналом S170.
Искажения могут возникать в синтезированном речевом сигнале, когда разреженная кодовая книга (записи которой в большинстве своем имеют нулевые значения) использовалась для вычисления квантованного представления остатка. Разреженность кодовой книги имеет место, в основном, когда узкополосный сигнал кодируется с низкой битовой скоростью. Искажения, обусловленные разреженностью кодовой книги, обычно являются квазипериодическими во времени и возникают, в основном, на частотах свыше 3 кГц. Поскольку человеческое ухо имеет повышенное временное разрешение на более высоких частотах, эти искажения могут быть более заметны в верхнем диапазоне.
Варианты осуществления включают в себя реализации генератора возбуждения A300 диапазона высоких частот, которые способны осуществлять фильтрацию для устранения разряжения. На фиг. 18 показана блок-схема реализации A312 генератора возбуждения A302 диапазона высоких частот, которая включает в себя фильтр 600 для устранения разряжения, способный фильтровать деквантованный узкополосный сигнал возбуждения, создаваемый обратным квантователем 450. На фиг. 19 показана блок-схема реализации A314 генератора возбуждения A302 диапазона высоких частот, которая включает в себя фильтр 600 для устранения разряжения, способный фильтровать спектрально расширенный сигнал, создаваемый расширителем спектра A400. На фиг. 20 показана блок-схема реализации A316 генератора возбуждения A302 диапазона высоких частот, которая включает в себя фильтр 600 для устранения разряжения, способный фильтровать выходной сигнал объединителя 490 для создания сигнала возбуждения S120 диапазона высоких частот. Конечно, возможны и, таким образом, явно раскрыты реализации генератора возбуждения A300 диапазона высоких частот, объединяющие особенности любой из реализаций A304 и A306 с особенностями любой из реализаций A312, A314 и A316. Фильтр 600 для устранения разряжения также может быть предусмотрен в расширителе спектра A400: например, после любого из элементов 510, 520, 530 и 540 в расширителе спектра A402. Заметим, что фильтр 600 для устранения разряжения также можно использовать с реализациями расширителя спектра A400, которые осуществляют спектральное наложение, спектральный перенос или гармоническое расширение.
Фильтр 600 для устранения разряжения может быть способен изменять фазу поступающего на него сигнала. Например, может оказаться желательно, чтобы фильтр 600 для устранения разряжения был настроен и размещен так, чтобы рандомизировать фазу сигнала возбуждения S120 диапазона высоких частот, или иным образом обеспечивает ее более равномерное распределение, по времени. Также может быть желательно, чтобы спектральная характеристика фильтра 600 для устранения разряжения была плоской, чтобы амплитудно-частотная характеристика фильтрованного сигнала не претерпевала значительных изменений. В одном примере, фильтр 600 для устранения разряжения реализован в виде всечастотного фильтра, передаточная функция которого выражается следующим образом:
Figure 00000003
Такой фильтр, в частности позволяет так распределить энергию входного сигнала, чтобы она больше не концентрировалась лишь в нескольких выборках.
Искажения, обусловленные разреженностью кодовой книги, обычно более заметны для шумоподобных сигналов, где остаток включает в себя меньше информации основного тона, а также для речи в фоновом шуме. Разреженность обычно вызывает меньшие искажения в случаях, когда возбуждение имеет долговременную структуру, и, действительно, изменение фазы может приводить к зашумлению вокализованных сигналов. Таким образом, может оказаться желательно настроить фильтр 600 для устранения разряжения на блокировку невокализованных сигналов и пропускание, по меньшей мере, некоторых вокализованных сигналов без изменения. Невокализованные сигналы характеризуются низким коэффициентом усиления основного тона (например, квантованным узкополосным коэффициентом усиления адаптивной кодовой книги) и близким к нулю или положительным наклоном спектра (например, квантованным первым коэффициентом отражения), что свидетельствует о том, что спектральная огибающая является плоской или возрастает с увеличением частоты. Типичные реализации фильтра для устранения разряжения 600 способны фильтровать невокализованные звуки (например, указанные значением наклона спектра), фильтровать вокализованные звуки, когда коэффициент усиления основного тона ниже порогового значения (альтернативно, не превышает пороговое значение), и, в противном случае, пропускать сигнал без изменения.
Другие реализации фильтра 600 для устранения разряжения включают в себя два или более фильтра, которые способны иметь разные максимальные углы изменения фазы (например, до 180 градусов). В таком случае, фильтр 600 для устранения разряжения может быть способен делать выбор из этих составляющих фильтров согласно значению коэффициента усиления основного тона (например, квантованного коэффициента усиления адаптивной кодовой книги или LTP), чтобы больший максимальный угол изменения фазы использовался для кадров, имеющих более низкие значения коэффициента усиления основного тона. Реализация фильтра 600 для устранения разряжения также может включать в себя разные составляющие фильтры, которые способны изменять фазу в более или менее широком частотном спектре, чтобы фильтр, способный изменять фазу в более широком частотном диапазоне входного сигнала, использовался для кадров, имеющих более низкие значения коэффициента усиления основного тона.
Для точного воспроизведения кодированного речевого сигнала, может оказаться желательно, чтобы отношение между уровнями части диапазона высоких частот и узкополосной части синтезированного широкополосного речевого сигнала S100 было близким к соответствующему отношению в исходном широкополосном речевом сигнале S10. Помимо спектральной огибающей, представленной параметрами кодирования S60a диапазона высоких частот, кодер A200 диапазона высоких частот может быть способен характеризовать сигнал S30 диапазона высоких частот путем задания временной огибающей или огибающей усиления. Согласно фиг. 10, кодер A202 диапазона высоких частот включает в себя калькулятор коэффициента усиления A230 диапазона высоких частот, который способен и призван вычислять один или несколько коэффициентов усиления согласно соотношению между сигналом S30 диапазона высоких частот и синтезированным сигналом S130 диапазона высоких частот, например, разности или отношению между энергиями двух сигналов на протяжении кадра или некоторой его части. В других реализациях кодера A202 диапазона высоких частот, калькулятор коэффициента усиления A230 диапазона высоких частот может иметь аналогичную конфигурацию, предназначен для вычисления огибающей усиления согласно такому изменяющемуся со временем соотношению между сигналом S30 диапазона высоких частот и узкополосным сигналом возбуждения S80 или сигналом возбуждения S120 диапазона высоких частот.
Временные огибающие узкополосного сигнала возбуждения S80 и сигнала S30 диапазона высоких частот с большой степенью вероятности сходны. Поэтому кодирование огибающей усиления, которое основано на соотношении между сигналом S30 диапазона высоких частот и узкополосным сигналом возбуждения S80 (или сигналом, выведенным из него, например сигналом возбуждения S120 диапазона высоких частот или синтезированным сигналом S130 диапазона высоких частот), будет, в общем случае, более эффективным, чем кодирование огибающей усиления, основанное только на сигнале S30 диапазона высоких частот. В типичной реализации, кодер A202 диапазона высоких частот способен выводить квантованный индекс размером от восьми до двенадцати битов, который указывает пять коэффициентов усиления для каждого кадра.
Калькулятор коэффициента усиления A230 диапазона высоких частот может быть способен осуществлять вычисление коэффициента усиления как задачу, которая включает в себя одну или несколько последовательностей подзадач. На фиг. 21 показана логическая блок-схема примера T200 такой задачи, которая вычисляет значение коэффициента усиления для соответствующего подкадра согласно относительной энергии сигнала S30 диапазона высоких частот и синтезированного сигнала S130 диапазона высоких частот. Задачи 220a и 220b вычисляют энергии соответствующих подкадров соответствующих сигналов. Например, задачи 220a и 220b могут быть способны вычислять энергию как сумму квадратов выборок соответствующего подкадра. Задача T230 вычисляет коэффициент усиления для подкадра как квадратный корень отношения этих энергий. В этом примере, задача T230 вычисляет коэффициент усиления как квадратный корень отношения энергии сигнала S30 диапазона высоких частот к энергии синтезированного сигнала S130 диапазона высоких частот на протяжении подкадра.
Может оказаться желательно, чтобы калькулятор коэффициента усиления A230 в диапазоне высоких частот был способен вычислять энергии подкадров согласно вырезающей функции. На фиг. 22 показана логическая блок-схема такой реализации T210 задачи T200 вычисления коэффициента усиления. Задача T215a применяет вырезающую функцию к сигналу S30 диапазона высоких частот, и задача T215b применяет ту же вырезающую функцию к синтезированному сигналу S130 диапазона высоких частот. Реализации 222a и 222b задач 220a и 220b вычисляют энергии соответствующих окон, и задача T230 вычисляет коэффициент усиления для подкадра как квадратный корень отношения энергий.
Может оказаться желательно применять вырезающую функцию, которая перекрывает соседние подкадры. Например, вырезающая функция, которая создает коэффициенты усиления, которые можно применять в режиме сложения с перекрытием, может способствовать снижению или устранению нарушения непрерывности между подкадрами. В одном примере, калькулятор коэффициента усиления A230 в диапазоне высоких частот способен применять трапецеидальную вырезающую функцию, показанную на фиг. 23a, в которой окно перекрывает каждый из двух соседних подкадров на одну миллисекунду. На фиг. 23b показано применение этой вырезающей функции к каждому из пяти подкадров 20-миллисекундного кадра. Другие реализации калькулятора коэффициента усиления A230 в диапазоне высоких частот могут быть способны применять вырезающие функции, имеющие разные периоды перекрытия и/или разные формы окна (например, прямоугольную, хэммингову), которые могут быть симметричными или асимметричными. Реализация калькулятора коэффициента усиления A230 в диапазоне высоких частот также может быть способна применять разные вырезающие функции к разным подкадрам в кадре и/или кадр может включать в себя подкадры разной длины.
В качестве примеров конкретных реализаций, без ограничения, представлены следующие значения. Для этих случаев предполагается 20-миллисекундный кадр, хотя можно использовать кадр любой другой длины. Для сигнала диапазона высоких частот, дискретизированного на 7 кГц, каждый кадр имеет 140 выборок. Если такой кадр разделить на пять подкадров равной длины, каждый подкадр будет иметь 28 выборок, и окно, показанное на фиг. 23a, будет иметь ширину 42 выборки. Для сигнала диапазона высоких частот, дискретизированного на 8 кГц, каждый кадр имеет 160 выборок. Если такой кадр разделить на пять подкадров равной длины, каждый подкадр будет иметь 32 выборки, и окно, показанное на фиг. 23a, будет иметь ширину 48 выборок. В других реализациях можно использовать подкадры любой ширины, и даже можно реализовать калькулятор коэффициента усиления A230 в диапазоне высоких частот, способный создавать разные коэффициенты усиления для разных выборок кадра.
На фиг. 24 показана блок-схема реализации B202 декодера B200 диапазона высоких частот. Декодер B202 диапазона высоких частот включает в себя генератор возбуждения B300 диапазона высоких частот, который способен создавать сигнал возбуждения S120 диапазона высоких частот на основании узкополосного сигнала возбуждения S80. В зависимости от конкретных выборов конструкции системы, генератор возбуждения B300 диапазона высоких частот можно реализовать согласно любой из описанных здесь реализаций генератора возбуждения A300 диапазона высоких частот. Обычно желательно реализовать генератор возбуждения B300 диапазона высоких частот, имеющий такую же характеристику, как генератор возбуждения диапазона высоких частот кодера диапазона высоких частот конкретной системы кодирования. Однако, поскольку узкополосный декодер B110 обычно осуществляет деквантование кодированного узкополосного сигнала возбуждения S50, в большинстве случаев можно реализовать генератор возбуждения B300 диапазона высоких частот, принимающий узкополосный сигнал возбуждения S80 от узкополосного декодера B110 и не обязательно включающий в себя обратный квантователь, способный деквантовать кодированный узкополосный сигнал возбуждения S50. Также можно реализовать узкополосный декодер B110, включающий в себя вариант фильтра 600 для устранения разряжения, способного фильтровать деквантованный узкополосный сигнал возбуждения прежде, чем он поступит на узкополосный синтезирующий фильтр, например фильтр 330.
Обратный квантователь 560 способен деквантовать параметры фильтра S60a диапазона высоких частот (в этом примере, в набор LSF), и преобразование LSF в коэффициенты LP-фильтра 570 способно преобразовывать LSF в набор коэффициентов фильтра (например, как описано выше со ссылкой на обратный квантователь 240 и преобразование 250 узкополосного кодера А122). В других реализациях, как отмечено выше, можно использовать разные наборы коэффициентов (например, коэффициенты косинусного преобразования Фурье) и/или представления коэффициентов (например, ISP). Синтезирующий фильтр В202 диапазона высоких частот способен создавать синтезированный сигнал диапазона высоких частот согласно сигналу возбуждения S120 диапазона высоких частот и набору коэффициентов фильтра. Для системы, в которой кодер диапазона высоких частот включает в себя синтезирующий фильтр (например, как в описанном выше примере кодера А202), может оказаться желательно реализовать синтезирующий фильтр В202 диапазона высоких частот, имеющий такую же характеристику (например, такую же передаточную функцию), как у синтезирующего фильтра.
Декодер В202 диапазона высоких частот также включает в себя обратный квантователь 580, способный деквантовать коэффициенты усиления S60b в диапазоне высоких частот, и элемент регулировки усиления 590 (например, умножитель или усилитель), способный и призванный применять деквантованные коэффициенты усиления к синтезированному сигналу диапазона высоких частот для создания сигнала S100 диапазона высоких частот. В случае, когда огибающая усиления кадра задана более чем одним коэффициентом усиления, элемент регулировки усиления 590 может включать в себя логику, способную применять коэффициенты усиления к соответствующим подкадрам, возможно, согласно вырезающей функции, которая может отличаться или не отличаться от вырезающей функции, применяемой калькулятором коэффициента усиления (например, калькулятором коэффициента усиления A230 в диапазоне высоких частот) соответствующего кодера диапазона высоких частот. В других реализациях декодера B202 диапазона высоких частот, элемент регулировки усиления 590 имеет аналогичную конфигурацию, но призван применять деквантованные коэффициенты усиления к узкополосному сигналу возбуждения S80 или к сигналу возбуждения S120 диапазона высоких частот.
Как отмечено выше, может оказаться желательно получать одно и то же состояние в кодере диапазона высоких частот и декодере диапазона высоких частот (например, с использованием деквантованных значений при кодировании). Таким образом, в системе кодирования согласно такой реализации, может оказаться желательно гарантировать одно и то же состояние для соответствующих генераторов шума в генераторах возбуждения A300 и B300 диапазона высоких частот. Например, генераторы возбуждения A300 и B300 диапазона высоких частот такой реализации могут иметь такую конфигурацию, что состояние генератора шума является детерминированной функцией информации, уже закодированной в том же кадре (например, узкополосных параметров фильтра S40 или их части и/или кодированного узкополосного сигнала возбуждения S50 или его части).
Один или несколько квантователей описанных здесь элементов (например, квантователь 230, 420 или 430) может быть способен осуществлять классифицированное векторное квантование. Например, такой квантователь может быть способен выбирать одну из набора кодовых книг на основании информации, уже закодированной в том же кадре на узкополосном канале и/или на канале диапазона высоких частот. Такая техника обычно обеспечивает повышение эффективности кодирования за счет хранения дополнительных кодовых книг.
Как описано выше, например, со ссылкой на фиг. 8 и 9, значительный объем периодической структуры может оставаться в остаточном сигнале после удаления грубой спектральной огибающей из узкополосного речевого сигнала S20. Например, остаточный сигнал может содержать последовательность приблизительно периодических импульсов или пиков во времени. Появление такой структуры, которая обычно связана с основным тоном, особенно вероятно в вокализованных речевых сигналах. Вычисление квантованного представления узкополосного остаточного сигнала может включать в себя кодирование этой структуры основного тона согласно модели долговременной периодичности, представленной, например, одной или несколькими кодовыми книгами.
Структура основного тона фактического остаточного сигнала может не точно совпадать с моделью периодичности. Например, остаточный сигнал может включать в себя небольшие флуктуации регулярности размещения импульсов основного тона, в результате чего расстояния между последовательными импульсами основного тона в кадре не точно равны, и структура не является вполне регулярной. Эти нерегулярности снижают эффективность кодирования.
Некоторые реализации узкополосного кодера A120 способны осуществлять регуляризацию структуры основного тона за счет применения адаптивного преобразования временного масштаба к остатку до или в ходе квантования или иного включения адаптивного преобразования временного масштаба в кодированный сигнал возбуждения. Например, такой кодер может быть способен выбирать или иначе вычислять степень трансформации во времени (например, согласно одному или нескольким критериям перцептивного взвешивания и/или минимизации ошибки), благодаря чему результирующий сигнал возбуждения оптимально согласуется с моделью долговременной периодичности. Регуляризация структуры основного тона осуществляется разновидностью кодеров CELP, именуемой кодерами на основе релаксационного линейного прогнозирования с кодовым возбуждением (RCELP).
Кодер RCELP обычно способен осуществлять преобразование временного масштаба в виде адаптивного временного сдвига. Этот временной сдвиг может представлять собой задержку в пределах от нескольких миллисекунд с отрицательным знаком до нескольких миллисекунд с положительным знаком и обычно изменяется плавно во избежание слышимых нарушений непрерывности. В некоторых реализациях, такой кодер способен применять регуляризацию в кусочно-линейном режиме, в котором каждый кадр или подкадр трансформируется с соответствующим фиксированным временным сдвигом. В других реализациях, кодер способен применять регуляризацию в виде непрерывной функции трансформации, в результате чего кадр или подкадр трансформируется согласно контуру основного тона (также именуемому траекторией основного тона). В ряде случаев (например, как описано в опубликованной патентной заявке США № 2004/0098255), кодер способен обеспечивать преобразование временного масштаба в кодированном сигнале возбуждения путем применения сдвига к перцептивно взвешенному входному сигналу, который используется для вычисления кодированного сигнала возбуждения.
Кодер вычисляет кодированный сигнал возбуждения, который регуляризуется и квантуется, и декодер деквантует кодированный сигнал возбуждения для получения сигнала возбуждения, который используется для синтеза декодированного речевого сигнала. Таким образом, декодированный выходной сигнал демонстрирует такую же изменяющуюся задержку, которая была внесена в кодированный сигнал возбуждения посредством регуляризации. Обычно на декодер не передается никакой информации, указывающей объемы регуляризации.
Регуляризация облегчает кодирование остаточного сигнала, что повышает эффективность кодирования из долгосрочного предсказателя и, таким образом, повышает общую эффективность кодирования, обычно без генерации искажений. Может оказаться желательно осуществлять регуляризацию только на вокализованных кадрах. Например, узкополосный кодер A124 может быть способен сдвигать только те кадры или подкадры, которые имеют долговременную структуру, например вокализованные сигналы. Также может оказаться желательно осуществлять регуляризацию только на подкадрах, которые включают в себя энергию импульсов основного тона. Различные реализации кодирования RCELP описаны в патентах США № 5,704,003 (Kleijn и др.) и 6,879,955 (Rao) и в опубликованной патентной заявке США № 2004/0098255 (Kovesi и др.). Существующие реализации кодеров RCELP включают в себя Enhanced Variable Rate Codec (EVRC), описанный в Telecommunications Industry Association (TIA) IS-127, и Third Generation Partnership Project 2 (3GPP2) Selectable Mode Vocoder (SMV).
К сожалению, регуляризация может создавать проблемы для широкополосного речевого кодера, в котором возбуждение в диапазоне высоких частот получается из кодированного узкополосного сигнала возбуждения (например, система, включающая в себя широкополосный речевой кодер A100 и широкополосный речевой декодер B100). В силу того, что он выводится из сигнала с трансформированной временной шкалой, сигнал возбуждения диапазона высоких частот обычно имеет иной временной профиль, чем исходный речевой сигнал диапазона высоких частот. Иными словами, сигнал возбуждения диапазона высоких частот выпадает из синхронизма с исходным речевым сигналом диапазона высоких частот.
Рассогласование по времени между трансформированным сигналом возбуждения диапазона высоких частот и исходным речевым сигналом диапазона высоких частот может вызвать ряд проблем. Например, трансформированный сигнал возбуждения диапазона высоких частот уже не может обеспечивать подходящее исходное возбуждение для синтезирующего фильтра, который настроен согласно параметрам фильтра, извлеченным из исходного речевого сигнала диапазона высоких частот. В результате, синтезированный сигнал диапазона высоких частот может содержать слышимые искажения, которые снижают воспринимаемое качество декодированного широкополосного речевого сигнала.
Рассогласование по времени также может приводить к снижению эффективности кодирования огибающей усиления. Как отмечено выше, с высокой степенью вероятности существует корреляция между временными огибающими узкополосного сигнала возбуждения S80 и сигналом S30 диапазона высоких частот. Благодаря кодированию огибающей усиления сигнала диапазона высоких частот согласно соотношению между этими двумя временными огибающими, можно реализовать повышение эффективности кодирования по сравнению с кодированием непосредственно огибающей усиления. Однако, благодаря регуляризации кодированного узкополосного сигнала возбуждения, эту корреляцию можно ослабить. Рассогласование по времени между узкополосным сигналом возбуждения S80 и сигналом S30 диапазона высоких частот может привести к появлению флуктуаций коэффициентов усиления S60b в диапазоне высоких частот и падению эффективности кодирования.
Варианты осуществления включают в себя способы широкополосного речевого кодирования, которые предусматривают осуществление преобразования временного масштаба речевого сигнала диапазона высоких частот согласно преобразованию временного масштаба, включенного в соответствующий кодированный узкополосный сигнал возбуждения. Потенциальные преимущества таких способов включают в себя повышение качества декодированного широкополосного речевого сигнала и/или повышение эффективности кодирования огибающей усиления в диапазоне высоких частот.
На фиг. 25 показана блок-схема реализации AD10 широкополосного речевого кодера A100. Кодер AD10 включает в себя реализацию A124 узкополосного кодера A120, который способен осуществлять регуляризацию в ходе вычисления кодированного узкополосного сигнала возбуждения S50. Например, узкополосный кодер A124 может быть настроен согласно одному или нескольким из рассмотренных выше реализаций RCELP.
Узкополосный кодер A124 также способен выводить сигнал SD10 данных регуляризации, который указывает степень применяемого преобразования временного масштаба. Для различных случаев, когда узкополосный кодер A124 способен применять фиксированный временной сдвиг к каждому кадру или подкадру, сигнал SD10 данных регуляризации может включать в себя ряд значений, указывающих величину каждого временного сдвига как целое или нецелое значение, выраженное в выборках, миллисекундах или другом приращении времени. В случае, когда узкополосный кодер A124 способен иначе изменять временную шкалу кадра или другой последовательности выборок (например, сжимая одну часть и растягивая другую часть), сигнал SD10 информации регуляризации может включать в себя соответствующее описание изменения, например набор параметров функции. В одном конкретном примере, узкополосный кодер A124 способен делить кадр на три подкадра и вычислять фиксированный временной сдвиг для каждого подкадра, поэтому сигнал SD10 данных регуляризации указывает три величины временного сдвига для каждого регуляризованного кадра кодированного узкополосного сигнала.
Широкополосный речевой кодер AD10 включает в себя линию задержки D120, способную обеспечивать опережение или отставание частей речевого сигнала S30 диапазона высоких частот, согласно величинам задержки, указанным во входном сигнале, для создания речевого сигнала S30a диапазона высоких частот с трансформированной временной шкалой. В примере, показанном на фиг. 25, линия задержки D120 способна трансформировать временную шкалу речевого сигнала S30 диапазона высоких частот согласно трансформации, указанной в сигнале SD10 данных регуляризации. Таким образом, преобразование временного масштаба той же величины, которая была включена в кодированный узкополосный сигнал возбуждения S50, применяется к соответствующей части речевого сигнала S30 диапазона высоких частот до анализа. Хотя в этом примере линия задержки D120 показана как элемент, отдельный от кодера A200 диапазона высоких частот, в других реализациях линия задержки D120 обеспечена как часть кодера диапазона высоких частот.
Другие реализации кодера A200 диапазона высоких частот могут быть способны осуществлять спектральный анализ (например, анализ LPC) нетрансформированного речевого сигнала S30 диапазона высоких частот и осуществлять преобразование временного масштаба речевого сигнала S30 диапазона высоких частот до вычисления параметров усиления S60b диапазона высоких частот. Такой кодер может включать в себя, например, реализацию линии задержки D120, призванной осуществлять преобразование временного масштаба. В таких случаях, однако, параметры фильтра S60a диапазона высоких частот, основанные на анализе нетрансформированного сигнала S30, могут описывать спектральную огибающую, рассогласованную по времени с сигналом возбуждения S120 диапазона высоких частот.
Линия задержки D120 может быть настроена согласно любой комбинации логических элементов и элементов хранения, пригодной для применения нужных операций преобразования временного масштаба к речевому сигналу S30 диапазона высоких частот. Например, линия задержки D120 может быть способна считывать речевой сигнал S30 диапазона высоких частот из буфера согласно нужным временным сдвигам. На фиг. 26a показана схема такой реализации D122 линии задержки D120, которая включает в себя сдвиговый регистр SR1. Сдвиговый регистр SR1 это буфер некоторой длины m, который способен принимать и сохранять m самых последних выборок речевого сигнала S30 диапазона высоких частот. Значение m равно, по меньшей мере, сумме максимальных поддерживаемых положительного ("опережение") и отрицательного ("отставание") временных сдвигов. Может оказаться удобно, чтобы значение m было равно длине кадра или подкадра сигнала S30 диапазона высоких частот.
Линия задержки D122 способна выводить сигнал S30a диапазона высоких частот с трансформированной временной шкалой из ячейки смещения OL сдвигового регистра SR1. Позиция ячейка смещения OL варьируется относительно опорной позиции (нулевого временного сдвига) согласно текущему временному сдвигу, указанному, например, сигналом SD10 данных регуляризации. Линия задержки D122 может быть способна поддерживать равные пределы опережения и отставания или, альтернативно, один предел больше другого, в результате чего в одном направлении может осуществлять больший сдвиг, чем в другом. На фиг. 26a показан конкретный пример, где временной сдвиг в положительном направлении больше, чем в отрицательном. Линия задержки D122 может быть способна выводить одновременно одну или несколько выборок (в зависимости, например, от ширины выходной шины).
Временной сдвиг регуляризации, имеющий величину свыше нескольких миллисекунд, может приводить к слышимым искажениям в декодированном сигнале. Обычно величина временного сдвига регуляризации, осуществляемого узкополосным кодером A124, не превышает нескольких миллисекунд, поэтому временные сдвиги, указанные в сигнале данных регуляризации SD10, ограничены. Однако в таких случаях может оказаться желательным, чтобы линия задержки D122 была способна налагать максимальное ограничение на временные сдвиги в положительном и/или отрицательном направлении (например, для обеспечения более жесткого ограничения, чем налагаемое узкополосным кодером).
На фиг. 26b показана схема реализации D124 линии задержки D122, которая включает в себя окно сдвига SW. В этом примере, позиция ячейки смещения OL ограничивается окном сдвига SW. Хотя на фиг. 26b показан случай, когда длина буфера m больше ширины окна сдвига SW, линию задержки D124 также можно реализовать с шириной окна сдвига SW равной m.
В других реализациях, линия задержки D120 способна записывать речевой сигнал S30 диапазона высоких частот в буфер согласно нужным временным сдвигам. На фиг. 27 показана схема такой реализации D130 линии задержки D120, которая включает в себя два сдвиговых регистра SR2 и SR3, способных принимать и сохранять речевой сигнал S30 диапазона высоких частот. Линия задержки D130 способна записывать кадр или подкадр из сдвигового регистра SR2 в сдвиговый регистр SR3 согласно временному сдвигу, указанному, например, в сигнале SD10 данных регуляризации. Сдвиговый регистр SR3 организован как буфер FIFO, призванный выводить сигнал S30а диапазона высоких частот с трансформированной временной шкалой.
В конкретном примере, показанном на фиг.27, сдвиговый регистр SR2 включает в себя участок кадрового буфера FBI и участок буфера задержки DB, и сдвиговый регистр SR3 включает в себя участок кадрового буфера FB2, участок опережающего буфера АВ и участок отстающего буфера RB. Длины опережающего буфера АВ и отстающего буфера RB могут быть равны, или один может быть больше другого, в результате чего в одном направлении поддерживается больший сдвиг, чем в другом. Буфер задержки DB и участок отстающего буфера RB могут быть иметь одинаковую длину. Альтернативно, буфер задержки DB можно сделать короче отстающего буфера RB для учета интервала времени, необходимого для переноса выборок из кадрового буфера FBI в сдвиговый регистр SR3, который может включать в себя другие операции обработки, например трансформацию выборок до сохранения в сдвиговом регистре SR3.
В примере, приведенном на фиг.27, кадровый буфер FBI способен иметь длину, равную длине одного кадра сигнала S30 диапазона высоких частот. В другом примере, кадровый буфер FBI способен иметь длину, равную длине одного подкадра сигнала S30 диапазона высоких частот. В таком случае, линия задержки D130 может быть способна включать в себя логику для применения одинаковой (например, средней) задержки ко всем подкадрам сдвигаемого кадра. Линия задержки D130 также может включать в себя логику для усреднения значений из кадрового буфера FBI со значениями, подлежащими перезаписи в отстающий буфер RB или опережающий буфер АВ. В еще одном примере, сдвиговый регистр SR3 может быть способен принимать значения сигнала S30 диапазона высоких частот только через кадровый буфер FB1, и, в таком случае, линия задержки D130 может включать в себя логику для интерполяции по зазорам между последовательными кадрами или подкадрами, записанными в сдвиговый регистр SR3. В других реализациях, линия задержки D130 может быть способна осуществлять операцию трансформации на выборках из кадрового буфера FB1 до записи их в сдвиговый регистр SR3 (например, согласно функции, описанной сигналом SD10 данных регуляризации).
Может оказаться желательно, чтобы линия задержки D120 применяла преобразование временного масштаба, основанное на, но не идентичное, трансформации, заданной сигналом SD10 данных регуляризации. На фиг. 28 показана блок-схема реализации AD12 широкополосного речевого кодера AD10, который включает в себя блок D110 отображения значений задержки. Блок D110 отображения значений задержки способен отображать трансформацию, указанную в сигнале SD10 данных регуляризации, в отображенные значения задержки SD10a. Линия задержки D120 призвана создавать речевой сигнал S30a диапазона высоких частот с трансформированной временной шкалой согласно трансформации, указанной отображенными значениям задержки SD10a.
Временной сдвиг, применяемый узкополосным кодером, предположительно, развивается плавно по времени. Поэтому обычно бывает достаточно вычислить средний узкополосный временной сдвиг, применяемый к подкадрам на протяжении кадра речи, и сдвинуть соответствующий кадр речевого сигнала S30 диапазона высоких частот согласно этому среднему значению. В одном таком примере, блок D110 отображения значений задержки способен вычислять среднее для значений задержки подкадров для каждого кадра, и линия задержки D120 способна применять вычисленное среднее к соответствующему кадру сигнала S30 диапазона высоких частот. В других примерах, можно вычислять и применять среднее по более короткому периоду (например, двум подкадрам или половине кадра) или более долгому периоду (например, двум кадрам). В случае, когда среднее является нецелым количеством выборок, блок D110 отображения значений задержки может быть способен округлять значение до целого количества выборок прежде, чем вывести его на линию задержки D120.
Узкополосный кодер A124 может быть способен включать в себя временной сдвиг регуляризации, равный нецелому количеству выборок в кодированном узкополосном сигнале возбуждения. В таком случае, может оказаться желательно, чтобы блок D110 отображения значений задержки был способен округлять узкополосный временной сдвиг до целого количества выборок и чтобы линия задержки D120 применяла округленный временной сдвиг к речевому сигналу S30 диапазона высоких частот.
В некоторых реализациях широкополосного речевого кодера AD10, частоты дискретизации узкополосного речевого сигнала S20 и речевого сигнала S30 диапазона высоких частот могут отличаться. В таких случаях, блок D110 отображения значений задержки может быть способен регулировать величины временного сдвига, указанные в сигнале SD10 данных регуляризации для учета разности между частотами дискретизации узкополосного речевого сигнала S20 (или узкополосного сигнала возбуждения S80) и речевого сигнала S30 диапазона высоких частот. Например, блок D110 отображения значений задержки может быть способен масштабировать величины временного сдвига согласно отношению частот дискретизации. В одном конкретном примере, как отмечено выше, узкополосный речевой сигнал S20 дискретизирован на 8 кГц, и речевой сигнал S30 диапазона высоких частот дискретизирован на 7 кГц. В этом случае, блок D110 отображения значений задержки способен изменять величину каждого сдвига на 7/8. Реализации блока D110 отображения значений задержки также могут быть способны осуществлять такую операцию масштабирования совместно с округлением до целого и/или описанную здесь операцию усреднения временного сдвига.
В еще одной реализации, линия задержки D120 способна иначе изменять временную шкалу кадра или другой последовательности выборок (например, сжимая одну часть и растягивая другую часть). Например, узкополосный кодер A124 может быть способен осуществлять регуляризацию согласно такой функции, как контур или траектория основного тона. В таком случае, сигнал SD10 данных регуляризации может включать в себя соответствующее описание функции, например набор параметров, и линия задержки D120 может включать в себя логику, способную трансформировать кадры или подкадры речевого сигнала S30 диапазона высоких частот согласно функции. В других реализациях, блок отображения значений задержки D110 способен усреднять, масштабировать и/или округлять функцию до ее применения к речевому сигналу S30 диапазона высоких частот линией задержки D120. Например, блок D110 отображения значений задержки может быть способен вычислять одно или несколько значений задержки согласно функции, причем каждое значение задержки указывает количество выборок, которые затем применяются линией задержки D120 для трансформации временного масштаба одного или нескольких соответствующих кадров или подкадров речевого сигнала S30 диапазона высоких частот.
На фиг. 29 показана логическая блок-схема способа MD100 преобразования временного масштаба речевого сигнала диапазона высоких частот согласно преобразованию временного масштаба, включенному в соответствующий кодированный узкополосный сигнал возбуждения. Задача TD100 обрабатывает широкополосный речевой сигнал для получения узкополосного речевого сигнала и речевого сигнала диапазона высоких частот. Например, задача TD100 может быть способна фильтровать широкополосный речевой сигнал с использованием гребенки фильтров, имеющей фильтры нижних и верхних частот, например реализации гребенки фильтров A110. Задача TD200 кодирует узкополосный речевой сигнал в, по меньшей мере, кодированный узкополосный сигнал возбуждения и совокупность параметров узкополосного фильтра. Кодированный узкополосный сигнал возбуждения и/или параметры фильтра могут быть квантованными, и кодированный узкополосный речевой сигнал также может включать в себя другие параметры, например параметр речевого режима. Задача TD200 также включает в себя преобразование временного масштаба в кодированном узкополосном сигнале возбуждения.
Задача TD300 генерирует сигнал возбуждения диапазона высоких частот на основании узкополосного сигнала возбуждения. В этом случае, узкополосный сигнал возбуждения основан на кодированном узкополосном сигнале возбуждения. Согласно, по меньшей мере, сигналу возбуждения диапазона высоких частот, задача TD400 кодирует речевой сигнал диапазона высоких частот в, по меньшей мере, совокупность параметров фильтра диапазона высоких частот. Например, задача TD400 может быть способна кодировать речевой сигнал диапазона высоких частот в совокупность квантованных LSF. Задача TD500 применяет временной сдвиг к речевому сигналу диапазона высоких частот, который основан на информации, связанной с преобразованием временного масштаба, включенным в кодированный узкополосный сигнал возбуждения.
Задача TD400 может быть способна осуществлять спектральный анализ (например, анализ LPC) на речевом сигнале диапазона высоких частот, и/или вычислять огибающую усиления речевого сигнала диапазона высоких частот. В таких случаях, задача TD500 может быть способна применять временной сдвиг к речевому сигналу диапазона высоких частот до анализа и/или вычисления огибающей усиления.
Другие реализации широкополосного речевого кодера A100 способны обращать преобразование временного масштаба сигнала возбуждения S120 диапазона высоких частот, обусловленного преобразованием временного масштаба, включенным в кодированный узкополосный сигнал возбуждения. Например, можно реализовать генератор возбуждения A300 диапазона высоких частот, включающий в себя реализацию линии задержки D120, которая способна принимать сигнал SD10 данных регуляризации или отображенные значения задержки SD10a и применять соответствующий обратный временной сдвиг к узкополосному сигналу возбуждения S80 и/или к последующему сигналу на его основе, например гармонически расширенному сигналу S160 или сигналу возбуждения S120 диапазона высоких частот.
Дополнительные реализации широкополосного речевого кодера могут быть способны кодировать узкополосный речевой сигнал S20 и речевой сигнал S30 диапазона высоких частот независимо друг от друга, в результате чего речевой сигнал S30 диапазона высоких частот кодируется как представление спектральной огибающей в диапазоне высоких частот и сигнала возбуждения диапазона высоких частот. Такая реализация может быть способна осуществлять преобразование временного масштаба остаточного сигнала диапазона высоких частот или иначе включать преобразование временного масштаба в кодированный сигнал возбуждения диапазона высоких частот, согласно информации, связанной с преобразованием временного масштаба, включенным в кодированный узкополосный сигнал возбуждения. Например, кодер диапазона высоких частот может включать в себя реализацию описанных здесь линии задержки D120 и/или блока D110 отображения значений задержки, которые способны применять преобразование временного масштаба к остаточному сигналу диапазона высоких частот. Потенциальные преимущества такой операции включают в себя более эффективное кодирование остаточного сигнала диапазона высоких частот и лучшее совпадение между синтезированными узкополосным и речевыми сигналами диапазона высоких частот.
Как отмечено выше, описанные здесь варианты осуществления включают в себя реализации, которые можно использовать для осуществления встроенного кодирования, поддержки совместимости с узкополосными системами и избавления необходимости в перекодировании. Поддержка кодирования в диапазоне высоких частот также может служить для дифференциации, в зависимости от стоимости, между микросхемами, наборами микросхем, устройствами и/или сетями, имеющими широкополосную поддержку с обратной совместимостью, и имеющими только узкополосную поддержку. Описанную здесь поддержку кодирования в диапазоне высоких частот также можно использовать совместно с техникой для поддержки кодирования в диапазона низких частот, и система, способ или устройство согласно такому вариант осуществления может поддерживать кодирование частотных составляющих от, например, около 50 или 100 Гц до около 7 или 8 кГц.
Как отмечено выше, добавление поддержки диапазона высоких частот к речевому кодеру может повысить разборчивость речи, особенно в отношении различения фрикативных звуков. Хотя слушатель-человек обычно может различать такие звуки на основании конкретного контекста, поддержка диапазона высоких частот может служить мощным вспомогательным средством в распознавании речи и других приложениях машинной интерпретации, например системах для автоматической навигации по голосовому меню и/или автоматической обработке вызова.
Устройство согласно варианту осуществления можно встроить в портативное устройство беспроводной связи, например сотовый телефон или карманный персональный компьютер (PDA). Альтернативно, такое устройство может входить в состав другого устройства связи, например телефонной трубки VoIP, персонального компьютера, способного поддерживать связь по стандарту VoIP, или сетевого устройства, способного маршрутизировать телефонные или VoIP вызовы. Например, устройство согласно варианту осуществления можно реализовать в виде микросхемы или набора микросхем для устройства связи. В зависимости от конкретного применения, такое устройство также может включать в себя такие особенности, как аналого-цифровое и/или цифроаналоговое преобразование речевого сигнала, схему для осуществления усиления и/или другой операции обработки сигнала на речевом сигнале и/или радиочастотную схему для передачи и/или приема кодированного речевого сигнала.
Мы в явном виде предполагаем, что варианты осуществления могут включать в себя и/или использовать одну или несколько других особенностей, раскрытых в предварительных патентных заявках США №№60/667,901 и 60/673,965 (сейчас публикации U.S. №2006/0282263, 2007/0088558, 2007/0088541, 2006/0277042, 2007/0088542, 2006/0277038, 2006/0271356 и 2008/0126086), приоритет которых испрашивает настоящая заявка. Такие особенности включают в себя удаление высокоэнергичных импульсов малой длительности, которые возникают в верхнем диапазоне и, по существу, отсутствуют в узком диапазоне. Такие особенности включают в себя фиксированное или адаптивное сглаживание представлений коэффициентов, например LSF диапазона высоких частот. Такие особенности включают в себя фиксированное или адаптивное преобразование формы шума, связанного с квантованием представлений коэффициентов, например LSF. Такие особенности также включают в себя фиксированное или адаптивное сглаживание огибающей усиления и адаптивное ослабление огибающей усиления.
Вышеприведенное представление описанных вариантов осуществления обеспечено для того, чтобы специалисты в данной области могли использовать настоящее изобретение. Возможны различные модификации этих вариантов осуществления, и представленные здесь общие принципы применимы и к другим вариантам осуществления. Например, вариант осуществления можно реализовать полностью или частично в виде электронной схемы, в виде конфигурации схем, скомпонованной на специализированной интегральной схеме, или в виде программно-аппаратного обеспечения, загруженного в энергонезависимое запоминающее устройство, или программного обеспечения, загружаемого из или на носитель данных в виде машинно-считываемого кода, причем такой код представляет собой команды, выполняемые матрицей логических элементов, например микропроцессором или другим блоком цифровой обработки сигнала. Носитель данных может представлять собой матрицу элементов хранения, например полупроводниковое ЗУ (которое может включать в себя, без ограничения, динамическое или статическое ОЗУ (оперативное ЗУ), ПЗУ (постоянное ЗУ), и/или флэш-память), или сегнетоэлектрическое ЗУ, магниторезистивное ЗУ, ЗУ на аморфных полупроводниках, полимерное ЗУ или ЗУ на основе фазовых переходов; или дисковый носитель, например магнитный или оптический диск. Термин "программное обеспечение" следует понимать в смысле, включающем в себя исходный код, код на языке ассемблера, машинный код, двоичный код, зашитую программу, макрокод, микрокод, один или несколько наборов или последовательностей команд, выполняемых матрицей логических элементов, и любую комбинацию таких примеров.
Различные элементы реализации генераторов возбуждения A300 и В300 диапазона высоких частот, кодера А200 диапазона высоких частот, декодера B200 диапазона высоких частот, широкополосного речевого кодера A100 и широкополосного речевого декодера B100 можно реализовать в виде электронных и/или оптических устройств, размещенных, например, на одной и той же микросхеме или на двух или более микросхемах в наборе микросхем, хотя возможны и другие конфигурации без такого ограничения. Один или несколько элементов такого устройства можно реализовать полностью или частично в виде одного или нескольких наборов команд, предназначенных для выполнения на одной или нескольких фиксированных или программируемых матрицах логических элементов (например, транзисторов, вентилей), например микропроцессорах, встроенных процессорах, основных услугах IP, цифровых сигнальных процессорах, FPGA (вентильных матрицах, программируемых пользователем), ASSP (специализированных стандартных продуктах) и ASIC (специализированных интегральных схемах). Один или несколько таких элементов также могут быть объединены в общую структуру (например, процессор, используемый для выполнения частей кода, соответствующих разным элементам, в разное время, набор команд, выполняемых для осуществления задач, соответствующих разным элементам, в разное время, или конфигурацию электронных и/или оптических устройств, осуществляющих операции для разных элементов в разное время). Кроме того, один или несколько таких элементов можно использовать для осуществления задач или выполнения других наборов команд, которые непосредственно не связаны с работой устройства, например задачи, относящейся к другой операции устройства или системы, в которую встроено устройство.
На фиг. 30 показана логическая блок-схема способа M100, согласно варианту осуществления, кодирования части речевого сигнала диапазона высоких частот, имеющего узкополосную часть и часть в диапазоне высоких частот. Задача X100 вычисляет набор параметров фильтра, характеризующих спектральную огибающую части в диапазоне высоких частот. Задача X200 вычисляет спектрально расширенный сигнал путем применения нелинейной функции к сигналу, полученному из узкополосной части. Задача X300 генерирует синтезированный сигнал диапазона высоких частот согласно (A) набору параметров фильтра и (B) сигналу возбуждения диапазона высоких частот, основанному на спектрально расширенном сигнале. Задача X400 вычисляет огибающую усиления на основании соотношения между (C) энергией части в диапазоне высоких частот и (D) энергией сигнала, полученного из узкополосной части.
На фиг. 31a показана логическая блок-схема способа M200 генерации сигнала возбуждения диапазона высоких частот согласно варианту осуществления. Задача Y100 вычисляет гармонически расширенный сигнал путем применения нелинейной функции к узкополосному сигналу возбуждения, полученному из узкополосной части речевого сигнала. Задача Y200 смешивает гармонически расширенный сигнал с модулированным шумовым сигналом для генерации сигнала возбуждения диапазона высоких частот. На фиг. 31b показана логическая блок-схема способа M210 генерации сигнала возбуждения диапазона высоких частот согласно другому варианту осуществления, включающего в себя задачи Y300 и Y400. Задача Y300 вычисляет огибающую во временном измерении в виде распределения энергии по времени для одного из узкополосного сигнала возбуждения и гармонически расширенного сигнала. Задача Y400 модулирует шумовой сигнал согласно огибающей во временном измерении для создания модулированного шумового сигнала.
На фиг. 32 показана логическая блок-схема способа M300 согласно варианту осуществления, декодирования части речевого сигнала диапазона высоких частот, имеющего узкополосную часть и часть в диапазоне высоких частот. Задача Z100 принимает набор параметров фильтра, характеризующих спектральную огибающую части в диапазоне высоких частот, и набор коэффициентов усиления, характеризующих временную огибающую части в диапазоне высоких частот. Задача Z200 вычисляет спектрально расширенный сигнал путем применения нелинейной функции к сигналу, полученному из узкополосной части. Задача Z300 генерирует синтезированный сигнал диапазона высоких частот согласно (A) набору параметров фильтра и (B) сигналу возбуждения диапазона высоких частот, основанному на спектрально расширенном сигнале. Задача Z400 модулирует огибающую усиления синтезированного сигнала диапазона высоких частот на основании набора коэффициентов усиления. Например, задача Z400 может быть способна модулировать огибающую усиления синтезированного сигнала диапазона высоких частот путем применения набора коэффициентов усиления к сигналу возбуждения, полученному из узкополосной части, к спектрально расширенному сигналу, к сигналу возбуждения диапазона высоких частот или к синтезированному сигналу диапазона высоких частот.
Варианты осуществления также включают в себя дополнительные способы речевого кодирования, кодирования и декодирования, отчетливо раскрытые здесь, например, посредством описаний структурных вариантов осуществления, способных осуществлять такие способы. Каждый из этих способов также может быть материально реализован (например, на одном или нескольких из вышеперечисленных носителей данных) в виде одного или нескольких наборов команд, считываемых и/или выполняемых машиной, включая матрицу логических элементов (например, процессор, микропроцессор, микроконтроллер или другой конечный автомат). Таким образом, настоящее изобретение не предусматривает ограничение вышеописанными вариантами осуществления, но подлежит рассмотрению в широчайшем объеме, согласующемся с принципами и новыми признаками, раскрытыми здесь любым образом, в том числе в приложенной формуле изобретения, которая составляет часть первоначального раскрытия.

Claims (31)

1. Способ кодирования части речевого сигнала диапазона высоких частот, имеющего узкополосную часть и часть в диапазоне высоких частот, содержащий этапы, на которых
вычисляют набор параметров фильтра, характеризующих спектральную огибающую части в диапазоне высоких частот,
вычисляют спектрально расширенный сигнал путем расширения спектра сигнала, полученного из узкополосной части, и
вычисляют огибающую усиления на основании соотношения между частью в диапазоне высоких частот и сигналом, основанным на узкополосной части.
2. Способ по п.1, в котором на этапе расширения спектра сигнала, полученного из узкополосной части, применяют нелинейную функцию к сигналу.
3. Способ по любому из п.1 или 2, в котором упомянутое соотношение является соотношением между энергией части в диапазоне высоких частот и энергией сигнала, основанного на узкополосной части.
4. Способ по п.1, содержащий этапы, на которых генерируют сигнал возбуждения диапазона высоких частот, основанный на спектрально расширенном сигнале, и генерируют синтезированный сигнал диапазона высоких частот согласно набору параметров фильтра и сигналу возбуждения диапазона высоких частот, и
в котором сигнал, основанный на узкополосной части, является синтезированным сигналом диапазона высоких частот.
5. Способ по п.1, содержащий этап, на котором генерируют сигнал возбуждения диапазона высоких частот посредством смешивания гармонически расширенного сигнала, основанного на спектрально расширенном сигнале, и модулированного шумового сигнала.
6. Способ по п.5, в котором этап, на котором генерируют сигнал возбуждения диапазона высоких частот, заключается в том, что
вычисляют огибающую во временном измерении одного сигнала из гармонически расширенного сигнала и узкополосного сигнала возбуждения, полученного из узкополосной части; и
модулируют по амплитуде шумовой сигнал в соответствии с огибающей во временном измерении для получения модулированного шумового сигнала.
7. Способ по любому из пп.5 или 6, в котором сигнал, основанный на узкополосной части, является одним из узкополосного сигнала возбуждения, сигнала возбуждения диапазона высоких частот и синтезированного сигнала диапазона высоких частот.
8. Способ по п.1, в котором сигнал, основанный на узкополосной части, является одним из узкополосного сигнала возбуждения, сигнала возбуждения диапазона высоких частот и синтезированного сигнала диапазона высоких частот.
9. Способ по п.1, в котором сигнал, основанный на узкополосной части, является основанным на узкополосном сигнале возбуждения, полученном из узкополосной части.
10. Способ по п.1, в котором расширение спектра сигнала, полученного из узкополосной части, заключается в том, что расширяют спектр сигнала в диапазон частот части диапазона высоких частот.
11. Способ по п.1, содержащий этап, на котором создают поток параметров кодирования диапазона высоких частот, включающих в себя набор параметров фильтра и набор коэффициентов усиления.
12. Способ по п.1, в котором на этапе вычисления огибающей усиления вычисляют набор коэффициентов усиления, и
в котором каждый из набора коэффициентов усиления соответствует различному одному из серии последовательных подкадров кадра части диапазона высоких частот.
13. Способ по п.1, в котором этап вычисления набора коэффициентов усиления заключается в том, что для каждого из набора коэффициентов усиления вычисляют энергию соответствующего подкадра части диапазона высоких частот, используя вырезающую функцию, которая перекрывает соседние подкадры части диапазона высоких частот.
14. Способ обработки речевого сигнала, содержащий этапы, на которых
генерируют сигнал возбуждения диапазона высоких частот на основании узкополосного сигнала возбуждения,
генерируют синтезированный сигнал диапазона высоких частот на основании сигнала возбуждения диапазона высоких частот и кодированной спектральной огибающей речевого сигнала диапазона высоких частот и
вычисляют набор коэффициентов усиления на основании соотношения между речевым сигналом диапазона высоких частот и сигналом, основанным на узкополосном сигнале возбуждения,
причем каждый из набора коэффициентов усиления соответствует различному одному из серии последовательных подкадров кадра речевого сигнала диапазона высоких частот.
15. Способ по п.14, в котором каждый из набора коэффициентов усиления основан на соотношении между энергией соответствующего подкадра речевого сигнала диапазона высоких частот и энергией соответствующей части во временном измерении сигнала, основанного на узкополосном сигнале возбуждения.
16. Способ по п.14, в котором упомянутое соотношение является соотношением между речевым сигналом диапазона высоких частот и синтезированным сигналом диапазона высоких частот.
17. Способ по п.16, в котором каждый из набора коэффициентов усиления основан на соотношении между энергией соответствующего подкадра речевого сигнала диапазона высоких частот и энергией соответствующей части во временном измерении синтезированного сигнала диапазона высоких частот.
18. Способ по любому из пп.14 или 15, в котором сигнал, основанный на узкополосном сигнале возбуждения, является одним из узкополосного сигнала возбуждения, сигнала возбуждения диапазона высоких частот и синтезированного сигнала диапазона высоких частот.
19. Способ декодирования части речевого сигнала диапазона высоких частот, имеющего узкополосную часть и часть в диапазоне высоких частот, содержащий этапы, на которых
принимают набор параметров фильтра, характеризующих спектральную огибающую части в диапазоне высоких частот, и набор коэффициентов усиления, характеризующих временную огибающую части в диапазоне высоких частот,
вычисляют спектрально расширенный сигнал путем расширения спектра сигнала, который основан на узкополосном сигнале возбуждения, полученного из узкополосной части,
генерируют синтезированный сигнал диапазона высоких частот согласно (А) набору параметров фильтра и (В) сигналу возбуждения диапазона высоких частот на основании спектрально расширенного сигнала и
модулируют огибающую усиления синтезированного сигнала диапазона высоких частот согласно набору коэффициентов усиления.
20. Способ по п.19, в котором на этапе расширения спектра сигнала, основанного на узкополосном сигнале возбуждения, применяют нелинейную функцию к сигналу.
21. Способ по любому из пп.19 или 20, в котором на этапе модуляции огибающей усиления изменяют согласно набору коэффициентов усиления амплитуду с течением времени для, по меньшей мере, одного из сигнала, который основан на узкополосном сигнале возбуждения, спектрально расширенного сигнала, сигнала возбуждения диапазона высоких частот и синтезированного сигнала диапазона высоких частот.
22. Устройство, выполненное с возможностью кодирования речевого сигнала диапазона высоких частот в соответствии с информацией в узкополосном кодированном сигнале, содержащее
модуль анализа, выполненный с возможностью создания набора значений параметров, характеризующих спектральную огибающую речевого сигнала в диапазоне высоких частот,
генератор возбуждения диапазона высоких частот, выполненный с возможностью генерирования сигнала возбуждения диапазона высоких частот, основанного на спектрально расширенном сигнале, причем генератор возбуждения диапазона высоких частот включает в себя расширитель спектра, выполненный с возможностью вычисления спектрально расширенного сигнала путем расширения спектра узкополосного сигнала возбуждения, полученного из узкополосного кодированного сигнала, в диапазон частот части диапазона высоких частот, и
калькулятор коэффициента усиления, выполненный с возможностью вычисления огибающей усиления на основании соотношения, изменяющегося со временем, между речевым сигналом диапазона высоких частот и сигналом, основанным на узкополосном сигнале возбуждения.
23. Устройство по п.22, в котором расширитель спектра выполнен с возможностью расширения спектра узкополосного сигнала возбуждения путем применения нелинейной функции к сигналу.
24. Устройство по любому из пп.22 или 23, в котором соотношение, изменяющееся со временем, является соотношением, изменяющимся со временем, между энергией речевого сигнала диапазона высоких частот и энергией сигнала, основанного на узкополосном сигнале возбуждения.
25. Устройство по п.22, содержащее синтезирующий фильтр, выполненный с возможностью генерирования синтезированного сигнала диапазона высоких частот согласно сигналу возбуждения диапазона высоких частот и набору значений параметров, и
причем сигнал, основанный на узкополосном сигнале возбуждения, является синтезированным сигналом диапазона высоких частот.
26. Устройство по п.22, в котором калькулятор коэффициента усиления выполнен с возможностью вычисления огибающей усиления как набора коэффициентов усиления,
причем каждый из набора коэффициентов усиления основан на соотношении между энергией части во временном измерении речевого сигнала диапазона высоких частот и энергией соответствующей части во временном измерении синтезированного сигнала диапазона высоких частот.
27. Устройство по п.22, содержащее сотовый телефон.
28. Декодер речевого сигнала диапазона высоких частот, выполненный с возможностью приема набора параметров фильтра, характеризующих спектральную огибающую части речевого сигнала диапазона высоких частот, и узкополосного сигнала возбуждения, основанного на узкополосной части речевого сигнала, содержащий
генератор возбуждения диапазона высоких частот, выполненный с возможностью генерирования сигнала возбуждения диапазона высоких частот на основании спектрально расширенного сигнала, причем генератор возбуждения диапазона высоких частот включает в себя расширитель спектра, выполненный с возможностью вычисления спектрально расширенного сигнала путем расширения спектра узкополосного сигнала возбуждения,
синтезирующий фильтр, выполненный с возможностью генерирования синтезированного сигнала диапазона высоких частот согласно набору параметров фильтра и сигналу возбуждения диапазона высоких частот, и
элемент регулировки усиления, выполненный с возможностью модулирования огибающей усиления синтезированного сигнала диапазона высоких частот согласно набору коэффициентов усиления, характеризующих временную огибающую части в диапазоне высоких частот.
29. Декодер по п.28, в котором расширитель спектра выполнен с возможностью расширения спектра узкополосного сигнала возбуждения путем применения нелинейной функции к сигналу.
30. Декодер по п.28, в котором элемент регулировки усиления выполнен с возможностью модулирования огибающей усиления посредством изменения согласно набору коэффициентов усиления амплитуды с течением времени, по меньшей мере, одного из узкополосного сигнала возбуждения, спектрально расширенного сигнала, сигнала возбуждения диапазона высоких частот и синтезированного сигнала диапазона высоких частот.
31. Декодер по любому из пп.28-30, в котором элемент регулировки усиления содержит, по меньшей мере, один из умножителя и усилителя.
RU2007140383/09A 2005-04-01 2006-04-03 Способы и устройство кодирования и декодирования части речевого сигнала диапазона высоких частот RU2402826C2 (ru)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US66790105P 2005-04-01 2005-04-01
US60/667,901 2005-04-01
US67396505P 2005-04-22 2005-04-22
US60/673,965 2005-04-22

Publications (2)

Publication Number Publication Date
RU2007140383A RU2007140383A (ru) 2009-05-10
RU2402826C2 true RU2402826C2 (ru) 2010-10-27

Family

ID=36588741

Family Applications (9)

Application Number Title Priority Date Filing Date
RU2007140406/09A RU2390856C2 (ru) 2005-04-01 2006-04-03 Системы, способы и устройства для подавления высокополосных всплесков
RU2007140381/09A RU2386179C2 (ru) 2005-04-01 2006-04-03 Способ и устройство для кодирования речевых сигналов с расщеплением полосы
RU2007140382/09A RU2381572C2 (ru) 2005-04-01 2006-04-03 Системы, способы и устройство широкополосного речевого кодирования
RU2009131435/08A RU2491659C2 (ru) 2005-04-01 2006-04-03 Системы, способы и устройства для высокополосного предыскажения шкалы времени
RU2007140429/09A RU2387025C2 (ru) 2005-04-01 2006-04-03 Способ и устройство для векторного квантования спектрального представления огибающей
RU2007140383/09A RU2402826C2 (ru) 2005-04-01 2006-04-03 Способы и устройство кодирования и декодирования части речевого сигнала диапазона высоких частот
RU2007140394/09A RU2413191C2 (ru) 2005-04-01 2006-04-03 Системы, способы и устройства для устраняющей разреженность фильтрации
RU2007140365/09A RU2376657C2 (ru) 2005-04-01 2006-04-03 Системы, способы и устройства для высокополосного предыскажения шкалы времени
RU2007140426/09A RU2402827C2 (ru) 2005-04-01 2006-04-03 Системы, способы и устройство для генерирования возбуждения в диапазоне высоких частот

Family Applications Before (5)

Application Number Title Priority Date Filing Date
RU2007140406/09A RU2390856C2 (ru) 2005-04-01 2006-04-03 Системы, способы и устройства для подавления высокополосных всплесков
RU2007140381/09A RU2386179C2 (ru) 2005-04-01 2006-04-03 Способ и устройство для кодирования речевых сигналов с расщеплением полосы
RU2007140382/09A RU2381572C2 (ru) 2005-04-01 2006-04-03 Системы, способы и устройство широкополосного речевого кодирования
RU2009131435/08A RU2491659C2 (ru) 2005-04-01 2006-04-03 Системы, способы и устройства для высокополосного предыскажения шкалы времени
RU2007140429/09A RU2387025C2 (ru) 2005-04-01 2006-04-03 Способ и устройство для векторного квантования спектрального представления огибающей

Family Applications After (3)

Application Number Title Priority Date Filing Date
RU2007140394/09A RU2413191C2 (ru) 2005-04-01 2006-04-03 Системы, способы и устройства для устраняющей разреженность фильтрации
RU2007140365/09A RU2376657C2 (ru) 2005-04-01 2006-04-03 Системы, способы и устройства для высокополосного предыскажения шкалы времени
RU2007140426/09A RU2402827C2 (ru) 2005-04-01 2006-04-03 Системы, способы и устройство для генерирования возбуждения в диапазоне высоких частот

Country Status (24)

Country Link
US (8) US8244526B2 (ru)
EP (8) EP1864281A1 (ru)
JP (8) JP5129115B2 (ru)
KR (8) KR100956876B1 (ru)
CN (1) CN102411935B (ru)
AT (4) ATE492016T1 (ru)
AU (8) AU2006252957B2 (ru)
BR (8) BRPI0608270A2 (ru)
CA (8) CA2602806C (ru)
DE (4) DE602006017050D1 (ru)
DK (2) DK1864101T3 (ru)
ES (3) ES2636443T3 (ru)
HK (5) HK1113848A1 (ru)
IL (8) IL186438A (ru)
MX (8) MX2007012191A (ru)
NO (7) NO20075511L (ru)
NZ (6) NZ562183A (ru)
PL (4) PL1864282T3 (ru)
PT (2) PT1864282T (ru)
RU (9) RU2390856C2 (ru)
SG (4) SG161224A1 (ru)
SI (1) SI1864282T1 (ru)
TW (8) TWI319565B (ru)
WO (8) WO2006107833A1 (ru)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2490727C2 (ru) * 2011-11-28 2013-08-20 Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования "Уральский государственный университет путей сообщения" (УрГУПС) Способ передачи речевых сигналов (варианты)
RU2562771C2 (ru) * 2011-02-16 2015-09-10 Долби Лабораторис Лайсэнзин Корпорейшн Способы и системы генерирования коэффициентов фильтра и конфигурирования фильтров
RU2575389C2 (ru) * 2011-03-04 2016-02-20 Телефонактиеболагет Л М Эрикссон (Пабл) Коррекция коэффициента усиления после квантования при кодировании аудио
RU2599966C2 (ru) * 2011-02-18 2016-10-20 Нтт Докомо, Инк. Декодер речи, кодер речи, способ декодирования речи, способ кодирования речи, программа декодирования речи и программа кодирования речи
RU2604425C2 (ru) * 2013-02-15 2016-12-10 Хуавэй Текнолоджиз Ко., Лтд. Система и способ возбуждения смешанной кодовой книги для кодирования речи
US10460738B2 (en) 2016-03-15 2019-10-29 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Encoding apparatus for processing an input signal and decoding apparatus for processing an encoded signal

Families Citing this family (317)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7987095B2 (en) * 2002-09-27 2011-07-26 Broadcom Corporation Method and system for dual mode subband acoustic echo canceller with integrated noise suppression
US7619995B1 (en) * 2003-07-18 2009-11-17 Nortel Networks Limited Transcoders and mixers for voice-over-IP conferencing
JP4679049B2 (ja) * 2003-09-30 2011-04-27 パナソニック株式会社 スケーラブル復号化装置
US7668712B2 (en) * 2004-03-31 2010-02-23 Microsoft Corporation Audio encoding and decoding with intra frames and adaptive forward error correction
EP1744139B1 (en) * 2004-05-14 2015-11-11 Panasonic Intellectual Property Corporation of America Decoding apparatus and method thereof
JP4698593B2 (ja) * 2004-07-20 2011-06-08 パナソニック株式会社 音声復号化装置および音声復号化方法
CN101873267B (zh) * 2004-08-30 2012-10-24 高通股份有限公司 用于语音ip传输的自适应去抖动缓冲器
US8085678B2 (en) * 2004-10-13 2011-12-27 Qualcomm Incorporated Media (voice) playback (de-jitter) buffer adjustments based on air interface
US8155965B2 (en) * 2005-03-11 2012-04-10 Qualcomm Incorporated Time warping frames inside the vocoder by modifying the residual
US8355907B2 (en) * 2005-03-11 2013-01-15 Qualcomm Incorporated Method and apparatus for phase matching frames in vocoders
WO2006103488A1 (en) * 2005-03-30 2006-10-05 Nokia Corporation Source coding and/or decoding
TWI319565B (en) 2005-04-01 2010-01-11 Qualcomm Inc Methods, and apparatus for generating highband excitation signal
US9043214B2 (en) * 2005-04-22 2015-05-26 Qualcomm Incorporated Systems, methods, and apparatus for gain factor attenuation
DK1869671T3 (da) * 2005-04-28 2009-10-19 Siemens Ag Fremgangsmåde og anordning til stöjundertrykkelse
US7177804B2 (en) * 2005-05-31 2007-02-13 Microsoft Corporation Sub-band voice codec with multi-stage codebooks and redundant coding
US7707034B2 (en) * 2005-05-31 2010-04-27 Microsoft Corporation Audio codec post-filter
US7831421B2 (en) * 2005-05-31 2010-11-09 Microsoft Corporation Robust decoder
DE102005032724B4 (de) * 2005-07-13 2009-10-08 Siemens Ag Verfahren und Vorrichtung zur künstlichen Erweiterung der Bandbreite von Sprachsignalen
US20100131276A1 (en) * 2005-07-14 2010-05-27 Koninklijke Philips Electronics, N.V. Audio signal synthesis
WO2007013973A2 (en) * 2005-07-20 2007-02-01 Shattil, Steve Systems and method for high data rate ultra wideband communication
KR101171098B1 (ko) * 2005-07-22 2012-08-20 삼성전자주식회사 혼합 구조의 스케일러블 음성 부호화 방법 및 장치
US8326614B2 (en) * 2005-09-02 2012-12-04 Qnx Software Systems Limited Speech enhancement system
CA2558595C (en) * 2005-09-02 2015-05-26 Nortel Networks Limited Method and apparatus for extending the bandwidth of a speech signal
CN101273404B (zh) * 2005-09-30 2012-07-04 松下电器产业株式会社 语音编码装置以及语音编码方法
JP4954080B2 (ja) 2005-10-14 2012-06-13 パナソニック株式会社 変換符号化装置および変換符号化方法
JPWO2007043643A1 (ja) * 2005-10-14 2009-04-16 パナソニック株式会社 音声符号化装置、音声復号装置、音声符号化方法、及び音声復号化方法
JP4876574B2 (ja) * 2005-12-26 2012-02-15 ソニー株式会社 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体
EP1852848A1 (en) * 2006-05-05 2007-11-07 Deutsche Thomson-Brandt GmbH Method and apparatus for lossless encoding of a source signal using a lossy encoded data stream and a lossless extension data stream
US8949120B1 (en) 2006-05-25 2015-02-03 Audience, Inc. Adaptive noise cancelation
US8135047B2 (en) 2006-07-31 2012-03-13 Qualcomm Incorporated Systems and methods for including an identifier with a packet associated with a speech signal
US8260609B2 (en) * 2006-07-31 2012-09-04 Qualcomm Incorporated Systems, methods, and apparatus for wideband encoding and decoding of inactive frames
US8725499B2 (en) * 2006-07-31 2014-05-13 Qualcomm Incorporated Systems, methods, and apparatus for signal change detection
US8532984B2 (en) 2006-07-31 2013-09-10 Qualcomm Incorporated Systems, methods, and apparatus for wideband encoding and decoding of active frames
US7987089B2 (en) * 2006-07-31 2011-07-26 Qualcomm Incorporated Systems and methods for modifying a zero pad region of a windowed frame of an audio signal
US20080046236A1 (en) * 2006-08-15 2008-02-21 Broadcom Corporation Constrained and Controlled Decoding After Packet Loss
US8706507B2 (en) 2006-08-15 2014-04-22 Dolby Laboratories Licensing Corporation Arbitrary shaping of temporal noise envelope without side-information utilizing unchanged quantization
US8239190B2 (en) * 2006-08-22 2012-08-07 Qualcomm Incorporated Time-warping frames of wideband vocoder
US8046218B2 (en) * 2006-09-19 2011-10-25 The Board Of Trustees Of The University Of Illinois Speech and method for identifying perceptual features
JP4972742B2 (ja) * 2006-10-17 2012-07-11 国立大学法人九州工業大学 高域信号補間方法及び高域信号補間装置
EP4300825A3 (en) 2006-10-25 2024-03-20 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating time-domain audio samples
US8639500B2 (en) * 2006-11-17 2014-01-28 Samsung Electronics Co., Ltd. Method, medium, and apparatus with bandwidth extension encoding and/or decoding
KR101565919B1 (ko) 2006-11-17 2015-11-05 삼성전자주식회사 고주파수 신호 부호화 및 복호화 방법 및 장치
KR101375582B1 (ko) 2006-11-17 2014-03-20 삼성전자주식회사 대역폭 확장 부호화 및 복호화 방법 및 장치
US8005671B2 (en) * 2006-12-04 2011-08-23 Qualcomm Incorporated Systems and methods for dynamic normalization to reduce loss in precision for low-level signals
GB2444757B (en) * 2006-12-13 2009-04-22 Motorola Inc Code excited linear prediction speech coding
US20080147389A1 (en) * 2006-12-15 2008-06-19 Motorola, Inc. Method and Apparatus for Robust Speech Activity Detection
FR2911031B1 (fr) * 2006-12-28 2009-04-10 Actimagine Soc Par Actions Sim Procede et dispositif de codage audio
FR2911020B1 (fr) * 2006-12-28 2009-05-01 Actimagine Soc Par Actions Sim Procede et dispositif de codage audio
KR101379263B1 (ko) * 2007-01-12 2014-03-28 삼성전자주식회사 대역폭 확장 복호화 방법 및 장치
US7873064B1 (en) * 2007-02-12 2011-01-18 Marvell International Ltd. Adaptive jitter buffer-packet loss concealment
US8032359B2 (en) * 2007-02-14 2011-10-04 Mindspeed Technologies, Inc. Embedded silence and background noise compression
GB0704622D0 (en) * 2007-03-09 2007-04-18 Skype Ltd Speech coding system and method
KR101411900B1 (ko) * 2007-05-08 2014-06-26 삼성전자주식회사 오디오 신호의 부호화 및 복호화 방법 및 장치
US9653088B2 (en) * 2007-06-13 2017-05-16 Qualcomm Incorporated Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding
DK3591650T3 (da) 2007-08-27 2021-02-15 Ericsson Telefon Ab L M Fremgangsmåde og indretning til udfyldning af spektrale huller
FR2920545B1 (fr) * 2007-09-03 2011-06-10 Univ Sud Toulon Var Procede de trajectographie de plusieurs cetaces par acoustique passive
RU2449386C2 (ru) * 2007-11-02 2012-04-27 Хуавэй Текнолоджиз Ко., Лтд. Способ и устройство для аудиодекодирования
CA2704812C (en) * 2007-11-06 2016-05-17 Nokia Corporation An encoder for encoding an audio signal
WO2009059632A1 (en) * 2007-11-06 2009-05-14 Nokia Corporation An encoder
CN101896968A (zh) * 2007-11-06 2010-11-24 诺基亚公司 音频编码装置及其方法
KR101444099B1 (ko) * 2007-11-13 2014-09-26 삼성전자주식회사 음성 구간 검출 방법 및 장치
US8504377B2 (en) * 2007-11-21 2013-08-06 Lg Electronics Inc. Method and an apparatus for processing a signal using length-adjusted window
US8050934B2 (en) * 2007-11-29 2011-11-01 Texas Instruments Incorporated Local pitch control based on seamless time scale modification and synchronized sampling rate conversion
US8688441B2 (en) * 2007-11-29 2014-04-01 Motorola Mobility Llc Method and apparatus to facilitate provision and use of an energy value to determine a spectral envelope shape for out-of-signal bandwidth content
TWI356399B (en) * 2007-12-14 2012-01-11 Ind Tech Res Inst Speech recognition system and method with cepstral
KR101439205B1 (ko) * 2007-12-21 2014-09-11 삼성전자주식회사 오디오 매트릭스 인코딩 및 디코딩 방법 및 장치
WO2009084221A1 (ja) * 2007-12-27 2009-07-09 Panasonic Corporation 符号化装置、復号装置およびこれらの方法
KR101413968B1 (ko) * 2008-01-29 2014-07-01 삼성전자주식회사 오디오 신호의 부호화, 복호화 방법 및 장치
KR101413967B1 (ko) * 2008-01-29 2014-07-01 삼성전자주식회사 오디오 신호의 부호화 방법 및 복호화 방법, 및 그에 대한 기록 매체, 오디오 신호의 부호화 장치 및 복호화 장치
DE102008015702B4 (de) * 2008-01-31 2010-03-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zur Bandbreitenerweiterung eines Audiosignals
US8433582B2 (en) * 2008-02-01 2013-04-30 Motorola Mobility Llc Method and apparatus for estimating high-band energy in a bandwidth extension system
US20090201983A1 (en) * 2008-02-07 2009-08-13 Motorola, Inc. Method and apparatus for estimating high-band energy in a bandwidth extension system
WO2009116815A2 (en) * 2008-03-20 2009-09-24 Samsung Electronics Co., Ltd. Apparatus and method for encoding and decoding using bandwidth extension in portable terminal
US8983832B2 (en) * 2008-07-03 2015-03-17 The Board Of Trustees Of The University Of Illinois Systems and methods for identifying speech sound features
CA2729665C (en) * 2008-07-10 2016-11-22 Voiceage Corporation Variable bit rate lpc filter quantizing and inverse quantizing device and method
BRPI0904958B1 (pt) 2008-07-11 2020-03-03 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Aparelho e método para calcular dados de extensão de largura de banda usando um quadro controlado por inclinação espectral
CA2836871C (en) 2008-07-11 2017-07-18 Stefan Bayer Time warp activation signal provider, audio signal encoder, method for providing a time warp activation signal, method for encoding an audio signal and computer programs
MY154452A (en) * 2008-07-11 2015-06-15 Fraunhofer Ges Forschung An apparatus and a method for decoding an encoded audio signal
KR101614160B1 (ko) * 2008-07-16 2016-04-20 한국전자통신연구원 포스트 다운믹스 신호를 지원하는 다객체 오디오 부호화 장치 및 복호화 장치
WO2010011963A1 (en) * 2008-07-25 2010-01-28 The Board Of Trustees Of The University Of Illinois Methods and systems for identifying speech sounds using multi-dimensional analysis
US8463412B2 (en) * 2008-08-21 2013-06-11 Motorola Mobility Llc Method and apparatus to facilitate determining signal bounding frequencies
WO2010028299A1 (en) * 2008-09-06 2010-03-11 Huawei Technologies Co., Ltd. Noise-feedback for spectral envelope quantization
US8352279B2 (en) * 2008-09-06 2013-01-08 Huawei Technologies Co., Ltd. Efficient temporal envelope coding approach by prediction between low band signal and high band signal
WO2010028292A1 (en) * 2008-09-06 2010-03-11 Huawei Technologies Co., Ltd. Adaptive frequency prediction
US8532998B2 (en) 2008-09-06 2013-09-10 Huawei Technologies Co., Ltd. Selective bandwidth extension for encoding/decoding audio/speech signal
WO2010028301A1 (en) * 2008-09-06 2010-03-11 GH Innovation, Inc. Spectrum harmonic/noise sharpness control
KR101178801B1 (ko) * 2008-12-09 2012-08-31 한국전자통신연구원 음원분리 및 음원식별을 이용한 음성인식 장치 및 방법
US20100070550A1 (en) * 2008-09-12 2010-03-18 Cardinal Health 209 Inc. Method and apparatus of a sensor amplifier configured for use in medical applications
WO2010031049A1 (en) * 2008-09-15 2010-03-18 GH Innovation, Inc. Improving celp post-processing for music signals
WO2010031003A1 (en) * 2008-09-15 2010-03-18 Huawei Technologies Co., Ltd. Adding second enhancement layer to celp based core layer
EP2169670B1 (en) * 2008-09-25 2016-07-20 LG Electronics Inc. An apparatus for processing an audio signal and method thereof
EP2182513B1 (en) * 2008-11-04 2013-03-20 Lg Electronics Inc. An apparatus for processing an audio signal and method thereof
DE102008058496B4 (de) * 2008-11-21 2010-09-09 Siemens Medical Instruments Pte. Ltd. Filterbanksystem mit spezifischen Sperrdämpfungsanteilen für eine Hörvorrichtung
GB0822537D0 (en) 2008-12-10 2009-01-14 Skype Ltd Regeneration of wideband speech
US9947340B2 (en) * 2008-12-10 2018-04-17 Skype Regeneration of wideband speech
GB2466201B (en) * 2008-12-10 2012-07-11 Skype Ltd Regeneration of wideband speech
WO2010070770A1 (ja) * 2008-12-19 2010-06-24 富士通株式会社 音声帯域拡張装置及び音声帯域拡張方法
GB2466669B (en) * 2009-01-06 2013-03-06 Skype Speech coding
GB2466672B (en) * 2009-01-06 2013-03-13 Skype Speech coding
GB2466675B (en) 2009-01-06 2013-03-06 Skype Speech coding
GB2466670B (en) * 2009-01-06 2012-11-14 Skype Speech encoding
GB2466673B (en) 2009-01-06 2012-11-07 Skype Quantization
GB2466674B (en) 2009-01-06 2013-11-13 Skype Speech coding
GB2466671B (en) 2009-01-06 2013-03-27 Skype Speech encoding
PL3598447T3 (pl) 2009-01-16 2022-02-14 Dolby International Ab Transpozycja harmonicznych rozszerzona o iloczyn wektorowy
US8463599B2 (en) * 2009-02-04 2013-06-11 Motorola Mobility Llc Bandwidth extension method and apparatus for a modified discrete cosine transform audio coder
EP2407965B1 (en) * 2009-03-31 2012-12-12 Huawei Technologies Co., Ltd. Method and device for audio signal denoising
JP4932917B2 (ja) * 2009-04-03 2012-05-16 株式会社エヌ・ティ・ティ・ドコモ 音声復号装置、音声復号方法、及び音声復号プログラム
JP4921611B2 (ja) * 2009-04-03 2012-04-25 株式会社エヌ・ティ・ティ・ドコモ 音声復号装置、音声復号方法、及び音声復号プログラム
CN102460574A (zh) * 2009-05-19 2012-05-16 韩国电子通信研究院 用于使用层级正弦脉冲编码对音频信号进行编码和解码的方法和设备
US8000485B2 (en) * 2009-06-01 2011-08-16 Dts, Inc. Virtual audio processing for loudspeaker or headphone playback
CN101609680B (zh) * 2009-06-01 2012-01-04 华为技术有限公司 压缩编码和解码的方法、编码器和解码器以及编码装置
KR20110001130A (ko) * 2009-06-29 2011-01-06 삼성전자주식회사 가중 선형 예측 변환을 이용한 오디오 신호 부호화 및 복호화 장치 및 그 방법
WO2011029484A1 (en) * 2009-09-14 2011-03-17 Nokia Corporation Signal enhancement processing
US9595257B2 (en) * 2009-09-28 2017-03-14 Nuance Communications, Inc. Downsampling schemes in a hierarchical neural network structure for phoneme recognition
US8452606B2 (en) * 2009-09-29 2013-05-28 Skype Speech encoding using multiple bit rates
JP5754899B2 (ja) * 2009-10-07 2015-07-29 ソニー株式会社 復号装置および方法、並びにプログラム
BR112012009446B1 (pt) 2009-10-20 2023-03-21 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V Método e aparelho de armazenamento de dados
EP2704143B1 (en) * 2009-10-21 2015-01-07 Panasonic Intellectual Property Corporation of America Apparatus, method and computer program for audio signal processing
ES2805349T3 (es) 2009-10-21 2021-02-11 Dolby Int Ab Sobremuestreo en un banco de filtros de reemisor combinado
US8484020B2 (en) 2009-10-23 2013-07-09 Qualcomm Incorporated Determining an upperband signal from a narrowband signal
CN102612712B (zh) * 2009-11-19 2014-03-12 瑞典爱立信有限公司 低频带音频信号的带宽扩展
CA2780971A1 (en) * 2009-11-19 2011-05-26 Telefonaktiebolaget L M Ericsson (Publ) Improved excitation signal bandwidth extension
US8489393B2 (en) * 2009-11-23 2013-07-16 Cambridge Silicon Radio Limited Speech intelligibility
US9838784B2 (en) 2009-12-02 2017-12-05 Knowles Electronics, Llc Directional audio capture
RU2464651C2 (ru) * 2009-12-22 2012-10-20 Общество с ограниченной ответственностью "Спирит Корп" Способ и устройство многоуровневого масштабируемого устойчивого к информационным потерям кодирования речи для сетей с коммутацией пакетов
US20110167445A1 (en) * 2010-01-06 2011-07-07 Reams Robert W Audiovisual content channelization system
US8326607B2 (en) * 2010-01-11 2012-12-04 Sony Ericsson Mobile Communications Ab Method and arrangement for enhancing speech quality
PT2524371T (pt) 2010-01-12 2017-03-15 Fraunhofer Ges Forschung Codificador de áudio, descodificador de áudio, método de codificação de uma informação de áudio, método de descodificação de uma informação de áudio e programa de computador que utiliza uma tabela hash que descreve tanto valores de estado significativos como limites de intervalo
US8699727B2 (en) 2010-01-15 2014-04-15 Apple Inc. Visually-assisted mixing of audio using a spectral analyzer
US9525569B2 (en) * 2010-03-03 2016-12-20 Skype Enhanced circuit-switched calls
CN102884572B (zh) 2010-03-10 2015-06-17 弗兰霍菲尔运输应用研究公司 音频信号解码器、音频信号编码器、用以将音频信号解码的方法、及用以将音频信号编码的方法
US8700391B1 (en) * 2010-04-01 2014-04-15 Audience, Inc. Low complexity bandwidth expansion of speech
CN102870156B (zh) * 2010-04-12 2015-07-22 飞思卡尔半导体公司 音频通信设备、输出音频信号的方法和通信系统
BR112012026326B1 (pt) * 2010-04-13 2021-05-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V método e codificador e decodificador para representação com amostragem precisa de um sinal de áudio
JP5850216B2 (ja) 2010-04-13 2016-02-03 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5609737B2 (ja) 2010-04-13 2014-10-22 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5652658B2 (ja) 2010-04-13 2015-01-14 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
US9443534B2 (en) * 2010-04-14 2016-09-13 Huawei Technologies Co., Ltd. Bandwidth extension system and approach
MX2012011943A (es) * 2010-04-14 2013-01-24 Voiceage Corp Libro de códigos de innovacion combinado, flexible y escalable para uso en codificador y decodificador celp.
MX2012011828A (es) * 2010-04-16 2013-02-27 Fraunhofer Ges Forschung Aparato, metodo y programa de computadora para generar una señal de banda amplia que utiliza extension de ancho de banda guiada y extension oculta de ancho de banda.
US8473287B2 (en) 2010-04-19 2013-06-25 Audience, Inc. Method for jointly optimizing noise reduction and voice quality in a mono or multi-microphone system
US8538035B2 (en) 2010-04-29 2013-09-17 Audience, Inc. Multi-microphone robust noise suppression
US8798290B1 (en) 2010-04-21 2014-08-05 Audience, Inc. Systems and methods for adaptive signal equalization
US8781137B1 (en) 2010-04-27 2014-07-15 Audience, Inc. Wind noise detection and suppression
US9378754B1 (en) 2010-04-28 2016-06-28 Knowles Electronics, Llc Adaptive spatial classifier for multi-microphone systems
US9558755B1 (en) 2010-05-20 2017-01-31 Knowles Electronics, Llc Noise suppression assisted automatic speech recognition
KR101660843B1 (ko) * 2010-05-27 2016-09-29 삼성전자주식회사 Lpc 계수 양자화를 위한 가중치 함수 결정 장치 및 방법
US8600737B2 (en) * 2010-06-01 2013-12-03 Qualcomm Incorporated Systems, methods, apparatus, and computer program products for wideband speech coding
ES2372202B2 (es) * 2010-06-29 2012-08-08 Universidad De Málaga Sistema de reconocimiento de sonidos de bajo consumo.
KR102079000B1 (ko) 2010-07-02 2020-02-19 돌비 인터네셔널 에이비 선택적인 베이스 포스트 필터
US8447596B2 (en) 2010-07-12 2013-05-21 Audience, Inc. Monaural noise suppression based on computational auditory scene analysis
JP5589631B2 (ja) * 2010-07-15 2014-09-17 富士通株式会社 音声処理装置、音声処理方法および電話装置
WO2012008891A1 (en) * 2010-07-16 2012-01-19 Telefonaktiebolaget L M Ericsson (Publ) Audio encoder and decoder and methods for encoding and decoding an audio signal
JP5777041B2 (ja) * 2010-07-23 2015-09-09 沖電気工業株式会社 帯域拡張装置及びプログラム、並びに、音声通信装置
JP6075743B2 (ja) 2010-08-03 2017-02-08 ソニー株式会社 信号処理装置および方法、並びにプログラム
WO2012031125A2 (en) 2010-09-01 2012-03-08 The General Hospital Corporation Reversal of general anesthesia by administration of methylphenidate, amphetamine, modafinil, amantadine, and/or caffeine
ES2933477T3 (es) * 2010-09-16 2023-02-09 Dolby Int Ab Transposición armónica basada en bloque de subbanda mejorado de producto cruzado
JP5707842B2 (ja) 2010-10-15 2015-04-30 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
US8924200B2 (en) 2010-10-15 2014-12-30 Motorola Mobility Llc Audio signal bandwidth extension in CELP-based speech coder
WO2012053149A1 (ja) * 2010-10-22 2012-04-26 パナソニック株式会社 音声分析装置、量子化装置、逆量子化装置、及びこれらの方法
JP5743137B2 (ja) * 2011-01-14 2015-07-01 ソニー株式会社 信号処理装置および方法、並びにプログラム
US9767823B2 (en) 2011-02-07 2017-09-19 Qualcomm Incorporated Devices for encoding and detecting a watermarked signal
US9767822B2 (en) 2011-02-07 2017-09-19 Qualcomm Incorporated Devices for encoding and decoding a watermarked signal
SG192721A1 (en) 2011-02-14 2013-09-30 Fraunhofer Ges Forschung Apparatus and method for encoding and decoding an audio signal using an aligned look-ahead portion
AU2012217215B2 (en) 2011-02-14 2015-05-14 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for error concealment in low-delay unified speech and audio coding (USAC)
CA2903681C (en) 2011-02-14 2017-03-28 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Audio codec using noise synthesis during inactive phases
AU2012217216B2 (en) 2011-02-14 2015-09-17 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for coding a portion of an audio signal using a transient detection and a quality result
CN103477386B (zh) * 2011-02-14 2016-06-01 弗劳恩霍夫应用研究促进协会 音频编解码器中的噪声产生
CA2799343C (en) 2011-02-14 2016-06-21 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Information signal representation using lapped transform
AU2012217269B2 (en) 2011-02-14 2015-10-22 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for processing a decoded audio signal in a spectral domain
TWI488176B (zh) 2011-02-14 2015-06-11 Fraunhofer Ges Forschung 音訊信號音軌脈衝位置之編碼與解碼技術
MX2013009345A (es) 2011-02-14 2013-10-01 Fraunhofer Ges Forschung Codificacion y decodificacion de posiciones de los pulsos de las pistas de una señal de audio.
WO2012122397A1 (en) 2011-03-09 2012-09-13 Srs Labs, Inc. System for dynamically creating and rendering audio objects
US9842168B2 (en) 2011-03-31 2017-12-12 Microsoft Technology Licensing, Llc Task driven user intents
US9760566B2 (en) 2011-03-31 2017-09-12 Microsoft Technology Licensing, Llc Augmented conversational understanding agent to identify conversation context between two humans and taking an agent action thereof
US10642934B2 (en) 2011-03-31 2020-05-05 Microsoft Technology Licensing, Llc Augmented conversational understanding architecture
US9298287B2 (en) 2011-03-31 2016-03-29 Microsoft Technology Licensing, Llc Combined activation for natural user interface systems
US9244984B2 (en) 2011-03-31 2016-01-26 Microsoft Technology Licensing, Llc Location based conversational understanding
JP5704397B2 (ja) * 2011-03-31 2015-04-22 ソニー株式会社 符号化装置および方法、並びにプログラム
US9064006B2 (en) 2012-08-23 2015-06-23 Microsoft Technology Licensing, Llc Translating natural language utterances to keyword search queries
CN102811034A (zh) 2011-05-31 2012-12-05 财团法人工业技术研究院 信号处理装置及信号处理方法
JP5986565B2 (ja) * 2011-06-09 2016-09-06 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 音声符号化装置、音声復号装置、音声符号化方法及び音声復号方法
US9070361B2 (en) 2011-06-10 2015-06-30 Google Technology Holdings LLC Method and apparatus for encoding a wideband speech signal utilizing downmixing of a highband component
MX370012B (es) * 2011-06-30 2019-11-28 Samsung Electronics Co Ltd Aparato y método para generar señal extendida de ancho de banda.
US9059786B2 (en) * 2011-07-07 2015-06-16 Vecima Networks Inc. Ingress suppression for communication systems
JP5942358B2 (ja) 2011-08-24 2016-06-29 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
RU2486636C1 (ru) * 2011-11-14 2013-06-27 Федеральное государственное военное образовательное учреждение высшего профессионального образования "Военный авиационный инженерный университет" (г. Воронеж) Министерства обороны Российской Федерации Способ генерации высокочастотных сигналов и устройство его реализации
RU2486637C1 (ru) * 2011-11-15 2013-06-27 Федеральное государственное военное образовательное учреждение высшего профессионального образования "Военный авиационный инженерный университет" (г. Воронеж) Министерства обороны Российской Федерации Способ генерации и частотной модуляции высокочастотных сигналов и устройство его реализации
RU2486638C1 (ru) * 2011-11-15 2013-06-27 Федеральное государственное военное образовательное учреждение высшего профессионального образования "Военный авиационный инженерный университет" (г. Воронеж) Министерства обороны Российской Федерации Способ генерации высокочастотных сигналов и устройство его реализации
RU2496222C2 (ru) * 2011-11-17 2013-10-20 Федеральное государственное образовательное учреждение высшего профессионального образования "Военный авиационный инженерный университет" (г. Воронеж) Министерства обороны Российской Федерации Способ генерации и частотной модуляции высокочастотных сигналов и устройство его реализации
RU2486639C1 (ru) * 2011-11-21 2013-06-27 Федеральное государственное военное образовательное учреждение высшего профессионального образования "Военный авиационный инженерный университет" (г. Воронеж) Министерства обороны Российской Федерации Способ генерации и частотной модуляции высокочастотных сигналов и устройство его реализации
RU2496192C2 (ru) * 2011-11-21 2013-10-20 Федеральное государственное военное образовательное учреждение высшего профессионального образования "Военный авиационный инженерный университет" (г. Воронеж) Министерства обороны Российской Федерации Способ генерации и частотной модуляции высокочастотных сигналов и устройство его реализации
RU2487443C1 (ru) * 2011-11-29 2013-07-10 Федеральное государственное военное образовательное учреждение высшего профессионального образования "Военный авиационный инженерный университет" (г. Воронеж) Министерства обороны Российской Федерации Способ согласования комплексных сопротивлений и устройство его реализации
JP5817499B2 (ja) * 2011-12-15 2015-11-18 富士通株式会社 復号装置、符号化装置、符号化復号システム、復号方法、符号化方法、復号プログラム、及び符号化プログラム
US9082398B2 (en) * 2012-02-28 2015-07-14 Huawei Technologies Co., Ltd. System and method for post excitation enhancement for low bit rate speech coding
US9437213B2 (en) * 2012-03-05 2016-09-06 Malaspina Labs (Barbados) Inc. Voice signal enhancement
CN104321815B (zh) * 2012-03-21 2018-10-16 三星电子株式会社 用于带宽扩展的高频编码/高频解码方法和设备
EP4274235A3 (en) 2012-03-29 2024-01-10 Telefonaktiebolaget LM Ericsson (publ) Vector quantizer
US10448161B2 (en) 2012-04-02 2019-10-15 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for gestural manipulation of a sound field
JP5998603B2 (ja) * 2012-04-18 2016-09-28 ソニー株式会社 音検出装置、音検出方法、音特徴量検出装置、音特徴量検出方法、音区間検出装置、音区間検出方法およびプログラム
KR101343768B1 (ko) * 2012-04-19 2014-01-16 충북대학교 산학협력단 스펙트럼 변화 패턴을 이용한 음성 및 오디오 신호 분류방법
RU2504894C1 (ru) * 2012-05-17 2014-01-20 Федеральное государственное военное образовательное учреждение высшего профессионального образования "Военный авиационный инженерный университет" (г. Воронеж) Министерства обороны Российской Федерации Способ демодуляции фазомодулированных и частотно-модулированных сигналов и устройство его реализации
RU2504898C1 (ru) * 2012-05-17 2014-01-20 Федеральное государственное военное образовательное учреждение высшего профессионального образования "Военный авиационный инженерный университет" (г. Воронеж) Министерства обороны Российской Федерации Способ демодуляции фазомодулированных и частотно-модулированных сигналов и устройство его реализации
US20140006017A1 (en) * 2012-06-29 2014-01-02 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for generating obfuscated speech signal
WO2014035328A1 (en) 2012-08-31 2014-03-06 Telefonaktiebolaget L M Ericsson (Publ) Method and device for voice activity detection
WO2014046916A1 (en) 2012-09-21 2014-03-27 Dolby Laboratories Licensing Corporation Layered approach to spatial audio coding
WO2014062859A1 (en) * 2012-10-16 2014-04-24 Audiologicall, Ltd. Audio signal manipulation for speech enhancement before sound reproduction
KR101413969B1 (ko) 2012-12-20 2014-07-08 삼성전자주식회사 오디오 신호의 복호화 방법 및 장치
CN103928031B (zh) 2013-01-15 2016-03-30 华为技术有限公司 编码方法、解码方法、编码装置和解码装置
SG11201505903UA (en) 2013-01-29 2015-08-28 Fraunhofer Ges Forschung Apparatus and method for synthesizing an audio signal, decoder, encoder, system and computer program
CN103971693B (zh) 2013-01-29 2017-02-22 华为技术有限公司 高频带信号的预测方法、编/解码设备
CN105264599B (zh) * 2013-01-29 2019-05-10 弗劳恩霍夫应用研究促进协会 音频编码器、音频解码器、提供编码音频信息的方法
US9728200B2 (en) 2013-01-29 2017-08-08 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for adaptive formant sharpening in linear prediction coding
US20140213909A1 (en) * 2013-01-31 2014-07-31 Xerox Corporation Control-based inversion for estimating a biological parameter vector for a biophysics model from diffused reflectance data
US9601125B2 (en) * 2013-02-08 2017-03-21 Qualcomm Incorporated Systems and methods of performing noise modulation and gain adjustment
US9741350B2 (en) 2013-02-08 2017-08-22 Qualcomm Incorporated Systems and methods of performing gain control
US9711156B2 (en) * 2013-02-08 2017-07-18 Qualcomm Incorporated Systems and methods of performing filtering for gain determination
US9336789B2 (en) * 2013-02-21 2016-05-10 Qualcomm Incorporated Systems and methods for determining an interpolation factor set for synthesizing a speech signal
WO2014136629A1 (ja) * 2013-03-05 2014-09-12 日本電気株式会社 信号処理装置、信号処理方法および信号処理プログラム
EP2784775B1 (en) * 2013-03-27 2016-09-14 Binauric SE Speech signal encoding/decoding method and apparatus
CN110265047B (zh) * 2013-04-05 2021-05-18 杜比国际公司 音频信号的解码方法和解码器、介质以及编码方法
KR102150496B1 (ko) * 2013-04-05 2020-09-01 돌비 인터네셔널 에이비 오디오 인코더 및 디코더
CN105264600B (zh) 2013-04-05 2019-06-07 Dts有限责任公司 分层音频编码和传输
BR112015031181A2 (pt) * 2013-06-21 2017-07-25 Fraunhofer Ges Forschung aparelho e método que realizam conceitos aperfeiçoados para tcx ltp
EP3011560B1 (en) 2013-06-21 2018-08-01 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder having a bandwidth extension module with an energy adjusting module
FR3007563A1 (fr) * 2013-06-25 2014-12-26 France Telecom Extension amelioree de bande de frequence dans un decodeur de signaux audiofrequences
WO2014210549A1 (en) 2013-06-27 2014-12-31 The General Hospital Corporation Systems and methods for tracking non-stationary spectral structure and dynamics in physiological data
WO2014210527A1 (en) * 2013-06-28 2014-12-31 The General Hospital Corporation System and method to infer brain state during burst suppression
CN104282308B (zh) * 2013-07-04 2017-07-14 华为技术有限公司 频域包络的矢量量化方法和装置
FR3008533A1 (fr) 2013-07-12 2015-01-16 Orange Facteur d'echelle optimise pour l'extension de bande de frequence dans un decodeur de signaux audiofrequences
EP2830059A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Noise filling energy adjustment
BR112016004299B1 (pt) 2013-08-28 2022-05-17 Dolby Laboratories Licensing Corporation Método, aparelho e meio de armazenamento legível por computador para melhora de fala codificada paramétrica e codificada com forma de onda híbrida
TWI557726B (zh) * 2013-08-29 2016-11-11 杜比國際公司 用於決定音頻信號的高頻帶信號的主比例因子頻帶表之系統和方法
EP4166072A1 (en) 2013-09-13 2023-04-19 The General Hospital Corporation Systems and methods for improved brain monitoring during general anesthesia and sedation
CN105531762B (zh) 2013-09-19 2019-10-01 索尼公司 编码装置和方法、解码装置和方法以及程序
CN104517610B (zh) * 2013-09-26 2018-03-06 华为技术有限公司 频带扩展的方法及装置
CN105761723B (zh) 2013-09-26 2019-01-15 华为技术有限公司 一种高频激励信号预测方法及装置
US9224402B2 (en) 2013-09-30 2015-12-29 International Business Machines Corporation Wideband speech parameterization for high quality synthesis, transformation and quantization
US9620134B2 (en) * 2013-10-10 2017-04-11 Qualcomm Incorporated Gain shape estimation for improved tracking of high-band temporal characteristics
US10083708B2 (en) * 2013-10-11 2018-09-25 Qualcomm Incorporated Estimation of mixing factors to generate high-band excitation signal
US9384746B2 (en) * 2013-10-14 2016-07-05 Qualcomm Incorporated Systems and methods of energy-scaled signal processing
KR102271852B1 (ko) 2013-11-02 2021-07-01 삼성전자주식회사 광대역 신호 생성방법 및 장치와 이를 채용하는 기기
EP2871641A1 (en) * 2013-11-12 2015-05-13 Dialog Semiconductor B.V. Enhancement of narrowband audio signals using a single sideband AM modulation
KR20160087827A (ko) 2013-11-22 2016-07-22 퀄컴 인코포레이티드 고대역 코딩에서의 선택적 위상 보상
US10163447B2 (en) * 2013-12-16 2018-12-25 Qualcomm Incorporated High-band signal modeling
RU2764260C2 (ru) 2013-12-27 2022-01-14 Сони Корпорейшн Устройство и способ декодирования
CN103714822B (zh) * 2013-12-27 2017-01-11 广州华多网络科技有限公司 基于silk编解码器的子带编解码方法及装置
FR3017484A1 (fr) * 2014-02-07 2015-08-14 Orange Extension amelioree de bande de frequence dans un decodeur de signaux audiofrequences
US9564141B2 (en) 2014-02-13 2017-02-07 Qualcomm Incorporated Harmonic bandwidth extension of audio signals
JP6281336B2 (ja) * 2014-03-12 2018-02-21 沖電気工業株式会社 音声復号化装置及びプログラム
JP6035270B2 (ja) * 2014-03-24 2016-11-30 株式会社Nttドコモ 音声復号装置、音声符号化装置、音声復号方法、音声符号化方法、音声復号プログラム、および音声符号化プログラム
BR112016019838B1 (pt) * 2014-03-31 2023-02-23 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Codificador de áudio, decodificador de áudio, método de codificação, método de decodificação e mídia de registro legível por computador não transitória
US9542955B2 (en) 2014-03-31 2017-01-10 Qualcomm Incorporated High-band signal coding using multiple sub-bands
US9697843B2 (en) * 2014-04-30 2017-07-04 Qualcomm Incorporated High band excitation signal generation
CN106409304B (zh) * 2014-06-12 2020-08-25 华为技术有限公司 一种音频信号的时域包络处理方法及装置、编码器
CN105336338B (zh) 2014-06-24 2017-04-12 华为技术有限公司 音频编码方法和装置
US9984699B2 (en) * 2014-06-26 2018-05-29 Qualcomm Incorporated High-band signal coding using mismatched frequency ranges
US9583115B2 (en) * 2014-06-26 2017-02-28 Qualcomm Incorporated Temporal gain adjustment based on high-band signal characteristic
CN105225670B (zh) * 2014-06-27 2016-12-28 华为技术有限公司 一种音频编码方法和装置
US9721584B2 (en) * 2014-07-14 2017-08-01 Intel IP Corporation Wind noise reduction for audio reception
EP2980798A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Harmonicity-dependent controlling of a harmonic filter tool
EP2980794A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and decoder using a frequency domain processor and a time domain processor
EP2980795A1 (en) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoding and decoding using a frequency domain processor, a time domain processor and a cross processor for initialization of the time domain processor
EP2980792A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating an enhanced signal using independent noise-filling
WO2016024853A1 (ko) * 2014-08-15 2016-02-18 삼성전자 주식회사 음질 향상 방법 및 장치, 음성 복호화방법 및 장치와 이를 채용한 멀티미디어 기기
CN104217730B (zh) * 2014-08-18 2017-07-21 大连理工大学 一种基于k‑svd的人工语音带宽扩展方法及装置
US9978388B2 (en) 2014-09-12 2018-05-22 Knowles Electronics, Llc Systems and methods for restoration of speech components
TWI550945B (zh) * 2014-12-22 2016-09-21 國立彰化師範大學 具有急遽過渡帶的複合濾波器之設計方法及其串聯式複合濾波器
US9595269B2 (en) * 2015-01-19 2017-03-14 Qualcomm Incorporated Scaling for gain shape circuitry
US9668048B2 (en) 2015-01-30 2017-05-30 Knowles Electronics, Llc Contextual switching of microphones
CN107517593B (zh) * 2015-02-26 2021-03-12 弗劳恩霍夫应用研究促进协会 用于使用目标时域包络来处理音频信号以获得经处理的音频信号的装置和方法
US10847170B2 (en) * 2015-06-18 2020-11-24 Qualcomm Incorporated Device and method for generating a high-band signal from non-linearly processed sub-ranges
US9837089B2 (en) * 2015-06-18 2017-12-05 Qualcomm Incorporated High-band signal generation
US9407989B1 (en) 2015-06-30 2016-08-02 Arthur Woodrow Closed audio circuit
US9830921B2 (en) * 2015-08-17 2017-11-28 Qualcomm Incorporated High-band target signal control
WO2017064264A1 (en) * 2015-10-15 2017-04-20 Huawei Technologies Co., Ltd. Method and appratus for sinusoidal encoding and decoding
NO20151400A1 (en) 2015-10-15 2017-01-23 St Tech As A system for isolating an object
MX371223B (es) 2016-02-17 2020-01-09 Fraunhofer Ges Forschung Post-procesador, pre-procesador, codificador de audio, decodificador de audio y metodos relacionados para mejorar el procesamiento de transitorios.
PT3443557T (pt) * 2016-04-12 2020-08-27 Fraunhofer Ges Forschung Codificador de áudio para codificar um sinal de áudio, método para codificar um sinal de áudio e programa de computador sob consideração de uma região espectral de pico detetada numa banda de frequência superior
US20170330575A1 (en) * 2016-05-10 2017-11-16 Immersion Services LLC Adaptive audio codec system, method and article
US10756755B2 (en) * 2016-05-10 2020-08-25 Immersion Networks, Inc. Adaptive audio codec system, method and article
US10699725B2 (en) * 2016-05-10 2020-06-30 Immersion Networks, Inc. Adaptive audio encoder system, method and article
AU2017262757B2 (en) * 2016-05-10 2022-04-07 Immersion Services LLC Adaptive audio codec system, method, apparatus and medium
US10770088B2 (en) * 2016-05-10 2020-09-08 Immersion Networks, Inc. Adaptive audio decoder system, method and article
US10264116B2 (en) * 2016-11-02 2019-04-16 Nokia Technologies Oy Virtual duplex operation
KR102507383B1 (ko) * 2016-11-08 2023-03-08 한국전자통신연구원 직사각형 윈도우를 이용한 스테레오 정합 방법 및 스테레오 정합 시스템
WO2018102402A1 (en) 2016-11-29 2018-06-07 The General Hospital Corporation Systems and methods for analyzing electrophysiological data from patients undergoing medical treatments
ES2950009T3 (es) * 2017-01-06 2023-10-04 Ericsson Telefon Ab L M Métodos y aparatos para señalizar y determinar desplazamientos de señal de referencia
KR20180092582A (ko) * 2017-02-10 2018-08-20 삼성전자주식회사 Wfst 디코딩 시스템, 이를 포함하는 음성 인식 시스템 및 wfst 데이터 저장 방법
US10553222B2 (en) * 2017-03-09 2020-02-04 Qualcomm Incorporated Inter-channel bandwidth extension spectral mapping and adjustment
US10304468B2 (en) * 2017-03-20 2019-05-28 Qualcomm Incorporated Target sample generation
TWI807562B (zh) * 2017-03-23 2023-07-01 瑞典商都比國際公司 用於音訊信號之高頻重建的諧波轉置器的回溯相容整合
US10825467B2 (en) * 2017-04-21 2020-11-03 Qualcomm Incorporated Non-harmonic speech detection and bandwidth extension in a multi-source environment
US20190051286A1 (en) * 2017-08-14 2019-02-14 Microsoft Technology Licensing, Llc Normalization of high band signals in network telephony communications
KR102438549B1 (ko) * 2017-10-27 2022-08-31 테라웨이브, 엘엘씨 인코딩된 정현파 파형들을 이용한 고 스펙트럼 효율의 데이터 통신 시스템을 위한 수신기
US11876659B2 (en) 2017-10-27 2024-01-16 Terawave, Llc Communication system using shape-shifted sinusoidal waveforms
CN109729553B (zh) * 2017-10-30 2021-12-28 成都鼎桥通信技术有限公司 Lte集群通信系统的语音业务处理方法及设备
EP3483879A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Analysis/synthesis windowing function for modulated lapped transformation
EP3483880A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Temporal noise shaping
EP3483884A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Signal filtering
WO2019091576A1 (en) 2017-11-10 2019-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits
EP3483883A1 (en) * 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio coding and decoding with selective postfiltering
EP3483886A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Selecting pitch lag
WO2019091573A1 (en) 2017-11-10 2019-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding and decoding an audio signal using downsampling or interpolation of scale parameters
EP3483878A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder supporting a set of different loss concealment tools
EP3483882A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Controlling bandwidth in encoders and/or decoders
US10460749B1 (en) * 2018-06-28 2019-10-29 Nuvoton Technology Corporation Voice activity detection using vocal tract area information
US10847172B2 (en) * 2018-12-17 2020-11-24 Microsoft Technology Licensing, Llc Phase quantization in a speech encoder
US10957331B2 (en) 2018-12-17 2021-03-23 Microsoft Technology Licensing, Llc Phase reconstruction in a speech decoder
WO2020171034A1 (ja) * 2019-02-20 2020-08-27 ヤマハ株式会社 音信号生成方法、生成モデルの訓練方法、音信号生成システムおよびプログラム
CN110610713B (zh) * 2019-08-28 2021-11-16 南京梧桐微电子科技有限公司 一种声码器余量谱幅度参数重构方法及系统
US11380343B2 (en) 2019-09-12 2022-07-05 Immersion Networks, Inc. Systems and methods for processing high frequency audio signal
TWI723545B (zh) * 2019-09-17 2021-04-01 宏碁股份有限公司 語音處理方法及其裝置
US11295751B2 (en) 2019-09-20 2022-04-05 Tencent America LLC Multi-band synchronized neural vocoder
KR102201169B1 (ko) * 2019-10-23 2021-01-11 성균관대학교 산학협력단 메타 표면의 반사 계수를 제어하기 위한 시간 부호 생성 방법, 메타 표면의 반사 계수를 제어하기 위한 시공간 부호 생성 방법, 이를 실행하는 컴퓨터 프로그램이 저장된 컴퓨터 판독 가능한 기록매체, 및 이를 이용한 메타 표면의 신호 변조 방법
CN114548442B (zh) * 2022-02-25 2022-10-21 万表名匠(广州)科技有限公司 一种基于互联网技术的腕表维修管理系统

Family Cites Families (148)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US321993A (en) * 1885-07-14 Lantern
US526468A (en) * 1894-09-25 Charles d
US525147A (en) * 1894-08-28 Steam-cooker
US596689A (en) * 1898-01-04 Hose holder or support
US1126620A (en) * 1911-01-30 1915-01-26 Safety Car Heating & Lighting Electric regulation.
US1089258A (en) * 1914-01-13 1914-03-03 James Arnot Paterson Facing or milling machine.
US1300833A (en) * 1918-12-12 1919-04-15 Moline Mill Mfg Company Idler-pulley structure.
US1498873A (en) * 1924-04-19 1924-06-24 Bethlehem Steel Corp Switch stand
US2073913A (en) * 1934-06-26 1937-03-16 Wigan Edmund Ramsay Means for gauging minute displacements
US2086867A (en) * 1936-06-19 1937-07-13 Hall Lab Inc Laundering composition and process
US3044777A (en) * 1959-10-19 1962-07-17 Fibermold Corp Bowling pin
US3158693A (en) 1962-08-07 1964-11-24 Bell Telephone Labor Inc Speech interpolation communication system
US3855416A (en) 1972-12-01 1974-12-17 F Fuller Method and apparatus for phonation analysis leading to valid truth/lie decisions by fundamental speech-energy weighted vibratto component assessment
US3855414A (en) * 1973-04-24 1974-12-17 Anaconda Co Cable armor clamp
JPS59139099A (ja) 1983-01-31 1984-08-09 株式会社東芝 音声区間検出装置
US4616659A (en) 1985-05-06 1986-10-14 At&T Bell Laboratories Heart rate detection utilizing autoregressive analysis
US4630305A (en) * 1985-07-01 1986-12-16 Motorola, Inc. Automatic gain selector for a noise suppression system
US4747143A (en) * 1985-07-12 1988-05-24 Westinghouse Electric Corp. Speech enhancement system having dynamic gain control
NL8503152A (nl) * 1985-11-15 1987-06-01 Optische Ind De Oude Delft Nv Dosismeter voor ioniserende straling.
US4862168A (en) * 1987-03-19 1989-08-29 Beard Terry D Audio digital/analog encoding and decoding
US4805193A (en) * 1987-06-04 1989-02-14 Motorola, Inc. Protection of energy information in sub-band coding
US4852179A (en) 1987-10-05 1989-07-25 Motorola, Inc. Variable frame rate, fixed bit rate vocoding method
JP2707564B2 (ja) 1987-12-14 1998-01-28 株式会社日立製作所 音声符号化方式
US5285520A (en) * 1988-03-02 1994-02-08 Kokusai Denshin Denwa Kabushiki Kaisha Predictive coding apparatus
CA1321645C (en) 1988-09-28 1993-08-24 Akira Ichikawa Method and system for voice coding based on vector quantization
US5086475A (en) 1988-11-19 1992-02-04 Sony Corporation Apparatus for generating, recording or reproducing sound source data
JPH02244100A (ja) * 1989-03-16 1990-09-28 Ricoh Co Ltd 駆動音源信号生成装置
HU216669B (hu) 1990-09-19 1999-08-30 Koninklijke Philips Electronics N.V. Információhordozó fő adatállománnyal és vezérlőállománnyal, eljárás és készülék ezen állományok rögzítésére, valamint készülék azok kiolvasására
JP2779886B2 (ja) 1992-10-05 1998-07-23 日本電信電話株式会社 広帯域音声信号復元方法
JP3191457B2 (ja) * 1992-10-31 2001-07-23 ソニー株式会社 高能率符号化装置、ノイズスペクトル変更装置及び方法
US5455888A (en) 1992-12-04 1995-10-03 Northern Telecom Limited Speech bandwidth extension method and apparatus
WO1995001680A1 (fr) 1993-06-30 1995-01-12 Sony Corporation Dispositif de codage de signaux numeriques, son dispositif de decodage, et son support d'enregistrement
WO1995010760A2 (en) 1993-10-08 1995-04-20 Comsat Corporation Improved low bit rate vocoders and methods of operation therefor
US5684920A (en) * 1994-03-17 1997-11-04 Nippon Telegraph And Telephone Acoustic signal transform coding method and decoding method having a high efficiency envelope flattening method therein
US5487087A (en) 1994-05-17 1996-01-23 Texas Instruments Incorporated Signal quantizer with reduced output fluctuation
US5797118A (en) * 1994-08-09 1998-08-18 Yamaha Corporation Learning vector quantization and a temporary memory such that the codebook contents are renewed when a first speaker returns
JP2770137B2 (ja) * 1994-09-22 1998-06-25 日本プレシジョン・サーキッツ株式会社 波形データ圧縮装置
US5699477A (en) 1994-11-09 1997-12-16 Texas Instruments Incorporated Mixed excitation linear prediction with fractional pitch
FI97182C (fi) 1994-12-05 1996-10-25 Nokia Telecommunications Oy Menetelmä vastaanotettujen huonojen puhekehysten korvaamiseksi digitaalisessa vastaanottimessa sekä digitaalisen tietoliikennejärjestelmän vastaanotin
JP3365113B2 (ja) * 1994-12-22 2003-01-08 ソニー株式会社 音声レベル制御装置
JP2956548B2 (ja) * 1995-10-05 1999-10-04 松下電器産業株式会社 音声帯域拡大装置
JP2798003B2 (ja) 1995-05-09 1998-09-17 松下電器産業株式会社 音声帯域拡大装置および音声帯域拡大方法
DE69619284T3 (de) 1995-03-13 2006-04-27 Matsushita Electric Industrial Co., Ltd., Kadoma Vorrichtung zur Erweiterung der Sprachbandbreite
JP3189614B2 (ja) 1995-03-13 2001-07-16 松下電器産業株式会社 音声帯域拡大装置
US5706395A (en) 1995-04-19 1998-01-06 Texas Instruments Incorporated Adaptive weiner filtering using a dynamic suppression factor
US6263307B1 (en) * 1995-04-19 2001-07-17 Texas Instruments Incorporated Adaptive weiner filtering using line spectral frequencies
JP3334419B2 (ja) * 1995-04-20 2002-10-15 ソニー株式会社 ノイズ低減方法及びノイズ低減装置
US5699485A (en) 1995-06-07 1997-12-16 Lucent Technologies Inc. Pitch delay modification during frame erasures
US5704003A (en) 1995-09-19 1997-12-30 Lucent Technologies Inc. RCELP coder
US6097824A (en) * 1997-06-06 2000-08-01 Audiologic, Incorporated Continuous frequency dynamic range audio compressor
EP0768569B1 (en) * 1995-10-16 2003-04-02 Agfa-Gevaert New class of yellow dyes for use in photographic materials
JP3707116B2 (ja) 1995-10-26 2005-10-19 ソニー株式会社 音声復号化方法及び装置
US5737716A (en) 1995-12-26 1998-04-07 Motorola Method and apparatus for encoding speech using neural network technology for speech classification
JP3073919B2 (ja) * 1995-12-30 2000-08-07 松下電器産業株式会社 同期装置
US5689615A (en) 1996-01-22 1997-11-18 Rockwell International Corporation Usage of voice activity detection for efficient coding of speech
TW307960B (en) 1996-02-15 1997-06-11 Philips Electronics Nv Reduced complexity signal transmission system
DE69730779T2 (de) 1996-06-19 2005-02-10 Texas Instruments Inc., Dallas Verbesserungen bei oder in Bezug auf Sprachkodierung
JP3246715B2 (ja) * 1996-07-01 2002-01-15 松下電器産業株式会社 オーディオ信号圧縮方法,およびオーディオ信号圧縮装置
CN1170268C (zh) * 1996-11-07 2004-10-06 松下电器产业株式会社 声音编码或解码装置及方法
US6009395A (en) * 1997-01-02 1999-12-28 Texas Instruments Incorporated Synthesizer and method using scaled excitation signal
US6202046B1 (en) 1997-01-23 2001-03-13 Kabushiki Kaisha Toshiba Background noise/speech classification method
US6041297A (en) 1997-03-10 2000-03-21 At&T Corp Vocoder for coding speech by using a correlation between spectral magnitudes and candidate excitations
US5890126A (en) 1997-03-10 1999-03-30 Euphonics, Incorporated Audio data decompression and interpolation apparatus and method
EP0878790A1 (en) 1997-05-15 1998-11-18 Hewlett-Packard Company Voice coding system and method
SE512719C2 (sv) 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
US6889185B1 (en) * 1997-08-28 2005-05-03 Texas Instruments Incorporated Quantization of linear prediction coefficients using perceptual weighting
US6122384A (en) * 1997-09-02 2000-09-19 Qualcomm Inc. Noise suppression system and method
US6029125A (en) * 1997-09-02 2000-02-22 Telefonaktiebolaget L M Ericsson, (Publ) Reducing sparseness in coded speech signals
US6231516B1 (en) * 1997-10-14 2001-05-15 Vacusense, Inc. Endoluminal implant with therapeutic and diagnostic capability
JPH11205166A (ja) 1998-01-19 1999-07-30 Mitsubishi Electric Corp ノイズ検出装置
US6301556B1 (en) 1998-03-04 2001-10-09 Telefonaktiebolaget L M. Ericsson (Publ) Reducing sparseness in coded speech signals
US6385573B1 (en) 1998-08-24 2002-05-07 Conexant Systems, Inc. Adaptive tilt compensation for synthesized speech residual
US6449590B1 (en) * 1998-08-24 2002-09-10 Conexant Systems, Inc. Speech encoder using warping in long term preprocessing
JP4170458B2 (ja) 1998-08-27 2008-10-22 ローランド株式会社 波形信号の時間軸圧縮伸長装置
US6353808B1 (en) * 1998-10-22 2002-03-05 Sony Corporation Apparatus and method for encoding a signal as well as apparatus and method for decoding a signal
KR20000047944A (ko) 1998-12-11 2000-07-25 이데이 노부유끼 수신장치 및 방법과 통신장치 및 방법
JP4354561B2 (ja) 1999-01-08 2009-10-28 パナソニック株式会社 オーディオ信号符号化装置及び復号化装置
US6223151B1 (en) 1999-02-10 2001-04-24 Telefon Aktie Bolaget Lm Ericsson Method and apparatus for pre-processing speech signals prior to coding by transform-based speech coders
US6829360B1 (en) 1999-05-14 2004-12-07 Matsushita Electric Industrial Co., Ltd. Method and apparatus for expanding band of audio signal
US6604070B1 (en) * 1999-09-22 2003-08-05 Conexant Systems, Inc. System of encoding and decoding speech signals
JP4792613B2 (ja) 1999-09-29 2011-10-12 ソニー株式会社 情報処理装置および方法、並びに記録媒体
US6556950B1 (en) 1999-09-30 2003-04-29 Rockwell Automation Technologies, Inc. Diagnostic method and apparatus for use with enterprise control
US6715125B1 (en) * 1999-10-18 2004-03-30 Agere Systems Inc. Source coding and transmission with time diversity
WO2001037263A1 (en) 1999-11-16 2001-05-25 Koninklijke Philips Electronics N.V. Wideband audio transmission system
CA2290037A1 (en) * 1999-11-18 2001-05-18 Voiceage Corporation Gain-smoothing amplifier device and method in codecs for wideband speech and audio signals
US7260523B2 (en) 1999-12-21 2007-08-21 Texas Instruments Incorporated Sub-band speech coding system
WO2001052241A1 (en) 2000-01-11 2001-07-19 Matsushita Electric Industrial Co., Ltd. Multi-mode voice encoding device and decoding device
US6757395B1 (en) * 2000-01-12 2004-06-29 Sonic Innovations, Inc. Noise reduction apparatus and method
US6704711B2 (en) 2000-01-28 2004-03-09 Telefonaktiebolaget Lm Ericsson (Publ) System and method for modifying speech signals
US6732070B1 (en) 2000-02-16 2004-05-04 Nokia Mobile Phones, Ltd. Wideband speech codec using a higher sampling rate in analysis and synthesis filtering than in excitation searching
JP3681105B2 (ja) 2000-02-24 2005-08-10 アルパイン株式会社 データ処理方式
FI119576B (fi) * 2000-03-07 2008-12-31 Nokia Corp Puheenkäsittelylaite ja menetelmä puheen käsittelemiseksi, sekä digitaalinen radiopuhelin
US6523003B1 (en) 2000-03-28 2003-02-18 Tellabs Operations, Inc. Spectrally interdependent gain adjustment techniques
US6757654B1 (en) 2000-05-11 2004-06-29 Telefonaktiebolaget Lm Ericsson Forward error correction in speech coding
DE60118627T2 (de) 2000-05-22 2007-01-11 Texas Instruments Inc., Dallas Vorrichtung und Verfahren zur Breitbandcodierung von Sprachsignalen
US7136810B2 (en) * 2000-05-22 2006-11-14 Texas Instruments Incorporated Wideband speech coding system and method
US7330814B2 (en) * 2000-05-22 2008-02-12 Texas Instruments Incorporated Wideband speech coding with modulated noise highband excitation system and method
JP2002055699A (ja) * 2000-08-10 2002-02-20 Mitsubishi Electric Corp 音声符号化装置および音声符号化方法
MXPA02003990A (es) * 2000-08-25 2002-10-23 Koninkl Philips Electronics Nv Metodo y apatao para reducir la longitud de palabra de una senal digital de entrada y metodo y aparato para recobrar la senal digital de entrada.
US6515889B1 (en) * 2000-08-31 2003-02-04 Micron Technology, Inc. Junction-isolated depletion mode ferroelectric memory
US7386444B2 (en) * 2000-09-22 2008-06-10 Texas Instruments Incorporated Hybrid speech coding and system
US6947888B1 (en) * 2000-10-17 2005-09-20 Qualcomm Incorporated Method and apparatus for high performance low bit-rate coding of unvoiced speech
JP2002202799A (ja) * 2000-10-30 2002-07-19 Fujitsu Ltd 音声符号変換装置
JP3558031B2 (ja) * 2000-11-06 2004-08-25 日本電気株式会社 音声復号化装置
CN1216368C (zh) * 2000-11-09 2005-08-24 皇家菲利浦电子有限公司 用于扩展语音信号的频率范围的方法和系统
SE0004163D0 (sv) 2000-11-14 2000-11-14 Coding Technologies Sweden Ab Enhancing perceptual performance of high frequency reconstruction coding methods by adaptive filtering
SE0004187D0 (sv) 2000-11-15 2000-11-15 Coding Technologies Sweden Ab Enhancing the performance of coding systems that use high frequency reconstruction methods
CN1200403C (zh) 2000-11-30 2005-05-04 松下电器产业株式会社 线性预测编码参数的矢量量化装置
GB0031461D0 (en) 2000-12-22 2001-02-07 Thales Defence Ltd Communication sets
US20040204935A1 (en) 2001-02-21 2004-10-14 Krishnasamy Anandakumar Adaptive voice playout in VOP
JP2002268698A (ja) 2001-03-08 2002-09-20 Nec Corp 音声認識装置と標準パターン作成装置及び方法並びにプログラム
US20030028386A1 (en) * 2001-04-02 2003-02-06 Zinser Richard L. Compressed domain universal transcoder
SE522553C2 (sv) * 2001-04-23 2004-02-17 Ericsson Telefon Ab L M Bandbreddsutsträckning av akustiska signaler
CN1529882A (zh) 2001-05-11 2004-09-15 西门子公司 用于扩展窄带滤波的语音信号、特别是由通信设备发送的语音信号的带宽的方法
US7174135B2 (en) * 2001-06-28 2007-02-06 Koninklijke Philips Electronics N. V. Wideband signal transmission system
US6879955B2 (en) 2001-06-29 2005-04-12 Microsoft Corporation Signal modification based on continuous time warping for low bit rate CELP coding
JP2003036097A (ja) 2001-07-25 2003-02-07 Sony Corp 情報検出装置及び方法、並びに情報検索装置及び方法
TW525147B (en) 2001-09-28 2003-03-21 Inventec Besta Co Ltd Method of obtaining and decoding basic cycle of voice
US6988066B2 (en) * 2001-10-04 2006-01-17 At&T Corp. Method of bandwidth extension for narrow-band speech
US6895375B2 (en) 2001-10-04 2005-05-17 At&T Corp. System for bandwidth extension of Narrow-band speech
TW526468B (en) 2001-10-19 2003-04-01 Chunghwa Telecom Co Ltd System and method for eliminating background noise of voice signal
JP4245288B2 (ja) * 2001-11-13 2009-03-25 パナソニック株式会社 音声符号化装置および音声復号化装置
JP2005509928A (ja) * 2001-11-23 2005-04-14 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ オーディオ信号帯域幅拡張
CA2365203A1 (en) * 2001-12-14 2003-06-14 Voiceage Corporation A signal modification method for efficient coding of speech signals
US6751587B2 (en) * 2002-01-04 2004-06-15 Broadcom Corporation Efficient excitation quantization in noise feedback coding with general noise shaping
JP4290917B2 (ja) * 2002-02-08 2009-07-08 株式会社エヌ・ティ・ティ・ドコモ 復号装置、符号化装置、復号方法、及び、符号化方法
JP3826813B2 (ja) 2002-02-18 2006-09-27 ソニー株式会社 ディジタル信号処理装置及びディジタル信号処理方法
JP3646939B1 (ja) * 2002-09-19 2005-05-11 松下電器産業株式会社 オーディオ復号装置およびオーディオ復号方法
JP3756864B2 (ja) 2002-09-30 2006-03-15 株式会社東芝 音声合成方法と装置及び音声合成プログラム
KR100841096B1 (ko) * 2002-10-14 2008-06-25 리얼네트웍스아시아퍼시픽 주식회사 음성 코덱에 대한 디지털 오디오 신호의 전처리 방법
US20040098255A1 (en) 2002-11-14 2004-05-20 France Telecom Generalized analysis-by-synthesis speech coding method, and coder implementing such method
US7242763B2 (en) 2002-11-26 2007-07-10 Lucent Technologies Inc. Systems and methods for far-end noise reduction and near-end noise compensation in a mixed time-frequency domain compander to improve signal quality in communications systems
CA2415105A1 (en) * 2002-12-24 2004-06-24 Voiceage Corporation A method and device for robust predictive vector quantization of linear prediction parameters in variable bit rate speech coding
KR100480341B1 (ko) * 2003-03-13 2005-03-31 한국전자통신연구원 광대역 저전송률 음성 신호의 부호화기
ATE368279T1 (de) * 2003-05-01 2007-08-15 Nokia Corp Verfahren und vorrichtung zur quantisierung des verstärkungsfaktors in einem breitbandsprachkodierer mit variabler bitrate
JP4212591B2 (ja) * 2003-06-30 2009-01-21 富士通株式会社 オーディオ符号化装置
US20050004793A1 (en) * 2003-07-03 2005-01-06 Pasi Ojala Signal adaptation for higher band coding in a codec utilizing band split coding
FI118550B (fi) 2003-07-14 2007-12-14 Nokia Corp Parannettu eksitaatio ylemmän kaistan koodaukselle koodekissa, joka käyttää kaistojen jakoon perustuvia koodausmenetelmiä
US7428490B2 (en) 2003-09-30 2008-09-23 Intel Corporation Method for spectral subtraction in speech enhancement
US7698292B2 (en) * 2003-12-03 2010-04-13 Siemens Aktiengesellschaft Tag management within a decision, support, and reporting environment
KR100587953B1 (ko) * 2003-12-26 2006-06-08 한국전자통신연구원 대역-분할 광대역 음성 코덱에서의 고대역 오류 은닉 장치 및 그를 이용한 비트스트림 복호화 시스템
CA2454296A1 (en) * 2003-12-29 2005-06-29 Nokia Corporation Method and device for speech enhancement in the presence of background noise
JP4259401B2 (ja) 2004-06-02 2009-04-30 カシオ計算機株式会社 音声処理装置及び音声符号化方法
US8000967B2 (en) * 2005-03-09 2011-08-16 Telefonaktiebolaget Lm Ericsson (Publ) Low-complexity code excited linear prediction encoding
US8155965B2 (en) 2005-03-11 2012-04-10 Qualcomm Incorporated Time warping frames inside the vocoder by modifying the residual
TWI319565B (en) * 2005-04-01 2010-01-11 Qualcomm Inc Methods, and apparatus for generating highband excitation signal
ES2350494T3 (es) 2005-04-01 2011-01-24 Qualcomm Incorporated Procedimiento y aparatos para codificar y decodificar una parte de banda alta de una señal de habla.
US9043214B2 (en) 2005-04-22 2015-05-26 Qualcomm Incorporated Systems, methods, and apparatus for gain factor attenuation

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9343076B2 (en) 2011-02-16 2016-05-17 Dolby Laboratories Licensing Corporation Methods and systems for generating filter coefficients and configuring filters
RU2562771C2 (ru) * 2011-02-16 2015-09-10 Долби Лабораторис Лайсэнзин Корпорейшн Способы и системы генерирования коэффициентов фильтра и конфигурирования фильтров
RU2651193C1 (ru) * 2011-02-18 2018-04-18 Нтт Докомо, Инк. Декодер речи, кодер речи, способ декодирования речи, способ кодирования речи, программа декодирования речи и программа кодирования речи
RU2707931C1 (ru) * 2011-02-18 2019-12-02 Нтт Докомо, Инк. Декодер речи, кодер речи, способ декодирования речи, способ кодирования речи, программа декодирования речи и программа кодирования речи
RU2599966C2 (ru) * 2011-02-18 2016-10-20 Нтт Докомо, Инк. Декодер речи, кодер речи, способ декодирования речи, способ кодирования речи, программа декодирования речи и программа кодирования речи
RU2742199C1 (ru) * 2011-02-18 2021-02-03 Нтт Докомо, Инк. Декодер речи, кодер речи, способ декодирования речи, способ кодирования речи, программа декодирования речи и программа кодирования речи
RU2630379C1 (ru) * 2011-02-18 2017-09-07 Нтт Докомо, Инк. Декодер речи, кодер речи, способ декодирования речи, способ кодирования речи, программа декодирования речи и программа кодирования речи
RU2718425C1 (ru) * 2011-02-18 2020-04-02 Нтт Докомо, Инк. Декодер речи, кодер речи, способ декодирования речи, способ кодирования речи, программа декодирования речи и программа кодирования речи
RU2674922C1 (ru) * 2011-02-18 2018-12-13 Нтт Докомо, Инк. Декодер речи, кодер речи, способ декодирования речи, способ кодирования речи, программа декодирования речи и программа кодирования речи
RU2575389C2 (ru) * 2011-03-04 2016-02-20 Телефонактиеболагет Л М Эрикссон (Пабл) Коррекция коэффициента усиления после квантования при кодировании аудио
RU2490727C2 (ru) * 2011-11-28 2013-08-20 Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования "Уральский государственный университет путей сообщения" (УрГУПС) Способ передачи речевых сигналов (варианты)
US9972325B2 (en) 2012-02-17 2018-05-15 Huawei Technologies Co., Ltd. System and method for mixed codebook excitation for speech coding
RU2633105C1 (ru) * 2013-02-15 2017-10-11 Хуавэй Текнолоджиз Ко., Лтд. Система и способ возбуждения смешанной кодовой книги для кодирования речи
RU2604425C2 (ru) * 2013-02-15 2016-12-10 Хуавэй Текнолоджиз Ко., Лтд. Система и способ возбуждения смешанной кодовой книги для кодирования речи
US10460738B2 (en) 2016-03-15 2019-10-29 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Encoding apparatus for processing an input signal and decoding apparatus for processing an encoded signal
RU2715026C1 (ru) * 2016-03-15 2020-02-21 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Устройство кодирования для обработки входного сигнала и устройство декодирования для обработки кодированного сигнала

Also Published As

Publication number Publication date
NZ562185A (en) 2010-06-25
CA2603219C (en) 2011-10-11
BRPI0607646A2 (pt) 2009-09-22
AU2006232361A1 (en) 2006-10-12
ATE485582T1 (de) 2010-11-15
RU2007140383A (ru) 2009-05-10
SG163555A1 (en) 2010-08-30
SG161224A1 (en) 2010-05-27
BRPI0607646B1 (pt) 2021-05-25
US20080126086A1 (en) 2008-05-29
AU2006232360A1 (en) 2006-10-12
NZ562182A (en) 2010-03-26
EP1864101A1 (en) 2007-12-12
EP1866915B1 (en) 2010-12-15
AU2006232357A1 (en) 2006-10-12
PL1869673T3 (pl) 2011-03-31
RU2381572C2 (ru) 2010-02-10
HK1115023A1 (en) 2008-11-14
CA2603255A1 (en) 2006-10-12
US8332228B2 (en) 2012-12-11
IL186441A0 (en) 2008-01-20
EP1866914B1 (en) 2010-03-03
HK1115024A1 (en) 2008-11-14
DE602006012637D1 (de) 2010-04-15
RU2007140382A (ru) 2009-05-10
SG163556A1 (en) 2010-08-30
KR100956876B1 (ko) 2010-05-11
RU2007140429A (ru) 2009-05-20
KR20070118167A (ko) 2007-12-13
CA2603219A1 (en) 2006-10-12
NZ562186A (en) 2010-03-26
NO20075514L (no) 2007-12-28
CA2603229C (en) 2012-07-31
WO2006107837A1 (en) 2006-10-12
EP1869670A1 (en) 2007-12-26
CA2603246C (en) 2012-07-17
MX2007012184A (es) 2007-12-11
TWI321314B (en) 2010-03-01
KR100956877B1 (ko) 2010-05-11
SI1864282T1 (sl) 2017-09-29
NO20075515L (no) 2007-12-28
NO340434B1 (no) 2017-04-24
JP5129116B2 (ja) 2013-01-23
JP5203929B2 (ja) 2013-06-05
TW200705390A (en) 2007-02-01
US20060277042A1 (en) 2006-12-07
KR20070118173A (ko) 2007-12-13
RU2376657C2 (ru) 2009-12-20
JP2008537606A (ja) 2008-09-18
US20070088541A1 (en) 2007-04-19
JP5161069B2 (ja) 2013-03-13
EP1866914A1 (en) 2007-12-19
MX2007012181A (es) 2007-12-11
HK1169509A1 (en) 2013-01-25
BRPI0608269A2 (pt) 2009-12-08
BRPI0608305B1 (pt) 2019-08-06
AU2006232357B2 (en) 2010-07-01
JP5129118B2 (ja) 2013-01-23
TWI321315B (en) 2010-03-01
RU2386179C2 (ru) 2010-04-10
BRPI0608270A2 (pt) 2009-10-06
IL186405A0 (en) 2008-01-20
WO2006107833A1 (en) 2006-10-12
IL186438A0 (en) 2008-01-20
US8244526B2 (en) 2012-08-14
CA2602804A1 (en) 2006-10-12
NZ562190A (en) 2010-06-25
BRPI0607690A2 (pt) 2009-09-22
US20060277038A1 (en) 2006-12-07
TW200705389A (en) 2007-02-01
EP1869673A1 (en) 2007-12-26
IL186438A (en) 2011-09-27
JP2008535025A (ja) 2008-08-28
US8260611B2 (en) 2012-09-04
DE602006017050D1 (de) 2010-11-04
TW200707405A (en) 2007-02-16
AU2006232362A1 (en) 2006-10-12
US8078474B2 (en) 2011-12-13
RU2007140406A (ru) 2009-05-10
NO20075511L (no) 2007-12-27
AU2006252957B2 (en) 2011-01-20
JP5129117B2 (ja) 2013-01-23
ATE482449T1 (de) 2010-10-15
WO2006107834A1 (en) 2006-10-12
US8069040B2 (en) 2011-11-29
CA2602806A1 (en) 2006-10-12
WO2006107838A1 (en) 2006-10-12
KR20070119722A (ko) 2007-12-20
RU2007140365A (ru) 2009-05-10
HK1114901A1 (en) 2008-11-14
MX2007012191A (es) 2007-12-11
BRPI0608269B1 (pt) 2019-07-30
MX2007012183A (es) 2007-12-11
TW200705387A (en) 2007-02-01
EP1869673B1 (en) 2010-09-22
EP1864283A1 (en) 2007-12-12
EP1869670B1 (en) 2010-10-20
AU2006232363A1 (en) 2006-10-12
EP1866915A2 (en) 2007-12-19
CN102411935A (zh) 2012-04-11
EP1864281A1 (en) 2007-12-12
IL186442A0 (en) 2008-01-20
WO2006107839A2 (en) 2006-10-12
NO20075503L (no) 2007-12-28
EP1864282A1 (en) 2007-12-12
US20070088558A1 (en) 2007-04-19
BRPI0607691B1 (pt) 2019-08-13
NO20075513L (no) 2007-12-28
RU2007140394A (ru) 2009-05-10
BRPI0608269B8 (pt) 2019-09-03
BRPI0607690A8 (pt) 2017-07-11
TWI316225B (en) 2009-10-21
ES2340608T3 (es) 2010-06-07
JP4955649B2 (ja) 2012-06-20
HK1113848A1 (en) 2008-10-17
IL186439A0 (en) 2008-01-20
TWI319565B (en) 2010-01-11
NO340428B1 (no) 2017-04-18
JP2008535024A (ja) 2008-08-28
WO2006107836A1 (en) 2006-10-12
JP2008537165A (ja) 2008-09-11
IL186405A (en) 2013-07-31
CA2603187A1 (en) 2006-12-07
WO2006130221A1 (en) 2006-12-07
BRPI0608306A2 (pt) 2009-12-08
CA2603187C (en) 2012-05-08
IL186442A (en) 2012-06-28
DE602006018884D1 (de) 2011-01-27
ATE492016T1 (de) 2011-01-15
RU2387025C2 (ru) 2010-04-20
ES2391292T3 (es) 2012-11-23
AU2006232358A1 (en) 2006-10-12
JP5203930B2 (ja) 2013-06-05
KR100956624B1 (ko) 2010-05-11
IL186404A (en) 2011-04-28
MX2007012185A (es) 2007-12-11
AU2006232363B2 (en) 2011-01-27
AU2006232364B2 (en) 2010-11-25
TW200707408A (en) 2007-02-16
ES2636443T3 (es) 2017-10-05
MX2007012189A (es) 2007-12-11
CA2603229A1 (en) 2006-10-12
BRPI0608305A2 (pt) 2009-10-06
JP2008535026A (ja) 2008-08-28
CA2602804C (en) 2013-12-24
AU2006232362B2 (en) 2009-10-08
KR100982638B1 (ko) 2010-09-15
AU2006232358B2 (en) 2010-11-25
DE602006017673D1 (de) 2010-12-02
TWI324335B (en) 2010-05-01
DK1864101T3 (da) 2012-10-08
JP5129115B2 (ja) 2013-01-23
NO20075510L (no) 2007-12-28
NO20075512L (no) 2007-12-28
SG161223A1 (en) 2010-05-27
RU2390856C2 (ru) 2010-05-27
PL1866915T3 (pl) 2011-05-31
KR100956523B1 (ko) 2010-05-07
TW200705388A (en) 2007-02-01
PT1864101E (pt) 2012-10-09
IL186443A0 (en) 2008-01-20
RU2413191C2 (ru) 2011-02-27
EP1864283B1 (en) 2013-02-13
BRPI0607691A2 (pt) 2009-09-22
US8484036B2 (en) 2013-07-09
PL1864282T3 (pl) 2017-10-31
KR20070118168A (ko) 2007-12-13
TW200703240A (en) 2007-01-16
TWI321777B (en) 2010-03-11
RU2402827C2 (ru) 2010-10-27
EP1864282B1 (en) 2017-05-17
RU2007140426A (ru) 2009-05-10
US20060271356A1 (en) 2006-11-30
IL186436A0 (en) 2008-01-20
AU2006252957A1 (en) 2006-12-07
CA2603231A1 (en) 2006-10-12
RU2491659C2 (ru) 2013-08-27
DK1864282T3 (en) 2017-08-21
BRPI0609530A2 (pt) 2010-04-13
RU2009131435A (ru) 2011-02-27
CA2603255C (en) 2015-06-23
CN102411935B (zh) 2014-05-07
RU2007140381A (ru) 2009-05-10
WO2006107840A1 (en) 2006-10-12
JP2008536170A (ja) 2008-09-04
KR101019940B1 (ko) 2011-03-09
US20060282263A1 (en) 2006-12-14
TWI330828B (en) 2010-09-21
KR20070118175A (ko) 2007-12-13
MX2007012187A (es) 2007-12-11
NO340566B1 (no) 2017-05-15
NZ562188A (en) 2010-05-28
PL1864101T3 (pl) 2012-11-30
US20070088542A1 (en) 2007-04-19
US8364494B2 (en) 2013-01-29
CA2602806C (en) 2011-05-31
MX2007012182A (es) 2007-12-10
TW200703237A (en) 2007-01-16
KR20070118174A (ko) 2007-12-13
KR20070118172A (ko) 2007-12-13
KR100956524B1 (ko) 2010-05-07
EP1864101B1 (en) 2012-08-08
US8140324B2 (en) 2012-03-20
AU2006232364A1 (en) 2006-10-12
PT1864282T (pt) 2017-08-10
IL186404A0 (en) 2008-01-20
NZ562183A (en) 2010-09-30
JP2008536169A (ja) 2008-09-04
JP2008535027A (ja) 2008-08-28
BRPI0609530B1 (pt) 2019-10-29
CA2603231C (en) 2012-11-06
WO2006107839A3 (en) 2007-04-05
KR100956525B1 (ko) 2010-05-07
ATE459958T1 (de) 2010-03-15
TWI320923B (en) 2010-02-21
AU2006232360B2 (en) 2010-04-29
KR20070118170A (ko) 2007-12-13
AU2006232361B2 (en) 2010-12-23
IL186443A (en) 2012-09-24
CA2603246A1 (en) 2006-10-12
AU2006232357C1 (en) 2010-11-25

Similar Documents

Publication Publication Date Title
RU2402826C2 (ru) Способы и устройство кодирования и декодирования части речевого сигнала диапазона высоких частот