RU2316059C2 - Способ и устройство для квантования усиления в широкополосном речевом кодировании с переменной битовой скоростью передачи - Google Patents

Способ и устройство для квантования усиления в широкополосном речевом кодировании с переменной битовой скоростью передачи Download PDF

Info

Publication number
RU2316059C2
RU2316059C2 RU2005137320/09A RU2005137320A RU2316059C2 RU 2316059 C2 RU2316059 C2 RU 2316059C2 RU 2005137320/09 A RU2005137320/09 A RU 2005137320/09A RU 2005137320 A RU2005137320 A RU 2005137320A RU 2316059 C2 RU2316059 C2 RU 2316059C2
Authority
RU
Russia
Prior art keywords
codebook
gain
quantization
subframes
pitch
Prior art date
Application number
RU2005137320/09A
Other languages
English (en)
Other versions
RU2005137320A (ru
Inventor
Милан ЖЕЛИНЕК
Редван САЛАМИ
Original Assignee
Нокиа Корпорейшн
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Нокиа Корпорейшн filed Critical Нокиа Корпорейшн
Publication of RU2005137320A publication Critical patent/RU2005137320A/ru
Application granted granted Critical
Publication of RU2316059C2 publication Critical patent/RU2316059C2/ru

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/083Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being an excitation gain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding

Abstract

Изобретение относится к способу и устройству квантования усиления для воплощения в методе кодирования дискретизированного звукового сигнала, обработанного в процессе кодирования последовательными кадрами из L выборок, где каждый кадр делится на некоторое число подкадров и каждый подкадр содержит некоторое число N выборок, где N<L. В способе и устройстве квантования усиления вычисляется начальное усиление основного тона на основании некоторого числа f подкадров, часть кодовой книги квантования усиления выбирается по отношению к начальному усилению основного тона, а усиления основного тона и фиксированной кодовой книги совместно квантуются. Это совместное квантование усилений основного тона и фиксированной кодовой книги содержит для некоторого числа f подкадров поиск в кодовой книге квантования усиления во взаимосвязи с критерием поиска. Поиск в кодовой книге ограничивается выбранной частью кодовой книги квантования усиления и индексом выбранной части кодовой книги квантования усиления, наилучшим образом отвечающим найденному критерию поиска. Технический результат - повышение пропускной способности системы. 8 н. и 45. з.п. ф-лы, 3 табл., 4 ил.

Description

Область техники, к которой относится изобретение
Настоящее изобретение относится к улучшенному методу цифрового кодирования звукового сигнала, в частности - но не исключительно - речевого сигнала, при передаче и синтезировании этого звукового сигнала.
Уровень техники
Потребность в эффективных методах цифрового узкополосного и широкополосного речевого кодирования с хорошим компромиссом между субъективным качеством и битовой скоростью передачи увеличивается в различных областях применения, таких как телеконференция, мультимедиа и беспроводная связь. До недавнего времени полоса частот телефонной связи, ограниченная в диапазоне 200-3400 Гц, использовалась главным образом в приложениях речевого кодирования. Однако широкополосные речевые приложения обеспечивают увеличенную разборчивость и естественность при передаче по сравнению с обычной полосой частот телефонной связи. Найдено, что полоса частот в интервале 50-7000 Гц достаточна для получения хорошего качества, дающего ощущение личного общения. Для общих аудиосигналов эта полоса частот дает приемлемое субъективное качество, которое все же ниже, чем качество FM радиосигнала или компакт-диска в диапазонах 20-16000 и 20-20000 Гц соответственно.
Речевой кодер преобразует речевой сигнал в цифровой битовый поток, который передается по каналу передачи или сохраняется на носителе данных. Речевой сигнал оцифровывается, то есть дискретизируется и квантуется обычно по 16 битов на выборку. Речевой кодер выполняет функцию представления этих цифровых отсчетов числом битов при поддержании хорошего субъективного качества речи. Речевой декодер или синтезатор работает на передаваемом или сохраненном битовом потоке и преобразует его обратно в звуковой сигнал.
Кодирование линейного предсказания с кодовым возбуждением (ЛПКВ) (CELP) является одним из лучших существующих методов для достижения хорошего компромисса между субъективным качеством и битовой скоростью передачи. Этот метод кодирования составляет основу для нескольких стандартов речевого кодирования как в беспроводных, так и в проводных приложениях. В кодировании ЛПКВ дискретизированный речевой сигнал обрабатывается в последовательных блоках из L выборок, обычно называемых кадрами, где L является заранее определенным числом, соответствующим обычно 10-30 мс. Фильтр линейного предсказания (ЛП) (LP) вычисляется и передается на каждый кадр. Для вычисления фильтра ЛП обычно необходим упреждающий просмотр, то есть речевой сегмент 5-15 мс из последующего кадра. Кадр из L выборок делится на меньшие блоки, называемые подкадрами. Обычно число подкадров равняется трем или четырем, что дает подкадры по 4-10 мс. В каждом подкадре сигнал возбуждения обычно получается из двух компонент: прошлого возбуждения и нового возбуждения из фиксированной кодовой книги. Компонент, сформированный из прошлого возбуждения, часто именуется адаптивной кодовой книгой или возбуждением основного тона. Параметры, характеризующие сигнал возбуждения, кодируются и передаются в декодер, где восстановленный сигнал возбуждения используется как входной сигнал для фильтра ЛП.
В беспроводных системах с помощью технологии множественного доступа с кодовым разделением каналов (МДКР) (CDMA) использование речевого кодирования с управляемой источником переменной битовой скоростью передачи (ПБСП) (VBR) значительно улучшает пропускную способность системы. При кодировании с управляемой источником ПБСП кодек работает на нескольких битовых скоростях передачи, а модуль выбора скорости используется для определения того, какая битовая скорость передачи используется для кодирования каждого речевого кадра, на основании природы речевого кадра (например, вокализованный, невокализованный, переходный, фоновый шум и так далее). Цель состоит в том, чтобы достигнуть наилучшего качества речи на данной средней битовой скорости передачи, также именуемой средней скоростью передачи данных (ССПД) (ADR). Кодек может работать с различными режимами, настраивая модуль выбора скорости для достижения различных ССПД в различных режимах работы, т.к. характеристика кодека улучшается при повышенных ССПД. Режим работы задается системой в зависимости от канальных условий. Это обеспечивает кодек механизмом компромисса между качеством речи и пропускной способностью системы. В системах МДКР (например, CDMA-one и CDMA2000) обычно используются 4 битовых скорости, именуемые как полная (вся) скорость (ВС) (FR), половинная скорость (ПС) (HR), скорость в одну четверть (СОЧ) (QR) и скорость в одну восьмую (СОВ) (ER). В этой системе поддерживаются два набора скоростей, именуемых как Набор I скоростей и Набор II скоростей. В Наборе II скоростей кодек переменной скорости с механизмом выбора скорости работает на битовых скоростях кодирования источника 13,3 (ВС), 6,2 (ПС), 2,7 (СОЧ) и 1,0 (СОВ) кбит/с, соответствующих главным битовым скоростям 14,4, 7,2, 3,6 и 1,8 кит/с (с некоторыми битами, добавленными для обнаружения ошибок).
Как правило, при кодировании ПБСП для систем МДКР используется скорость в одну восьмую для кодирования кадров без речевой активности (кадры паузы или только шума). Когда кадр является стационарным вокализованным или стационарным невокализованным, то используется половинная скорость или скорость в одну четверть в зависимости от режима работы. Когда используется половинная скорость для стационарных невокализованных кадров, то используется модель ЛПКВ без кодовой книги основного тона. Когда используется половинная скорость в случае стационарных голосовых кадров, используется изменение сигнала для увеличения периодичности и уменьшения числа битов для индексов основного тона. Если режим работы задает скорость в одну четверть, то никакое согласование формы сигнала обычно не возможно, поскольку число битов недостаточно, и обычно применяется некоторое параметрическое кодирование. Полная скорость используется для приступов (начальных согласных слога), переходных кадров и смешанных вокализованных кадров (обычно используется типичная модель ЛПКВ). В дополнение к управляемой источником работе кодека в системах МДКР, система может ограничить максимальную битовую скорость в некоторых вокализованных кадрах для того, чтобы послать канальную информацию сигнализации (называемую неясной и импульсной сигнализацией) или в течение плохих канальных условий (таких как вблизи границ ячейки), для того чтобы улучшить устойчивость кодека. Это именуется как максимум половинной скорости. Когда модуль выбора скорости выбирает кадр, который будет закодирован как кадр полной скорости, и система задает, например, кадр ПС, характеристика речи ухудшается, так как выделенные режимы ПС не способны эффективно кодировать приступы и переходные сигналы. Разработана другая общая модель кодирования ПС для обработки этих особых случаев.
Адаптивный многоскоростной широкополосный (АМС-ШП) (AMR-WB) речевой кодек был принят ITU-T (Международным союзом электросвязи - сектором стандартизации телекоммуникаций (МСЭ-ССТ)) для широкополосной речевой телефонии и услуг, и 3GPP (Проектом партнерства третьего поколения (ППТП)) для беспроводных систем третьего поколения GSM и Ш-МДКР (Широкополосный МДКР) (W-CDMA). Кодек АМС-ШП состоит из девяти битовых скоростей, а именно 6,60, 8,85, 12,65, 14,25, 15,85, 18,25, 19,85, 23,05 и 23,85 кбит/с. Проектирование управляемого источником основанного на АМС-ШП кодека ПБСП для систем МДКР имеет преимущество обеспечения взаимодействия между МДКР и другими системами, использующими кодек АМС-ШП. Битовая скорость АМС-ШП 12,65 кбит/с является ближайшей скоростью, которая может соответствовать полной скорости 13,3 кбит/с в Наборе II скоростей. Эта скорость может быть использована как общая скорость между широкополосным кодеком ПБСП МДКР и АМС-ШП, чтобы обеспечить функциональную совместимость, не требуя перекодирования (которое ухудшает качество речи). Типы кодирования с более низкими скоростями должны быть разработаны специально для широкополосного решения применительно к ПБСП МДКР, чтобы обеспечить эффективную работу в пределах Набора II скоростей. Кодек затем может работать в нескольких специфичных для МДКР режимах с использованием всех скоростей, но он будет иметь режим, который допускает функциональную совместимость с системами, использующими кодек АМС-ШП.
При кодировании ПБСП на основании ЛПКВ обычно все классы, за исключением невокализованных и неактивных вокализованных классов, используют кодовую книгу основного тона (или адаптивную) и кодовую книгу нововведения (или фиксированную) для представления сигнала возбуждения. Таким образом, кодированное возбуждение состоит из задержки основного тона (или индекса кодовой книги основного тона), усилия основного тона, индекса кодовой книги нововведения и усиления кодовой книги нововведения. Как правило, усиление основного тона и усиление нововведения совместно квантуются или векторно квантуются для снижения битовой скорости. Если они квантуются отдельно, то усиление основного тона требует 4 бита, а усиление кодовой книги нововведения требует 5 или 6 битов. Однако при совместном квантовании достаточно 6 или 7 битов (экономия 3 бита на подкадр 5 мс эквивалентна экономии 0,6 кбит/с). В общем, таблица квантования или кодовая книга формируется с использованием речевых сегментов всех типов (например, вокализованных, невокализованных, переходных, приступов, смещений и так далее). В контексте кодирования ПБСП модели кодирования с половинной скоростью являются обычно специфическими для класса. Поэтому различные модели с половинной скоростью разрабатываются для различных классов сигналов (вокализованных, невокализованных или общих). Таким образом, новые таблицы квантования должны быть разработаны для таких ориентированных на классы сигналов моделей кодирования.
Сущность изобретения
Настоящее изобретение относится к способу квантования усиления для воплощения в методе кодирования дискретизированного звукового сигнала, обрабатываемого в процессе кодирования последовательными кадрами из L выборок, в котором:
- каждый кадр делится на некоторое число подкадров;
- каждый подкадр включает в себя некоторое число N выборок, где N<L; и
- способ квантования усиления включает в себя: вычисление начального усиления основного тона на основании некоторого числа f подкадров; выбор части кодовой книги квантования усиления по отношению к начальному усилению основного тона; идентификацию выбранной части кодовой книги квантования усиления с использованием, по меньшей мере, одного бита на последующую группу из f подкадров; и совместное квантование усилений основного тона и фиксированной кодовой книги.
Объединенное квантование усилений основного тона и фиксированной кодовой книги включает в себя, для некоторого числа f подкадров, поиск в кодовой книге квантования усиления во взаимосвязи с критерием поиска. Поиск в кодовой книге квантования усиления включает в себя ограничение поиска в кодовой книге до выбранной части кодовой книги квантования усиления и нахождение индекса выбранной части кодовой книги квантования усиления, наилучшим образом отвечающего критерию поиска.
Настоящее изобретение также относится к устройству квантования усиления для воплощения в системе для кодирования дискретизированного звукового сигнала, обрабатываемого, в процессе кодирования, последовательными кадрами из L выборок, в котором:
каждый кадр делится на некоторое число подкадров;
каждый подкадр включает в себя некоторое число N выборок, где N<L; и
устройство квантования усиления включает в себя: средство для вычисления начального усиления основного тона на основании некоторого числа f подкадров; средство для выбора части кодовой книги квантования усиления по отношению к начальному усилению основного тона; средство для идентификации выбранной части кодовой книги квантования усиления с использованием, по меньшей мере, одного бита на последующую группу из f подкадров; и средство для совместного квантования усилений основного тона и фиксированной кодовой книги.
Средство для объединенного квантования усилений основного тона и фиксированной кодовой книги включает в себя средство для поиска в кодовой книге квантования усиления во взаимосвязи с критерием поиска. Упомянутое средство поиска в кодовой книге квантования усиления включает в себя средство для ограничения - для некоторого числа f подкадров - поиска в кодовой книге до выбранной части кодовой книги квантования усиления и средство для нахождения индекса выбранной части кодовой книги квантования усиления, наилучшим образом отвечающего критерию поиска.
Настоящее изобретение далее относится к устройству квантования усиления для воплощения в методе кодирования дискретизированного звукового сигнала, обрабатываемого, в процессе кодирования, последовательными кадрами из L выборок, в котором:
- каждый кадр делится на некоторое число подкадров;
- каждый подкадр включает в себя некоторое число N выборок, где N<L; и
- устройство квантования усиления включает в себя: вычислитель начального усиления основного тона на основании некоторого числа f подкадров; селектор части кодовой книги квантования усиления по отношению к начальному усилению основного тона; идентификатор выбранной части кодовой книги квантования усиления с использованием, по меньшей мере, одного бита на последующую группу из f подкадров; и совместный квантователь для совместного квантования усилений основного тона и фиксированной кодовой книги.
Совместный квантователь включает в себя средство поиска в выбранной части кодовой книги квантования усиления во взаимосвязи с критерием поиска, причем это средство поиска в кодовой книге квантования усиления ограничивает поиск в кодовой книге до выбранной части кодовой книги квантования усиления и находит индекс выбранной части кодовой книги квантования усиления, наилучшим образом отвечающий критерию поиска.
Настоящее изобретение еще далее относится к способу квантования усиления для воплощения в методе для кодирования дискретизированного звукового сигнала, обрабатываемого, в процессе кодирования, последовательными кадрами из L выборок, в котором каждый кадр делится на некоторое число подкадров и каждый подкадр включает в себя некоторое число N выборок, где N<L. Этот способ квантования усиления содержит:
вычисление начального усиления основного тона на основании периода К длиннее, чем подкадр;
выбор части кодовой книги квантования усиления по отношению к начальному усилению основного тона;
идентификацию выбранной части кодовой книги квантования усиления с использованием, по меньшей мере, одного бита на последующую группу из f подкадров; и
совместное квантования усилений основного тона и фиксированной кодовой книги, причем совместное квантования усилений основного тона и фиксированной кодовой книги содержит:
поиск в кодовой книге квантования усиления во взаимосвязи с критерием поиска, причем поиск в кодовой книге квантования усиления включает в себя ограничение поиска в кодовой книге до выбранной части кодовой книги квантования усиления и поиск индекса выбранной части кодовой книги квантования усиления, наилучшим образом отвечающего критерию поиска; и
вычисление начального усиления основного тона на основании периода К длиннее, чем подкадр, содержит использование следующего отношения:
Figure 00000002
,
где TOL является задержкой основного тона без обратной связи, а sw(n) является сигналом, полученным из перцепционно взвешенного варианта дискретизированного звукового сигнала.
Наконец, настоящее изобретение относится к устройству квантования усиления для воплощения в методе для кодирования дискретизированного звукового сигнала, обрабатываемого в процессе кодирования последовательными кадрами из L выборок, в котором каждый кадр делится на некоторое число подкадров и каждый подкадр включает в себя некоторое число N выборок, где N<L, причем устройство квантования усиления содержит:
вычислитель начального усиления основного тона на основании периода К длиннее, чем подкадр;
селектор части кодовой книги квантования усиления по отношению к начальному усилению основного тона;
идентификатор выбранной части кодовой книги квантования усиления с использованием, по меньшей мере, одного бита на последующую группу из f подкадров; и
совместный квантователь для совместного квантования усилений основного тона и фиксированной кодовой книги, причем совместный квантователь содержит:
средство поиска в выбранной части кодовой книги квантования усиления по отношению к критерию поиска, это средство поиска в кодовой книге квантования усиления ограничивает поиск в кодовой книге до выбранной части кодовой книги квантования усиления и находит индекс выбранной части кодовой книги квантования усиления, наилучшим образом отвечающий критерию поиска; и
вычислитель начального усиления основного тона содержит последующее отношение, используемое для вычисления начального усиления
Figure 00000003
основного тона:
Figure 00000002
,
где TOL является задержкой основного тона без обратной связи, а sw(n) является сигналом, полученным из перцепционно взвешенного варианта дискретизированного звукового сигнала.
Предшествующие и другие цели, преимущества и признаки настоящего изобретения поясняются в последующем неограничивающем описании иллюстративных вариантов осуществления со ссылками на чертежи.
Краткое описание чертежей
Фиг.1 - блок-схема системы передачи речи, иллюстрирующая контекст, в котором используются устройства речевого кодирования и декодирования в соответствии с настоящим изобретением;
Фиг.2 - функциональная блок-схема адаптивного многоскоростного широкополосного (АМС-ШП) (AMR-WB) кодера;
Фиг.3 - блок-схема алгоритма иллюстративного варианта осуществления способа согласно настоящему изобретению;
Фиг.4 - блок-схема алгоритма иллюстративного варианта осуществления устройства согласно настоящему изобретению.
Подробное описание предпочтительного варианта осуществления
Хотя иллюстративные варианты осуществления настоящего изобретения описаны ниже по отношению к речевому сигналу, следует иметь в виду, что настоящее изобретение может быть применено для других видов звуковых сигналов, таких как, например, аудиосигналы.
Фиг.1 показывает систему 100 передачи речи, изображающую контекст, в котором используются устройства речевого кодирования и декодирования в соответствии с настоящим изобретением. Система 100 передачи речи поддерживает передачу и воспроизведение речевого сигнала по каналу 105 связи. Хотя он может содержать, например, проводную, оптическую или оптоволоконную линию, канал 105 связи обычно содержит, по меньшей мере частично, радиочастотную линию. Радиочастотная линия зачастую поддерживает множество одновременных речевых передач, требующих совместного использования ресурсов полосы частот, как это имеет место в вариантах осуществления сотовой телефонии. Хотя и не показано, но канал 105 связи может быть заменен блоком памяти в варианте осуществления отдельного устройства системы связи, которое записывает и хранит кодированный речевой сигнал для последующего воспроизведения.
На передающей стороне микрофон 101 преобразует речь в аналоговый речевой сигнал 110, подаваемый на аналого-цифровой (АЦ) (A/D) преобразователь 102. Функция аналого-цифрового преобразователя 102 заключается в преобразовании аналогового речевого сигнала 110 в цифровой речевой сигнал 111. Речевой кодер 103 кодирует цифровой речевой сигнал, чтобы получить набор параметров 112 кодирования сигнала в двоичной форме, доставляемых к опциональному канальному кодеру 104. Опциональный канальный кодер 104 добавляет избыточность к двоичному представлению параметров 112 кодирования сигнала перед их передачей (113) по каналу 105 связи.
На приемной стороне канальный декодер 106 использует избыточную информацию в принимаемом битовом потоке 114 для обнаружения и исправления ошибок канала, возникающих в процессе передачи. Речевой декодер 107 преобразует битовый поток 115, принимаемых из канального декодера, обратно в набор параметров кодирования сигнала для восстановления синтезируемого речевого сигнала 116. Синтезируемый речевой сигнал 116, восстановленный в речевом декодере 107, преобразуется обратно в аналоговый речевой сигнал 117 в цифроаналоговом (ЦА) (D/A) преобразователе 108. Наконец, аналоговый речевой сигнал 117 воспроизводится через блок 109 громкоговорителя.
Краткий обзор кодера АМС-ШП
Ниже представлен обзор кодера АМС-ШП, работающего с битовой скоростью 12,65 кбит/с. Этот кодер АМС-ШП используется как кодер полной скорости в иллюстративных вариантах осуществления настоящего изобретения.
Входной дискретизированный звуковой сигнал 212, например, речевой сигнал, обрабатывается или кодируется на поблочной основе посредством кодера 200 на Фиг.2, который разделен на одиннадцать модулей, пронумерованных от 201 до 211.
Входной дискретизированный звуковой сигнал 212 преобразуется в вышеупомянутые последовательные блоки из L выборок, называемых кадрами.
Согласно Фиг.2 частота дискретизации входного дискретизированного речевого сигнала 112 понижается в средстве 201 понижения частоты дискретизации. Частота дискретизации входного речевого сигнала 212 понижается с частоты дискретизации 16 кГц до частоты дискретизации 12,8 кГц с помощью методов, общеизвестных специалистам в этой области техники. Понижение частоты дискретизации увеличивает эффективность кодирования, так как кодируется меньшая ширина полосы частот. Понижение частоты дискретизации также понижает алгоритмическую сложность, так как число выборок в кадре уменьшается. После понижения частоты кодирования кадр из 320 выборок, имеющий длительность в 20 мс, уменьшается до кадра 213 из 256 выборок (отношение понижения частоты дискретизации 4/5).
Кадр 213 с пониженной частотой дискретизации затем подается на опциональный блок предварительной обработки. В примере по Фиг.2 блок предварительной обработки состоит из фильтра 202 верхних частот с частотой отсечки 50 Гц. Этот фильтр 202 верхних частот удаляет нежелательные звуковые компоненты ниже 50 Гц.
Заранее обработанный сигнал с пониженной частотой дискретизации обозначается sp(n), где n=0, 1, 2, ..., L-1, а L является длиной кадра (256 на частоте дискретизации 12,81 кГц). Согласно неограничивающему примеру сигнал sp(n) предварительно корректируется с помощью фильтра 203 предварительной коррекции, имеющего следующую передаточную функцию:
Figure 00000004
(1)
где μ является коэффициентом предварительной коррекции со значением, расположенным между 0 и 1 (обычно значение μ = 0,7). Функция фильтра 203 предварительной коррекции заключается в усилении высокочастотных составляющих входного речевого сигнала. Фильтр 203 предварительной коррекции также понижает динамический диапазон входного речевого сигнала, что делает его более подходящим для реализации с фиксированной запятой. Предварительная коррекция также играет важную роль в реализации надлежащего общего перцепционного взвешивания ошибки квантования, что способствует улучшению качества звука. Это объяснено более подробно ниже.
Выходной сигнал фильтра 203 предварительной коррекции обозначен s(n). Этот сигнал s(n) используется для выполнения анализа ЛП в модуле 204 анализа ЛП, квантования и интерполяции. Анализ ЛП является методом, общеизвестным специалистам. В иллюстративном примере на Фиг.2 используется автокорреляционный метод. Согласно автокорреляционному методу сигнал s(n) сначала обрабатывается методом окна, в типовом случае окна Хемминга, имеющего обычно длину порядка 30-40 мс. Вычисляются автокорреляции из сигнала, обработанного методом окна, и используется рекурсия Левинсона-Дурбина для вычисления коэффициентов ai фильтра ЛП, где i=1, 2,..., p и где p является порядком ЛП, который обычно равен 16 при широкополосном кодировании. Параметры ai являются коэффициентами функции передачи фильтра ЛП, который задается следующим отношением:
Figure 00000005
(2)
Анализ ЛП выполняется в модуле 204 анализа ЛП, квантования и интерполяции, который также выполняет квантование и интерполяцию коэффициентов фильтра ЛП. Коэффициенты ai фильтра ЛП сначала преобразуются в другую эквивалентную область, более подходящую для целей интерполяции и квантования. Области линейной спектральной пары (ЛСП) (LSP) и иммитансной спектральной пары (ИСП) (ISP) являются двумя областями, в которых могут быть эффективно выполнены квантование и интерполяция. 16 коэффициентов ai фильтра ЛП могут быть квантованы числом битов порядка 30-50 с помощью расщепленного или многоступенчатого квантования или их комбинации. Назначение интерполяции состоит в обеспечении обновления коэффициентов ai фильтра ЛП каждого подкадра при передаче их один раз на каждый кадр, что улучшает производительность кодера без увеличения битовой скорости. В остальном квантование и интерполяция коэффициентов фильтра ЛП известны специалистам и поэтому далее не описываются.
Ниже описаны остальные операции кодирования, выполняемые на основе подкадров. В иллюстративном примере на Фиг.2 входной кадр делится на 4 подкадра по 5 мс (64 выборки при частоте дискретизации 12,8 кГц). В последующем описании фильтр A(z) означает неквантованный интерполированный фильтр ЛП подкадра, а фильтр
Figure 00000006
означает квантованный интерполированный фильтр ЛП подкадра.
В кодерах анализа через синтез оптимальный основной тон и инновационные параметры определяются путем минимизации среднеквадратичной ошибки между входной речью и синтезированной речью в перцепционно взвешенной области. Перцепционно взвешенный сигнал, обозначенный sw(n) на Фиг.2, вычисляется в перцепционно взвешивающем фильтре 205. Используется перцепционно взвешивающий фильтр 205 с фиксированным знаменателем, пригодный для широкополосных сигналов. Пример передаточной функции для перцепционно взвешивающего фильтра 205 дается следующим отношением:
Figure 00000007
Чтобы упростить анализ основного тона, сначала методом разомкнутого контура оценивается задержка TOL основного тона в модуле 206 поиска основного тона методом разомкнутого контура с помощью взвешенного речевого сигнала sw(n). Затем анализ основного тона методом замкнутого контура, который выполняется в модуле 207 поиска основного тона методом замкнутого контура на основе подкадра, ограничивается относительно задержки TOL основного тона разомкнутого контура, чтобы посредством этого значительно уменьшить сложность поиска параметров Т и gp ДВП (долговременного предсказания) (LTP) (задержка основного тона и усиление основного тона соответственно). Анализ основного тона разомкнутого контура обычно выполняется в модуле 206 каждые 10 мс (два подкадра) с помощью методов, общеизвестных специалисту.
Сначала вычисляется вектор x значения для анализа долговременного предсказания (ДВП) (LTP). Это обычно делается вычитанием нулевого входного отклика s0 взвешенного синтезирующего фильтра из взвешенного речевого сигнала sw(n). Этот нулевой входной отклик s0 вычисляется вычислителем 208 нулевого входного отклика в ответ на фильтр ЛП
Figure 00000009
квантованной интерполяции из модуля 204 анализа ЛП, квантования и интерполяции и на исходные состояния взвешенного синтезирующего фильтра , хранящегося в модуле обновления памяти, в ответ на фильтры А(z) и
Figure 00000009
и вектор u возбуждения. Это действие общеизвестно специалистам и поэтому далее не описывается.
N-мерный вектор h импульсного отклика взвешенного синтезирующего фильтра вычисляется в генераторе 209 с помощью коэффициентов A(z) и
Figure 00000009
фильтра ЛП из модуля 204 анализа ЛП, квантования и интерполяции. Это действие также известно специалистам и поэтому далее не описывается.
Параметры gр, T и j основного тона замкнутого контура (или кодовой книги основного тона) вычисляются в модуле 207 поиска основного тона методом замкнутого контура, который использует целевой вектор x(n), вектор h(n) импульсного отклика и задержку TOL основного тона разомкнутого контура, как входные сигналы.
Поиск основного тона состоит из нахождения наилучших задержки T и усиления gр, которые минимизируют среднеквадратичную ошибку предсказания взвешенного основного тона, например,
Figure 00000010
,
между целевым вектором x(n) и взвешенным фильтрованным вариантом прошлого возбуждения gр, yT(n).
Более конкретно поиск кодовой книги основного тона выполняется в три стадии.
На первой стадии оценивается задержка TOL основного тона разомкнутого контура в модуле 206 поиска методом основного тона разомкнутого контура в ответ на взвешенный речевой сигнал sw(n). Как показано выше, этот анализ основного тона разомкнутого контура обычно выполняется каждые 10 мс (два подкадра) известными методами.
На второй стадии отыскивается критерий С поиска в модуле 207 поиска основного тона методом замкнутого контура для целочисленных задержек основного тона вокруг оцененной задержки TOL основного тона разомкнутого контура (обычно ±5), что значительно упрощает процедуру поиска в кодовой книге основного тона. Используется простая процедура для обновления фильтрованного кодового вектора yT(n) (этот вектор определен ниже) без необходимости вычисления свертки для каждой задержки основного тона. Примером критерия С поиска может служить:
Figure 00000011
, где t означает транспонирование.
Когда оптимальная целочисленная задержка основного тона найдена на второй стадии, третья стадия поиска (модуль 207 поиска основного тона методом замкнутого контура) проверяет, посредством критерия С поиска, участки вокруг этой оптимальной целочисленной задержки основного тона. Например, кодер АМС-ШП использует разрешение в 1/4 и 1/2 выборки.
В широкополосных сигналах гармоническая структура существует только до некоторой частоты в зависимости от речевого сегмента. Таким образом, для обеспечения эффективного представления вклада основного тона в голосовые сегменты широкополосного речевого сигнала необходима гибкость для изменения величины периодичности по широкополосному спектру. Это достигается обработкой кодового вектора основного тона посредством множества частотных формирующих фильтров (например, низкочастотные или высокочастотные фильтры) и выбором частотного формирующего фильтра, который минимизирует выше определенную среднеквадратичную взвешенную ошибку e(y). Выбранный частотный формирующий фильтр обозначается индексом j.
Индекс Т кодовой книги основного тона кодируется и передается мультиплексору 214 для передачи по каналу связи. Усиление gр основного тона квантуется и передается мультиплексору 214. Дополнительный бит используется для кодирования индекса j, и этот дополнительный бит также подается на мультиплексор 214.
Как только определены основной тон и параметры gр, Т и j долговременного предсказания (ДВП) (LTP), следующий шаг состоит в поиске оптимального инновационного (фиксированной кодовой книги) возбуждения посредством модуля 210 поиска инновационного возбуждения по Фиг.2. Сначала целевой вектор x(n) обновляется вычитанием вклада ДВП:
Figure 00000012
где gр является усилением основного тона, а yT(n) является отфильтрованным вектором кодовой книги основного тона (прошлое возбуждение при задержке T основного тона, отфильтрованное выбранным частотным формирующим фильтром (индекс j) и подвергнутое свертке с импульсным откликом h(n)).
Процедура поиска инновационного возбуждения в ЛПКВ выполняется в инновационной (фиксированной) кодовой книге, чтобы найти оптимальные кодовый вектор ck возбуждения (фиксированной кодовой книги) и усиление gс, которые минимизируют среднеквадратичную ошибку E между целевым вектором x'(n) и масштабированным отфильтрованным вариантом кодового вектора ck, например:
Figure 00000013
где H является нижней треугольной сверточной матрицей, полученной из вектора h(n) импульсного отклика. Индекс k инновационной кодовой книги, соответствующий найденным оптимальным кодовому вектору ck, и усиление gс подаются на мультиплексор 214 для передачи через канал связи.
Следует отметить, что использованная инновационная кодовая книга может быть динамической кодовой книгой, состоящей из алгебраической кодовой книги, за которой следует адаптивный предварительный фильтр F(z), который усиливает заданные спектральные компоненты для того, чтобы улучшить качество речевого синтеза, согласно патенту США № 5444816, выданному на имя Adoul et al. 22 августа 1995. Конкретнее, поиск в инновационной кодовой книге может быть выполнен в модуле 210 посредством алгебраической кодовой книги, как описывается в патентах США № 5444816 (Adoul et al.), опубликованном 22 августа 1995; 5699482, выданном на имя Adoul et al. 17 декабря 1997; 5754976, выданном на имя Adoul et al. 19 Мая 1998, и 5701392 (Adoul et al.), датированном 23 декабря 1997.
Передается индекс k оптимального инновационного кодового вектора. В качестве неограничивающего примера алгебраическая кодовая книга используется, когда индекс состоит из положений и знаков импульсов ненулевой амплитуды в векторе возбуждения. Усиление gр основного тона и инновационное усиление gс окончательно квантуются с помощью процедуры совместного квантования, которая описана ниже.
Распределение битов кодера АМС-ШП, работающего в режиме 12,65 кбит/с, приводится в таблице 1.
Таблица 1
Битовое распределение в режиме 12,65 кбит/с в соответствии со стандартом АМС-ШП
Параметр Биты/Кадры
Параметры ЛП 46
Задержка основного тона 30=9+6+9+6
Фильтрация основного тона 4=1+1+1+1
Усиления 28=7+7+7+7
Алгебраическая кодовая книга 144=36+36+36+36
Признак ДАР (детектора активности речи) (VAD) 1
Итого 253 бита = 12,65 кбит/с
Совместное квантование усилений
Усиления gp кодовой книги основного тона и усиления gc инновационной кодовой книги могут быть проквантованы либо скалярно, либо векторно.
При скалярном квантовании усиление основного тона квантуется независимо с помощью обычно 4 битов (неравномерное квантование в пределах 0-1,2). Усиление инновационной кодовой книги обычно квантуется с помощью 5 или 6 битов; знак квантуется 1 битом, а величина 4 или 5 битами. Величина усилений обычно квантуется равномерно в логарифмической области.
При объединенном или векторном квантовании таблица квантования или кодовая книга квантования проектируется и сохраняется как на стороне кодера, так и на стороне декодера. Эта кодовая книга может быть двумерной кодовой книгой, имеющей размер, который зависит от числа битов, используемых для квантования двух усилений gр и gс. Например, 7-битовая кодовая книга, используемая для квантования двух усилений gр и gc, содержит 128 элементов записей с размерностью 2. Наилучший элемент записи для некоторого подкадра определяется минимизацией некоторого критерия ошибки. Например, наилучший элемент записи кодовой книги может быть найден минимизацией среднеквадратичной ошибки между входным сигналом и синтезируемым сигналом.
Для дальнейшего использования корреляции сигналов может быть выполнено предсказание на основе усиления gc инновационной кодовой книги. Как правило, предсказание выполняется на основе масштабированной энергии инновационной кодовой книги в логарифмической области.
Предсказание может быть проведено, например, с помощью предсказания скользящего среднего (ПС) (МА) с фиксированными коэффициентами. Например, предсказание MA четвертого порядка выполняется на основе энергии инновационной кодовой книги следующим образом. Пусть E(n) будет средней удаленной энергией инновационной кодовой книги (в дБ) в подкадре n и задается:
Figure 00000014
(3)
где N является размером подкадра, c(i) является возбуждением инновационной кодовой книги и
Figure 00000015
является средним значением энергии инновационной кодовой книги в дБ. В этом примере N=64 соответствует 5 мс при частоте дискретизации 12,8 кГц и
Figure 00000016
=30 дБ. Предсказанная энергия инновационной кодовой книги задается:
Figure 00000017
(4)
где [b1, b2, b3, b4] = [0,5, 0,4, 0,3, 0,2] являются коэффициентами предсказания ПС, а
Figure 00000018
является квантованной энергией ошибки предсказания в подкадре n-i. Предсказанная энергия инновационной кодовой книги используется для вычисления предсказанного инновационного усиления g'с, согласно уравнению (3), путем подстановки E(n) вместо
Figure 00000019
и gс вместо g'с. Это делается следующим образом. Сначала вычисляется средняя энергия инновационной кодовой книги с помощью следующего отношения:
Figure 00000020
, (5)
а затем предсказанное инновационное усиление g'с находится как
Figure 00000021
.(6)
Коэффициент корреляции между усилением gс, который вычисляется в процессе обработки входного речевого сигнала 212, и оцененным предсказанным усилением g'с задается как:
Figure 00000022
.(7)
Заметим, что ошибка предсказания энергии задается как:
Figure 00000023
(8)
Усиление gр основного тона и коэффициент γ корреляции являются вектором, совместно квантованным с помощью шестибитовой кодовой книги для скоростей АМС-ШП 8,85 кбит/с и 6,60 кбит/с и семибитовой кодовой книги для других скоростей АМС-ШП. Поиск кодовой книги квантования усиления выполняется минимизацией среднеквадратичной взвешенной ошибки между первоначальной и восстановленной речью, что задается следующим соотношением:
Figure 00000024
, (9)
где x является целевым вектором, y является фильтрованным сигналом основного тона кодовой книги (сигнал y(n) обычно вычисляется как свертка между вектором кодовой книги основного тона и импульсным откликом h(n) взвешенного синтезирующего фильтра), z является вектором инновационной кодовой книги, отфильтрованным посредством взвешенного синтезирующего фильтра, а t обозначает "транспонирование". Ошибка предсказания квантованной энергии, связанная с выбранными усилениями, используется для обновления R(n).
Квантование усиления при кодировании с переменной битовой скоростью
Использование управляемого источником речевого кодирования ПБС значительно улучшает пропускную способность множества систем связи, особенно беспроводных систем, использующих метод МДКР. При управляемом источником кодировании ПБС кодек работает на нескольких битовых скоростях, а модуль выбора скорости используется для определения битовой скорости, которая используется для кодирования каждого речевого кадра на основе характера речевого кадра, например, вокализованного, невокализованного, переходного, шумового и т.д. Цель состоит в том, чтобы получить наилучшее качество речи на заданной средней битовой скорости. Кодек может работать в различных режимах путем настройки модуля выбора скорости для достижения различных средних скоростей передачи (ССПД) (ADR), где производительность кодека улучшается с увеличением ССПД. В некоторых системах связи режим работы может определяться системой в зависимости от канальных условий. Это обеспечивает кодек механизмом принятия компромиссных решений между качеством речи и пропускной способностью системы. Кодек далее включает в себя алгоритм классификации сигналов для анализа входного речевого сигнала и для классификации каждого речевого кадра в один из набора заранее заданных классов, например, шумовой, вокализованный, невокализованный, смешанный вокализованный, переходный и так далее. Кодек также содержит алгоритм выбора скорости для принятия решения о том, какая битовая скорость и какая модель кодирования должны использоваться, на основании определенного класса речевого кадра и желаемой средней битовой скорости.
Например, когда используется система CDMA2000 (эта система далее упоминается как система МДКР), то обычно используются четырехбитовые скорости, именуемые как полная (вся) скорость (ВС) (FR), половинная скорость (ПС) (HR), скорость в одну четверть (СОЧ) (QR) и скорость в одну восьмую (СОВ) (ER). Также два набора скоростей, именуемые как Набор I скоростей и Набор II скоростей, поддерживаются системой МДКР. В Наборе II скоростей кодек переменной скорости с механизмом выбора скорости работает на кодируемых источником битовых скоростях 13,3 (ВС), 6,2 (ПС), 2,7 (СОЧ) и 1,0 (СОВ) кбит/с. В Наборе I скоростей кодируемыми источником битовыми скоростями являются 8,55 (ВС), 4,0 (ПС), 2,0 (СОЧ) и 0,8 (СОВ) кбит/с. Набор II скоростей рассматривается в иллюстративных вариантах осуществления настоящего изобретения.
При многорежимном кодировании ПБС различные режимы работы, соответствующие различным средним битовым скоростям, могут быть получены определением процента использования отдельных битовых скоростей. Таким образом, алгоритм выбора скорости выбирает битовую скорость, которая будет использоваться для некоторого речевого кадра, на основании характера речевого кадра (классификационной информации) и желаемой средней битовой скорости.
В дополнение к определению режима работы, система МДКР может также ограничивать максимальную битовую скорость в некоторых речевых кадрах для того, чтобы посылать канальную информацию сигнализации (называемую неясной и пакетной сигнализацией), или в течение плохих канальных условий (таких как вблизи границ ячейки), для того чтобы улучшить устойчивость кодека.
В иллюстративных вариантах осуществления настоящего изобретения используется управляемая источником многорежимная система кодирования с переменной битовой скоростью, которая может работать в Наборе II скоростей систем CDMA2000. Она называется далее переменным многоскоростным широкополосным (ПМС-ШП) (VMR-ВБ) кодеком. Этот кодек основывается на адаптивном многоскоростном широкополосном (АМС-ШП) речевом кодеке, как описано выше. Кодирование на полной скорости (ВС) (FR) основано на АМС-ШП при 12,65 кбит/с. Для стационарных вокализованных кадров разработана вокализованная модель кодирования ПС. Для невокализованных кадров разработаны невокализованная модель ПС и невокализованная модель СОЧ кодирования. Для фоновых шумовых кадров (неактивная речь) разработан генератор комфортного шума СОВ (ГКШ) (CNG). Когда алгоритм выбора скорости передачи выбирает модель ВС для конкретного кадра, но система связи вынуждает использовать ПС для целей сигнализации, тогда ни вокализованная ПС, ни невокализованная ПС не пригодны для кодирования кадра. Для этой цели разработана модель основной ПС. Модель основной ПС может также использоваться для кодирования кадров, не классифицированных как вокализованные или невокализованные, но с относительно низкой энергией по отношению к долговременной средней энергии, поскольку эти кадры имеют малую важность для восприятия.
Способы кодирования для вышеупомянутой системы обобщены в Таблице 2 и в общем упоминаются как типы кодирования. Другие типы кодирования могут использоваться без потери общности.
Таблица 2
Конкретные кодеры ПМС-ШП и их краткое описание
Методы кодирования Краткое описание
Основная ВС Универсальный кодек ВС, основанный на
АМС-ШП при 12,65 кбит/с
Основная ПС Универсальный кодек ПС
Вокализованная ПС Кодирование вокализованного кадра на ПС
Невокализованная ПС Кодирование невокализованного кадра на ПС
Невокализованная СОЧ Кодирование невокализованного кадра на СОЧ
ГКШ СОВ Генератор комфортного шума на СОВ
Кодовая книга квантования усиления для кодирования типа ВС разработана для всех классов сигнала, таких как вокализованный, невокализованный, переходный, приступ, смещение и т.д., с помощью обучающих процедур, известных специалистам. В контексте кодирования ПБС вокализованный и основной типы кодирования ПС используют как кодовую книгу основного тона, так и инновационную кодовую книгу для формирования сигнала возбуждения. Таким образом, подобно типу кодирования ВС, усиление основного тона и инновационное усиление (усиление кодовой книги основного тона и усиление инновационной кодовой книги) должны быть проквантованы. На более низких битовых скоростях, однако, выгодно снижать число битов квантования, что требует проектирования новых кодовых книг. Более того, для вокализованной ПС требуется новая кодовая книга квантования для этого типа кодирования конкретного класса. Поэтому иллюстративные варианты осуществления настоящего изобретения обеспечивают квантование усиления в кодировании ПБС, основанном на ЛПКВ, позволяющем уменьшить число битов для квантования усиления, не требуя проектирования новых кодовых книг квантования для типов кодирования с меньшей скоростью передачи. Более конкретно, используется часть кодовой книги, разработанной для типа кодирования основной ПС. Кодовая книга квантования усиления упорядочивается на основании значений усиления основного тона. Часть кодовой книги, используемая при квантовании, определяется на основе начального значения усиления основного тона, вычисленного по более долговременному периоду, например, по двум подкадрам или более, или синхронно с основным тоном в течение одного или нескольких периодов основного тона. Это приведет к снижению битовой скорости, так как информация, касающаяся части кодовой книги, не посылается на основе подкадров. Более того, это приведет к качественному улучшению в случае стационарных голосовых кадров, так как вариация усиления в пределах кадра будет уменьшаться.
Неквантованное усиление основного тона в подкадре вычисляется как
Figure 00000025
, (10)
где x(n) является целевым сигналом, y(n) является фильтрованным вектором кодовой книги основного тона и N является размером подкадра (число отсчетов в подкадре). Сигнал y(n) обычно вычисляется как свертка между вектором кодовой книги основного тона и импульсным откликом h(n) взвешенного синтезирующего фильтра. Вычисление целевого вектора и фильтрованного вектора кодовой книги основного тона при кодировании, основанном на ЛПКВ, известно специалистам. Пример этого вычисления описан в ссылках [ITU-T Recommendation G.722.2 «Wideband coding of speech at around 16 kbit/s using Adaptive Multi-Rate Wideband (AMR-WB)», Geneva, 2002] и [3GPP TS 26.190, «AMR Wideband Speech Codec; Transcoding Functions», 3GPP Technical Specification]. Для того чтобы уменьшить нестабильность в случае канальных ошибок, вычисленное усиление основного тона ограничивается диапазоном от 0 до 1,2.
Первый иллюстративный вариант осуществления
В первом неограничивающем иллюстративном варианте осуществления при кодировании первого подкадра в кадре с четырьмя подкадрами усиление gi начального основного тона вычисляется на основании первых двух подкадров одного и того же кадра с помощью уравнения (10), но для длины 2N (два подкадра). В этом случае уравнение (10) становится:
Figure 00000026
(11)
Затем вычисление целевого сигнала x(n) и фильтрованного сигнала y(n) кодовой книги основного тона также выполняется в течение двух подкадров, например, первый и второй подкадры кадра. Вычисление целевого сигнала x(n) в течение периода большего, чем один подкадр, выполняется расширением вычисления взвешенного речевого сигнала sw(n) и нулевого входного отклика s0 по более длинному периоду при использовании того же самого фильтра ЛП, как в начальном подкадре из двух первых подкадров для всего расширенного периода; целевой сигнал x(n) вычисляется как взвешенный речевой сигнал sw(n) после вычитания нулевого входного отклика s0 взвешенного синтезирующего фильтра
Figure 00000027
. Подобным же образом вычисление взвешенного сигнала y(n) кодовой книги основного тона выполняется расширением вычисления вектора v(n) кодовой книги основного тона и импульсного отклика h(n) взвешенного синтезирующего фильтра
Figure 00000027
первого подкадра по периоду большему, чем длина подкадра; взвешенный сигнал кодовой книги основного тона является сверткой между вектором v(n) кодовой книги и импульсным откликом h(n), где свертка в этом случае вычисляется по более длинному периоду.
После вычисления начального усиления gi основного тона по двум подкадрам, затем в течение кодирования ПЛП (половинной скорости передачи) первых двух подкадров, объединенное квантование усилений gр и gc основного тона и инновационного усиления ограничивается частью кодовой книги, используемой для квантования усилений на полной скорости (ВС), при этом данная часть определяется значением начального усиления основного тона, вычисленным по двум подкадрам. В первом иллюстративном варианте осуществления, при типе кодирования ВС, усиления gр и gс совместно квантуются с помощью 7 битов согласно процедуре квантования, описанной ранее; предсказание ПС применяется к инновационной энергии возбуждения в логарифмической области для получения предсказанного усиления инновационной кодовой книги, а коэффициент γ корреляции квантуется. Содержимое таблицы квантования, использованного в типе кодирования ВС (полная скорость), показано в Таблице 3 (как используется в АМС-ШП [ITU-T Recommendation G.722.2 «Wideband coding of speech at around 16 kbit/s using Adaptive Multi-Rate Wideband (AMR-WB)», Geneva, 2002] и [3GPP TS 26.190, «AMR Wideband Speech Codec; Transcoding Functions,» 3GPP Technical Specification]). В первом иллюстративном варианте осуществления квантование усиления gр и gc двух подкадров выполняется ограничением поиска в Таблице 3 (таблице квантования или кодовой книге) до первой или второй половины этой таблицы квантования согласно начальному значению gi усиления основного тона, вычисленного по двум подкадрам. Если начальное значение gi усиления основного тона меньше, чем 0,768606, то квантование в первых двух подкадрах ограничивается первой половиной Таблицы 3 (таблицы квантования или кодовой книги). Иначе, квантование ограничивается второй половиной Таблицы 3. Значение основного тона 0,768606 соответствует квантованному значению gс усиления основного тона в начале второй половины таблицы квантования (в верхней части пятой колонки в Таблице 3). Один бит необходим на каждые два подкадра для отображения того, какая часть таблицы квантования или кодовой книги используется для квантования.
Таблица 3:
Кодовая книга квантования усиления основного тона и коэффициента корреляции инновационного усиления в иллюстративном варианте осуществления согласно настоящему изобретению
gp γ gp γ gp γ gp γ
0,012445 0,215546 0,445842 1,301113 0,768606 1,789648 0,962628 2,514156
0,028326 0,965442 0,455671 5,519512 0,771245 4,085637 0,968507 0,588605
0,053042 0,525819 0,484764 0,387607 0,772613 0,778145 0,974739 0,339933
0,065409 1,495322 0,488696 0,967884 0,786483 1,283204 0,991738 1,750201
0,078212 2,323725 0,488730 0,666771 0,79246 2,412891 0,997210 0,936131
0,100504 0,751276 0,508189 1,516224 0,802393 0,544588 1,002422 1,250008
0,112617 3,427530 0,508792 2,348662 0,807156 0,255978 1,006040 2,167232
0,113124 0,309583 0,531504 3,883870 0,814280 1,544409 1,008848 3,129940
0,121763 1,140685 0,548649 1,112861 0,817839 0,938798 1,014404 5,842819
0,143515 7,519609 0,551182 0,514986 0,826959 2,910633 1,027798 4,287319
0,162430 0,568752 0,564397 1,742030 0,830453 0,684066 1,039404 1,489295
0,164940 1,904113 0,566598 0,796454 0,833431 1,171532 1,039628 8,947958
0,165429 4,947562 0,589255 3,081743 0,841208 1,908628 1,043214 0,765733
0,194985 0,855463 0,598816 1,271936 0,846440 5,333522 1,045089 2,537806
0,213527 1,281019 0,617654 0,333501 0,868280 0,841519 1,058994 1,031496
0,223544 0,414672 0,619073 2,040522 0,868622 1,435230 1,060415 0,478612
0,243135 2,781766 0,625282 0,950244 0,871449 3,675784 1,072132 12,8
0,257180 1,659565 0,630798 0,594883 0,881317 2,245058 1,074778 1,910049
0,269488 0,636749 0,638918 4,863197 0,882020 0,480249 1,076570 15,9999
0,286539 1,003938 0,650102 1,464846 0,882476 1,105804 1,107853 3,843067
0,328124 2,225436 0,668412 0,747138 0,902856 0,684850 1,110673 1,228576
0,328761 0,330278 0,669490 2,583027 0,904419 1,682113 1,110969 2,758471
0,336807 11,500983 0,683757 1,125479 0,909384 2,787801 1,140058 1,603077
0,339794 3,805726 0,691216 1,79274 0,916558 7,500981 1,155384 0,668935
0,344454 1,494626 0,718441 3,297789 0,918444 0,950341 1,176229 6,717108
0,346165 0,738748 0,722608 0,902743 0,919721 1,296319 1,179008 2,011940
0,363605 1,141454 0,728827 2,194941 0,940272 4,682978 1,187735 0,963552
0,398729 0,517614 0,729586 0,633849 0,940273 1,991736 1,199569 4,891432
0,415276 2,928666 0,730907 7,432957 0,950291 3,507281 1,206311 3,316329
0,416282 0,862935 0,731017 0,431076 0,957455 1,116284 1,215323 2,507536
0,423421 1,873310 0,731543 1,387847 0,957723 0,793034 1,223150 1,387102
0,444151 0,202244 0,759183 1,045210 0,958217 1,497824 1,296012 9,684225
Следует отметить, что для третьего и четвертого подкадров выполняется подобная же процедура квантования усиления. А именно, начальное усиление gi вычисляется по третьему и четвертому подкадрам, затем часть таблицы 3 квантования усиления (кодовая книга квантования усиления), которая будет использоваться в процедуре квантования, определяется на основе значения этого начального усиления gi основного тона. Наконец, совместное квантование двух усилений gр и gс ограничивается определенной частью кодовой книги, и один бит передается, чтобы указать, какая часть используется; один бит требуется, чтобы указать часть таблицы или кодовой книги, когда каждая часть кодовой книги соответствует половине кодовой книги квантования усиления.
На Фиг.3 и 4 показаны блок-схема алгоритма и блок-схема, обобщающая описанный выше первый вариант осуществления способа и устройства согласно настоящему изобретению.
Шаг 301 на Фиг.3 состоит из вычисления начального усиления gi основного тона по двум подкадрам. Шаг 301 выполняется вычислителем 401, как показано на Фиг.4.
Шаг 302 состоит из поиска, например, в семибитовой кодовой книге совместного квантования усиления, где начальный индекс ассоциируется с усилением основного тона, ближайшем к начальному усилению gi основного тона. Шаг 302 управляется блоком 402 поиска.
Шаг 303 состоит из выбора части (например, половины) кодовой книги квантования, содержащей начальный индекс, определенный в течение шага 302, и определения выбранной части кодовой книги (например, половины) с помощью, по меньшей мере, одного бита на два подкадра. Шаг 303 выполняется селектором 403 и идентификатором 404.
Шаг 304 состоит из ограничения поиска в таблице или кодовой книге в двух подкадрах для выбора части кодовой книги (например, половины) и определения выбранного индекса с, например, шестью битами на подкадр. Шаг 304 выполняется средством 405 поиска и квантователем 406.
В описанном выше первом иллюстративном варианте осуществления 7 битов на подкадр используются при кодировании ВС (с полной скоростью) для квантования усилений gр и gc, что дает 28 битов на кадр. При речевом и основном кодировании ПС (половинной скорости) используется та же самая кодовая книга квантования, как и при кодировании ВС (полной скорости). Однако используются только 6 битов на подкадр, а 2 дополнительных бита необходимы для целого кадра для указания, в случае половинной части, части кодовой книги при квантовании каждых двух подкадров. Это дает всего 26 битов на подкадр без увеличения объема памяти и с улучшенным качеством по сравнению с проектированием новой шестибитовой кодовой книги, как было найдено экспериментально. Фактически эксперименты показали объективные результаты (например, сегментное соотношение сигнал-шум (Сегм-С/Ш) (Seg-SNR), средняя битовая скорость, ...), эквивалентные или лучшие, чем результаты, полученные с помощью первоначального семибитового квантователя. Представляется, что эта улучшенная характеристика обусловлена уменьшением вариаций усиления в кадре. Таблица 4 показывает распределение битов различных моделей кодирования согласно первому иллюстративному варианту осуществления.
Таблица 4
Выделение битов для методов кодирования,
используемых в решении ПМС-ШП
Параметр Основная ВС Основная ПС Вокализованная ПС Невокализованная ПС Невокализованная
СОЧ
ГКШ СОВ
Информация класса - 1 3 2 1 -
Бит ДАР - - - - - -
Параметры
ЛП
46 36 36 46 32 14
Задержка основного
тона
30 13 9 - - -
Фильтрация основного
тона
4 - 2 - - -
Усиления 28 26 26 24 20 6
Алгебраическая
кодовая
книга
144 48 48 52 - -
Биты защиты
FER
14 - - - - -
Неиспользованные
биты
- - - - 1 -
Итого 266 124 124 124 54 20
Другой вариант первого иллюстративного варианта осуществления может быть легко получен для достижения большей экономии числа битов. Например, начальное усиление основного тона может быть вычислено по всему кадру, а часть кодовой книги (например, половина кодовой книги), используемая при квантовании двух усилений gр и gc, может быть определена для всех подкадров на основании начального значения gi усиления основного тона. В этом случае только 1 бит на кадр необходим для указания части кодовой книги (например, половины кодовой книги), что дает всего 25 битов.
Согласно другому примеру кодовая книга квантования усилия, которая сортируется на основании усиления основного тона, делится на 4 части, а начальное значение gi усиления основного тона используется для определения части кодовой книги, которая используется для процесса квантования. Для примера семибитовой кодовой книги, данной в Таблице 3, кодовая книга делится на 4 части по 32 элемента записи, соответствующих следующим диапазонам усиления основного тона: менее 0,445842, от 0,445842 до 0,768606, от 0,768606 до 0,962625 и более 0,962625. Только 5 битов необходимо для передачи индекса квантования в каждой части каждого подкадра, затем 2 бита необходимы каждые 2 подкадра для указаний используемой части кодовой книги. Это дает всего 24 бита. Далее та же самая часть кодовой книги может быть использована для всех четырех подкадров, для чего будут необходимы только 2 лишних бита на кадр, что дает всего 22 бита.
Также декодер (не показан) согласно первому иллюстративному варианту осуществления содержит, например, семибитовую кодовую книгу, используемую для хранения квантованных векторов усиления. Каждые два подкадра декодер принимает один бит (в случае половины кодовой книги) для идентификации части кодовой книги, которая использовалась для кодирования усилений gр и gс, и 6 битов на подкадр для извлечения квантованных усилений из этой части кодовой книги.
Второй иллюстративный вариант осуществления
Второй иллюстративный вариант осуществления подобен первому, объясненному выше в связи с Фиг.3 и 4, за исключением того, что начальное усиление gi основного тона вычисляется по-иному. Для упрощения вычисления в уравнении (11) может быть использован взвешенный звуковой сигнал sw(n) или низкочастотный фильтрованный прореженный взвешенный звуковой сигнал. Получается следующее соотношение:
Figure 00000002
(12)
где TOL является задержкой основного тона разомкнутого контура и K является временным периодом, по которому вычисляется начальное усиление gi основного тона. Временной период может быть равен 2 или 4 подкадрам, как описано выше, или может быть равен кратному значению периода TOL основного тона разомкнутого контура. Например, K может быть набором, равным TOL, 2TOL, 3TOL и так далее согласно значению TOL: большее число циклов основного тона может быть использовано для коротких периодов основного тона. Другие сигналы могут быть использованы в уравнении (12) без потери общности, такие как остаточный сигнал, выработанный в процессе кодирования, основанные на ЛПКВ.
Третий иллюстративный вариант осуществления
В третьем иллюстративном варианте осуществления настоящего изобретения используется идея ограничения части кодовой книги квантования усиления, которая определяется согласно начальному значению gi усиления основного тона, вычисленному по более длинному периоду времени, как это объяснено выше. Однако цель использования этого подхода заключается не в уменьшении битовой скорости, а в улучшении качества. Таким образом, нет необходимости в уменьшении числа битов на подкадр и посылке лишней информации относительно использованной части кодовой книги, поскольку индекс всегда квантуется для всего размера кодовой книги (7 битов согласно примеру Таблицы 3). Это не даст ограничения на часть кодовой книги, используемой для поиска. Ограничение поиска до части кодовой книги согласно начальному значению gi усиления основного тона, вычисленного по большему временному периоду, уменьшает флюктуацию в значениях квантованных усилений и улучшает общее качество, обеспечивая более плавное изменение формы сигнала.
Согласно неограничивающему примеру кодовая книга квантования в Таблице 3 используется в каждом подкадре. Начальное усиление gi основного тона может быть вычислено согласно уравнению (12) или уравнению (11) или любым другим соответствующим способом. Когда используется уравнение (12), примеры значений K (множество из периода основного тона разомкнутого контура) являются следующими: для значений основного тона TOL<50 K устанавливается 3TOL; для значений основного тона 51<TOL<96 K устанавливается 2TOL; в других случаях K устанавливается TOL.
После вычисления начального усиления gi основного тона поиск в кодовой книге квантования вектора ограничивается пределом от
Figure 00000028
до
Figure 00000029
, где
Figure 00000030
является индексом вектора кодовой книги квантования усиления, у которого значения усиления основного тона наиболее близко к начальному значению gi основного тона. Обычное значение p равняется 15 с ограничениями
Figure 00000031
и
Figure 00000032
. Как только индекс квантования усиления найден, оно кодируется с помощью 7 битов, как в обыкновенном квантовании усиления.
Конечно, множество других изменений и вариаций возможны для заявленного изобретения. Ввиду вышеизложенного подробного описания настоящего изобретения и иллюстрирующих чертежей такие другие изменения и вариации будут очевидны специалистам. Также понятно, что такие другие вариации могут быть осуществлены в объеме формулы изобретения, не отступая от сущности и объема настоящего изобретения.

Claims (53)

1. Способ кодирования дискретизированного звукового сигнала, причем дискретизированный звуковой сигнал содержит последовательные кадры, и каждый кадр содержит заранее определенное число подкадров, причем способ предназначен для определения параметра усиления gp кодовой книги основного тона и параметра усиления gc инновационной кодовой книги однократно на подкадр и выполнения совместного квантования параметра усиления gp кодовой книги основного тона и параметра усиления gc инновационной кодовой книги, определяемых для подкадра посредством поиска в кодовой книги квантования, содержащей число элементов записи, которое зависит от числа битов, используемых для квантования параметра усиления gp кодовой книги основного тона и параметра усиления gc инновационной кодовой книги, и каждый элемент записи имеет ассоциированный индекс записи, представленный заранее определенным числом битов, отличающийся тем, что операция квантования усиления содержит
вычисление начального усиления основного тона на основании заранее заданного числа f подкадров;
выбор части кодовой книги квантования по отношению к начальному усилению основного тона;
ограничение поиска в кодовой книге квантования выбранной частью кодовой книги квантования для двух или более последовательных подкадров;
поиск в выбранной части кодовой книги квантования индекса записи для идентификации элемента записи кодовой книги квантования, наилучшим образом представляющего параметр усиления gp кодовой книги основного тона и параметра усиления gc инновационной кодовой книги для подкадра из выбранной части кодовой книги квантования, и использование индекса записи, ассоциированного с идентифицируемым элементом записи, для представления параметра усиления gp кодовой книги основного тона и параметра усиления gc инновационной кодовой книги подкадра.
2. Способ по п.1, в котором определяют начальное усиление основного тона путем вычисления отношения первого и второго значений корреляции по формуле
Figure 00000033
где К представляет количество выборок, используемых при вычислении упомянутых первого и второго значений корреляции, х(n) является целевым сигналом, у(n) является фильтрованным адаптивным сигналом кодовой книги.
3. Способ по п.1, в котором выбранная часть кодовой книги квантования содержит половину элементов записи кодовой книги квантования.
4. Способ по п.2, в котором К равно числу выборок в двух подкадрах.
5. Способ по п.2, в котором вычисляют коэффициенты фильтра линейного предсказания для периода, равного одному подкадру дискретизированного звукового сигнала, причем фильтр линейного предсказания содержит число коэффициентов, соответствующее порядку фильтра; формируют перцепционный взвешенный фильтр, основанный на коэффициентах фильтра линейного предсказания; формируют взвешенный синтезирующий фильтр, основанный на коэффициентах фильтра линейного предсказания.
6. Способ по п.5, в котором формируют перцепционно взвешенный звуковой сигнал с помощью перцепционного взвешенного фильтра для дискретизированного звукового сигнала по периоду большему, чем один подкадр, вычисляют нулевой входной отклик взвешенного синтезирующего фильтра и формируют целевой сигнал путем вычитания нулевого входного отклика взвешенного синтезирующего фильтра из перцепционно взвешенного звукового сигнала.
7. Способ по п.5, в котором вычисляют адаптивный вектор кодовой книги по периоду большему, чем один подкадр; вычисляют импульсный отклик взвешенного синтезирующего фильтра и формируют фильтрованный адаптивный сигнал кодовой книги квантования путем свертки импульсного отклика взвешенного синтезирующего фильтра с адаптивным вектором кодовой книги квантования.
8. Способ по п.1, в котором вычисляют предсказанное инновационное усиление с помощью схемы предсказания на основе энергии инновационной кодовой книги и определяют параметр усиления gc инновационной кодовой книги путем вычисления коэффициента коррекции как отношения инновационного усиления и предсказанного инновационного усиления.
9. Способ по п.1, в котором вычисляют начальное усиление основного тона на основе, по меньшей мере, двух подкадров.
10. Способ по п.1, в котором повторяют вычисление начального усиления основного тона и выбор части кодовой книги квантования один раз на каждые f подкадров.
11. Способ по п.1, в котором выбор части кодовой книги квантования содержит поиск в кодовой книге квантования для нахождения индекса записи, ассоциированного со значением усиления основного тона кодовой книги квантования, ближайшего к начальному усилению основного тона, и выбор части кодовой книги квантования, содержащей упомянутый индекс записи.
12. Способ по п.1, в котором f равно числу подкадров в кадре.
13. Способ по п.1, в котором ограничение поиска в кодовой книге квантования выбранной частью кодовой книги квантования позволяет представить индекс записи, ассоциированный с элементом записи кодовой книги квантования, наилучшим образом представляющим параметр усиления gp кодовой книги основного тона и параметр усиления gc инновационной кодовой книги для подкадра, с использованием уменьшенного числа битов.
14. Способ по п.13, в котором ограничение поиска в кодовой книге квантования одной половиной кодовой книги квантования для каждого из двух последовательных подкадров позволяет представить индекс записи, ассоциированный с элементом записи кодовой книги, наилучшим образом представляющим параметр усиления gp кодовой книги основного тона и параметр усиления gc инновационной кодовой книги, для подкадра, с использованием числа битов на один меньше, причем бит-индикатор предназначен для указания половины кодовой книги, которой ограничивают поиск в кодовой книге квантования.
15. Способ по п.1, в котором формируют битовый поток, содержащий параметры кодирования, соответствующие упомянутым подкадрам, и индикатор, указывающий на выбранную часть кодовой книги квантования один раз на каждые два или более подкадров.
16. Способ по п.1, в котором вычисление начального усиления основного тона содержит использование следующего отношения:
Figure 00000034
где g'p является усилением основного тона, TOL является задержкой основного тона разомкнутого контура, К является временным периодом, sw(n) является сигналом, получаемым из перцепционной взвешенной версии дискретизированного звукового сигнала.
17. Способ по п.16, в котором К представляет значение основного тона разомкнутого контура.
18. Способ по п.16, в котором К представляет значение, кратное значению основного тона разомкнутого контура.
19. Способ по п.16, в котором К представляет значение, кратное числу выборок в подкадре.
20. Способ по п.1, в котором ограничение поиска в кодовой книге квантования содержит ограничение поиска в пределах от Iinit-p до Iinit+p, где Iinit является индексом вектора усиления кодовой книги квантования усиления, соответствующим усилению основного тона, ближайшему к начальному усилению основного тона, а р является целым числом.
21. Способ по п.20, в котором р равняется 15 с ограничениями Iinit-p≥0 и Iinit+p<128.
22. Способ декодирования битового потока, представляющего дискретизированный звуковой сигнал, причем дискретизированный звуковой сигнал содержит последовательные кадры, и каждый кадр содержит заранее заданное число подкадров, битовый поток содержит параметры кодирования, представляющие упомянутые подкадры, параметры кодирования для подкадров содержат параметр усиления gp кодовой книги основного тона и параметр усиления gc инновационной кодовой книги, которые совместно квантованы и представлены в битовом потоке индексом записи в кодовой книге квантования, причем способ содержит выполнение операции деквантования усиления для совместного деквантования параметра усиления gp кодовой книги основного тона и параметра усиления gc инновационной кодовой книги, отличающийся тем, что операция деквантования усиления содержит
прием битового потока, из которого выделяют индикатор, указывающий на выбранную часть кодовой книги квантования, используемую при квантовании упомянутых параметра усиления gp кодовой книги основного тона и параметра усиления gc инновационной кодовой книги, для двух или более подкадров, и
выделение для каждого из упомянутых двух или более подкадров параметра усиления gp кодовой книги основного тона и параметра усиления gc инновационной кодовой книги, из указанной части кодовой книги квантования.
23. Способ по п.22, в котором указание части кодовой книги квантования обеспечивается параметрами кодирования один раз на каждые два или более подкадров.
24. Способ по п.22, в котором вычисляют предсказанное инновационное усиление с помощью схемы предсказания на основе энергии инновационной кодовой книги, определяют параметр усиления gc инновационной кодовой книги путем вычисления коэффициента коррекции как отношения инновационного усиления и предсказанного инновационного усиления.
25. Кодер для кодирования дискретизированного звукового сигнала, причем дискретизированный звуковой сигнал содержит последовательные кадры, и каждый кадр содержит заранее определенное число подкадров, кодер предназначен для определения параметра усиления gp кодовой книги основного тона и параметр усиления gc инновационной кодовой книги однократно на подкадр и выполнения совместного квантования параметра усиления gp кодовой книги основного тона и параметра усиления gc инновационной кодовой книги, определяемых для подкадра посредством поиска в кодовой книге квантования, содержащей число элементов записи, и каждый элемент записи имеет ассоциированный индекс записи, представленный заранее определенным числом битов, отличающийся тем, что кодер предназначен для вычисления начального усиления основного тона на основании заранее заданного числа f подкадров; выбора части кодовой книги квантования по отношению к начальному усилению основного тона; ограничения поиска в кодовой книге квантования выбранной частью кодовой книги квантования для двух или более последовательных подкадров; поиска в выбранной части кодовой книги квантования индекса записи для идентификации элемента записи кодовой книги квантования, наилучшим образом представляющего параметр усиления gp кодовой книги основного тона и параметр усиления gc инновационной кодовой книги для подкадра из выбранной части кодовой книги квантования, и использования индекса записи, ассоциированного с идентифицированным элементом записи для представления параметра усиления gp кодовой книги основного тона и параметра усиления gc инновационной кодовой книги подкадра.
26. Кодер по п.25, в котором кодер предназначен для определения начального усиления основного тона путем вычисления отношения первого и второго значений корреляции как
Figure 00000035
где К представляет некоторое количество выборок, используемых при вычислении упомянутых первого и второго значений корреляции, х(n) является целевым сигналом, у(n) является фильтрованным адаптивным сигналом кодовой книги.
27. Кодер по п.25, в котором выбранная часть кодовой книги квантования содержит половину элементов записи кодовой книги квантования.
28. Кодер по п.26, в котором К равно числу выборок в двух подкадрах.
29. Кодер по п.26, содержащий модуль анализа линейного предсказания для вычисления коэффициентов фильтра линейного предсказания для периода, равного одному подкадру дискретизированного звукового сигнала, причем фильтр линейного предсказания содержит число коэффициентов, соответствующее порядку фильтра; перцепционный взвешенный фильтр для формирования взвешенного звукового сигнала на основе коэффициентов фильтра линейного предсказания и взвешенный синтезирующий фильтр для формирования взвешенного звукового сигнала на основе коэффициентов фильтра линейного предсказания.
30. Кодер по п.29, в котором кодер предназначен для формирования перцепционно взвешенного звукового сигнала с помощью перцепционного взвешенного фильтра для дискретизированного звукового сигнала по периоду большему, чем один подкадр, вычисления нулевого входного отклика взвешенного синтезирующего фильтра и формирования целевого сигнала путем вычитания нулевого входного отклика взвешенного синтезирующего фильтра из перцепционно взвешенного звукового сигнала.
31. Кодер по п.29, в котором кодер предназначен для вычисления адаптивного вектора кодовой книги квантования по периоду большему, чем один подкадр; вычисления импульсного отклика взвешенного синтезирующего фильтра и формирования фильтрованного адаптивного сигнала кодовой книги квантования путем свертки импульсного отклика взвешенного синтезирующего фильтра с адаптивным вектором кодовой книги квантования.
32. Кодер по п.25, в котором кодер предназначен для вычисления предсказанного инновационного усиления с помощью схемы предсказания на основе энергии инновационной кодовой книги и определения параметра усиления gc инновационной кодовой книги путем вычисления коэффициента коррекции как отношения инновационного усиления и предсказанного инновационного усиления.
33. Кодер по п.25, в котором кодер предназначен для вычисления начального усиления основного тона на основе, по меньшей мере, двух подкадров.
34. Кодер по п.25, в котором кодер предназначен для повторения вычисления упомянутого начального усиления основного тона и выбора части кодовой книги квантования один раз на каждый из f подкадров.
35. Кодер по п.25, в котором кодер предназначен для выбора части кодовой книги квантования посредством поиска в кодовой книге квантования для нахождения индекса записи, ассоциированного со значением усиления основного тона кодовой книги квантования, ближайшего к начальному усилению основного тона, и выбора части кодовой книги квантования, содержащей упомянутый индекс записи.
36. Кодер по п.25, в котором f равно числу подкадров в кадре.
37. Кодер по п.25, в котором кодер предназначен для ограничения поиска в кодовой книге квантования выбранной частью кодовой книг квантования, что позволяет представить индекс записи, ассоциированный с элементом записи кодовой книги квантования, наилучшим образом представляющим параметр усиления gp кодовой книги основного тона и параметр усиления gc инновационной кодовой книги для подкадра, с использованием уменьшенного числа битов.
38. Кодер по п.37, в котором кодер предназначен для ограничения поиска в кодовой книге квантования одной половиной кодовой книги квантования для каждого из двух последовательных подкадров, что позволяет представить индекс записи, ассоциированный с элементом записи кодовой книги квантования, наилучшим образом представляющим параметр усиления gp кодовой книги основного тона и параметр усиления gc инновационной кодовой книги для подкадра, с использованием числа битов на один меньше, причем бит-индикатор на каждые два подкадра предназначен для указания выделенной половины кодовой книги квантования, которой ограничивают поиск в кодовой книге квантования.
39. Кодер по п.25, в котором кодер предназначен для формирования битового потока, содержащего параметры кодирования, соответствующие упомянутым подкадрам, и индикатор, указывающий на выбранную часть кодовой книги квантования в параметрах кодирования один раз на каждые два или более подкадров.
40. Кодер по п.25, в котором кодер предназначен для вычисления начального усиления основного тона с использованием следующего отношения:
Figure 00000036
где
Figure 00000037
является усилением основного тона, TOL является задержкой основного тона разомкнутого контура, К является временным периодом, a sw(n) является сигналом, получаемым из перцепционной взвешенной версии дискретизированного звукового сигнала.
41. Кодер по п.40, в котором К представляет значение основного тона разомкнутого контура.
42. Кодер по п.40, в котором К представляет значение, кратное значению основного тона разомкнутого контура.
43. Кодер по п.40, в котором К представляет значение, кратное числу выборок в подкадре.
44. Кодер по п.25, в котором кодер предназначен для ограничения поиска в кодовой книге квантования и содержит ограничение поиска в пределах от Iinit-p до Iinit+p где Iinit является индексом вектора усиления кодовой книги квантования усиления, соответствующим усилению основного тона, ближайшему к начальному усилению основного тона, а р является целым числом.
45. Кодер по п.44, в котором р равняется 15 с ограничениями Iinit-p≥0 и Iinit+p<128.
46. Декодер для декодирования битового потока, представляющего дискретизированный звуковой сигнал, причем дискретизированный звуковой сигнал содержит последовательные кадры, и каждый кадр содержит заранее заданное число подкадров, битовый поток содержит параметры кодирования, представляющие упомянутые подкадры, параметры кодирования для подкадров содержат параметр усиления gp кодовой книги основного тона и параметр усиления gc инновационной кодовой книги, которые совместно квантованы и представлены в битовом потоке индексом записи в кодовой книге квантования, причем декодер предназначен для выполнения операции деквантования усиления для совместного деквантования парамета усиления gp кодовой книги основного тона и параметра усиления gc инновационной кодовой книги, отличающийся тем, что декодер предназначен для приема битового потока, из которого выделяют индикатор, указывающий на выбранную часть кодовой книги квантования, используемую при квантовании упомянутых параметра усиления gp кодовой книги основного тона и параметра усиления gc инновационной кодовой книги для двух или более подкадров, и выделения для каждого из упомянутых двух или более подкадров параметра усиления gp кодовой книги основного тона и параметра усиления gc инновационной кодовой книги из указанной части кодовой книги квантования.
47. Декодер по п.46, в котором декодер предназначен для выделения указания части кодовой книги квантования из параметров кодирования один раз на каждые два или более подкадров.
48. Декодер по п.46, в котором декодер предназначен для вычисления предсказанного инновационного усиления с помощью схемы предсказания на основе энергии инновационной кодовой книги и определения параметра усиления gc инновационной кодовой книги путем вычисления коэффициента коррекции как отношения инновационного усиления и предсказанного инновационного усиления.
49. Битовый поток, представляющий дискретизированный звуковой сигнал, причем дискретизированный звуковой сигнал содержит последовательные кадры, и каждый кадр содержит заранее заданное число подкадров, битовый поток содержит параметры кодирования, представляющие упомянутые подкадры, параметры кодирования для подкадров содержат параметр усиления gp кодовой книги основного тона и параметр усиления gc инновационной кодовой книги, которые совместно квантованы и представлены в битовом потоке индексом записи в кодовой книге квантования, отличающийся тем, что битовый поток содержит индикатор, указывающий выделенную часть кодовой книги квантования, используемую для квантования параметра усиления gp кодовой книги основного тона и параметра усиления gc инновационной кодовой книги для двух или более подкадров.
50. Битовый поток по п.49, в котором часть кодовой книги квантования, используемая для квантования параметра усиления gp кодовой книги основного тона и параметра усиления gc инновационной кодовой книги для упомянутых двух или более подкадров, определяется на основе начального усиления основного тона, вычисленного на основании заранее определенного числа f подкадров.
51. Сотовый телефон, содержащий кодер по п.25 и декодер по п.46.
52. Система речевой связи, содержащая кодер по п.25 и декодер по п.46.
53. Машиночитаемый носитель, содержащий компьютерную программу, обеспечивающую при исполнении на компьютере выполнение этапов способа по п.1.
RU2005137320/09A 2003-05-01 2004-03-12 Способ и устройство для квантования усиления в широкополосном речевом кодировании с переменной битовой скоростью передачи RU2316059C2 (ru)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US46678403P 2003-05-01 2003-05-01
US60/466,784 2003-05-01

Publications (2)

Publication Number Publication Date
RU2005137320A RU2005137320A (ru) 2006-06-10
RU2316059C2 true RU2316059C2 (ru) 2008-01-27

Family

ID=33418422

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2005137320/09A RU2316059C2 (ru) 2003-05-01 2004-03-12 Способ и устройство для квантования усиления в широкополосном речевом кодировании с переменной битовой скоростью передачи

Country Status (12)

Country Link
US (1) US7778827B2 (ru)
EP (1) EP1618557B1 (ru)
JP (1) JP4390803B2 (ru)
KR (1) KR100732659B1 (ru)
CN (1) CN1820306B (ru)
AT (1) ATE368279T1 (ru)
BR (1) BRPI0409970B1 (ru)
DE (1) DE602004007786T2 (ru)
HK (1) HK1082315A1 (ru)
MY (1) MY143176A (ru)
RU (1) RU2316059C2 (ru)
WO (1) WO2004097797A1 (ru)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2486610C2 (ru) * 2008-12-31 2013-06-27 Хуавэй Текнолоджиз Ко., Лтд. Способ кодирования сигнала и способ декодирования сигнала
RU2486609C2 (ru) * 2008-06-19 2013-06-27 Панасоник Корпорейшн Квантователь, кодер и их способы
RU2486484C2 (ru) * 2008-07-11 2013-06-27 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Вычислитель контура временной деформации, кодера аудиосигнала, кодированное представление аудиосигнала, способы и программное обеспечение
US8700388B2 (en) 2008-04-04 2014-04-15 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio transform coding using pitch correction
RU2520378C2 (ru) * 2009-05-28 2014-06-27 Квэлкомм Инкорпорейтед Динамический выбор форматов подкадров в беспроводной сети
US9015041B2 (en) 2008-07-11 2015-04-21 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Time warp activation signal provider, audio signal encoder, method for providing a time warp activation signal, method for encoding an audio signal and computer programs
RU2591011C2 (ru) * 2009-10-20 2016-07-10 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. Кодер аудиосигнала, декодер аудиосигнала, способ кодирования или декодирования аудиосигнала с удалением алиасинга (наложения спектров)
RU2591021C2 (ru) * 2011-02-15 2016-07-10 Войсэйдж Корпорейшн Устройство и способ для квантования усилений адаптивного и фиксированного вкладов возбуждения в кодеке celp
US9626982B2 (en) 2011-02-15 2017-04-18 Voiceage Corporation Device and method for quantizing the gains of the adaptive and fixed contributions of the excitation in a CELP codec
RU2644123C2 (ru) * 2013-10-18 2018-02-07 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Принцип для кодирования аудиосигнала и декодирования аудиосигнала с использованием детерминированной и шумоподобной информации
US10373625B2 (en) 2013-10-18 2019-08-06 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Concept for encoding an audio signal and decoding an audio signal using speech related spectral shaping information

Families Citing this family (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100668300B1 (ko) * 2003-07-09 2007-01-12 삼성전자주식회사 비트율 확장 음성 부호화 및 복호화 장치와 그 방법
EP1496500B1 (en) * 2003-07-09 2007-02-28 Samsung Electronics Co., Ltd. Bitrate scalable speech coding and decoding apparatus and method
US7353436B2 (en) * 2004-07-21 2008-04-01 Pulse-Link, Inc. Synchronization code methods
US8031583B2 (en) 2005-03-30 2011-10-04 Motorola Mobility, Inc. Method and apparatus for reducing round trip latency and overhead within a communication system
RU2376657C2 (ru) * 2005-04-01 2009-12-20 Квэлкомм Инкорпорейтед Системы, способы и устройства для высокополосного предыскажения шкалы времени
TWI317933B (en) * 2005-04-22 2009-12-01 Qualcomm Inc Methods, data storage medium,apparatus of signal processing,and cellular telephone including the same
US20070005347A1 (en) * 2005-06-30 2007-01-04 Kotzin Michael D Method and apparatus for data frame construction
US9454974B2 (en) * 2006-07-31 2016-09-27 Qualcomm Incorporated Systems, methods, and apparatus for gain factor limiting
US8400998B2 (en) 2006-08-23 2013-03-19 Motorola Mobility Llc Downlink control channel signaling in wireless communication systems
US7788827B2 (en) * 2007-03-06 2010-09-07 Nike, Inc. Article of footwear with mesh on outsole and insert
US9466307B1 (en) * 2007-05-22 2016-10-11 Digimarc Corporation Robust spectral encoding and decoding methods
KR101449431B1 (ko) * 2007-10-09 2014-10-14 삼성전자주식회사 계층형 광대역 오디오 신호의 부호화 방법 및 장치
CN101868821B (zh) * 2007-11-21 2015-09-23 Lg电子株式会社 用于处理信号的方法和装置
CN101499281B (zh) * 2008-01-31 2011-04-27 华为技术有限公司 一种语音编码中的增益量化方法及装置
EP2301021B1 (en) * 2008-07-10 2017-06-21 VoiceAge Corporation Device and method for quantizing lpc filters in a super-frame
CN102144256B (zh) * 2008-07-17 2013-08-28 诺基亚公司 用于针对矢量量化器的快速最近邻搜索的方法和设备
CN101604525B (zh) * 2008-12-31 2011-04-06 华为技术有限公司 基音增益获取方法、装置及编码器、解码器
KR20110001130A (ko) * 2009-06-29 2011-01-06 삼성전자주식회사 가중 선형 예측 변환을 이용한 오디오 신호 부호화 및 복호화 장치 및 그 방법
CA2778240C (en) * 2009-10-20 2016-09-06 Fraunhofer Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Multi-mode audio codec and celp coding adapted therefore
US8868432B2 (en) * 2010-10-15 2014-10-21 Motorola Mobility Llc Audio signal bandwidth extension in CELP-based speech coder
US8924200B2 (en) * 2010-10-15 2014-12-30 Motorola Mobility Llc Audio signal bandwidth extension in CELP-based speech coder
CN101986629B (zh) * 2010-10-25 2013-06-05 华为技术有限公司 估计窄带干扰的方法、装置及接收设备
KR20120046627A (ko) * 2010-11-02 2012-05-10 삼성전자주식회사 화자 적응 방법 및 장치
GB2490879B (en) 2011-05-12 2018-12-26 Qualcomm Technologies Int Ltd Hybrid coded audio data streaming apparatus and method
CN103915097B (zh) * 2013-01-04 2017-03-22 中国移动通信集团公司 一种语音信号处理方法、装置和系统
US9607624B2 (en) * 2013-03-29 2017-03-28 Apple Inc. Metadata driven dynamic range control
TWI557726B (zh) * 2013-08-29 2016-11-11 杜比國際公司 用於決定音頻信號的高頻帶信號的主比例因子頻帶表之系統和方法
CN106033672B (zh) 2015-03-09 2021-04-09 华为技术有限公司 确定声道间时间差参数的方法和装置
US10944418B2 (en) 2018-01-26 2021-03-09 Mediatek Inc. Analog-to-digital converter capable of generate digital output signal having different bits
CN113823298B (zh) * 2021-06-15 2024-04-16 腾讯科技(深圳)有限公司 语音数据处理方法、装置、计算机设备及存储介质

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SE504397C2 (sv) * 1995-05-03 1997-01-27 Ericsson Telefon Ab L M Metod för förstärkningskvantisering vid linjärprediktiv talkodning med kodboksexcitering
US5664055A (en) 1995-06-07 1997-09-02 Lucent Technologies Inc. CS-ACELP speech compression system with adaptive pitch prediction filter gain based on a measure of periodicity
US6260010B1 (en) * 1998-08-24 2001-07-10 Conexant Systems, Inc. Speech encoder using gain normalization that combines open and closed loop gains
US6397178B1 (en) * 1998-09-18 2002-05-28 Conexant Systems, Inc. Data organizational scheme for enhanced selection of gain parameters for speech coding
US7315815B1 (en) * 1999-09-22 2008-01-01 Microsoft Corporation LPC-harmonic vocoder with superframe structure
CA2290037A1 (en) * 1999-11-18 2001-05-18 Voiceage Corporation Gain-smoothing amplifier device and method in codecs for wideband speech and audio signals
ATE439666T1 (de) 2001-02-27 2009-08-15 Texas Instruments Inc Verschleierungsverfahren bei verlust von sprachrahmen und dekoder dafer
JP2005515486A (ja) 2002-01-08 2005-05-26 ディリチウム ネットワークス ピーティーワイ リミテッド Celpによる音声符号間のトランスコーディング・スキーム
JP4330346B2 (ja) 2002-02-04 2009-09-16 富士通株式会社 音声符号に対するデータ埋め込み/抽出方法および装置並びにシステム

Cited By (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8700388B2 (en) 2008-04-04 2014-04-15 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio transform coding using pitch correction
RU2486609C2 (ru) * 2008-06-19 2013-06-27 Панасоник Корпорейшн Квантователь, кодер и их способы
US9015041B2 (en) 2008-07-11 2015-04-21 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Time warp activation signal provider, audio signal encoder, method for providing a time warp activation signal, method for encoding an audio signal and computer programs
US9293149B2 (en) 2008-07-11 2016-03-22 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Time warp activation signal provider, audio signal encoder, method for providing a time warp activation signal, method for encoding an audio signal and computer programs
RU2486484C2 (ru) * 2008-07-11 2013-06-27 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Вычислитель контура временной деформации, кодера аудиосигнала, кодированное представление аудиосигнала, способы и программное обеспечение
US9466313B2 (en) 2008-07-11 2016-10-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Time warp activation signal provider, audio signal encoder, method for providing a time warp activation signal, method for encoding an audio signal and computer programs
US9431026B2 (en) 2008-07-11 2016-08-30 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Time warp activation signal provider, audio signal encoder, method for providing a time warp activation signal, method for encoding an audio signal and computer programs
US9646632B2 (en) 2008-07-11 2017-05-09 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Time warp activation signal provider, audio signal encoder, method for providing a time warp activation signal, method for encoding an audio signal and computer programs
US9502049B2 (en) 2008-07-11 2016-11-22 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Time warp activation signal provider, audio signal encoder, method for providing a time warp activation signal, method for encoding an audio signal and computer programs
US9025777B2 (en) 2008-07-11 2015-05-05 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio signal decoder, audio signal encoder, encoded multi-channel audio signal representation, methods and computer program
US9043216B2 (en) 2008-07-11 2015-05-26 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio signal decoder, time warp contour data provider, method and computer program
US9263057B2 (en) 2008-07-11 2016-02-16 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Time warp activation signal provider, audio signal encoder, method for providing a time warp activation signal, method for encoding an audio signal and computer programs
US9299363B2 (en) 2008-07-11 2016-03-29 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Time warp contour calculator, audio signal encoder, encoded audio signal representation, methods and computer program
US8515744B2 (en) 2008-12-31 2013-08-20 Huawei Technologies Co., Ltd. Method for encoding signal, and method for decoding signal
RU2486610C2 (ru) * 2008-12-31 2013-06-27 Хуавэй Текнолоджиз Ко., Лтд. Способ кодирования сигнала и способ декодирования сигнала
US8712763B2 (en) 2008-12-31 2014-04-29 Huawei Technologies Co., Ltd Method for encoding signal, and method for decoding signal
US8855062B2 (en) 2009-05-28 2014-10-07 Qualcomm Incorporated Dynamic selection of subframe formats in a wireless network
RU2520378C2 (ru) * 2009-05-28 2014-06-27 Квэлкомм Инкорпорейтед Динамический выбор форматов подкадров в беспроводной сети
RU2591011C2 (ru) * 2009-10-20 2016-07-10 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. Кодер аудиосигнала, декодер аудиосигнала, способ кодирования или декодирования аудиосигнала с удалением алиасинга (наложения спектров)
US9626982B2 (en) 2011-02-15 2017-04-18 Voiceage Corporation Device and method for quantizing the gains of the adaptive and fixed contributions of the excitation in a CELP codec
RU2591021C2 (ru) * 2011-02-15 2016-07-10 Войсэйдж Корпорейшн Устройство и способ для квантования усилений адаптивного и фиксированного вкладов возбуждения в кодеке celp
US10115408B2 (en) 2011-02-15 2018-10-30 Voiceage Corporation Device and method for quantizing the gains of the adaptive and fixed contributions of the excitation in a CELP codec
RU2644123C2 (ru) * 2013-10-18 2018-02-07 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Принцип для кодирования аудиосигнала и декодирования аудиосигнала с использованием детерминированной и шумоподобной информации
US10304470B2 (en) 2013-10-18 2019-05-28 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Concept for encoding an audio signal and decoding an audio signal using deterministic and noise like information
US10373625B2 (en) 2013-10-18 2019-08-06 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Concept for encoding an audio signal and decoding an audio signal using speech related spectral shaping information
US10607619B2 (en) 2013-10-18 2020-03-31 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Concept for encoding an audio signal and decoding an audio signal using deterministic and noise like information
US10909997B2 (en) 2013-10-18 2021-02-02 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Concept for encoding an audio signal and decoding an audio signal using speech related spectral shaping information
US11798570B2 (en) 2013-10-18 2023-10-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Concept for encoding an audio signal and decoding an audio signal using deterministic and noise like information
US11881228B2 (en) 2013-10-18 2024-01-23 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E. V. Concept for encoding an audio signal and decoding an audio signal using speech related spectral shaping information

Also Published As

Publication number Publication date
KR100732659B1 (ko) 2007-06-27
DE602004007786D1 (de) 2007-09-06
ATE368279T1 (de) 2007-08-15
US20050251387A1 (en) 2005-11-10
EP1618557A1 (en) 2006-01-25
EP1618557B1 (en) 2007-07-25
BRPI0409970A (pt) 2006-04-25
RU2005137320A (ru) 2006-06-10
CN1820306B (zh) 2010-05-05
JP4390803B2 (ja) 2009-12-24
US7778827B2 (en) 2010-08-17
MY143176A (en) 2011-03-31
BRPI0409970B1 (pt) 2018-07-24
HK1082315A1 (en) 2006-06-02
KR20060007412A (ko) 2006-01-24
CN1820306A (zh) 2006-08-16
JP2006525533A (ja) 2006-11-09
DE602004007786T2 (de) 2008-04-30
WO2004097797A1 (en) 2004-11-11

Similar Documents

Publication Publication Date Title
RU2316059C2 (ru) Способ и устройство для квантования усиления в широкополосном речевом кодировании с переменной битовой скоростью передачи
RU2461897C2 (ru) Способ и устройство, предназначенные для эффективной передачи сигналов размерности и пачки в полосе частот и работы с максимальной половинной скоростью при широкополосном кодировании речи с переменной скоростью передачи битов для беспроводных систем мдкр
JP2006525533A5 (ru)
US7280959B2 (en) Indexing pulse positions and signs in algebraic codebooks for coding of wideband signals
US5778335A (en) Method and apparatus for efficient multiband celp wideband speech and music coding and decoding
US6757649B1 (en) Codebook tables for multi-rate encoding and decoding with pre-gain and delayed-gain quantization tables
US6604070B1 (en) System of encoding and decoding speech signals
US6581032B1 (en) Bitstream protocol for transmission of encoded voice signals
KR100417634B1 (ko) 광대역 신호들의 효율적 코딩을 위한 인식적 가중디바이스 및 방법
RU2262748C2 (ru) Многорежимное устройство кодирования
JP4662673B2 (ja) 広帯域音声及びオーディオ信号復号器における利得平滑化
US20020035470A1 (en) Speech coding system with time-domain noise attenuation
JP4176349B2 (ja) マルチモードの音声符号器
KR20030046451A (ko) 음성 코딩을 위한 코드북 구조 및 탐색 방법
US7634402B2 (en) Apparatus for coding of variable bitrate wideband speech and audio signals, and a method thereof
Jayant et al. Speech coding with time-varying bit allocations to excitation and LPC parameters
JPH05265496A (ja) 複数のコードブックを有する音声符号化方法
JP3579276B2 (ja) 音声符号化/復号化方法
Sadek et al. An enhanced variable bit-rate CELP speech coder
AU2757602A (en) Multimode speech encoder

Legal Events

Date Code Title Description
PC41 Official registration of the transfer of exclusive right

Effective date: 20160602