RU2326450C2 - Способ и устройство для векторного квантования с надежным предсказанием параметров линейного предсказания в кодировании речи с переменной битовой скоростью - Google Patents

Способ и устройство для векторного квантования с надежным предсказанием параметров линейного предсказания в кодировании речи с переменной битовой скоростью Download PDF

Info

Publication number
RU2326450C2
RU2326450C2 RU2005123381/09A RU2005123381A RU2326450C2 RU 2326450 C2 RU2326450 C2 RU 2326450C2 RU 2005123381/09 A RU2005123381/09 A RU 2005123381/09A RU 2005123381 A RU2005123381 A RU 2005123381A RU 2326450 C2 RU2326450 C2 RU 2326450C2
Authority
RU
Russia
Prior art keywords
prediction
vector
stage
quantization
error vector
Prior art date
Application number
RU2005123381/09A
Other languages
English (en)
Other versions
RU2005123381A (ru
Inventor
Милан ЖЕЛИНЕК (CA)
Милан ЖЕЛИНЕК
Original Assignee
Нокиа Корпорейшн
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Нокиа Корпорейшн filed Critical Нокиа Корпорейшн
Publication of RU2005123381A publication Critical patent/RU2005123381A/ru
Application granted granted Critical
Publication of RU2326450C2 publication Critical patent/RU2326450C2/ru

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • G10L19/038Vector quantisation, e.g. TwinVQ audio
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/20Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

Изобретение относится к способу и устройству для квантования параметров линейного предсказания в кодировании звукового сигнала с переменной битовой скоростью, при котором принимают входной вектор параметров линейного предсказания, классифицируют кадр звукового сигнала, соответствующий входному вектору параметров линейного предсказания, вычисляют вектор предсказания, вычисленный вектор предсказания удаляют из входного вектора параметров линейного предсказания для создания вектора ошибки предсказания, и вектор ошибки предсказания квантуют. Вычисление вектора предсказания включает в себя выбор одной из множества схем предсказания в отношении классификации кадра звукового сигнала и обработку вектора ошибки предсказания посредством выбранной схемы предсказания. Изобретение относится к способу и устройству для обратного квантования параметров линейного предсказания в декодировании звукового сигнала с переменной битовой скоростью, при котором принимают, по меньшей мере, один индекс квантования и информацию классификации кадра звукового сигнала, соответствующую индексу квантования, восстанавливают вектор ошибки предсказания посредством применения индекса по меньшей мере к одной таблице квантования, воссоздают вектор предсказания, и создают вектор параметров линейного предсказания в зависимости от восстановленного вектора ошибки предсказания и воссозданного вектора предсказания. Воссоздание вектора предсказания включает в себя обработку восстановленного вектора ошибки предсказания посредством одной из множества схем предсказания в зависимости от информации классификации кадра. Технический результат - уменьшение ошибок квантования. 6 н. и 51 з.п ф-лы, 8 ил.

Description

Область техники, к которой относится изобретение
Настоящее изобретение относится к усовершенствованному способу цифрового кодирования звукового сигнала, в частности речевого сигнала и т.д., с точки зрения передачи и синтезирования указанного звукового сигнала. Более конкретно, настоящее изобретение имеет отношение к способу и устройству для векторного квантования параметров линейного предсказания в кодировании, основанном на линейном предсказании, с переменной битовой скоростью (скоростью передачи битов).
УРОВЕНЬ ТЕХНИКИ
Кодирование речи и квантование параметров линейного предсказания (ЛП, LP).
Системы цифровой речевой связи, например, системы радиосвязи, используют речевые кодеры для увеличения пропускной способности при поддержании высокого качества речи. Речевой кодер осуществляет преобразование речевого сигнала в цифровой поток битов, который передается через канал связи или сохраняется на носителе информации. Речевой сигнал оцифровывается, то есть дискретизируется и квантуется, обычно, 16-битами на выборку. Назначение речевого кодера состоит в представлении указанных цифровых выборок меньшим количеством битов при поддержании хорошего субъективного качества речи. Речевой декодер или синтезатор функционирует на переданном или сохраненном потоке битов и преобразует его обратно в звуковой сигнал.
Способы цифрового кодирования речи, основанные на анализе линейного предсказания, были очень удачны для кодирования речи с низкой битовой скоростью. В частности, одним из наилучших известных способов для достижения хорошего компромисса между субъективным качеством и битовой скоростью является кодирование с кодовым линейным предсказанием (CELP). Указанный способ кодирования является базовым для нескольких стандартов кодирования речи в приложениях проводной связи и радиосвязи. В CELP-кодировании дискретизированный речевой сигнал обрабатывается в последовательных блоках из N выборок, обычно называемых кадрами, где N является предварительно определенным числом, обычно соответствующим 10-30 мс. Каждый кадр вычисляется, кодируется, и передается фильтр A(z) линейного предсказания (LP). Обычно вычисление LP-фильтра A(z) требует просмотра вперед, включающего сегмент речи в 5-15 мс из последующего кадра. Кадр из N выборок делится на меньшие блоки, называемые подкадрами. Обычно количество подкадров составляет три или четыре, что приводит к подкадрам в 4-10 мс. В каждом подкадре сигнал возбуждения обычно получается из двух составляющих, прошлого возбуждения и нового возбуждения, устанавливаемого по кодовой книге. Составляющая, формируемая из прошлого возбуждения, часто определяется как возбуждение основным тоном или по адаптивной кодовой книге. Параметры, характеризующие сигнал возбуждения, кодируются и передаются в декодер, где воссозданный сигнал возбуждения используется в качестве входных данных синтезирующего LP-фильтра.
Синтезирующий LP-фильтр задается следующим образом:
Figure 00000002
где ai являются коэффициентами линейного предсказания, а М является порядком LP-анализа. Синтезирующий LP-фильтр моделирует огибающую спектра речевого сигнала. В декодере при фильтровании декодируемого возбуждения через синтезирующий LP-фильтр воссоздается речевой сигнал.
Набор коэффициентов линейного предсказания ai вычисляется так, чтобы минимизировалась ошибка предсказания
Figure 00000003
где s(n) является входным сигналом в момент времени n, а
Figure 00000004
(n) является сигналом, предсказанным на основе М последних выборок, заданным следующим образом:
Figure 00000005
Соответственно, ошибка предсказания задана следующим образом:
Figure 00000006
Это соответствует в области z-преобразования:
Figure 00000007
где A(z) является LP-фильтром порядка М, заданным следующим образом:
Figure 00000008
Обычно коэффициенты линейного предсказания ai вычисляются посредством минимизации среднеквадратичной ошибки предсказания по блоку L выборок, L является целым числом, обычно не меньшим N (L обычно соответствует 20-30 мс). Специалистам в данной области техники известны иные способы вычисления коэффициентов линейного предсказания. Возможный вариант такого вычисления приведен в [Рекомендации ITU-T G.722.2 "Wideband coding of speech at round 16 kbit/s using adaptive multi-rate wideband (AMR-WB)", Женева, 2002].
Коэффициенты линейного предсказания ai не могут непосредственно квантоваться для передачи в декодер. Причина этого состоит в том, что малые ошибки квантования на коэффициентах линейного предсказания могут создавать большие спектральные ошибки в функции преобразования LP-фильтра и могут даже привести к неустойчивости фильтра. Следовательно, до квантования к коэффициентам линейного предсказания ai применяется преобразование. Преобразование выдает то, что называется представлением коэффициентов линейного предсказания ai. Следовательно, после приема квантованных преобразованных коэффициентов линейного предсказания ai, декодер может применить обратное преобразование для получения квантованных коэффициентов линейного предсказания. Одним широко используемым представлением для коэффициентов линейного предсказания ai являются частоты спектральных линий (ЧСЛ, LSF), также известные как пары спектральных линий (ПСЛ, LSP). Подробности вычисления частот спектральных линий могут быть найдены в [Рекомендации ITU-T G.729 "Coding of speech at 8 kbit/s using conjugate-structure algebraic-code-excited linear prediction (CS-ACELP)", Женева, март 1996].
Подобным представлением являются частоты спектрального иммитанса (ЧСИ, ISF), которые использовались в стандарте кодирования AMR-WB [Рекомендации ITU-T G.722.2 "Wideband coding of speech at around 16 kbit/s using Adaptive Multi-Rate Wideband (AMR-WB)", Женева, 2002]. Возможны и использовались также другие представления. Без потери общности в последующем описании будет рассмотрен конкретный случай представления ISF.
Так полученные параметры LP (частоты LSF, ISF и т.д.) квантуются с использованием или скалярного квантования (СК, SQ) или векторного квантования (ВК, VQ). В скалярном квантовании параметры LP квантуются по отдельности и обычно требуется 3 или 4 бита на параметр. В векторном квантовании параметры LP группируются в вектор и квантуются как объект. Хранится кодовая книга, или таблица, содержащая набор квантованных векторов. Квантователь ищет кодовую книгу для элемента кодовой книги, который наиболее близок к входному вектору в соответствии с определенным показателем расстояния. Индекс выбранного квантованного вектора передается в декодер. Векторное квантование дает более высокую эффективность, чем скалярное квантование, но за счет повышенных требований на память и сложности.
Обычно для уменьшения сложности и требований на память VQ используется структурированное векторное квантование. В VQ с разделением вектор параметров LP разделяется по меньшей мере на два субвектора, которые квантуются по отдельности. В многоэтапном VQ квантованный вектор является суммой элементов из отдельных кодовых книг. VQ с разделением и многоэтапное VQ приводят к понижению сложности и уменьшению памяти при поддержании высокой эффективности квантования. Кроме того, интересующий подход должен объединять многоэтапное VQ и VQ с разделением для дополнительного понижения сложности и требования на память. Согласно [Рекомендации ITU-T G.729 "Coding of speech at 8 kbit/s using conjugate-structure algebraic-code-excited linear prediction (CS-ACELP)", Женева, март 1996], квантование вектора параметров LP осуществляется на двух этапах, где вектор второго этапа разделяется на два субвектора.
Параметры LP проявляют сильную корреляцию между последовательными кадрами, и это обычно используется при применении квантования с предсказанием для повышения эффективности. В векторном квантовании с предсказанием на основе информации из прошлых кадров вычисляется предсказанный вектор параметров LP. Затем предсказанный вектор удаляется из входного вектора, и осуществляется векторное квантование ошибки предсказания. Обычно используются два вида предсказания: (АР, AR) предсказание авторегрессией и предсказание скользящим средним значением (СС, MA). В AR предсказании предсказанный вектор вычисляется как комбинация квантованных векторов из прошлых кадров. В MA предсказании предсказанный вектор вычисляется как комбинация векторов ошибки предсказания из прошлых кадров. AR предсказание выдает лучшую эффективность. Однако AR предсказание не является надежным в условиях потери кадров, с которыми сталкиваются в системах радиосвязи и системах связи, основанных на пакетах. В случае потерянных кадров ошибка распространяется на последующие кадры, так как предсказание основывается на предыдущих разрушенных кадрах.
Кодирование с переменной битовой скоростью (ПБС, VBR)
В некоторых системах связи, например системах радиосвязи, использующих технологию множественного доступа с кодовым разделением каналов (МДКР, CDMA), использование кодирования речи с переменной битовой скоростью (VBR), управляемого источником, существенно повышает пропускную способность системы. В кодировании VBR, управляемом источником, кодер может функционировать при нескольких битовых скоростях, и используется блок выбора скорости для определения битовой скорости, используемой при кодировании каждого кадра речи, на основе характеристики кадра речи, например вокализованный, невокализованный, переходной, фоновый шум и т.д. Задача состоит в получении наилучшего качества речи при заданной средней битовой скорости, также определенной, как средняя скорость передачи данных (СПД, ADR). Кодер также может действовать в соответствии с различными режимами функционирования посредством настройки блока выбора скорости для получения различных ADR для различных режимов, где с увеличением ADR повышается эффективность кодера. Это обеспечивает кодер механизмом компромисса между качеством речи и пропускной способностью системы. В системах CDMA, например CDMA-one и CDMA2000, обычно используется 4 битовых скорости, определяемых как полноскоростная (ПС, FR), полускоростная (ПуС, HR), четвертьскоростная (ЧС, QR) и 1/8-скоростная (ER). В этой системе CDMA поддерживаются два набора скоростей и определяются, как Набор скоростей I и Набор скоростей II. В Наборе скоростей II кодер с переменной битовой скоростью с механизмом выбора скорости функционирует при битовых скоростях, управляемых источником, в 13,3 (FR); 6,2 (HF); 2,7 (QR) и 1,0 (ER) кбит/с, соответствующих большим битовым скоростям в 14,4; 7,2; 3,6 и 1,8 кбит/с (с некоторыми битами, добавленными для обнаружения ошибок).
Широкополосный кодек, известный как адаптивный многоскоростной широкополосный (AMR-WB) речевой кодек, недавно был выбран ITU-T (Международным телекоммуникационным союзом - Сектором стандартизации коммуникаций) для отдельной широкополосной речевой телефонной связи и услуг, и 3GPP (Проектом Партнерства третьего Поколения) для GSM (глобальной системы мобильной связи (ГСМС)) и W-CDMA (широкополосных множественного доступа с кодовым разделением каналов) систем радиосвязи третьего поколения. Кодек AMR-WB включает в себя девять битовых скоростей в диапазоне от 6,6 до 23,85 кбит/с. Разработка для системы CDMA2000 кодека VBR, управляемого источником, основанного на AMR-WB, имеет преимущество обеспечения возможности взаимодействия между CDMA2000 и другими системами, использующими кодек AMR-WB. Битовая скорость AMR-WB в 12,65 кбит/с является наиболее близкой скоростью, которая может соответствовать полноскоростной 13,3 кбит/с Набора Скоростей II CDMA2000, скорость в 12,65 кбит/с может использоваться как общая скорость между широкополосным VBR кодеком CDMA2000 и кодеком AMR-WB, которая обеспечивает возможность взаимодействия без транскодирования, которое ухудшает качество речи. Должна быть добавлена половинная скорость в 6,2 кбит/с для обеспечения возможности эффективного функционирования в структуре Набора II скоростей. Полученный в результате кодек может функционировать в некоторых режимах, определенных для CDMA2000, и включает в себя режим, обеспечивающий возможность взаимодействия с системами, использующими кодек AMR-WB.
Обычно полускоростное кодирование выбирается в кадрах, где входной речевой сигнал является стационарным. При менее частом обновлении параметров кодирования или при использовании меньшего количества битов для кодирования некоторых из этих параметров кодирования достигается экономия битов по сравнению с полноскоростным кодированием. Более конкретно, в стационарных вокализованных сегментах информация основного тона кодируется только один раз на кадр, и меньшее количество битов используется для представления фиксированных параметров кодовой книги и коэффициентов линейного предсказания.
Так как VQ с предсказанием с MA-предсказанием обычно применяется для кодирования коэффициентов линейного предсказания, то может наблюдаться излишнее повышение шума квантования в указанных коэффициентах линейного предсказания. MA-предсказание, в противоположность AR-предсказанию, используется для повышения надежности в отношении потерь кадров; однако, в стационарных кадрах коэффициенты линейного предсказания развиваются так медленно, что использование AR-предсказания в этом конкретном случае меньше влияет на распространение ошибки в случае потерянных кадров. При наблюдении можно заметить, что в случае отсутствия кадров, большинство декодеров применяет процедуру скрытия, которая по существу экстраполирует коэффициенты линейного предсказания последнего кадра. Если отсутствующий кадр является стационарным вокализованным кадром, то указанная экстраполяция создает значения, точно подобные переданным в действительности, но не принятым, параметрам LP. Соответственно, воссозданный вектор параметров LP является близким к тому, который должен был быть декодирован, если бы кадр не был потерян. Следовательно, в этом конкретном случае использование AR-предсказания в процедуре квантования коэффициентов линейного предсказания не может влиять слишком неблагоприятно на распространение ошибки квантования.
СУЩНОСТЬ ИЗОБРЕТЕНИЯ
Согласно настоящему изобретению, предложен способ квантования параметров линейного предсказания в кодировании звукового сигнала с переменной битовой скоростью, включающий в себя прием входного вектора параметров линейного предсказания, классификацию кадра звукового сигнала, соответствующего входному вектору параметров линейного предсказания, вычисление вектора предсказания, удаление вычисленного вектора предсказания из входного вектора параметров линейного предсказания для создания вектора ошибки предсказания, масштабирование вектора ошибки предсказания и квантование масштабированного вектора ошибки предсказания. Вычисление вектора предсказания включает выбор одной из множества схем предсказания в отношении классификации кадра звукового сигнала и вычисление вектора предсказания в соответствии с выбранной схемой предсказания. Масштабирование вектора ошибки предсказания включает выбор по меньшей мере одной из множества схем масштабирования в отношении выбранной схемы предсказания, и масштабирование вектора ошибки предсказания в соответствии с выбранной схемой масштабирования.
Также, согласно настоящему изобретению, предложено устройство для квантования параметров линейного предсказания в кодировании звукового сигнала с переменной битовой скоростью, содержащее средство приема входного вектора параметров линейного предсказания, средство классификации кадра звукового сигнала, соответствующего входному вектору параметров линейного предсказания, средство вычисления вектора предсказания, средство удаления вычисленного вектора предсказания из входного вектора параметров линейного предсказания для создания вектора ошибки предсказания, средство масштабирования вектора ошибки предсказания и средство квантования масштабированного вектора ошибки предсказания. Средство вычисления вектора предсказания содержит средство выбора одной из множества схем предсказания в отношении классификации кадра звукового сигнала, и средство вычисления вектора предсказания в соответствии с выбранной схемой предсказания. Также средство масштабирования вектора ошибки предсказания содержит средство выбора по меньшей мере одной из множества схем масштабирования в отношении выбранной схемы предсказания и средство масштабирования вектора ошибки предсказания в соответствии с выбранной схемой масштабирования.
Настоящее изобретение также относится к устройству для квантования параметров линейного предсказания в кодировании звукового сигнала с переменной битовой скоростью, содержащему вход для приема входного вектора параметров линейного предсказания, классификатор кадра звукового сигнала, соответствующего входному вектору параметров линейного предсказания, вычислитель вектора предсказания, вычитатель для удаления вычисленного вектора предсказания из входного вектора параметров линейного предсказания для создания вектора ошибки предсказания, блок масштабирования, снабжаемый вектором ошибки предсказания, этот блок масштабирует вектор ошибки предсказания, и квантователь масштабированного вектора ошибки предсказания. Вычислитель вектора предсказания содержит селектор одной из множества схем предсказания в отношении классификации кадра звукового сигнала для вычисления вектора предсказания в соответствии с выбранной схемой предсказания. Блок масштабирования содержит селектор по меньшей мере одной из множества схем масштабирования в отношении выбранной схемы предсказания для масштабирования вектора ошибки предсказания в соответствии с выбранной схемой масштабирования.
Настоящее изобретение, дополнительно, относится к способу обратного квантования параметров линейного предсказания в декодировании звукового сигнала с переменной битовой скоростью, включающему в себя прием по меньшей мере одного индекса квантования, прием информации относительно классификации кадра звукового сигнала, соответствующего упомянутому по меньшей мере одному индексу квантования, восстановление вектора ошибки предсказания посредством применения по меньшей мере одного индекса по меньшей мере к одной таблице квантования, воссоздание вектора предсказания и создание вектора параметров линейного предсказания в зависимости от восстановленного вектора ошибки предсказания и воссозданного вектора предсказания. Воссоздание вектора предсказания включает обработку восстановленного вектора ошибки предсказания посредством одной из множества схем предсказания в зависимости от информации классификации кадра.
Настоящее изобретение еще дополнительно относится к устройству для обратного квантования параметров линейного предсказания в декодировании звукового сигнала с переменной битовой скоростью, содержащему средство приема по меньшей мере одного индекса квантования, средство приема информации относительно классификации кадра звукового сигнала, соответствующего по меньшей мере одному индексу квантования, средство восстановления вектора ошибки предсказания посредством применения по меньшей мере одного индекса по меньшей мере к одной таблице квантования, средство воссоздания вектора предсказания и средство создания вектора параметров линейного предсказания в зависимости от восстановленного вектора ошибки предсказания и воссозданного вектора предсказания. Средство воссоздания вектора предсказания содержит средство обработки восстановленного вектора ошибки предсказания посредством множества схем предсказания в зависимости от информации классификации кадра.
В соответствии с последним аспектом настоящего изобретения, предложено устройство для обратного квантования параметров линейного предсказания в декодировании звукового сигнала с переменной битовой скоростью, содержащее средство приема по меньшей мере одного индекса квантования, средство приема информации относительно классификации кадра звукового сигнала, соответствующего по меньшей мере одному индексу квантования, по меньшей мере одну таблицу квантования, снабжаемую упомянутым по меньшей мере одним индексом квантования для восстановления вектора ошибки предсказания, блок воссоздания вектора предсказания и формирователь вектора параметров линейного предсказания в зависимости от восстановленного вектора ошибки предсказания и воссозданного вектора предсказания. Блок воссоздания вектора предсказания содержит по меньшей мере один предсказатель, снабжаемый восстановленным вектором ошибки предсказания для обработки восстановленного вектора ошибки предсказания посредством одной из множества схем предсказания в зависимости от информации классификации кадра.
Изложенные и другие задачи, преимущества и признаки настоящего изобретения станут более ясны после прочтения, согласно приложенным чертежам, не предназначенного для ограничения последующего описания его иллюстративных вариантов осуществления, приведенных исключительно в виде возможного варианта.
КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ
Фиг.1 - блок-схема, иллюстрирующая возможный вариант, не предназначенный для ограничения, многоэтапного векторного квантователя.
Фиг.2 - блок-схема, иллюстрирующая возможный вариант, не предназначенный для ограничения, векторного квантователя с разделением вектора.
Фиг.3 - блок-схема, иллюстрирующая возможный вариант, не предназначенный для ограничения, векторного квантователя с предсказанием, использующего (AR) предсказание авторегрессией.
Фиг.4 - блок-схема, иллюстрирующая возможный вариант, не предназначенный для ограничения, векторного квантователя с предсказанием, использующего (MA) предсказание скользящим средним значением.
Фиг.5 - блок-схема возможного варианта переключаемого векторного квантователя с предсказанием в кодере, согласно иллюстративному варианту осуществления настоящего изобретения, не предназначенному для ограничения.
Фиг.6 - блок-схема возможного варианта переключаемого векторного квантователя с предсказанием в декодере, согласно иллюстративному варианту осуществления настоящего изобретения, не предназначенному для ограничения.
Фиг.7 - иллюстративный возможный вариант, не предназначенный для ограничения, распределения ISF по частоте, в котором каждое распределение является функцией вероятности обнаружения ISF в данной позиции в векторе ISF.
Фиг.8 - график, изображающий стандартный возможный вариант развития параметров ISF по последовательным кадрам речи.
ОСУЩЕСТВЛЕНИЕ ИЗОБРЕТЕНИЯ
Хотя в последующем описании иллюстративные варианты осуществления настоящего изобретения будут описаны в отношении применения к речевому сигналу, должно учитываться, что настоящее изобретение также может быть применено к другим видам звуковых сигналов.
Наиболее современные способы кодирования речи основаны на анализе линейного предсказания, например, кодирование CELP. Параметры LP вычисляются и квантуются в кадрах в 10-30 мс. В настоящем иллюстративном варианте осуществления используются кадры в 20 мс и предполагается порядок анализа LP, равный 16. Возможный вариант вычисления параметров LP в системе кодирования речи можно обнаружить при обращении к [Рекомендации ITU-T G.722.2 "Wideband coding of speech at around 16 kbit/s using Adaptive Multi-Rate Wideband (AMR-WB)", Женева, 2002]. В указанном иллюстративном возможном варианте предварительно обработанный речевой сигнал обрабатывается методом окна, и вычисляются автокорреляции речи, обработанной методом окна. Затем используется рекурсия Левинсона-Дюрбина (Levinson-Durbin) для вычисления коэффициентов линейного предсказания ai, i = 1,..., М из автокорреляций R(k), k=0,...,М, где М является порядком предсказания.
Коэффициенты линейного предсказания ai не могут непосредственно квантоваться для передачи в декодер. Причина состоит в том, что малые ошибки квантования на коэффициентах линейного предсказания могут создавать большие спектральные ошибки в функции преобразования LP-фильтра, и даже могут привести к неустойчивости фильтра. Следовательно, до квантования к коэффициентам линейного предсказания ai применяется преобразование. Преобразование выдает то, что называется представлением коэффициентов линейного предсказания ai. Следовательно, после приема квантованных преобразованных коэффициентов линейного предсказания ai, декодер может применить обратное преобразование для получения квантованных коэффициентов линейного предсказания. Одним широко используемым представлением для коэффициентов линейного предсказания ai являются частоты спектральных линий (LSF), также известные как пары спектральных линий (LSP). Подробности вычисления частот LSF могут быть найдены в [Рекомендации ITU-T G.729 "Coding of speech at 8 kbit/s using conjugate-structure algebraic-code-excited linear prediction (CS-ACELP)", Женева, март 1996]. Частоты LSF состоят из полюсов полиномов
Figure 00000009
и
Figure 00000010
Для четных значений М, каждый полином имеет M/2 сопряженных корня на единичной окружности (e±jωi). Соответственно, полиномы могут быть записаны как
Figure 00000011
и
Figure 00000012
где qi=cos(ωi) с ωi, являющимися частотами спектральных линий (LSF), удовлетворяющими свойству упорядочения 0 < ω1 < ω2 < ... < ωM < π. В этом конкретном возможном варианте частоты LSF составляют параметры LP (линейного предсказания).
Подобным представлением являются пары спектрального иммитанса (ISP) или частоты спектрального иммитанса (ISF), которые использовались в стандарте кодирования AMR-WB. Подробности вычисления частот ISF могут быть найдены при обращении к [Рекомендации ITU-T G.722.2 "Wideband coding of speech at round 16 kbit/s using adaptive multi-rate wideband (AMR-WB)", Женева, 2002]. Также возможны и использовались другие представления. Без потери общности в последующем описании будет рассматриваться случай представления ISF как иллюстративный возможный вариант, не предназначенный для ограничения.
Для LP-фильтра M-го порядка, где М является четным, пары ISP определяются как корни полиномов:
Figure 00000013
и
Figure 00000014
Полиномы F1(z) и F2(z) имеют M/2 и M/2-1 сопряженных корня на единичной окружности (e±jwi), соответственно. Следовательно, полиномы могут быть записаны как
Figure 00000015
и
Figure 00000016
где qi=cos(ωi) с ωi, являющимися частотами спектрального иммитанса (ISF), и aM является последним коэффициентом линейного предсказания. Частоты ISF удовлетворяют свойству упорядочения 0 < ω1 < ω2 < ... < ωM < π. В этом конкретном возможном варианте частоты LSF составляют параметры LP (линейного предсказания). Соответственно, частоты ISF состоят из M-1 частот дополнительно к последним коэффициентам линейного предсказания. В представленном иллюстративном варианте осуществления частоты ISF отображаются в частоты в диапазоне от 0 до fS/2, где fS является частотой дискретизации, с использованием следующего отношения:
Figure 00000017
и
Figure 00000018
Частоты LSF и ISF (параметры LP) широко использовались благодаря некоторым свойствам, которые делают их применимыми для квантования. Среди этих свойств имеются хорошо определенный динамический диапазон, их гладкое развитие, приводящее к сильным корреляциям внутри кадра и между кадрами, и наличие свойства упорядочения, которое обеспечивает устойчивость квантуемого LP-фильтра.
В этом документе, термин "параметр LP" используется для определения любого представления коэффициентов LP, например, LSF, ISF, LSF с удаленным средним значением или ISF с удаленным средним значением.
Теперь для понимания используемых подходов квантования будут описаны основные свойства частот ISF (параметров LP (линейного предсказания)). На фиг.7 изображен типичный возможный вариант функции распределения вероятностей (ФРВ, PDF) коэффициентов ISF. Каждая кривая представляет PDF отдельного коэффициента ISF. На горизонтальной оси показано среднее значение каждого распределения (μk). Например, кривая для ISF1 указывает все значения с вероятностью их возникновения, которые может принимать первый коэффициент ISF в кадре. Кривая для ISF2 указывает все значения с вероятностью их возникновения, которые может принимать второй коэффициент ISF в кадре, и так далее. Функция PDF обычно получается применением гистограммы к значениям, принимаемым данным коэффициентом, как наблюдается по нескольким последовательным кадрам. Видно, что каждый коэффициент ISF занимает ограниченный интервал по всем возможным значениям ISF. Это действительно уменьшает пространство, которое должен охватывать квантователь и повышает эффективность битовой скорости. Также важно отметить что, хотя функции PDF коэффициентов ISF могут перекрываться, коэффициенты ISF в заданном кадре всегда упорядочены (ISFk+1 - ISFk > 0, где k является позицией коэффициента ISF внутри вектора коэффициентов ISF).
При длительностях кадра от 10 до 30 мс, обычных в речевом кодере, коэффициенты ISF проявляют корреляцию между кадрами. Фиг.8 иллюстрирует развитие коэффициентов ISF по кадрам в речевом сигнале. Фиг.8 был получена при выполнении анализа LP более чем по 30 последовательным кадрам в 20 мс в речевом сегменте, содержащем вокализованные и невокализованные кадры. Коэффициенты LP (16 на кадр) были преобразованы в коэффициенты ISF. На фиг.8 изображено, что линии никогда не пересекают друг друга, что означает, что частоты ISF всегда упорядочены. Фиг.8 также отражает, что коэффициенты ISF обычно развиваются медленно по сравнению с частотой кадров. Это на практике означает, что квантование с предсказанием может применяться для уменьшения ошибки квантования.
Фиг.3 иллюстрирует возможный вариант векторного квантователя 300 с предсказанием, использующего (AR) предсказание авторегрессией. Как изображено на фиг.3, сначала получается вектор ошибки предсказания en посредством вычитания (Процессор 301) вектора предсказания pn из входного вектора параметров LP, который должен квантоваться, xn. Символ n здесь относится к индексу кадра во времени. Вектор предсказания pn вычисляется предсказателем P (Процессор 302) с использованием прошлых квантованных векторов параметров LP,
Figure 00000019
Figure 00000020
и т.д. Затем вектор ошибки предсказания en квантуется (Процессор 303) для создания индекса i для передачи, например, через канал, и квантованного вектора ошибки предсказания кn. Полный квантованный вектор параметров LP
Figure 00000021
получается посредством суммирования (Процессор 304) квантованного вектора ошибки предсказания кn и вектора предсказания pn. Общий вид предсказателя P (Процессор 302) является следующим:
Figure 00000022
где Ak являются матрицами предсказания размерностью MxM, а K является порядком предсказателя. В простом виде предсказателя P (Процессор 302) используется предсказание первого порядка:
Figure 00000023
где A является матрицей предсказания размерности MxM, где М является размерностью вектора параметров LP xn. Простым видом матрицы предсказания является диагональная матрица с диагональными элементами α1, α2,..., αM, где αi являются коэффициентами предсказания для отдельных параметров LP. Если для всех параметров LP используется идентичный коэффициент α, то уравнение 2 сокращается до
Figure 00000024
Если используется простой вид предсказания Уравнения (3), то на фиг.3 квантованный вектор параметров LP
Figure 00000025
задается следующим (AR) отношением авторегрессии:
Figure 00000026
Рекурсивный вид Уравнения (4) подразумевает, что при использовании квантователя 300 с AR предсказанием вида, изображенного на фиг.3, ошибки канала распространятся по нескольким кадрам. Это может быть более заметно, если Уравнение (4) записано в следующем математически эквивалентном виде
Figure 00000027
Из этого вида ясно видно, что в принципе каждый прошлый декодированный вектор ошибки предсказания кn-k вносит вклад в значение квантованного вектора параметров LP
Figure 00000028
Следовательно, в случае ошибок канала, которые должны изменять значение кn, принимаемое декодером, относительно того значения, которое было передано кодером, декодированный вектор
Figure 00000029
полученный в Уравнении (4), не будет идентичным в декодере и в кодере. Из-за рекурсивного характера предсказателя P это несоответствие декодера с кодером распространится на будущее и повлияет на следующие векторы
Figure 00000030
Figure 00000031
и т.д., даже если ошибки канала в последующих кадрах отсутствуют. Следовательно, векторное квантование с предсказанием не является надежным в отношении ошибок канала, особенно, когда коэффициенты предсказания являются большими (α близко к 1 в Уравнениях (4) и (5)).
Чтобы смягчить указанную проблему распространения, вместо AR предсказания может использоваться (MA) предсказание скользящим средним значением. В MA предсказании бесконечная последовательность Уравнения (5) обрезается до конечного количества членов. Идея состоит в аппроксимации авторегрессионного вида предсказателя P в Уравнении (4) посредством использования малого количества членов в Уравнении (5). Следует отметить, что для лучшей аппроксимации предсказателя P Уравнения (4) могут быть изменены веса в суммировании.
Возможный вариант, не предназначенный для ограничения, векторного квантователя 400 с MA предсказанием изображен на фиг.4, при этом процессоры 401, 402, 403 и 404 соответствуют процессорам 301, 302, 303 и 304, соответственно. Общий вид предсказателя P (Процессор 402) является следующим:
Figure 00000032
где Bk являются матрицами предсказания с размерностью MxM, а K является порядком предсказателя. Следует отметить, что в MA предсказании ошибки передачи распространяются только на следующие K кадров.
В простом виде предсказателя P (Процессор 402) используется предсказание первого порядка:
Figure 00000033
где B является матрицей предсказания с размерностью MxM, где М является размерностью вектора параметров LP. Простым видом матрицы предсказания является диагональная матрица с диагональными элементами β1, β2, ..., βM, где βi являются коэффициентами предсказания для отдельных параметров LP. Если для всех параметров LP используется идентичный коэффициент β, то Уравнение (6) сокращается до
Figure 00000034
Если используется простой вид предсказания Уравнения (7), то на фиг.4 квантованный вектор параметров LP
Figure 00000035
задается следующим отношением для скользящего среднего (MA) значения:
Figure 00000036
В иллюстративном возможном варианте векторного квантователя 400 с предсказанием, использующего MA предсказание, как изображено на фиг.4, память предсказателя (в Процессоре 402) сформирована прошлыми декодированными векторами ошибки предсказания кn-1, кn-2 и т.д. Следовательно, максимальным количеством кадров, по которым может распространяться ошибка канала, является порядок предсказателя P (Процессор 402). В иллюстративном возможном варианте предсказателя Уравнения (8) используется предсказание 1-го порядка, так что ошибка MA предсказания может распространяться только на один кадр.
Хотя MA предсказание является более надежным, чем AR предсказание в отношении ошибок передачи, оно не достигает идентичного выигрыша в предсказании для заданного порядка предсказания. Следовательно, ошибка предсказания имеет больший динамический диапазон, и может требовать большего количества битов, чем при квантовании с AR предсказанием, для достижения идентичного выигрыша в кодировании. Соответственно, компромисс состоит в надежности в отношении ошибок канала против выигрыша в кодировании при заданной битовой скорости.
В кодировании с переменной битовой скоростью (VBR), управляемым источником, кодер функционирует при нескольких битовых скоростях, и блок выбора скорости используется для определения битовой скорости, используемого для кодирования каждого кадра речи, на основе характеристики кадра речи, например вокализованный, невокализованный, переходной, фоновый шум. Характеристика кадра речи, например вокализованный, невокализованный, переходной, фоновый шум и т.д., может быть определена так же, как для VBR CDMA. Задача состоит в достижении наилучшего качества речи при заданной средней битовой скорости, также определенной, как средняя скорость передачи данных (ADR). В качестве иллюстративного возможного варианта, в системах CDMA, например CDMA-one и CDMA2000, обычно используется 4 битовых скорости, определяемых как полноскоростная (ПС, FR), полускоростная (ПС, HR), четвертьскоростная (ЧС, QR) и 1/8-скоростная (ER). В этой системе CDMA поддерживаются два набора скоростей и определяются, как Набор скоростей I и Набор скоростей II. В Наборе скоростей II кодер с переменной битовой скоростью с механизмом выбора скорости функционирует при битовой скорости, управляемой источником, в 13,3 (FR); 6,2 (HF); 2,7 (QR) и 1,0 (ER) кбит/с.
В кодировании VBR используется механизм классификации и выбора скорости для классификации кадра речи в соответствии с его характеристикой (вокализованный, невокализованный, переходный, шум и т.д.) и выбора битовой скорости, необходимой для кодирования кадра в соответствии с классификацией и требуемой средней скоростью передачи данных (ADR). Обычно в кадрах, где входной речевой сигнал является стационарным, выбирается полускоростное кодирование. Экономия битов по сравнению с полноскоростным (кодированием) достигается посредством менее частого обновления параметров кодера или использования меньшего количества битов для кодирования некоторых параметров. Дополнительно, указанные кадры проявляют сильную корреляцию, что может использоваться для уменьшения битовой скорости. Более конкретно, в стационарных вокализованных сегментах информация основного тона кодируется только один раз в кадре, и меньшее количество битов используются для фиксированной кодовой книги и коэффициентов LP. В невокализованных кадрах не требуется предсказание основного тона, и возбуждение может быть смоделировано малыми кодовыми книгами в HR или случайным шумом в QR.
Так как обычно для кодирования параметров LP применяется VQ с предсказанием с MA предсказанием, это приводит к излишнему увеличению шума квантования. MA предсказание, в противоположность AR предсказанию, используется для повышения надежности в отношении потери кадра; однако, в стационарных кадрах параметры LP развиваются медленно, так что использование AR предсказания в этом случае должно оказывать меньшее влияние на распространение ошибки в случае потерянных кадров. При наблюдении обнаружено, что в случае отсутствия кадров большинство декодеров применяет процедуру скрытия, которая по существу экстраполирует параметры LP последнего кадра. Если отсутствующий кадр является стационарным вокализованным кадром, то при такой экстраполяции создаются значения, весьма подобные переданным в действительности, но не принятым параметрам LP. Соответственно, воссозданный вектор параметров LP является очень близким к тому, который должен был быть декодирован, если бы кадр не был потерян. В этом конкретном случае использование AR предсказания в процедуре квантования LP коэффициентов не может влиять слишком неблагоприятно на распространение ошибки квантования.
Соответственно, согласно иллюстративному варианту осуществления настоящего изобретения, не предназначенному для ограничения, раскрыт способ VQ с предсказанием для параметров LP, при котором предсказатель переключается между MA и AR предсказанием в соответствии с характеристикой обрабатываемого кадра речи. Более конкретно, в переходных и нестационарных кадрах используется MA предсказание, в то время как в стационарных кадрах используется AR предсказание. Кроме того, так как AR предсказание приводит к вектору ошибки предсказания en с меньшим динамическим диапазоном, чем MA предсказание, то использовать идентичные таблицы квантования для обоих видов предсказания не эффективно. Для преодоления этой проблемы вектор ошибки предсказания после AR предсказания масштабируется соответствующим образом, чтобы он мог квантоваться с использованием таблиц квантования, идентичных таблицам квантования в случае MA предсказания. Когда для квантования вектора ошибки предсказания используется многоэтапное VQ, первый этап может использоваться для обоих видов предсказания после соответственного масштабирования вектора ошибки AR предсказания. Так как на втором этапе достаточно использовать VQ с разделением, которое не требует памяти большой емкости, таблицы квантования этого второго этапа могут быть подготовлены и разработаны отдельно для обоих видов предсказания. Безусловно, вместо разработки таблиц квантования первого этапа для MA предсказания и масштабирования вектора ошибки AR предсказания, также допустимо обратное, то есть первый этап может быть разработан для AR предсказания, и до квантования масштабируется вектор ошибки MA предсказания.
Соответственно, согласно иллюстративному варианту осуществления настоящего изобретения, не предназначенному для ограничения, также раскрыт способ векторного квантования с предсказанием для квантования параметров LP в речевом кодеке с переменной битовой скоростью, при котором предсказатель P переключается между MA и AR предсказанием в соответствии с информацией классификации, относящейся к характеристике обрабатываемого кадра речи, и при котором вектор ошибки предсказания масштабируется соответствующим образом, так что для обоих видов предсказания могут использоваться идентичные таблицы квантования первого этапа в многоэтапном VQ ошибки предсказания.
Возможный вариант 1
На фиг.1 изображен возможный вариант, не предназначенный для ограничения, двухэтапного векторного квантователя 100. Сначала входной вектор x квантуется квантователем Q1 (Процессор 101) для создания квантованного вектора
Figure 00000037
и индекса квантования i1. Вычисляется (Процессор 102) разность между входным вектором x и квантованным на первом этапе вектором
Figure 00000037
для создания вектора ошибки x2, дополнительно квантуемого на втором этапе VQ (Процессор 103) для создания квантованного вектора ошибки второго этапа
Figure 00000038
с индексом квантования i2. Индексы i1 и i2 передаются (Процессор 104) через канал, и квантованный вектор
Figure 00000039
воссоздается в декодере, как
Figure 00000040
На фиг.2 изображен иллюстративный возможный вариант векторного квантователя 200 с разделением. Входной вектор x размерности М разделяется на K субвекторов с размерностями N1, N2, ..., NK и квантуется векторными квантователями Q1, Q2, ..., QK, соответственно (Процессоры 201.1, 201.2 ... 201.K). Создаются квантованные субвекторы
Figure 00000041
с индексами квантования i1, i2 и iK. Индексы квантования передаются (Процессор 202) через канал, и квантованный вектор
Figure 00000042
воссоздается простой конкатенацией квантованных субвекторов.
Эффективный подход для векторного квантования должен объединять многоэтапное VQ и VQ с разделением, что приводит к хорошему компромиссу между качеством и сложностью. В первом иллюстративном возможном варианте может использоваться двухэтапное VQ, при котором вектор ошибки второго этапа к2 разделяется на несколько субвекторов и квантуется квантователями второго этапа Q21, Q22, ..., Q2K, соответственно. Во втором иллюстративном возможном варианте входной вектор может быть разделен на два субвектора, затем каждый субвектор квантуется двухэтапным VQ с использованием дополнительного разделения на втором этапе, как в первом иллюстративном возможном варианте.
Фиг.5 - схематическая блочная диаграмма, иллюстрирующая возможный вариант, не предназначенный для ограничения, переключаемого векторного квантователя 500 с предсказанием, согласно настоящему изобретению. Во-первых, вектор среднего значения параметров LP μ удаляется из входного вектора параметров LP z для создания вектора параметров LP с удаленным средним значением x (Процессор 501). Как указано в приведенном описании, векторами параметров LP могут быть векторы параметров LSF, параметров ISF, или любое другое релевантное представление параметров LP. Удаление вектора среднего значения параметров LP μ из входного вектора параметров LP z является необязательным, но приводит к повышенной эффективности предсказания. Если Процессор 501 блокирован, то вектор параметров LP с удаленным средним значением x будет идентичен входному вектору параметров LP z. Здесь следует отметить, что для упрощения индекс кадра n, используемый на фиг.3 и 4, здесь был опущен. Затем вычисляется вектор предсказания p и удаляется из вектора параметров LP с удаленным средним значением x для создания вектора ошибки предсказания e (Процессор 502). Затем на основе информации относительно классификации кадра, если кадр, соответствующий входному вектору параметров LP z, является стационарным вокализованным кадром, то используется AR предсказание, и вектор ошибки e масштабируется с некоторым коэффициентом (Процессор 503) для получения масштабированного вектора ошибки предсказания e'. Если кадр не является стационарным вокализованным кадром, то используется MA предсказание, и масштабный коэффициент (Процессор 503) равен 1. Вновь, классификация кадра, например вокализованный, невокализованный, переходный, фоновый шум и т.д., может быть определена, например, так же, как для VBR CDMA. Масштабный коэффициент, обычно, больше 1 и приводит к повышению выше среднего уровня динамического диапазона вектора ошибки предсказания, чтобы он мог квантоваться квантователем, разработанным для MA предсказания. Значение масштабного коэффициента зависит от коэффициентов, используемых для MA и AR предсказания. Обычные значения, не предназначенные для ограничения: коэффициент MA предсказания β=0,33, коэффициент AR предсказания α=0,65, и масштабный коэффициент =1,25. Если квантователь разработан для AR предсказания, то будет выполнена обратная операция: будет масштабироваться вектор ошибки предсказания для MA предсказания, и масштабный коэффициент будет меньше 1.
Затем масштабированный вектор ошибки предсказания e' векторно квантуется (Процессор 508) для создания квантованного масштабированного вектора ошибки предсказания к'. В возможном варианте, изображенном на фиг.5, процессор 508 состоит из двухэтапного векторного квантователя, где используется VQ с разделением на обоих этапах, и при этом таблицы векторного квантования первого этапа идентичны для MA и AR предсказания. Двухэтапный векторный квантователь 508 состоит из процессоров 504, 505, 506, 507 и 509. В квантователе первого этапа Q1 масштабированный вектор ошибки предсказания e' квантуется для создания квантованного вектора ошибки предсказания первого этапа к1 (Процессор 504). Этот вектор к1 удаляется из масштабированного вектора ошибки предсказания e' (Процессор 505) для создания вектора ошибки предсказания второго этапа e2. Затем этот вектор ошибки предсказания второго этапа e2 квантуется (Процессор 506) векторным квантователем QMA второго этапа или векторным квантователем QAR второго этапа для создания квантованного вектора ошибки предсказания второго этапа к2. Выбор между векторными квантователями QMA и QAR второго этапа зависит от информации классификации кадра (например, как указано выше, AR, если кадр является стационарным вокализованным кадром, и MA, если кадр не является стационарным вокализованным кадром). Квантованный масштабированный вектор ошибки предсказания к' воссоздается (Процессор 509) посредством суммирования квантованных векторов ошибки предсказания, к1 и к2 из двух этапов: к'=к12. В заключение, к квантованному масштабированному вектору ошибки предсказания к' применяется операция, обратная масштабированию процессора 503 (Процессор 510) для создания квантованного вектора ошибки предсказания к. В представленном иллюстративном возможном варианте размерность вектора равна 16, и на обоих этапах используется VQ с разделением. Индексы квантования i1 и i2 из квантователя Q1 и квантователя QMA или QAR мультиплексируются и передаются через канал связи (Процессор 507).
Вектор предсказания p вычисляется в MA предсказателе (Процессор 511) или в AR предсказателе (Процессор 512) в зависимости от информации классификации кадра (например, как указано выше, AR, если кадр является стационарным вокализованным, и MA, если кадр не является стационарным вокализованным). Если кадр является стационарным вокализованным, то вектор предсказания равен выходным данным AR предсказателя 512. Иначе вектор предсказания равен выходным данным MA предсказателя 511. Как поясняется здесь выше, MA предсказатель 511 функционирует на квантованных векторах ошибки предсказания из предыдущих кадров, в то время как AR предсказатель 512 функционирует на квантованных входных векторах LP параметров из предыдущих кадров. Квантованный входной вектор параметров LP (с удаленным средним значением) создается посредством суммирования квантованного вектора ошибки предсказания к с вектором предсказания p (Процессор 514):
Figure 00000042
= к + p.
Фиг.6 является схематической блочной диаграммой, изображающей иллюстративный вариант осуществления переключаемого векторного квантователя 600 с предсказанием в декодере, согласно настоящему изобретению. На стороне декодера принятые наборы индексов квантования i1 и i2 используются таблицами квантования (Процессоры 601 и 602) для создания квантованных векторов ошибки предсказания первого этапа и второго этапа к1 и к2. Следует отметить, что квантование второго этапа (Процессор 602) состоит из двух наборов таблиц для MA и AR предсказания, как описано выше в отношении стороны кодера фиг.5. Затем в Процессоре 603 воссоздается масштабированный вектор ошибки предсказания посредством суммирования векторов ошибки предсказания, квантованных на двух этапах: к' = к1 + к2. В Процессоре 609 применяется обратное масштабирование для создания квантованного вектора ошибки предсказания к. Следует отметить, что обратное масштабирование является функцией информации классификации принятого кадра и является обратным масштабированию, выполняемому процессором 503 фиг.5. Затем в Процессоре 604 воссоздается квантованный входной вектор параметров LP с удаленным средним значением
Figure 00000042
посредством суммирования вектора предсказания p с квантованным вектором ошибки предсказания к:
Figure 00000042
=к+p. В случае, если на стороне кодера был удален вектор среднего значения параметров LP μ, он добавляется в Процессоре 608 для создания квантованного входного вектора параметров LP
Figure 00000043
. Следует отметить, что, как в случае стороны кодера фиг.5, вектор предсказания p является выходными данными MA предсказателя 605 или AR предсказателя 606 в зависимости от информации классификации кадра; такой выбор делается в соответствии с логической схемой Процессора 607 в зависимости от информации классификации кадра. Более конкретно, если кадр является стационарным вокализованным, то вектор предсказания p равен выходным данным AR предсказателя 606. Иначе вектор предсказания p равен выходным данным MA предсказателя 605.
Безусловно, несмотря на тот факт, что в некотором кадре используются только выходные данные MA предсказателя или AR предсказателя, блоки памяти обоих предсказателей должны обновляться каждый кадр с учетом того, что в следующем кадре может использоваться MA или AR предсказание. Это верно и для стороны декодера и для стороны кодера.
Для оптимизации выигрыша в кодировании некоторые векторы первого этапа, предназначенные для MA предсказания, могут быть заменены новыми векторами, предназначенными для AR предсказания. В иллюстративном варианте осуществления, не предназначенном для ограничения, размер кодовой книги первого этапа равен 256, и имеет содержимое, идентичное содержимому в стандарте AMR-WB на 12,65 кбит/с, и при использовании AR предсказания в кодовой книге первого этапа заменяются 28 векторов. Соответственно, расширенная кодовая книга первого этапа формируется следующим образом: сначала 28 векторов первого этапа, наименее используемых при применении AR предсказания, но пригодных для использования для MA предсказания, помещаются в начале таблицы, затем в таблицу добавляются оставшиеся 256-28=228 векторов первого этапа, пригодных для использования и для AR и для MA предсказания, и в завершение в конце таблицы помещаются 28 новых векторов, пригодных для использования для AR предсказания. Соответственно, длина таблицы составляет 256+28=284 вектора. При использовании MA предсказания на первом этапе используются первые 256 векторов таблицы; при использовании AR предсказания используются последние 256 векторов таблицы. Для обеспечения возможности взаимодействия с стандартом AMR-WB используется таблица, которая содержит соответствие между позицией вектора первого этапа в указанной новой кодовой книге и его исходной позицией в кодовой книге первого этапа для AMR-WB.
Подводя итог, описанные выше иллюстративные варианты осуществления настоящего изобретения, не предназначенные для ограничения, описанные согласно фиг.5 и 6, имеют следующие признаки:
- Переключаемое AR/MA предсказание используется в зависимости от режима кодирования кодера с переменной битовой скоростью, зависящим непосредственно от характеристики текущего кадра речи.
- По существу, применяется ли AR или MA предсказание, используется один квантователь первого этапа, что приводит к экономии памяти. В иллюстративном варианте осуществления, не предназначенном для ограничения, используется предсказание LP 16-го порядка, и параметры LP представляются в области значений ISF. Кодовая книга первого этапа является идентичной используемой в режиме 12,65 кбит/с кодера AMR-WB, где кодовая книга была разработана с использованием MA предсказания (вектор параметров LP с размерностью 16 разделяется на 2 для получения двух субвекторов с размерностью 7 и 9, и на первом этапе квантования используются две кодовые книги с 256 элементами).
- В стационарном режиме вместо MA предсказания используется AR предсказание, в частности, в полускоростном вокализованном режиме; иначе используется MA предсказание.
- В случае AR предсказания первый этап квантователя идентичен случаю MA предсказания. Однако второй этап может быть соответственно разработан и подготовлен для AR предсказания.
- Для учета указанного переключения в режиме предсказателя, блоки памяти MA и AR предсказателей обновляются каждый кадр с учетом того, что для следующего кадра могут использоваться оба, MA или AR, предсказания.
- Дополнительно, для оптимизации выигрыша в кодировании, некоторые векторы первого этапа, разработанные для MA предсказания, могут быть заменены новыми векторами, разработанными для AR предсказания. Согласно этому иллюстративному варианту осуществления, не предназначенному для ограничения, при использовании AR предсказания в кодовой книге первого этапа заменяется 28 векторов.
- Соответственно, расширенная кодовая книга первого этапа может быть сформирована следующим образом: сначала 28 векторов первого этапа, наименее используемых при применении AR предсказания, помещается в начале таблицы, затем в таблицу добавляются оставшиеся 256-28=228 векторов первого этапа, и в завершение в конце таблицы помещаются 28 новых векторов. Соответственно, длина таблицы составляет 256+28=284 векторов. При использовании MA предсказания на первом этапе используются первые 256 векторов таблицы; при использовании AR предсказания используются последние 256 векторов таблицы.
- Для обеспечения возможности взаимодействия с стандартом AMR-WB используется таблица, которая содержит соответствие между позицией вектора первого этапа в указанной новой кодовой книге и исходной позицией в кодовой книге первого этапа AMR-WB.
- Так как при использовании на стационарных сигналах AR предсказание достигает более низкой энергии ошибки предсказания, чем MA предсказание, к ошибке предсказания применяется масштабный коэффициент. В иллюстративном варианте осуществления, не предназначенном для ограничения, при использовании MA предсказания масштабный коэффициент равен 1, и при использовании AR предсказания 1/0,8. Это увеличивает ошибку AR предсказания в динамическом эквиваленте ошибки MA предсказания. Следовательно, на первой стадии для MA и AR предсказания может использоваться один квантователь.
Хотя в приведенном выше описании настоящее изобретение было описано в отношении его иллюстративных вариантов осуществления, не предназначенных для ограничения, не удаляясь от сущности и не выходя из объема настоящего изобретения указанные варианты осуществления могут быть при необходимости изменены в пределах объема приложенной формулы изобретения.

Claims (57)

1. Способ квантования параметров линейного предсказания в кодировании звукового сигнала с переменной битовой скоростью, заключающийся в том, что:
принимают входной вектор параметров линейного предсказания,
классифицируют кадр звукового сигнала, соответствующий входному вектору параметров линейного предсказания,
вычисляют вектор предсказания,
удаляют вычисленный вектор предсказания из входного вектора параметров линейного предсказания для создания вектора ошибки предсказания,
масштабируют вектор ошибки предсказания,
квантуют масштабированный вектор ошибки предсказания,
при этом
вычисление вектора предсказания включает в себя выбор одной из множества схем предсказания в отношении классификации кадра звукового сигнала и вычисление вектора предсказания в соответствии с выбранной схемой предсказания, и
масштабирование вектора ошибки предсказания включает в себя выбор по меньшей мере одной из множества схем масштабирования в отношении выбранной схемы предсказания и масштабирование вектора ошибки предсказания в соответствии с выбранной схемой масштабирования.
2. Способ квантования параметров линейного предсказания по п.1, в котором квантование вектора ошибки предсказания включает в себя обработку вектора ошибки предсказания посредством по меньшей мере одного квантователя с использованием выбранной схемы предсказания.
3. Способ квантования параметров линейного предсказания по п.1, в котором
множество схем предсказания включает в себя предсказание скользящим средним значением и предсказание авторегрессией.
4. Способ квантования параметров линейного предсказания по п.1, в котором дополнительно
создают вектор среднего значения параметров линейного предсказания и удаляют вектор среднего значения параметров линейного предсказания из входного вектора параметров линейного предсказания для создания вектора параметров линейного предсказания с удаленным средним значением.
5. Способ квантования параметров линейного предсказания по п.1, в котором
классификация кадра звукового сигнала включает в себя определение, что кадр звукового сигнала является стационарным вокализованным кадром, выбор одной из множества схем предсказания включает в себя выбор предсказания авторегрессией,
вычисление вектора предсказания включает в себя вычисление вектора ошибки предсказания посредством предсказания авторегрессией,
выбор одной из множества схем масштабирования включает в себя выбор масштабного коэффициента и
масштабирование вектора ошибки предсказания включает в себя масштабирование вектора ошибки предсказания с использованием упомянутого масштабного коэффициента до квантования.
6. Способ квантования параметров линейного предсказания по п.1, в котором
классификация кадра звукового сигнала включает в себя определение, что кадр звукового сигнала не является стационарным вокализованным кадром,
вычисление вектора предсказания включает в себя вычисление вектора ошибки предсказания посредством предсказания скользящим средним значением.
7. Способ квантования параметров линейного предсказания по п.5, в котором масштабный коэффициент больше 1.
8. Способ квантования параметров линейного предсказания по п.1, в котором квантование вектора ошибки предсказания включает в себя
обработку вектора ошибки предсказания посредством двухэтапного процесса векторного квантования.
9. Способ квантования параметров линейного предсказания по п.8, в котором дополнительно используют векторное квантование с разделением на двух этапах процесса векторного квантования.
10. Способ квантования параметров линейного предсказания по п.3, в котором
квантование вектора ошибки предсказания включает в себя обработку вектора ошибки предсказания посредством двухэтапного процесса векторного квантования, включающего в себя первый и второй этапы, и обработка вектора ошибки предсказания посредством двухэтапного процесса векторного квантования включает в себя применение вектора ошибки предсказания к таблицам векторного квантования первого этапа, которые являются идентичными и для предсказания скользящим средним значением, и для предсказания авторегрессией.
11. Способ квантования параметров линейного предсказания по п.8, в котором квантование вектора ошибки предсказания включает в себя на первом этапе двухэтапного процесса векторного квантования квантование вектора ошибки предсказания для создания квантованного вектора ошибки предсказания первого этапа,
удаление из вектора ошибки предсказания квантованного вектора ошибки предсказания первого этапа для создания вектора ошибки предсказания второго этапа,
на втором этапе двухэтапного процесса векторного квантования квантование вектора ошибки предсказания второго этапа для создания квантованного вектора ошибки предсказания второго этапа и
создание квантованного вектора ошибки предсказания посредством суммирования квантованных векторов ошибки предсказания первого этапа и второго этапа.
12. Способ квантования параметров линейного предсказания по п.11, в котором квантование вектора ошибки предсказания второго этапа включает в себя
обработку вектора ошибки предсказания второго этапа посредством квантователя с предсказанием скользящим средним значением или квантователя с предсказанием авторегрессией в зависимости от классификации кадра звукового сигнала.
13. Способ квантования параметров линейного предсказания по п.8, в котором квантование вектора ошибки предсказания включает в себя создание индексов квантования для двух этапов двухэтапного процесса векторного квантования,
передачу индексов квантования через канал связи.
14. Способ квантования параметров линейного предсказания по п.8, в котором
классификация кадра звукового сигнала включает в себя определение, что кадр звукового сигнала является стационарным вокализованным кадром, и вычисление вектора предсказания включает в себя суммирование (а) квантованного вектора ошибки предсказания, созданного посредством суммирования квантованных векторов ошибки предсказания первого этапа и второго этапа, и (b) вычисленного вектора предсказания для создания квантованного входного вектора, и обработку квантованного входного вектора посредством предсказания авторегрессией.
15. Способ квантования параметров линейного предсказания по п.2, в котором
множество схем предсказания включает в себя предсказание скользящим средним значением и предсказание авторегрессией,
квантование вектора ошибки предсказания включает в себя
обработку вектора ошибки предсказания посредством двухэтапного векторного квантователя, содержащего кодовую книгу первого этапа, непосредственно содержащую последовательно
первую группу векторов, пригодных для использования при применении предсказания скользящим средним значением и помещенных в начале таблицы,
вторую группу векторов, пригодных для использования при применении любого из: предсказания скользящим средним значением и предсказания авторегрессией и помещенных в таблице между первой группой векторов и третьей группой векторов,
третью группу векторов, пригодных для использования при применении предсказания авторегрессией и помещенных в конце таблицы,
обработка вектора ошибки предсказания посредством по меньшей мере одного квантователя с использованием выбранной схемы предсказания включает в себя
обработку вектора ошибки предсказания посредством первой и второй групп векторов таблицы, когда выбранной схемой предсказания является предсказание скользящим средним значением, и
обработку вектора ошибки предсказания посредством второй и третьей групп векторов, когда выбранной схемой предсказания является предсказание авторегрессией.
16. Способ квантования параметров линейного предсказания по п.15, в котором для обеспечения возможности взаимодействия с стандартом AMR-WB посредством таблицы соответствия осуществляют соответствие между позицией вектора первого этапа в таблице кодовой книги первого этапа и исходной позицией вектора первого этапа в кодовой книге первого этапа AMR-WB.
17. Способ квантования параметров линейного предсказания по п.1, в котором
классификация кадра звукового сигнала включает в себя определение, что кадр звукового сигнала является стационарным вокализованным кадром или нестационарным вокализованным кадром, и
для стационарных вокализованных кадров выбор одной из множества схем предсказания в отношении классификации кадра звукового сигнала включает в себя выбор предсказания авторегрессией, вычисление вектора предсказания в соответствии с выбранной схемой предсказания включает в себя вычисление вектора ошибки предсказания посредством предсказания авторегрессией, выбор по меньшей мере одной из множества схем масштабирования в отношении выбранной схемы предсказания включает в себя выбор масштабного коэффициента, большего 1 и масштабирование вектора ошибки предсказания в соответствии с выбранной схемой масштабирования включает в себя масштабирование вектора ошибки предсказания с использованием масштабного коэффициента, большего 1, до квантования,
для нестационарных вокализованных кадров выбор одной из множества схем предсказания в отношении классификации кадра звукового сигнала включает в себя выбор предсказания скользящим средним значением, вычисление вектора предсказания в соответствии с выбранной схемой предсказания включает в себя вычисление вектора ошибки предсказания посредством предсказания скользящим средним значением, выбор по меньшей мере одной из множества схем масштабирования в отношении выбранной схемы предсказания включает в себя выбор масштабного коэффициента, равного 1, и масштабирование вектора ошибки предсказания в соответствии с выбранной схемой масштабирования включает в себя масштабирование вектора ошибки предсказания с использованием масштабного коэффициента, равного 1, до квантования.
18. Способ обратного квантования параметров линейного предсказания в декодировании звукового сигнала с переменной битовой скоростью, заключающийся в том, что
принимают по меньшей мере один индекс квантования,
принимают информацию относительно классификации кадра звукового сигнала, соответствующего упомянутому по меньшей мере одному индексу квантования,
восстанавливают вектор ошибки предсказания посредством применения упомянутого по меньшей мере одного индекса по меньшей мере к одной таблице квантования,
воссоздают вектор предсказания и
создают вектор параметров линейного предсказания в зависимости от восстановленного вектора ошибки предсказания и воссозданного вектора предсказания,
при этом
воссоздание вектора предсказания включает в себя обработку восстановленного вектора ошибки предсказания посредством одной из множества схем предсказания в зависимости от информации классификации кадра.
19. Способ обратного квантования параметров линейного предсказания по п.18, в котором восстановление вектора ошибки предсказания включает в себя
применение упомянутого по меньшей мере одного индекса и информации классификации по меньшей мере к одной таблице квантования с использованием упомянутой одной схемы предсказания.
20. Способ обратного квантования параметров линейного предсказания по п.18, в котором
прием по меньшей мере одного индекса квантования включает в себя прием индекса квантования первого этапа и индекса квантования второго этапа и
применение упомянутого по меньшей мере одного индекса к упомянутой по меньшей мере одной таблице квантования включает в себя применение индекса квантования первого этапа к таблице квантования первого этапа для создания вектора ошибки предсказания первого этапа и применение индекса квантования второго этапа к таблице квантования второго этапа для создания вектора ошибки предсказания второго этапа.
21. Способ обратного квантования параметров линейного предсказания по п.20, в котором
множество схем предсказания включает в себя предсказание скользящим средним значением и предсказание авторегрессией,
таблица квантования второго этапа включает в себя таблицу предсказания скользящим средним значением и таблицу предсказания авторегрессией, и дополнительно применяют классификацию кадра звукового сигнала к таблице квантования второго этапа для обработки индекса квантования второго этапа посредством таблицы предсказания скользящим средним значением или таблицы предсказания автррегрессией в зависимости от принятой информации классификации кадра.
22. Способ обратного квантования параметров линейного предсказания по п.20, в котором восстановление вектора ошибки предсказания включает в себя
суммирование вектора ошибки предсказания первого этапа и вектора ошибки предсказания второго этапа для создания восстановленного вектора ошибки предсказания.
23. Способ обратного квантования параметров линейного предсказания по п.22, в котором дополнительно
проводят на восстановленном векторе предсказания операцию обратного масштабирования как функцию принятой информации классификации кадра.
24. Способ обратного квантования параметров линейного предсказания по п.18, в котором создание вектора параметров линейного предсказания включает в себя
суммирование восстановленного вектора ошибки предсказания и воссозданного вектора предсказания для создания вектора параметров линейного предсказания.
25. Способ обратного квантования параметров линейного предсказания по п.24, в котором дополнительно суммируют вектор среднего значения параметров линейного предсказания с восстановленным вектором ошибки предсказания и воссозданным вектором предсказания для создания вектора параметров линейного предсказания.
26. Способ обратного квантования параметров линейного предсказания по п.18, в котором
множество схем предсказания включает в себя предсказание скользящим средним значением и предсказание авторегрессией и воссоздание вектора предсказания включает в себя обработку восстановленного вектора ошибки предсказания посредством предсказания скользящим средним значением или обработку созданного вектора параметров посредством предсказания авторегрессией в зависимости от информации классификации кадра.
27. Способ обратного квантования параметров линейного предсказания по п.26, в котором воссоздание вектора предсказания включает в себя
обработку созданного вектора параметров посредством предсказания авторегрессией, когда информация классификации кадра указывает, что кадр звукового сигнала является стационарным вокализованным, и обработку восстановленного вектора ошибки предсказания посредством предсказания скользящим средним значением, когда информация классификации кадра указывает, что кадр звукового сигнала не является стационарным вокализованным.
28. Устройство для квантования параметров линейного предсказания в кодировании звукового сигнала с переменной битовой скоростью,
содержащее
средство приема входного вектора параметров линейного предсказания,
средство классификации кадра звукового, сигнала, соответствующего входному вектору параметров линейного предсказания,
средство вычисления вектора предсказания,
средство удаления вычисленного вектора предсказания из входного вектора параметров линейного предсказания для создания вектора ошибки предсказания,
средство масштабирования вектора ошибки предсказания,
средство квантования масштабированного вектора ошибки предсказания,
при этом
средство вычисления вектора предсказания содержит средство выбора одной из множества схем предсказания в отношении классификации кадра звукового сигнала и средство вычисления вектора предсказания в соответствии с выбранной схемой предсказания, и
средство масштабирования вектора ошибки предсказания содержит средство выбора по меньшей мере одной из множества схем масштабирования в отношении выбранной схемы предсказания и средство масштабирования вектора ошибки предсказания в соответствии с выбранной схемой масштабирования.
29. Устройство для квантования параметров линейного предсказания в кодировании звукового сигнала с переменной битовой скоростью, содержащее
вход для приема входного вектора параметров линейного предсказания,
классификатор кадра звукового сигнала, соответствующего входному вектору параметров линейного предсказания,
вычислитель вектора предсказания,
вычитатель для удаления вычисленного вектора предсказания из входного вектора параметров линейного предсказания для создания вектора ошибки предсказания,
блок масштабирования, снабжаемый вектором ошибки предсказания, причем упомянутый блок масштабирует вектор ошибки предсказания, и квантователь масштабированного вектора ошибки предсказания,
при этом
вычислитель вектора предсказания содержит селектор одной из множества схем предсказания в отношении классификации кадра звукового сигнала для вычисления вектора предсказания в соответствии с выбранной схемой предсказания, и
блок масштабирования содержит селектор по меньшей мере одной из множества схем масштабирования в отношении выбранной схемы предсказания для масштабирования вектора ошибки предсказания в соответствии с выбранной схемой масштабирования.
30. Устройство для квантования параметров линейного предсказания по п.29, в котором
квантователь снабжается вектором ошибки предсказания для обработки упомянутого вектора ошибки предсказания посредством выбранной схемы предсказания.
31. Устройство для квантования параметров линейного предсказания по п.29, в котором
множество схем предсказания включает в себя предсказание скользящим средним значением и предсказание авторегрессией.
32. Устройство для квантования параметров линейного предсказания по п.29 дополнительно содержит
средство создания вектора среднего значения параметров линейного предсказания и
вычитатель для удаления вектора среднего значения параметров линейного предсказания из входного вектора параметров линейного предсказания для создания входного вектора параметров линейного предсказания с удаленным средним значением.
33. Устройство для квантования параметров линейного предсказания по п.29, в котором, когда классификатор определяет, что кадр звукового сигнала является стационарным вокализованным кадром, вычислитель вектора предсказания содержит
предсказатель авторегрессией для применения предсказания авторегрессией к вектору ошибки предсказания.
34. Устройство для квантования параметров линейного предсказания по п.29, в котором, когда классификатор определяет, что кадр звукового сигнала не является стационарным вокализованным кадром,
вычислитель вектора предсказания содержит предсказатель скользящим средним значением для применения предсказания скользящим средним значением к вектору ошибки предсказания.
35. Устройство для квантования параметров линейного предсказания по п.33, в котором блок масштабирования содержит
умножитель для применения к вектору ошибки предсказания масштабного коэффициента, большего 1.
36. Устройство для квантования параметров линейного предсказания по п.29, в котором квантователь содержит двухэтапный векторный квантователь.
37. Устройство для квантования параметров линейного предсказания по п.36, в котором двухэтапный векторный квантователь с двумя этапами, использующими векторное квантование с разделением.
38. Устройство для квантования параметров линейного предсказания по п.31, в котором
квантователь содержит двухэтапный векторный квантователь с первым и вторым этапами, а
двухэтапный векторный квантователь содержит таблицы квантования первого этапа, которые являются идентичными и для предсказания скользящим средним значением, и для предсказания авторегрессией.
39. Устройство для квантования параметров линейного предсказания по п.36, в котором двухэтапный векторный квантователь содержит
векторный квантователь первого этапа, снабжаемый вектором ошибки предсказания для квантования упомянутого вектора ошибки предсказания и создания квантованного вектора ошибки предсказания первого этапа,
вычитатель для удаления из вектора ошибки предсказания квантованного вектора ошибки предсказания первого этапа для создания вектора ошибки предсказания второго этапа,
векторный квантователь второго этапа, снабжаемый вектором ошибки предсказания второго этапа для квантования упомянутого вектора ошибки предсказания второго этапа и создания квантованного вектора ошибки предсказания второго этапа, и
сумматор для создания квантованного вектора ошибки предсказания посредством суммирования квантованных векторов ошибки предсказания первого этапа и второго этапа.
40. Устройство для квантования параметров линейного предсказания по п.39, в котором векторный квантователь второго этапа содержит
векторный квантователь второго этапа со скользящим средним значением для квантования вектора ошибки предсказания второго этапа с использованием предсказания скользящим средним значением и
авторегрессионный векторный квантователь второго этапа для квантования вектора ошибки предсказания второго этапа с использованием предсказания авторегрессией.
41. Устройство для квантования параметров линейного предсказания по п.36, в котором двухэтапный векторный квантователь содержит
векторный квантователь первого этапа для создания индекса квантования первого этапа,
векторный квантователь второго этапа для создания индекса квантования второго этапа и
передатчик индексов квантования первого этапа и второго этапа через канал связи.
42. Устройство для квантования параметров линейного предсказания по п.39, в котором, когда классификатор определяет, что кадр звукового сигнала является стационарным вокализованным кадром, вычислитель вектора предсказания содержит
сумматор для суммирования (а) квантованного вектора ошибки предсказания, созданного посредством суммирования квантованных векторов ошибки предсказания первого этапа и второго этапа, и (b) вычисленного вектора предсказания для создания квантованного входного вектора, и
предсказатель авторегрессией для обработки квантованного входного вектора.
43. Устройство для квантования параметров линейного предсказания по п.30, в котором
множество схем предсказания включает в себя предсказание скользящим средним значением и предсказание авторегрессией, квантователь содержит
двухэтапный векторный квантователь, содержащий кодовую книгу первого этапа, непосредственно содержащую последовательно
первую группу векторов, пригодных для использования при применении предсказания скользящим средним значением и помещенных в начале таблицы,
вторую группу векторов, пригодных для использования при применении любого из: предсказания скользящим средним значением и предсказания
авторегрессией и помещенных в таблице между первой группой векторов и третьей группой векторов,
третью группу векторов, пригодных для использования при применении предсказания авторегрессией и помещенных в конце таблицы,
средство обработки вектора ошибки предсказания содержит
средство обработки вектора ошибки предсказания посредством первой и второй групп векторов таблицы, когда выбранной схемой предсказания является предсказание скользящим средним значением, и
средство обработки вектора ошибки предсказания посредством второй и третьей групп векторов, когда выбранной схемой предсказания является предсказание авторегрессией.
44. Устройство для квантования параметров линейного предсказания по п.43, дополнительно содержащее для обеспечения возможности взаимодействия с стандартом AMR-WB таблицу соответствия, устанавливающую соответствие между позицией вектора первого этапа в таблице кодовой книги первого этапа и исходной позицией вектора первого этапа в кодовой книге первого этапа AMR-WB.
45. Устройство для квантования параметров линейного предсказания по п.31, в котором
вычислитель вектора предсказания содержит предсказатель авторегрессиеи для применения предсказания авторегрессиеи к вектору ошибки предсказания и предсказатель скользящим средним значением для применения предсказания скользящим средним значением к вектору ошибки предсказания, и
предсказатель авторегрессией и предсказатель скользящим средним значением содержат соответственные блоки памяти, которые обновляют каждый кадр звукового сигнала с учетом того, что в следующем кадре может использоваться или предсказание скользящим средним значением, или предсказание авторегрессией.
46. Устройство для обратного квантования параметров линейного предсказания в декодировании звукового сигнала с переменной битовой скоростью, содержащее
средство приема по меньшей мере одного индекса квантования,
средство приема информации относительно классификации кадра звукового сигнала, соответствующего упомянутому по меньшей мере одному индексу квантования,
средство восстановления вектора ошибки предсказания посредством применения упомянутого по меньшей мере одного индекса по меньшей мере к одной таблице квантования,
средство воссоздания вектора предсказания,
средство создания вектора параметров линейного предсказания в зависимости от восстановленного вектора ошибки предсказания и воссозданного вектора предсказания,
при этом
средство воссоздания вектора предсказания содержит средство обработки восстановленного вектора ошибки предсказания посредством множества схем предсказания в зависимости от информации классификации кадра.
47. Устройство для обратного квантования параметров линейного предсказания в декодировании звукового сигнала с переменной битовой скоростью, содержащее
средство приема по меньшей мере одного индекса квантования,
средство приема информации относительно классификации кадра звукового сигнала, соответствующего упомянутому по меньшей мере одному индексу квантования,
по меньшей мере одну таблицу квантования, снабжаемую упомянутым по меньшей мере одним индексом квантования для восстановления вектора ошибки предсказания,
блок воссоздания вектора предсказания,
формирователь вектора параметров линейного предсказания в зависимости от восстановленного вектора ошибки предсказания и воссозданного вектора предсказания,
при этом
блок воссоздания вектора предсказания содержит по меньшей мере один предсказатель, снабжаемый восстановленным вектором ошибки предсказания для обработки восстановленного вектора ошибки предсказания посредством одной из множества схем предсказания в зависимости от информации классификации кадра.
48. Устройство для обратного квантования параметров линейного предсказания по п.47, в котором упомянутая по меньшей мере одна таблица квантования включает в себя
таблицу квантования, использующую упомянутую одну схему предсказания и снабжаемую упомянутым по меньшей мере одним индексом и информацией классификации.
49. Устройство для обратного квантования параметров линейного предсказания по п.47, в котором
средство приема индекса квантования содержит два входа для приема индекса квантования первого этапа и индекса квантования второго этапа, и упомянутая по меньшей мере одна таблица квантования включает в себя таблицу квантования первого этапа, снабжаемую индексом квантования первого этапа для создания вектора ошибки предсказания первого этапа и таблицу квантования второго этапа, снабжаемую индексом квантования второго этапа для создания вектора ошибки предсказания второго этапа.
50. Устройство для обратного квантования параметров линейного предсказания по п.49, в котором
множество схем предсказания включает в себя предсказание скользящим средним значением и предсказание авторегрессией,
таблица квантования второго этапа включает в себя таблицу предсказания скользящим средним значением и таблицу предсказания авторегрессией, и
упомянутое устройство дополнительно содержит средство применения классификации кадра звукового сигнала к таблице квантования второго этапа для обработки индекса квантования второго этапа посредством таблицы предсказания скользящим средним значением или таблицы предсказания авторегрессией в зависимости от принятой информации классификации кадра.
51. Устройство для обратного квантования параметров линейного предсказания по п.49, дополнительно содержащее
сумматор для суммирования вектора ошибки предсказания первого этапа и вектора ошибки предсказания второго этапа для создания восстановленного вектора ошибки предсказания.
52. Устройство для обратного квантования параметров линейного предсказания по п.51, дополнительно содержащее
средство проведения на воссозданном векторе предсказания операции обратного масштабирования, как функции принятой информации классификации кадра.
53. Устройство для обратного квантования параметров линейного предсказания по п.47, в котором формирователь вектора параметров линейного предсказания содержит
сумматор восстановленного вектора ошибки предсказания и воссозданного вектора предсказания для создания вектора параметров линейного предсказания.
54. Устройство для обратного квантования параметров линейного предсказания по п.53, дополнительно содержащее средство суммирования вектора среднего значения параметров линейного предсказания с восстановленным вектором ошибки предсказания и воссозданным вектором предсказания для создания вектора параметров линейного предсказания.
55. Устройство для обратного квантования параметров линейного предсказания по п.47, в котором
множество схем предсказания включает в себя предсказание скользящим средним значением и предсказание авторегрессией, и
блок воссоздания вектора предсказания содержит предсказатель скользящим средним значением и предсказатель авторегрессией для обработки восстановленного вектора ошибки предсказания посредством предсказания скользящим средним значением или для обработки созданного вектора параметра посредством предсказания авторегрессией в зависимости от информации классификации кадра.
56. Устройство для обратного квантования параметров линейного предсказания по п.55, в котором блок воссоздания вектора предсказания содержит
средство обработки созданного вектора параметра посредством предсказателя авторегрессией, когда информация классификации кадра указывает, что кадр звукового сигнала является стационарным вокализованным, и
средство обработки восстановленного вектора ошибки предсказания посредством предсказателя скользящим средним значением, когда информация классификации кадра указывает, что кадр звукового сигнала не является стационарным вокализованным.
57. Устройство для обратного квантования параметров линейного предсказания по п.55, в котором
упомянутый по меньшей мере один предсказатель содержит предсказатель авторегрессией для применения предсказания авторегрессией к вектору ошибки предсказания и предсказатель скользящим средним значением для применения предсказания скользящим средним значением к вектору ошибки предсказания, и
предсказатель авторегрессией и предсказатель скользящим средним значением содержат соответственные блоки памяти, которые обновляют каждый кадр звукового сигнала с учетом того, что в следующем кадре может использоваться или предсказание скользящим средним значением, или предсказание авторегрессией.
RU2005123381/09A 2002-12-24 2003-12-18 Способ и устройство для векторного квантования с надежным предсказанием параметров линейного предсказания в кодировании речи с переменной битовой скоростью RU2326450C2 (ru)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CA002415105A CA2415105A1 (en) 2002-12-24 2002-12-24 A method and device for robust predictive vector quantization of linear prediction parameters in variable bit rate speech coding
CA2,415,105 2002-12-24

Publications (2)

Publication Number Publication Date
RU2005123381A RU2005123381A (ru) 2006-01-20
RU2326450C2 true RU2326450C2 (ru) 2008-06-10

Family

ID=32514130

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2005123381/09A RU2326450C2 (ru) 2002-12-24 2003-12-18 Способ и устройство для векторного квантования с надежным предсказанием параметров линейного предсказания в кодировании речи с переменной битовой скоростью

Country Status (16)

Country Link
US (2) US7149683B2 (ru)
EP (1) EP1576585B1 (ru)
JP (1) JP4394578B2 (ru)
KR (1) KR100712056B1 (ru)
CN (1) CN100576319C (ru)
AT (1) ATE410771T1 (ru)
AU (1) AU2003294528A1 (ru)
BR (2) BR0317652A (ru)
CA (1) CA2415105A1 (ru)
DE (1) DE60324025D1 (ru)
HK (1) HK1082587A1 (ru)
MX (1) MXPA05006664A (ru)
MY (1) MY141174A (ru)
RU (1) RU2326450C2 (ru)
UA (1) UA83207C2 (ru)
WO (1) WO2004059618A1 (ru)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2510974C2 (ru) * 2010-01-08 2014-04-10 Ниппон Телеграф Энд Телефон Корпорейшн Способ кодирования, способ декодирования, устройство кодера, устройство декодера, программа и носитель записи
RU2519027C2 (ru) * 2009-02-13 2014-06-10 Панасоник Корпорэйшн Устройство векторного квантования, устройство векторного обратного квантования и способы для этого
RU2606552C2 (ru) * 2011-04-21 2017-01-10 Самсунг Электроникс Ко., Лтд. Устройство для квантования коэффициентов кодирования с линейным предсказанием, устройство кодирования звука, устройство для деквантования коэффициентов кодирования с линейным предсказанием, устройство декодирования звука и электронное устройство для этого
RU2616863C2 (ru) * 2010-03-11 2017-04-18 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. Сигнальный процессор, формирователь окон, кодированный медиа-сигнал, способ обработки сигнала и способ формирования окон
RU2635069C2 (ru) * 2013-07-04 2017-11-08 Хуавэй Текнолоджиз Ко., Лтд. Устройство и способ квантования векторов огибающих частот
US10229692B2 (en) 2011-04-21 2019-03-12 Samsung Electronics Co., Ltd. Method of quantizing linear predictive coding coefficients, sound encoding method, method of de-quantizing linear predictive coding coefficients, sound decoding method, and recording medium and electronic device therefor
RU2726158C2 (ru) * 2012-03-29 2020-07-09 Телефонактиеболагет Лм Эрикссон (Пабл) Векторный квантователь

Families Citing this family (49)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2388439A1 (en) * 2002-05-31 2003-11-30 Voiceage Corporation A method and device for efficient frame erasure concealment in linear predictive based speech codecs
CA2415105A1 (en) * 2002-12-24 2004-06-24 Voiceage Corporation A method and device for robust predictive vector quantization of linear prediction parameters in variable bit rate speech coding
KR100956877B1 (ko) 2005-04-01 2010-05-11 콸콤 인코포레이티드 스펙트럼 엔벨로프 표현의 벡터 양자화를 위한 방법 및장치
PT1875463T (pt) * 2005-04-22 2019-01-24 Qualcomm Inc Sistemas, métodos e aparelho para nivelamento de fator de ganho
US8594252B2 (en) * 2005-08-22 2013-11-26 Qualcomm Incorporated Interference cancellation for wireless communications
US8630602B2 (en) * 2005-08-22 2014-01-14 Qualcomm Incorporated Pilot interference cancellation
US9071344B2 (en) * 2005-08-22 2015-06-30 Qualcomm Incorporated Reverse link interference cancellation
US8611305B2 (en) 2005-08-22 2013-12-17 Qualcomm Incorporated Interference cancellation for wireless communications
US8743909B2 (en) * 2008-02-20 2014-06-03 Qualcomm Incorporated Frame termination
US7587314B2 (en) * 2005-08-29 2009-09-08 Nokia Corporation Single-codebook vector quantization for multiple-rate applications
KR100717401B1 (ko) * 2006-03-02 2007-05-11 삼성전자주식회사 역방향 누적 히스토그램을 이용한 음성 특징 벡터의 정규화방법 및 그 장치
GB2436191B (en) * 2006-03-14 2008-06-25 Motorola Inc Communication Unit, Intergrated Circuit And Method Therefor
US20090299738A1 (en) * 2006-03-31 2009-12-03 Matsushita Electric Industrial Co., Ltd. Vector quantizing device, vector dequantizing device, vector quantizing method, and vector dequantizing method
KR100900438B1 (ko) * 2006-04-25 2009-06-01 삼성전자주식회사 음성 패킷 복구 장치 및 방법
WO2008022181A2 (en) * 2006-08-15 2008-02-21 Broadcom Corporation Updating of decoder states after packet loss concealment
EP2115742B1 (en) * 2007-03-02 2012-09-12 Telefonaktiebolaget LM Ericsson (publ) Methods and arrangements in a telecommunications network
US20080249783A1 (en) * 2007-04-05 2008-10-09 Texas Instruments Incorporated Layered Code-Excited Linear Prediction Speech Encoder and Decoder Having Plural Codebook Contributions in Enhancement Layers Thereof and Methods of Layered CELP Encoding and Decoding
JP5300733B2 (ja) * 2007-10-12 2013-09-25 パナソニック株式会社 ベクトル量子化装置、ベクトル逆量子化装置、およびこれらの方法
CN101335004B (zh) * 2007-11-02 2010-04-21 华为技术有限公司 一种多级量化的方法及装置
US9408165B2 (en) * 2008-06-09 2016-08-02 Qualcomm Incorporated Increasing capacity in wireless communications
US9277487B2 (en) 2008-08-01 2016-03-01 Qualcomm Incorporated Cell detection with interference cancellation
US9237515B2 (en) * 2008-08-01 2016-01-12 Qualcomm Incorporated Successive detection and cancellation for cell pilot detection
JP5188913B2 (ja) * 2008-09-26 2013-04-24 株式会社エヌ・ティ・ティ・ドコモ 量子化装置、量子化方法、逆量子化装置、逆量子化方法、音声音響符号化装置および音声音響復号装置
US20100097955A1 (en) * 2008-10-16 2010-04-22 Qualcomm Incorporated Rate determination
GB2466671B (en) * 2009-01-06 2013-03-27 Skype Speech encoding
GB2466673B (en) 2009-01-06 2012-11-07 Skype Quantization
GB2466672B (en) * 2009-01-06 2013-03-13 Skype Speech coding
GB2466675B (en) 2009-01-06 2013-03-06 Skype Speech coding
GB2466669B (en) * 2009-01-06 2013-03-06 Skype Speech coding
GB2466674B (en) 2009-01-06 2013-11-13 Skype Speech coding
GB2466670B (en) * 2009-01-06 2012-11-14 Skype Speech encoding
US9160577B2 (en) 2009-04-30 2015-10-13 Qualcomm Incorporated Hybrid SAIC receiver
US8787509B2 (en) * 2009-06-04 2014-07-22 Qualcomm Incorporated Iterative interference cancellation receiver
KR20110001130A (ko) * 2009-06-29 2011-01-06 삼성전자주식회사 가중 선형 예측 변환을 이용한 오디오 신호 부호화 및 복호화 장치 및 그 방법
US8831149B2 (en) * 2009-09-03 2014-09-09 Qualcomm Incorporated Symbol estimation methods and apparatuses
US8452606B2 (en) 2009-09-29 2013-05-28 Skype Speech encoding using multiple bit rates
CN102668612B (zh) 2009-11-27 2016-03-02 高通股份有限公司 增加无线通信中的容量
JP2013512593A (ja) 2009-11-27 2013-04-11 クゥアルコム・インコーポレイテッド 無線通信における容量の増加
DE102010010736A1 (de) * 2010-03-09 2011-09-15 Arnold & Richter Cine Technik Gmbh & Co. Betriebs Kg Verfahren zur Kompression von Bilddaten
GB2486663A (en) * 2010-12-21 2012-06-27 Sony Comp Entertainment Europe Audio data generation using parametric description of features of sounds
JPWO2013061584A1 (ja) * 2011-10-28 2015-04-02 パナソニック株式会社 音信号ハイブリッドデコーダ、音信号ハイブリッドエンコーダ、音信号復号方法、及び音信号符号化方法
CN105551497B (zh) 2013-01-15 2019-03-19 华为技术有限公司 编码方法、解码方法、编码装置和解码装置
CN104112451B (zh) * 2013-04-18 2017-07-28 华为技术有限公司 一种选择编码模式的方法及装置
BR112016010273B1 (pt) * 2013-11-07 2022-05-31 Telefonaktiebolaget Lm Ericsson (Publ) Método para particionamento de vetores de entrada para codificação de sinais de áudio, unidade de particionamento, codificador e meio não-transitório legível por máquina
EP2916319A1 (en) * 2014-03-07 2015-09-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Concept for encoding of information
AU2016384679B2 (en) * 2016-01-03 2022-03-10 Auro Technologies Nv A signal encoder, decoder and methods using predictor models
CN105811995A (zh) * 2016-03-04 2016-07-27 广东工业大学 一种减少量化噪声的方法
US10002086B1 (en) * 2016-12-20 2018-06-19 Sandisk Technologies Llc Multi-channel memory operations based on bit error rates
US11343301B2 (en) * 2017-11-30 2022-05-24 Goto Group, Inc. Managing jitter buffer length for improved audio quality

Family Cites Families (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0286231A (ja) * 1988-09-21 1990-03-27 Matsushita Electric Ind Co Ltd 音声予測符号化装置
JP3254696B2 (ja) * 1991-09-25 2002-02-12 三菱電機株式会社 音声符号化装置、音声復号化装置および音源生成方法
US5614996A (en) * 1994-03-03 1997-03-25 Kyocera Corporation Toner storage unit, residual toner collect unit, toner container with these units and image forming apparatus with such toner container
WO1996006496A1 (en) * 1994-08-18 1996-02-29 British Telecommunications Public Limited Company Analysis of audio quality
JPH0863198A (ja) * 1994-08-22 1996-03-08 Nec Corp ベクトル量子化器
KR100322706B1 (ko) * 1995-09-25 2002-06-20 윤종용 선형예측부호화계수의부호화및복호화방법
US5774839A (en) * 1995-09-29 1998-06-30 Rockwell International Corporation Delayed decision switched prediction multi-stage LSF vector quantization
JP2891193B2 (ja) * 1996-08-16 1999-05-17 日本電気株式会社 広帯域音声スペクトル係数量子化装置
JP3067676B2 (ja) * 1997-02-13 2000-07-17 日本電気株式会社 Lspの予測符号化装置及び方法
US6064954A (en) * 1997-04-03 2000-05-16 International Business Machines Corp. Digital audio signal coding
TW408298B (en) * 1997-08-28 2000-10-11 Texas Instruments Inc Improved method for switched-predictive quantization
WO1999010719A1 (en) * 1997-08-29 1999-03-04 The Regents Of The University Of California Method and apparatus for hybrid coding of speech at 4kbps
FI973873A (fi) * 1997-10-02 1999-04-03 Nokia Mobile Phones Ltd Puhekoodaus
KR100900113B1 (ko) * 1997-10-22 2009-06-01 파나소닉 주식회사 확산 펄스 벡터 생성 장치 및 방법
EP0920204B1 (en) * 1997-11-24 2006-02-15 STMicroelectronics S.r.l. MPEG-2 decoder with reduced RAM requisite by recompression using adaptive tree search vector quantization
US6141640A (en) * 1998-02-20 2000-10-31 General Electric Company Multistage positive product vector quantization for line spectral frequencies in low rate speech coding
US6260010B1 (en) * 1998-08-24 2001-07-10 Conexant Systems, Inc. Speech encoder using gain normalization that combines open and closed loop gains
US6104992A (en) * 1998-08-24 2000-08-15 Conexant Systems, Inc. Adaptive gain reduction to produce fixed codebook target signal
US7272556B1 (en) * 1998-09-23 2007-09-18 Lucent Technologies Inc. Scalable and embedded codec for speech and audio signals
CA2252170A1 (en) * 1998-10-27 2000-04-27 Bruno Bessette A method and device for high quality coding of wideband speech and audio signals
JP3578933B2 (ja) * 1999-02-17 2004-10-20 日本電信電話株式会社 重み符号帳の作成方法及び符号帳設計時における学習時のma予測係数の初期値の設定方法並びに音響信号の符号化方法及びその復号方法並びに符号化プログラムが記憶されたコンピュータに読み取り可能な記憶媒体及び復号プログラムが記憶されたコンピュータに読み取り可能な記憶媒体
JP2000305597A (ja) * 1999-03-12 2000-11-02 Texas Instr Inc <Ti> 音声圧縮のコード化
US6691092B1 (en) * 1999-04-05 2004-02-10 Hughes Electronics Corporation Voicing measure as an estimate of signal periodicity for a frequency domain interpolative speech codec system
US7423983B1 (en) * 1999-09-20 2008-09-09 Broadcom Corporation Voice and data exchange over a packet based network
US6604070B1 (en) * 1999-09-22 2003-08-05 Conexant Systems, Inc. System of encoding and decoding speech signals
US6505222B1 (en) * 1999-10-29 2003-01-07 International Business Machines Corporation Systems methods and computer program products for controlling undesirable bias in an equalizer
KR100324204B1 (ko) * 1999-12-24 2002-02-16 오길록 예측분할벡터양자화 및 예측분할행렬양자화 방식에 의한선스펙트럼쌍 양자화기의 고속탐색방법
US7010482B2 (en) * 2000-03-17 2006-03-07 The Regents Of The University Of California REW parametric vector quantization and dual-predictive SEW vector quantization for waveform interpolative coding
US6785805B1 (en) * 2000-08-08 2004-08-31 Vi Technology, Inc. Network-based configuration method for systems integration in test, measurement, and automation environments
JP3916934B2 (ja) * 2000-11-27 2007-05-23 日本電信電話株式会社 音響パラメータ符号化、復号化方法、装置及びプログラム、音響信号符号化、復号化方法、装置及びプログラム、音響信号送信装置、音響信号受信装置
EP1860650A1 (en) * 2000-11-30 2007-11-28 Matsushita Electric Industrial Co., Ltd. Vector quantizing device for LPC parameters
KR20020075592A (ko) * 2001-03-26 2002-10-05 한국전자통신연구원 광대역 음성 부호화기용 lsf 양자화기
US7042841B2 (en) 2001-07-16 2006-05-09 International Business Machines Corporation Controlling network congestion using a biased packet discard policy for congestion control and encoded session packets: methods, systems, and program products
US6885988B2 (en) * 2001-08-17 2005-04-26 Broadcom Corporation Bit error concealment methods for speech coding
CA2415105A1 (en) * 2002-12-24 2004-06-24 Voiceage Corporation A method and device for robust predictive vector quantization of linear prediction parameters in variable bit rate speech coding

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2519027C2 (ru) * 2009-02-13 2014-06-10 Панасоник Корпорэйшн Устройство векторного квантования, устройство векторного обратного квантования и способы для этого
RU2510974C2 (ru) * 2010-01-08 2014-04-10 Ниппон Телеграф Энд Телефон Корпорейшн Способ кодирования, способ декодирования, устройство кодера, устройство декодера, программа и носитель записи
RU2616863C2 (ru) * 2010-03-11 2017-04-18 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. Сигнальный процессор, формирователь окон, кодированный медиа-сигнал, способ обработки сигнала и способ формирования окон
RU2606552C2 (ru) * 2011-04-21 2017-01-10 Самсунг Электроникс Ко., Лтд. Устройство для квантования коэффициентов кодирования с линейным предсказанием, устройство кодирования звука, устройство для деквантования коэффициентов кодирования с линейным предсказанием, устройство декодирования звука и электронное устройство для этого
RU2669139C1 (ru) * 2011-04-21 2018-10-08 Самсунг Электроникс Ко., Лтд. Устройство для квантования коэффициентов кодирования с линейным предсказанием, устройство кодирования звука, устройство для деквантования коэффициентов кодирования с линейным предсказанием, устройство декодирования звука, и электронное устройство для этого
US10224051B2 (en) 2011-04-21 2019-03-05 Samsung Electronics Co., Ltd. Apparatus for quantizing linear predictive coding coefficients, sound encoding apparatus, apparatus for de-quantizing linear predictive coding coefficients, sound decoding apparatus, and electronic device therefore
US10229692B2 (en) 2011-04-21 2019-03-12 Samsung Electronics Co., Ltd. Method of quantizing linear predictive coding coefficients, sound encoding method, method of de-quantizing linear predictive coding coefficients, sound decoding method, and recording medium and electronic device therefor
RU2726158C2 (ru) * 2012-03-29 2020-07-09 Телефонактиеболагет Лм Эрикссон (Пабл) Векторный квантователь
US11741977B2 (en) 2012-03-29 2023-08-29 Telefonaktiebolaget L M Ericsson (Publ) Vector quantizer
RU2635069C2 (ru) * 2013-07-04 2017-11-08 Хуавэй Текнолоджиз Ко., Лтд. Устройство и способ квантования векторов огибающих частот
US10032460B2 (en) 2013-07-04 2018-07-24 Huawei Technologies Co., Ltd. Frequency envelope vector quantization method and apparatus

Also Published As

Publication number Publication date
US20070112564A1 (en) 2007-05-17
US20050261897A1 (en) 2005-11-24
ATE410771T1 (de) 2008-10-15
CA2415105A1 (en) 2004-06-24
EP1576585A1 (en) 2005-09-21
US7502734B2 (en) 2009-03-10
JP2006510947A (ja) 2006-03-30
BR0317652A (pt) 2005-12-06
RU2005123381A (ru) 2006-01-20
CN100576319C (zh) 2009-12-30
MY141174A (en) 2010-03-31
EP1576585B1 (en) 2008-10-08
CN1739142A (zh) 2006-02-22
BRPI0317652B1 (pt) 2018-05-22
JP4394578B2 (ja) 2010-01-06
WO2004059618A1 (en) 2004-07-15
US7149683B2 (en) 2006-12-12
KR20050089071A (ko) 2005-09-07
UA83207C2 (ru) 2008-06-25
MXPA05006664A (es) 2005-08-16
HK1082587A1 (en) 2006-06-09
AU2003294528A1 (en) 2004-07-22
KR100712056B1 (ko) 2007-05-02
DE60324025D1 (de) 2008-11-20

Similar Documents

Publication Publication Date Title
RU2326450C2 (ru) Способ и устройство для векторного квантования с надежным предсказанием параметров линейного предсказания в кодировании речи с переменной битовой скоростью
RU2696292C2 (ru) Аудиокодер и декодер
JP5143193B2 (ja) スペクトル包絡情報量子化装置、スペクトル包絡情報復号装置、スペクトル包絡情報量子化方法及びスペクトル包絡情報復号方法
EP1222659B1 (en) Lpc-harmonic vocoder with superframe structure
RU2509379C2 (ru) Устройство и способ квантования и обратного квантования lpc-фильтров в суперкадре
EP2255358B1 (en) Scalable speech and audio encoding using combinatorial encoding of mdct spectrum
JP5722040B2 (ja) スケーラブルなスピーチおよびオーディオコーデックにおける、量子化mdctスペクトルに対するコードブックインデックスのエンコーディング/デコーディングのための技術
KR101246991B1 (ko) 오디오 신호 처리 방법
KR101175651B1 (ko) 다중 압축 부호화 방법 및 장치
JPH08263099A (ja) 符号化装置
JPWO2007114290A1 (ja) ベクトル量子化装置、ベクトル逆量子化装置、ベクトル量子化方法及びベクトル逆量子化方法
US6611797B1 (en) Speech coding/decoding method and apparatus
KR20230129581A (ko) 음성 정보를 갖는 개선된 프레임 손실 보정
JP2000132194A (ja) 信号符号化装置及び方法、並びに信号復号装置及び方法
KR20140005201A (ko) 계층적 인코더에서 개선 스테이지의 개선된 인코딩
US20100292986A1 (en) encoder
CA2511516C (en) Method and device for robust predictive vector quantization of linear prediction parameters in variable bit rate speech coding
JP2000132195A (ja) 信号符号化装置及び方法

Legal Events

Date Code Title Description
PC41 Official registration of the transfer of exclusive right

Effective date: 20160602