RU2257556C2 - Квантование коэффициентов усиления для речевого кодера линейного прогнозирования с кодовым возбуждением - Google Patents

Квантование коэффициентов усиления для речевого кодера линейного прогнозирования с кодовым возбуждением Download PDF

Info

Publication number
RU2257556C2
RU2257556C2 RU2002134175/09A RU2002134175A RU2257556C2 RU 2257556 C2 RU2257556 C2 RU 2257556C2 RU 2002134175/09 A RU2002134175/09 A RU 2002134175/09A RU 2002134175 A RU2002134175 A RU 2002134175A RU 2257556 C2 RU2257556 C2 RU 2257556C2
Authority
RU
Russia
Prior art keywords
gain
vector
codebook
speech signal
quantized
Prior art date
Application number
RU2002134175/09A
Other languages
English (en)
Other versions
RU2002134175A (ru
Inventor
Янг ГАО (US)
Янг ГАО
Адиль БЕНЯССИНЕ (US)
Адиль БЕНЯССИНЕ
Original Assignee
Конексант Системз, Инк.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Конексант Системз, Инк. filed Critical Конексант Системз, Инк.
Publication of RU2002134175A publication Critical patent/RU2002134175A/ru
Application granted granted Critical
Publication of RU2257556C2 publication Critical patent/RU2257556C2/ru

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/083Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being an excitation gain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/09Long term prediction, i.e. removing periodical redundancies, e.g. by using adaptive codebook or pitch predictor
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/167Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G3/00Gain control in amplifiers or frequency changers
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Analogue/Digital Conversion (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

Изобретение относится к области кодирования. Технический результат заключается в увеличении битовой скорости для непериодических сигналов и уменьшении количества битов, необходимых для представления квантованных коэффициентов усиления. Сущность изобретения заключается в том, что обеспечивают речевой сигнал на покадровой основе, в ходе обработки кадров и до обработки подкадров определяют коэффициент усиления адаптивной кодовой книги для каждого подкадра текущего кадра на основании речевого сигнала, осуществляют векторное квантование коэффициентов усиления адаптивной кодовой книги, в ходе обработки подкадров определяют коэффициент усиления фиксированной кодовой книги для каждого подкадра текущего кадра и после обработки подкадров и осуществляют векторное квантование коэффициентов усиления фиксированной кодовой книги с задержанным решением. 4 н. и 75 з.п. ф-лы, 12 ил.

Description

ССЫЛКИ НА РОДСТВЕННЫЕ ЗАЯВКИ
Следующие заявки на патент США включены в настоящее описание посредством ссылки и составляют часть настоящей заявки:
заявка №09/156650 на патент США, озаглавленная “Речевой кодер с использованием нормализации коэффициента усиления, объединяющий коэффициенты усиления разомкнутого и замкнутого контура”, №98RSS399 в реестре фирмы Конексант, поданная 18 сентября 1998 г.; и
предварительная заявка №60/155321 на патент США, озаглавленная “Кодирование речевого сигнала на скорости 4 кбит/с”, №99RSS485 в реестре фирмы Конексант, поданная 22 сентября 1999 г.
ПРЕДПОСЫЛКИ ИЗОБРЕТЕНИЯ
Область применения настоящего изобретения относится, в целом, к кодированию речевого сигнала в системах голосовой связи и, в частности, к усовершенствованной системе кодирования в режиме линейного прогнозирования с кодовым возбуждением и способу кодирования параметров квантования коэффициента усиления речевого сигнала меньшим количеством битов.
Для моделирования основных звуков речи речевые сигналы дискретизируют по времени и сохраняют в кадрах в виде дискретного сигнала, подлежащего цифровой обработке. Однако для повышения эффективности использования полосы частот, выделенной для передачи речевого сигнала, речевой сигнал перед передачей кодируют, в особенности, когда предусмотрены ограничения на полосу частот для передачи речевого сигнала. Для различных аспектов кодирования речевого сигнала предусмотрены многочисленные алгоритмы. При кодировании речевого сигнала алгоритм кодирования речевого сигнала пытается представить характеристики речевого сигнала таким образом, чтобы использовать более узкую полосу частот. Например, алгоритм кодирования речевого сигнала пытается удалить избыточные элементы речевого сигнала. На первом этапе удаляют кратковременные корреляции. Один из методов кодирования сигнала - это кодирование с линейным прогнозированием (LPC). В режиме LPC значение речевого сигнала в любой отдельно взятый момент времени моделируют линейной функцией предыдущих значений. Используя подход LPC, можно удалить кратковременные корреляции и определить эффективные представления речевого сигнала путем оценивания и применения определенных параметров прогнозирования для представления сигнала. После удаления кратковременных корреляций из речевого сигнала остается остаточный сигнал LPC. Этот остаточный сигнал содержит информацию периодичности, которую необходимо моделировать. На втором этапе удаления избыточных элементов моделируют информацию периодичности. Информацию периодичности можно моделировать с использованием прогнозирования основного тона речевого сигнала. Некоторые фрагменты речевого сигнала обладают периодичностью, а некоторые - нет. Например, звук “ааа...” обладает информацией периодичности, тогда как звук “шшш...” не обладает информацией периодичности.
Благодаря применению метода LPC, традиционный кодер исходного сигнала обрабатывает речевые сигналы, выделяя информацию моделирования и параметров, подлежащую кодированию для передачи по каналу связи на традиционный декодер исходного сигнала. Один способ кодирования информации моделирования и параметров с уменьшением объема информации предусматривает использование квантования. Квантование параметров предусматривает выбор ближайшего элемента в таблице или кодовой книге для представления параметра. Так, например, параметр 0.125 можно представить значением 0.1, если кодовая книга содержит 0, 0.1, 0.2, 0.3 и т.д. Квантование включает в себя скалярное квантование и векторное квантование. При скалярном квантовании в таблице или кодовой книге выбирают элемент, который является ближайшим приближением параметра, как описано выше. Напротив, векторное квантование предполагает объединение двух или более параметров и выбор в таблице или кодовой книге элемента, ближайшего к объединенным параметрам. Например, векторное квантование можно осуществлять, выбирая в кодовой книге элемент, ближайший к разности параметров. Кодовую книгу, используемую для векторного квантования сразу двух параметров, часто называют двухмерной кодовой книгой. n-мерная кодовая книга квантует сразу n параметров.
Кодирование речевого сигнала в режиме CELP (линейного прогнозирования с кодовым возбуждением) предусматривает два типа коэффициентов усиления. Коэффициент усиления первого типа - это коэффициент усиления Gp основного тона, именуемый также коэффициентом усиления адаптивной кодовой книги. Коэффициент усиления адаптивной кодовой книги иногда, в частности, здесь обозначают нижним индексом “а” вместо нижнего индекса “р”. Коэффициент усиления второго типа - это коэффициент усиления Gc фиксированной кодовой книги. Алгоритмы кодирования речевого сигнала оперируют с квантованными параметрами, включая коэффициент усиления адаптивной кодовой книги и коэффициент усиления фиксированной кодовой книги. После кодирования параметры, представляющие входной речевой сигнал, передают на приемопередатчик.
Декодер, входящий в состав приемопередатчика, получает кодированную информацию. Поскольку конфигурация декодера позволяет ему знать, каким способом кодированы речевые сигналы, декодер декодирует кодированную информацию, реконструируя сигнал для воспроизведения, который звучит для человеческого уха как исходная речь.
Итак, для передачи информации моделирования и параметров на декодер требуется определенная полоса частот канала связи. Для повышения эффективности использования полосы частот необходимо усовершенствовать процесс кодирования информации моделирования и параметров. Требуются такие алгоритмы кодирования, которые позволяют уменьшить объем информации в битах, подлежащей передаче по каналу, при обеспечении высокого уровня качества воспроизводимой речи.
СУЩНОСТЬ ИЗОБРЕТЕНИЯ
Различные аспекты настоящего изобретения предусматривают систему кодирования речевого сигнала и соответствующий способ, основанный на использовании метода анализа путем синтеза для кодирования речевого сигнала. Система кодирования речевого сигнала содержит процессор кодера и совокупность кодовых книг, которые генерируют векторы возбуждения. Речевой кодер анализирует и классифицирует каждый кадр речевого сигнала как речевой сигнал, подобный периодическому, или речевой сигнал, подобный непериодическому. Для простоты в этой заявке и формуле изобретения сигналы, подобные периодическим, и периодические сигналы будем называть “периодическими сигналами”, а непериодические речевые сигналы будем называть “непериодическими” сигналами.
Существует, по меньшей мере, три основных альтернативных варианта осуществления, которые рассмотрены ниже. Первый вариант осуществления предусматривает применение новой стратегии квантования коэффициента усиления к периодическому речевому сигналу и применение известного способа квантования к непериодическому речевому сигналу. Второй вариант осуществления предусматривает применение новой стратегии квантования коэффициента усиления как к периодическому речевому сигналу, так и к непериодическому речевому сигналу, причем битовая скорость (количество битов в секунду) для непериодического речевого сигнала выше, чем для периодического речевого сигнала, но ниже битовой скорости, обеспечиваемой известными способами квантования коэффициента усиления. Третий вариант осуществления предусматривает применение новой стратегии квантования коэффициента усиления ко всем речевым сигналам, что обеспечивает такую же битовую скорость, что и для непериодического речевого сигнала во втором варианте осуществления.
Ниже приведены описания первого, второго и третьего вариантов осуществления. Если речевой сигнал является периодическим, то коэффициенты усиления основного тона извлекают из исходного неквантованного взвешенного речевого сигнала до начала обработки подкадров в замкнутом контуре. В этом состоит отличие от традиционного способа, согласно которому коэффициенты усиления основного тона получают путем обработки подкадров в замкнутом контуре. Процесс обработки “в замкнутом контуре” позволяет найти вектор в кодовой книге, генерирующей синтезированный речевой сигнал, который является перцептивно ближайшим к исходному входному речевому сигналу. В отличие от него, процесс обработки “в разомкнутом контуре” позволяет найти вектор в кодовой книге, ближайший к вектору коэффициента усиления (или преобразованному вектору коэффициента усиления, например записи вектора коэффициента усиления). При обработке в разомкнутом контуре близость двух векторов не зависит от перцептивной близости синтезированного речевого сигнала к исходному речевому сигналу. Речевой кодер по разному осуществляет процесс квантования в зависимости от того, является ли речевой сигнал периодическим или нет. Если речевой сигнал является периодическим, то усовершенствованный речевой кодер осуществляет следующие две операции квантования коэффициента усиления: (1) предварительное векторное квантование коэффициента усиления Gp адаптивной кодовой книги для каждого подкадра кадра, которое основано на исходном неквантованном взвешенном речевом сигнале; это квантование осуществляется до начала обработки подкадров в замкнутом контуре; и (2) векторное квантование в замкнутом контуре с задержанным решением коэффициента усиления Gc фиксированной кодовой книги по окончании обработки подкадров.
Первый аспект настоящего изобретения предусматривает речевой кодер, который классифицирует речевой сигнал как подобный периодическому или подобный непериодическому и осуществляет квантование коэффициента усиления речевого сигнала, подобного периодическому, иначе, чем речевого сигнала, подобного непериодическому.
Второй аспект настоящего изобретения предусматривает речевой кодер, который осуществляет для каждого кадра периодического речевого сигнала предварительное квантование Gp для каждого подкадра кадра и осуществляет векторное квантование Gc в замкнутом контуре с задержанным решением.
Третий аспект настоящего изобретения предусматривает речевой кодер, который осуществляет векторное квантование Gc в замкнутом контуре с задержанным решением для периодического речевого сигнала.
Четвертый аспект настоящего изобретения предусматривает речевой кодер, который уменьшает количество битов, необходимых для векторного квантования информации коэффициента усиления в периодическом речевом сигнале.
Пятый аспект настоящего изобретения предусматривает речевой кодер, который осуществляет обработку речевого сигнала на уровне кадров и затем - обработку подкадров в зависимости от режима.
Шестой аспект настоящего изобретения предусматривает речевой кодер, который получает квантованный коэффициент усиления основного тона для текущего подкадра из процесса предварительного векторного квантования, предшествующего обработке подкадров в замкнутом контуре, что позволяет использовать квантованный коэффициент усиления основного тона для текущего подкадра для поиска в фиксированной кодовой книге вектора возбуждения фиксированной кодовой книги для текущего подкадра.
Седьмой аспект настоящего изобретения предусматривает речевой кодер, который выводит коэффициенты усиления основного тона из исходного неквантованного взвешенного речевого сигнала до начала обработки подкадров в замкнутом контуре, если речевой сигнал является периодическим.
Восьмой аспект настоящего изобретения предусматривает речевой кодер, который применяет новый процесс квантования коэффициента усиления только к периодическим сигналам и традиционный процесс квантования коэффициента усиления к непериодическим сигналам.
Девятый аспект настоящего изобретения предусматривает речевой кодер, который различает периодические и непериодические сигналы и применяет новый процесс квантования коэффициента усиления к периодическим сигналам и непериодическим сигналам, выделяя непериодическим сигналам больше битов квантования коэффициента усиления, чем периодическим сигналам.
Десятый аспект настоящего изобретения предусматривает речевой кодер, который не различает периодические и непериодические сигналы и применяет новый процесс квантования коэффициента усиления ко всем сигналам.
Одиннадцатый аспект настоящего изобретения сводится к любому из вышеперечисленных аспектов в применении к речевому кодеру, который различает периодические и непериодические сигналы и применяет новый процесс квантования коэффициента усиления к периодическим сигналам и непериодическим сигналам, выделяя непериодическим сигналам больше битов квантования коэффициента усиления, чем периодическим сигналам.
Двенадцатый аспект настоящего изобретения сводится к любому из вышеперечисленных аспектов в применении к речевому кодеру, который не различает периодические и непериодические сигналы и применяет новый процесс квантования коэффициента усиления ко всем сигналам.
Другие аспекты настоящего изобретения относятся к способу кодирования параметров квантования коэффициентов усиления речевого сигнала меньшим количеством битов.
Тринадцатый аспект настоящего изобретения предусматривает способ квантования информации коэффициента усиления в речевом сигнале, согласно которому классифицируют речевой сигнал как подобный периодическому или подобный непериодическому и осуществляют квантование коэффициента усиления речевого сигнала, подобного периодическому, иначе, чем речевого сигнала, подобного непериодическому.
Четырнадцатый аспект настоящего изобретения предусматривает способ квантования информации коэффициента усиления в речевом сигнале, согласно которому для каждого кадра периодического речевого сигнала осуществляют предварительное векторное квантование Gp для каждого подкадра кадра и осуществляют векторное квантование Gc в замкнутом контуре с задержанным решением.
Пятнадцатый аспект настоящего изобретения предусматривает способ квантования информации коэффициента усиления в речевом сигнале, согласно которому осуществляют векторное квантование Gc в замкнутом контуре с задержанным решением для периодического речевого сигнала после обработки подкадров.
Шестнадцатый аспект настоящего изобретения предусматривает способ квантования информации коэффициента усиления в речевом сигнале, который позволяет уменьшить количество битов, необходимых для векторного квантования информации коэффициента усиления в периодическом речевом сигнале.
Семнадцатый аспект настоящего изобретения предусматривает способ квантования информации коэффициента усиления в речевом сигнале, согласно которому осуществляют обработку речевого сигнала на уровне кадров и затем - обработку подкадров в зависимости от режима.
Восемнадцатый аспект настоящего изобретения предусматривает способ квантования информации коэффициента усиления в речевом сигнале, согласно которому получают квантованный коэффициент усиления основного тона для текущего подкадра из процесса предварительного векторного квантования, предшествующего обработке подкадров в замкнутом контуре, чтобы квантованный коэффициент усиления основного тона для текущего подкадра можно было использовать для поиска в фиксированной кодовой книге вектора возбуждения фиксированной кодовой книги для текущего подкадра.
Девятнадцатый аспект настоящего изобретения предусматривает способ квантования информации коэффициента усиления в речевом сигнале, согласно которому извлекают коэффициенты усиления основного тона из исходного неквантованного взвешенного речевого сигнала до начала обработки подкадров в замкнутом контуре, если речевой сигнал является периодическим.
Двадцатый аспект настоящего изобретения предусматривает способ квантования информации коэффициента усиления в речевом сигнале, согласно которому различают периодические и непериодические сигналы и применяют новый процесс квантования коэффициента усиления к периодическим сигналам и непериодическим сигналам, выделяя непериодическим сигналам больше битов квантования коэффициента усиления, чем периодическим сигналам.
Двадцать первый аспект настоящего изобретения предусматривает способ квантования информации коэффициента усиления в речевом сигнале, согласно которому не различают периодические и непериодические сигналы и применяют новый процесс квантования коэффициента усиления ко всем сигналам.
Двадцать второй аспект настоящего изобретения сводится к любому из вышеперечисленных аспектов в применении к способу квантования информации коэффициента усиления в речевом сигнале, согласно которому различают периодические и непериодические сигналы и применяют новый процесс квантования коэффициента усиления к периодическим сигналам и непериодическим сигналам, выделяя непериодическим сигналам больше битов квантования коэффициента усиления, чем периодическим сигналам.
Двадцать третий аспект настоящего изобретения сводится к любому из вышеперечисленных аспектов в применении к способу квантования информации коэффициента усиления в речевом сигнале, согласно которому не различают периодические и непериодические сигналы и применяют новый процесс квантования коэффициента усиления ко всем сигналам.
Двадцать четвертый аспект настоящего изобретения сводится к любому из вышеперечисленных аспектов по отдельности или в некоторой их комбинации.
Другие аспекты, преимущества и признаки новизны настоящего изобретения будут очевидны из нижеследующего подробного описания предпочтительного варианта осуществления, иллюстрируемого чертежами.
КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ
Фиг.1 - функциональная блок-схема системы передачи речевого сигнала, содержащей кодер исходного сигнала и декодер исходного сигнала.
Фиг.2 - более подробная функциональная блок-схема системы передачи речевого сигнала, изображенной на фиг.1.
Фиг.3 - функциональная блок-схема иллюстративной первой ступени, речевого препроцессора, входящего в состав кодера исходного сигнала, используемого согласно одному варианту осуществления системы передачи речевого сигнала, изображенной на фиг.1.
Фиг.4 - функциональная блок-схема иллюстративной второй ступени кодера исходного сигнала, используемого согласно одному варианту осуществления системы передачи речевого сигнала, изображенной на фиг.1.
Фиг.5 - функциональная блок-схема иллюстративной третьей ступени кодера исходного сигнала, используемого согласно одному варианту осуществления системы передачи речевого сигнала, изображенной на фиг.1.
Фиг.6 - функциональная блок-схема иллюстративной четвертой ступени кодера исходного сигнала, используемого согласно одному варианту осуществления системы передачи речевого сигнала, изображенной на фиг.1, для обработки непериодического речевого сигнала (режим 0).
Фиг.7 - функциональная блок-схема иллюстративной четвертой ступени кодера исходного сигнала, используемого согласно одному варианту осуществления системы передачи речевого сигнала, изображенной на фиг.1, для обработки периодического речевого сигнала (режим 1).
Фиг.8 - блок-схема, иллюстрирующая кадр и подкадры.
Фиг.9 - пример двухмерной кодовой книги для квантования коэффициентов усиления адаптивной кодовой книги и коэффициентов усиления фиксированной кодовой книги.
Фиг.10 - таблица, иллюстрирующая выделение битов под параметры согласно одному иллюстративному варианту осуществления алгоритма кодирования речевого сигнала, отвечающего настоящему изобретению.
Фиг.11 - блок-схема одного варианта осуществления речевого декодера для обработки кодированной информации, поступающей от речевого кодера, отвечающего настоящему изобретению.
Фиг.12а-12с - схемы трех альтернативных вариантов осуществления речевого кодера, отвечающего настоящему изобретению.
ПОДРОБНОЕ ОПИСАНИЕ ПРЕДПОЧТИТЕЛЬНОГО ВАРИАНТА ОСУЩЕСТВЛЕНИЯ
Ниже в общих чертах описан алгоритм кодирования и декодирования речевого сигнала в целом, а затем подробно рассмотрен вариант осуществления настоящего изобретения.
На фиг.1 изображена блок-схема системы передачи речевого сигнала, иллюстрирующая обычное использование речевого кодера и декодера в системе связи. Система 100 передачи речевого сигнала передает и воспроизводит речевой сигнал посредством канала связи 103. Хотя он может содержать проводную, волоконную или оптическую линию связи, канал связи 103 обычно содержит, по меньшей мере, частично линию радиосвязи, которая часто должна поддерживать множество одновременных обменов речевыми сигналами, для чего требуются совместно используемые ресурсы полосы частот, как, например, в сотовой телефонии.
К каналу связи 103 можно подключить запоминающее устройство для временного хранения речевой информации для задержанного воспроизведения, например для осуществления функций автоответчика, голосовой электронной почты и т.п. Аналогично, канал связи 103 можно заменить таким запоминающим устройством согласно варианту осуществления системы связи 100 в виде единого устройства, которое, например, только записывает и хранит речевой сигнал для последующего воспроизведения.
В частности, микрофон 111 выдает речевой сигнал в режиме реального времени. От микрофона 111 речевой сигнал поступает на А/Ц (аналого-цифровой) преобразователь 115. А/Ц преобразователь 115 преобразует аналоговый речевой сигнал в цифровой сигнал, после чего оцифрованный речевой сигнал поступает на речевой кодер 117.
Речевой кодер 117 кодирует оцифрованный речевой сигнал, используя по выбору один из совокупности режимов кодирования. Каждый из совокупности режимов кодирования предусматривает использование того или иного метода оптимизации качества конечного воспроизведения речевого сигнала. Работая в любом из совокупности режимов, речевой кодер 117 выдает определенную информацию моделирования и параметров (например, “речевых параметров”), и речевые параметры поступают на опционный канальный кодер 119.
Опционный канальный кодер 119 координирует, на какой канальный декодер 131 следует доставлять речевые параметры по каналу связи 103. Канальный декодер 131 пересылает речевые параметры на речевой декодер 133. Работая в режиме, соответствующем режиму речевого кодера 117, речевой декодер 133 пытается максимально точно восстановить исходный речевой сигнал на основании речевых параметров. С речевого декодера 133 воспроизводимый речевой сигнал поступает на Ц/А (цифроаналоговый) преобразователь 135 с тем, чтобы воспроизводимую речь можно было прослушивать через громкоговоритель 137.
На фиг.2 изображена блок-схема иллюстративного устройства связи, изображенного на фиг.1. Устройство связи 151 содержит речевой кодер и речевой декодер для одновременного восприятия и воспроизведения речи. Устройство связи 151, выполненное обычно в виде единого блока, может содержать, например, сотовый телефон, переносной телефон, вычислительную систему или иное устройство связи. Альтернативно, если предусмотрен элемент памяти для хранения кодированной речевой информации, то устройство связи 151 может содержать автоответчик, магнитофон, систему голосовой почты или иное устройство связи с памятью.
С микрофона 155 и А/Ц преобразователя 157 цифровой голосовой сигнал поступает на систему кодирования 159. Система кодирования 159 осуществляет кодирование речевого сигнала и выдает сформированную информацию речевых параметров в канал связи. Передаваемая информация речевых параметров может быть адресована другому устройству связи (не показано), находящемуся на удалении.
Приняв информацию речевых параметров, система декодирования 165 осуществляет декодирование речевого сигнала. Из системы декодирования информация речевых параметров поступает на Ц/А преобразователь 167, выдающий аналоговый речевой сигнал, который может воспроизводиться громкоговорителем 169. Конечным результатом является воспроизведение звуков, как можно более близких к первоначально воспринимаемой речи.
Система кодирования 159 содержит схему 185 обработки речевого сигнала, которая осуществляет кодирование речевого сигнала, и схему 187 опционной канальной обработки, которая осуществляет опционное канальное кодирование. Аналогично, система декодирования 165 содержит схему 189 обработки речевого сигнала, которая осуществляет декодирование речевого сигнала, и схему 191 опционной канальной обработки, которая осуществляет канальное декодирование.
Хотя схема 185 обработки речевого сигнала и схема 187 опционной канальной обработки показаны раздельными, они могут быть частично или полностью объединены в едином модуле. Например, схема 185 обработки речевого сигнала и схема 187 канальной обработки могут совместно использовать один ЦСП (цифровой сигнальный процессор) и/или другие электронные средства обработки. Аналогично, схема 189 обработки речевого сигнала и схема 191 опционной канальной обработки могут быть полностью раздельными или частично или полностью объединенными. Кроме того, полное или частичное объединение можно применять к схемам 185 и 189 обработки речевого сигнала, схемам 187 и 191 канальной обработки, схемам 185, 187, 189 и 191 обработки или иным их сочетаниям по мере необходимости.
Система кодирования 159 и система декодирования 165 используют память 161. Схема 185 обработки речевого сигнала использует фиксированную кодовую книгу 181 и адаптивную кодовую книгу 183 речевой памяти 177 в процессе кодирования исходного сигнала. Аналогично, схема 189 обработки речевого сигнала использует фиксированную кодовую книгу 181 и адаптивную кодовую книгу 183 в процессе декодирования исходного сигнала.
Хотя, согласно фиг.2, схемы 185 и 189 обработки речевого сигнала совместно используют речевую память 177, каждой из схем 185 и 189 обработки можно выделить один или несколько обособленных блоков речевой памяти. В памяти 161 также хранится программное обеспечение, используемое схемами 185, 187, 189 и 191 обработки для осуществления различных функций, необходимых в процессах кодирования и декодирования исходных сигналов.
Перед подробным рассмотрением варианта осуществления усовершенствованного кодирования речевого сигнала ниже описан в общих чертах алгоритм кодирования речевого сигнала в целом. Усовершенствованный алгоритм кодирования речевого сигнала применительно к данному описанию изобретения может представлять собой, например, алгоритм eX-CELP (расширенный CELP), основанный на модели CELP. Алгоритм eX-CELP подробно рассмотрен в заявке на патент США, переуступленной настоящему заявителю, Конексант Системз, Инк., и включенной в настоящее описание посредством ссылки: предварительная заявка №60/155321 на патент США, озаглавленная “Кодирование речевого сигнала на скорости 4 кбит/с”, №99RSS485 в реестре фирмы Конексант, поданная 22 сентября 1999 г.
Для достижения высокого качества при низкой битовой скорости (например, 4 кбит/с) усовершенствованный алгоритм кодирования речевого сигнала несколько отклоняется от жесткого критерия согласования формы сигнала, применяемого в традиционных алгоритмах CELP, и стремится воспринимать перцептивно важные особенности входного сигнала. Для этого усовершенствованный алгоритм кодирования речевого сигнала анализирует входной сигнал в отношении определенных особенностей, например степени шумоподобного содержимого, степени содержимого с резкими выбросами, степени озвученного содержимого, степени глухого содержимого, эволюции амплитудного спектра, эволюции энергетического контура, эволюции периодичности и т.д., и использует эту информацию для управления взвешиванием в процессе кодирования и квантования. Основная идея состоит в том, что перцептивно важные особенности нужно представлять максимально точно, а для менее значительных особенностей допустимы сравнительно большие ошибки. Таким образом, усовершенствованный алгоритм кодирования речевого сигнала делает основной упор на перцептивном согласовании, а не на согласовании формы сигнала. Сосредоточение на перцептивном согласовании приводит к удовлетворительному воспроизведению речи в силу предположения, что на скорости 4 кбит/с согласование формы сигнала не является достаточно точным для достоверного восприятия всей информации, содержащейся во входном сигнале.
Поэтому усовершенствованный речевой кодер имеет некоторые преимущества в достижении улучшенных результатов.
Согласно одному конкретному варианту осуществления усовершенствованный речевой кодер использует размер кадра 20 миллисекунд или 160 выборок на кадр, причем каждый кадр делится на два или три подкадра. Количество подкадров зависит от режима обработки подкадров. В данном конкретном варианте осуществления каждый кадр речевого сигнала можно обрабатывать в одном из двух режимов: режиме 0 или режиме 1. Существенно, что способ обработки подкадров зависит от режима. В данном варианте осуществления в режиме 0 кадр делится на два подкадра, причем каждый подкадр имеет размер 10 миллисекунд или содержит 80 выборок. Аналогично, в данном иллюстративном варианте осуществления в режиме 1 кадр делится на три подкадра, причем первый и второй подкадры имеют размер 6,625 миллисекунд или содержат по 53 выборки, а третий подкадр имеет размер 6,75 миллисекунд или содержит 54 выборки. В обоих режимах можно использовать упреждение в 15 миллисекунд. В обоих режимах 0 и 1 для представления огибающей спектра сигнала можно использовать модель линейного прогнозирования (LP) десятого порядка. Модель LP можно кодировать в области частот линейного спектра (ЧЛС) [частоты, определяемые как корни особого линейного многочлена, используемого для сжатия голосового сигнала] по схеме коммутируемого многоступенчатого прогнозирующего векторного квантования с задержанным решением.
В режиме 0 используют традиционный алгоритм кодирования речевого сигнала, например алгоритм CELP. Однако режим 0 применяют не ко всем кадрам речевого сигнала. Режим 0 выбирают для обработки кадров любого речевого сигнала, кроме речевого сигнала, “подобного периодическому”, что более подробно рассматривается ниже. Для удобства речевой сигнал, “подобный периодическому”, будем называть периодическим речевым сигналом, а любой другой речевой сигнал будем называть “непериодическим” речевым сигналом. Такой непериодический речевой сигнал содержит кадры перехода, для которых характерны быстрые изменения обычных параметров, например корреляции основного тона и задержки основного тона, и кадры, содержащие в основном шумоподобный сигнал. Режим 0 предусматривает разбиение каждого кадра на два подкадра. В режиме 0 задержку основного тона кодируют один раз в течение подкадра и используют двухмерный векторный квантователь, чтобы одновременно кодировать коэффициент усиления основного тона (т.е. коэффициент усиления адаптивной кодовой книги) и коэффициент усиления фиксированной кодовой книги один раз в течение подкадра. Согласно данному иллюстративному варианту осуществления фиксированная кодовая книга содержит две импульсные кодовые полкниги и одну гауссову кодовую подкнигу; две импульсные кодовые подкниги имеют два и три импульса соответственно.
Режим 1 предусматривает отход от традиционного алгоритма CELP. Режим 1 используют для обработки кадров, содержащих периодический речевой сигнал, для которых характерна высокая периодичность и представление посредством сглаженного тракта основного тона. В данном конкретном варианте осуществления режим 1 предусматривает разбиение кадра на три подкадра. Задержку основного тона кодируют один раз в течение кадра до начала обработки подкадров в порядке предварительной обработки основного тона и на основании задержки выводят интерполированный тракт основного тона. Три коэффициента усиления основного тона, полученные для соответствующих подкадров, весьма стабильны и подвергаются совместному квантованию с использованием предварительного векторного квантования, основанного на критерии среднеквадратичной ошибки, до начала обработки подкадров в замкнутом контуре. Из взвешенного речевого сигнала выводят три опорных коэффициента усиления, которые не подлежат квантованию и являются побочным продуктом предварительной обработки основного тона на уровне кадров. Используя предварительно квантованные коэффициенты усиления основного тона, осуществляют традиционную обработку подкадров в режиме CELP, оставляя без квантования три коэффициента усиления фиксированной кодовой книги. Три коэффициента усиления фиксированной кодовой книги подвергают совместному квантованию после обработки подкадров на основе метода задержанного решения с использованием прогнозирования энергии методом скользящего среднего. Затем синтезируют три подкадра с полностью квантованными параметрами.
Выбор того или иного режима обработки каждого кадра речевого сигнала производится на основании классификации речевого сигнала, содержащегося в кадре, и новый способ обработки периодического речевого сигнала позволяет квантовать коэффициенты усиления посредством меньшего количества битов без значительного снижения перцептивного качества речи. Ниже приведено более подробное описание этого способа обработки речевого сигнала.
На фиг.3-7 изображены функциональные блок-схемы, иллюстрирующие подход многоступенчатого кодирования, используемый согласно одному варианту осуществления речевого кодера, проиллюстрированного на фиг.1 и 2. В частности, на фиг.3 показана функциональная блок-схема, иллюстрирующая речевой препроцессор 193, который осуществляет первую ступень метода многоступенчатого кодирования; на фиг.4 показана функциональная блок-схема, иллюстрирующая вторую ступень; на фиг.3 и 6 показаны функциональные блок-схемы, представляющие режим 0 третьей ступени; и на фиг.7 показана функциональная блок-схема, представляющая режим 1 третьей ступени. Речевой кодер, содержащий обрабатывающую схему кодера, обычно действует в соответствии с программой, выполняя следующие функции.
Входной речевой сигнал считывается и буферизуется в виде кадров. Что касается речевого препроцессора 193, изображенного на фиг.3, то кадр входного речевого сигнала 129 поступает на блок 195 повышения разборчивости молчания, который определяет, содержит ли кадр речевого сигнала полное молчание, т.е. наличие только “шума молчания”. Блок 195 повышения разборчивости речи адаптивно проверяет на уровне кадров, содержит ли текущий кадр исключительно “шум молчания”. Если сигнал 192 является “шумом молчания”, то блок 195 повышения разборчивости речи сбрасывает сигнал до нулевого уровня сигнала 192. Если же сигнал 192 не является “шумом молчания”, то блок 195 повышения разборчивости речи не изменяет сигнал 192. Блок 195 повышения разборчивости речи вычищает фрагменты молчания чистой речи до шума очень низкого уровня и, таким образом, повышает перцептивное качество чистой речи. Эффект функции повышения разборчивости речи становится особенно заметным, когда входной речевой сигнал поступает из источника А-типа, т.е. для входного сигнала, прошедшего кодирование и декодирование А-типа непосредственно перед применением данного алгоритма кодирования речевого сигнала. Поскольку А-тип подразумевает усиление выборочных значений вокруг 0 (например, -1, 0, +1) до -8 либо +8, то усиление А-типа способно преобразовывать неслышимый шум молчания в отчетливо слышимый шум. Пройдя обработку в блоке 195 повышения разборчивости речи, речевой сигнал поступает в фильтр 197 высоких частот.
Фильтр 197 высоких частот блокирует частоты, которые ниже определенной частоты среза, и, таким образом, в аттенюатор 199 шума поступают только частоты, превышающие частоту среза. В данном конкретном варианте осуществления фильтр 197 высоких частот идентичен входному фильтру высоких частот, отвечающему стандарту ITU-T G.729 кодирования речевого сигнала. Конкретно, это фильтр второго порядка с полюсами и нулями, имеющий частоту среза 140 герц (Гц). Конечно, в качестве фильтра 197 высоких частот не обязательно использовать именно такой фильтр, и можно использовать любой подходящий фильтр, известный специалистам в данной области.
Аттенюатор 199 шума осуществляет алгоритм шумоподавления. В данном конкретном варианте осуществления аттенюатор 199 шума осуществляет слабое шумоподавление, максимум на 5 децибел (дБ) шума окружающей среды, что позволяет алгоритму кодирования речевого сигнала лучше оценивать параметры. Специалистам в данной области известны многочисленные варианты реализации конкретных способов повышения разборчивости молчания, построения фильтра 197 высоких частот и ослабления шума. Речевой препроцессор 193 выдает предварительно обработанный речевой сигнал 200.
Конечно, специалисты в данной области могут предложить различные варианты замены блока 195 повышения разборчивости молчания, фильтра 197 высоких частот и аттенюатора 199 шума каким-либо другим устройством или их изменения в соответствии с конкретной областью применения.
На фиг.4 представлена блок-схема общей обработки речевого сигнала на уровне кадров. Иными словами, фиг.4 иллюстрирует покадровую обработку речевого сигнала. Эта обработка кадров осуществляется независимо от режима (например, режима 0 или 1) и предваряет обработку 250, зависящую от режима. Предварительно обработанный речевой сигнал 200 поступает на фильтр 252 перцептивного взвешивания, который подчеркивает провалы и сглаживает пики предварительно обработанного речевого сигнала 200. Специалисты в данной области могут предложить различные варианты замены фильтра 200 перцептивного взвешивания каким-либо другим устройством или его изменения в соответствии с конкретной областью применения.
Анализатор 260 LPC получает предварительно обработанный речевой сигнал 200 и оценивает кратковременную огибающую спектра речевого сигнала 200. Анализатор 260 LPC извлекает коэффициенты LPC из характеристик, определяющих речевой сигнал 200. Согласно одному варианту осуществления анализ LPC десятого порядка осуществляется три раза для каждого кадра. Его производят в средней трети, последней трети и в упреждении каждого кадра. Анализ LPC для упреждения начинает цикл для следующего кадра как соответствующий первой трети кадра. Таким образом, для каждого кадра генерируется четыре набора параметров LPC. Анализатор 260 LPC может также осуществлять квантование коэффициентов LPC, например, в области частот линейного спектра (ЧЛС). Квантование коэффициентов LPC может представлять собой скалярное или векторное квантование и может осуществляться в любой подходящей области и любым способом, известным в технике.
Классификатор 270 получает информацию о характеристиках предварительно обработанного речевого сигнала 200 на основании, например, абсолютного максимума кадра, коэффициентов отражения, ошибки прогнозирования, вектора ЧЛС, полученного от анализатора 260 LPC, автокорреляции десятого порядка, последней задержки основного тона и последних коэффициентов усиления основного тона. Эти параметры известны специалистам в данной области и потому дополнительно не поясняются. Классификатор 270 использует эту информацию для управления другими функциями кодера, например оцениванием отношения сигнал-шум, оцениванием основного тона, классификацией, сглаживанием спектра, сглаживанием энергетического контура и нормализацией коэффициента усиления. Эти функции опять же известны специалистам в данной области и потому дополнительно не поясняются. Ниже приведено краткое описание алгоритма классификации.
Классификатор 270 с помощью препроцессора 254 основного тона классифицирует каждый кадр как принадлежащий одному из шести классов согласно преобладающей особенности кадра. Эти классы таковы: (1) молчание/фоновый шум; (2) шумоподобная/глухая речь; (3) глухой; (4) переход (содержит подъем); (5) нестационарно звонкий; (6) стационарно звонкий. Классификатор 270 может использовать любой подход для классификации входного сигнала как периодического сигнала или непериодического сигнала. Например, классификатор 270 может использовать в качестве входных параметров предварительно обработанный речевой сигнал, задержку и корреляцию основного тона второй половины кадра и другую информацию.
Для определения того, следует ли считать речевой сигнал периодическим, можно использовать различные критерии. Например, речевой сигнал можно считать периодическим, если он содержит стационарно звонкую речь и нестационарно звонкую речь, но, применительно к данному описанию изобретения, периодический речевой сигнал включает в себя стационарно звонкую речь. Кроме того, периодический речевой сигнал может представлять собой плавную и стационарную речь. Речь считается “стационарной”, когда изменение речевого сигнала в пределах кадра не превышает определенной величины. Такой речевой сигнал, скорее всего, имеет четкий энергетический контур. Речевой сигнал является “плавным”, если коэффициент усиления Gp адаптивной кодовой книги для этого речевого сигнала превышает пороговое значение. Например, если пороговое значение равно 0.7, то речевой сигнал в подкадре считается плавным, если его коэффициент усиления Gp адаптивной кодовой книги больше 0.7. Непериодический речевой сигнал или незвонкая речь включает в себя глухую речь (например, фрикативные звуки наподобие звука “шшш...”), переходы (например, подъемы, спады), фоновый шум и молчание.
В частности, согласно иллюстративному варианту осуществления, речевой кодер первоначально выводит следующие параметры:
Спектральный спад (оценка первого коэффициента отражения 4 раза за кадр):
Figure 00000002
где L=80 - окно, по которому вычисляется коэффициент отражения, и Sk(n) - k-й сегмент, задаваемый выражением
Figure 00000003
где wh(n) - окно Хэмминга на 80 выборок, и s(0), s(1),..., s(159) - текущий кадр предварительно обработанного речевого сигнала.
Абсолютный максимум (отслеживание абсолютного максимума сигнала 8 оценок на кадр):
Figure 00000004
где ns(k) и ne(k) - начальная точка и конечная точка соответственно поиска k-го максимума в момент k·160/8 выборок кадра. В общем случае длина сегмента в 1,5 раза превышает период основного тона, и сегменты перекрываются. Таким образом, можно получить плавный контур амплитудной огибающей.
Параметры спектрального спада, абсолютного максимума и корреляции основного тона составляют основание для классификации. Однако дополнительная обработка и анализ параметров осуществляется до принятия решения классификации. При обработке параметров первоначально применяется взвешивание до трех параметров. Взвешивание в каком-то смысле устраняет составляющую фонового шума в параметрах путем вычитания вклада фонового шума. В результате получается параметрическое пространство, “независимое” от любого фонового шума, и, таким образом, более однородное, и повышается устойчивость классификации по отношению к фоновому шуму.
Скользящие средние значения энергии шума, спектрального спада шума, абсолютного максимума шума и корреляции шума с основным тоном по периоду основного тона обновляются восемь раз за кадр и выражаются приведенными ниже уравнениями (4)-(7). Эти параметры, задаваемые уравнениями (4)-(7), оцениваются/дискретизируются восемь раз за кадр, что обеспечивает параметрическое пространство с хорошим разрешением по времени:
Скользящее среднее значение энергии шума по периоду основного тона:
Figure 00000005
где EN,P(k) - энергия, нормализованная по периоду основного тона в момент k·160/8 выборок кадра. Сегменты, по которым вычисляется энергия, могут перекрываться, поскольку период основного тона обычно превышает 20 выборок (160 выборок/8). Скользящее среднее значение спектрального спада шума:
Figure 00000006
Скользящее среднее значение абсолютного максимума шума:
Figure 00000007
Скользящее среднее значение корреляции шума с основным тоном:
Figure 00000008
где Rp - корреляция входного основного тона для второй половины кадра. Адаптационная постоянная α1 является адаптивной, хотя типичное значение α1=0,99.
Отношение фонового шума к сигналу вычисляется следующим образом:
Figure 00000009
Ослабление параметрического шума ограничено 30 дБ, т.е.
Figure 00000010
Набор параметров без шума (взвешенных параметров) получают удалением составляющей шума согласно приведенным ниже уравнениям (10)-(12):
Оценка взвешенного спектрального спада:
Figure 00000011
Оценка взвешенного абсолютного максимума:
Figure 00000012
Оценка взвешенной корреляции основного тона:
Figure 00000013
Эволюция взвешенного спада и взвешенного максимума вычисляется согласно приведенным ниже уравнениям (13) и (14) соответственно как наклон аппроксимации первого порядка:
Figure 00000014
Figure 00000015
После обновления параметров уравнений (4)-(14) для восьми точек выборки кадра на основании параметров уравнений (4)-(14) вычисляют следующие параметры кадрового уровня:
Максимальная взвешенная корреляция основного тона:
Figure 00000016
Средневзвешенная корреляция основного тона:
Figure 00000017
Скользящее среднее значение средневзвешенной корреляции основного тона:
Figure 00000018
где m - номер кадра и α2=0,75 - адаптационная постоянная. Нормализованное стандартное отклонение задержки основного тона:
Figure 00000019
где Lp(m) - задержка входного основного тона и
Figure 00000020
- среднее значение задержки основного тона по последним трем кадрам, выражаемое следующим образом:
Figure 00000021
Минимальный взвешенный спектральный спад:
Figure 00000022
Скользящее среднее значение минимального взвешенного спектрального спада:
Figure 00000023
Средневзвешенный спектральный спад:
Figure 00000024
Минимальный наклон взвешенного спада:
Figure 00000025
Накопленный наклон взвешенного спектрального спада:
Figure 00000026
Максимальный наклон взвешенного максимума:
Figure 00000027
Накопленный наклон взвешенного максимума:
Figure 00000028
Параметры, заданные уравнениями (23), (25) и (26), используются для того, чтобы помечать кадр, который, вероятно, содержит подъем, а параметры, задаваемые уравнениями (16)-(18), (20)-(22), используются для того, чтобы помечать кадр, в котором, вероятно, преобладает звонкая речь. На основании исходных меток, прошлых меток и другой информации кадр классифицируется как принадлежащий одному из шести классов.
Более подробное описание классификации предварительно обработанного речевого сигнала 200, осуществляемой классификатором 270, приведено в заявке на патент США, присвоенной настоящему заявителю, Конексант системз, инк., и ранее включенной в настоящее описание посредством ссылки:
предварительная заявка №60/155321 на патент США, озаглавленная “Кодирование речевого сигнала на скорости 4 кбит/с”, №99RSS485 в реестре фирмы Конексант, поданная 22 сентября 1999 г.
Квантователь 267 ЧЛС получает коэффициенты LPC от анализатора 260 LPC и квантует коэффициенты LPC. Задачей квантования ЧЛС, которое может представлять собой любой известный способ квантования, включая скалярное или векторное квантование, является представление коэффициентов меньшим количеством битов. В данном конкретном варианте осуществления квантователь 267 ЧЛС осуществляет квантование согласно модели LPC десятого порядка. Квантователь 267 ЧЛС может также сглаживать спектры ЧЛС для уменьшения нежелательных флуктуаций огибающей спектра фильтра синтеза LPC. Квантователь 267 ЧЛС направляет квантованные коэффициенты Aq(z) 268 в блок 250 обработки подкадров, входящий в состав речевого кодера. Блок обработки подкадров, входящий в состав речевого кодера, является зависимым от режима. Хотя предпочтительно работать в ЧЛС, квантователь 267 может квантовать коэффициенты LPC в области, отличной от области ЧЛС.
Если выбрана предварительная обработка основного тона, то взвешенный речевой сигнал 256 поступает на препроцессор 254 основного тона. Препроцессор 254 основного тона взаимодействует с блоком 272 оценки основного тона в разомкнутом контуре для изменения взвешенного речевого сигнала 256 таким образом, чтобы эту информацию основного тона можно было более точно квантовать. Препроцессор 254 основного тона может, например, использовать известные методы сжатия или расширения на периодах основного тона для повышения способности речевого кодера квантовать коэффициенты усиления основного тона. Иными словами, препроцессор 254 основного тона изменяет взвешенный речевой сигнал 256, чтобы он лучше соответствовал оцененному тракту основного тона и, таким образом, более точно подходил к модели кодирования, тем самым генерируя перцептивно неотличимый воспроизводимый речевой сигнал. Если обрабатывающая схема кодера выбирает режим предварительной обработки основного тона, то препроцессор 254 основного тона осуществляет предварительную обработку основного тона взвешенного речевого сигнала 256. Препроцессор 254 основного тона “деформирует” взвешенный речевой сигнал 256, чтобы привести его в соответствие с интерполированными значениями основного тона, генерируемыми обрабатывающей схемой декодера. Когда применяется предварительная обработка основного тона, “деформированный” речевой сигнал называют измененным взвешенным речевым сигналом 258. Если режим предварительной обработки основного тона не выбран, то взвешенный речевой сигнал 256 проходит через препроцессор 254 основного тона без предварительной обработки основного тона (и для простоты по прежнему именуется “измененным взвешенным речевым сигналом” 258). Препроцессор 254 основного тона может включать в себя интерполятор формы сигнала, функция и реализация которого известны специалистам в данной области. Интерполятор формы сигнала может изменять определенные сегменты нерегулярных переходов, используя известные методы интерполирования формы сигнала вперед и назад, чтобы усилить регулярности и подавить нерегулярности речевого сигнала. Коэффициент усиления основного тона и корреляция основного тона для взвешенного сигнала 256 оцениваются препроцессором 254 основного тона. Блок 272 оценки основного тона в разомкнутом контуре извлекает информацию о характеристиках основного тона из взвешенного речевого сигнала 256. Информация основного тона включает в себя информацию задержки основного тона и коэффициента усиления основного тона.
Препроцессор 254 основного тона также взаимодействует с классификатором 270 посредством блока 272 оценки основного тона в разомкнутом контуре для уточнения классификации речевого сигнала, осуществляемой классификатором 270. Поскольку препроцессор 254 основного тона получает дополнительную информацию о речевом сигнале, классификатор 270 может использовать дополнительную информацию для точной настройки своей классификации речевого сигнала. После осуществления предварительной обработки препроцессор 254 основного тона выдает информацию 284 тракта основного тона и неквантованные коэффициенты усиления 286 основного тона в блок 250 обработки подкадров в зависимости от режима, входящий в состав речевого кодера.
После того, как классификатор 270 соотнесет предварительно обработанный речевой сигнал 200 с одним из совокупности возможных классов, классификационный номер предварительно обработанного речевого сигнала 200 поступает в блок 274 выбора режима и блок 250 обработки подкадров в зависимости от режима в качестве информации управления 280.
Блок 274 выбора режима использует классификационный номер для выбора режима работы. В данном конкретном варианте осуществления классификатор 270 классифицирует предварительно обработанный речевой сигнал 200 как принадлежащий одному из шести возможных классов. Если предварительно обработанный речевой сигнал 200 является стационарно звонкой речью (например, так называемым “периодическим” речевым сигналом), то блок 274 выбора режима выдает сигнал 282 режима, соответствующий режиму 1. В противном случае блок 274 выбора режима выдает сигнал 282 режима, соответствующий режиму 0. Сигнал 282 режима поступает в блок 250 обработки подкадров в зависимости от режима, входящий в состав речевого кодера. Информация 282 режима добавляется к битовому потоку, передаваемому в декодер.
Идентификацию речевого сигнала, как “периодического” или “непериодического”, следует, применительно к данному конкретному варианту осуществления, интерпретировать с некоторой осторожностью. Например, кадры, кодированные в режиме 1, - это кадры, поддерживающие высокую степень корреляции основного тона и высокий коэффициент усиления основного тона на протяжении кадра, на основании тракта 284 основного тона, выводимого всего лишь из семи битов на кадр. Следовательно, выбор режима 0 вместо режима 1 может произойти не только из-за отсутствия периодичности, но и вследствие неточности представления тракта 284 основного тона всего лишь семью битами. Поэтому сигналы, кодированные с использованием режима 0, вполне могут иметь периодичность, хотя и не очень хорошо представленную всего лишь семью битами на кадр для тракта основного тона. Таким образом, в режиме 0 тракт основного тона кодируют семью битами дважды на протяжении кадра, т.е. всего четырнадцатью битами на кадр, чтобы более правильно представлять тракт основного тона.
Каждый из функциональных блоков, показанных на фиг.3-4 и других чертежах, иллюстрирующих описание изобретения, не обязательно представляет собой отдельную структуру, а может объединяться с каким-либо другим или несколькими из вышеописанных функциональных блоков.
Блок 250 обработки подкадров в зависимости от режима, входящий в состав речевого кодера, работает в двух режимах: режиме 0 и режиме 1. На фиг.5-6 изображены функциональные блок-схемы обработки подкадров в режиме 0, а на фиг.7 изображена функциональная блок-схема обработки подкадров в режиме 1, осуществляемой на третьей ступени речевого кодера.
Согласно фиг.5 выбранный вектор 291 возбуждения из адаптивной кодовой книги 290 поступает на умножитель 294, где перемножается с квантованным коэффициентом усиления Gp основного тона для получения вклада 293 адаптивной кодовой книги, масштабированного коэффициентом усиления. Аналогично, выбранный вектор 295 возбуждения из фиксированной кодовой книги 292 поступает на умножитель 296, где перемножается с квантованным коэффициентом усиления Gc фиксированной кодовой книги для получения вклада 297 фиксированной кодовой книги, масштабированного коэффициентом усиления. Вклад 293 адаптивной кодовой книги, масштабированный коэффициентом усиления, и вклад 297 фиксированной кодовой книги, масштабированный коэффициентом усиления, суммируются на сумматоре 298 для получения суммарного сигнала 299. Суммарный сигнал 299 обрабатывается фильтром 301 синтеза, который осуществляет функцию, обратную анализу квантованного LPC. Взвешивающий фильтр 303 также выполняет функцию, обратную функции фильтра 252 перцептивного взвешивания. Иными словами, фильтр 301 синтеза и взвешивающий фильтр 303 осуществляют повторный синтез речевого сигнала 304 из суммарного сигнала 299. С использованием суммарного сигнала 299, выведенного из квантованной информации, фильтр 301 синтеза и взвешивающий фильтр 303 пытаются создать копию речевого сигнала, например повторно синтезированный речевой сигнал 304. Теоретически повторно синтезированный сигнал 304 идентичен конечному сигналу (например, измененному взвешенному сигналу 258). Однако, вследствие эффектов квантования, повторно синтезированный речевой сигнал 304 не в точности идентичен конечному измененному взвешенному сигналу 258. Чтобы минимизировать ошибку квантования коэффициента усиления Gp адаптивной кодовой книги и коэффициента усиления Gc фиксированной кодовой книги, блок обработки подкадров в режиме 0, изображенный на фиг.5, определяет ошибку, вычитая повторно синтезированный речевой сигнал 304 из измененного взвешенного сигнала 258. По существу, вычитатель 309 вычитает повторно синтезированный речевой сигнал 304 из измененного взвешенного сигнала 258, чтобы генерировать сигнал 307 энергии. Минимизатор 300 получает сигнал 307, который представляет ошибку квантования вклада основного тона. На основании сигнала 307 минимизатор 300 управляет выбором векторов возбуждения из адаптивной кодовой книги 290 и фиксированной кодовой книги 292 для снижения ошибки. Процесс повторяется до тех пор, пока минимизатор 300 не выберет оптимальные векторы возбуждения из адаптивной кодовой книги 290 и фиксированной кодовой книги 292, которые минимизируют ошибку повторно синтезированного речевого сигнала 304 для каждого подкадра. Конечно, специалисты в данной области могут предложить различные варианты замены фильтра 301 синтеза, взвешивающего фильтра 303 и минимизатора 300 каким-либо другим устройством или их изменения в соответствии с конкретной областью применения.
Как указывает блок 288, обозначенный на фиг.5 пунктирной линией, коэффициенты усиления адаптивной и фиксированной кодовых книг подвергаются совместному векторному квантованию. В данном конкретном иллюстративном варианте осуществления коэффициенты усиления адаптивной и фиксированной кодовых книг подвергаются совместному векторному квантованию посредством семи битов на подкадр в соответствии со способом, заданным стандартом G.729. Двухмерная кодовая книга, используемая для совместного квантования коэффициентов усиления адаптивной и фиксированной кодовых книг, подвергается исчерпывающему поиску на предмет элемента, который минимизирует среднеквадратичную ошибку между конечным речевым сигналом 258 и реконструированным речевым сигналом 304, т.е. минимизирует значение
Figure 00000029
где квантованные коэффициенты усиления адаптивной и фиксированной кодовой книги выводятся из семиразрядной кодовой книги. Кодовая книга вместо того, чтобы содержать коэффициент усиления адаптивной кодовой книги и коэффициент усиления фиксированной кодовой книги, может содержать коэффициент усиления адаптивной кодовой книги и корректировочный коэффициент для прогнозируемого коэффициента усиления фиксированной кодовой книги (который представляет коэффициент усиления фиксированной кодовой книги). Прогнозирование коэффициента усиления фиксированной кодовой книги основано на прогнозировании второго порядка методом скользящего среднего энергии фиксированной кодовой книги. Соотношение между корректировочным коэффициентом γk и квантованным коэффициентом усиления фиксированной кодовой книги задается выражением
Figure 00000030
, где
Figure 00000031
- квантованный коэффициент усиления фиксированной кодовой книги и
Figure 00000032
- прогнозируемый коэффициент усиления фиксированной кодовой книги. Прогнозируемый коэффициент усиления фиксированной кодовой книги определяется выражением:
Figure 00000033
Figure 00000034
и
Figure 00000035
Коэффициенты прогнозирования, используемые в процессе прогнозирования методом скользящего среднего, {b1b2}={0,6;0,3}. Обработка подкадров в режиме 0 известна специалистам в данной области и может быть видоизменена по необходимости и способом, известным в технике.
На фиг.6 изображена более подробная блок-схема блока обработки подкадров в режиме 0, изображенного на фиг.5. На фиг.6 показаны три разных этапа обработки. На первом этапе выбирают оптимальный вектор возбуждения Vp из адаптивной кодовой книги 290 в соответствии с методом анализа через синтез. Для выбора исходного вектора возбуждения из адаптивной кодовой книги 290 используют информацию 284 тракта основного тона, поступающую от препроцессора 254 основного тона. Умножитель 406 умножает вектор возбуждения 402 на квантованный коэффициент усиления Gp адаптивной кодовой книги из адаптивной кодовой книги 460 и выдает сигнал 404 произведения на фильтр 408 синтеза. Фильтр 408 синтеза получает квантованные коэффициенты LPC Aq(z) 268 от квантователя 267 LSP и совместно с фильтром 410 перцептивного взвешивания создает повторно синтезированный речевой сигнал 414. Вычитатель 412 вычитает повторно синтезированный речевой сигнал 414 из конечного измененного взвешенного сигнала 258, генерируя сигнал 416. Минимизатор 420 получает сигнал 416, который представляет ошибку квантования коэффициента усиления адаптивной кодовой книги. Минимизатор 420 управляет выбором вектора возбуждения из адаптивной кодовой книги 290 для уменьшения ошибки. Процесс повторяется до тех пор, пока минимизатор 420 не выберет оптимальный вектор возбуждения из адаптивной кодовой книги 290 для каждого подкадра, который минимизирует ошибку в повторно синтезированном речевом сигнале 414. После выбора оптимального вклада основного тона из адаптивной кодовой книги 290 остаточный сигнал 416 представляет собой измененный взвешенный речевой сигнал за минусом вклада основного тона. Этот остаточный сигнал 416 используют на втором этапе выбора оптимального вектора возбуждения из фиксированной кодовой книги 292, который минимизирует ошибку в повторно синтезированном речевом сигнале 436.
Ниже более подробно описан этот второй этап. Выбирают вектор возбуждения из фиксированной кодовой книги 292. Умножитель 427 умножает вектор возбуждения 425 на квантованный коэффициент усиления Gc фиксированной кодовой книги из фиксированной кодовой книги 460 и выдает сигнал 428 произведения на фильтр 430 синтеза. Фильтр 430 синтеза получает квантованные коэффициенты LPC Aq(z) 268 от квантователя 267 ЧЛС и совместно с фильтром 434 перцептивного взвешивания создает повторно синтезированный речевой сигнал 436. Вычитатель 440 вычитает повторно синтезированный речевой сигнал 436 из конечного сигнала (например, сигнала 416), генерируя второй остаточный сигнал 438. Минимизатор 444 получает сигнал 438, который представляет ошибку квантования коэффициента усиления фиксированной кодовой книги. Минимизатор 444 использует сигнал 438 для управления выбором векторов возбуждения из фиксированной кодовой книги 292 для уменьшения ошибки. Минимиэатор 444 получает информацию управления 280 (которая включает в себя классификационный номер речевого сигнала) и в зависимости от классификации тем или иным образом управляет выбором векторов возбуждения из фиксированной кодовой книги 292. Процесс повторяется до тех пор, пока минимизатор 444 не выберет оптимальный вектор возбуждения из фиксированной кодовой книги 292 для каждого подкадра, который минимизирует ошибку повторно синтезированного речевого сигнала 436. Поскольку предполагается, что в этот момент действует режим 0, блок обработки подкадров в режиме 0 нашел оптимальные векторы возбуждения как из адаптивной кодовой книги 290, так и из фиксированной кодовой книги 292.
Ниже описан третий этап, осуществляемый блоком обработки подкадров в режиме 0, изображенным на фиг.6. В этот момент найдены оптимальные векторы возбуждения для адаптивной и фиксированной кодовых книг. Их соответствующие коэффициенты усиления подвергают совместному векторному квантованию. Векторы кодовой книги коэффициентов усиления, представляющие совместное векторное квантование коэффициента усиления адаптивной кодовой книги и коэффициента усиления фиксированной кодовой книги, выбирают из кодовой книги 460 коэффициентов усиления для двухмерного векторного квантования и направляют на умножители 466, 468. Умножитель 466 перемножает квантованный коэффициент усиления Gp 462 адаптивной кодовой книги с оптимальным вектором возбуждения Vp 402 из адаптивной кодовой книги для формирования сигнала 446. Умножитель 468 перемножает квантованный коэффициент усиления Gc 464 фиксированной кодовой книги с оптимальным вектором возбуждения Vc 425 из фиксированной кодовой книги для формирования сигнала 448. Заметим, что выбранные векторы возбуждения Vp 402 и Vc 425 были найдены как оптимальные значения возбуждения на первом и втором этапах обработки подкадров в режиме 0. Сумматор 480 суммирует сигналы 446 и 448 для формирования суммарного сигнала 450. Суммарный сигнал 450 используют для повторного синтеза, осуществляемого комбинацией фильтра 482 синтеза и фильтра 486 перцептивного взвешивания, в результате чего получают повторно синтезированный речевой сигнал 454. Как и фильтры 408 и 430 синтеза, фильтр 482 синтеза получает коэффициенты LPC Aq(z) 268. Вычитатель 512 вычитает повторно синтезированный речевой сигнал 454 из конечного измененного взвешенного речевого сигнала 258 для генерации третьего остаточного сигнала 456. Минимизатор 520 получает третий сигнал 456, который представляет ошибку, возникающую при совместном квантовании коэффициента усиления фиксированной кодовой книги и коэффициента усиления адаптивной кодовой книги посредством кодовой книги 460 коэффициентов усиления для двухмерного векторного квантования. Минимизатор 520 использует сигнал 456 для управления выбором векторов возбуждения из кодовой книги 460 коэффициентов усиления для двухмерного векторного квантования с целью уменьшения ошибки. Процесс повторяется до тех пор, пока минимизатор 520 не выберет оптимальный вектор возбуждения из кодовой книги 460 коэффициентов усиления для двухмерного векторного квантования для каждого подкадра, который минимизирует ошибку в повторно синтезированном речевом сигнале 454. После минимизации ошибки квантованные коэффициенты усиления Gp и Gc из кодовой книги 460 коэффициентов усиления для двухмерного векторного квантования поступают на умножители 294, 296, изображенные на фиг.5.
Специалисты в данной области могут предложить различные варианты замены фильтров 408, 430 и 482 синтеза, взвешивающих фильтров 410, 434 и 486, минимизаторов 420, 430 и 520, умножителей 406, 427 и 468, сумматора 480 и вычитателей 412, 440 и 512 (а также любого другого фильтра, минимизатора, умножителя, сумматора и вычитателя, описанных в данной заявке) какими-либо другими устройствами или их изменения в соответствии с конкретной областью применения.
Подробно рассмотрев обработку подкадров в режиме 0, перейдем к описанию обработки подкадров в режиме 1. На фиг.7 показана иллюстративная блок-схема блока обработки подкадров в режиме 1 блока 250 обработки подкадров в зависимости от режима. В соответствии с трактом 284 основного тона выбирают вектор 588 коэффициента усиления адаптивной кодовой книги из адаптивной кодовой книги 290. Вклад адаптивной кодовой книги определяют на основании предыдущего вектора возбуждения и тракта 284 основного тона, полученного от препроцессора 254 основного тона, при этом поиск в кодовой книге 290 не требуется. На основании интерполированного тракта основного тона Lp(n), полученного от препроцессора 254, каждое выборочное значение вектора возбуждения адаптивной кодовой книги получают интерполяцией предыдущего вектора возбуждения с использованием взвешенного Sinc-функцией окна Хэмминга 21-го порядка:
Figure 00000036
где е(n) - предыдущий вектор возбуждения, i(Lp(n)) и f(Lp(n)) - целая и дробная части задержки основного тона соответственно и ws(f,i) - взвешенное Sinc-функцией окно Хэмминга. Оптимальная взвешенная среднеквадратическая ошибка коэффициента усиления основного тона оценивают как:
Figure 00000037
для минимизации взвешенной среднеквадратической ошибки между исходным и реконструированным речевыми сигналами. “N” в уравнении 32 - это переменное количество подкадров в кадре. Неквантованный коэффициент усиления основного тона вычисляют согласно следующему взвешиванию оптимального коэффициента усиления основного тона:
Figure 00000038
где нормализованный коэффициент перекрестной корреляции задан выражением:
Figure 00000039
Это взвешивание нивелирует вклад основного тона из адаптивной кодовой книги до поиска в фиксированной кодовой книге, оставляя больше информации основного тона в конечном сигнале для поиска в фиксированной кодовой книге.
Неквантованные коэффициенты усиления 286 основного тона, полученные от блока обработки кадров, входящего в состав речевого кодера, поступают на блок 580 предварительного n-мерного векторного квантования. Если, например, каждый кадр делится на три подкадра, то блок 580 предварительного n-мерного векторного квантования представляет собой блок трехмерного векторного квантования, который выдает коэффициент усиления 582 основного тона, подвергнутый векторному квантованию, на умножитель 592. Умножитель 592 перемножает вектор 588 коэффициента усиления адаптивной кодовой книги с вектором 582 квантованного коэффициента усиления основного тона и выдает результат 584 на фильтр 600 синтеза. Фильтр 600 синтеза также получает квантованные коэффициенты LPC Aq(z) 268 от квантователя 267 ЧЛС и выдает выходной сигнал 586 на фильтр 602 перцептивного взвешивания. Фильтр 600 синтеза и фильтр 602 перцептивного взвешивания совместно создают повторно синтезированный речевой сигнал 587, который вычитается из измененного взвешенного речевого сигнала 258 вычитателем 604. Разностный сигнал 589 поступает на другой вынитатель 614.
Фиксированная кодовая книга 292 направляет вектор 590 коэффициента усиления фиксированной кодовой книги на умножитель 594. Умножитель 594 перемножает вектор 590 коэффициента усиления фиксированной кодовой книги с расчетным вектором gck коэффициента усиления фиксированной кодовой книги. Сигнал 595 произведения поступает на фильтр 610 синтеза. Фильтр 610 синтеза также получает квантованные коэффициенты LPC Aq(z) 268 и выдает выходной сигнал 596 на фильтр 612 перцептивного взвешивания. Совместно фильтр 610 синтеза и фильтр 612 перцептивного взвешивания создают повторно синтезированный речевой сигнал 597, который вычитается из разностного сигнала 589 вычитателем 614 для генерации другого разностного сигнала 599. Разностный сигнал 589 представляет ошибку квантования коэффициента усиления адаптивной кодовой книги, а разностный сигнал 599 представляет ошибку квантования коэффициента усиления фиксированной кодовой книги. Разностный сигнал 599 поступает на минимизатор 620, который управляет выбором вектора возбуждения из фиксированной кодовой книги 292 для уменьшения ошибки. Минимизатор также получает информацию управления 280 от блока обработки кадров, входящего в состав речевого кодера, а именно классификационный номер кадра. В частности, в этом иллюстративном варианте осуществления фиксированная кодовая книга 292 имеет три импульсные подкниги: 2-импульсную кодовую книгу, 3-импульсную кодовую книгу и 6-импульсную кодовую книгу. Исходная цель фиксированной кодовой книги 292 вычисляется из взвешенного предварительно обработанного речевого сигнала 258 с удаленным нулевым откликом, т.е. цели адаптивной кодовой книги 290 и оптимального вектора возбуждения и коэффициента усиления адаптивной кодовой книги согласно уравнению:
Figure 00000040
Выбор конечного векторного возбуждения фиксированной кодовой книги предусматривает сравнение взвешенной среднеквадратической ошибки 599 наилучшего кандидата из каждой кодовой подкниги фиксированной кодовой книги 292 после применения соответствующего взвешивания согласно классификации 280. Конечное возбуждение фиксированной кодовой книги обозначается
Figure 00000041
или vc(n).
Процесс выбора вектора коэффициента усиления фиксированной кодовой книги повторяется до тех пор, пока минимизатор 620 не выберет оптимальный вектор возбуждения из фиксированной кодовой книги 292 для каждого подкадра, который минимизирует ошибку повторно синтезированного речевого сигнала 597. После выбора оптимального вектора возбуждения из фиксированной кодовой книги 292 выбранный вектор 588 коэффициента усиления адаптивной кодовой книги и выбранный вектор 590 возбуждения фиксированной кодовой книги поступают совместно с измененным взвешенным речевым сигналом 258 в буфер 642.
В режиме 1 кадр делится на n подкадров, причем в данном конкретном варианте осуществления n равно 3. Обработка, осуществляемая в блоке 575, выполняется на уровне подкадров, и индекс k обозначает номер подкадра. Остальные функции, осуществляющиеся вне блока 575, выполняются на уровне кадров. Ввиду того, что обработка осуществляется как на уровне подкадров, так и на уровне кадров, определенные функции не могут быть выполнены до завершения других функций. Поэтому определенные параметры для n (например, трех) подкадров приходится сохранять в буфере 642 на границе уровней подкадров и кадров. Буферизуемые параметры могут включать в себя, например, предварительно квантованные коэффициенты усиления основного тона, квантованные векторы адаптивной и фиксированной кодовых книг, конечный вектор и другие параметры. Буферизованная информация затем поступает на вычитатель 644.
n векторов 660 коэффициента усиления адаптивной кодовой книги перемножаются с n векторами 662 коэффициента усиления основного тона на умножителе 644 для генерации сигнала 666 произведения. Сигнал 666 произведения поступает на сумматор 670. Кодовая книга 680 коэффициентов усиления для n-мерного векторного квантования обеспечивает векторы квантованного коэффициента усиления фиксированной кодовой книги, подлежащие перемножению с вектором 672 коэффициента усиления фиксированной кодовой книги на умножителе 684. Сигнал 668 произведения поступает на сумматор 670. Сумматор 670 направляет суммарный сигнал 669 на фильтр 690 синтеза. Фильтр 690 синтеза получает квантованные коэффициенты LPC Aq(z) 268. Фильтр 690 синтеза и фильтр 694 перцептивного взвешивания действуют совместно для создания повторно синтезированного речевого сигнала 696. Повторно синтезированный речевой сигнал 696 вычитается из измененного взвешенного речевого сигнала 258 на вычитателе 644. Разностный сигнал 698, представляющий ошибку квантования векторов коэффициента усиления фиксированной кодовой книги, поступает на минимизатор 678. Минимизатор 678 выбирает другой вектор коэффициента усиления фиксированной кодовой книги из блока 680 n-мерного векторного квантования, чтобы минимизировать эту ошибку.
В частности, согласно данному иллюстративному варианту осуществления три коэффициента усиления основного тона, выведенные в ходе предварительной обработки основного тона, подвергаются предварительному векторному квантованию посредством блока четырехразрядного 3-мерного векторного квантования согласно
Figure 00000042
Figure 00000043
Предварительное векторное квантование коэффициентов усиления основного тона осуществляется до начала обработки подкадров в замкнутом контуре. Обработка подкадров в режиме 1 осуществляется с помощью неквантованных коэффициентов усиления фиксированной кодовой книги. Векторы возбуждения 588 и 590 коэффициента усиления и конечные сигналы буферизуются в буфере 642 в ходе обработки подкадров и используются для осуществления задержанного совместного квантования трех коэффициентов усиления фиксированной кодовой книги посредством блока 680 восьмиразрядного векторного квантования. Оптимальные векторы
Figure 00000044
,
Figure 00000045
коэффициентов усиления кодовой книги для каждого подкадра сохраняются в буфере 642.
Для полной синхронизации речевого кодера и декодера, а также для правильного обновления блоков памяти фильтров 600, 610 синтез для всех подкадров повторяется при полностью квантованных параметрах по завершении задержанного векторного квантования трех коэффициентов усиления фиксированной кодовой книги.
В n-мерной кодовой книге 680 (здесь n=3) осуществляется поиск для минимизации
Figure 00000046
где L1, L2 и L3 - длины соответствующих подкадров в режиме 1. Квантованные коэффициенты усиления основного тона
Figure 00000047
получают из первоначальной обработки кадров, и {t1(n),t2(n),t3(n)},
Figure 00000048
и
Figure 00000049
буферизуют в ходе обработки подкадров, причем верхние индексы представляют 1-й, 2-й и 3-й подкадр (а не показатели степени).
Оптимальные коэффициенты усиления фиксированной кодовой книги
Figure 00000050
выбирают из восьмиразрядной кодовой книги 680, причем элементы кодовой книги содержат 3-мерный корректировочный коэффициент для прогнозируемых коэффициентов усиления кодовой книги. Прогнозирование коэффициентов усиления фиксированной кодовой книги основывается на прогнозировании энергии фиксированной кодовой книги методом скользящего среднего.
Соотношение между корректировочными коэффициентами γkj и квантованными коэффициентами усиления фиксированной кодовой книги выражается следующим образом:
Figure 00000051
где
Figure 00000052
- квантованный коэффициент усиления фиксированной кодовой книги и
Figure 00000053
- прогнозируемый коэффициент усиления фиксированной кодовой книги для j-го подкадра k-го кадра.
Прогнозируемые коэффициенты усиления фиксированной кодовой книги получают путем прогнозирования энергии фиксированной кодовой книги методом скользящего среднего согласно уравнению:
Figure 00000054
где
Figure 00000055
- средняя энергия, и
Figure 00000056
и
Figure 00000057
Коэффициенты прогнозирования для прогнозирования методом скользящего среднего составляют {b1,b2,b3}={0,6;0,3;0,1}.
Прогнозирование энергии на основании более отдаленного прошлого имеет большую утечку, чтобы учесть большую неопределенность, связанную с прогнозированием. Это применимо ко второму и третьему подкадру, где самые последние данные еще отсутствуют по причине совместного квантования. Возможны и другие типы прогнозирования, предусматривающие использование других коэффициентов прогнозирования для каждого подкадра.
Отличительная особенность поиска векторов возбуждения в фиксированной кодовой книге состоит в том, что выбранный вектор возбуждения фиксированной кодовой книги фильтруется посредством адаптивного предварительного фильтра P(z), который усиливает гармонические составляющие для повышения качества реконструированного речевого сигнала. Фильтр может, например, выполнять следующую функцию:
Figure 00000058
где Т - целая часть задержки основного тона текущего подкадра и β - коэффициент усиления основного тона, зависящий от того, обрабатывается ли кадр в режиме 0 или в режиме 1. В режиме 0 β представляет собой квантованный коэффициент усиления основного тона из предыдущего подкадра, поскольку квантованный коэффициент усиления основного тона для текущего подкадра пока отсутствует, поэтому для поиска в фиксированной кодовой книге на предмет вектора возбуждения фиксированной кодовой книги для текущего подкадра используется квантованный коэффициент усиления основного тона из предыдущего подкадра. В режиме 1 β представляет собой квантованный коэффициент усиления основного тона для текущего подкадра, ввиду наличия этого квантованного коэффициента усиления основного тона из обработки подкадров в замкнутом контуре, и для поиска в фиксированной кодовой книге на предмет вектора возбуждения фиксированной кодовой книги для текущего подкадра используется квантованный коэффициент усиления основного тона для текущего подкадра.
Итак, для моделирования информации периодичности определенных фрагментов речевого сигнала используют адаптивную кодовую книгу. При этом выводят коэффициент усиления Gp основного тона. После моделирования информации периодичности с использованием прогнозирования основного тона остается второй остаточный сигнал.
Второй остаточный сигнал подвергается векторному квантованию с помощью фиксированной кодовой книги. Вектор масштабируется коэффициентом усиления Gc фиксированной кодовой книги. Коэффициент усиления Gp адаптивной кодовой книги и коэффициент усиления Gc фиксированной кодовой книги обычно выводят на уровне подкадров. Каждый подкадр имеет соответствующие коэффициент усиления Gp адаптивной кодовой книги и коэффициент усиления Gc фиксированной кодовой книги. Например, как показано на фиг.8, первый подкадр коррелирует с коэффициентом усиления Gp1 адаптивной кодовой книги и коэффициентом усиления Gc1 фиксированной кодовой книги; второй подкадр связан с коэффициентами усиления Gp2 и Gc2; третий подкадр связан с Ср3 и Сс3 и четвертый кадр связан с Gp4 и Gc4. При этом первый способ, отвечающий уровню техники, может предусматривать квантование коэффициента усиления Gp адаптивной кодовой книги и коэффициента усиления Gc фиксированной кодовой книги по отдельности для каждого подкадра с использованием скалярного квантования. Поскольку скалярное квантование менее эффективно, чем векторное квантование, более эффективный подход, отвечающий уровню техники, состоит в использовании векторного квантования в замкнутом контуре значений коэффициентов усиления Gp и Gc. Согласно этому второму подходу, отвечающему уровню техники, кодовая книга Gp и Gc, например, показанная на фиг.9, используется для обеспечения векторного квантования комбинации Gp и Gc.
Речевой кодер, построенный в соответствии с настоящим изобретением, использует третий подход квантования коэффициентов усиления Gp адаптивной кодовой книги и Gc фиксированной кодовой книги. Во-первых, операция производится в двух режимах: режиме 0 и режиме 1. Во-вторых, каждый кадр речевого сигнала анализируется и классифицируется на предмет того, является ли речевой сигнал “периодическим”. Если кадр содержит “периодический” речевой сигнал, то коэффициенты усиления основного тона выводятся из исходного неквантованного взвешенного речевого сигнала до начала обработки подкадров в замкнутом контуре. Усовершенствованный способ квантования коэффициентов усиления предусматривает предварительное векторное квантование коэффициентов усиления Gp (например, Gp1, Gp2, Gр3, Gp4) всех подкадров кадра до осуществления обработки подкадров, которая определяет коэффициенты фиксированной кодовой книги и векторы возбуждения. Когда речевой сигнал является периодическим, усовершенствованный способ квантования коэффициентов усиления предусматривает векторное квантование параметров усиления посредством меньшего количества битов без значительного ухудшения качества голоса. Если речевой сигнал не является периодическим, речевой сигнал иногда можно изменить так, чтобы он вел себя, как если бы он был периодическим, способами, известными специалистами в данной области.
В процессе предварительного векторного квантования коэффициентов усиления Gp адаптивной кодовой книги пытаются добиться наиболее полного согласования между неквантованными коэффициентами усиления Gp адаптивной кодовой книги и векторами кодовой книги. Закончив с векторным квантованием коэффициентов усиления Gp адаптивной кодовой книги, обратимся к коэффициентам усиления Gc фиксированной кодовой книги.
Если речевой сигнал в текущем кадре является периодическим, то усовершенствованный способ квантования коэффициента усиления, отвечающий настоящему изобретению, предусматривает векторное квантование в замкнутом контуре с задержанным решением коэффициентов усиления Gc фиксированной кодовой книги. Этот процесс осуществляется по завершении обработки подкадров. Заметим, что это векторное квантование не обязательно осуществлять с использованием традиционных коэффициентов усиления Gc фиксированной кодовой книги, поскольку его можно осуществлять на прогнозируемых Gc, преобразованных Gc и других разновидностях и модификациях Gc. Согласно сказанному выше относительно коэффициентов усиления Gp адаптивной кодовой книги, если речевой сигнал не является периодическим, то речевой сигнал иногда можно изменить так, чтобы он вел себя, как если бы он был периодическим сигналом, и в результате получить преобразованные Gc и преобразованные Gp. Аналогично, Gc и/или Gp могут представлять собой прогнозируемые значения. Специалистам в данной области известны способы преобразования речевого сигнала в периодический сигнал, а также способы прогнозирования Gc и/или Gp. Согласно вышеприведенному подробному объяснению векторное квантование “с задержанным решением” коэффициентов усиления Gc фиксированной кодовой книги означает, что каждый Gc выводится отдельно и последовательно, после чего они используются для формирования вектора, подлежащего квантованию. Решение задерживается, поскольку процесс должен ждать вывода всех Gc в кадре прежде, чем приступить к векторному квантованию Gc. Таким образом, усовершенствованный способ квантования коэффициентов усиления предусматривает предварительное векторное квантование коэффициентов усиления Gp адаптивной кодовой книги, но при этом векторное квантование коэффициентов усиления Gc фиксированной кодовой книги с задержанным решением в замкнутом контуре для периодического речевого сигнала.
Первый способ совместного векторного квантования Gp и Gc, отвечающий уровню техники, предусматривает создание вектора из каждой пары Gp/Gc в подкадре (например, (Gp1,Gc1), (Gp2,Gc2), (Gp3,Gc3), (Gp4,Gc4) для кадра, содержащего четыре подкадра) и затем квантование каждого вектора с использованием кодовой книги без задержанного решения. Первый способ, отвечающий уровню техники, позволяет воспроизводить речь с хорошим качеством, но только на высоких битовых скоростях.
Второй способ, отвечающий уровню техники, предусматривает совместное квантование всех Gp и Gc в кадре с использованием метода задержанного решения (например, (Gp1, Gp2, Gp3, Gp4, Gc1, Gc2, Gc3, Gc4) для кадра, имеющего четыре подкадра). Второй способ, отвечающий уровню техники, дает низкое качество воспроизведения речи.
Усовершенствованный способ квантования коэффициентов усиления предусматривает следующие два этапа квантования коэффициентов усиления: (1) предварительное векторное квантование Gp для каждого подкадра кадра до начала обработки подкадров в замкнутом контуре, если речевой сигнал является периодическим; и (2) векторное квантование Gc с задержанным решением в замкнутом контуре. Специалистам в данной области известно, что векторное квантование в замкнутом контуре находит не оптимальное согласование в кодовой книге для вектора, а наилучшее согласование для речевого сигнала.
Согласно усовершенствованному способу квантования коэффициентов усиления метод задержанного решения векторного квантования применяется только к Gc фиксированной кодовой книги и увеличивает степень сжатия без потери качества речи. Таким образом, усовершенствованный речевой кодер воспроизводит речевой сигнал с высоким качеством даже на низкой битовой скорости. Векторное квантование коэффициентов усиления Gp адаптивной кодовой книги не обязательно осуществлять в замкнутом контуре. Поскольку усовершенствованный способ предусматривает предварительное векторное квантование коэффициентов усиления Gp адаптивной кодовой книги, квантование Gp оказывается более устойчивым.
Усовершенствованный речевой кодер обеспечивает многие другие преимущества. Например, усовершенствованный речевой кодер способен получать квантованные коэффициенты усиления Gp адаптивной кодовой книги для всех подкадров кадра до получения коэффициента усиления Gc фиксированной кодовой книги (который получают в ходе обработки подкадров в замкнутом контуре); тогда как второй способ, отвечающий уровню техники, рассмотренный выше, не дает возможности получить квантованные Gp и Gc, пока кодер не обработает последний подкадр кадра. В результате, поскольку усовершенствованный речевой кодер получает квантованные Gp до начала обработки подкадров, значение Gp не влияет на поиск оптимального коэффициента усиления фиксированной кодовой книги. Согласно второму способу, отвечающему уровню техники, любые ошибки в значении Gp также влияют на обработку фиксированной кодовой книги. Кроме того, поскольку квантованный Gp получают до использования адаптивной кодовой книги, любые ошибки в значении Gp можно корректировать за счет обработки фиксированной кодовой книги. Иными словами, поиск по фиксированной кодовой книге производится с учетом предыдущего квантования Gр и корректирует любые ошибки в значении Gp. Способы, отвечающие уровню техники, этого не предусматривают.
Хотя усовершенствованный речевой кодер применяет обработку в режиме 1 только к периодическому речевому сигналу, периодический речевой сигнал составляет примерно 60-70% обычной речи. Поэтому режим 1 усовершенствованного речевого кодера оказывает значительное влияние на уменьшение количества битов, используемых для квантования коэффициентов усиления. Теоретически усовершенствованный речевой кодер позволяет значительно уменьшить количество битов. Если, к примеру, размер кадра равен 80 битам, кадр содержит четыре подкадра, и скорость на канале данных равна 4 кбит/с, то для представления информации коэффициента усиления способом, отвечающим уровню техники, требуется по 7 битов на каждый из четырех подкадров кадра, итого 28 битов. В то же время усовершенствованный речевой кодер способен представлять ту же информацию примерно четырнадцатью битами, т.е. обеспечивает 50%-ную экономию, что показано на фиг.10.
В данном конкретном варианте осуществления с кодера на декодер передают 80 битов на кадр. Декодер отображает 80 битов обратно в параметры кодера. Осуществляется прямой синтез речевого сигнала на основании параметров, подобный заданному стандартом G.729. Конечный фильтр, в принципе, соответствует G.729 и имеет как долговременную (основного тона), так и кратковременную (LPC) конечную обработку.
На фиг.11 показана блок-схема речевого декодера, соответствующего усовершенствованному речевому кодеру. Речевой декодер осуществляет обратное отображение битового потока в параметры алгоритма с последующим синтезом в зависимости от режима. Адаптивная кодовая книга 290 получает информацию 284 тракта основного тона (которую декодер восстанавливает из информации, переданной по каналу связи от речевого кодера). В зависимости от режима 282 адаптивная кодовая книга 290 выдает квантованный вектор
Figure 00000059
902 адаптивной кодовой книги на умножитель 904. Умножитель 904 перемножает квантованный вектор
Figure 00000060
902 адаптивной кодовой книги с вектором 910 коэффициента усиления основного тона. Выбор вектора 910 коэффициента усиления основного тона зависит от режима 282. Если действует режим 0, то кодовая книга 460 двухмерного векторного квантования выдает на умножитель 904 вектор 910 коэффициента усиления основного тона. Кодовая книга 460 является двухмерной, поскольку она выдает вектор 910 коэффициента усиления основного тона на умножитель 904 и вектор 924 коэффициента усиления фиксированной кодовой книги на умножитель 922. В зависимости от режима 282 фиксированная кодовая книга 292 выдает квантованный вектор
Figure 00000061
920 фиксированной кодовой книги на умножитель 922. Умножитель 922 перемножает квантованный вектор
Figure 00000062
920 фиксированной кодовой книги с квантованным вектором 924 коэффициента усиления фиксированной кодовой книги. Если действует режим 1, то кодовая книга 580 коэффициентов усиления для n-мерного векторного квантования (где n - количество подкадров на кадр) выдает вектор 910 коэффициента усиления основного тона на умножитель 904. Аналогично, кодовая книга 680 коэффициентов усиления для n-мерного векторного квантования (где n - количество подкадров на кадр) выдает вектор 924 коэффициента усиления на умножитель 922. Умножитель 904 выдает сигнал 906 произведения в сумматор 930, где сигнал 906 произведения суммируется с сигналом 926 произведения, поступающим от умножителя 922. Суммарный сигнал 932 поступает в фильтр 940 синтеза, который также получает квантованные коэффициенты LPC Aq(z) 268 (которые декодер выводит из информации, переданной по каналу связи речевым кодером). Фильтр 940 синтеза и постпроцессор 944 совместно создают реконструированный речевой сигнал 950 из суммарного сигнала 932.
Согласно вышеописанному коэффициенты усиления основного тона можно выводить из исходного неквантованного взвешенного речевого сигнала. Однако коэффициенты усиления основного тона можно также выводить из неквантованного остаточного сигнала LPC, исходного неквантованного речевого сигнала или из неквантованного измененного речевого сигнала до начала обработки подкадров в замкнутом контуре. На фиг.12а показана блок-схема первого альтернативного варианта осуществления, предусматривающего применение двух методов квантования коэффициентов усиления в зависимости от того, является ли сигнал периодическим или непериодическим (иными словами, подобным периодическому или подобным непериодическому). Новый процесс квантования коэффициентов усиления применяется только к периодическим сигналам, что обозначено блоком 951, и традиционный процесс квантования коэффициентов усиления применяется к непериодическим сигналам, что обозначено блоком 953 на фиг.12а. Например, в случае применения традиционного процесса квантования коэффициентов усиления к кадрам, имеющим четыре подкадра, для квантования коэффициента усиления следует выделять 28 битов. Применяя новый процесс квантования коэффициентов усиления, можно выделять только 16 битов. Таким образом, новая стратегия квантования коэффициентов усиления позволяет в данном случае экономить 12 битов на кадр периодических сигналов, и эти биты можно при желании использовать для других целей.
Ниже рассмотрен второй альтернативный вариант осуществления со ссылкой на вышеприведенное описание. Согласно фиг.12b новый процесс квантования коэффициентов усиления (блок 951), который применялся только к периодическим сигналам, можно распространить и на непериодические сигналы. Эта вторая стратегия дает немного более высокую битовую скорость, чем для периодических сигналов, для обработки которых используется новая стратегия квантования коэффициентов усиления, но все же более низкую, чем битовая скорость, отвечающая уровню техники. Это повышение битовой скорости во второй стратегии объясняется более широким диапазоном значений параметров коэффициента усиления непериодических сигналов по сравнению с периодическими сигналами. Тот же процесс 951 квантования коэффициента усиления, описанный выше применительно к первому варианту осуществления, можно использовать для обработки непериодических сигналов во втором варианте осуществления, с той только разницей, что для представления квантования коэффициента усиления непериодических сигналов требуется большее количество битов. Например, если каждый кадр имеет четыре подкадра, то новый процесс квантования коэффициентов усиления для периодических сигналов требует только 16 битов, тогда как тот же подход для непериодических сигналов требует только 22 бита. Таким образом, в данном примере новая стратегия квантования коэффициентов усиления позволяет сэкономить 12 битов для периодических сигналов и 6 битов для непериодических сигналов в расчете на кадр.
Рассмотрим третий альтернативный вариант осуществления со ссылкой на вышеприведенное описание. Согласно фиг.12с процесс квантования коэффициентов усиления может не различать периодический и непериодический сигналы, если новый процесс 951 квантования коэффициентов усиления применяется ко всем речевым сигналам. В данном случае новый процесс 951 квантования коэффициентов усиления, описанный применительно к непериодическим сигналам во втором варианте осуществления, представленном на фиг.12b, можно использовать для обработки всех сигналов, включая периодические сигналы. Однако для представления квантования коэффициентов усиления этих сигналов может потребоваться выделять больше битов. Например, если кадр имеет четыре подкадра, то новая стратегия квантования коэффициентов усиления требует выделения только 22 битов, что экономит 12 битов на кадр.
Очевидно, что, помимо описанных и проиллюстрированных вариантов осуществления и реализации настоящего изобретения, можно предложить много других вариантов осуществления и реализации в пределах объема настоящего изобретения. Соответственно, изобретение не должно ограничиваться ничем, кроме формулы изобретения и ее эквивалентов.

Claims (79)

1. Способ кодирования речевых сигналов в системе связи, содержащий этапы, на которых a) обеспечивают речевой сигнал на покадровой основе в ходе обработки кадров и до обработки подкадров: b) определяют коэффициент усиления адаптивной кодовой книги для каждого подкадра текущего кадра на основании речевого сигнала; c) осуществляют векторное квантование коэффициентов усиления адаптивной кодовой книги, в ходе обработки подкадров; d) определяют коэффициент усиления фиксированной кодовой книги для каждого подкадра текущего кадра и после обработки подкадров; e) осуществляют векторное квантование коэффициентов усиления фиксированной кодовой книги с задержанным решением.
2. Способ по п.1, отличающийся тем, что речевой сигнал является периодическим.
3. Способ по п.1, отличающийся тем, что речевой сигнал является непериодическим.
4. Способ по п.1, отличающийся тем, что речевой сигнал является неквантованным измененным речевым сигналом.
5. Способ по п.1, отличающийся тем, что на этапе (е) осуществляют векторное квантование коэффициента усиления фиксированной кодовой книги в разомкнутом контуре.
6. Способ по п.1, отличающийся тем, что на этапе (е) осуществляют векторное квантование коэффициента усиления фиксированной кодовой книги в замкнутом контуре.
7. Способ по п.1, отличающийся тем, что этапы (с) и (е) объединяют для совместного векторного квантования коэффициентов усиления адаптивной кодовой книги и коэффициентов усиления фиксированной кодовой книги, если речевой сигнал текущего кадра не является периодическим.
8. Способ по п.7, отличающийся тем, что на этапе (с) осуществляют векторное квантование коэффициентов усиления адаптивной кодовой книги в разомкнутом контуре или в замкнутом контуре.
9. Способ по п.7, отличающийся тем, что на этапе (е) осуществляют векторное квантование коэффициентов усиления фиксированной кодовой книги в разомкнутом контуре или в замкнутом контуре.
10. Способ по п.1, отличающийся тем, что этап (с) содержит этапы, на которых формируют вектор с помощью коэффициента усиления адаптивной кодовой книги из каждого подкадра и находят вектор в таблице коэффициентов усиления адаптивной кодовой книги, ближайший к сформированному вектору.
11. Способ по п.1, отличающийся тем, что этап (е) содержит этапы, на которых формируют вектор с помощью коэффициента усиления фиксированной кодовой книги из каждого подкадра и находят вектор в таблице коэффициентов усиления фиксированной кодовой книги, ближайший к сформированному вектору.
12. Способ по п.1, отличающийся тем, что этап (d) содержит этап, на котором преобразуют коэффициент усиления фиксированной кодовой книги.
13. Способ по п.1, отличающийся тем, что этап (d) содержит этап, на котором изменяют коэффициент усиления фиксированной кодовой книги.
14. Способ по п.1, отличающийся тем, что этап (d) содержит этап, на котором прогнозируют коэффициент усиления фиксированной кодовой книги.
15. Способ по п.1, отличающийся тем, что дополнительно содержит этапы, на которых f) осуществляют другое кодирование речевого сигнала, g) передают кодированную информацию в приемник, h) принимают кодированную информацию в приемнике, i) декодируют кодированную информацию для воспроизведения речевого сигнала.
16. Система кодирования речевых сигналов, которая принимает речевой сигнал, содержащая
a) блок обработки кадров для обработки кадров речевого сигнала, содержащий генератор коэффициентов усиления основного тона, который выводит неквантованные коэффициенты усиления основного тона, и первый блок векторного квантования, который получает неквантованные коэффициенты усиления основного тона и генерирует квантованные коэффициенты усиления основного тона, b) блок обработки подкадров, который начинает обрабатывать подкадры после формирования генератором коэффициентов усиления основного тона неквантованных коэффициентов усиления основного тона, причем блок обработки подкадров содержит генератор замкнутого контура, который генерирует неквантованные коэффициенты усиления фиксированной кодовой книги, и c) второй блок векторного квантования, который получает неквантованные коэффициенты усиления фиксированной кодовой книги и генерирует квантованные коэффициенты усиления фиксированной кодовой книги в замкнутом контуре с задержанным решением после обработки подкадров блоком обработки подкадров.
17. Система по п.16, отличающаяся тем, что дополнительно содержит детектор периодического сигнала, который определяет, является ли речевой сигнал периодическим.
18. Система по п.17, отличающаяся тем, что, если речевой сигнал является периодическим, то генератор коэффициентов усиления основного тона выводит неквантованные коэффициенты усиления основного тона и блок обработки подкадров начинает обрабатывать подкадры после формирования генератором коэффициентов усиления основного тона неквантованных коэффициентов усиления основного тона и генерирования первым блоком векторного квантования квантованных коэффициентов усиления основного тона.
19. Система по п.18, отличающаяся тем, что независимо от того, является ли речевой сигнал периодическим или непериодическим, генератор коэффициентов усиления основного тона формирует неквантованные коэффициенты усиления основного тона и блок обработки подкадров начинает обрабатывать подкадры после формирования генератором коэффициентов усиления основного тона неквантованных коэффициентов усиления основного тона и генерирования первым блоком векторного квантования квантованных коэффициентов усиления основного тона.
20. Система по п.16, отличающаяся тем, что для всех речевых сигналов генератор коэффициентов усиления основного тона формирует неквантованные коэффициенты усиления основного тона и блок обработки подкадров начинает обрабатывать подкадры после формирования генератором коэффициентов усиления основного тона неквантованных коэффициентов усиления основного тона и генерирования первым блоком векторного квантования квантованных коэффициентов усиления основного тона.
21. Система по п.16, отличающаяся тем, что дополнительно содержит первую кодовую книгу, которая генерирует вектор возбуждения адаптивной кодовой книги, первый умножитель, который перемножает вектор возбуждения адаптивной кодовой книги с квантованным коэффициентом усиления основного тона для формирования масштабированного вектора коэффициента усиления адаптивной кодовой книги, вторую кодовую книгу, которая генерирует вектор возбуждения фиксированной кодовой книги, второй умножитель, который перемножает вектор возбуждения фиксированной кодовой книги с коэффициентом усиления фиксированной кодовой книги для формирования масштабированного вектора коэффициента усиления фиксированной кодовой книги, сумматор, который суммирует масштабированный вектор коэффициента усиления адаптивной кодовой книги с масштабированным вектором коэффициента усиления фиксированной кодовой книги.
22. Система по п.16, отличающаяся тем, что первый блок векторного квантования осуществляет векторное квантование коэффициентов усиления адаптивной кодовой книги до генерирования генератором замкнутого контура неквантованных коэффициентов усиления фиксированной кодовой книги.
23. Система по п.16, отличающаяся тем, что второй блок векторного квантования осуществляет векторное квантование коэффициентов усиления фиксированной кодовой книги в замкнутом контуре с задержанным решением.
24. Система по п.16, отличающаяся тем, что дополнительно содержит третий блок векторного квантования, который осуществляет совместное векторное квантование коэффициентов усиления адаптивной кодовой книги и коэффициентов усиления фиксированной кодовой книги в замкнутом контуре.
25. Система по п.21, отличающаяся тем, что первый блок векторного квантования осуществляет векторное квантование коэффициентов усиления адаптивной кодовой книги до генерирования генератором замкнутого контура неквантованных коэффициентов усиления фиксированной кодовой книги.
26. Система по п.21, отличающаяся тем, что второй блок векторного квантования осуществляет векторное квантование коэффициентов усиления фиксированной кодовой книги в замкнутом контуре с задержанным решением.
27. Система по п.22, отличающаяся тем, что дополнительно содержит третий блок векторного квантования, который осуществляет совместное векторное квантование коэффициентов усиления адаптивной кодовой книги и коэффициентов усиления фиксированной кодовой книги в замкнутом контуре.
28. Система по п.21, отличающаяся тем, что кадры включают в себя текущий кадр и каждый кадр содержит совокупность подкадров, которая включает в себя текущий подкадр и предыдущий подкадр, и вторая кодовая книга использует квантованный коэффициент усиления основного тона для текущего подкадра, чтобы генерировать вектор возбуждения фиксированной кодовой книги для текущего подкадра.
29. Система по п.18, отличающаяся тем, что дополнительно содержит фильтр, который преобразует речевой сигнал в неквантованный взвешенный речевой сигнал или неквантованный остаточный речевой сигнал кодирования с линейным прогнозированием.
30. Система по п.18, отличающаяся тем, что речевой сигнал является неквантованным исходным речевым сигналом.
31. Система п.18, отличающаяся тем, что речевой сигнал является неквантованным измененным речевым сигналом.
32. Система по п.18, отличающаяся тем, что дополнительно содержит первую кодовую книгу, которая генерирует вектор возбуждения адаптивной кодовой книги, первый умножитель, который перемножает вектор возбуждения адаптивной кодовой книги с квантованным коэффициентом усиления основного тона для формирования масштабированного вектора коэффициента усиления адаптивной кодовой книги, вторую кодовую книгу, которая генерирует вектор возбуждения фиксированной кодовой книги, второй умножитель, который перемножает вектор возбуждения фиксированной кодовой книги с коэффициентом усиления фиксированной кодовой книги для формирования масштабированного вектора коэффициента усиления фиксированной кодовой книги, сумматор, который суммирует масштабированный вектор коэффициента усиления адаптивной кодовой книги с масштабированным вектором коэффициента усиления фиксированной кодовой книги.
33. Система по п.18, отличающаяся тем, что если речевой сигнал является периодическим, то первый блок векторного квантования осуществляет векторное квантование коэффициентов усиления адаптивной кодовой книги до формирования генератором замкнутого контура неквантованных коэффициентов усиления фиксированной кодовой книги.
34. Система по п.18, отличающаяся тем, что если речевой сигнал является периодическим, то второй блок векторного квантования осуществляет векторное квантование коэффициентов усиления фиксированной кодовой книги в замкнутом контуре с задержанным решением.
35. Система по п.18, отличающаяся тем, что дополнительно содержит третий блок векторного квантования, который осуществляет совместное векторное квантование коэффициентов усиления адаптивной кодовой книги и коэффициентов усиления фиксированной кодовой книги в замкнутом контуре, если речевой сигнал не является периодическим.
36. Система по п.32, отличающаяся тем, что если речевой сигнал является периодическим, то первый блок векторного квантования осуществляет векторное квантование коэффициентов усиления адаптивной кодовой книги до формирования генератором замкнутого контура неквантованных коэффициентов усиления фиксированной кодовой книги.
37. Система по п.32, отличающаяся тем, что если речевой сигнал является периодическим, то второй блок векторного квантования осуществляет векторное квантование коэффициентов усиления фиксированной кодовой книги в замкнутом контуре с задержанным решением.
38. Система по п.33, отличающаяся тем, что дополнительно содержит третий блок векторного квантования, который осуществляет совместное векторное квантование коэффициентов усиления адаптивной кодовой книги и коэффициентов усиления фиксированной кодовой книги в замкнутом контуре, если речевой сигнал не является периодическим.
39. Система по п.32, отличающаяся тем, что кадры включают в себя текущий кадр, и каждый кадр содержит совокупность подкадров, которая включает в себя текущий подкадр и предыдущий подкадр, и вторая кодовая книга использует квантованный коэффициент усиления основного тона для текущего подкадра, чтобы генерировать вектор возбуждения фиксированной кодовой книги для текущего подкадра.
40. Система по п.19, отличающаяся тем, что дополнительно содержит фильтр, который преобразует речевой сигнал в неквантованный взвешенный речевой сигнал или неквантованный остаточный речевой сигнал кодирования с линейным прогнозированием.
41. Система по п.19, отличающаяся тем, что речевой сигнал является неквантованным исходным речевым сигналом.
42. Система по п.19, отличающаяся тем, что речевой сигнал является неквантованным измененным речевым сигналом.
43. Система по п.19, отличающаяся тем, что дополнительно содержит первую кодовую книгу, которая генерирует вектор возбуждения адаптивной кодовой книги, первый умножитель, который перемножает вектор возбуждения адаптивной кодовой книги с квантованным коэффициентом усиления основного тона для формирования масштабированного вектора коэффициента усиления адаптивной кодовой книги, вторую кодовую книгу, которая генерирует вектор возбуждения фиксированной кодовой книги, второй умножитель, который перемножает вектор возбуждения фиксированной кодовой книги с коэффициентом усиления фиксированной кодовой книги для формирования масштабированного вектора коэффициента усиления фиксированной кодовой книги, сумматор, который суммирует масштабированный вектор коэффициента усиления адаптивной кодовой книги с масштабированным вектором коэффициента усиления фиксированной кодовой книги.
44. Система по п.19, отличающаяся тем, что первый блок векторного квантования осуществляет векторное квантование коэффициентов усиления адаптивной кодовой книги до формирования генератором замкнутого контура неквантованных коэффициентов усиления фиксированной кодовой книги.
45. Система по п.19, отличающаяся тем, что второй блок векторного квантования осуществляет векторное квантование коэффициентов усиления фиксированной кодовой книги в замкнутом контуре с задержанным решением.
46. Система по п.44, отличающаяся тем, что речевой сигнал является периодическим или непериодическим сигналом.
47. Система по п.45, отличающаяся тем, что речевой сигнал является периодическим или непериодическим сигналом.
48. Система по п.43, отличающаяся тем, что первый блок векторного квантования осуществляет векторное квантование коэффициентов усиления адаптивной кодовой книги до формирования генератором замкнутого контура неквантованных коэффициентов усиления фиксированной кодовой книги.
49. Система по п.43, отличающаяся тем, что второй блок векторного квантования осуществляет векторное квантование коэффициентов усиления фиксированной кодовой книги в замкнутом контуре с задержанным решением.
50. Система по п.43, отличающаяся тем, что кадры включают в себя текущий кадр и каждый кадр содержит совокупность подкадров, которая включает в себя текущий подкадр и предыдущий подкадр, и вторая кодовая книга использует квантованный коэффициент усиления основного тона для текущего подкадра, чтобы генерировать вектор возбуждения фиксированной кодовой книги для текущего подкадра.
51. Система по п.20, отличающаяся тем, что дополнительно содержит фильтр, который преобразует речевой сигнал в неквантованный взвешенный речевой сигнал или неквантованный остаточный речевой сигнал кодирования с линейным прогнозированием.
52. Система по п.20, отличающаяся тем, что речевой сигнал является неквантованным исходным речевым сигналом.
53. Система по п.20, отличающаяся тем, что речевой сигнал является неквантованным измененным речевым сигналом.
54. Система по п.20, отличающаяся тем, что дополнительно содержит первую кодовую книгу, которая генерирует вектор возбуждения адаптивной кодовой книги, первый умножитель, который перемножает вектор возбуждения адаптивной кодовой книги с квантованным коэффициентом усиления основного тона для формирования масштабированного вектора коэффициента усиления адаптивной кодовой книги, вторую кодовую книгу, которая генерирует вектор возбуждения фиксированной кодовой книги, второй умножитель, который перемножает вектор возбуждения фиксированной кодовой книги с коэффициентом усиления фиксированной кодовой книги для формирования масштабированного вектора коэффициента усиления фиксированной кодовой книги, сумматор, который суммирует масштабированный вектор коэффициента усиления адаптивной кодовой книги с масштабированным вектором коэффициента усиления фиксированной кодовой книги.
55. Система по п.20, отличающаяся тем, что первый блок векторного квантования осуществляет векторное квантование коэффициентов усиления адаптивной кодовой книги до формирования генератором замкнутого контура неквантованных коэффициентов усиления фиксированной кодовой книги.
56. Система по п.20, отличающаяся тем, что второй блок векторного квантования осуществляет векторное квантование коэффициентов усиления фиксированной кодовой книги в замкнутом контуре с задержанным решением.
57. Система по п.55, отличающаяся тем, что речевой сигнал является периодическим или непериодическим сигналом.
58. Система по п.56, отличающаяся тем, что речевой сигнал является периодическим или непериодическим сигналом.
59. Система по п.54, отличающаяся тем, что первый блок векторного квантования осуществляет векторное квантование коэффициентов усиления адаптивной кодовой книги до формирования генератором замкнутого контура неквантованных коэффициентов усиления фиксированной кодовой книги.
60. Система по п.54, отличающаяся тем, что второй блок векторного квантования осуществляет векторное квантование коэффициентов усиления фиксированной кодовой книги в замкнутом контуре с задержанным решением.
61. Система по п.54, отличающаяся тем, что кадры включают в себя текущий кадр и каждый кадр содержит совокупность подкадров, которая включает в себя текущий подкадр и предыдущий подкадр, и вторая кодовая книга использует квантованный коэффициент усиления основного тона для текущего подкадра, чтобы генерировать вектор возбуждения фиксированной кодовой книги для текущего подкадра.
62. Способ кодирования речевых сигналов в системе связи, содержащий этапы, на которых а) обеспечивают речевой сигнал на покадровой основе, причем кадры включают в себя текущий кадр и каждый кадр содержит совокупность подкадров, которая включает в себя текущий подкадр и предыдущий подкадр, b) определяют, является ли речевой сигнал текущего кадра периодическим, c) выводят неквантованный коэффициент усиления основного тона, d) осуществляют векторное квантование неквантованного коэффициента усиления основного тона, чтобы генерировать квантованный коэффициент усиления основного тона, и e) осуществляют обработку подкадров по завершении этапов (с) и (d), если речевой сигнал текущего кадра является периодическим, причем обработка подкадров содержит этапы, на которых (1) генерируют неквантованный коэффициент усиления фиксированной кодовой книги в замкнутом контуре и (2) осуществляют векторное квантование неквантованного коэффициента усиления фиксированной кодовой книги, чтобы генерировать квантованный коэффициент усиления фиксированной кодовой книги в замкнутом контуре с задержанным решением по окончании обработки подкадров.
63. Способ по п.62, отличающийся тем, что дополнительно содержит этапы, на которых генерируют вектор возбуждения адаптивной кодовой книги, перемножают вектор возбуждения адаптивной кодовой книги с квантованным коэффициентом усиления основного тона для формирования масштабированного вектора коэффициента усиления адаптивной кодовой книги, генерируют вектор возбуждения фиксированной кодовой книги, перемножают вектор возбуждения фиксированной кодовой книги с коэффициентом усиления фиксированной кодовой книги для формирования масштабированного вектора коэффициента усиления фиксированной кодовой книги, суммируют масштабированный вектор коэффициента усиления адаптивной кодовой книги с масштабированным вектором коэффициента усиления фиксированной кодовой книги.
64. Способ по п.63, отличающийся тем, что на этапе генерации вектора возбуждения фиксированной кодовой книги используют квантованный коэффициент усиления основного тона для текущего подкадра для получения вектора возбуждения фиксированной кодовой книги для текущего подкадра.
65. Способ по п.63, отличающийся тем, что если речевой сигнал не является периодическим сигналом, то этап осуществления обработки подкадров по завершении этапов (с) и (d) содержит этапы, на которых (1) генерируют неквантованный коэффициент усиления фиксированной кодовой книги в замкнутом контуре и (2) осуществляют векторное квантование неквантованного коэффициента усиления фиксированной кодовой книги, чтобы генерировать квантованный коэффициент усиления фиксированной кодовой книги в замкнутом контуре с задержанным решением по окончании обработки подкадров.
66. Способ кодирования речевых сигналов в системе связи, содержащий этапы, на которых a) обеспечивают речевой сигнал на покадровой основе, причем кадры включают в себя текущий кадр и каждый кадр содержит совокупность подкадров, которая включает в себя текущий подкадр и предыдущий подкадр, b) выводят неквантованный коэффициент усиления основного тона, c) осуществляют векторное квантование неквантованного коэффициента усиления основного тона, чтобы генерировать квантованный коэффициент усиления основного тона, d) осуществляют обработку подкадров по завершении этапов (b) и (с), причем обработка подкадров содержит этапы, на которых (1) генерируют неквантованный коэффициент усиления фиксированной кодовой книги в замкнутом контуре и (2) осуществляют векторное квантование неквантованного коэффициента усиления фиксированной кодовой книги, чтобы генерировать квантованный коэффициент усиления фиксированной кодовой книги в замкнутом контуре с задержанным решением по окончании обработки подкадров.
67. Способ по п.66, отличающийся тем, что дополнительно содержит этапы, на которых генерируют вектор возбуждения адаптивной кодовой книги, перемножают вектор возбуждения адаптивной кодовой книги с квантованным коэффициентом усиления основного тона для формирования масштабированного вектора коэффициента усиления адаптивной кодовой книги, генерируют вектор возбуждения фиксированной кодовой книги, перемножают вектор возбуждения фиксированной кодовой книги с коэффициентом усиления фиксированной кодовой книги для формирования масштабированного вектора коэффициента усиления фиксированной кодовой книги, суммируют масштабированный вектор коэффициента усиления адаптивной кодовой книги с масштабированным вектором коэффициента усиления фиксированной кодовой книги.
68. Способ по п.67, отличающийся тем, что на этапе генерации вектора возбуждения фиксированной кодовой книги используют квантованный коэффициент усиления основного тона для текущего подкадра для получения вектора возбуждения фиксированной кодовой книги для текущего подкадра.
69. Способ по п.66, отличающийся тем, что речевой сигнал является периодическим сигналом.
70. Способ по п.66, отличающийся тем, что речевой сигнал является непериодическим сигналом.
71. Система кодирования речевых сигналов, которая принимает речевой сигнал, включающий в себя кадр, имеющий множество подкадров, причем система кодирования речевых сигналов содержит генератор коэффициентов усиления основного тона, который выводит неквантованные коэффициенты усиления основного тона для каждого из множества подкадров кадра; первый блок векторного квантования, который получает неквантованные коэффициенты усиления основного тона и генерирует квантованные коэффициенты усиления основного тона, блок обработки подкадров, который начинает обрабатывать подкадры после формирования генератором коэффициентов усиления основного тона неквантованных коэффициентов усиления основного тона и генерирования первым блоком векторного квантования квантованных коэффициентов усиления основного тона, причем блок обработки подкадров содержит генератор замкнутого контура, который генерирует неквантованные коэффициенты усиления фиксированной кодовой книги, и второй блок векторного квантования, который получает неквантованные коэффициенты усиления фиксированной кодовой книги и генерирует квантованные коэффициенты усиления фиксированной кодовой книги.
72. Система по п.71, отличающаяся тем, что дополнительно содержит детектор периодического сигнала, который определяет, является ли речевой сигнал периодическим.
73. Система по п.72, отличающаяся тем, что, если речевой сигнал является периодическим, то генератор коэффициентов усиления основного тона выводит неквантованные коэффициенты усиления основного тона и блок обработки подкадров начинает обрабатывать подкадры после формирования генератором коэффициентов усиления основного тона неквантованных коэффициентов усиления основного тона и генерирования первым блоком векторного квантования квантованных коэффициентов усиления основного тона.
74. Система по п.71, отличающаяся тем, что генератор коэффициентов усиления основного тона формирует неквантованные коэффициенты усиления основного тона и блок обработки подкадров начинает обрабатывать подкадры после формирования генератором коэффициентов усиления основного тона неквантованных коэффициентов усиления основного тона и генерирования первым блоком векторного квантования квантованных коэффициентов усиления основного тона.
75. Система по п.71, отличающаяся тем, что второй блок векторного квантования формирует квантованные коэффициенты усиления фиксированной кодовой книги в замкнутом контуре с задержанным решением после обработки подкадров блоком обработки подкадров.
76. Способ кодирования речевого сигнала, включающего в себя кадр, имеющий множество подкадров, содержащий этапы, на которых определяют коэффициент усиления адаптивной кодовой книги для каждого из множества подкадров, осуществляют векторное квантование коэффициентов усиления адаптивной кодовой книги множества подкадров, определенных на упомянутом этапе определения, определяют после завершения упомянутого этапа осуществления векторного квантования коэффициент усиления фиксированной кодовой книги для каждого из множества подкадров и осуществляют векторное квантование коэффициентов усиления фиксированной кодовой книги множества подкадров.
77. Способ по п.76, отличающийся тем, что на этапе векторного квантования коэффициентов усиления фиксированной кодовой книги осуществляется задержанное решение.
78. Способ по п.76, отличающийся тем, что способ выполняют, только если речевой сигнал является периодическим.
79. Способ по п.76, отличающийся тем, что векторное квантование коэффициентов усиления фиксированной кодовой книги осуществляют в разомкнутом контуре.
RU2002134175/09A 2000-05-19 2001-04-16 Квантование коэффициентов усиления для речевого кодера линейного прогнозирования с кодовым возбуждением RU2257556C2 (ru)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US09/574,396 2000-05-19
US09/574,396 US6782360B1 (en) 1999-09-22 2000-05-19 Gain quantization for a CELP speech coder

Publications (2)

Publication Number Publication Date
RU2002134175A RU2002134175A (ru) 2004-05-10
RU2257556C2 true RU2257556C2 (ru) 2005-07-27

Family

ID=24295936

Family Applications (2)

Application Number Title Priority Date Filing Date
RU2002110441/09A RU2262748C2 (ru) 2000-05-19 2000-09-15 Многорежимное устройство кодирования
RU2002134175/09A RU2257556C2 (ru) 2000-05-19 2001-04-16 Квантование коэффициентов усиления для речевого кодера линейного прогнозирования с кодовым возбуждением

Family Applications Before (1)

Application Number Title Priority Date Filing Date
RU2002110441/09A RU2262748C2 (ru) 2000-05-19 2000-09-15 Многорежимное устройство кодирования

Country Status (11)

Country Link
US (4) US6782360B1 (ru)
EP (1) EP1338003B1 (ru)
JP (1) JP2004510174A (ru)
KR (1) KR100546444B1 (ru)
CN (1) CN1252681C (ru)
AT (1) ATE343199T1 (ru)
AU (2) AU2001255422B2 (ru)
BR (1) BR0110831A (ru)
DE (1) DE60123999D1 (ru)
RU (2) RU2262748C2 (ru)
WO (2) WO2001022402A1 (ru)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2453932C2 (ru) * 2007-11-02 2012-06-20 Хуавэй Текнолоджиз Ко., Лтд. Способ и устройство многоступенчатого квантования
RU2460155C2 (ru) * 2006-09-18 2012-08-27 Конинклейке Филипс Электроникс Н.В. Кодирование и декодирование звуковых объектов
RU2462769C2 (ru) * 2006-10-24 2012-09-27 Войсэйдж Корпорейшн Способ и устройство кодирования кадров перехода в речевых сигналах
US8494865B2 (en) 2008-10-08 2013-07-23 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio decoder, audio encoder, method for decoding an audio signal, method for encoding an audio signal, computer program and audio signal
RU2491658C2 (ru) * 2008-07-11 2013-08-27 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. Синтезатор аудиосигнала и кодирующее устройство аудиосигнала
RU2591021C2 (ru) * 2011-02-15 2016-07-10 Войсэйдж Корпорейшн Устройство и способ для квантования усилений адаптивного и фиксированного вкладов возбуждения в кодеке celp
RU2611973C2 (ru) * 2011-10-19 2017-03-01 Конинклейке Филипс Н.В. Ослабление шума в сигнале
US9626982B2 (en) 2011-02-15 2017-04-18 Voiceage Corporation Device and method for quantizing the gains of the adaptive and fixed contributions of the excitation in a CELP codec

Families Citing this family (97)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6782360B1 (en) * 1999-09-22 2004-08-24 Mindspeed Technologies, Inc. Gain quantization for a CELP speech coder
JP2001175298A (ja) * 1999-12-13 2001-06-29 Fujitsu Ltd 騒音抑圧装置
US7127390B1 (en) 2000-02-08 2006-10-24 Mindspeed Technologies, Inc. Rate determination coding
DE10124420C1 (de) * 2001-05-18 2002-11-28 Siemens Ag Verfahren zur Codierung und zur Übertragung von Sprachsignalen
US6871176B2 (en) * 2001-07-26 2005-03-22 Freescale Semiconductor, Inc. Phase excited linear prediction encoder
US7302387B2 (en) * 2002-06-04 2007-11-27 Texas Instruments Incorporated Modification of fixed codebook search in G.729 Annex E audio coding
CA2392640A1 (en) 2002-07-05 2004-01-05 Voiceage Corporation A method and device for efficient in-based dim-and-burst signaling and half-rate max operation in variable bit-rate wideband speech coding for cdma wireless systems
US8090577B2 (en) * 2002-08-08 2012-01-03 Qualcomm Incorported Bandwidth-adaptive quantization
US7657427B2 (en) 2002-10-11 2010-02-02 Nokia Corporation Methods and devices for source controlled variable bit-rate wideband speech coding
WO2004034379A2 (en) * 2002-10-11 2004-04-22 Nokia Corporation Methods and devices for source controlled variable bit-rate wideband speech coding
US20040167772A1 (en) * 2003-02-26 2004-08-26 Engin Erzin Speech coding and decoding in a voice communication system
US7231346B2 (en) * 2003-03-26 2007-06-12 Fujitsu Ten Limited Speech section detection apparatus
KR100546758B1 (ko) * 2003-06-30 2006-01-26 한국전자통신연구원 음성의 상호부호화시 전송률 결정 장치 및 방법
KR100668300B1 (ko) * 2003-07-09 2007-01-12 삼성전자주식회사 비트율 확장 음성 부호화 및 복호화 장치와 그 방법
US7792670B2 (en) * 2003-12-19 2010-09-07 Motorola, Inc. Method and apparatus for speech coding
US7668712B2 (en) * 2004-03-31 2010-02-23 Microsoft Corporation Audio encoding and decoding with intra frames and adaptive forward error correction
US7831421B2 (en) 2005-05-31 2010-11-09 Microsoft Corporation Robust decoder
US7177804B2 (en) * 2005-05-31 2007-02-13 Microsoft Corporation Sub-band voice codec with multi-stage codebooks and redundant coding
US7707034B2 (en) * 2005-05-31 2010-04-27 Microsoft Corporation Audio codec post-filter
US20070011009A1 (en) * 2005-07-08 2007-01-11 Nokia Corporation Supporting a concatenative text-to-speech synthesis
US9058812B2 (en) * 2005-07-27 2015-06-16 Google Technology Holdings LLC Method and system for coding an information signal using pitch delay contour adjustment
US7720677B2 (en) * 2005-11-03 2010-05-18 Coding Technologies Ab Time warped modified transform coding of audio signals
US8949120B1 (en) 2006-05-25 2015-02-03 Audience, Inc. Adaptive noise cancelation
WO2008007698A1 (fr) * 2006-07-12 2008-01-17 Panasonic Corporation Procédé de compensation des pertes de blocs, appareil de codage audio et appareil de décodage audio
US9454974B2 (en) * 2006-07-31 2016-09-27 Qualcomm Incorporated Systems, methods, and apparatus for gain factor limiting
KR100862662B1 (ko) 2006-11-28 2008-10-10 삼성전자주식회사 프레임 오류 은닉 방법 및 장치, 이를 이용한 오디오 신호복호화 방법 및 장치
CN101286319B (zh) * 2006-12-26 2013-05-01 华为技术有限公司 改进语音丢包修补质量的语音编码方法
US8688437B2 (en) 2006-12-26 2014-04-01 Huawei Technologies Co., Ltd. Packet loss concealment for speech coding
US8160872B2 (en) * 2007-04-05 2012-04-17 Texas Instruments Incorporated Method and apparatus for layered code-excited linear prediction speech utilizing linear prediction excitation corresponding to optimal gains
WO2009047911A1 (ja) * 2007-10-12 2009-04-16 Panasonic Corporation ベクトル量子化装置、ベクトル逆量子化装置、およびこれらの方法
US8527265B2 (en) * 2007-10-22 2013-09-03 Qualcomm Incorporated Low-complexity encoding/decoding of quantized MDCT spectrum in scalable speech and audio codecs
US8515767B2 (en) * 2007-11-04 2013-08-20 Qualcomm Incorporated Technique for encoding/decoding of codebook indices for quantized MDCT spectrum in scalable speech and audio codecs
US20100274556A1 (en) * 2008-01-16 2010-10-28 Panasonic Corporation Vector quantizer, vector inverse quantizer, and methods therefor
CN101499281B (zh) * 2008-01-31 2011-04-27 华为技术有限公司 一种语音编码中的增益量化方法及装置
EP2301021B1 (en) * 2008-07-10 2017-06-21 VoiceAge Corporation Device and method for quantizing lpc filters in a super-frame
MY154452A (en) * 2008-07-11 2015-06-15 Fraunhofer Ges Forschung An apparatus and a method for decoding an encoded audio signal
PL2311033T3 (pl) 2008-07-11 2012-05-31 Fraunhofer Ges Forschung Dostarczanie sygnału aktywującego dopasowanie czasowe i kodowanie sygnału audio z jego użyciem
WO2010003544A1 (en) * 2008-07-11 2010-01-14 Fraunhofer-Gesellschaft Zur Förderung Der Angewandtern Forschung E.V. An apparatus and a method for generating bandwidth extension output data
JP2010079275A (ja) * 2008-08-29 2010-04-08 Sony Corp 周波数帯域拡大装置及び方法、符号化装置及び方法、復号化装置及び方法、並びにプログラム
WO2010028297A1 (en) * 2008-09-06 2010-03-11 GH Innovation, Inc. Selective bandwidth extension
WO2010028299A1 (en) * 2008-09-06 2010-03-11 Huawei Technologies Co., Ltd. Noise-feedback for spectral envelope quantization
WO2010028292A1 (en) * 2008-09-06 2010-03-11 Huawei Technologies Co., Ltd. Adaptive frequency prediction
WO2010028301A1 (en) * 2008-09-06 2010-03-11 GH Innovation, Inc. Spectrum harmonic/noise sharpness control
US8577673B2 (en) * 2008-09-15 2013-11-05 Huawei Technologies Co., Ltd. CELP post-processing for music signals
WO2010031003A1 (en) 2008-09-15 2010-03-18 Huawei Technologies Co., Ltd. Adding second enhancement layer to celp based core layer
JP2010122617A (ja) 2008-11-21 2010-06-03 Yamaha Corp ノイズゲート、及び収音装置
CN101604525B (zh) * 2008-12-31 2011-04-06 华为技术有限公司 基音增益获取方法、装置及编码器、解码器
GB2466672B (en) 2009-01-06 2013-03-13 Skype Speech coding
GB2466674B (en) 2009-01-06 2013-11-13 Skype Speech coding
GB2466671B (en) 2009-01-06 2013-03-27 Skype Speech encoding
GB2466675B (en) 2009-01-06 2013-03-06 Skype Speech coding
GB2466673B (en) 2009-01-06 2012-11-07 Skype Quantization
PL2234103T3 (pl) 2009-03-26 2012-02-29 Fraunhofer Ges Forschung Urządzenie i sposób manipulacji sygnałem audio
ES2453098T3 (es) * 2009-10-20 2014-04-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Códec multimodo de audio
RU2464651C2 (ru) * 2009-12-22 2012-10-20 Общество с ограниченной ответственностью "Спирит Корп" Способ и устройство многоуровневого масштабируемого устойчивого к информационным потерям кодирования речи для сетей с коммутацией пакетов
MX2012011943A (es) 2010-04-14 2013-01-24 Voiceage Corp Libro de códigos de innovacion combinado, flexible y escalable para uso en codificador y decodificador celp.
US9558755B1 (en) 2010-05-20 2017-01-31 Knowles Electronics, Llc Noise suppression assisted automatic speech recognition
CA2958360C (en) 2010-07-02 2017-11-14 Dolby International Ab Audio decoder
US9047875B2 (en) 2010-07-19 2015-06-02 Futurewei Technologies, Inc. Spectrum flatness control for bandwidth extension
US9236063B2 (en) 2010-07-30 2016-01-12 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for dynamic bit allocation
US9208792B2 (en) 2010-08-17 2015-12-08 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for noise injection
CA3067155C (en) * 2010-09-16 2021-01-19 Dolby International Ab Cross product enhanced subband block based harmonic transposition
US9082416B2 (en) * 2010-09-16 2015-07-14 Qualcomm Incorporated Estimating a pitch lag
KR20120032444A (ko) 2010-09-28 2012-04-05 한국전자통신연구원 적응 코드북 업데이트를 이용한 오디오 신호 디코딩 방법 및 장치
WO2012044067A1 (ko) * 2010-09-28 2012-04-05 한국전자통신연구원 적응 코드북 업데이트를 이용한 오디오 신호 디코딩 방법 및 장치
EP2737479B1 (en) * 2011-07-29 2017-01-18 Dts Llc Adaptive voice intelligibility enhancement
KR102138320B1 (ko) 2011-10-28 2020-08-11 한국전자통신연구원 통신 시스템에서 신호 코덱 장치 및 방법
WO2013062370A1 (ko) * 2011-10-28 2013-05-02 한국전자통신연구원 통신 시스템에서 신호 코덱 장치 및 방법
EP2798631B1 (en) * 2011-12-21 2016-03-23 Huawei Technologies Co., Ltd. Adaptively encoding pitch lag for voiced speech
CN103187065B (zh) 2011-12-30 2015-12-16 华为技术有限公司 音频数据的处理方法、装置和系统
EP2828854B1 (en) 2012-03-23 2016-03-16 Dolby Laboratories Licensing Corporation Hierarchical active voice detection
DK2831757T3 (da) * 2012-03-29 2019-08-19 Ericsson Telefon Ab L M Vektorkvantiserer
EP2682941A1 (de) * 2012-07-02 2014-01-08 Technische Universität Ilmenau Vorrichtung, Verfahren und Computerprogramm für frei wählbare Frequenzverschiebungen in der Subband-Domäne
US9589570B2 (en) * 2012-09-18 2017-03-07 Huawei Technologies Co., Ltd. Audio classification based on perceptual quality for low or medium bit rates
WO2014054556A1 (ja) * 2012-10-01 2014-04-10 日本電信電話株式会社 符号化方法、符号化装置、プログラム、および記録媒体
US9640194B1 (en) 2012-10-04 2017-05-02 Knowles Electronics, Llc Noise suppression for speech processing based on machine-learning mask estimation
CN103137135B (zh) * 2013-01-22 2015-05-06 深圳广晟信源技术有限公司 Lpc系数量化方法和装置及多编码核音频编码方法和设备
SG11201505903UA (en) 2013-01-29 2015-08-28 Fraunhofer Ges Forschung Apparatus and method for synthesizing an audio signal, decoder, encoder, system and computer program
WO2014131054A2 (en) * 2013-02-25 2014-08-28 Audience, Inc. Dynamic audio perspective change during video playback
KR102148407B1 (ko) * 2013-02-27 2020-08-27 한국전자통신연구원 소스 필터를 이용한 주파수 스펙트럼 처리 장치 및 방법
US9883312B2 (en) 2013-05-29 2018-01-30 Qualcomm Incorporated Transformed higher order ambisonics audio data
SG11201510463WA (en) * 2013-06-21 2016-01-28 Fraunhofer Ges Forschung Apparatus and method for improved concealment of the adaptive codebook in acelp-like concealment employing improved pitch lag estimation
PT3011555T (pt) 2013-06-21 2018-07-04 Fraunhofer Ges Forschung Reconstrução de uma estrutura de discurso
US9536540B2 (en) 2013-07-19 2017-01-03 Knowles Electronics, Llc Speech signal separation and synthesis based on auditory scene analysis and speech modeling
EP3038104B1 (en) * 2013-08-22 2018-12-19 Panasonic Intellectual Property Corporation of America Speech coding device and method for same
CN104637486B (zh) * 2013-11-07 2017-12-29 华为技术有限公司 一种数据帧的内插方法及装置
US9489955B2 (en) * 2014-01-30 2016-11-08 Qualcomm Incorporated Indicating frame parameter reusability for coding vectors
US10770087B2 (en) 2014-05-16 2020-09-08 Qualcomm Incorporated Selecting codebooks for coding vectors decomposed from higher-order ambisonic audio signals
US9583115B2 (en) * 2014-06-26 2017-02-28 Qualcomm Incorporated Temporal gain adjustment based on high-band signal characteristic
CN105225670B (zh) * 2014-06-27 2016-12-28 华为技术有限公司 一种音频编码方法和装置
FR3024581A1 (fr) * 2014-07-29 2016-02-05 Orange Determination d'un budget de codage d'une trame de transition lpd/fd
US9799330B2 (en) 2014-08-28 2017-10-24 Knowles Electronics, Llc Multi-sourced noise suppression
WO2016142002A1 (en) * 2015-03-09 2016-09-15 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal
WO2016162283A1 (en) * 2015-04-07 2016-10-13 Dolby International Ab Audio coding with range extension
KR102169435B1 (ko) * 2016-03-21 2020-10-23 후아웨이 테크놀러지 컴퍼니 리미티드 가중된 행렬 계수의 적응형 양자화
MX2020002972A (es) 2017-09-20 2020-07-22 Voiceage Corp Metodo y dispositivo para asignar un presupuesto de bits entre subtramas en un codec celp.
CN114650103B (zh) * 2020-12-21 2023-09-08 航天科工惯性技术有限公司 一种泥浆脉冲数据传输方法、装置、设备及存储介质

Family Cites Families (44)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4720861A (en) * 1985-12-24 1988-01-19 Itt Defense Communications A Division Of Itt Corporation Digital speech coding circuit
US4969192A (en) * 1987-04-06 1990-11-06 Voicecraft, Inc. Vector adaptive predictive coder for speech and audio
US5307441A (en) * 1989-11-29 1994-04-26 Comsat Corporation Wear-toll quality 4.8 kbps speech codec
US5293449A (en) * 1990-11-23 1994-03-08 Comsat Corporation Analysis-by-synthesis 2,4 kbps linear predictive speech codec
CA2568984C (en) * 1991-06-11 2007-07-10 Qualcomm Incorporated Variable rate vocoder
US5233660A (en) * 1991-09-10 1993-08-03 At&T Bell Laboratories Method and apparatus for low-delay celp speech coding and decoding
US5765127A (en) * 1992-03-18 1998-06-09 Sony Corp High efficiency encoding method
US5495555A (en) * 1992-06-01 1996-02-27 Hughes Aircraft Company High quality low bit rate celp-based speech codec
US5734789A (en) * 1992-06-01 1998-03-31 Hughes Electronics Voiced, unvoiced or noise modes in a CELP vocoder
US5745523A (en) * 1992-10-27 1998-04-28 Ericsson Inc. Multi-mode signal processing
JP2746039B2 (ja) 1993-01-22 1998-04-28 日本電気株式会社 音声符号化方式
IT1270438B (it) * 1993-06-10 1997-05-05 Sip Procedimento e dispositivo per la determinazione del periodo del tono fondamentale e la classificazione del segnale vocale in codificatori numerici della voce
EP0699334B1 (en) 1994-02-17 2002-02-20 Motorola, Inc. Method and apparatus for group encoding signals
TW271524B (ru) * 1994-08-05 1996-03-01 Qualcomm Inc
US5751903A (en) * 1994-12-19 1998-05-12 Hughes Electronics Low rate multi-mode CELP codec that encodes line SPECTRAL frequencies utilizing an offset
US5701390A (en) 1995-02-22 1997-12-23 Digital Voice Systems, Inc. Synthesis of MBE-based coded speech using regenerated phase information
US5699485A (en) * 1995-06-07 1997-12-16 Lucent Technologies Inc. Pitch delay modification during frame erasures
US5664055A (en) * 1995-06-07 1997-09-02 Lucent Technologies Inc. CS-ACELP speech compression system with adaptive pitch prediction filter gain based on a measure of periodicity
US5732389A (en) * 1995-06-07 1998-03-24 Lucent Technologies Inc. Voiced/unvoiced classification of speech for excitation codebook selection in celp speech decoding during frame erasures
JP3616432B2 (ja) * 1995-07-27 2005-02-02 日本電気株式会社 音声符号化装置
US5774837A (en) * 1995-09-13 1998-06-30 Voxware, Inc. Speech coding system and method using voicing probability determination
EP0763818B1 (en) * 1995-09-14 2003-05-14 Kabushiki Kaisha Toshiba Formant emphasis method and formant emphasis filter device
US5864798A (en) * 1995-09-18 1999-01-26 Kabushiki Kaisha Toshiba Method and apparatus for adjusting a spectrum shape of a speech signal
EP0764939B1 (en) * 1995-09-19 2002-05-02 AT&T Corp. Synthesis of speech signals in the absence of coded parameters
JP3196595B2 (ja) * 1995-09-27 2001-08-06 日本電気株式会社 音声符号化装置
US6014622A (en) * 1996-09-26 2000-01-11 Rockwell Semiconductor Systems, Inc. Low bit rate speech coder using adaptive open-loop subframe pitch lag estimation and vector quantization
FI113903B (fi) * 1997-05-07 2004-06-30 Nokia Corp Puheen koodaus
DE19729494C2 (de) * 1997-07-10 1999-11-04 Grundig Ag Verfahren und Anordnung zur Codierung und/oder Decodierung von Sprachsignalen, insbesondere für digitale Diktiergeräte
US6058359A (en) 1998-03-04 2000-05-02 Telefonaktiebolaget L M Ericsson Speech coding including soft adaptability feature
US6029125A (en) * 1997-09-02 2000-02-22 Telefonaktiebolaget L M Ericsson, (Publ) Reducing sparseness in coded speech signals
US6470309B1 (en) * 1998-05-08 2002-10-22 Texas Instruments Incorporated Subframe-based correlation
CA2239294A1 (en) * 1998-05-29 1999-11-29 Majid Foodeei Methods and apparatus for efficient quantization of gain parameters in glpas speech coders
US6240386B1 (en) 1998-08-24 2001-05-29 Conexant Systems, Inc. Speech codec employing noise classification for noise compensation
US6507814B1 (en) * 1998-08-24 2003-01-14 Conexant Systems, Inc. Pitch determination using speech classification and prior pitch estimation
JP3343082B2 (ja) * 1998-10-27 2002-11-11 松下電器産業株式会社 Celp型音声符号化装置
US6691084B2 (en) * 1998-12-21 2004-02-10 Qualcomm Incorporated Multiple mode variable rate speech coding
US6775649B1 (en) * 1999-09-01 2004-08-10 Texas Instruments Incorporated Concealment of frame erasures for speech transmission and storage system and method
US6959274B1 (en) * 1999-09-22 2005-10-25 Mindspeed Technologies, Inc. Fixed rate speech compression system and method
US6782360B1 (en) 1999-09-22 2004-08-24 Mindspeed Technologies, Inc. Gain quantization for a CELP speech coder
US6804218B2 (en) * 2000-12-04 2004-10-12 Qualcomm Incorporated Method and apparatus for improved detection of rate errors in variable rate receivers
US6738739B2 (en) * 2001-02-15 2004-05-18 Mindspeed Technologies, Inc. Voiced speech preprocessing employing waveform interpolation or a harmonic model
US7054807B2 (en) * 2002-11-08 2006-05-30 Motorola, Inc. Optimizing encoder for efficiently determining analysis-by-synthesis codebook-related parameters
US7613606B2 (en) * 2003-10-02 2009-11-03 Nokia Corporation Speech codecs
US20050258983A1 (en) * 2004-05-11 2005-11-24 Dilithium Holdings Pty Ltd. (An Australian Corporation) Method and apparatus for voice trans-rating in multi-rate voice coders for telecommunications

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2460155C2 (ru) * 2006-09-18 2012-08-27 Конинклейке Филипс Электроникс Н.В. Кодирование и декодирование звуковых объектов
RU2462769C2 (ru) * 2006-10-24 2012-09-27 Войсэйдж Корпорейшн Способ и устройство кодирования кадров перехода в речевых сигналах
US8401843B2 (en) 2006-10-24 2013-03-19 Voiceage Corporation Method and device for coding transition frames in speech signals
RU2453932C2 (ru) * 2007-11-02 2012-06-20 Хуавэй Текнолоджиз Ко., Лтд. Способ и устройство многоступенчатого квантования
US8731948B2 (en) 2008-07-11 2014-05-20 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio signal synthesizer for selectively performing different patching algorithms
RU2491658C2 (ru) * 2008-07-11 2013-08-27 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. Синтезатор аудиосигнала и кодирующее устройство аудиосигнала
US10014000B2 (en) 2008-07-11 2018-07-03 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio signal encoder and method for generating a data stream having components of an audio signal in a first frequency band, control information and spectral band replication parameters
US10522168B2 (en) 2008-07-11 2019-12-31 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio signal synthesizer and audio signal encoder
US8494865B2 (en) 2008-10-08 2013-07-23 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio decoder, audio encoder, method for decoding an audio signal, method for encoding an audio signal, computer program and audio signal
RU2591021C2 (ru) * 2011-02-15 2016-07-10 Войсэйдж Корпорейшн Устройство и способ для квантования усилений адаптивного и фиксированного вкладов возбуждения в кодеке celp
US9626982B2 (en) 2011-02-15 2017-04-18 Voiceage Corporation Device and method for quantizing the gains of the adaptive and fixed contributions of the excitation in a CELP codec
US10115408B2 (en) 2011-02-15 2018-10-30 Voiceage Corporation Device and method for quantizing the gains of the adaptive and fixed contributions of the excitation in a CELP codec
RU2611973C2 (ru) * 2011-10-19 2017-03-01 Конинклейке Филипс Н.В. Ослабление шума в сигнале

Also Published As

Publication number Publication date
US7660712B2 (en) 2010-02-09
CN1468427A (zh) 2004-01-14
AU2001255422B2 (en) 2004-11-04
EP1338003A1 (en) 2003-08-27
US6782360B1 (en) 2004-08-24
DE60123999D1 (de) 2006-11-30
CN1252681C (zh) 2006-04-19
WO2001091112A1 (en) 2001-11-29
US20070255559A1 (en) 2007-11-01
US7260522B2 (en) 2007-08-21
BR0110831A (pt) 2004-12-07
JP2004510174A (ja) 2004-04-02
KR100546444B1 (ko) 2006-01-26
ATE343199T1 (de) 2006-11-15
WO2001022402A1 (en) 2001-03-29
KR20030001523A (ko) 2003-01-06
US20090177464A1 (en) 2009-07-09
AU5542201A (en) 2001-12-03
US20040260545A1 (en) 2004-12-23
EP1338003B1 (en) 2006-10-18
RU2262748C2 (ru) 2005-10-20
US10181327B2 (en) 2019-01-15

Similar Documents

Publication Publication Date Title
RU2257556C2 (ru) Квантование коэффициентов усиления для речевого кодера линейного прогнозирования с кодовым возбуждением
JP4137634B2 (ja) 紛失フレームを取扱うための音声通信システムおよび方法
US6735567B2 (en) Encoding and decoding speech signals variably based on signal classification
US6574593B1 (en) Codebook tables for encoding and decoding
US6581032B1 (en) Bitstream protocol for transmission of encoded voice signals
JP4662673B2 (ja) 広帯域音声及びオーディオ信号復号器における利得平滑化
JP3566652B2 (ja) 広帯域信号の効率的な符号化のための聴覚重み付け装置および方法
US6081776A (en) Speech coding system and method including adaptive finite impulse response filter
US6098036A (en) Speech coding system and method including spectral formant enhancer
US6119082A (en) Speech coding system and method including harmonic generator having an adaptive phase off-setter
US6078880A (en) Speech coding system and method including voicing cut off frequency analyzer
US6138092A (en) CELP speech synthesizer with epoch-adaptive harmonic generator for pitch harmonics below voicing cutoff frequency
JP4176349B2 (ja) マルチモードの音声符号器
AU2001255422A1 (en) Gains quantization for a celp speech coder
US6094629A (en) Speech coding system and method including spectral quantizer
US5884251A (en) Voice coding and decoding method and device therefor
JP3357795B2 (ja) 音声符号化方法および装置
JPH11504733A (ja) 聴覚モデルによる量子化を伴う予測残余信号の変形符号化による多段音声符号器
JP3192051B2 (ja) 音声符号化装置
JPH0786952A (ja) 音声の予測符号化方法
JP3024467B2 (ja) 音声符号化装置
JPH06195098A (ja) 音声符号化方法
JPH05289696A (ja) 音声の符号化方法

Legal Events

Date Code Title Description
MM4A The patent is invalid due to non-payment of fees

Effective date: 20060417

PC41 Official registration of the transfer of exclusive right

Effective date: 20121217