RU2142166C1 - Способ и устройство осуществления поиска в справочнике кодов для кодирования звукового сигнала и система сотовой связи - Google Patents

Способ и устройство осуществления поиска в справочнике кодов для кодирования звукового сигнала и система сотовой связи Download PDF

Info

Publication number
RU2142166C1
RU2142166C1 RU97114804A RU97114804A RU2142166C1 RU 2142166 C1 RU2142166 C1 RU 2142166C1 RU 97114804 A RU97114804 A RU 97114804A RU 97114804 A RU97114804 A RU 97114804A RU 2142166 C1 RU2142166 C1 RU 2142166C1
Authority
RU
Russia
Prior art keywords
amplitude
positions
amplitudes
pulses
pulse
Prior art date
Application number
RU97114804A
Other languages
English (en)
Other versions
RU97114804A (ru
Inventor
Пьер Адуль Жан
Лафлам Клод
Original Assignee
Юниверситэ де Шербрук
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=27010408&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=RU2142166(C1) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Юниверситэ де Шербрук filed Critical Юниверситэ де Шербрук
Publication of RU97114804A publication Critical patent/RU97114804A/ru
Application granted granted Critical
Publication of RU2142166C1 publication Critical patent/RU2142166C1/ru

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/10Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0004Design or structure of the codebook
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0007Codebook element generation
    • G10L2019/0008Algebraic codebooks
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0011Long term prediction filters, i.e. pitch estimation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0013Codebook search algorithms
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/06Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being correlation coefficients

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

Для кодирования звукового сигнала осуществляют поиск в справочнике кодов. Этот справочник кодов состоит из множества комбинаций амплитуд и позиций импульсов, каждая из которых определяет L различных позиций и содержит как импульсы нулевой амплитуды, так и импульсы ненулевой амплитуды, присвоенные соответствующим позициям р = 1, 2,..., L комбинации, причем каждый импульс ненулевой амплитуды предполагает наличие, по меньшей мере, одной из q возможных амплитуд. Технический результат заключается в уменьшении сложности поиска. Чтобы уменьшить сложность поиска, предварительно выбирают некоторое подмножество комбинаций амплитуд и позиций импульсов из справочника кодов в связи со звуковым сигналом и осуществляют поиск только в этом подмножестве комбинаций. Предварительный выбор подмножества комбинаций заключается в том, что предварительно устанавливают, в связи со звуковым сигналом, функциональную зависимость Sр между соответствующими позициями р = 1, 2,..., L и q возможными амплитудами, при этом поиск ограничивают теми комбинациями из справочника кодов, имеющими импульсы ненулевой амплитуды, которые соответствуют предварительно установленной функциональной зависимости. Функциональную зависимость можно предварительно устанавливать путем предварительного присвоения одной из q возможных амплитуд каждой позиции p, причем предварительно установленная функциональная зависимость вступает в силу, когда каждый импульс ненулевой амплитуды комбинации имеет амплитуду, равную амплитуде Sp, предварительно присвоенной позиции p этого импульса. 3 с. и 24 з.п. ф-лы, 5 ил.

Description

Предпосылки к созданию изобретения
Область техники
Настоящее изобретение относится к усовершенствованному способу цифрового кодирования звукового сигнала, в частности, но не исключительно, речевого сигнала, в связи с передачей и синтезом такого звукового сигнала.
Предшествующий уровень техники
В настоящее время растет потребность в эффективных способах цифрового кодирования речи, обеспечивающих приемлемый субъективный компромисс между качеством и скоростью передачи данных в битах, для использования в различных системах, например при передаче речевых сообщений посредством спутников, в наземных мобильных станциях, в цифровой радио- или пакетной сети, устройствах для запоминания речевых сообщений, устройствах для передачи ответных речевых сообщений и радиотелефонии.
Одним из наилучших известных способов, при котором можно достичь приемлемого компромисса между качеством и скоростью передачи данных в битах, является так называемый способ линейного предсказания с кодовым возбуждением (ЛПКВ). В соответствии с этим способом, производят выборку и обработку речевого сигнала в блоках из L выборок (т.е. векторов), где L - некоторое заданное число. Способ ЛПКВ основан на использовании справочника кодов.
В контексте ЛПКВ справочник кодов - это индексированное множество последовательностей длиной L выборок, указанные последовательности будут именоваться L-мерными кодовыми векторами (комбинациями импульсов, определяющими L различных позиций и содержащими как импульсы нулевой амплитуды, так и импульсы ненулевой амплитуды, присвоенные соответствующим позициям p = 1, 2,... L комбинации). Справочник кодов содержит индекс k, находящийся в диапазоне от 1 до M, где M представляет собой размер справочника кодов, иногда выражаемый количеством битов b:
М = 2b.
Справочник кодов можно хранить в физической памяти (например, как просмотровую таблицу), или можно использовать механизм, связывающий индекс с соответствующим кодовым вектором (например, соответствующую формулу).
Чтобы синтезировать речь в соответствии со способом ЛПКВ, каждый блок выборок речи синтезируют путем фильтрации подходящего кодового вектора из справочника кодов с помощью нестационарных фильтров, моделирующих спектральные характеристики речевого сигнала. В устройстве кодирования рассчитывается синтезированный выходной сигнал для всех или некоторого подмножества кодовых векторов-кандидатов из справочника кодов (поиск в справочнике кодов). Именно зафиксированный кодовый вектор дает синтетический выходной сигнал, который является наиболее близким к исходному речевому сигналу, соответственно некоторой мере перцептуально взвешенного искажения.
Первым типом справочников кодов являются так называемые "стохастические" справочники кодов. Недостаток этих справочников заключается в том, что они часто занимают значительный объем физической памяти. Они являются стохастическими, т.е. случайными в том смысле, что путь от индекса к связанному с ним кодовому вектору использует просмотровые таблицы, которые являются результатом объединения случайно генерируемых чисел, или статистические способы, применяемые к большим речевым обучающим массивам данных. Объем стохастических справочников кодов, как правило, ограничен памятью и/или сложностью поиска.
Вторым типом справочников кодов являются алгебраические справочники кодов. В отличие от стохастических справочников кодов, алгебраические справочники кодов не являются случайными и не требуют памяти. Алгебраический справочник кодов - это множество упорядоченных кодовых векторов, в котором амплитуды и позиции импульсов k-го кодового вектора можно получить, исходя из его индекса k, с помощью правила, которое вообще не требует или требует наличия минимальной физической памяти. Следовательно, объем алгебраического справочника кодов не ограничен требованиями к памяти. Алгебраические справочники кодов также могут быть предназначены для эффективного поиска.
Задача настоящего изобретения состоит в создании способа и устройства, обеспечивающих значительное уменьшение сложности поиска в справочнике кодов после кодирования звукового сигнала, применимые к большому классу справочников кодов.
Еще одной задачей настоящего изобретения является создание способа и устройства, дающих возможность априорного выбора некоторого подмножества комбинаций импульсов из справочника кодов и ограничения подлежащих поиску комбинаций этим подмножеством для уменьшения сложности поиска в справочнике кодов.
Дополнительная задача настоящего изобретения состоит в том, чтобы увеличить размер справочника кодов, допуская наличие отдельных импульсов ненулевой амплитуды кодовых векторов, предположительно, имеющих, по меньшей мере, одну из q возможных амплитуд, без увеличения сложности поиска.
Сущность изобретения
Более конкретно, в соответствии с настоящим изобретением, разработан и способ осуществления поиска в справочнике кодов для кодирования звукового сигнала, при этом справочник кодов состоит из множества комбинаций амплитуд и позиций импульсов, каждая комбинация амплитуд и позиций импульсов определяет L различных позиций и содержит как импульсы нулевой амплитуды, так и импульсы нулевой амплитуды, присвоенные соответствующим позициям p = 1, 2,... L комбинации, а каждый импульс ненулевой амплитуды предполагает наличие одной из q возможных амплитуд, заключающийся в том, что
предварительно выбирают из справочника кодов некоторое подмножество комбинаций амплитуд и позиций импульсов в связи со звуковым сигналом, и
осуществляют поиск только в этом подмножестве комбинаций амплитуд и позиций импульсов для кодирования звукового сигнала, за счет чего уменьшают сложность поиска, поскольку поиск осуществляют только в одном подмножестве комбинаций амплитуд и позиций импульсов из справочника кодов.
Этап предварительного выбора включает предварительное установление, в связи со звуковым сигналом, функциональной зависимости Sp, предварительно присваивающей позициям p = 1, 2, ... L действительные амплитуды из q возможных амплитуд, а этап поиска включает поиск только тех комбинаций амплитуд и позиций импульсов из справочника кодов, имеющих импульсы ненулевой амплитуды, которые соответствуют предварительно установленной функциональной зависимости.
Также в соответствии с настоящим изобретением, разработано устройство для осуществления поиска в справочнике кодов для кодирования звукового сигнала, причем справочник кодов состоит из множества комбинаций амплитуд и позиций импульсов, каждая комбинация амплитуд и позиций импульсов определяет L различных позиций и содержит как импульсы нулевой амплитуды, так и импульсы ненулевой в амплитуды, присвоенные соответствующим позициям p = 1, 2, . .. L комбинации, а каждый импульс ненулевой амплитуды предполагает наличие одной из q возможных амплитуд, содержащее
средство предварительного выбора из справочника кодов некоторого подмножества комбинаций амплитуд и позиций импульсов в связи со звуковым сигналом и
средство поиска только в этом подмножестве комбинаций амплитуд и позиций импульсов ввиду кодирования звукового сигнала, за счет чего уменьшается сложность поиска, поскольку поиск осуществляется только в одном подмножестве комбинаций амплитуд и позиций импульсов из справочника кодов.
Средство предварительного выбора содержит средство предварительного установления, в связи со звуковым сигналом, функциональной зависимости Sp, предварительно присваивающей позициям p = 1, 2,... L действительные амплитуды из q возможных амплитуд, а средство поиска содержит средство ограничения поиска теми комбинациями амплитуд и позиций импульсов из справочника кодов, имеющими импульсы ненулевой амплитуды, которые соответствуют предварительно заданной функциональной зависимости.
Также в соответствии с настоящим изобретением, разработана система сотовой связи для обслуживания большой территориальной зоны, разделенной на множество ячеек, содержащая
мобильные приемопередающие блоки,
сотовые базовые станции, соответственно расположенные в упомянутых ячейках,
средства управления связью между сотовыми базовыми станциями,
подсистему двусторонней радиосвязи между каждым мобильным блоком, находящимся в одной из ячеек, и сотовой базовой станцией этой ячейки, содержащую в мобильном блоке и в сотовой базовой станции передатчик, включающий в себя средство кодирования речевого сигнала и средство передачи кодированного речевого сигнала, и приемник, включающий в себя средство приема переданного кодированного речевого сигнала и средство декодирования принятого кодированного речевого сигнала.
Средство кодирования речевого сигнала содержит устройство для осуществления поиска в справочнике кодов для кодирования речевого сигнала, причем справочник кодов состоит из множества комбинаций амплитуд и позиций импульсов, каждая комбинация амплитуд и позиций импульсов определяет L различных позиций и содержит как импульсы нулевой амплитуды, так и импульсы ненулевой амплитуды, присвоенные соответствующим позициям p = 1, 2,... L комбинации, а каждый импульс ненулевой амплитуды предполагает наличие одной из q возможных амплитуд, при этом устройство для осуществления поиска содержит
средство предварительного выбора из справочника кодов некоторого подмножества комбинаций амплитуд и позиций импульсов в связи с речевым сигналом и
средство поиска только в этом подмножестве комбинаций амплитуд и позиций импульсов для кодирования речевого сигнала, за счет чего уменьшается сложность поиска, поскольку поиск осуществляется только в одном подмножестве комбинаций амплитуд и позиций из справочника кодов,
при этом средство предварительного выбора содержит средство предварительного установления, в связи со звуковым сигналом, функциональной зависимости Sp, предварительно присваивающей позициям p = 1, 2,... L действительные амплитуды из указанных q возможных амплитуд, а средство поиска содержит средство ограничения поиска теми комбинациями амплитуд и позиций импульсов из справочника кодов, имеющими импульсы ненулевой амплитуды, которые соответствуют предварительно установленной функциональной зависимости.
В соответствии с предпочтительным вариантом осуществления изобретения, посредством функциональной зависимости Sp одна из q возможных амплитуд предварительно присваивается в качестве действительной амплитуды каждой позиции p, а предварительно установленная функциональная зависимость вступает в силу, когда каждый импульс ненулевой амплитуды комбинации амплитуд и позиций импульсов имеет амплитуду, равную амплитуде Sp, предварительно присвоенной позиции p импульса ненулевой амплитуды.
Предпочтительно, предварительное присвоение одной из q возможных амплитуд каждой позиции p заключается в том, что
обрабатывают звуковой сигнал с получением обратно отфильтрованного целевого сигнала D и остаточного сигнала R' с удаленным основным тоном,
вычисляют вектор B оценки амплитуды по обратно отфильтрованному целевому сигналу D и остаточному сигналу R' с удаленным основным тоном, и
для каждой из позиций p квантуют оценку Bp амплитуды вектора B для получения амплитуды, выбираемой для позиции p.
Вычисление вектора B оценки амплитуды преимущественно включает сложение обратно фильтрованного целевого сигнала D в нормированном виде
Figure 00000002

с остаточным сигналом R' с удаленным основным тоном в нормированном виде
Figure 00000003

для получения вектора B оценки амплитуды в виде
Figure 00000004

где β - фиксированная константа, предпочтительно имеющая значение в диапазоне между 0 и 1.
Согласно другому предпочтительному варианту осуществления данного изобретения, квантование осуществляют по оценке Bp нормированной максимальным значением амплитуды вектора B с помощью следующего выражения:
Figure 00000005

где знаменатель
Figure 00000006

является коэффициентом нормировки, представляющим собой максимальную амплитуду импульсов ненулевой амплитуды.
Каждая комбинация импульсов может содержать число N импульсов ненулевой амплитуды, а позиции p импульсов ненулевой амплитуды предпочтительно ограничены в соответствии с по меньшей мере одним кодом перестановки N перемежающихся одиночных импульсов.
Поиск в справочнике кодов предпочтительно включает максимизацию заданной дроби, имеющей знаменатель ak2, вычисленный посредством N вложенных циклов в соответствии со следующим соотношением:
ak2 = U'(p1,p1) + U'(p2,p2) + 2 U'(p1,p2) + U'(p3,p3) + 2 U'(p1,p3) + 2 U'(p2, p3) . . . . . . ... + U'(pN,pN) + 2 U'(p1,pN) + 2 U'(p2,pN) + ... 2 U'(pN-1,pN),
где вычисление для каждого цикла записано в отдельную строку от крайнего внешнего цикла до крайнего внутреннего цикла из N вложенных циклов, где pn - позиция n-го импульса ненулевой амплитуды комбинации и где U'(px,py) - функция, зависящая от амплитуды
Figure 00000007
, предварительно присвоенной позиции px из числа позиций p, и амплитуды
Figure 00000008
, предварительно присвоенной позиции py из числа позиций p. При вышеуказанном вычислении, по меньшей мере, крайний внутренний цикл из N вложенных циклов можно пропускать всякий раз, когда справедливо следующее неравенство:
Figure 00000009

где Spn - амплитуда, предварительно присвоенная позиции pn, Dpn - pn-ая составляющая целевого вектора D, а TD - пороговое значение, связанное с обратно отфильтрованным целевым вектором D.
Задачи, преимущества и другие признаки настоящего изобретения поясняются в нижеследующем описании предпочтительного варианта осуществления изобретения, приведенного только в качестве примера и со ссылками на прилагаемые чертежи.
Краткое описание чертежей
На прилагаемых чертежах представлено следующее:
фиг.1 - блок-схема устройства кодирования звукового сигнала, содержащего селектор амплитуды и оптимизирующее устройство управления в соответствии с настоящим изобретением,
фиг. 2 - блок-схема устройства декодирования, связанного с устройством кодирования, изображенным на фиг.1,
фиг. 3a - последовательность основных операций для быстрого поиска в справочнике кодов в соответствии с настоящим изобретением, основанного на амплитудах импульсов, выбранных применительно к сигналу,
фиг. 3b - последовательность операций для предварительного присвоения одной из q амплитуд каждой позиции p комбинаций амплитуд и позиций импульсов,
фиг. 3c - последовательность операций, выполняемых при поиске с использованием N вложенных циклов, при котором крайний внутренний цикл пропускается всякий раз, когда вклад первых N-1 импульсов в числитель DAKT считается недостаточным,
фиг.4 - схематическое представление N вложенных циклов, используемых для поиска в справочнике кодов, и
фиг. 5 - блок-схема, иллюстрирующая инфраструктуру типичной системы сотовой связи.
Подробное описание предпочтительного варианта осуществления
На фиг.5 изображена инфраструктура типичной системы 1 сотовой связи.
Хотя применение способа и устройства для осуществления поиска, соответствующих настоящему изобретению, в системе сотовой связи раскрыто в данном описании в качестве примера, не устанавливающего каких-либо ограничений, следует иметь в виду, что эти способ и устройство можно использовать с теми же выгодами во многих других типах систем связи, где требуется кодирование звукового сигнала.
В системе сотовой связи, например, в системе 1, телекоммуникационное обслуживание обеспечивается в пределах большой территориальной зоны путем разделения этой большой зоны на некоторое количество меньших ячеек. Каждая ячейка имеет сотовую базовую станцию 2 (фиг.5) для создания каналов сигнализации для радиосвязи, а также аудио- и информационных каналов.
Каналы сигнализации для радиосвязи используются для поискового вызова мобильных радиотелефонов (подвижных приемопередающих блоков), например 3, в пределах зоны обслуживания (ячейки) базовой станции ячейки и для установления связи по вызовам с другими радиотелефонами как в пределах ячейки данной базовой станции, так и вне ее или посредством другой сети, например коммутируемой телефонной сети общего пользования (КТСОП) 4.
Как только радиотелефон 3 установил связь по вызову или принял вызов, устанавливается аудио- или информационный канал с сотовой базовой станцией 2, соответствующей ячейке, в которой находится радиотелефон 3, и осуществляется связь между базовой станцией 2 и радиотелефоном 3 по этому аудио- или информационному каналу. Радиотелефон 3 может также принимать информацию управления или синхронизации по каналу сигнализации в процессе вызова.
Если радиотелефон 3 покидает ячейку во время вызова и попадает в другую ячейку, то он переносит вызов в имеющийся аудио- или информационный канал в новой ячейке. Аналогично, если текущего вызова нет, по каналу сигнализации посылается управляющее сообщение, так что радиотелефон регистрируется в базовой станции 2, связанной с новой ячейкой. Таким образом, возможна мобильная связь в широкой территориальной зоне.
Сотовая система связи 1 также содержит терминал 5 для управления связью между сотовыми базовыми станциями 2 и КТСОП 4, например во время сеанса связи между радиотелефоном 3 и КТСОП 4, или между радиотелефоном 3 в первой ячейке и радиотелефоном 3 во второй ячейке.
Конечно, для установления связи между каждым радиотелефоном 3, находящимся в одной ячейке, и сотовой базовой станцией 2 этой ячейки, необходима подсистема двусторонней радиосвязи. Такая система двусторонней радиосвязи обычно содержит и в радиотелефоне 3, и в сотовой базовой станции 2 передатчик для кодирования речевого сигнала и для передачи кодированного речевого сигнала через антенну, например 6 или 7, и приемник для приема переданного кодированного речевого сигнала через ту же антенну 6 или 7 и для декодирования принятого кодированного речевого сигнала. Как известно специалистам в данной области техники, чтобы уменьшить ширину полосы, необходимую для передачи речи по системе двусторонней радиосвязи, например между радиотелефоном 3 и базовой станцией 2, требуется кодирование речевых сообщений.
Задачей настоящего изобретения является создание эффективного способа цифрового кодирования речи с приемлемым субъективным компромиссом между качеством и скоростью передачи данных в битах, например для двухсторонней передачи речевых сигналов между сотовой базовой станцией 2 и радиотелефоном 3 по аудио- или информационному каналу. На фиг.1 изображена блок-схема устройства цифрового кодирования речи, пригодного для осуществления этого эффективного способа.
Устройство кодирования речи, изображенное на фиг.1, идентично устройству кодирования речи, изображенному на фиг.1 первичной заявки на патент США N 07/927528, в которое введен селектор 112 амплитуды в соответствии с настоящим изобретением. Первичная заявка на патент США N 07/927528 подана 10 сентября 1992 на "Динамический справочник кодов для эффективного кодирования речи на основе алгебраических кодов".
Аналоговый речевой сигнал дискретизируется и подвергается поблочной обработке. Следует иметь в виду, что настоящее изобретение не ограничено применением к речевому сигналу. Можно также осуществлять и кодирование других типов звукового сигнала.
В приведенном примере блок входного дискретизированного речевого сигнала S (фиг. 1) содержит L последовательных выборок. В соответствии с методом ЛПКВ, L называют длиной "подгруппы данных", и она обычно составляет от 20 до 80. Кроме того, блоки из L выборок называют L-мерными векторами. B процессе кодирования получают различные L-мерные вектора. Перечень этих векторов, который показан на фиг.1 и 2, а также перечень передаваемых параметров, приводится ниже.
Перечень основных L-мерных векторов:
S - вектор входного речевого сигнала,
R' - остаточный вектор с удаленным основным тоном,
X - целевой вектор,
D - обратно фильтрованный целевой вектор,
Ak - кодовый вектор индекса k из алгебраического справочника кодов, и
Ck - вектор обновления (отфильтрованный кодовый вектор).
Перечень передаваемых параметров
k - индекс кодового вектора (входной параметр алгебраического справочника кодов),
g - коэффициент усиления,
КСП (STP) - параметры краткосрочного прогноза (определяющие A(z)), и
ДСП (LTP) - параметры долгосрочного прогноза (определяющие коэффициент усиления b основного тона и задержку T основного тона).
Принцип декодирования
Представляется предпочтительным описать сначала устройство кодирования речи, изображенное на фиг.2, иллюстрируя различные этапы, выполняемые при переходе от цифрового входного сигнала (вход демультиплексора 205) к выходному дискретизированному речевому сигналу (выход синтезирующего фильтра 204).
Демультиплексор 205 выделяет четыре разных параметра из двоичной информации, принятой из цифрового входного канала, а именно индекс k, коэффициент усиления g, параметры краткосрочного прогноза КСП и параметры долгосрочного прогноза ДСП. На основании этих четырех параметров синтезируется текущий L-мерный вектор S, как поясняется ниже.
Устройство декодирования речи, показанное на фиг. 2, содержит динамический справочник кодов 208, состоящий из генератора 201 алгебраических кодов и адаптивного предварительного фильтра 202, усилителя 206, сумматора 207, устройства 203 долгосрочного прогнозирования и синтезирующего фильтра 204.
На первом этапе алгебраический генератор кодов 201 формирует кодовый вектор Ak в ответ на индекс k.
На втором этапе кодовый вектор Ak обрабатывается адаптивным предварительным фильтром 202, на который подаются параметры краткосрочного прогноза КСП и/или параметры долгосрочного прогноза ДСП, для получения выходного вектора обновления Ck. Назначение адаптивного предварительного фильтра 202 заключается в динамическом управлении частотным содержанием выходного вектора обновления Ck для улучшения качества речи, т.е. уменьшения слышимого искажения, обусловленного частотами, раздражающими человеческое ухо. Типичные передаточные функции F(z) для адаптивного предварительного фильтра 202 приведены ниже
Figure 00000010

Fa(z) - это формантный предварительный фильтр, в котором 0 < Y1 < Y2 < 1 - константы. Этот предварительный фильтр улучшает формантные области и работает очень эффективно, особенно при скорости кодирования ниже 5 кбит/с.
Fb(z) - это предварительный фильтр основного тона, в котором T - изменяющаяся во времени задержка основного тона, а b0 - либо константа, либо величина, равная квантованному параметру долгосрочного прогноза основного тона из текущей или предыдущей групп данных. Fb(z) действует весьма эффективно для повышения частот гармоник основного тона на всех скоростях передачи. Поэтому F(z), как правило, включает в себя предварительный фильтр основного тона, иногда в сочетании с формантным предварительным фильтром, а именно:
F(z) = Fa(z)•Fb(z).
В соответствии со способом ЛПКВ, выходной дискретизированный речевой сигнал
Figure 00000011
получают путем проведения сначала масштабирования вектора обновления Ck из справочника кодов 208 с помощью коэффициента усиления g, обеспечиваемого посредством усилителя 206. Затем сумматор 207 складывает масштабированный сигнал gCk с выходным сигналом E (составляющей долгосрочного прогноза возбуждения сигнала синтезирующего фильтра 204) устройства 203 долгосрочного прогнозирования, на которое подаются параметры ДСП, включенного в контур обратной связи и имеющего передаточную функцию B(z), определяемую следующим образом:
B(z) = bz-T,
где b и T - это вышеуказанные коэффициент усиления и задержка основного тона, соответственно.
Устройство прогнозирования 203 - это фильтр, имеющий передаточную функцию, соответствующую последним принятым параметрам ДСП - b и T, для моделирования периодичности основного тона речи. Он вводит соответствующее усиление b и задержку T основного тока выборок. Составной сигнал E+gCk представляет собой возбуждение сигнала синтезирующего фильтра 204, который имеет передаточную функцию 1/A(z) (A(z)) определяется в нижеследующем описании). Предварительный фильтр 204 обеспечивает правильное формирование спектра в соответствии с последними принятыми параметрами КСП. Более конкретно, фильтр 204 моделирует резонансные частоты (форманты) речи. Выходной блок
Figure 00000012
это синтезированный дискретизированный речевой сигнал, который можно преобразовать в аналоговый сигнал путем надлежащей фильтрации для устранения эффектов наложения спектров, что хорошо известно в технике.
Существует много способов построения генератора 201 алгебраических кодов. Предпочтительный способ, раскрытый в вышеупомянутой заявке на патент США N 07/927528, заключается в использовании, по меньшей мере, одного кода перестановки N перемежающихся одиночных импульсов.
Эту идею можно проиллюстрировать с помощью простого генератора 201 алгебраических кодов. В этом примере L = 40 и множество 40-мерных кодовых векторов содержит только N = 5 импульсов ненулевой амплитуды Sp1, Sp2, Sp3, Sp4, Sp5. Здесь pi обозначает местоположение i-гo импульса в подгруппе данных (т.п. pi находится в диапазоне от 0 до L-1). Предположим, что импульс Sp1 ограничен восемью возможными позициями p1 следующим образом:
p1 = 0, 5, 10, 15, 20, 25, 30, 35 = 0+8m1, M1=0,1 ... 7.
В пределах этих восьми позиций, которые можно назвать "дорожкой" N 1, можно свободно осуществлять взаимные перестановки Sp1 и семи импульсов нулевой амплитуды. Это "код перестановки одиночных импульсов". Перемежение пяти таких "кодов перестановки одиночных импульсов" можно обеспечить путем ограничения также позиций остальных импульсов аналогичным образом (т.е. дорожки N 2, дорожки N 3, дорожки N 4, дорожки N 5).
p1 - 0, 5, 10, 15, 20, 25, 30, 35 - 0+8m1,
p2 = 1, 6, 11, 16, 21, 26, 31, 36 = 1+8m2,
p3 = 2, 7, 12, 17, 22, 27, 32, 37 - 2+8m3,
p4 = 3, 8, 13, 18, 23, 28, 33, 38 = 3+8m4,
p5 = 4, 9, 14, 19, 24, 29, 34, 39 = 4+8m5.
Отметим, что целые числа mi = 0, 1,..., 7 полностью определяют позицию pi каждого импульса Spi.
Таким образом, простой индекс позиции kp можно получить посредством прямого мультиплексирования Мi с помощью следующего соотношения:
kp = 4096m1 + 512m2 + 64m3 + 8m4 + m5.
Следует подчеркнуть, что с помощью вышеуказанных дорожек импульсов можно получить и другие справочники кодов.
Например, можно использовать только 4 импульса, где первые 3 импульса занимают позиции в первых трех дорожках, соответственно, тогда как четвертый импульс занимает либо четвертую, либо пятую дорожку, причем один бит указывает, какая дорожка занята. Такая конфигурация позволяет создать справочник кодов с позициями на 13 бит.
В предшествующем уровне техники предполагалось, что импульсы ненулевой амплитуды имеют фиксированную амплитуду для всех практических целей по причинам сложности поиска кодового вектора. В самом деле, если можно предположить, что импульс Spi имеет одну из q возможных амплитуд, в процессе поиска придется рассмотреть qN возможных комбинаций импульсов и амплитуд. Например, если допустить, что 5 импульсов из первого примера могут принимать одно из q = 4 возможных значений амплитуды, например, Spi = +1, -1, +2, -2, вместо фиксированной амплитуды, размер алгебраического кодового справочника увеличивается с 15 до 15+(5x2) бит = 25 бит, то есть поиск в тысячу раз более сложен.
В настоящем изобретении был обнаружен неожиданный результат, состоящий в том, что можно обеспечить высокую эффективность с помощью импульсов q, амплитуд без значительных затрат. Решение заключается в сведении поиска к некоторому ограниченному подмножеству кодовых векторов. Способ выбора кодовых векторов связан со входным речевым сигналом, как поясняется в нижеследующем описании.
Практическая выгода настоящего изобретения заключается в том, чтобы обеспечить увеличение объема динамического алгебраического справочника кодов 208, допуская наличие различных возможных амплитуд у отдельных импульсов без увеличения сложности поиска кодового вектора.
Принцип кодирования
Выбранный речевой сигнал S кодируют поблочно с помощью системы кодирования, изображенной на фиг. 1, которая состоит из 11 модулей, обозначенных позициями с 102 до 112. Функции и работа этих модулей оставлены неизменными относительно описания первичной заявки на патент США N 07/927528. Следовательно, хотя в нижеследующем описании и будут, по меньшей мере кратко, пояснены функции и работа каждого модуля, оно будет сконцентрировано на предмете, который является новым относительно описания первичной заявки на патент США N 07/927528.
Для каждого блока из L выборок речевого сигнала множество параметров кодирования методом линейного предсказания (КМЛП), называемых параметрами краткосрочного прогноза (КСП), получают согласно известному способу посредством анализатора 102 спектра КМЛП. Более конкретно, анализатор 102 моделирует спектральные характеристики каждого блока S из L выборок.
Входной блок S из L выборок обрабатывается отбеливающим фильтром 103, имеющим следующую передаточную функцию, основанную на текущих величинах параметров КСП:
Figure 00000013

где а0 = 1, a(z) - переменная так называемого z - преобразования. Как показано на фиг. 1, отбеливающий фильтр 103 формирует остаточный вектор R.
Для вычисления и квантования параметров ДСП, а именно - задержки T основного тона и коэффициента усиления g основного тона, используется выделить 104 основного тона. Исходное состояние выделителя 104 также задают равным величине сигнала СФ из выделителя 110 исходного состояния. Подробная процедура вычисления и квантования параметров ДСП описана в первичной заявке на патент США N 07/927528 и хорошо известна специалистам в данной области техники и дополнительно рассматриваться не будет.
Чтобы рассчитать характеристику откликов фильтра ХОФ, предназначенную для использования на последующих этапах, на характеризатор 105 откликов фильтра (фиг. 1) подают параметры КСП и ДСП. Информация ХОФ состоит из следующих трех составляющих, где n = 1, 2, ... L.
f(n): отклик F(z).
Отметим, что F(z) обычно включает в себя предварительный фильтр основного тона.
h(n): отклик 1/A(zy-1) на f(n),
где y - коэффициент восприятия. В более общем виде, h(n) - это импульсный отклик F(z)W(z)/A(z), являющегося каскадом из предварительного фильтра F(z), фильтра W(z) перцептуального взвешивания и синтезирующего фильтра 1/A(z). Отметим, что F(z) и 1/A(z) - это те же фильтры, что и используемые в устройстве декодирования, изображенном на фиг.2.
U(i,j): автокорреляция h(n) согласно следующему выражению,
Figure 00000014

На устройство 106 долгосрочного прогнозирования подается прошлый сигнал возбуждения (т.е. E+gCk предыдущей подгруппы данных) для формирования новой составляющей E с использованием надлежащей задержки T и коэффициента усиления b основного тона.
Исходное состояние фильтра восприятия 107 устанавливают в соответствии с величиной СФ, подаваемой из выделителя 110 исходного состояния. Остаточный вектор R'=R-E с удаленным основным тоном, вычисленный устройством вычитания 121 (фиг. 1), затем подается на перцептуальный фильтр 107 для получения на выходе последнего фильтра целевого вектора X. Как показано на фиг. 1, параметры КСП подаются на фильтр 107, чтобы изменить его передаточную функцию в связи с этими параметрами. В основном, X=R'-P, где P представляет собой вклад долгосрочного прогноза (ДСП), включая последствие от прошлых возбуждений. Теперь можно установить критерий среднеквадратичной ошибки (СКО), который применим к Δ, в виде следующих матричных записей:
Figure 00000015

где H - матрица меньших треугольников Теплица LxL, образованная из отклика h(n) следующим образом. Элемент h(0) занимает диагональ матрицы, a h(1), h(2),... h(L-1) занимают соответствующие меньшие диагонали.
Этап обратной фильтрации осуществляется фильтром 108, показанным на фиг. 1. Установка на ноль производной вышеуказанного равенства по коэффициенту усиления g приводит к оптимальному коэффициенту усиления следующим образом:
Figure 00000016

При этом значении g минимизация принимает вид:
Figure 00000017

Задача состоит в том, чтобы найти конкретный индекс k, при котором достигается минимизация. Отметим, что поскольку
Figure 00000018
- фиксированная величина, тот же самый индекс можно найти путем минимизации следующей величины:
Figure 00000019

где D = (XH), а
Figure 00000020

В обратном фильтре 108 вычисляется обратно фильтрованный целевой вектор D= (XH). Термин "обратная фильтрация" для этой операции вытекает из интерпретации (XH) как фильтрации обращенного во времени X.
К устройству, показанному на фиг.1 вышеупомянутой первичной заявки на патент США N 07/927528, дополнительно введен только селектор амплитуды 112. Функция селектора амплитуды 112 заключается в ограничении кодовых векторов Ak, поиск которых осуществляется оптимизирующим устройством управления 109, наиболее перспективными кодовыми векторами Ak, чтобы тем самым уменьшить сложность поиска кодовых векторов. Как указано в вышеизложенном описании, каждый кодовый вектор Ak является сигналом комбинации амплитуд и позиций импульсов, определяющим L различных позиций p и содержащим как импульсы нулевой амплитуды, так и импульсы ненулевой амплитуды, присвоенные соответствующим позициям p = 1, 2,... L комбинации, причем каждый импульс ненулевой амплитуды предполагает наличие, по меньшей мере, одной из q различных возможных амплитуд.
В соответствии с фиг.3a, 3b и 3c, назначение селектора амплитуды 112 заключается в том, чтобы предварительно установить функциональную зависимость Sp между позициями p сигнала кодового вектора и q возможными значениями амплитуд импульсов. Предварительно установленная функциональная зависимость Sp определяется в связи с речевым сигналом перед поиском в справочнике кодов. Более конкретно, предварительное установление этой функциональной зависимости заключается в предварительном присвоении, в связи с речевым сигналом, по меньшей мере, одной из q возможных амплитуд каждой возможной позиции p сигнала (этап 301 на фиг. 3a).
Чтобы предварительно присвоить одну из q амплитуд каждой позиции p сигнала, вычисляют вектор B оценки амплитуды по обратно отфильтрованному целевому вектору D и остаточному вектору R' с удаленным основным тоном. Более конкретно, вектор В оценки амплитуды вычисляют путем сложения (подэтап 301-1 на фиг.3b) обратно отфильтрованного целевого вектора B в нормированном виде
Figure 00000021

и остаточного вектора R' с удаленным основным тоном в нормированном виде
Figure 00000022

чтобы таким образом получить вектор B оценки амплитуды в виде:
Figure 00000023

где β - фиксированная константа, имеющая типичное значение 1/2 (значение β выбирают между 0 и 1, в зависимости от процентной доли импульсов ненулевой амплитуды, используемых в алгебраическом коде).
Для каждой позиции q сигнала амплитуду Sp, предварительно присвоенную этой позиции p, получают путем квантования соответствующей оценки Bp амплитуды вектора B. Более конкретно, для каждой позиции p сигнала оценку Bp нормированной максимальным значением амплитуды вектора B квантуют (подшаг 301-2 на фиг.3b) с помощью следующего выражения:
Figure 00000024

где Q(.) - функция квантования, а
Figure 00000025

коэффициент нормировки, представляющий максимальную амплитуду импульсов ненулевой амплитуды.
В важном специальном случае, когда
q= 2, то есть можно предполагать наличие только двух значений амплитуд импульсов (т.е. Spi = ±1), и
плотность N/L импульсов ненулевой амплитуды меньше или равна 15%,
значение β может быть равным нулю, тогда вектор B оценки амплитуды просто уменьшается до обратного отфильтрованного целевого вектора D и, следовательно, Sp = sign(Dp).
Назначение оптимизирующего устройства управления 109 заключается в том, чтобы выбрать наилучший кодовый вектор Ak из алгебраического справочника кодов. Критерий выбора задают в виде соотношения, рассчитываемого для каждого кодового вектора Ak и максимизируемого по всем кодовым векторам (этап 303):
Figure 00000026

где D = (XH), a
Figure 00000027

Поскольку Ak - это алгебраический кодовый вектор, имеющий N импульсов ненулевой амплитуды соответствующих амплитуд Spi, числитель является квадратом величины
Figure 00000028

а знаменатель является энергетической составляющей, которую можно выразить как
Figure 00000029

где U(pi, pj) - корреляция, связанная с двумя импульсами единичной амплитуды, одним - в позиции pi, а другим - в позиции pj. Эту матрицу вычисляют в соответствии с вышеуказанным уравнением в характеризаторе 105 откликов фильтра и включают во множество параметров, определяемых как ХОФ на блок-схеме, показанной на фиг.1.
Быстрый способ вычисления этого знаменателя (этап 304) предусматривает N вложенных циклов, изображенных на фиг.4, в которых используется усеченная строчная запись s(i) и ss(i,j) вместо "Spi" "Spi Spj". Вычисление знаменателя αk2 является процедурой, требующей наибольших затрат времени. Вычисления, вносящие вклад в αk2, которые осуществляются в каждом цикле, показанном на фиг. 4, можно записать в отдельных строках от крайнего внешнего цикла до крайнего внутреннего цикла следующим образом:
Figure 00000030

где pi - позиция i-того импульса ненулевой амплитуды. Отметим, что наличие N вложенных циклов на фиг.4 дает возможность ограничить импульсы ненулевой амплитуды кодовых векторов Ak в соответствии с кодами перестановки N перемежающихся одиночных импульсов.
В настоящем изобретении сложность поиска значительно уменьшается путем ограничения подмножества отыскиваемых кодовых векторов Ak кодовыми векторами, для которых N импульсов ненулевой амплитуды соответствуют функциональной зависимости, предварительно установленной на этапе 301, показанном на фиг.3a. Предварительно установленная функциональная зависимость вступает в силу, когда каждый из N импульсов ненулевой амплитуды кодового вектора Ak имеет амплитуду, равную амплитуде, предварительно присвоенной позиции p импульса ненулевой амплитуды.
Упомянутое ограничение подмножества кодовых векторов осуществляют путем проведения сначала объединения предварительно установленной функциональной зависимости Sp с элементами матрицы U(i,j) (этап 302 на фиг.3a), а затем - использования N вложенных циклов, показанных на фиг.4, в предположении, что все импульсы s(i) являются фиксированными, положительными и имеют единичную амплитуду (этап 303). Таким образом, даже несмотря на то, что амплитуда ненулевых импульсов может принимать любое из q возможных значений в алгебраическом справочнике кодов, сложность поиска уменьшается до случая фиксированных амплитуд импульсов. Более конкретно, матрица U(i,j) элементом которой формируются характеризатором 105 откликов фильтра, объединяется с предварительно установленной функциональной зависимостью в соответствии со следующим соотношением (этап 302):
U'(i,j) =SiSjU(i,j),
где Si определяется функционированием селектора амплитуды 112, а именно, Si - это амплитуда, выбранная для отдельной позиции i, с учетом квантования соответствующей оценки амплитуды.
Для этой новой матрицы вычисление для каждого цикла быстрого алгоритма можно записать в отдельной строке, от крайнего внешнего до крайнего внутреннего никла, следующим образом:
Figure 00000031

где px - позиция x-го импульса ненулевой амплитуды сигнала и где U'(px, py-функция, зависящая от амплитуды
Figure 00000032
предварительно присвоенной позиции px из числа позиций p, и амплитуды
Figure 00000033
предварительно присвоенной позиции py из числа позиций p.
Чтобы дополнительно уменьшить сложность поиска, можно пропускать (см. фиг. 3c), в частности, но не исключительно, крайний внутренний цикл всякий раз, когда справедливо неравенство:
Figure 00000034

где Spn - амплитуда, предварительно присвоенная позиции pn, Dpn - pn - -ая составляющая целевого вектора D, а TD - пороговое значение, связанное с обратно отфильтрованным целевым вектором D.
Сигнал E+gCk возбуждения общего сигнала вычисляется сумматором 120 (фиг. 1) по сигналу gCk из устройства управления 109 и выходному сигналу E из устройства прогнозирования 106. Модуль 110 выделителя исходного состояния, состоящий из перцептуального фильтра с передаточной функцией 1/A(zy-1), изменяющейся в связи с параметрами КСП, вычитают из остаточного сигнала R сигнал E + gCk возбуждения сигнала просто для получения конечного состояния фильтра СФ с целью использования его в качестве исходного состояния в фильтре 107 и выделителе 104 основного тона.
Множество из четырех параметров k, g, ДСП и КСП преобразуется в надлежащий формат цифрового канала мультиплексором 111, завершающим процедуру кодирования блока S выборок речевого сигнала.
Хотя настоящее изобретение было описано выше со ссылками на предпочтительные конкретные варианты его осуществления, эти конкретные варианты, при желании, можно модифицировать в пределах объема прилагаемой формулы изобретения, без изменения сущности изобретения.

Claims (27)

1. Способ осуществления поиска в справочнике кодов, состоящем из множества комбинаций амплитуд и позиций импульсов для кодирования звукового сигнала, причем каждая комбинация амплитуд и позиций импульсов определяет L различных позиций и содержит как импульсы нулевой амплитуды, так и импульсы ненулевой амплитуды, присвоенные соответствующим позициям p = 1, 2, ..., L комбинации, а каждый импульс ненулевой амплитуды предполагает наличие одной из q возможных амплитуд, отличающийся тем, что предварительно выбирают из справочника кодов подмножество комбинаций амплитуд и позиций импульсов в связи со звуковым сигналом и осуществляют поиск только в этом подмножестве комбинаций амплитуд и позиций импульсов для кодирования звукового сигнала, за счет чего уменьшают сложность поиска, поскольку поиск осуществляют только в одном подмножестве комбинаций амплитуд и позиций импульсов из справочника кодов, причем этап предварительного выбора включает предварительное установление, в связи со звуковым сигналом, функциональной зависимости Sp, предварительно присваивающей позициям p = 1, 2, ... L действительные амплитуды из упомянутых q возможных амплитуд, а этап поиска включает поиск только тех комбинаций амплитуд и позиций импульсов из справочника кодов, имеющих импульсы ненулевой амплитуды, которые соответствуют предварительно установленной функциональной зависимости.
2. Способ по п.1, отличающийся тем, что этап предварительного установления функциональной зависимости включает предварительно присваивание, посредством функциональной зависимости Sp, одной из возможных амплитуд в качестве действительной амплитуды каждой позиции p, а предварительно установленная функциональная зависимость вступает в силу, котла каждый импульс ненулевой амплитуды комбинации амплитуд и позиций импульсов имеет амплитуду, равную амплитуде, предварительно присвоенной функциональной зависимостью Sp позиции p импульса ненулевой амплитуды.
3. Способ по п.2, отличающийся тем, что этап предварительного присвоения одной из q возможных амплитуд каждой позиции p заключается в том, что обрабатывают звуковой сигнал с получением обратно отфильтрованного целевого вектора D и остаточного сигнала R' с удаленным основным тоном, вычисляют вектор B оценки амплитуды по обратно отфильтрованному целевому вектору D и остаточному сигналу R' с удаленным основным тоном и для каждой из упомянутых изделий p квантуют оценку Bp амплитуды упомянутого вектора B с получением амплитуды, выбираемой для упомянутой позиции p.
4. Способ по п.3, отличающийся тем, что этап вычисления вектора B оценки амплитуды включает сложение обратно отфильтрованного вектора D в нормированном виде
Figure 00000035

с остаточным сигналом R' с удаленным основным тоном в нормированном виде
Figure 00000036

для получения вектора B оценки амплитуды в виде
Figure 00000037

где β - фиксированная константа.
5. Способ по п.4, отличающийся тем, что β является фиксированной константной, имеющей значение в диапазоне между 0 и 1.
6. Способ по п.3, отличающийся тем, что для каждой из упомянутых позиций p этап квантования включает квантование оценки Bp нормированной максимальным значением амплитуды вектора B с помощью следующего выражения:
Figure 00000038

где знаменатель
Figure 00000039

является коэффициентом нормировки, представляющим максимальную амплитуду импульсов ненулевой амплитуды.
7. Способ по п.1, отличающийся тем, что каждая из упомянутых комбинаций импульсов содержит число N импульсов ненулевой амплитуды, причем упомянутый способ дополнительно включает ограничение позиций p импульсов ненулевой амплитуды в соответствии, по меньшей мере, с одним кодом перестановки N перемежающихся одиночных импульсов.
8. Способ по п.3, отличающийся тем, что каждая из упомянутых комбинаций амплитуд и позиций импульсов содержит число N импульсов ненулевой амплитуды, а этап поиска включает максимизацию заданной дроби, знаменатель αk2 которой вычислен посредством N вложенных циклов в соответствии со следующим соотношением:
Figure 00000040

где вычисление для каждого цикла записано в отдельную строку от крайнего внешнего цикла до крайнего внутреннего цикла из N вложенных циклов;
Pn - позиция n-го импульса ненулевой амплитуды комбинации;
U'(Px, Py) - функция, зависящая от амплитуды Spx, предварительно присвоенной позиции Px из числа позиций p, и амплитуды Spy, предварительно присвоенной позиции Py из числа позиций p.
9. Способ по п.8, отличающийся тем, что этап максимизации упомянутой заданной дроби включает пропуск, по меньшей мере, крайнего внутреннего цикла из N вложенных циклов всякий раз, когда справедливо следующее неравенство:
Figure 00000041

где Spn - амплитуда, предварительно присвоенная позиции Pn;
Dpn - Pn -я составляющая целевого вектора D;
TD - пороговое значение, соответствующее обратно отфильтрованному целевому вектору D.
10. Устройство для осуществления поиска в справочнике кодов, состоящем из множества комбинаций амплитуд и позиций импульсов, для кодирования звукового сигнала, причем каждая комбинация амплитуд и позиций импульсов определяет L различных позиций и содержит как импульсы нулевой амплитуды, так и импульсы ненулевой амплитуды, присвоенные соответствующим позициям p = 1, 2, ..., L комбинации, а каждый импульс ненулевой амплитуды предполагает наличие одной из возможных амплитуд, содержащее средство предварительного выбора из упомянутого справочника кодов подмножества комбинаций амплитуд и позиций импульсов в связи со звуковым сигналом и средство поиска только в упомянутом подмножестве комбинаций амплитуд и позиций импульсов для кодирования звукового сигнала, для уменьшения сложности поиска за счет осуществления поиска только в одном подмножестве комбинаций амплитуд и позиций импульсов из справочника кодов, при этом средство предварительного выбора содержит средство предварительного установления, в связи со звуковым сигналом, функциональной зависимости Sp для предварительного присвоения позициям p = 1, 2, ..., L действительных амплитуд из упомянутых q возможных амплитуд, а средство поиска содержит средство ограничения поиска теми комбинациями амплитуд и позиций импульсов из упомянутого справочника кодов, имеющими импульсы ненулевой амплитуды, которые соответствуют предварительно установленной функциональной зависимости.
11. Устройство по п.10, отличающееся тем, что средство предварительного установления функциональной зависимости содержит средство предварительного присвоения, посредством функциональной зависимости Sp, одной из q возможных амплитуд в качестве действительной амплитуды каждой позиции p, а предварительно установленная функциональная зависимость вступает в силу, когда каждый импульс ненулевой амплитуды комбинации амплитуд и позиций импульсов имеет амплитуду, равную амплитуде, предварительно присвоенной функциональной зависимостью Sp позиции p импульса ненулевой амплитуды.
12. Устройство по п.11, отличающееся тем, что средство предварительного присвоения одной из q возможных амплитуд каждой позиции содержит средство обработки звукового сигнала с получением обратно отфильтрованного целевого вектора D и остаточного сигнала R' с удаленным основным тоном, средство вычисления вектора B оценки амплитуды по обратно отфильтрованному целевому вектору D и остаточному сигналу R' с удаленным основным тоном и средство квантования, для каждой из упомянутых позиций p, оценки Bp амплитуды упомянутого вектора B с получением амплитуды, выбираемой для упомянутой позиции p.
13. Устройство по п.12, отличающееся тем, что упомянутое средство вычисления вектора B оценки амплитуды содержит средство сложения обратно отфильтрованного целевого вектора D в нормированном виде
Figure 00000042

с остаточным сигналом R' с удаленным основным тоном в нормированном виде
Figure 00000043

для получения вектора B оценки амплитуды в виде
Figure 00000044

где β - фиксированная константа.
14. Устройство по п.13, отличающееся тем, что β является фиксированной константой, имеющей значение в диапазоне между 0 и 1.
15. Устройство по п. 12, отличающееся тем, что упомянутое средство квантования содержит средство квантования, для каждой из упомянутых позиций p, оценки Bp, нормированной максимальными значениями амплитуды векторов B с помощью следующего выражения:
Figure 00000045

где знаменатель
Figure 00000046

является коэффициентом нормировки, представляющим максимальную амплитуду импульсов ненулевой амплитуды.
16. Устройство по п. 10, отличающееся тем, что каждая из упомянутых комбинаций амплитуд и позиций импульсов содержит число N импульсов ненулевой амплитуды, при этом упомянутое устройство дополнительно содержит средство ограничения позиций p импульсов ненулевой амплитуды в соответствии, по меньшей мере, с одним кодом перестановки N перемежающихся одиночных импульсов.
17. Устройство по п. 12, отличающееся тем, что каждая из упомянутых комбинаций амплитуд и позиций импульсов содержит число N импульсов ненулевой амплитуды, причем средство поиска содержит средство максимизации заданной дроби, имеющей знаменатель αk2, и средство вычисления упомянутого знаменателя αk2 посредством N вложенных циклов в соответствии со следующим соотношением:
Figure 00000047

где вычисление в каждом цикле записано в отдельную строку от крайнего внешнего цикла до крайнего внутреннего цикла из N вложенных циклов, где Pp - позиция n-го импульса ненулевой амплитуды комбинации и где U'(Px, Py) - функция, зависящая от амплитуды SPx, предварительно присвоенной позиции Px из числа позиций p, и амплитуды SPy, предварительно присвоенной позиции Py из числа позиций p.
18. Устройство по п.17, отличающееся тем, что упомянутое средство вычисления знаменателя αk2 содержит средство пропуска, по меньшей мере, крайнего внутреннего цикла из N вложенных циклов всякий раз, когда справедливо следующее неравенство:
Figure 00000048

где SPn - амплитуда, предварительно присвоенная позиция Pn;
Dpn - Pn-ая составляющая целевого вектора D;
TD - пороговое значение, относящееся к обратно отфильтрованному целевому вектору D.
19. Система сотовой связи для обслуживания большой территориальной зоны, разделенной на множество ячеек, содержащая мобильные приемопередающие блоки, сотовые базовые станции, соответственно находящиеся в упомянутых ячейках, средства управления связью между сотовыми базовыми станциями, подсистему двусторонней радиосвязи между каждым мобильным блоком, находящимся в одной из ячеек, и сотовой базовой станцией упомянутой ячейки, содержащую и в мобильном блоке, и в сотовой базовой станции передатчик, включающий в себя средство кодированного речевого сигнала и средство передачи кодированного речевого сигнала, и приемник, включающий в себя средство приема переданного кодированного речевого сигнала и средство декодирования принятого кодированного речевого сигнала, отличающаяся тем, что средство кодирования речевого сигнала содержит устройство для осуществления поиска в справочнике кодов, состоящее из множества комбинаций амплитуд и позиций импульсов для кодирования речевого сигнала, причем каждая комбинация амплитуд и позиций импульсов определяет L различных позиций и содержит как импульсы нулевой амплитуды, так и импульсы ненулевой амплитуды, присвоенные соответствующим позициям p = 1, 2, ..., L комбинации, а каждый импульс ненулевой амплитуды предполагает наличие одной из q возможных амплитуд, при этом устройство для осуществления поиска содержит средство предварительного выбора из справочника кодов некоторого подмножества комбинаций амплитуд и позиций импульсов в связи с речевым сигналом и средства поиска только в упомянутом подмножестве комбинаций амплитуд и позиций импульсов ввиду кодирования речевого сигнала для уменьшения сложности поиска за счет осуществления поиска только в одном подмножестве комбинаций амплитуд и позиций в справочнике кодов, при этом средство предварительного выбора содержит средство предварительного установления, в связи со звуковым сигналом, функциональной зависимости Sp, предварительно присваивающей позициям p = 1, 2, ..., L действительные амплитуды из упомянутых q возможных амплитуд, и при этом средство поиска содержит средство ограничения поиска теми комбинациями амплитуд и позиций импульсов из справочника кодов, имеющих импульсы ненулевой амплитуды, которые соответствуют предварительно установленной функции.
20. Система по п. 19, отличающаяся тем, что средство предварительного установления функциональной зависимости содержит средство предварительного присвоения, посредством функциональной зависимости Sp, одной из q возможных амплитуд в качестве правильной амплитуды каждой позиции p, а предварительно установленная функциональная зависимость вступает в силу, когда каждый импульс ненулевой амплитуды комбинации амплитуд и позиций импульсов имеет амплитуду, равную амплитуде, предварительно присвоенной функциональной зависимостью Sp позиции p импульса ненулевой амплитуды.
21. Система по п. 20, отличающаяся тем, что средство предварительного присвоения одной из q возможных амплитуд каждой позиции p содержит средство обработки речевого сигнала с получением обратного отфильтрованного целевого вектора D и остаточного сигнала R' с удаленным основным тоном, средство вычисления вектора B оценки амплитуды по обратно отфильтрованному целевому вектору D и остаточному сигналу R' с удаленным основным тоном и средство квантования, для каждой из упомянутых позиций P, оценки Bp амплитуды упомянутого вектора B с получением амплитуды, выбираемой для упомянутой позиции p.
22. Система по п.21, отличающаяся тем, что упомянутое средство вычисления вектора B оценки амплитуды содержит средство сложения обратно отфильтрованного целевого вектора D в нормированном виде
Figure 00000049

с остаточным сигналом R' с удаленным основным тоном в нормированном виде
Figure 00000050

для получения вектора B оценки амплитуды в виде
Figure 00000051

где β - фиксированная константа.
23. Система по п. 22, отличающаяся тем, что β является фиксированной константой, имеющей значение в диапазоне между 0 и 1.
24. Система по п.23, отличающаяся тем, что упомянутое средство квантования содержит средство квантования, для каждой из упомянутых позиций p, оценки Bp, нормированной максимальным значением амплитуды вектора B с помощью следующего выражения
Figure 00000052

где знаменатель
Figure 00000053

является коэффициентом нормировки. представляющим максимальную амплитуду импульсов ненулевой амплитуды.
25. Система по п.19, отличающаяся тем, что каждая из упомянутых комбинаций амплитуд и позиций импульсов содержит число N импульсов ненулевой амплитуды, а упомянутое устройство дополнительно содержит средство ограничения позиций p импульсов ненулевой амплитуды в соответствии, по меньшей мере, с одним из кодов перестановки N перемежающихся одиночных импульсов.
26. Система по п.22, отличающаяся тем, что каждая из упомянутых комбинаций амплитуд и позиций импульсов содержит число N импульсов ненулевой амплитуды, при этом средство поиска содержит средство максимизации заданной дроби, имеющей знаменатель αk2, и средство вычисления упомянутого знаменателя αk2 посредством N вложенных циклов в соответствии со следующим соотношением:
Figure 00000054

где вычисление в каждом цикле записано в отдельную строку от крайнего внешнего цикла до крайнего внутреннего цикла из N вложенных циклов, где Pn - позиция n-го импульса ненулевой амплитуды комбинации, и где U'(Px, Py) - функция, зависящая от амплитуды Spx, предварительно присвоенной позиции Px из числа позиций p, и амплитуды Spy, предварительно присвоенной позиции Py из числа позиций p.
27.Система по п.26, отличающаяся тем, что упомянутое средство вычисления знаменателя αk2 содержит средство пропуска, по меньшей мере, крайнего внутреннего цикла из N вложенных циклов всякий раз, когда справедливо следующее неравенство:
Figure 00000055

где Spn - амплитуда, предварительно присвоенная позиция Pn;
DPn - Pn-ая составляющая целевого вектора D;
TD - пороговое значение, относящееся к обратно отфильтрованному целевому вектору D.
Приоритет по пунктам:
06.02.95 - по п.1, 10;
28.07.95 - по п.19.
RU97114804A 1995-02-06 1996-02-02 Способ и устройство осуществления поиска в справочнике кодов для кодирования звукового сигнала и система сотовой связи RU2142166C1 (ru)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US38396895A 1995-02-06 1995-02-06
US08/383,968 1995-02-06
US08/508,801 1995-07-28
US08/508,801 US5754976A (en) 1990-02-23 1995-07-28 Algebraic codebook with signal-selected pulse amplitude/position combinations for fast coding of speech
PCT/CA1996/000069 WO1996024925A1 (en) 1995-02-06 1996-02-02 Algebraic codebook with signal-selected pulse amplitudes for fast coding of speech

Publications (2)

Publication Number Publication Date
RU97114804A RU97114804A (ru) 1999-08-20
RU2142166C1 true RU2142166C1 (ru) 1999-11-27

Family

ID=27010408

Family Applications (1)

Application Number Title Priority Date Filing Date
RU97114804A RU2142166C1 (ru) 1995-02-06 1996-02-02 Способ и устройство осуществления поиска в справочнике кодов для кодирования звукового сигнала и система сотовой связи

Country Status (26)

Country Link
US (1) US5754976A (ru)
EP (2) EP1225568B1 (ru)
JP (2) JP3430175B2 (ru)
KR (2) KR100388751B1 (ru)
CN (2) CN1198262C (ru)
AR (1) AR000871A1 (ru)
AT (2) ATE230888T1 (ru)
AU (1) AU708392C (ru)
BR (1) BR9607026A (ru)
CA (1) CA2210765C (ru)
DE (1) DE19604273C5 (ru)
DK (2) DK0808496T3 (ru)
ES (1) ES2112807B1 (ru)
FI (2) FI117994B (ru)
FR (1) FR2730336B1 (ru)
GB (1) GB2297671B (ru)
HK (2) HK1002492A1 (ru)
IN (1) IN187453B (ru)
IT (1) IT1305724B1 (ru)
MX (1) MX9705997A (ru)
MY (2) MY130529A (ru)
NO (1) NO318595B1 (ru)
PT (1) PT1225568E (ru)
RU (1) RU2142166C1 (ru)
SE (1) SE520553C2 (ru)
WO (1) WO1996024925A1 (ru)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2458412C1 (ru) * 2006-03-10 2012-08-10 Панасоник Корпорэйшн Устройство поиска фиксированных таблиц кодирования и способ поиска фиксированных таблиц кодирования
RU2471288C2 (ru) * 2008-03-13 2012-12-27 Моторола Мобилити, Инк. Устройство и способ комбинаторного кодирования малой сложности сигналов

Families Citing this family (61)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SE508788C2 (sv) * 1995-04-12 1998-11-02 Ericsson Telefon Ab L M Förfarande att bestämma positionerna inom en talram för excitationspulser
US5822724A (en) * 1995-06-14 1998-10-13 Nahumi; Dror Optimized pulse location in codebook searching techniques for speech processing
US6393391B1 (en) * 1998-04-15 2002-05-21 Nec Corporation Speech coder for high quality at low bit rates
TW317051B (ru) * 1996-02-15 1997-10-01 Philips Electronics Nv
JP3523649B2 (ja) * 1997-03-12 2004-04-26 三菱電機株式会社 音声符号化装置、音声復号装置及び音声符号化復号装置、及び、音声符号化方法、音声復号方法及び音声符号化復号方法
FI114248B (fi) * 1997-03-14 2004-09-15 Nokia Corp Menetelmä ja laite audiokoodaukseen ja audiodekoodaukseen
CN1494055A (zh) * 1997-12-24 2004-05-05 ������������ʽ���� 声音编码方法和声音译码方法以及声音编码装置和声音译码装置
US6385576B2 (en) * 1997-12-24 2002-05-07 Kabushiki Kaisha Toshiba Speech encoding/decoding method using reduced subframe pulse positions having density related to pitch
US5963897A (en) * 1998-02-27 1999-10-05 Lernout & Hauspie Speech Products N.V. Apparatus and method for hybrid excited linear prediction speech encoding
FI113571B (fi) 1998-03-09 2004-05-14 Nokia Corp Puheenkoodaus
JP3180762B2 (ja) * 1998-05-11 2001-06-25 日本電気株式会社 音声符号化装置及び音声復号化装置
US6714907B2 (en) * 1998-08-24 2004-03-30 Mindspeed Technologies, Inc. Codebook structure and search for speech coding
WO2000016501A1 (en) * 1998-09-11 2000-03-23 Motorola Inc. Method and apparatus for coding an information signal
SE521225C2 (sv) * 1998-09-16 2003-10-14 Ericsson Telefon Ab L M Förfarande och anordning för CELP-kodning/avkodning
CA2252170A1 (en) 1998-10-27 2000-04-27 Bruno Bessette A method and device for high quality coding of wideband speech and audio signals
JP4173940B2 (ja) * 1999-03-05 2008-10-29 松下電器産業株式会社 音声符号化装置及び音声符号化方法
US6295520B1 (en) 1999-03-15 2001-09-25 Tritech Microelectronics Ltd. Multi-pulse synthesis simplification in analysis-by-synthesis coders
JP2001075600A (ja) * 1999-09-07 2001-03-23 Mitsubishi Electric Corp 音声符号化装置および音声復号化装置
US7272553B1 (en) * 1999-09-08 2007-09-18 8X8, Inc. Varying pulse amplitude multi-pulse analysis speech processor and method
WO2001020595A1 (en) * 1999-09-14 2001-03-22 Fujitsu Limited Voice encoder/decoder
CA2290037A1 (en) 1999-11-18 2001-05-18 Voiceage Corporation Gain-smoothing amplifier device and method in codecs for wideband speech and audio signals
KR100576024B1 (ko) * 2000-04-12 2006-05-02 삼성전자주식회사 에이켈프 음성 압축기의 코드북 검색 장치 및 방법
US6728669B1 (en) * 2000-08-07 2004-04-27 Lucent Technologies Inc. Relative pulse position in celp vocoding
US7363219B2 (en) * 2000-09-22 2008-04-22 Texas Instruments Incorporated Hybrid speech coding and system
CA2327041A1 (en) * 2000-11-22 2002-05-22 Voiceage Corporation A method for indexing pulse positions and signs in algebraic codebooks for efficient coding of wideband signals
KR100438175B1 (ko) * 2001-10-23 2004-07-01 엘지전자 주식회사 코드북 검색방법
US7236928B2 (en) * 2001-12-19 2007-06-26 Ntt Docomo, Inc. Joint optimization of speech excitation and filter parameters
US7206740B2 (en) * 2002-01-04 2007-04-17 Broadcom Corporation Efficient excitation quantization in noise feedback coding with general noise shaping
JP2003255976A (ja) * 2002-02-28 2003-09-10 Nec Corp 音声素片データベースの圧縮伸張を行なう音声合成装置及び方法
CA2388439A1 (en) * 2002-05-31 2003-11-30 Voiceage Corporation A method and device for efficient frame erasure concealment in linear predictive based speech codecs
CA2392640A1 (en) * 2002-07-05 2004-01-05 Voiceage Corporation A method and device for efficient in-based dim-and-burst signaling and half-rate max operation in variable bit-rate wideband speech coding for cdma wireless systems
US7054807B2 (en) * 2002-11-08 2006-05-30 Motorola, Inc. Optimizing encoder for efficiently determining analysis-by-synthesis codebook-related parameters
KR100503414B1 (ko) * 2002-11-14 2005-07-22 한국전자통신연구원 고정 코드북의 집중 검색 방법 및 장치
US7698132B2 (en) * 2002-12-17 2010-04-13 Qualcomm Incorporated Sub-sampled excitation waveform codebooks
US7249014B2 (en) * 2003-03-13 2007-07-24 Intel Corporation Apparatus, methods and articles incorporating a fast algebraic codebook search technique
WO2004090870A1 (ja) * 2003-04-04 2004-10-21 Kabushiki Kaisha Toshiba 広帯域音声を符号化または復号化するための方法及び装置
EP1513137A1 (en) * 2003-08-22 2005-03-09 MicronasNIT LCC, Novi Sad Institute of Information Technologies Speech processing system and method with multi-pulse excitation
CN100416652C (zh) * 2005-10-31 2008-09-03 连展科技(天津)有限公司 增强的amr编码器快速固定码本搜索方法
JP5159318B2 (ja) * 2005-12-09 2013-03-06 パナソニック株式会社 固定符号帳探索装置および固定符号帳探索方法
US8255207B2 (en) * 2005-12-28 2012-08-28 Voiceage Corporation Method and device for efficient frame erasure concealment in speech codecs
US20080120098A1 (en) * 2006-11-21 2008-05-22 Nokia Corporation Complexity Adjustment for a Signal Encoder
US8688437B2 (en) 2006-12-26 2014-04-01 Huawei Technologies Co., Ltd. Packet loss concealment for speech coding
CN101286321B (zh) * 2006-12-26 2013-01-09 华为技术有限公司 双脉冲激励的线性测编码
EP2157573B1 (en) 2007-04-29 2014-11-26 Huawei Technologies Co., Ltd. An encoding and decoding method
CN100530357C (zh) * 2007-07-11 2009-08-19 华为技术有限公司 固定码书搜索方法及搜索器
US8566106B2 (en) * 2007-09-11 2013-10-22 Voiceage Corporation Method and device for fast algebraic codebook search in speech and audio coding
CN100578619C (zh) * 2007-11-05 2010-01-06 华为技术有限公司 编码方法和编码器
CN101903946B (zh) * 2007-12-21 2012-09-26 Nvoq股份有限公司 分布式听写/转录系统
DK2242045T3 (da) * 2009-04-16 2012-09-24 Univ Mons Talesyntese og kodningsfremgangsmåder
CN101931414B (zh) * 2009-06-19 2013-04-24 华为技术有限公司 脉冲编码方法及装置、脉冲解码方法及装置
US8280729B2 (en) * 2010-01-22 2012-10-02 Research In Motion Limited System and method for encoding and decoding pulse indices
CN102299760B (zh) 2010-06-24 2014-03-12 华为技术有限公司 脉冲编解码方法及脉冲编解码器
CN102623012B (zh) * 2011-01-26 2014-08-20 华为技术有限公司 矢量联合编解码方法及编解码器
US9767822B2 (en) 2011-02-07 2017-09-19 Qualcomm Incorporated Devices for encoding and decoding a watermarked signal
US8880404B2 (en) * 2011-02-07 2014-11-04 Qualcomm Incorporated Devices for adaptively encoding and decoding a watermarked signal
US9767823B2 (en) 2011-02-07 2017-09-19 Qualcomm Incorporated Devices for encoding and detecting a watermarked signal
US9070356B2 (en) 2012-04-04 2015-06-30 Google Technology Holdings LLC Method and apparatus for generating a candidate code-vector to code an informational signal
US9263053B2 (en) 2012-04-04 2016-02-16 Google Technology Holdings LLC Method and apparatus for generating a candidate code-vector to code an informational signal
CN103456309B (zh) * 2012-05-31 2016-04-20 展讯通信(上海)有限公司 语音编码器及其代数码表搜索方法和装置
US9728200B2 (en) * 2013-01-29 2017-08-08 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for adaptive formant sharpening in linear prediction coding
US20140334564A1 (en) * 2013-05-09 2014-11-13 Samsung Electronics Co., Ltd Method and system for providing low-complexity hybrid precoding in wireless communication systems

Family Cites Families (45)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4401855A (en) * 1980-11-28 1983-08-30 The Regents Of The University Of California Apparatus for the linear predictive coding of human speech
CA1164569A (en) * 1981-03-17 1984-03-27 Katsunobu Fushikida System for extraction of pole/zero parameter values
WO1983003917A1 (en) * 1982-04-29 1983-11-10 Massachusetts Institute Of Technology Voice encoder and synthesizer
US4625286A (en) * 1982-05-03 1986-11-25 Texas Instruments Incorporated Time encoding of LPC roots
US4520499A (en) * 1982-06-25 1985-05-28 Milton Bradley Company Combination speech synthesis and recognition apparatus
JPS5922165A (ja) * 1982-07-28 1984-02-04 Nippon Telegr & Teleph Corp <Ntt> アドレス制御回路
DE3276651D1 (en) * 1982-11-26 1987-07-30 Ibm Speech signal coding method and apparatus
US4764963A (en) * 1983-04-12 1988-08-16 American Telephone And Telegraph Company, At&T Bell Laboratories Speech pattern compression arrangement utilizing speech event identification
US4667340A (en) * 1983-04-13 1987-05-19 Texas Instruments Incorporated Voice messaging system with pitch-congruent baseband coding
US4669120A (en) * 1983-07-08 1987-05-26 Nec Corporation Low bit-rate speech coding with decision of a location of each exciting pulse of a train concurrently with optimum amplitudes of pulses
DE3335358A1 (de) * 1983-09-29 1985-04-11 Siemens AG, 1000 Berlin und 8000 München Verfahren zur bestimmung von sprachspektren fuer die automatische spracherkennung und sprachcodierung
US4799261A (en) * 1983-11-03 1989-01-17 Texas Instruments Incorporated Low data rate speech encoding employing syllable duration patterns
CA1236922A (en) * 1983-11-30 1988-05-17 Paul Mermelstein Method and apparatus for coding digital signals
CA1223365A (en) * 1984-02-02 1987-06-23 Shigeru Ono Method and apparatus for speech coding
US4724535A (en) * 1984-04-17 1988-02-09 Nec Corporation Low bit-rate pattern coding with recursive orthogonal decision of parameters
US4680797A (en) * 1984-06-26 1987-07-14 The United States Of America As Represented By The Secretary Of The Air Force Secure digital speech communication
US4742550A (en) * 1984-09-17 1988-05-03 Motorola, Inc. 4800 BPS interoperable relp system
CA1252568A (en) * 1984-12-24 1989-04-11 Kazunori Ozawa Low bit-rate pattern encoding and decoding capable of reducing an information transmission rate
US4858115A (en) * 1985-07-31 1989-08-15 Unisys Corporation Loop control mechanism for scientific processor
IT1184023B (it) * 1985-12-17 1987-10-22 Cselt Centro Studi Lab Telecom Procedimento e dispositivo per la codifica e decodifica del segnale vocale mediante analisi a sottobande e quantizzazione vettorariale con allocazione dinamica dei bit di codifica
US4720861A (en) * 1985-12-24 1988-01-19 Itt Defense Communications A Division Of Itt Corporation Digital speech coding circuit
US4771465A (en) * 1986-09-11 1988-09-13 American Telephone And Telegraph Company, At&T Bell Laboratories Digital speech sinusoidal vocoder with transmission of only subset of harmonics
US4797926A (en) * 1986-09-11 1989-01-10 American Telephone And Telegraph Company, At&T Bell Laboratories Digital speech vocoder
US4873723A (en) * 1986-09-18 1989-10-10 Nec Corporation Method and apparatus for multi-pulse speech coding
US4797925A (en) * 1986-09-26 1989-01-10 Bell Communications Research, Inc. Method for coding speech at low bit rates
IT1195350B (it) * 1986-10-21 1988-10-12 Cselt Centro Studi Lab Telecom Procedimento e dispositivo per la codifica e decodifica del segnale vocale mediante estrazione di para metri e tecniche di quantizzazione vettoriale
US4868867A (en) * 1987-04-06 1989-09-19 Voicecraft Inc. Vector excitation speech or audio coder for transmission or storage
CA1337217C (en) * 1987-08-28 1995-10-03 Daniel Kenneth Freeman Speech coding
US4815134A (en) * 1987-09-08 1989-03-21 Texas Instruments Incorporated Very low rate speech encoder and decoder
IL84902A (en) * 1987-12-21 1991-12-15 D S P Group Israel Ltd Digital autocorrelation system for detecting speech in noisy audio signal
US4817157A (en) * 1988-01-07 1989-03-28 Motorola, Inc. Digital speech coder having improved vector excitation source
CA1321646C (en) * 1988-05-20 1993-08-24 Eisuke Hanada Coded speech communication system having code books for synthesizing small-amplitude components
US5008965A (en) * 1988-07-11 1991-04-23 Kinetic Concepts, Inc. Fluidized bead bed
IT1232084B (it) * 1989-05-03 1992-01-23 Cselt Centro Studi Lab Telecom Sistema di codifica per segnali audio a banda allargata
SE463691B (sv) * 1989-05-11 1991-01-07 Ericsson Telefon Ab L M Foerfarande att utplacera excitationspulser foer en lineaerprediktiv kodare (lpc) som arbetar enligt multipulsprincipen
US5097508A (en) * 1989-08-31 1992-03-17 Codex Corporation Digital speech coder having improved long term lag parameter determination
US5307441A (en) * 1989-11-29 1994-04-26 Comsat Corporation Wear-toll quality 4.8 kbps speech codec
CA2010830C (en) * 1990-02-23 1996-06-25 Jean-Pierre Adoul Dynamic codebook for efficient speech coding based on algebraic codes
US5144671A (en) * 1990-03-15 1992-09-01 Gte Laboratories Incorporated Method for reducing the search complexity in analysis-by-synthesis coding
US5293449A (en) * 1990-11-23 1994-03-08 Comsat Corporation Analysis-by-synthesis 2,4 kbps linear predictive speech codec
US5396576A (en) * 1991-05-22 1995-03-07 Nippon Telegraph And Telephone Corporation Speech coding and decoding methods using adaptive and random code books
US5233660A (en) * 1991-09-10 1993-08-03 At&T Bell Laboratories Method and apparatus for low-delay celp speech coding and decoding
JP3089769B2 (ja) * 1991-12-03 2000-09-18 日本電気株式会社 音声符号化装置
US5457783A (en) * 1992-08-07 1995-10-10 Pacific Communication Sciences, Inc. Adaptive speech coder having code excited linear prediction
DE4315313C2 (de) * 1993-05-07 2001-11-08 Bosch Gmbh Robert Vektorcodierverfahren insbesondere für Sprachsignale

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2458412C1 (ru) * 2006-03-10 2012-08-10 Панасоник Корпорэйшн Устройство поиска фиксированных таблиц кодирования и способ поиска фиксированных таблиц кодирования
RU2471288C2 (ru) * 2008-03-13 2012-12-27 Моторола Мобилити, Инк. Устройство и способ комбинаторного кодирования малой сложности сигналов

Also Published As

Publication number Publication date
MY119038A (en) 2005-03-31
CN1181150A (zh) 1998-05-06
EP0808496A1 (en) 1997-11-26
PT1225568E (pt) 2004-01-30
IT1305724B1 (it) 2001-05-15
HK1002492A1 (en) 1998-08-28
SE9600437D0 (sv) 1996-02-06
KR19980701975A (ko) 1998-06-25
US5754976A (en) 1998-05-19
ATE248423T1 (de) 2003-09-15
GB9602391D0 (en) 1996-04-03
DE19604273C2 (de) 2000-06-29
NO318595B1 (no) 2005-04-18
FI20020320A (fi) 2002-02-18
NO973472L (no) 1997-10-06
FR2730336A1 (fr) 1996-08-09
MX9705997A (es) 1997-11-29
EP1225568B1 (en) 2003-08-27
GB2297671B (en) 2000-01-19
FI118396B (fi) 2007-10-31
FI973241A (fi) 1997-10-06
WO1996024925A1 (en) 1996-08-15
NO973472D0 (no) 1997-07-28
CA2210765C (en) 2001-08-21
AR000871A1 (es) 1997-08-06
JP3430175B2 (ja) 2003-07-28
HK1055007A1 (en) 2003-12-19
GB2297671A (en) 1996-08-07
DE19604273C5 (de) 2004-05-27
EP0808496B1 (en) 2003-01-08
ES2112807B1 (es) 1999-04-16
KR100393910B1 (ko) 2003-08-02
ITUD960012A0 (it) 1996-02-02
AU4479696A (en) 1996-08-27
SE520553C2 (sv) 2003-07-22
DK0808496T3 (da) 2003-04-22
AU708392B2 (en) 1999-08-05
JP4187556B2 (ja) 2008-11-26
FI117994B (fi) 2007-05-15
MY130529A (en) 2007-06-29
CA2210765A1 (en) 1996-08-15
JP2003308100A (ja) 2003-10-31
CN1198262C (zh) 2005-04-20
IN187453B (ru) 2002-04-27
FR2730336B1 (fr) 1997-08-14
KR100388751B1 (ko) 2003-11-28
EP1225568A1 (en) 2002-07-24
ITUD960012A1 (it) 1997-08-02
ES2112807A1 (es) 1998-04-01
DE19604273A1 (de) 1996-08-29
CN1410970A (zh) 2003-04-16
ATE230888T1 (de) 2003-01-15
BR9607026A (pt) 1997-11-04
JPH10513571A (ja) 1998-12-22
DK1225568T3 (da) 2003-11-24
AU708392C (en) 2003-01-09
FI973241A0 (fi) 1997-08-06
CN1220178C (zh) 2005-09-21

Similar Documents

Publication Publication Date Title
RU2142166C1 (ru) Способ и устройство осуществления поиска в справочнике кодов для кодирования звукового сигнала и система сотовой связи
KR100299408B1 (ko) 음성의고속코딩을위한심도우선대수코드북검색
JP4064236B2 (ja) 広帯域信号コーディング用の代数コードブック中のパルス位置と符号の索引付け方法
KR100417635B1 (ko) 광대역 신호들 코딩에서 적응성 대역폭 피치 검색 방법 및디바이스
KR100310811B1 (ko) 정보 신호 코드화 방법 및 장치
KR19980080463A (ko) 코드여기 선형예측 음성코더내에서의 벡터 양자화 방법
Be’ery et al. An efficient variable-bit-rate low-delay CELP (VBR-LD-CELP) coder
CA2618002C (en) Algebraic codebook with signal-selected pulse amplitudes for fast coding of speech
CA2210765E (en) Algebraic codebook with signal-selected pulse amplitudes for fast coding of speech
Yoon et al. Fixed point implementation of the QCELP speech coder
KR950013373B1 (ko) 음성 메시지 공급 장치와 음성 메시지 생성 방법
SE524905C2 (sv) Algebraisk kodbok med signalvalda pulsamplituder för snabb kodning av tal
Tavathia et al. Low bit rate CELP using ternary excitation codebook
MXPA97005997A (en) Algebraic coding book with amplitude signal deimpulse selected for a rapidacodification of
Evans NEW INNOVATIONS IN MULTI-PULSE SPEECH CODING FOR BIT RATES BELOW 8kb/s
WO2000057400A1 (en) Method, devices and system for generating background noise in a telecommunications system
WO2000042601A1 (en) A method and device for designing and searching large stochastic codebooks in low bit rate speech encoders
NO322594B1 (no) Algebraisk kodebok med signalvalgte pulsamplituder for hurtig koding av tale