RU2009119491A - Способ и устройство кодирования кадров перехода в речевых сигналах - Google Patents

Способ и устройство кодирования кадров перехода в речевых сигналах Download PDF

Info

Publication number
RU2009119491A
RU2009119491A RU2009119491/08A RU2009119491A RU2009119491A RU 2009119491 A RU2009119491 A RU 2009119491A RU 2009119491/08 A RU2009119491/08 A RU 2009119491/08A RU 2009119491 A RU2009119491 A RU 2009119491A RU 2009119491 A RU2009119491 A RU 2009119491A
Authority
RU
Russia
Prior art keywords
codebook
transition
frame
transition mode
glottal
Prior art date
Application number
RU2009119491/08A
Other languages
English (en)
Other versions
RU2462769C2 (ru
Inventor
Вацлав ЭКСЛЕР (CA)
Вацлав ЭКСЛЕР
Милан ЕЛИНЕК (CA)
Милан ЕЛИНЕК
Редван САЛАМИ (CA)
Редван САЛАМИ
Original Assignee
Войсэйдж Корпорейшн (Ca)
Войсэйдж Корпорейшн
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=39324068&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=RU2009119491(A) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Войсэйдж Корпорейшн (Ca), Войсэйдж Корпорейшн filed Critical Войсэйдж Корпорейшн (Ca)
Publication of RU2009119491A publication Critical patent/RU2009119491A/ru
Application granted granted Critical
Publication of RU2462769C2 publication Critical patent/RU2462769C2/ru

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/09Long term prediction, i.e. removing periodical redundancies, e.g. by using adaptive codebook or pitch predictor

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

1. Устройство режима перехода для использования в кодеке звукового сигнала с предсказанием для создания возбуждения режима перехода, заменяющего возбуждение адаптивной кодовой книги в кадре перехода и/или кадре, следующем за переходом в звуковом сигнале, содержащее ! вход для приема индекса кодовой книги; и ! кодовую книгу режима перехода для генерирования набора кодовых векторов, независимых от прошлого возбуждения, причем кодовая книга режима перехода является реагирующей на индекс для генерирования, в кадре перехода и/или кадре, следующем за переходом, одного из кодовых векторов набора, соответствующего упомянутому возбуждению режима перехода. ! 2. Устройство режима перехода по п.1, в котором кодовая книга режима перехода содержит фиксированную кодовую книгу, независимую от прошлого возбуждения. ! 3. Устройство режима перехода по п.1, в котором кодовая книга режима перехода содержит кодовую книгу форм глоттальных импульсов. ! 4. Устройство режима перехода по п.1, в котором звуковой сигнал содержит речевой сигнал, и в котором кадр перехода выбирается из группы, состоящей из кадра, содержащего вокализованное вступление, и кадра, содержащего переход между двумя различными вокализованными звуками. ! 5. Устройство режима перехода по п.1, в котором кадр перехода и/или кадр, следующий за переходом, содержит кадр перехода, за которым следуют несколько кадров. ! 6. Устройство режима перехода по п.1, в котором кадр перехода и/или кадр, следующий за переходом, содержит по меньшей мере один кадр, следующий за переходом. ! 7. Устройство режима перехода по п.1, в котором каждый кадр перехода и/или кадр, следующий за переходом, сод

Claims (68)

1. Устройство режима перехода для использования в кодеке звукового сигнала с предсказанием для создания возбуждения режима перехода, заменяющего возбуждение адаптивной кодовой книги в кадре перехода и/или кадре, следующем за переходом в звуковом сигнале, содержащее
вход для приема индекса кодовой книги; и
кодовую книгу режима перехода для генерирования набора кодовых векторов, независимых от прошлого возбуждения, причем кодовая книга режима перехода является реагирующей на индекс для генерирования, в кадре перехода и/или кадре, следующем за переходом, одного из кодовых векторов набора, соответствующего упомянутому возбуждению режима перехода.
2. Устройство режима перехода по п.1, в котором кодовая книга режима перехода содержит фиксированную кодовую книгу, независимую от прошлого возбуждения.
3. Устройство режима перехода по п.1, в котором кодовая книга режима перехода содержит кодовую книгу форм глоттальных импульсов.
4. Устройство режима перехода по п.1, в котором звуковой сигнал содержит речевой сигнал, и в котором кадр перехода выбирается из группы, состоящей из кадра, содержащего вокализованное вступление, и кадра, содержащего переход между двумя различными вокализованными звуками.
5. Устройство режима перехода по п.1, в котором кадр перехода и/или кадр, следующий за переходом, содержит кадр перехода, за которым следуют несколько кадров.
6. Устройство режима перехода по п.1, в котором кадр перехода и/или кадр, следующий за переходом, содержит по меньшей мере один кадр, следующий за переходом.
7. Устройство режима перехода по п.1, в котором каждый кадр перехода и/или кадр, следующий за переходом, содержит множество подкадров, и в котором кодовая книга режима перехода используется в первой части подкадров, и кодовая книга с предсказанием кодека с предсказанием используется во второй части подкадров.
8. Устройство режима перехода по п.1, в котором кодовая книга содержит кодовую книгу глоттальных форм, содержащую кодовые векторы, сформированные из формы глоттального импульса, размещенной в заданном положении в кодовом векторе.
9. Устройство режима перехода по п.8, в котором кодовая книга глоттальных форм включает в себя предварительно определенное количество различных форм глоттальных импульсов, и в котором каждая форма глоттального импульса располагается во множестве различных положений в кодовом векторе, формируя множество различных кодовых векторов кодовой книги глоттальных форм.
10. Устройство режима перехода по п.8, в котором кодовая книга глоттальных форм содержит генератор кодовых векторов, содержащих только один ненулевой элемент, и формирующий фильтр для обработки кодовых векторов, содержащих только один ненулевой элемент, для создания кодовых векторов, представляющих формы глоттальных импульсов, расположенные по центру различных положений.
11. Устройство режима перехода по п.8, в котором импульсы глоттальной формы содержат первый и последний отсчеты, в котором усекается предварительно определенное количество первых и последних отсчетов.
12. Устройство кодера для генерирования возбуждения режима перехода, заменяющего возбуждение адаптивной кодовой книги в кадре перехода и/или кадре, следующем за переходом в звуковом сигнале, содержащее:
генератор целевого сигнала поиска по кодовой книге;
кодовую книгу режима перехода для генерирования набора кодовых векторов, независимых от прошлого возбуждения, причем каждый кодовый вектор упомянутого набора соответствует соответствующему возбуждению режима перехода;
устройство поиска кодовой книги режима перехода для нахождения кодового вектора упомянутого набора, соответствующего возбуждению режима перехода, оптимально соответствующему целевому сигналу поиска по кодовой книге.
13. Устройство кодера по п.12, в котором кодовая книга режима перехода содержит фиксированную кодовую книгу, независимую от прошлого возбуждения.
14. Устройство кодера по п.12, в котором кодовая книга режима перехода содержит кодовую книгу форм глоттальных импульсов.
15. Устройство кодера по п.14, в котором устройство поиска применяет заданный критерий к каждой форме глоттального импульса кодовой книги форм глоттальных импульсов и находит в качестве кодового вектора, оптимально соответствующего целевому сигналу поиска по адаптивной кодовой книге, кодовый вектор набора, соответствующий максимальному значению упомянутого критерия.
16. Устройство кодера по п.15, в котором устройство поиска идентифицирует найденный кодовый вектор посредством параметров режима перехода, выбранных из группы, состоящей из идентификации конфигурации режима перехода, формы глоттального импульса, положения центра формы глоттального импульса в найденном кодовом векторе, коэффициента усиления режима перехода, знака коэффициента усиления режима перехода и периода основного тона по закрытому циклу.
17. Устройство кодера по п.12, в котором звуковой сигнал содержит речевой сигнал, и в котором кадр перехода выбирается из группы, состоящей из кадра, содержащего вокализованное вступление, и кадра, содержащего переход между двумя различными вокализованными звуками.
18. Устройство кодера по п.12, в котором кадр перехода и/или кадр, следующий за переходом, содержит кадр перехода, за которым следует несколько кадров.
19. Устройство кодера по п.12, в котором кадр перехода и/или кадр, следующий за переходом, содержит по меньшей мере один кадр, следующий за переходом.
20. Устройство кодера по п.12, в котором каждый кадр перехода и/или кадр, следующий за переходом, содержит множество подкадров, и в котором устройство поиска выполняет поиск по кодовой книге режима перехода в первой части подкадров, и по кодовой книге с предсказанием устройства кодера во второй части подкадров.
21. Устройство кодера по п.12, в котором кодовая книга режима перехода содержит кодовую книгу глоттальных форм, содержащую кодовые векторы, сформированные из формы глоттального импульса, размещенной в заданном положении в кодовом векторе.
22. Устройство кодера по п.21, в котором кодовая книга глоттальных форм включает в себя предварительно определенное количество различных форм глоттальных импульсов, и в котором каждая форма глоттального импульса располагается во множестве различных положений в кодовом векторе, формируя множество различных кодовых векторов кодовой книги глоттальных форм.
23. Устройство кодера по п.21, в котором кодовая книга глоттальных форм содержит генератор кодовых векторов, содержащих только один ненулевой элемент, и формирующий фильтр для обработки кодовых векторов, содержащих только один ненулевой элемент, для создания кодовых векторов, представляющих формы глоттальных импульсов, расположенные по центру различных положений.
24. Устройство кодера по п.12, дополнительно содержащее
генератор целевого сигнала поиска по кодовой книге порождений;
кодовую книгу порождений для генерирования набора кодовых векторов порождения, причем каждый соответствует соответствующему возбуждению порождения;
устройство поиска кодовой книги порождений для нахождения кодового вектора порождения упомянутого набора, соответствующего возбуждению порождения, оптимально соответствующему целевому сигналу поиска по кодовой книге порождений; и
сумматор возбуждения режима перехода и возбуждения порождения для создания глобального возбуждения для синтезирующего звуковой сигнал фильтра.
25. Устройство кодера по п.24, в котором каждый кадр перехода и/или кадр, следующий за переходом, содержит множество подкадров, и в котором, в зависимости от того, где расположен глоттальный импульс или импульсы в подкадрах, устройство кодера содержит средство кодирования подкадров, используя по меньшей мере одну из кодовой книги режима перехода, адаптивной кодовой книги и кодовой книги порождений.
26. Устройство декодера для генерирования возбуждения режима перехода, заменяющего возбуждение адаптивной кодовой книги в кадре перехода и/или кадре, следующем за переходом в звуковом сигнале, содержащее
вход для приема индекса кодовой книги; и
кодовую книгу режима перехода для генерирования набора кодовых векторов, независимых от прошлого возбуждения, причем кодовая книга режима перехода является реагирующей на индекс для генерирования в кадре перехода и/или кадре, следующем за переходом, одного из кодовых векторов набора, соответствующего возбуждению режима перехода.
27. Устройство декодера по п.26, в котором кодовая книга режима перехода содержит фиксированную кодовую книгу, независимую от прошлого возбуждения.
28. Устройство декодера по п.26, в котором кодовая книга режима перехода содержит кодовую книгу форм глоттальных импульсов.
29. Устройство декодера по п.26, в котором звуковой сигнал содержит речевой сигнал, и в котором кадр перехода выбирается из группы, состоящей из кадра, содержащего вокализованное вступление, и кадра, содержащего переход между двумя различными вокализованными звуками.
30. Устройство декодера по п.26, в котором каждый кадр перехода и/или кадр, следующий за переходом, содержит множество подкадров, и в котором кодовая книга режима перехода используется в первой части подкадров, и устройство декодера содержит кодовую книгу с предсказанием, которая используется во второй части подкадров.
31. Устройство декодера по п.26, в котором кодовая книга режима перехода содержит кодовую книгу глоттальных форм, содержащую кодовые векторы, сформированные из формы глоттального импульса, размещенной в заданном положении в кодовом векторе.
32. Устройство декодера по п.31, в котором кодовая книга глоттальных форм включает в себя предварительно определенное количество различных форм глоттальных импульсов, и в котором каждая форма глоттального импульса располагается во множестве различных положений в кодовом векторе, формируя множество различных кодовых векторов кодовой книги глоттальных форм.
33. Устройство декодера по п.31, в котором кодовая книга глоттальных форм содержит генератор кодовых векторов, содержащих только один ненулевой элемент, и формирующий фильтр для обработки кодовых векторов, содержащих только один ненулевой элемент, для создания кодовых векторов, представляющих формы глоттальных импульсов, расположенные по центру различных положений.
34. Устройство декодера по п.26, дополнительно содержащее
вход для приема индекса кодовой книги порождений;
кодовую книгу порождений для генерирования набора кодовых векторов порождения, причем кодовая книга порождений является реагирующей на индекс кодовой книги порождений для генерирования в кадре перехода и/или кадре, следующем за переходом, одного из кодовых векторов порождения набора, соответствующего возбуждению порождения;
сумматор возбуждения режима перехода и возбуждения порождения для создания глобального возбуждения для синтезирующего звуковой сигнал фильтра.
35. Способ режима перехода для использования в кодеке звукового сигнала с предсказанием для создания возбуждения режима перехода, заменяющего возбуждение адаптивной кодовой книги в кадре перехода и/или кадре, следующем за переходом в звуковом сигнале, содержащий
обеспечение кодовой книги режима перехода для генерирования набора кодовых векторов, независимых от прошлого возбуждения;
подачу индекса кодовой книги на кодовую книгу режима перехода; и
генерирование, посредством кодовой книги режима перехода и в ответ на индекс кодовой книги, одного из кодовых векторов набора, соответствующего упомянутому возбуждению режима перехода.
36. Способ режима перехода по п.35, в котором кодовая книга режима перехода содержит фиксированную кодовую книгу, независимую от прошлого возбуждения.
37. Способ режима перехода по п.35, в котором кодовая книга режима перехода содержит кодовую книгу форм глоттальных импульсов.
38. Способ режима перехода по п.35, в котором звуковой сигнал содержит речевой сигнал, и упомянутый способ содержит выбор кадра перехода из группы, состоящей из кадра, содержащего вокализованное вступление, и кадра, содержащего переход между двумя различными вокализованными звуками.
39. Способ режима перехода по п.35, в котором кадр перехода и/или кадр, следующий за переходом, содержит кадр перехода, за которым следует несколько кадров.
40. Способ режима перехода по п.35, в котором кадр перехода и/или кадр, следующий за переходом, содержит по меньшей мере один кадр, следующий за переходом.
41. Способ режима перехода по п.35, в котором каждый кадр перехода и/или кадр, следующий за переходом, содержит множество подкадров, и упомянутый способ содержит использование кодовой книги режима перехода в первой части подкадров и кодовой книги с предсказанием кодека с предсказанием во второй части подкадров.
42. Способ режима перехода по п.35, в котором обеспечение кодовой книги режима перехода содержит обеспечение кодовой книги глоттальных форм, содержащей кодовые векторы, сформированные из формы глоттального импульса, размещенной в заданном положении в кодовом векторе.
43. Способ режима перехода по п.42, в котором обеспечение кодовой книги глоттальных форм содержит обеспечение кодовой книги глоттальных форм, включающей в себя предварительно определенное количество различных форм глоттальных импульсов, и формирование в кодовой книге глоттальных форм множества различных кодовых векторов посредством расположения каждой формы глоттального импульса во множестве различных положений в кодовом векторе.
44. Способ режима перехода по п.42, содержащий генерирование в кодовой книге глоттальных форм кодовых векторов, содержащих только один ненулевой элемент, и обработку при помощи формирующего фильтра кодовых векторов, содержащих только один ненулевой элемент, для создания кодовых векторов, представляющих формы глоттальных импульсов, расположенные по центру различных положений.
45. Способ режима перехода по п.42, в котором импульсы глоттальной формы содержат первый и последний отсчеты, причем упомянутый способ содержит усечение предварительно определенного количества первых и последних отсчетов.
46. Способ кодирования для генерирования возбуждения режима перехода, заменяющего возбуждение адаптивной кодовой книги в кадре перехода и/или кадре, следующем за переходом в звуковом сигнале, содержащий
генерирование целевого сигнала поиска по кодовой книге;
обеспечение кодовой книги режима перехода для генерирования набора кодовых векторов, независимых от прошлого возбуждения, причем каждый кодовый вектор упомянутого набора соответствует соответствующему возбуждению режима перехода;
поиск по кодовой книге режима перехода для нахождения кодового вектора упомянутого набора, соответствующего возбуждению режима перехода, оптимально соответствующему целевому сигналу поиска по кодовой книге.
47. Способ кодирования по п.46, в котором обеспечение кодовой книги режима перехода содержит обеспечение фиксированной кодовой книги, независимой от прошлого возбуждения.
48. Способ кодирования по п.46, в котором обеспечение кодовой книги режима перехода содержит обеспечение кодовой книги форм глоттальных импульсов.
49. Способ кодирования по п.48, в котором поиск по кодовой книге режима перехода содержит применение данного критерия к каждой форме глоттального импульса кодовой книги форм глоттальных импульсов и нахождение в качестве кодового вектора, оптимально соответствующего целевому сигналу поиска по адаптивной кодовой книге, кодового вектора набора, соответствующего максимальному значению упомянутого критерия.
50. Способ кодирования по п.49, в котором поиск по кодовой книге режима перехода содержит идентификацию найденного кодового вектора посредством параметров режима перехода, выбранных из группы, состоящей из идентификации конфигурации режима перехода, формы глоттального импульса, положения центра формы глоттального импульса в найденном кодовом векторе, коэффициента усиления режима перехода, знака коэффициента усиления режима перехода и периода основного тона по закрытому циклу.
51. Способ кодирования по п.46, в котором звуковой сигнал содержит речевой сигнал, и упомянутый способ дополнительно содержит выбор кадра перехода из группы, состоящей из кадра, содержащего вокализованное вступление, и кадра, содержащего переход между двумя различными вокализованными звуками.
52. Способ кодирования по п.46, в котором кадр перехода и/или кадр, следующий за переходом, содержит кадр перехода, за которым следуют несколько кадров.
53. Способ кодирования по п.46, в котором кадр перехода и/или кадр, следующий за переходом, содержит по меньшей мере один кадр, следующий за переходом.
54. Способ кодирования по п.46, в котором каждый кадр перехода и/или кадр, следующий за переходом, содержит множество подкадров, и в котором поиск по кодовой книге режима перехода содержит поиск по кодовой книге режима перехода в первой части подкадров и поиск по кодовой книге с предсказанием устройства кодера во второй части подкадров.
55. Способ кодирования по п.46, в котором обеспечение кодовой книги режима перехода содержит обеспечение кодовой книги глоттальных форм, содержащей кодовые векторы, сформированные из формы глоттального импульса, расположенной в заданном положении в кодовом векторе.
56. Способ кодирования по п.55, в котором обеспечение кодовой книги глоттальных форм содержит обеспечение кодовой книги глоттальных форм, включающей в себя предварительно определенное количество различных форм глоттальных импульсов, и формирование множества различных кодовых векторов кодовой книги глоттальных форм посредством расположения каждой формы глоттального импульса во множестве различных положений в кодовом векторе.
57. Способ кодирования по п.55, в котором генерирование в кодовой книге глоттальных форм набора кодовых векторов, независимых от прошлого возбуждения, содержит генерирование кодовых векторов, содержащих только один ненулевой элемент, и обработку при помощи формирующего фильтра кодовых векторов, содержащих только один ненулевой элемент, для создания кодовых векторов, представляющих формы глоттальных импульсов, расположенные по центру различных положений.
58. Способ кодирования по п.46, дополнительно содержащий
генерирование целевого сигнала поиска по кодовой книге порождений;
обеспечение кодовой книги порождений для генерирования набора кодовых векторов порождения, причем каждый соответствует соответствующему возбуждению порождения;
поиск по кодовой книге порождений для нахождения кодового вектора порождения из упомянутого набора, соответствующего возбуждению порождения, оптимально соответствующему целевому сигналу поиска по кодовой книге порождений; и
суммирование возбуждения режима перехода и возбуждения порождения для создания глобального возбуждения для синтезирующего звуковой сигнал фильтра.
59. Способ кодирования по п.58, в котором каждый кадр перехода и/или кадр, следующий за переходом, содержит множество подкадров, и в котором, в зависимости от того, где расположен глоттальный импульс или импульсы в подкадрах, способ кодирования содержит кодирование подкадров, используя по меньшей мере одну из кодовой книги режима перехода, адаптивной кодовой книги и кодовой книги порождений.
60. Способ декодирования для генерирования возбуждения режима перехода, заменяющего возбуждение адаптивной кодовой книги в кадре перехода и/или кадре, следующем за переходом в звуковом сигнале, содержащий
прием индекса кодовой книги;
подачу индекса кодовой книги на кодовую книгу режима перехода для генерирования набора кодовых векторов, независимых от прошлого возбуждения, и
генерирование, посредством кодовой книги режима перехода и в ответ на индекс кодовой книги, одного из кодовых векторов набора, соответствующего возбуждению режима перехода.
61. Способ декодирования по п.60, в котором кодовая книга режима перехода содержит фиксированную кодовую книгу, независимую от прошлого возбуждения.
62. Способ декодирования по п.60, содержащий обеспечение в качестве кодовой книги режима перехода кодовой книги форм глоттальных импульсов.
63. Способ декодирования по п.60, в котором звуковой сигнал содержит речевой сигнал, и в котором упомянутый способ содержит выбор кадра перехода из группы, состоящей из кадра, содержащего вокализованное вступление, и кадра, содержащего переход между двумя различными вокализованными звуками.
64. Способ декодирования по п.60, в котором каждый кадр перехода и/или кадр, следующий за переходом, содержит множество подкадров, и в котором упомянутый способ содержит использование кодовой книги режима перехода в первой части подкадров, и кодовой книги с предсказанием во второй части подкадров.
65. Способ декодирования по п.60, содержащий обеспечение в качестве кодовой книги режима перехода кодовой книги глоттальных форм, содержащей кодовые векторы, сформированные из формы глоттального импульса, размещенной в заданном положении в кодовом векторе.
66. Способ декодирования по п.65, в котором кодовая книга глоттальных форм включает в себя предварительно определенное количество различных форм глоттальных импульсов, и в котором упомянутый способ содержит формирование множества различных кодовых векторов кодовой книги глоттальных форм посредством расположения каждой формы глоттального импульса во множестве различных положений в кодовом векторе.
67. Способ декодирования по п.65, в котором кодовые векторы набора генерируются посредством кодовой книги глоттальных форм посредством генерирования кодовых векторов, содержащих только один ненулевой элемент, и обработки при помощи формирующего фильтра кодовых векторов, содержащих только один ненулевой элемент, для создания кодовых векторов, представляющих формы глоттальных импульсов, расположенные по центру различных положений.
68. Способ декодирования по п.60, дополнительно содержащий
обеспечение кодовой книги порождений для генерирования набора кодовых векторов порождения;
подачу индекса кодовой книги порождений на кодовую книгу порождений;
генерирование, посредством кодовой книги порождении и в ответ на индекс кодовой книги порождений, одного из кодовых векторов порождения набора, соответствующего возбуждению порождения; и
суммирование возбуждения режима перехода и возбуждения порождения для создания глобального возбуждения для синтезирующего звуковой сигнал фильтра.
RU2009119491/08A 2006-10-24 2007-10-24 Способ и устройство кодирования кадров перехода в речевых сигналах RU2462769C2 (ru)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US85374906P 2006-10-24 2006-10-24
US60/853,749 2006-10-24

Publications (2)

Publication Number Publication Date
RU2009119491A true RU2009119491A (ru) 2010-11-27
RU2462769C2 RU2462769C2 (ru) 2012-09-27

Family

ID=39324068

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2009119491/08A RU2462769C2 (ru) 2006-10-24 2007-10-24 Способ и устройство кодирования кадров перехода в речевых сигналах

Country Status (16)

Country Link
US (1) US8401843B2 (ru)
EP (1) EP2102619B1 (ru)
JP (1) JP5166425B2 (ru)
KR (1) KR101406113B1 (ru)
CN (1) CN101578508B (ru)
BR (1) BRPI0718300B1 (ru)
CA (1) CA2666546C (ru)
DK (1) DK2102619T3 (ru)
ES (1) ES2624718T3 (ru)
HK (1) HK1132324A1 (ru)
MX (1) MX2009004427A (ru)
MY (1) MY152845A (ru)
NO (1) NO341585B1 (ru)
PT (1) PT2102619T (ru)
RU (1) RU2462769C2 (ru)
WO (1) WO2008049221A1 (ru)

Families Citing this family (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008146466A1 (ja) * 2007-05-24 2008-12-04 Panasonic Corporation オーディオ復号装置、オーディオ復号方法、プログラム及び集積回路
US8515767B2 (en) * 2007-11-04 2013-08-20 Qualcomm Incorporated Technique for encoding/decoding of codebook indices for quantized MDCT spectrum in scalable speech and audio codecs
US8768690B2 (en) * 2008-06-20 2014-07-01 Qualcomm Incorporated Coding scheme selection for low-bit-rate applications
US20090319261A1 (en) * 2008-06-20 2009-12-24 Qualcomm Incorporated Coding of transitional speech frames for low-bit-rate applications
US20090319263A1 (en) * 2008-06-20 2009-12-24 Qualcomm Incorporated Coding of transitional speech frames for low-bit-rate applications
JP2010204391A (ja) * 2009-03-03 2010-09-16 Nippon Telegr & Teleph Corp <Ntt> 音声信号モデル化方法、信号認識装置及び方法、パラメータ学習装置及び方法、特徴量生成装置及び方法並びにプログラム
KR101137652B1 (ko) * 2009-10-14 2012-04-23 광운대학교 산학협력단 천이 구간에 기초하여 윈도우의 오버랩 영역을 조절하는 통합 음성/오디오 부호화/복호화 장치 및 방법
KR101381272B1 (ko) * 2010-01-08 2014-04-07 니뽄 덴신 덴와 가부시키가이샤 부호화 방법, 복호 방법, 부호화 장치, 복호 장치, 프로그램 및 기록 매체
US9626982B2 (en) * 2011-02-15 2017-04-18 Voiceage Corporation Device and method for quantizing the gains of the adaptive and fixed contributions of the excitation in a CELP codec
NO2669468T3 (ru) * 2011-05-11 2018-06-02
US9972325B2 (en) * 2012-02-17 2018-05-15 Huawei Technologies Co., Ltd. System and method for mixed codebook excitation for speech coding
RU2612581C2 (ru) 2012-11-15 2017-03-09 Нтт Докомо, Инк. Устройство кодирования аудио, способ кодирования аудио, программа кодирования аудио, устройство декодирования аудио, способ декодирования аудио и программа декодирования аудио
FR3001593A1 (fr) * 2013-01-31 2014-08-01 France Telecom Correction perfectionnee de perte de trame au decodage d'un signal.
HRP20231248T1 (hr) * 2013-03-04 2024-02-02 Voiceage Evs Llc Uređaj i postupak za smanјenјe šuma kvantizacije u dekoderu vremenskog domena
RU2740690C2 (ru) * 2013-04-05 2021-01-19 Долби Интернешнл Аб Звуковые кодирующее устройство и декодирующее устройство
BR112015031824B1 (pt) 2013-06-21 2021-12-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Aparelho e método para uma ocultação melhorada do livro do código adaptativo na ocultação tipo acelp utilizando uma estimativa melhorada de atraso de pitch
MX352092B (es) 2013-06-21 2017-11-08 Fraunhofer Ges Forschung Aparato y método para mejorar el ocultamiento del libro de códigos adaptativo en la ocultación similar a acelp empleando una resincronización de pulsos mejorada.
CN108364657B (zh) 2013-07-16 2020-10-30 超清编解码有限公司 处理丢失帧的方法和解码器
US10614816B2 (en) * 2013-10-11 2020-04-07 Qualcomm Incorporated Systems and methods of communicating redundant frame information
CN104637486B (zh) * 2013-11-07 2017-12-29 华为技术有限公司 一种数据帧的内插方法及装置
CN103680509B (zh) * 2013-12-16 2016-04-06 重庆邮电大学 一种语音信号非连续传输及背景噪声生成方法
EP4336500A3 (en) 2014-04-17 2024-04-03 VoiceAge EVS LLC Methods, encoder and decoder for linear predictive encoding and decoding of sound signals upon transition between frames having different sampling rates
ES2911527T3 (es) * 2014-05-01 2022-05-19 Nippon Telegraph & Telephone Dispositivo de descodificación de señales de sonido, método de descodificación de señales de sonido, programa y soporte de registro
CN106683681B (zh) * 2014-06-25 2020-09-25 华为技术有限公司 处理丢失帧的方法和装置
FR3024581A1 (fr) * 2014-07-29 2016-02-05 Orange Determination d'un budget de codage d'une trame de transition lpd/fd
FR3024582A1 (fr) * 2014-07-29 2016-02-05 Orange Gestion de la perte de trame dans un contexte de transition fd/lpd
RU2670377C2 (ru) 2014-08-28 2018-10-22 Нокиа Текнолоджиз Ой Квантование аудиопараметров
US9916835B2 (en) * 2015-01-22 2018-03-13 Sennheiser Electronic Gmbh & Co. Kg Digital wireless audio transmission system
US10157441B2 (en) * 2016-12-27 2018-12-18 Automotive Research & Testing Center Hierarchical system for detecting object with parallel architecture and hierarchical method thereof
CN111133510B (zh) * 2017-09-20 2023-08-22 沃伊斯亚吉公司 用于在celp编解码器中高效地分配比特预算的方法和设备
US20220172733A1 (en) * 2019-02-21 2022-06-02 Telefonaktiebolaget Lm Ericsson (Publ) Methods for frequency domain packet loss concealment and related decoder
US20220180884A1 (en) * 2019-05-07 2022-06-09 Voiceage Corporation Methods and devices for detecting an attack in a sound signal to be coded and for coding the detected attack
CN111123305B (zh) * 2019-12-12 2023-08-22 秦然 一种gnss记录回放测试仪图形化噪声系数优化方法

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US549555A (en) * 1895-11-12 white
JP2707564B2 (ja) * 1987-12-14 1998-01-28 株式会社日立製作所 音声符号化方式
US5495555A (en) * 1992-06-01 1996-02-27 Hughes Aircraft Company High quality low bit rate celp-based speech codec
CA2108623A1 (en) * 1992-11-02 1994-05-03 Yi-Sheng Wang Adaptive pitch pulse enhancer and method for use in a codebook excited linear prediction (celp) search loop
EP1355298B1 (en) * 1993-06-10 2007-02-21 Oki Electric Industry Company, Limited Code Excitation linear prediction encoder and decoder
US6233550B1 (en) * 1997-08-29 2001-05-15 The Regents Of The University Of California Method and apparatus for hybrid coding of speech at 4kbps
DE69840008D1 (de) * 1997-10-22 2008-10-23 Matsushita Electric Ind Co Ltd Verfahren und Vorrichtung für die Erzeugung von gestreuten Vektoren
CN100583242C (zh) * 1997-12-24 2010-01-20 三菱电机株式会社 声音译码方法和声音译码装置
US6385576B2 (en) * 1997-12-24 2002-05-07 Kabushiki Kaisha Toshiba Speech encoding/decoding method using reduced subframe pulse positions having density related to pitch
US7072832B1 (en) * 1998-08-24 2006-07-04 Mindspeed Technologies, Inc. System for speech encoding having an adaptive encoding arrangement
US6192335B1 (en) * 1998-09-01 2001-02-20 Telefonaktieboiaget Lm Ericsson (Publ) Adaptive combining of multi-mode coding for voiced speech and noise-like signals
JP4008607B2 (ja) * 1999-01-22 2007-11-14 株式会社東芝 音声符号化/復号化方法
US6782360B1 (en) 1999-09-22 2004-08-24 Mindspeed Technologies, Inc. Gain quantization for a CELP speech coder
ATE420432T1 (de) 2000-04-24 2009-01-15 Qualcomm Inc Verfahren und vorrichtung zur prädiktiven quantisierung von stimmhaften sprachsignalen
DE10114561A1 (de) * 2001-03-24 2002-09-26 Wella Ag Verwendung von Mitteln enthaltend Kreatin, Kreatin und/oder deren Derivaten zur Verstärkung und Strukturverbesserung von keratinischen Fasern
DE10124420C1 (de) * 2001-05-18 2002-11-28 Siemens Ag Verfahren zur Codierung und zur Übertragung von Sprachsignalen
CN1320520C (zh) 2002-05-10 2007-06-06 旭化成株式会社 语音识别设备和语音识别方法
CA2388439A1 (en) * 2002-05-31 2003-11-30 Voiceage Corporation A method and device for efficient frame erasure concealment in linear predictive based speech codecs
JP4414705B2 (ja) * 2003-09-17 2010-02-10 パナソニック株式会社 音源信号符号化装置、及び音源信号符号化方法
US7668712B2 (en) * 2004-03-31 2010-02-23 Microsoft Corporation Audio encoding and decoding with intra frames and adaptive forward error correction
GB0408856D0 (en) 2004-04-21 2004-05-26 Nokia Corp Signal encoding
CN1989548B (zh) * 2004-07-20 2010-12-08 松下电器产业株式会社 语音解码装置及补偿帧生成方法
US7752039B2 (en) 2004-11-03 2010-07-06 Nokia Corporation Method and device for low bit rate speech coding

Also Published As

Publication number Publication date
EP2102619B1 (en) 2017-03-22
DK2102619T3 (en) 2017-05-15
BRPI0718300B1 (pt) 2018-08-14
KR101406113B1 (ko) 2014-06-11
NO341585B1 (no) 2017-12-11
MX2009004427A (es) 2009-06-30
JP5166425B2 (ja) 2013-03-21
MY152845A (en) 2014-11-28
CA2666546A1 (en) 2008-05-02
EP2102619A4 (en) 2012-03-28
CN101578508B (zh) 2013-07-17
EP2102619A1 (en) 2009-09-23
JP2010507818A (ja) 2010-03-11
HK1132324A1 (en) 2010-02-19
US20100241425A1 (en) 2010-09-23
CN101578508A (zh) 2009-11-11
ES2624718T3 (es) 2017-07-17
BRPI0718300A2 (pt) 2014-01-07
RU2462769C2 (ru) 2012-09-27
US8401843B2 (en) 2013-03-19
NO20092017L (no) 2009-05-25
WO2008049221A1 (en) 2008-05-02
PT2102619T (pt) 2017-05-25
CA2666546C (en) 2016-01-19
KR20090073253A (ko) 2009-07-02

Similar Documents

Publication Publication Date Title
RU2009119491A (ru) Способ и устройство кодирования кадров перехода в речевых сигналах
KR890001022A (ko) 음성 인코딩 방법 및 장치
CN101548317B (zh) 自适应激励矢量量化装置和自适应激励矢量量化方法
WO1999034354A1 (en) Sound encoding method and sound decoding method, and sound encoding device and sound decoding device
JP3180762B2 (ja) 音声符号化装置及び音声復号化装置
JPWO2008155919A1 (ja) 適応音源ベクトル量子化装置および適応音源ベクトル量子化方法
CA2090205A1 (en) Speech coding system
JP3275247B2 (ja) 音声符号化・復号化方法
CA2336360C (en) Speech coder
KR20040043278A (ko) 음성 부호화기 및 이를 이용한 음성 부호화 방법
JP2538450B2 (ja) 音声の励振信号符号化・復号化方法
JPH10232696A (ja) 音源ベクトル生成装置及び音声符号化/復号化装置
JP3583945B2 (ja) 音声符号化方法
JPH0258100A (ja) 音声符号化復号化方法及び音声符号化装置並びに音声復号化装置
McCree A scalable phonetic vocoder framework using joint predictive vector quantization of melp parameters
JP3166697B2 (ja) 音声符号化・復号装置及びシステム
JP3103108B2 (ja) 音声符号化装置
JPWO2007129726A1 (ja) 音声符号化装置及び音声符号化方法
JPH0511799A (ja) 音声符号化方式
Benita et al. DiffAR: Denoising Diffusion Autoregressive Model for Raw Speech Waveform Generation
KR100550002B1 (ko) 음성부호화기에서 적응 코드북 검색기 및 그 방법
Lin et al. Switching auxiliary chains for speech recognition
JP2001134298A (ja) 音声符号化装置と音声復号化装置、及び音声符号化復号化システム
JP4191502B2 (ja) 信号符号化方法、およびこれらの装置、並びに信号符号化プログラム
JP3236852B2 (ja) Celp型音声復号化装置及び音声復号化方法

Legal Events

Date Code Title Description
PC41 Official registration of the transfer of exclusive right

Effective date: 20220301