RU2004138286A - Способ и устройство для эффективного маскирования стирания кадров в речевых кодеках на основе линейного предсказания - Google Patents

Способ и устройство для эффективного маскирования стирания кадров в речевых кодеках на основе линейного предсказания Download PDF

Info

Publication number
RU2004138286A
RU2004138286A RU2004138286/09A RU2004138286A RU2004138286A RU 2004138286 A RU2004138286 A RU 2004138286A RU 2004138286/09 A RU2004138286/09 A RU 2004138286/09A RU 2004138286 A RU2004138286 A RU 2004138286A RU 2004138286 A RU2004138286 A RU 2004138286A
Authority
RU
Russia
Prior art keywords
frame
parameter
voiced
signal
frames
Prior art date
Application number
RU2004138286/09A
Other languages
English (en)
Other versions
RU2325707C2 (ru
Inventor
Милан ЖЕЛИНЕК (CA)
Милан ЖЕЛИНЕК
Филипп ГУРНАЙ (CA)
Филипп ГУРНАЙ
Original Assignee
Войсэйдж Корпорейшн (Ca)
Войсэйдж Корпорейшн
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=29589088&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=RU2004138286(A) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Войсэйдж Корпорейшн (Ca), Войсэйдж Корпорейшн filed Critical Войсэйдж Корпорейшн (Ca)
Publication of RU2004138286A publication Critical patent/RU2004138286A/ru
Application granted granted Critical
Publication of RU2325707C2 publication Critical patent/RU2325707C2/ru

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders

Claims (177)

1. Способ маскирования стирания кадров, вызванного кадрами кодированного звукового сигнала, стертыми во время передачи от кодера к декодеру, причем способ содержит определение в кодере параметров маскирования/восстановления; передачу в декодер параметров маскирования/восстановления, определенных в кодере; и в декодере, осуществление маскирования стирания кадров и восстановления в декодере в соответствии с принятыми параметрами маскирования/восстановления.
2. Способ по п.1, дополнительно содержащий квантование в кодере параметров маскирования/восстановления перед передачей параметров маскирования/восстановления в декодер.
3. Способ по п.1, в котором параметры маскирования/восстановления выбирают из группы, состоящей из параметра классификации сигнала, параметра информации об энергии и параметра информации о фазе.
4. Способ по п.3, в котором определение параметра информации о фазе содержит определение положения первого импульса, относящегося к голосовой щели, в кадре кодированного звукового сигнала.
5. Способ по п.1, в котором осуществление маскирования стирания кадров и восстановления в декодере содержит осуществление восстановления в декодере в соответствии с определенным положением первого импульса, относящегося к голосовой щели, после по меньшей мере одного потерянного голосового приступа.
6. Способ по п.1, в котором осуществление маскирования стирания кадров и восстановления в декодере содержит, при потере по меньшей мере одного кадра приступа, формирование искусственным образом части периодического возбуждения в виде периодической последовательности импульсов, подвергнутых низкочастотной фильтрации, причем эти импульсы разделены периодом основного тона.
7. Способ по п.6, в котором способ содержит квантование положения первого импульса, относящегося к голосовой щели, перед передачей положения первого импульса, относящегося к голосовой щели, в декодер; и формирование периодической части возбуждения содержит реализацию периодической последовательности импульсов, подвергнутых низкочастотной фильтрации, путем центрирования первой импульсной характеристики фильтра нижних частот по квантованному положению первого импульса, относящегося к голосовой щели, в соответствии с началом кадра; и помещения каждой из остальных импульсных характеристик фильтра нижних частот на расстоянии, соответствующем среднему значению основного тона, от предыдущей импульсной характеристики вплоть до конца последнего субкадра, затронутого искусственным формированием.
8. Способ по п.4, в котором определение параметра информации о фазе дополнительно содержит кодирование в кодере формы, знака и амплитуды первого импульса, относящегося к голосовой щели, и передачу кодированных формы, знака и амплитуды из кодера в декодер.
9. Способ по п.4, в котором определение положения первого импульса, относящегося к голосовой щели, содержит измерение первого импульса, относящегося к голосовой щели, в виде отсчета максимальной амплитуды в периоде основного тона; и квантование положения отсчета максимальной амплитуды в периоде основного тона.
10. Способ по п.1, в котором звуковой сигнал является речевым сигналом; и определение в кодере параметров маскирования/восстановления содержит классификацию последовательных кадров кодированного звукового сигнала как невокализованного кадра, невокализованного перехода, вокализованного перехода, вокализованного кадра или приступа.
11. Способ по п.10, в котором классификация последовательных кадров содержит классификацию в качестве невокализованного каждого кадра, который является невокализованный кадром, каждого кадра без активной речи и каждого вокализованного кадра сдвига, конец которого имеет тенденцию к невокализованному состоянию.
12. Способ по п.10, в котором классификация последовательных кадров содержит классификацию в качестве невокализованного перехода каждого невокализованного кадра, имеющего конец с возможным вокализованным приступом, который слишком короток или сформирован в недостаточной степени для обработки в качестве вокализованного кадра.
13. Способ по п.10, в котором классификация последовательных кадров представляет собой классификацию в качестве вокализованного перехода каждого вокализованного кадра с относительно слабыми вокализованными характеристиками, в том числе вокализованных кадров с быстро изменяющимися характеристиками и вокализованных сдвигов, которые длятся целый кадр, причем кадр, классифицированный в качестве вокализованного перехода, следует только за кадрами, классифицированными как вокализованный переход, вокализованный кадр или приступ.
14. Способ по п.10, в котором классификация последовательных кадров представляет собой классификацию в качестве вокализованного каждого вокализованного кадра со стабильными характеристиками, причем кадр, классифицированный как вокализованный, следует только за кадрами, классифицированными как вокализованный переход, вокализованный кадр или приступ.
15. Способ по п.10, в котором классификация последовательных кадров представляет собой классификацию в качестве приступа каждого вокализованного кадра со стабильными характеристиками, следующего после кадра, классифицированного как невокализованный кадр или как невокализованный переход.
16. Способ по п.10, содержащий определение классификации последовательных кадров кодированного звукового сигнала на основе по меньшей мере части следующих параметров: параметр нормализованной корреляции, параметр спектрального наклона, параметр отношения сигнал-шум, параметр стабильности основного тона, параметр относительной энергии кадра и параметр перехода через нуль.
17. Способ по п.10, в котором определение классификации последовательных кадров содержит вычисление коэффициента качества на основе параметра нормализованной корреляции, параметра спектрального наклона, параметра отношения сигнал-шум, параметра стабильности основного тона, параметра относительной энергии кадра и параметра перехода через нуль; и сравнение коэффициента качества с пороговыми значениями для определения классификации.
18. Способ по п.16, содержащий вычисление параметра нормализованной корреляции на основе текущей взвешенной версии речевого сигнала и прошлой взвешенной версии указанного речевого сигнала.
19. Способ по п.16, содержащий оценивание параметра спектрального наклона как отношения энергии, сконцентрированной на низких частотах, и энергии, сконцентрированной на высоких частотах.
20. Способ по п.16, содержащий оценивание параметра отношения сигнал-шум как отношения энергии взвешенной версии речевого сигнала текущего кадра и энергии ошибки между взвешенной версией речевого сигнала текущего кадра и взвешенной версией синтезированного речевого сигнала текущего кадра.
21. Способ по п.16, содержащий вычисление параметра стабильности основного тона в соответствии с оценками основного тона без обратной связи для первой половины текущего кадра, второй половины текущего кадра и упреждающего просмотра.
22. Способ по п.16, содержащий вычисление параметра относительной энергии кадра как разницы между энергией текущего кадра и долгосрочным средним значением энергии активных речевых кадров.
23. Способ по п.16, содержащий определение параметра перехода через нуль как числа случаев изменения знака речевого сигнала с первой полярности на вторую полярность.
24. Способ по п.16, содержащий вычисление по меньшей мере одного из параметров: параметра нормализованной корреляции, параметра спектрального наклона, параметра отношения сигнал-шум, параметра стабильности основного тона, параметра относительной энергии кадра и параметра перехода через нуль с использованием доступного упреждающего просмотра для учета поведения речевого сигнала в следующем кадре.
25. Способ по п.16, дополнительно содержащий определение классификации последовательных кадров кодированного звукового сигнала также на основе флага обнаружения голосовой активности.
26. Способ по п.3, в котором звуковой сигнал является речевым сигналом; определение в кодере параметров маскирования/восстановления содержит классификацию последовательных кадров кодированного звукового сигнала как невокализованного кадра, невокализованного перехода, вокализованного перехода, вокализованного кадра или приступа; и определение параметров маскирования/восстановления содержит вычисление параметра информации об энергии по отношению к максимальной энергии сигнала для кадров, классифицированных как вокализованные кадры или как приступ, и вычисление параметра информации об энергии по отношению к средней энергии на отсчет для других кадров.
27. Способ по п.1, в котором определение в кодере параметров маскирования/восстановления содержит вычисление параметра информации вокализации.
28. Способ по п. 27, в котором звуковой сигнал является речевым сигналом; определение в кодере параметров маскирования/восстановления содержит классификацию последовательных кадров кодированного звукового сигнала; причем способ содержит определение классификации последовательных кадров кодированного звукового сигнала на основе параметра нормализованной корреляции; и вычисление параметра информации вокализации содержит оценивание указанного параметра информации вокализации на основе нормализованной корреляции.
29. Способ по п.1, в котором осуществление маскирования стирания кадра и восстановления в декодере содержит: после приема нестертого невокализованного кадра после стирания кадра, генерацию непериодической части сигнала возбуждения LP-фильтра; после приема после стирания кадра нестертого кадра, отличного от невокализованного, генерирование периодической части сигнала возбуждения LP-фильтра путем повторения последнего периода основного тона предыдущего кадра.
30. Способ по п.29, в котором формирование периодической части сигнала возбуждения LP-фильтра содержит фильтрацию повторяющегося последнего периода основного тона предыдущего кадра посредством фильтра нижних частот.
31. Способ по п.30, в котором определение параметров маскирования/восстановления содержит вычисление параметра информации вокализации; фильтр нижних частот имеет частоту среза; и формирование периодической части сигнала возбуждения содержит динамическую регулировку частоты среза по отношению к параметру информации вокализации.
32. Способ по п.1, в котором осуществление маскирования стирания кадров и восстановления в декодере содержит генерирование случайным образом непериодической, нововведенной части сигнала возбуждения LP-фильтра.
33. Способ по п.32, в котором генерирование случайным образом непериодической, нововведенной части сигнала возбуждения LP-фильтра содержит генерирование случайного шума.
34. Способ по п.32, в котором генерирование случайным образом непериодической, нововведенной части сигнала возбуждения LP-фильтра содержит генерирование случайным образом индексов вектора кодовой книги нововведений.
35. Способ по п.32, в котором звуковой сигнал является речевым сигналом; определение параметров маскирования/восстановления содержит классификацию последовательных кадров кодированного звукового сигнала как невокализованного кадра, невокализованного перехода, вокализованного перехода, вокализованного кадра или как приступа; и генерирование случайным образом непериодической, нововведенной части сигнала возбуждения LP-фильтра дополнительно содержит фильтрацию нововведенной части сигнала возбуждения посредством фильтра верхних частот, если последний правильно принятый кадр отличается от невокализованного; и использование только нововведенной части сигнала возбуждения, если последний правильно принятый кадр является невокализованным.
36. Способ по п.1, в котором звуковой сигнал является речевым сигналом; определение в кодере параметров маскирования/восстановления содержит классификацию последовательных кадров кодированного звукового сигнала как невокализованного кадра, невокализованного перехода, вокализованного перехода, вокализованного кадра или приступа; осуществление маскирования стирания кадров и восстановления в декодере содержит, когда кадр приступа потерян, на что указывает присутствие вокализованного кадра, следующего за стиранием кадра, и невокализованного кадра перед стиранием кадра, искусственное восстановление потерянного приступа путем формирования периодической части сигнала возбуждения в виде периодической последовательности импульсов, подвергнутой низкочастотной фильтрации разделенных периодом основного тона.
37. Способ по п.36, в котором осуществление маскирования стирания кадров и восстановления в декодере дополнительно содержит формирование нововведенной части сигнала возбуждения посредством стандартного декодирования.
38. Способ по п.37, в котором формирование нововведенной части сигнала возбуждения содержит случайный выбор записей кодовой книги нововведений.
39. Способ по п.36, в котором искусственное восстановление потерянного кадра приступа содержит ограничение длины искусственно восстановленного приступа, так что по меньшей мере один целый период основного тона формируется путем искусственного восстановления приступа, причем восстановление продолжается до конца текущего субкадра.
40. Способ по п.39, в котором осуществление маскирования стирания кадров и восстановления в декодере дополнительно содержит, после искусственного восстановления потерянного приступа, возобновление регулярной обработки CELP, при этом период основного тона является округленным средним значением декодированных периодов основного тона всех субкадров, где используется искусственное восстановление приступа.
41. Способ по п.3, в котором осуществление маскирования стирания кадров и восстановления в декодере содержит управление энергией синтезированного звукового сигнала, сформированного декодером, причем управление энергией синтезированного звукового сигнала содержит масштабирование синтезированного звукового сигнала для воспроизведения энергии синтезированного звукового сигнала в начале первого нестертого кадра, принятого вслед за стиранием кадра, подобной энергии синтезированного сигнала в конце последнего кадра, стертого во время стирания кадра; и сходимость энергии синтезированного звукового сигнала в принятом первом нестертом кадре к энергии, соответствующей принятому параметру информации об энергии, по направлению к концу принятого первого нестертого кадра при ограничении нарастания энергии.
42. Способ по п.3, в котором параметр информации об энергии не передается от кодера к декодеру; и осуществление маскирования стирания кадров и восстановления в декодере содержит, в случае когда усиление LP-фильтра первого нестертого кадра, принятого вслед за стиранием кадра, больше усиления LP-фильтра последнего кадра, стертого во время стирания кадра, регулировку энергии сигнала возбуждения LP-фильтра, сформированного в декодере во время принятого первого нестертого кадра, до усиления LP-фильтра принятого первого нестертого кадра.
43. Способ по п.42, в котором регулировка энергии сигнала возбуждения LP-фильтра, сформированного в декодере во время принятого первого нестертого кадра, до усиления LP-фильтра принятого первого нестертого кадра содержит использование следующего соотношения:
Figure 00000001
где E1 – энергия в конце текущего кадра, ELP0 - энергия импульсной характеристики LP-фильтра для последнего нестертого кадра, принятого перед стиранием кадра, а ELP1 - энергия импульсной характеристики LP-фильтра для принятого первого нестертого кадра, следующего за стиранием кадра.
44. Способ по п.41, в котором звуковой сигнал является речевым сигналом; определение в кодере параметров маскирования/восстановления содержит классификацию последовательных кадров кодированного звукового сигнала как невокализованного кадра, невокализованного перехода, вокализованного перехода, вокализованного кадра или приступа; и когда первый нестертый кадр, принятый после стирания кадра, классифицирован как ONSET (приступ), осуществление маскирования стирания кадров и восстановления в декодере содержит ограничение до заданного значения усиления, используемого для масштабирования синтезированного звукового сигнала.
45. Способ по п.41, в котором звуковой сигнал является речевым сигналом; определение в кодере параметров маскирования/восстановления содержит классификацию последовательных кадров кодированного звукового сигнала как невокализованного кадра, невокализованного перехода, вокализованного перехода, вокализованного кадра или приступа; и причем способ содержит обеспечение равенства усиления, используемого для масштабирования синтезированного звукового сигнала в начале первого нестертого кадра, принятого после стирания кадра, усилению, используемому в конце принятого первого нестертого кадра во время перехода от вокализованного кадра к невокализованному кадру, в случае, когда последний нестертый кадр, принятый перед стиранием кадра, классифицирован как вокализованный переход, вокализованный кадр или приступ, а первый нестертый кадр, принятый после стирания кадра, классифицирован как невокализованный кадр; и во время перехода от периода неактивной речи к периоду активной речи, когда последний нестертый кадр, принятый перед стиранием кадра, закодирован как комфортный шум, а первый нестертый кадр, принятый после стирания кадра, закодирован как активная речь.
46. Способ маскирования стирания кадров, вызванного кадрами кодированного звукового сигнала, стертого во время передачи от кодера к декодеру, причем способ содержит определение в кодере параметров маскирования/восстановления; и передачу в декодер параметров маскирования/восстановления, определенных в кодере.
47. Способ по п.46, дополнительно содержащий квантование в кодере параметров маскирования/восстановления перед передачей указанных параметров маскирования/восстановления в декодер.
48. Способ по п.46, в котором параметры маскирования/восстановления выбирают из группы, состоящей из параметра классификации сигнала, параметра информации об энергии и параметра информации о фазе.
49. Способ по п.48, в котором определение параметра информации о фазе содержит определение положения первого импульса, относящегося к голосовой щели, в кадре кодированного звукового сигнала.
50. Способ по п.49, в котором определение параметра информации о фазе дополнительно содержит кодирование в кодере формы, знака и амплитуды первого импульса, относящегося к голосовой щели, и передачу кодированных формы, знака и амплитуды от кодера к декодеру.
51. Способ по п.49, в котором определение положения первого импульса, относящегося к голосовой щели, содержит измерение первого импульса, относящегося к голосовой щели, в виде отсчета максимальной амплитуды в периоде основного тона; и квантование положения отсчета максимальной амплитуды в периоде основного тона.
52. Способ по п.46, в котором звуковой сигнал является речевым сигналом; и определение в кодере параметров маскирования/восстановления содержит классификацию последовательных кадров кодированного звукового сигнала как невокализованного кадра, невокализованного перехода, вокализованного перехода, вокализованного кадра или приступа.
53. Способ по п.52, в котором классификация последовательных кадров содержит классификацию как невокализованного каждого кадра, который является невокализованный кадром, каждого кадра без активной речи и каждого вокализованного кадра сдвига, конец которого проявляет тенденцию к невокализованному.
54. Способ по п.52, в котором классификация последовательных кадров содержит классификацию в качестве невокализованного перехода каждого невокализованного кадра, имеющего конец с возможным вокализованным приступом, который слишком короток или сформирован в недостаточной степени для обработки в качестве вокализованного кадра.
55. Способ по п.52, в котором классификация последовательных кадров содержит классификацию в качестве вокализованного перехода каждого вокализованного кадра с относительно слабыми вокализованными характеристиками, в том числе вокализованных кадров с быстро изменяющимися характеристиками и вокализованных сдвигов, которые длятся целый кадр, причем кадр, классифицированный как вокализованный переход, следует только за кадрами, классифицированными как вокализованный переход, вокализованный кадр или приступ.
56. Способ по п.52, в котором классификация последовательных кадров содержит классификацию в качестве вокализованного каждого вокализованного кадра со стабильными характеристиками, причем кадр, классифицированный как вокализованный, следует только за кадрами, классифицированными как вокализованный переход, вокализованный кадр или приступ.
57. Способ по п.52, в котором классификация последовательных кадров содержит классификацию в качестве приступа каждого вокализованного кадра со стабильными характеристиками, следующего после кадра, классифицированного как невокализованный кадр или как невокализованный переход.
58. Способ по п.52, содержащий определение классификации последовательных кадров кодированного звукового сигнала на основе по меньшей мере части следующих параметров: параметр нормализованной корреляции, параметр спектрального наклона, параметр отношения сигнал-шум, параметр стабильности основного тона, параметр относительной энергии кадра и параметр перехода через нуль.
59. Способ по п.58, в котором определение классификации последовательных кадров содержит вычисление коэффициента качества на основе параметра нормализованной корреляции, параметра спектрального наклона, параметра отношения сигнал-шум, параметра стабильности основного тона, параметра относительной энергии кадра и параметра перехода через нуль; и сравнение коэффициента качества с пороговыми значениями для определения классификации.
60. Способ по п.58, содержащий вычисление параметра нормализованной корреляции на основе текущей взвешенной версии речевого сигнала и прошлой взвешенной версии речевого сигнала.
61. Способ по п.58, содержащий оценивание параметра спектрального наклона как отношения энергии, сконцентрированной на низких частотах, и энергии, сконцентрированной на высоких частотах.
62. Способ по п.58, содержащий оценивание параметра отношения сигнал-шум как отношения энергии взвешенной версии речевого сигнала текущего кадра и энергии ошибки между взвешенной версией речевого сигнала текущего кадра и взвешенной версией синтезированного речевого сигнала текущего кадра.
63. Способ по п.58, содержащий вычисление параметра стабильности основного тона в соответствии с оценками основного тона без обратной связи для первой половины текущего кадра, второй половины текущего кадра и упреждающего просмотра.
64. Способ по п.58, содержащий вычисление параметра относительной энергии кадра как разницы между энергией текущего кадра и долгосрочным средним значением энергии активных речевых кадров.
65. Способ по п.58, содержащий определение параметра перехода через нуль как числа случаев изменения знака речевого сигнала с первой полярности на вторую полярность.
66. Способ по п.58, содержащий вычисление по меньшей мере одного из параметров: параметра нормализованной корреляции, параметра спектрального наклона, параметра отношения сигнал-шум, параметра стабильности основного тона, параметра относительной энергии кадра и параметра перехода через нуль с использованием имеющегося предварительного просмотра для учета поведения речевого сигнала в следующем кадре.
67. Способ по п.58, дополнительно содержащий определение классификации последовательных кадров кодированного звукового сигнала также на основе флага обнаружения голосовой активности.
68. Способ по п.48, в котором звуковой сигнал является речевым сигналом; определение в кодере параметров маскирования/восстановления содержит классификацию последовательных кадров кодированного звукового сигнала как невокализованного кадра, невокализованного перехода, вокализованного перехода, вокализованного кадра или приступа; и определение параметров маскирования/восстановления содержит вычисление параметра информации об энергии по отношению к максимальной энергии сигнала для кадров, классифицированных как вокализованные или как приступ, и вычисление параметра информации об энергии по отношению к средней энергии на отсчет для других кадров.
69. Способ по п.46, в котором определение в кодере параметров маскирования/восстановления содержит вычисление параметра информации вокализации.
70. Способ по п.68, в котором звуковой сигнал является речевым сигналом; определение в кодере параметров маскирования/восстановления содержит классификацию последовательных кадров кодированного звукового сигнала; причем способ содержит определение классификации последовательных кадров кодированного звукового сигнала на основе параметра нормализованной корреляции; и вычисление параметра информации вокализации содержит оценивание указанного параметра информации на основе нормализованной корреляции.
71. Способ для маскирования стирания кадров, вызванного кадрами, стертыми во время передачи звукового сигнала, кодированного соответственно форме параметров кодирования сигнала, от кодера к декодеру, причем способ содержит определение в декодере параметров маскирования/восстановления из параметров кодирования сигнала; осуществление в декодере маскирования стертых кадров и восстановления в декодере в соответствии с параметрами маскирования/восстановления, определенными в декодере.
72. Способ по п.71, в котором параметры маскирования/восстановления выбирают из группы, состоящей из параметра классификации сигнала, параметра информации об энергии и параметра информации о фазе.
73. Способ по п.71, в котором звуковой сигнал является речевым сигналом; и определение в декодере параметров маскирования/восстановления содержит классификацию последовательных кадров кодированного звукового сигнала как невокализованного кадра, невокализованного перехода, вокализованного перехода, вокализованного кадра или приступа.
74. Способ по п.71, в котором определение в декодере параметров маскирования/восстановления содержит вычисление параметра информации вокализации.
75. Способ по п.71, в котором осуществление маскирования стирания кадров и восстановления в декодере содержит: после приема нестертого невокализованного кадра после стирания кадра, генерирование непериодической части сигнала возбуждения LP-фильтра; после приема после стирания кадра нестертого кадра, отличного от невокализованного, формирование периодической части сигнала возбуждения LP-фильтра путем повторения последнего периода основного тона предыдущего кадра.
76. Способ по п.75, в котором формирование периодической части сигнала возбуждения содержит фильтрацию повторяющегося последнего периода основного тона предыдущего кадра посредством фильтра нижних частот.
77. Способ по п.76, в котором определение в декодере параметров маскирования/восстановления содержит вычисление параметра информации вокализации; фильтр нижних частот имеет частоту среза; и формирование периодической части сигнала возбуждения LP-фильтра содержит динамическую регулировку частоты среза по отношению к параметру информации вокализации.
78. Способ по п.71, в котором осуществление маскирования стирания кадров и восстановления декодера содержит генерирование случайным образом непериодической, нововведенной части сигнала возбуждения LP-фильтра.
79. Способ по п.78, в котором генерирование случайным образом непериодической, нововведенной части сигнала возбуждения LP-фильтра содержит генерирование случайного шума.
80. Способ по п.78, в котором генерирование случайным образом непериодической, нововведенной части сигнала возбуждения LP-фильтра содержит генерирование случайным образом индексов вектора кодовой книги нововведений.
81. Способ по п.78, в котором звуковой сигнал является речевым сигналом; определение в декодере параметров маскирования/восстановления содержит классификацию последовательных кадров кодированного звукового сигнала как невокализованного кадра, невокализованного перехода, вокализованного перехода, вокализованного кадра или как приступа; и генерирование случайным образом непериодической, нововведенной части сигнала возбуждения LP-фильтра дополнительно содержит фильтрацию нововведенной части сигнала возбуждения LP-фильтра посредством фильтра верхних частот, если принятый последний нестертый кадр отличается от невокализованного; и использование только нововведенной части сигнала возбуждения LP-фильтра, если принятый последний нестертый кадр является невокализованным.
82. Способ по п.78, в котором звуковой сигнал является речевым сигналом; определение в декодере параметров маскирования/восстановления содержит классификацию последовательных кадров кодированного звукового сигнала как невокализованного кадра, невокализованного перехода, вокализованного перехода, вокализованного кадра или приступа; осуществление маскирования стирания кадров и восстановления в декодере содержит, когда кадр приступа потерян, на что указывает присутствие вокализованного кадра, следующего за стиранием кадра, и невокализованного кадра перед стиранием кадра, искусственное восстановление потерянного приступа путем формирования периодической части сигнала возбуждения в виде периодической последовательности импульсов, подвергнутых низкочастотной фильтрации, которые разделены периодом основного тона.
83. Способ по п.82, в котором осуществление маскирования стирания кадров и восстановления в декодере дополнительно содержит формирование нововведенной части сигнала возбуждения LP-фильтра посредством стандартного декодирования.
84. Способ по п.83, в котором формирование нововведенной части сигнала возбуждения LP-фильтра содержит случайный выбор записей кодовой книги нововведений.
85. Способ по п.82, в котором искусственное восстановление потерянного приступа содержит ограничение длины искусственно восстановленного приступа, так что по меньшей мере один целый период основного тона формируется путем искусственного формирования приступа, причем формирование продолжается до конца текущего субкадра.
86. Способ по п.85, в котором осуществление маскирования стирания кадров и восстановления в декодере дополнительно содержит, после искусственного восстановления потерянного приступа, возобновление регулярной обработки CELP, причем период основного тона является округленным средним значением декодированных периодов основного тона всех субкадров, где используется искусственное восстановление приступа.
87. Способ по п.72, в котором параметр информации об энергии не передается от кодера к декодеру; и осуществление маскирования стирания кадров и восстановления декодера содержит в случае, когда усиление LP-фильтра первого нестертого кадра, принятого вслед за стиранием кадра, больше усиления LP-фильтра последнего кадра, стертого во время стирания кадра, регулировки энергии сигнала возбуждения LP-фильтра, созданного в декодере во время принятого первого нестертого кадра, до усиления LP-фильтра принятого первого нестертого кадра, с использованием следующего соотношения:
Figure 00000002
где E1 – энергия в конце текущего кадра, ELP0 - энергия импульсной характеристики LP-фильтра для последнего нестертого кадра, принятого перед стиранием кадра, а ELP1 – энергия импульсной характеристики LP-фильтра для принятого первого нестертого кадра, следующего за стиранием кадра.
88. Устройство для осуществления маскирования стирания кадров, вызванного кадрами кодированного звукового сигнала, стертыми во время передачи от кодера к декодеру, причем устройство содержит средство для определения в кодере параметров маскирования/восстановления; средство для передачи в декодер параметров маскирования/восстановления, определенных в кодере; и в декодере, средство для осуществления маскирования стирания кадров и восстановления в декодере в соответствии с принятыми параметрами маскирования/восстановления, определенных средством определения.
89. Устройство по п.88, дополнительно содержащее средство для квантования в кодере параметров маскирования/ восстановления перед передачей параметров маскирования/восстановления в декодер.
90. Устройство по п.88, в котором параметры маскирования/восстановления выбирают из группы, состоящей из параметра классификации сигнала, параметра информации об энергии и параметра информации о фазе.
91. Устройство по п.90, в котором средство для определения параметра информации о фазе содержит средство для определения положения первого импульса, относящегося к голосовой щели, в кадре кодированного звукового сигнала.
92. Устройство по п.88, в котором средство для осуществления маскирования стирания кадров и восстановления декодера содержит средство для проведения восстановления в декодере в соответствии с определенным положением первого импульса, относящегося к голосовой щели, после по меньшей мере одного потерянного голосового приступа.
93. Устройство по п.88, в котором средство для осуществления маскирования стирания кадров и восстановления в декодере содержит средство для формирования искусственным образом, при потере по меньшей мере одного кадра приступа, части периодического возбуждения в виде периодической последовательности импульсов, подвергнутых низкочастотной фильтрации, причем эти импульсы разделены периодом основного тона.
94. Устройство по п.93, в котором устройство содержит средство для квантования положения первого импульса, относящегося к голосовой щели, перед передачей указанного положения первого импульса, относящегося к голосовой щели, в декодер; и средство для формирования периодической части возбуждения содержит средство для реализации периодической последовательности импульсов, подвергнутых низкочастотной фильтрации, путем центрирования первой импульсной характеристики фильтра нижних частот по квантованному положению первого импульса, относящегося к голосовой щели, в соответствии с началом кадра; и помещения каждой из остальных импульсных характеристик фильтра нижних частот на расстоянии, соответствующем среднему значению основного тона, от предыдущей импульсной характеристики вплоть до конца последнего субкадра, затронутого искусственным формированием.
95. Устройство по п.91, в котором средство для определения параметра информации о фазе дополнительно содержит средство для кодирования в кодере формы, знака и амплитуды первого импульса, относящегося к голосовой щели, и средство для передачи кодированных формы, знака и амплитуды из кодера в декодер.
96. Устройство по п.91, в котором средство для определения положения первого импульса, относящегося к голосовой щели, содержит средство для измерения первого импульса, относящегося к голосовой щели, в виде отсчета максимальной амплитуды в периоде основного тона; и средство для квантования положения отсчета максимальной амплитуды в периоде основного тона.
97. Устройство по п.88, в котором звуковой сигнал является речевым сигналом; и средство для определения в кодере параметров маскирования/восстановления содержит средство для классификации последовательных кадров кодированного звукового сигнала как невокализованного кадра, невокализованного перехода, вокализованного перехода, вокализованного кадра или приступа.
98. Устройство по п.97, в котором средство для классификации последовательных кадров содержит средство для классификации в качестве невокализованного каждого кадра, который является невокализованный кадром, каждого кадра без активной речи и каждого вокализованного кадра сдвига, конец которого проявляет тенденцию к невокализованному кадру.
99. Устройство по п.97, в котором средство для классификации последовательных кадров содержит средство для классификации в качестве невокализованного перехода каждого невокализованного кадра, имеющего конец с возможным вокализованным приступом, который слишком короток или сформирован в недостаточной степени для обработки в качестве вокализованного кадра.
100. Устройство по п.97, в котором средство для классификации последовательных кадров содержит средство для классификации в качестве вокализованного перехода каждого вокализованного кадра с относительно слабыми вокализованными характеристиками, в том числе вокализованных кадров с быстро изменяющимися характеристиками и вокализованных сдвигов, которые длятся целый кадр, причем кадр, классифицированный как вокализованный переход, следует только за кадрами, классифицированными как вокализованный переход, вокализованный кадр или приступ.
101. Устройство по п.97, в котором средство для классификации последовательных кадров содержит средство для классификации в качестве вокализованного каждого вокализованного кадра со стабильными характеристиками, причем кадр, классифицированный как вокализованный, следует только за кадрами, классифицированными как вокализованный переход, вокализованный кадр или приступ.
102. Устройство по п.97, в котором средство для классификации последовательных кадров содержит средство для классификации в качестве приступа каждого вокализованного кадра со стабильными характеристиками, следующего после кадра, классифицированного как невокализованный кадр или как невокализованный переход.
103. Устройство по п.97, содержащие средство для определения классификации последовательных кадров кодированного звукового сигнала на основе по меньшей мере части следующих параметров: параметр нормализованной корреляции, параметр спектрального наклона, параметр отношения сигнал-шум, параметр стабильности основного тона, параметр относительной энергии кадра и параметр перехода через нуль.
104. Устройство по п.103, в котором средство для определения классификации последовательных кадров содержит средство для вычисления коэффициента качества на основе параметра нормализованной корреляции, параметра спектрального наклона, параметра отношения сигнал-шум, параметра стабильности основного тона, параметра относительной энергии кадра и параметра перехода через нуль; и средство для сравнения коэффициента качества с пороговыми значениями для определения классификации.
105. Устройство по п.103, содержащее средство для вычисления параметра нормализованной корреляции на основе текущей взвешенной версии речевого сигнала и прошлой взвешенной версии речевого сигнала.
106. Устройство по п.103, содержащее средство для оценивания параметра спектрального наклона как отношения энергии, сконцентрированной на низких частотах, и энергии, сконцентрированной на высоких частотах.
107. Устройство по п.103, содержащее средство для оценивания параметра отношения сигнал-шум как отношения энергии взвешенной версии речевого сигнала текущего кадра и энергии ошибки между взвешенной версией речевого сигнала текущего кадра и взвешенной версией синтезированного речевого сигнала текущего кадра.
108. Устройство по п.103, содержащее средство для вычисления параметра стабильности основного тона в соответствии с оценками основного тона без обратной связи для первой половины текущего кадра, второй половины текущего кадра и упреждающего просмотра.
109. Устройство по п.103, содержащее средство для вычисления параметра относительной энергии кадра как разницы между энергией текущего кадра и долгосрочным средним значением энергии активных речевых кадров.
110. Устройство по п.103, содержащее средство для определения параметра перехода через нуль как числа случаев изменения знака речевого сигнала с первой полярности на вторую полярность.
111. Устройство по п.103, содержащее средство для вычисления по меньшей мере одного из параметров: параметра нормализованной корреляции, параметра спектрального наклона, параметра отношения сигнал-шум, параметра стабильности основного тона, параметра относительной энергии кадра и параметра перехода через нуль с использованием доступного упреждающего просмотра для учета поведения речевого сигнала в следующем кадре.
112. Устройство по п.103, дополнительно содержащее средство для определения классификации последовательных кадров кодированного звукового сигнала также на основе флага обнаружения голосовой активности.
113. Устройство по п.90, в котором звуковой сигнал является речевым сигналом; средство для определения в кодере параметров маскирования/восстановления содержит средство для классификации последовательных кадров кодированного звукового сигнала как невокализованного кадра, невокализованного перехода, вокализованного перехода, вокализованного кадра или приступа; и средство для определения параметров маскирования/восстановления содержит средство для вычисления параметра информации об энергии по отношению к максимальной энергии сигнала для кадров, классифицированных как вокализованные или как приступ, и средство для вычисления параметра информации об энергии по отношению к средней энергии на отсчет для других кадров.
114. Устройство по п.88, в котором средство для определения в кодере параметров маскирования/восстановления содержит средство для вычисления параметра информации вокализации.
115. Устройство по п.114, в котором звуковой сигнал является речевым сигналом; средство для определения в кодере параметров маскирования/восстановления содержит средство для классификации последовательных кадров кодированного звукового сигнала; причем устройство содержит средство для определения классификации последовательных кадров кодированного звукового сигнала на основе параметра нормализованной корреляции; и средство для вычисления параметра информации вокализации содержит средство для оценивания указанного параметра информации вокализации на основе нормализованной корреляции.
116. Устройство по п.88, в котором средство для проведения маскирования стирания кадра и восстановления в декодере содержит: после приема нестертого невокализованного кадра после стирания кадра, средство для генерации непериодической части сигнала возбуждения LP-фильтра; после приема после стирания кадра нестертого кадра, отличного от невокализованного, средство для построения периодической части сигнала возбуждения LP-фильтра путем повторения последнего периода основного тона предыдущего кадра.
117. Устройство по п.116, в котором средство для построения периодической части сигнала возбуждения LP-фильтра содержит фильтр нижних частот для фильтрации повторяющегося последнего периода основного тона предыдущего кадра.
118. Устройство по п.117, в котором средство для определения параметров маскирования/восстановления содержит средство для вычисления параметра информации вокализации; фильтр нижних частот имеет частоту среза; и средство для формирования периодической части сигнала возбуждения содержит средство для динамической регулировки частоты среза по отношению к параметру информации вокализации.
119. Устройство по п.88, в котором средство для осуществления маскирования стирания кадров и восстановления в декодере содержит средство для генерирования случайным образом непериодической, нововведенной части сигнала возбуждения LP-фильтра.
120. Устройство по п.119, в котором средство для генерирования случайным образом непериодической, нововведенной части сигнала возбуждения LP-фильтра содержит средство для генерирования случайного шума.
121. Устройство по п.119, в котором средство для генерирования случайным образом непериодической, нововведенной части сигнала возбуждения LP-фильтра содержит средство для генерирования случайным образом индексов вектора кодовой книги нововведений.
122. Устройство по п.119, в котором звуковой сигнал является речевым сигналом; средство для определения параметров маскирования/восстановления содержит средство для классификации последовательных кадров кодированного звукового сигнала как невокализованного кадра, невокализованного перехода, вокализованного перехода, вокализованного кадра или приступа; и средство для генерирования случайным образом непериодической, нововведенной части сигнала возбуждения LP-фильтра дополнительно содержит фильтр верхних частот для фильтрации нововведенной части сигнала возбуждения; и средство для использования только нововведенной части сигнала возбуждения, если правильно принятый последний кадр является невокализованным.
123. Устройство по п.88, в котором звуковой сигнал является речевым сигналом; средство для определения в кодере параметров маскирования/восстановления содержит средство для классификации последовательных кадров кодированного звукового сигнала как невокализованного кадра, невокализованного перехода, вокализованного перехода, вокализованного кадра или приступа; средство для осуществления маскирования стирания кадров и восстановления в декодере содержит, когда кадр приступа потерян, на что указывает присутствие вокализованного кадра, следующего за стиранием кадра, и невокализованного кадра перед стиранием кадра, средство для искусственного восстановления потерянного приступа путем формирования периодической части сигнала возбуждения в виде периодической последовательности импульсов, подвергнутых низкочастотной фильтрации, которые разделены периодом основного тона.
124. Устройство по п.123, в котором средство для осуществления маскирования стирания кадров и восстановления в декодере дополнительно содержит средство для формирования нововведенной части сигнала возбуждения посредством стандартного декодирования.
125. Устройство по п.124, в котором средство для формирования нововведенной части сигнала возбуждения содержит средство для случайного выбора записей кодовой книги нововведений.
126. Устройство по п.123, в котором средство для искусственного восстановления потерянного приступа содержит средство для ограничения длины искусственно восстановленного приступа, так что по меньшей мере один целый период основного тона формируется путем искусственного восстановления приступа, причем указанное восстановление продолжается до конца текущего субкадра.
127. Устройство по п.126, в котором средство для осуществления маскирования стирания кадров и восстановления в декодере дополнительно содержит, после искусственного восстановления потерянного приступа, средство для возобновления регулярной обработки CELP, где период основного тона является округленным средним значением декодированных периодов основного тона всех субкадров, где используется искусственное восстановление приступа.
128. Устройство по п.90, в котором средство для осуществления маскирования стирания кадров и восстановления в декодере содержит средство для управления энергией синтезированного звукового сигнала, сформированного декодером, причем средство для управления энергией синтезированного звукового сигнала содержит средство для масштабирования синтезированного звукового сигнала для воспроизведения энергии указанного синтезированного звукового сигнала в начале первого нестертого кадра, принятого вслед за стиранием кадра, подобной энергии синтезированного сигнала в конце последнего кадра, стертого во время стирания кадра; и средство для сходимости энергии синтезированного звукового сигнала в принятом первом нестертом кадре к энергии, соответствующей принятому параметру информации об энергии, по направлению к концу принятого первого нестертого кадра при ограничении нарастания энергии.
129. Устройство по п.90, в котором параметр информации об энергии не передается от кодера к декодеру; и средство для осуществления маскирования стирания кадров и восстановления в декодере содержит, в случае когда усиление LP-фильтра первого нестертого кадра, принятого вслед за стиранием кадра, больше усиления LP-фильтра последнего кадра, стертого во время стирания кадра, средство для регулировки энергии сигнала возбуждения LP-фильтра, сформированного в декодере во время принятого первого нестертого кадра, до усиления LP-фильтра принятого первого нестертого кадра.
130. Устройство по п.129, в котором средство для регулировки энергии сигнала возбуждения LP-фильтра, сформированного в декодере во время принятого первого нестертого кадра, до усиления LP-фильтра принятого первого нестертого кадра, содержит средство для использования следующего соотношения:
Figure 00000003
где E1 – энергия в конце текущего кадра, ELP0 - энергия импульсной характеристики LP-фильтра для последнего нестертого кадра, принятого перед стиранием кадра, а ELP1 - энергия импульсной характеристики LP-фильтра для принятого первого нестертого кадра, следующего за стиранием кадра.
131. Устройство по п.128, в котором звуковой сигнал является речевым сигналом; средство для определения в кодере параметров маскирования/восстановления содержит средство для классификации последовательных кадров кодированного звукового сигнала как невокализованного кадра, невокализованного перехода, вокализованного перехода, вокализованного кадра или приступа; и когда первый нестертый кадр, принятый после стирания кадра, классифицирован как ONSET (приступ), средство для осуществления маскирования стирания кадров и восстановления в декодере содержит средство для ограничения до заданного значения усиления, используемого для масштабирования синтезированного звукового сигнала.
132. Устройство по п.128, в котором звуковой сигнал является речевым сигналом; средство для определения в кодере параметров маскирования/восстановления содержит средство для классификации последовательных кадров кодированного звукового сигнала как невокализованного кадра, невокализованного перехода, вокализованного перехода, вокализованного кадра или приступа; и причем устройство содержит средство для обеспечения равенства усиления, используемого для масштабирования синтезированного звукового сигнала в начале первого нестертого кадра, принятого после стирания кадра, усилению, используемому в конце указанного принятого первого нестертого кадра во время перехода от вокализованного кадра к невокализованному кадру, в случае, когда последний нестертый кадр, принятый перед стиранием кадра, классифицирован как вокализованный переход, вокализованный кадр или приступ, а первый нестертый кадр, принятый после стирания кадра, классифицирован как невокализованный кадр; и во время перехода от периода неактивной речи к периоду активной речи, когда последний нестертый кадр, принятый перед стиранием кадра, кодируется как комфортный шум, а первый нестертый кадр, принятый после стирания кадра, кодируется как активная речь.
133. Устройство для осуществления маскирования стирания кадров, вызванного кадрами кодированного звукового сигнала, стертого во время передачи от кодера к декодеру, причем устройство содержит средство для определения в кодере параметров маскирования/восстановления; и средство для передачи в декодер параметров маскирования/восстановления, определенных в кодере.
134. Устройство по п.133, дополнительно содержащее средство для квантования в кодере параметров маскирования/восстановления перед передачей указанных параметров маскирования/восстановления в декодер.
135. Устройство по п.133, в котором параметры маскирования/восстановления выбирают из группы, состоящей из параметра классификации сигнала, параметра информации об энергии и параметра информации о фазе.
136. Устройство по п.135, в котором средство для определения параметра информации о фазе содержит средство для определения положения первого импульса, относящегося к голосовой щели, в кадре кодированного звукового сигнала.
137. Устройство по п.136, в котором средство для определения параметра информации о фазе дополнительно содержит средство для кодирования в кодере формы, знака и амплитуды первого импульса, относящегося к голосовой щели, и средство для передачи кодированных формы, знака и амплитуды от кодера к декодеру.
138. Устройство по п.136, в котором средство для определения положения первого импульса, относящегося к голосовой щели, содержит средство для измерения первого импульса, относящегося к голосовой щели, в виде отсчета максимальной амплитуды в периоде основного тона; и средство для квантования положения отсчета максимальной амплитуды в периоде основного тона.
139. Устройство по п.133, в котором звуковой сигнал является речевым сигналом; и средство для определения в кодере параметров маскирования/восстановления содержит средство для классификации последовательных кадров кодированного звукового сигнала как невокализованного кадра, невокализованного перехода, вокализованного перехода, вокализованного кадра или приступа.
140. Устройство по п.139, в котором средство для классификации последовательных кадров содержит средство для классификации в качестве невокализованного каждого кадра, который является невокализованным кадром, каждого кадра без активной речи и каждого вокализованного кадра сдвига, конец которого проявляет тенденцию к невокализованному кадру.
141. Устройство по п.139, в котором средство для классификации последовательных кадров содержит средство для классификации в качестве невокализованного перехода каждого невокализованного кадра, имеющего конец с возможным вокализованным приступом, который слишком короток или сформирован в недостаточной степени для обработки в качестве вокализованного кадра.
142. Устройство по п.139, в котором средство для классификации последовательных кадров содержит средство для классификации в качестве вокализованного перехода каждого вокализованного кадра с относительно слабыми вокализованными характеристиками, в том числе вокализованных кадров с быстро изменяющимися характеристиками и вокализованных сдвигов, которые длятся целый кадр, причем кадр, классифицированный как вокализованный переход следует только за кадрами, классифицированными как вокализованный переход, вокализованный кадр или приступ.
143. Устройство по п.139, в котором средство для классификации последовательных кадров содержит средство для классификации в качестве вокализованного кадра каждого вокализованного кадра со стабильными характеристиками, причем кадр, классифицированный как вокализованный, следует только за кадрами, классифицированными как вокализованный переход, вокализованный кадр или приступ.
144. Устройство по п.139, в котором средство для классификации последовательных кадров содержит средство для классификации в качестве приступа каждого вокализованного кадра со стабильными характеристиками, следующего после кадра, классифицированного как невокализованный кадр или как невокализованный переход.
145. Устройство по п.139, содержащее средство для определения классификации последовательных кадров кодированного звукового сигнала на основе по меньшей мере части следующих параметров: параметр нормализованной корреляции, параметр спектрального наклона, параметр отношения сигнал-шум, параметр стабильности основного тона, параметр относительной энергии кадра и параметр перехода через нуль.
146. Устройство по п.145, в котором средство для определения классификации последовательных кадров содержит средство для вычисления коэффициента качества на основе параметра нормализованной корреляции, параметра спектрального наклона, параметра отношения сигнал-шум, параметра стабильности основного тона, параметра относительной энергии кадра и параметра перехода через нуль; и средство для сравнения коэффициента качества с пороговыми значениями для определения классификации.
147. Устройство по п.145, содержащее средство для вычисления параметра нормализованной корреляции на основе текущей взвешенной версии речевого сигнала и прошлой взвешенной версии речевого сигнала.
148. Устройство по п.145, содержащее средство для оценивания параметра спектрального наклона как отношения энергии, сконцентрированной на низких частотах, и энергии, сконцентрированной на высоких частотах.
149. Устройство по п.145, содержащее средство для оценивания параметра отношения сигнал-шум как отношения энергии взвешенной версии речевого сигнала текущего кадра и энергии ошибки между взвешенной версией речевого сигнала текущего кадра и взвешенной версией синтезированного речевого сигнала текущего кадра.
150. Устройство по п.145, содержащее средство для вычисления параметра стабильности основного тона в соответствии с оценками основного тона без обратной связи для первой половины текущего кадра, второй половины текущего кадра и упреждающего просмотра.
151. Устройство по п.145, содержащее средство для вычисления параметра относительной энергии кадра как разницы между энергией текущего кадра и долгосрочным средним значением энергии активных речевых кадров.
152. Устройство по п.145, содержащее средство для определения параметра перехода через нуль как числа случаев изменения знака речевого сигнала с первой полярности на вторую полярность.
153. Устройство по п.45, содержащее средство для вычисления по меньшей мере одного из параметров: параметра нормализованной корреляции, параметра спектрального наклона, параметра отношения сигнал-шум, параметра стабильности основного тона, параметра относительной энергии кадра и параметра перехода через нуль с использованием доступного упреждающего просмотра для учета поведения речевого сигнала в следующем кадре.
154. Устройство по п.145, дополнительно содержащее средство для определения классификации последовательных кадров кодированного звукового сигнала также на основе флага обнаружения голосовой активности.
155. Устройство по п.135, в котором звуковой сигнал является речевым сигналом; средство для определения в кодере параметров маскирования/восстановления содержит средство для классификации последовательных кадров кодированного звукового сигнала как невокализованного кадра, невокализованного перехода, вокализованного перехода, вокализованного кадра или приступа; и средство для определения параметров маскирования/восстановления содержит средство для вычисления параметра информации об энергии по отношению к максимальной энергии сигнала для кадров, классифицированных как вокализованные или как приступ, и средство для вычисления параметра информации об энергии по отношению к средней энергии на отсчет для других кадров.
156. Устройство по п.133, в котором средство для определения в кодере параметров маскирования/восстановления содержит средство для вычисления параметра информации вокализации.
157. Устройство по п.156, в котором звуковой сигнал является речевым сигналом; средство для определения в кодере параметров маскирования/восстановления содержит средство для классификации последовательных кадров кодированного звукового сигнала; причем устройство содержит средство для определения классификации последовательных кадров кодированного звукового сигнала на основе параметра нормализованной корреляции; и средство для вычисления параметра информации вокализации содержит средство для оценивания параметра информации вокализации на основе нормализованной корреляции.
158. Устройство для маскирования стирания кадров, вызванного кадрами, стертыми во время передачи звукового сигнала, кодированного под видом параметров кодирования сигнала от кодера к декодеру, причем устройство содержит средство для определения в декодере параметров маскирования/восстановления из параметров кодирования сигнала; в декодере, средство для осуществления маскирования стертых кадров и восстановления декодера в соответствии с параметрами маскирования/восстановления, определенными средством определения.
159. Устройство по п.158, в котором параметры маскирования/восстановления выбирают из группы, состоящей из параметра классификации сигнала, параметра информации об энергии и параметра информации о фазе.
160. Устройство по п.158, в котором звуковой сигнал является речевым сигналом; и средство для определения в декодере параметров маскирования/восстановления содержит средство для классификации последовательных кадров кодированного звукового сигнала как невокализованного кадра, невокализованного перехода, вокализованного перехода, вокализованного кадра или приступа.
161. Устройство по п.158, в котором средство для определения в декодере параметров маскирования/восстановления содержит средство для вычисления параметра информации вокализации.
162. Устройство по п.158, в котором средство для осуществления маскирования стирания кадров и восстановления декодера содержит: после приема нестертого невокализованного кадра после стирания кадра, средство для генерирования непериодической части сигнала возбуждения LP-фильтра; после приема после стирания кадра нестертого кадра, отличного от невокализованного, средство для построения периодической части сигнала возбуждения LP-фильтра путем повторения последнего периода основного тона предыдущего кадра.
163. Устройство по п.162, в котором средство для формирования периодической части сигнала возбуждения содержит фильтр нижних частот для фильтрации повторяющегося последнего периода основного тона предыдущего кадра.
164. Устройство по п.163, в котором средство для определения в декодере параметров маскирования/восстановления содержит средство для вычисления параметра информации вокализации; фильтр нижних частот имеет частоту среза; и средство для формирования периодической части сигнала возбуждения LP-фильтра содержит средство для динамической регулировки частоты среза по отношению к параметру информации вокализации.
165. Устройство по п.158, в котором средство для осуществления маскирования стирания кадров и восстановления в декодере содержит средство для генерирования случайным образом непериодической, нововведенной части сигнала возбуждения LP-фильтра.
166. Устройство по п.165, в котором средство для генерирования случайным образом непериодической, нововведенной части сигнала возбуждения LP-фильтра содержит средство для генерирования случайного шума.
167. Устройство по п.165, в котором средство для генерирования случайным образом непериодической, нововведенной части сигнала возбуждения LP-фильтра содержит средство для генерирования случайным образом индексов вектора кодовой книги нововведений.
168. Устройство по п.165, в котором звуковой сигнал является речевым сигналом; средство для определения в декодере параметров маскирования/восстановления содержит средство для классификации последовательных кадров кодированного звукового сигнала как невокализованного кадра, невокализованного перехода, вокализованного перехода, вокализованного кадра или как приступа; и средство для генерирования случайным образом непериодической, нововведенной части сигнала возбуждения LP-фильтра дополнительно содержит фильтр верхних частот для фильтрации нововведенной части сигнала возбуждения LP-фильтра, если принятый последний нестертый кадр отличается от невокализованного; и средство для использования только нововведенной части сигнала возбуждения LP-фильтра, если принятый последний нестертый кадр является невокализованным.
169. Устройство по п.165, в котором звуковой сигнал является речевым сигналом; средство для определения в декодере параметров маскирования/восстановления содержит средство для классификации последовательных кадров кодированного звукового сигнала как невокализованного кадра, невокализованного перехода, вокализованного перехода, вокализованного кадра или приступа; средство для проведения маскирования стирания кадров и восстановления декодера содержит, когда кадр приступа потерян, на что указывает присутствие вокализованного кадра, следующего за стиранием кадра, и невокализованного кадра перед стиранием кадра, средство для искусственного восстановления потерянного приступа путем формирования периодической части сигнала возбуждения в виде периодической последовательности импульсов, подвергнутых низкочастотной фильтрации, которые разделены периодом основного тона.
170. Устройство по п.169, в котором средство для осуществления маскирования стирания кадров и восстановления в декодере дополнительно содержит средство для формирования нововведенной части сигнала возбуждения LP-фильтра посредством стандартного декодирования.
171. Устройство по п.170, в котором средство для формирования нововведенной части сигнала возбуждения LP-фильтра содержит средство для случайного выбора записей кодовой книги нововведений.
172. Устройство по п.169, в котором средство для искусственного восстановления потерянного приступа содержит средство для ограничения длины искусственно сформированного приступа, так что по меньшей мере один целый период основного тона формируется путем искусственного восстановления приступа, причем указанное восстановление продолжается до конца текущего субкадра.
173. Устройство по п.172, в котором средство для осуществления маскирования стирания кадров и восстановления в декодере дополнительно содержит, после искусственного восстановления потерянного приступа, средство для возобновления регулярной обработки CELP, где период основного тона является округленным средним значением декодированных периодов основного тона всех субкадров, где используется искусственное восстановление приступа.
174. Устройство по п.159, в котором параметр информации об энергии не передается от кодера к декодеру; и средство для осуществления маскирования стирания кадров и восстановления в декодере содержит в случае, когда усиление LP-фильтра первого нестертого кадра, принятого вслед за стиранием кадра, больше усиления LP-фильтра последнего кадра, стертого во время стирания кадра, средство для регулировки энергии сигнала возбуждения LP-фильтра, сформированного в декодере во время принятого первого нестертого кадра, до усиления LP-фильтра принятого первого нестертого кадра, с использованием следующего соотношения:
Figure 00000004
где E1 – энергия в конце текущего кадра, ELP0 - энергия импульсной характеристики LP-фильтра для последнего нестертого кадра, принятого перед стиранием кадра, а ELP1 - энергия импульсной характеристики LP-фильтра для принятого первого нестертого кадра, следующего за стиранием кадра.
175. Система для кодирования и декодирования звукового сигнала, содержащая кодер звукового сигнала, реагирующий на звуковой сигнал, для создания набора параметров кодирования сигнала; средство для передачи параметров кодирования сигнала в декодер; декодер для синтеза звукового сигнала в соответствии с параметрами кодирования сигнала; и устройство по любому из пп.88-132 для маскирования стирания кадров, вызванного кадрами кодированного звукового сигнала, стертыми во время передачи от кодера к декодеру.
176. Декодер для декодирования кодированного звукового сигнала, содержащий средство, реагирующее на кодированный звуковой сигнал, для восстановления из кодированного звукового сигнала набора параметров кодирования сигнала; средство для синтеза звукового сигнала в соответствии с параметрами кодирования сигнала; и устройство по любому из пп.158-174 для маскирования стирания кадров, вызванного кадрами кодированного звукового сигнала, стертыми во время передачи от кодера к декодеру.
177. Кодер для кодирования звукового сигнала, содержащий средство, реагирующее на звуковой сигнал, для создания набора параметров кодирования сигнала; средство для передачи набора параметров кодирования сигнала в декодер в соответствии с параметрами кодирования сигнала, для восстановления звукового сигнала; и устройство по любому из пп.133-157 для проведения маскирования стирания кадров, вызванного кадрами, стертыми во время передачи параметров кодирования сигнала от кодера к декодеру.
RU2004138286/09A 2002-05-31 2003-05-30 Способ и устройство для эффективного маскирования стертых кадров в речевых кодеках на основе линейного предсказания RU2325707C2 (ru)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CA2,388,439 2002-05-31
CA002388439A CA2388439A1 (en) 2002-05-31 2002-05-31 A method and device for efficient frame erasure concealment in linear predictive based speech codecs

Publications (2)

Publication Number Publication Date
RU2004138286A true RU2004138286A (ru) 2005-06-10
RU2325707C2 RU2325707C2 (ru) 2008-05-27

Family

ID=29589088

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2004138286/09A RU2325707C2 (ru) 2002-05-31 2003-05-30 Способ и устройство для эффективного маскирования стертых кадров в речевых кодеках на основе линейного предсказания

Country Status (18)

Country Link
US (1) US7693710B2 (ru)
EP (1) EP1509903B1 (ru)
JP (1) JP4658596B2 (ru)
KR (1) KR101032119B1 (ru)
CN (1) CN100338648C (ru)
AU (1) AU2003233724B2 (ru)
BR (3) BR122017019860B1 (ru)
CA (2) CA2388439A1 (ru)
DK (1) DK1509903T3 (ru)
ES (1) ES2625895T3 (ru)
MX (1) MXPA04011751A (ru)
MY (1) MY141649A (ru)
NO (1) NO20045578L (ru)
NZ (1) NZ536238A (ru)
PT (1) PT1509903T (ru)
RU (1) RU2325707C2 (ru)
WO (1) WO2003102921A1 (ru)
ZA (1) ZA200409643B (ru)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2496156C2 (ru) * 2008-03-28 2013-10-20 Франс Телеком Маскирование ошибки передачи в цифровом аудиосигнале в иерархической структуре декодирования

Families Citing this family (150)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7558295B1 (en) * 2003-06-05 2009-07-07 Mindspeed Technologies, Inc. Voice access model using modem and speech compression technologies
JP4135621B2 (ja) * 2003-11-05 2008-08-20 沖電気工業株式会社 受信装置および方法
KR100587953B1 (ko) * 2003-12-26 2006-06-08 한국전자통신연구원 대역-분할 광대역 음성 코덱에서의 고대역 오류 은닉 장치 및 그를 이용한 비트스트림 복호화 시스템
CA2457988A1 (en) * 2004-02-18 2005-08-18 Voiceage Corporation Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization
US7668712B2 (en) 2004-03-31 2010-02-23 Microsoft Corporation Audio encoding and decoding with intra frames and adaptive forward error correction
CN1989548B (zh) * 2004-07-20 2010-12-08 松下电器产业株式会社 语音解码装置及补偿帧生成方法
FR2880724A1 (fr) * 2005-01-11 2006-07-14 France Telecom Procede et dispositif de codage optimise entre deux modeles de prediction a long terme
US9047860B2 (en) 2005-01-31 2015-06-02 Skype Method for concatenating frames in communication system
KR100612889B1 (ko) * 2005-02-05 2006-08-14 삼성전자주식회사 선스펙트럼 쌍 파라미터 복원 방법 및 장치와 그 음성복호화 장치
US20070147518A1 (en) * 2005-02-18 2007-06-28 Bruno Bessette Methods and devices for low-frequency emphasis during audio compression based on ACELP/TCX
CN101138174B (zh) 2005-03-14 2013-04-24 松下电器产业株式会社 可扩展解码装置和可扩展解码方法
US7930176B2 (en) 2005-05-20 2011-04-19 Broadcom Corporation Packet loss concealment for block-independent speech codecs
US7177804B2 (en) * 2005-05-31 2007-02-13 Microsoft Corporation Sub-band voice codec with multi-stage codebooks and redundant coding
US7707034B2 (en) 2005-05-31 2010-04-27 Microsoft Corporation Audio codec post-filter
US7831421B2 (en) * 2005-05-31 2010-11-09 Microsoft Corporation Robust decoder
ES2356492T3 (es) * 2005-07-22 2011-04-08 France Telecom Método de conmutación de tasa de transmisión en decodificación de audio escalable en tasa de transmisión y ancho de banda.
KR100723409B1 (ko) * 2005-07-27 2007-05-30 삼성전자주식회사 프레임 소거 은닉장치 및 방법, 및 이를 이용한 음성복호화 방법 및 장치
US8620644B2 (en) * 2005-10-26 2013-12-31 Qualcomm Incorporated Encoder-assisted frame loss concealment techniques for audio coding
US7805297B2 (en) * 2005-11-23 2010-09-28 Broadcom Corporation Classification-based frame loss concealment for audio signals
US8255207B2 (en) 2005-12-28 2012-08-28 Voiceage Corporation Method and device for efficient frame erasure concealment in speech codecs
KR101151746B1 (ko) 2006-01-02 2012-06-15 삼성전자주식회사 오디오 신호용 잡음제거 방법 및 장치
FR2897977A1 (fr) * 2006-02-28 2007-08-31 France Telecom Procede de limitation de gain d'excitation adaptative dans un decodeur audio
EP1990800B1 (en) * 2006-03-17 2016-11-16 Panasonic Intellectual Property Management Co., Ltd. Scalable encoding device and scalable encoding method
KR100900438B1 (ko) * 2006-04-25 2009-06-01 삼성전자주식회사 음성 패킷 복구 장치 및 방법
CN1983909B (zh) 2006-06-08 2010-07-28 华为技术有限公司 一种丢帧隐藏装置和方法
US8218529B2 (en) * 2006-07-07 2012-07-10 Avaya Canada Corp. Device for and method of terminating a VoIP call
CN101101753B (zh) * 2006-07-07 2011-04-20 乐金电子(昆山)电脑有限公司 音频帧识别方法
US8255213B2 (en) 2006-07-12 2012-08-28 Panasonic Corporation Speech decoding apparatus, speech encoding apparatus, and lost frame concealment method
JP5052514B2 (ja) * 2006-07-12 2012-10-17 パナソニック株式会社 音声復号装置
US8015000B2 (en) * 2006-08-03 2011-09-06 Broadcom Corporation Classification-based frame loss concealment for audio signals
US8280728B2 (en) * 2006-08-11 2012-10-02 Broadcom Corporation Packet loss concealment for a sub-band predictive coder based on extrapolation of excitation waveform
US8005678B2 (en) * 2006-08-15 2011-08-23 Broadcom Corporation Re-phasing of decoder states after packet loss
CN101375330B (zh) * 2006-08-15 2012-02-08 美国博通公司 丢包后解码音频信号的时间扭曲的方法
JP4827661B2 (ja) * 2006-08-30 2011-11-30 富士通株式会社 信号処理方法及び装置
CN101155140A (zh) * 2006-10-01 2008-04-02 华为技术有限公司 音频流错误隐藏的方法、装置和系统
US7877253B2 (en) * 2006-10-06 2011-01-25 Qualcomm Incorporated Systems, methods, and apparatus for frame erasure recovery
JP5166425B2 (ja) * 2006-10-24 2013-03-21 ヴォイスエイジ・コーポレーション 音声信号中の遷移フレームの符号化のための方法およびデバイス
JP5123516B2 (ja) * 2006-10-30 2013-01-23 株式会社エヌ・ティ・ティ・ドコモ 復号装置、符号化装置、復号方法及び符号化方法
DE602006015328D1 (de) * 2006-11-03 2010-08-19 Psytechnics Ltd Abtastfehlerkompensation
EP1921608A1 (en) * 2006-11-13 2008-05-14 Electronics And Telecommunications Research Institute Method of inserting vector information for estimating voice data in key re-synchronization period, method of transmitting vector information, and method of estimating voice data in key re-synchronization using vector information
KR100862662B1 (ko) 2006-11-28 2008-10-10 삼성전자주식회사 프레임 오류 은닉 방법 및 장치, 이를 이용한 오디오 신호복호화 방법 및 장치
KR101291193B1 (ko) 2006-11-30 2013-07-31 삼성전자주식회사 프레임 오류은닉방법
WO2008072671A1 (ja) * 2006-12-13 2008-06-19 Panasonic Corporation 音声復号化装置およびパワ調整方法
US8364472B2 (en) 2007-03-02 2013-01-29 Panasonic Corporation Voice encoding device and voice encoding method
ES2394515T3 (es) * 2007-03-02 2013-02-01 Telefonaktiebolaget Lm Ericsson (Publ) Métodos y adaptaciones en una red de telecomunicaciones
BRPI0808202A8 (pt) * 2007-03-02 2016-11-22 Panasonic Corp Dispositivo de codificação e método de codificação.
WO2008108080A1 (ja) 2007-03-02 2008-09-12 Panasonic Corporation 音声符号化装置及び音声復号装置
US20080249783A1 (en) * 2007-04-05 2008-10-09 Texas Instruments Incorporated Layered Code-Excited Linear Prediction Speech Encoder and Decoder Having Plural Codebook Contributions in Enhancement Layers Thereof and Methods of Layered CELP Encoding and Decoding
US20080249767A1 (en) * 2007-04-05 2008-10-09 Ali Erdem Ertan Method and system for reducing frame erasure related error propagation in predictive speech parameter coding
EP2112653A4 (en) * 2007-05-24 2013-09-11 Panasonic Corp AUDIO DEODICATION DEVICE, AUDIO CODING METHOD, PROGRAM AND INTEGRATED CIRCUIT
CN101325631B (zh) * 2007-06-14 2010-10-20 华为技术有限公司 一种估计基音周期的方法和装置
JP5618826B2 (ja) * 2007-06-14 2014-11-05 ヴォイスエイジ・コーポレーション Itu.t勧告g.711と相互運用可能なpcmコーデックにおいてフレーム消失を補償する装置および方法
KR100906766B1 (ko) * 2007-06-18 2009-07-09 한국전자통신연구원 키 재동기 구간의 음성 데이터 예측을 위한 음성 데이터송수신 장치 및 방법
CN100524462C (zh) 2007-09-15 2009-08-05 华为技术有限公司 对高带信号进行帧错误隐藏的方法及装置
KR101449431B1 (ko) 2007-10-09 2014-10-14 삼성전자주식회사 계층형 광대역 오디오 신호의 부호화 방법 및 장치
US8326610B2 (en) * 2007-10-24 2012-12-04 Red Shift Company, Llc Producing phonitos based on feature vectors
CN100550712C (zh) * 2007-11-05 2009-10-14 华为技术有限公司 一种信号处理方法和处理装置
CN101207665B (zh) 2007-11-05 2010-12-08 华为技术有限公司 一种衰减因子的获取方法
KR100998396B1 (ko) * 2008-03-20 2010-12-03 광주과학기술원 프레임 손실 은닉 방법, 프레임 손실 은닉 장치 및 음성송수신 장치
US8768690B2 (en) 2008-06-20 2014-07-01 Qualcomm Incorporated Coding scheme selection for low-bit-rate applications
US20090319263A1 (en) * 2008-06-20 2009-12-24 Qualcomm Incorporated Coding of transitional speech frames for low-bit-rate applications
US20090319261A1 (en) * 2008-06-20 2009-12-24 Qualcomm Incorporated Coding of transitional speech frames for low-bit-rate applications
ES2683077T3 (es) * 2008-07-11 2018-09-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Codificador y decodificador de audio para codificar y decodificar tramas de una señal de audio muestreada
DE102008042579B4 (de) * 2008-10-02 2020-07-23 Robert Bosch Gmbh Verfahren zur Fehlerverdeckung bei fehlerhafter Übertragung von Sprachdaten
US8706479B2 (en) * 2008-11-14 2014-04-22 Broadcom Corporation Packet loss concealment for sub-band codecs
CN101599272B (zh) * 2008-12-30 2011-06-08 华为技术有限公司 基音搜索方法及装置
CN101958119B (zh) * 2009-07-16 2012-02-29 中兴通讯股份有限公司 一种改进的离散余弦变换域音频丢帧补偿器和补偿方法
CN102884574B (zh) * 2009-10-20 2015-10-14 弗兰霍菲尔运输应用研究公司 音频信号编码器、音频信号解码器、使用混迭抵消来将音频信号编码或解码的方法
EP2502229B1 (en) * 2009-11-19 2017-08-09 Telefonaktiebolaget LM Ericsson (publ) Methods and arrangements for loudness and sharpness compensation in audio codecs
US9020812B2 (en) * 2009-11-24 2015-04-28 Lg Electronics Inc. Audio signal processing method and device
WO2011074233A1 (ja) * 2009-12-14 2011-06-23 パナソニック株式会社 ベクトル量子化装置、音声符号化装置、ベクトル量子化方法、及び音声符号化方法
RU2510974C2 (ru) 2010-01-08 2014-04-10 Ниппон Телеграф Энд Телефон Корпорейшн Способ кодирования, способ декодирования, устройство кодера, устройство декодера, программа и носитель записи
US20110196673A1 (en) * 2010-02-11 2011-08-11 Qualcomm Incorporated Concealing lost packets in a sub-band coding decoder
US8660195B2 (en) 2010-08-10 2014-02-25 Qualcomm Incorporated Using quantized prediction memory during fast recovery coding
EP2975610B1 (en) * 2010-11-22 2019-04-24 Ntt Docomo, Inc. Audio encoding device and method
DK3518234T3 (da) * 2010-11-22 2024-01-02 Ntt Docomo Inc Audiokodningsindretning og fremgangsmåde
JP5724338B2 (ja) * 2010-12-03 2015-05-27 ソニー株式会社 符号化装置および符号化方法、復号装置および復号方法、並びにプログラム
CN103503062B (zh) 2011-02-14 2016-08-10 弗劳恩霍夫应用研究促进协会 用于使用对齐的前瞻部分将音频信号编码及解码的装置与方法
TWI488176B (zh) 2011-02-14 2015-06-11 Fraunhofer Ges Forschung 音訊信號音軌脈衝位置之編碼與解碼技術
CN103534754B (zh) 2011-02-14 2015-09-30 弗兰霍菲尔运输应用研究公司 在不活动阶段期间利用噪声合成的音频编解码器
PL3239978T3 (pl) 2011-02-14 2019-07-31 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Kodowanie i dekodowanie pozycji impulsów ścieżek sygnału audio
BR112012029132B1 (pt) 2011-02-14 2021-10-05 Fraunhofer - Gesellschaft Zur Förderung Der Angewandten Forschung E.V Representação de sinal de informações utilizando transformada sobreposta
JP5625126B2 (ja) 2011-02-14 2014-11-12 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン スペクトル領域ノイズ整形を使用する線形予測ベースコーディングスキーム
JP5849106B2 (ja) * 2011-02-14 2016-01-27 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン 低遅延の統合されたスピーチ及びオーディオ符号化におけるエラー隠しのための装置及び方法
CA2827249C (en) 2011-02-14 2016-08-23 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for processing a decoded audio signal in a spectral domain
KR101525185B1 (ko) 2011-02-14 2015-06-02 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 트랜지언트 검출 및 품질 결과를 사용하여 일부분의 오디오 신호를 코딩하기 위한 장치 및 방법
JP2012203351A (ja) * 2011-03-28 2012-10-22 Yamaha Corp 子音識別装置、およびプログラム
US9026434B2 (en) 2011-04-11 2015-05-05 Samsung Electronic Co., Ltd. Frame erasure concealment for a multi rate speech and audio codec
DK2774145T3 (da) 2011-11-03 2020-07-20 Voiceage Evs Llc Forbedring af ikke-taleindhold til celp-afkoder med lav hastighed
JP6012203B2 (ja) * 2012-03-05 2016-10-25 キヤノン株式会社 画像処理装置、及び制御方法
US20130282373A1 (en) * 2012-04-23 2013-10-24 Qualcomm Incorporated Systems and methods for audio signal processing
US9589570B2 (en) 2012-09-18 2017-03-07 Huawei Technologies Co., Ltd. Audio classification based on perceptual quality for low or medium bit rates
US9123328B2 (en) * 2012-09-26 2015-09-01 Google Technology Holdings LLC Apparatus and method for audio frame loss recovery
CN103714821A (zh) 2012-09-28 2014-04-09 杜比实验室特许公司 基于位置的混合域数据包丢失隐藏
CN102984122A (zh) * 2012-10-09 2013-03-20 中国科学技术大学苏州研究院 基于amr-wb码率伪装的ip语音隐蔽通信方法
ES2688021T3 (es) * 2012-12-21 2018-10-30 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Adición de ruido de confort para modelar ruido de fondo a bajas tasas de bits
CA2894625C (en) 2012-12-21 2017-11-07 Anthony LOMBARD Generation of a comfort noise with high spectro-temporal resolution in discontinuous transmission of audio signals
US9601125B2 (en) * 2013-02-08 2017-03-21 Qualcomm Incorporated Systems and methods of performing noise modulation and gain adjustment
EP3432304B1 (en) * 2013-02-13 2020-06-17 Telefonaktiebolaget LM Ericsson (publ) Frame error concealment
US9842598B2 (en) * 2013-02-21 2017-12-12 Qualcomm Incorporated Systems and methods for mitigating potential frame instability
KR102148407B1 (ko) * 2013-02-27 2020-08-27 한국전자통신연구원 소스 필터를 이용한 주파수 스펙트럼 처리 장치 및 방법
SI3537437T1 (sl) * 2013-03-04 2021-08-31 Voiceage Evs Llc Naprava in postopek za zmanjšanje kvantizacijskega šuma v časovnem dekoderju
CN104217723B (zh) 2013-05-30 2016-11-09 华为技术有限公司 信号编码方法及设备
PL3011555T3 (pl) * 2013-06-21 2018-09-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Rekonstrukcja ramki sygnału mowy
EP3011561B1 (en) 2013-06-21 2017-05-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for improved signal fade out in different domains during error concealment
KR101757338B1 (ko) 2013-06-21 2017-07-26 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에.베. 오디오 신호의 대체 프레임에 대한 스펙트럼 계수들을 획득하기 위한 방법과 장치, 오디오 디코더, 오디오 수신기 및 오디오 신호들의 전송을 위한 시스템
SG11201510463WA (en) 2013-06-21 2016-01-28 Fraunhofer Ges Forschung Apparatus and method for improved concealment of the adaptive codebook in acelp-like concealment employing improved pitch lag estimation
ES2697474T3 (es) 2013-06-21 2019-01-24 Fraunhofer Ges Forschung Decodificador de audio que tiene un módulo de extensión de ancho de banda con un módulo de ajuste de energía
CN108364657B (zh) * 2013-07-16 2020-10-30 超清编解码有限公司 处理丢失帧的方法和解码器
CN107818789B (zh) 2013-07-16 2020-11-17 华为技术有限公司 解码方法和解码装置
JP5981408B2 (ja) * 2013-10-29 2016-08-31 株式会社Nttドコモ 音声信号処理装置、音声信号処理方法、及び音声信号処理プログラム
PT3288026T (pt) * 2013-10-31 2020-07-20 Fraunhofer Ges Forschung Descodificador áudio e método para fornecer uma informação de áudio descodificada utilizando uma ocultação de erro baseada num sinal de excitação no domínio de tempo
KR101854296B1 (ko) 2013-10-31 2018-05-03 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 시간 도메인 여기 신호를 변형하는 오류 은닉을 사용하여 디코딩된 오디오 정보를 제공하기 위한 오디오 디코더 및 방법
FR3013496A1 (fr) * 2013-11-15 2015-05-22 Orange Transition d'un codage/decodage par transformee vers un codage/decodage predictif
CN104751849B (zh) 2013-12-31 2017-04-19 华为技术有限公司 语音频码流的解码方法及装置
KR102354331B1 (ko) * 2014-02-24 2022-01-21 삼성전자주식회사 신호 분류 방법 및 장치, 및 이를 이용한 오디오 부호화방법 및 장치
EP2922056A1 (en) 2014-03-19 2015-09-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method and corresponding computer program for generating an error concealment signal using power compensation
EP2922055A1 (en) * 2014-03-19 2015-09-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method and corresponding computer program for generating an error concealment signal using individual replacement LPC representations for individual codebook information
EP2922054A1 (en) 2014-03-19 2015-09-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method and corresponding computer program for generating an error concealment signal using an adaptive noise estimation
CN107369454B (zh) 2014-03-21 2020-10-27 华为技术有限公司 语音频码流的解码方法及装置
PL3385948T3 (pl) * 2014-03-24 2020-01-31 Nippon Telegraph And Telephone Corporation Sposób kodowania, koder, program i nośnik zapisu
LT3511935T (lt) * 2014-04-17 2021-01-11 Voiceage Evs Llc Būdas, įrenginys ir kompiuteriu nuskaitoma neperkeliama atmintis garso signalų tiesinės prognozės kodavimui ir dekodavimui po perėjimo tarp kadrų su skirtingais mėginių ėmimo greičiais
US9697843B2 (en) * 2014-04-30 2017-07-04 Qualcomm Incorporated High band excitation signal generation
CN106415717B (zh) * 2014-05-15 2020-03-13 瑞典爱立信有限公司 音频信号分类和编码
NO2780522T3 (ru) 2014-05-15 2018-06-09
CN105225666B (zh) 2014-06-25 2016-12-28 华为技术有限公司 处理丢失帧的方法和装置
EP2980797A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder, method and computer program using a zero-input-response to obtain a smooth transition
KR102061316B1 (ko) * 2014-07-28 2019-12-31 니폰 덴신 덴와 가부시끼가이샤 부호화 방법, 장치, 프로그램 및 기록 매체
TWI602172B (zh) * 2014-08-27 2017-10-11 弗勞恩霍夫爾協會 使用參數以加強隱蔽之用於編碼及解碼音訊內容的編碼器、解碼器及方法
CN105590629B (zh) * 2014-11-18 2018-09-21 华为终端(东莞)有限公司 一种语音处理的方法及装置
CN107004417B (zh) 2014-12-09 2021-05-07 杜比国际公司 Mdct域错误掩盖
CN105810214B (zh) * 2014-12-31 2019-11-05 展讯通信(上海)有限公司 语音激活检测方法及装置
DE102016101023A1 (de) * 2015-01-22 2016-07-28 Sennheiser Electronic Gmbh & Co. Kg Digitales Drahtlos-Audioübertragungssystem
US9830921B2 (en) * 2015-08-17 2017-11-28 Qualcomm Incorporated High-band target signal control
US20170365271A1 (en) * 2016-06-15 2017-12-21 Adam Kupryjanow Automatic speech recognition de-reverberation
US9679578B1 (en) 2016-08-31 2017-06-13 Sorenson Ip Holdings, Llc Signal clipping compensation
CN108011686B (zh) * 2016-10-31 2020-07-14 腾讯科技(深圳)有限公司 信息编码帧丢失恢复方法和装置
CN109496333A (zh) * 2017-06-26 2019-03-19 华为技术有限公司 一种丢帧补偿方法及设备
CN107564533A (zh) * 2017-07-12 2018-01-09 同济大学 基于信源先验信息的语音帧修复方法和装置
WO2019056108A1 (en) * 2017-09-20 2019-03-28 Voiceage Corporation METHOD AND DEVICE FOR EFFICIENT DISTRIBUTION OF A BINARY BUDGET IN A CELP CODEC
KR20230058546A (ko) * 2018-04-05 2023-05-03 텔레호낙티에볼라게트 엘엠 에릭슨(피유비엘) 컴포트 노이즈 생성 지원
US10763885B2 (en) 2018-11-06 2020-09-01 Stmicroelectronics S.R.L. Method of error concealment, and associated device
US10784988B2 (en) 2018-12-21 2020-09-22 Microsoft Technology Licensing, Llc Conditional forward error correction for network data
US10803876B2 (en) * 2018-12-21 2020-10-13 Microsoft Technology Licensing, Llc Combined forward and backward extrapolation of lost network data
CN111063362B (zh) * 2019-12-11 2022-03-22 中国电子科技集团公司第三十研究所 一种数字语音通信噪音消除和语音恢复方法及装置
CN113766239A (zh) * 2020-06-05 2021-12-07 于江鸿 数据处理的方法和系统
US11388721B1 (en) * 2020-06-08 2022-07-12 Sprint Spectrum L.P. Use of voice muting as a basis to limit application of resource-intensive service
CN113113030B (zh) * 2021-03-22 2022-03-22 浙江大学 一种基于降噪自编码器的高维受损数据无线传输方法
EP4329202A1 (en) 2021-05-25 2024-02-28 Samsung Electronics Co., Ltd. Neural network-based self-correcting min-sum decoder and electronic device comprising same
KR20220159071A (ko) * 2021-05-25 2022-12-02 삼성전자주식회사 신경망 자기 정정 최소합 복호기 및 이를 포함하는 전자 장치

Family Cites Families (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4707857A (en) * 1984-08-27 1987-11-17 John Marley Voice command recognition system having compact significant feature data
US5754976A (en) 1990-02-23 1998-05-19 Universite De Sherbrooke Algebraic codebook with signal-selected pulse amplitude/position combinations for fast coding of speech
US5701392A (en) 1990-02-23 1997-12-23 Universite De Sherbrooke Depth-first algebraic-codebook search for fast coding of speech
CA2010830C (en) 1990-02-23 1996-06-25 Jean-Pierre Adoul Dynamic codebook for efficient speech coding based on algebraic codes
US5226084A (en) * 1990-12-05 1993-07-06 Digital Voice Systems, Inc. Methods for speech quantization and error correction
US5122875A (en) 1991-02-27 1992-06-16 General Electric Company An HDTV compression system
EP0533257B1 (en) * 1991-09-20 1995-06-28 Koninklijke Philips Electronics N.V. Human speech processing apparatus for detecting instants of glottal closure
JP3137805B2 (ja) * 1993-05-21 2001-02-26 三菱電機株式会社 音声符号化装置、音声復号化装置、音声後処理装置及びこれらの方法
US5701390A (en) * 1995-02-22 1997-12-23 Digital Voice Systems, Inc. Synthesis of MBE-based coded speech using regenerated phase information
US5664055A (en) * 1995-06-07 1997-09-02 Lucent Technologies Inc. CS-ACELP speech compression system with adaptive pitch prediction filter gain based on a measure of periodicity
US5732389A (en) * 1995-06-07 1998-03-24 Lucent Technologies Inc. Voiced/unvoiced classification of speech for excitation codebook selection in celp speech decoding during frame erasures
US5699485A (en) * 1995-06-07 1997-12-16 Lucent Technologies Inc. Pitch delay modification during frame erasures
US5864798A (en) * 1995-09-18 1999-01-26 Kabushiki Kaisha Toshiba Method and apparatus for adjusting a spectrum shape of a speech signal
SE9700772D0 (sv) * 1997-03-03 1997-03-03 Ericsson Telefon Ab L M A high resolution post processing method for a speech decoder
US6233550B1 (en) * 1997-08-29 2001-05-15 The Regents Of The University Of California Method and apparatus for hybrid coding of speech at 4kbps
KR20000068950A (ko) * 1997-09-12 2000-11-25 요트.게.아. 롤페즈 신호의 미싱 부분을 복구하는 기능이 향상된 전송 시스템
FR2774827B1 (fr) * 1998-02-06 2000-04-14 France Telecom Procede de decodage d'un flux binaire representatif d'un signal audio
US7272556B1 (en) * 1998-09-23 2007-09-18 Lucent Technologies Inc. Scalable and embedded codec for speech and audio signals
FR2784218B1 (fr) * 1998-10-06 2000-12-08 Thomson Csf Procede de codage de la parole a bas debit
CA2252170A1 (en) * 1998-10-27 2000-04-27 Bruno Bessette A method and device for high quality coding of wideband speech and audio signals
US6418408B1 (en) * 1999-04-05 2002-07-09 Hughes Electronics Corporation Frequency domain interpolative speech codec system
US6324503B1 (en) * 1999-07-19 2001-11-27 Qualcomm Incorporated Method and apparatus for providing feedback from decoder to encoder to improve performance in a predictive speech coder under frame erasure conditions
RU2000102555A (ru) 2000-02-02 2002-01-10 Войсковая часть 45185 Способ маскирования видеосигнала
SE0001727L (sv) * 2000-05-10 2001-11-11 Global Ip Sound Ab Överföring över paketförmedlade nät
US6757654B1 (en) * 2000-05-11 2004-06-29 Telefonaktiebolaget Lm Ericsson Forward error correction in speech coding
FR2815457B1 (fr) * 2000-10-18 2003-02-14 Thomson Csf Procede de codage de la prosodie pour un codeur de parole a tres bas debit
US7031926B2 (en) * 2000-10-23 2006-04-18 Nokia Corporation Spectral parameter substitution for the frame error concealment in a speech decoder
US7016833B2 (en) * 2000-11-21 2006-03-21 The Regents Of The University Of California Speaker verification system using acoustic data and non-acoustic data
US6889182B2 (en) * 2001-01-12 2005-05-03 Telefonaktiebolaget L M Ericsson (Publ) Speech bandwidth extension
US6614370B2 (en) * 2001-01-26 2003-09-02 Oded Gottesman Redundant compression techniques for transmitting data over degraded communication links and/or storing data on media subject to degradation
US7013269B1 (en) * 2001-02-13 2006-03-14 Hughes Electronics Corporation Voicing measure for a speech CODEC system
US6931373B1 (en) * 2001-02-13 2005-08-16 Hughes Electronics Corporation Prototype waveform phase modeling for a frequency domain interpolative speech codec system
EP1235203B1 (en) * 2001-02-27 2009-08-12 Texas Instruments Incorporated Method for concealing erased speech frames and decoder therefor
US6937978B2 (en) * 2001-10-30 2005-08-30 Chungwa Telecom Co., Ltd. Suppression system of background noise of speech signals and the method thereof
US7047187B2 (en) * 2002-02-27 2006-05-16 Matsushita Electric Industrial Co., Ltd. Method and apparatus for audio error concealment using data hiding
CA2415105A1 (en) * 2002-12-24 2004-06-24 Voiceage Corporation A method and device for robust predictive vector quantization of linear prediction parameters in variable bit rate speech coding
US20070174047A1 (en) * 2005-10-18 2007-07-26 Anderson Kyle D Method and apparatus for resynchronizing packetized audio streams

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2496156C2 (ru) * 2008-03-28 2013-10-20 Франс Телеком Маскирование ошибки передачи в цифровом аудиосигнале в иерархической структуре декодирования

Also Published As

Publication number Publication date
BR122017019860B1 (pt) 2019-01-29
WO2003102921A1 (en) 2003-12-11
AU2003233724B2 (en) 2009-07-16
KR101032119B1 (ko) 2011-05-09
BR0311523A (pt) 2005-03-08
NZ536238A (en) 2006-06-30
JP4658596B2 (ja) 2011-03-23
MXPA04011751A (es) 2005-06-08
MY141649A (en) 2010-05-31
RU2325707C2 (ru) 2008-05-27
PT1509903T (pt) 2017-06-07
ZA200409643B (en) 2006-06-28
CA2483791C (en) 2013-09-03
EP1509903A1 (en) 2005-03-02
ES2625895T3 (es) 2017-07-20
US7693710B2 (en) 2010-04-06
CA2483791A1 (en) 2003-12-11
CN100338648C (zh) 2007-09-19
JP2005534950A (ja) 2005-11-17
CN1659625A (zh) 2005-08-24
US20050154584A1 (en) 2005-07-14
AU2003233724A1 (en) 2003-12-19
BRPI0311523B1 (pt) 2018-06-26
CA2388439A1 (en) 2003-11-30
DK1509903T3 (en) 2017-06-06
NO20045578L (no) 2005-02-22
KR20050005517A (ko) 2005-01-13
EP1509903B1 (en) 2017-04-12

Similar Documents

Publication Publication Date Title
RU2004138286A (ru) Способ и устройство для эффективного маскирования стирания кадров в речевых кодеках на основе линейного предсказания
US8401843B2 (en) Method and device for coding transition frames in speech signals
JP5373217B2 (ja) 可変レートスピーチ符号化
JP4222951B2 (ja) 紛失フレームを取扱うための音声通信システムおよび方法
RU2371784C2 (ru) Изменение масштаба времени кадров в вокодере посредством изменения остатка
US6470313B1 (en) Speech coding
EP2535893B1 (en) Device and method for lost frame concealment
JP4173198B2 (ja) 受信音声信号の再構成方法および装置
EP1291851B1 (en) Method and System for a concealment technique of error corrupted speech frames
JPH09281998A (ja) 音声符号化装置
JP3062226B2 (ja) 条件付き確率的励起符号化法
JPH10207498A (ja) マルチモード符号励振線形予測により音声入力を符号化する方法及びその符号器
CA2137416C (en) Speech decoder capable of reproducing well background noise
JP2001134296A (ja) 音声信号復号方法及び装置と音声信号符号化復号方法及び装置と記録媒体
US20030055631A1 (en) Method and system for a waveform attenuation technique for predictive speech coding based on extrapolation of speech waveform
EP1103953B1 (en) Method for concealing erased speech frames
JP3806344B2 (ja) 定常雑音区間検出装置及び定常雑音区間検出方法
JP3451998B2 (ja) 無音声符号化を含む音声符号化・復号装置、復号化方法及びプログラムを記録した記録媒体
US7089180B2 (en) Method and device for coding speech in analysis-by-synthesis speech coders
JPH0782360B2 (ja) 音声分析合成方法
JP3417362B2 (ja) 音声信号復号方法及び音声信号符号化復号方法
JP3798433B2 (ja) ピッチサイクル波形を平滑化する方法及び装置
JP2001142499A (ja) 音声符号化装置ならびに音声復号化装置
JP3475958B2 (ja) 無音声符号化を含む音声符号化・復号装置、復号化方法及びプログラムを記録した記録媒体
JP2004061558A (ja) 音声符号化復号方式間の符号変換方法及び装置とその記憶媒体

Legal Events

Date Code Title Description
PC41 Official registration of the transfer of exclusive right

Effective date: 20220301