RU2007137643A

RU2007137643A - Изменение масштаба времени кадров в вокодере посредством изменения остатка

Info

Publication number: RU2007137643A
Application number: RU2007137643/09A
Authority: RU
Inventors: Рохит КАПУР (US); Рохит КАПУР; СПИНДОЛА Серафин ДИАС (US); Спиндола Серафин Диас
Original assignee: Квэлкомм Инкорпорейтед (US); Квэлкомм Инкорпорейтед
Priority date: 2005-03-11
Filing date: 2006-03-13
Publication date: 2009-04-20
Also published as: AU2006222963B2; CA2600713A1; JP5203923B2; KR100957265B1; MX2007011102A; IL185935A; JP2008533529A; US8155965B2; NO20075180L; TWI389099B; RU2371784C2; KR100956623B1; BRPI0607624A2; KR20090119936A; US20060206334A1; AU2006222963A1; EP1856689A1; TW200638336A; KR20070112832A; BRPI0607624B1

Abstract

1. Способ передачи речи, содержащий этапы, на которых: ! изменяют масштаб времени остаточного речевого сигнала к расширенному или сжатому виду упомянутого остаточного речевого сигнала и ! синтезируют упомянутый остаточный речевой сигнал, подвергшийся изменению масштаба времени. ! 2. Способ передачи речи по п.1, дополнительно содержащий этапы, на которых: ! классифицируют речевые сегменты и ! кодируют упомянутые речевые сегменты. ! 3. Способ передачи речи по п.2, в котором упомянутый этап кодирования речевых сегментов содержит использование периодов тона образца, линейное предсказание с кодовым возбуждением, линейное предсказание с шумовым возбуждением или 1/8 кадрового кодирования. ! 4. Способ передачи речи по п.2, дополнительно содержащий этапы, на которых: ! отправляют упомянутый речевой сигнал через кодирующий фильтр с линейным предсказанием, посредством чего фильтруя кратковременные корреляции в упомянутом речевом сигнале; и ! выдают коэффициенты кодирования с линейным предсказанием и остаточный сигнал. ! 5. Способ передачи речи по п.2, в котором упомянутый этап классифицирования речевых сегментов содержит классификацию речевых кадров на периодические, слабопериодические или шумовые в зависимости от того, представляют ли кадры вокализированную, невокализированную или неустойчивую речь. ! 6. Способ передачи речи по п.2, в котором упомянутое кодирование является кодированием с линейным предсказанием с кодовым возбуждением. ! 7. Способ передачи речи по п.2, в котором упомянутое кодирование является кодированием периода тона образца. ! 8. Способ передачи речи по п.2, в котором упомянутое кодирование является кодирован

Claims

1. Способ передачи речи, содержащий этапы, на которых:

изменяют масштаб времени остаточного речевого сигнала к расширенному или сжатому виду упомянутого остаточного речевого сигнала и

синтезируют упомянутый остаточный речевой сигнал, подвергшийся изменению масштаба времени.

2. Способ передачи речи по п.1, дополнительно содержащий этапы, на которых:

классифицируют речевые сегменты и

кодируют упомянутые речевые сегменты.

3. Способ передачи речи по п.2, в котором упомянутый этап кодирования речевых сегментов содержит использование периодов тона образца, линейное предсказание с кодовым возбуждением, линейное предсказание с шумовым возбуждением или 1/8 кадрового кодирования.

4. Способ передачи речи по п.2, дополнительно содержащий этапы, на которых:

отправляют упомянутый речевой сигнал через кодирующий фильтр с линейным предсказанием, посредством чего фильтруя кратковременные корреляции в упомянутом речевом сигнале; и

выдают коэффициенты кодирования с линейным предсказанием и остаточный сигнал.

5. Способ передачи речи по п.2, в котором упомянутый этап классифицирования речевых сегментов содержит классификацию речевых кадров на периодические, слабопериодические или шумовые в зависимости от того, представляют ли кадры вокализированную, невокализированную или неустойчивую речь.

6. Способ передачи речи по п.2, в котором упомянутое кодирование является кодированием с линейным предсказанием с кодовым возбуждением.

7. Способ передачи речи по п.2, в котором упомянутое кодирование является кодированием периода тона образца.

8. Способ передачи речи по п.2, в котором упомянутое кодирование является кодированием с линейным предсказанием с шумовым возбуждением.

9. Способ по п.6, в котором упомянутый этап изменения масштаба времени содержит:

оценку периода тона и

добавление или выделение по меньшей мере одного упомянутого периода тона после приема упомянутого остаточного сигнала.

10. Способ по п.6, в котором этап изменения масштаба времени содержит:

оценку задержки тона;

разделение речевого кадра на периоды тона, при этом границы упомянутых периодов тона определяются, используя упомянутую задержку тона в различных точках упомянутого речевого кадра;

совмещение упомянутых периодов тона, если уменьшается упомянутый остаточный речевой сигнал; и

добавление упомянутых периодов тона, если увеличивается упомянутый остаточный речевой сигнал.

11. Способ по п.7, в котором упомянутый этап изменения масштаба времени содержит этапы, на которых:

оценивают по меньшей мере один период тона;

интерполируют упомянутый по меньшей мере один период тона;

добавляют упомянутый по меньшей мере один период тона, когда расширяют упомянутый остаточный речевой сигнал; и

выделяют упомянутый по меньшей мере один период тона, когда сжимают упомянутый остаточный речевой сигнал.

12. Способ по п.8, в котором упомянутый этап кодирования содержит кодирование информации кодирования с линейным предсказанием в качестве коэффициентов усиления разных частей речевого сегмента.

13. Способ по п.10, в котором упомянутый этап совмещения упомянутых периодов тона, если уменьшается упомянутый речевой остаточной сигнал, содержит:

сегментирование входной эталонной последовательности в блоки эталонов;

удаление сегментов упомянутого остаточного сигнала за постоянные интервалы времени;

объединение упомянутых удаленных сегментов и

замену упомянутых удаленных сегментов на объединенный сегмент.

14. Способ по п.10, в котором упомянутый этап оценки задержки тона содержит интерполяцию между задержкой тона конца последнего кадра и конца текущего кадра.

15. Способ по п.10, в котором упомянутый этап добавления упомянутых периодов тона содержит объединение речевых сегментов.

16. Способ по п.10, в котором упомянутый этап добавления упомянутых периодов тона, если увеличивается упомянутый остаточный речевой сигнал, содержит добавление дополнительного периода тона, созданного из первого сегмента периода тона и второго сегмента периода тона.

17. Способ по п.12, в котором упомянутые коэффициенты усиления кодируются для наборов речевых эталонов.

18. Способ по п.13, в котором упомянутый этап объединения упомянутых удаленных сегментов содержит увеличение доли первого сегмента периода тона и уменьшение доли второго сегмента периода тона.

19. Способ по п.15, дополнительно содержащий этап выбора схожих речевых сегментов, при этом объединяют упомянутые схожие речевые сегменты.

20. Способ по п.15, дополнительно содержащий этап корреляции речевых сегментов, посредством чего объединяют схожие речевые сегменты.

21. Способ по п.16, в котором упомянутый этап добавления дополнительного периода тона, созданного из первого сегмента периода тона и второго сегмента периода тона, содержит сложение упомянутого первого и упомянутого второго сегментов тона таким образом, что увеличивается доля упомянутого первого сегмента периода тона и уменьшается доля упомянутого второго сегмента периода тона.

22. Способ по п.17, дополнительно содержащий этап генерирования остаточного сигнала посредством генерирования случайных значений с последующим применением упомянутых коэффициентов усиления к упомянутым случайным значениям.

23. Способ по п.17, дополнительно содержащий этап представления упомянутой информации кодирования с линейным предсказанием в качестве 10 кодированных значений коэффициентов усиления, при этом каждое кодированное значение коэффициента усиления представляет 16 эталонов речи.

24. Вокодер, имеющий по меньшей мере один вход и по меньшей мере один выход, содержащий:

кодер, содержащий фильтр, имеющий по меньшей мере один вход, функционально связанный с входом вокодера, и по меньшей мере один выход; и

декодер, содержащий синтезатор, имеющий по меньшей мере один вход, функционально связанный с упомянутым по меньшей мере одним выходом упомянутого кодера, и по меньшей мере один выход, функционально связанный с упомянутым по меньшей мере одним выходом вокодера.

25. Вокодер по п.24, в котором упомянутый декодер содержит:

память, при этом упомянутый декодер выполнен с возможностью выполнения программных команд, сохраненных в упомянутой памяти, содержащих изменение масштаба времени остаточного речевого сигнала к расширенному или сжатому виду упомянутого остаточного сигнала.

26. Вокодер по п.24, в котором упомянутый кодер содержит:

память и упомянутый кодер выполнен с возможностью выполнения программных команд, сохраненных в упомянутой памяти, содержащих классификацию речевых сегментов по 1/8 кадра, периоды тона образца, линейное предсказание с кодовым возбуждением или линейное предсказание с шумовым возбуждением.

27. Вокодер по п.26, в котором упомянутый декодер содержит:

память и упомянутый декодер выполнен с возможностью выполнения программных команд, сохраненных в упомянутой памяти, содержащих изменение масштаба времени остаточного сигнала к расширенному или сжатому виду упомянутого остаточного речевого сигнала.

28. Вокодер по п.27, в котором упомянутый фильтр является кодирующим фильтром с линейным предсказанием, который выполнен с возможностью:

фильтрации кратковременных корреляций в речевом сигнале и

выдачи коэффициентов кодирования с линейным предсказанием и остаточного сигнала.

29. Вокодер по п.27, в котором упомянутый кодер содержит:

память и упомянутый кодер выполнен с возможностью выполнения программных команд, сохраненных в упомянутой памяти, содержащих кодирование упомянутых речевых сегментов, используя кодирование с линейным предсказанием с кодовым возбуждением.

30. Вокодер по п.27, в котором упомянутый кодер содержит:

память и упомянутый кодер выполнен с возможностью выполнения программных команд, сохраненных в упомянутой памяти, содержащих кодирование упомянутых речевых сегментов, используя кодирование периода тона образца.

31. Вокодер по п.27, в котором упомянутый кодер содержит:

память и упомянутый кодер выполнен с возможностью выполнения программных команд, сохраненных в упомянутой памяти, содержащих кодирование упомянутых речевых сегментов, используя кодирование с линейным предсказанием с шумовым возбуждением.

32. Вокодер по п.29, в котором упомянутая программная команда изменения масштаба времени содержит:

оценку по меньшей мере одного периода тона и

добавление или удаление упомянутого по меньшей мере одного периода тона после приема упомянутого остаточного сигнала.

33. Вокодер по п.29, в котором упомянутая программная команда изменения масштаба времени содержит

оценку задержки тона;

добавление упомянутых периодов тона, если увеличивается остаточный речевой сигнал.

34. Вокодер по п.30, в котором упомянутая программная команда изменения масштаба времени содержит

оценку по меньшей мере одного период тона;

интерполяцию упомянутого по меньшей мере одного периода тона;

добавление упомянутого по меньшей мере одного периода тона, когда расширяют упомянутый остаточный речевой сигнал; и

выделение упомянутого по меньшей мере одного периода тона, когда сжимают упомянутый остаточный речевой сигнал.

35. Вокодер по п.31, в котором упомянутое кодирование упомянутых речевых сегментов, используя программную команду кодирования с линейным предсказанием с шумовым возбуждением, содержит кодирование информации кодирования с линейным предсказанием в качестве коэффициентов усиления различных частей речевых сегментов.

36. Вокодер по п.33, в котором упомянутое совмещение упомянутых периодов тона, если уменьшается упомянутый речевой остаточный сигнал, содержит

сегментацию входной эталонной последовательности на блоки эталонов;

удаление сегментов упомянутого остаточного сигнала в постоянные интервалы времени;

объединение упомянутых объединенных сегментов и

37. Вокодер по п.33, в котором упомянутая команда оценки задержки тона содержит интерполяцию между задержкой тона конца последнего кадра и конца текущего кадра.

38. Вокодер по п.33, в котором упомянутая команда суммирования упомянутых периодов тона содержит объединение речевых сегментов.

39. Вокодер по п.33, в котором упомянутая команда добавления упомянутых периодов тона, если увеличивается упомянутый речевой остаточный сигнал, содержит добавление дополнительного периода тона, созданного из первого сегмента периода тона и второго сегмента периода тона.

40. Вокодер по п.35, в котором упомянутые коэффициенты усиления кодируются для наборов речевых эталонов.

41. Вокодер по п.36, в котором упомянутая команда объединения упомянутых удаленных сегментов содержит увеличение доли первого сегмента периода тона и уменьшение доли второго сегмента периода тона.

42. Вокодер по п.38, дополнительно содержащий этап выбора схожих речевых сегментов, при этом объединяются упомянутые схожие речевые сегменты.

43. Вокодер по п.38, в котором упомянутая команда изменения масштаба времени дополнительно содержит корреляцию речевых сегментов, посредством чего выбираются схожие речевые сегменты.

44. Вокодер по п.39, в котором упомянутое дополнение дополнительного периода тона, созданного из первого сегмента периода тона, и команда второго сегмента периода тона содержит добавление упомянутого первого и второго сегментов периода тона таким образом, что увеличивается упомянутая доля первого сегмента периода тона и уменьшается доля второго сегмента периода тона.

45. Вокодер по п.40, в котором упомянутая команда изменения масштаба времени дополнительно содержит генерирование остаточного сигнала посредством генерирования случайных значений с последующим применением упомянутых коэффициентов усиления к упомянутым случайным значениям.

46. Вокодер по п.40, в котором упомянутая команда изменения масштаба времени дополнительно содержит представление упомянутой информации кодирования с линейным предсказанием в качестве 10 кодированных значений коэффициента усиления, при этом каждое кодированное значение коэффициента усиления представляет 16 эталонов речи.