RU98101107A - Синтезатор и способ для речевого синтеза (варианты) и радиоустройство - Google Patents
Синтезатор и способ для речевого синтеза (варианты) и радиоустройствоInfo
- Publication number
- RU98101107A RU98101107A RU98101107/28A RU98101107A RU98101107A RU 98101107 A RU98101107 A RU 98101107A RU 98101107/28 A RU98101107/28 A RU 98101107/28A RU 98101107 A RU98101107 A RU 98101107A RU 98101107 A RU98101107 A RU 98101107A
- Authority
- RU
- Russia
- Prior art keywords
- signal
- excitation
- accordance
- scaling factor
- gain
- Prior art date
Links
- 230000002194 synthesizing Effects 0.000 title claims 15
- 230000015572 biosynthetic process Effects 0.000 title claims 13
- 238000003786 synthesis reaction Methods 0.000 title claims 13
- 230000005284 excitation Effects 0.000 claims 42
- 230000003044 adaptive Effects 0.000 claims 19
- 230000004048 modification Effects 0.000 claims 4
- 238000006011 modification reaction Methods 0.000 claims 4
- 230000004301 light adaptation Effects 0.000 claims 3
- 238000003780 insertion Methods 0.000 claims 2
- 230000001419 dependent Effects 0.000 claims 1
- 238000000605 extraction Methods 0.000 claims 1
Claims (50)
1. Синтезатор для речевого синтеза, отличающийся тем, что он содержит пост-процессорное средство для обработки первого сигнала, включающего в себя информацию о периодичности речи, выделенного из источника возбуждения, выполненное с возможностью видоизменять содержание информации о периодичности речи первого сигнала в соответствии со вторым сигналом, выделяемым из источника возбуждения.
2. Синтезатор по п. 1, отличающийся тем, что пост-процессорное средство включает в себя средство регулировки усиления для масштабирования второго сигнала в соответствии с первым коэффициентом (р) масштабирования, выделенным из информации основного тона, связанной с первым сигналом.
3. Синтезатор по п. 2, отличающийся тем, что в нем источник возбуждения содержит фиксированный кодовый словарь и адаптивный кодовый словарь, при этом первый сигнал содержит комбинацию из первого и второго сигналов частичного возбуждения, исходящих, соответственно, из фиксированного и адаптивного кодовых словарей.
4. Синтезатор по п. 3, отличающийся тем, что он выполнен с возможностью выделения первого коэффициента (р) масштабирования из коэффициента (b) масштабирования адаптивного кодового словаря.
5. Синтезатор по п. 4, отличающийся тем, что он выполнен с обеспечением выделения первого коэффициента (р) масштабирования из следующего соотношения:
b < Пнижн p = 0,0
Пнижн ≤ b < П2 p = aулучш1 f1(b)
П2 ≤ b < П3 p = aулучш2 f2(b)
если
ПN-1 ≤ b ≤ Пверх p = aулучшN-1 fN-1(b)
b > Пверх p = aулучшN fN(b),
где П представляют пороговые значения, b является коэффициентом усиления адаптивного кодового словаря, р является коэффициентом масштабирования первого пост-процессорного средства, aулучш является линейным множителем, а f(b) является функцией усиления b.
b < Пнижн p = 0,0
Пнижн ≤ b < П2 p = aулучш1 f1(b)
П2 ≤ b < П3 p = aулучш2 f2(b)
если
ПN-1 ≤ b ≤ Пверх p = aулучшN-1 fN-1(b)
b > Пверх p = aулучшN fN(b),
где П представляют пороговые значения, b является коэффициентом усиления адаптивного кодового словаря, р является коэффициентом масштабирования первого пост-процессорного средства, aулучш является линейным множителем, а f(b) является функцией усиления b.
6. Синтезатор по п. 4 или 5, отличающийся тем, что он выполнен с возможностью выделения коэффициента (р) масштабирования в соответствии с соотношением
b < Пнижн p = 0,0
если Пнижн ≤ b ≤ Пверх - p = aулучшb2
b > Пверх - p = aулучшb,
где aулучш является постоянной, которая управляет интенсивностью операции улучшения, b является коэффициентом усиления адаптивного кодового словаря, П являются пороговыми значениями, а р является коэффициентом масштабирования первого пост-процесорного средства.
b < Пнижн p = 0,0
если Пнижн ≤ b ≤ Пверх - p = aулучшb2
b > Пверх - p = aулучшb,
где aулучш является постоянной, которая управляет интенсивностью операции улучшения, b является коэффициентом усиления адаптивного кодового словаря, П являются пороговыми значениями, а р является коэффициентом масштабирования первого пост-процесорного средства.
7. Синтезатор по любому из пп. 3-6, отличающийся тем, что в нем второй сигнал исходит из адаптивного кодового словаря.
8. Синтезатор по п. 7, отличающийся тем, что в нем второй сигнал соответствует практически второму сигналу частичного возбуждения.
9. Синтезатор по любому из пп. 3-6, отличающийся тем, что в нем второй сигнал исходит из фиксированного кодового словаря.
10. Синтезатор по п. 9, отличающийся тем, что в нем второй сигнал соответствует практически первому сигналу частичного возбуждения.
11. Синтезатор по п. 9 или 10, отличающийся тем, что в нем средство регулировки усиления выполнено с возможностью масштабирования второго сигнала в соответствии со вторым коэффициентом (р') масштабирования, где
и g является коэффициентом масштабирования фиксированного кодового словаря, b является коэффициентом масштабирования адаптивного кодового словаря, а р представляет собой первый коэффициент масштабирования.
и g является коэффициентом масштабирования фиксированного кодового словаря, b является коэффициентом масштабирования адаптивного кодового словаря, а р представляет собой первый коэффициент масштабирования.
12. Синтезатор по любому из предыдущих пунктов, отличающийся тем, что в нем первый сигнал представляет собой первый сигнал возбуждения, пригодный для введения в речевой синтезирующий фильтр, а второй сигнал представляет собой второй сигнал возбуждения, пригодный для введения в речевой синтезирующий фильтр.
13. Синтезатор по любому из пп. 1-11, отличающийся тем, что в нем первый сигнал представляет собой первый речевой синтезированный сигнал, выходящий из первого речевого фильтра, а второй сигнал представляет собой выход из второго речевого синтезирующего фильтра.
14. Синтезатор по п. 13, отличающийся тем, что средство регулировки усиления выполнено с работой по сигналам, вводимым во второй речевой синтезирующий фильтр.
15. Синтезатор по любому из предыдущих пунктов, отличающийся тем, что он выполнен для модифицирования первого сигнала путем объединения второго сигнала с первым сигналом.
16. Синтезатор по п. 15, отличающийся тем, что пост-процессорное средство дополнительно содержит средство адаптивной регулировки энергии, выполненное с возможностью масштабирования видоизмененного первого сигнала в соответствии со следующим соотношением:
где N представляет собой соответственно выбранный период адаптации, eх(n) является первым сигналом, ew'(n) является видоизмененным первым сигналом, a k представляет собой масштабный коэффициент энергии.
где N представляет собой соответственно выбранный период адаптации, eх(n) является первым сигналом, ew'(n) является видоизмененным первым сигналом, a k представляет собой масштабный коэффициент энергии.
17. Синтезатор, по существу как он описан здесь и со ссылками на фиг. 3 и фиг. 4 чертежей.
18. Способ улучшения синтезированной речи, включающий в себя выделение первого сигнала, содержащего информацию о периодичности речи, из источника возбуждения, выделение второго сигнала из источника возбуждения, отличающийся тем, что он включает в себя также видоизменение содержания информации о периодичности речи первого сигнала в соответствии со вторым сигналом.
19. Способ по п. 18, отличающийся тем, что он включает в себя дополнительно масштабирование второго сигнала в соответствии с первым коэффициентом (р) масштабирования, выделенным из информации основного тона, связанной с первым сигналом.
20. Способ по п. 19, отличающийся тем, что его выполняют с источником возбуждения, содержащим фиксированный кодовый словарь и адаптивный кодовый словарь, при этом первый сигнал содержит комбинацию из первого и второго сигналов частичного возбуждения, исходящих, соответственно, из фиксированного и адаптивного кодовых словарей.
21. Способ по п. 20, отличающийся тем, что первый коэффициент (р) масштабирования выделяют из коэффициента (b) усиления для информации основного тона первого сигнала.
22. Способ по п. 21, отличающийся тем, что первый коэффициент (р) масштабирования выделяют в соответствии со следующим уравнением:
b < Пнижн p = 0,0
Пнижн ≤ b < П2 p = aулучш1 f1(b)
П2 ≤ b < П3 p = aулучш2 f2(b)
если
ПN-1 ≤ b ≤ Пверх p = aулучшN-1 fN-1(b)
b > Пверх p = aулучшN fN(b),
где П представляют пороговые значения, b является коэффициентом усиления для информации основного тона первого сигнала, р является коэффициентом масштабирования первого сигнала, aулучш является линейным множителем, a f(b) является функцией b.
b < Пнижн p = 0,0
Пнижн ≤ b < П2 p = aулучш1 f1(b)
П2 ≤ b < П3 p = aулучш2 f2(b)
если
ПN-1 ≤ b ≤ Пверх p = aулучшN-1 fN-1(b)
b > Пверх p = aулучшN fN(b),
где П представляют пороговые значения, b является коэффициентом усиления для информации основного тона первого сигнала, р является коэффициентом масштабирования первого сигнала, aулучш является линейным множителем, a f(b) является функцией b.
23. Способ по п. 21 или 22, отличающийся тем, что коэффициент (р) масштабирования выделяют в соответствии с соотношением
b < Пнижн - p = 0,0
если Пнижн ≤ b ≤ Пверх - p = aулучшb2
b > Пверх - p = aулучшb,
где aулучш является постоянной, которая управляет интенсивностью операции улучшения, b представляет собой коэффициент усиления для информации основного тона первого сигнала, П являются пороговыми значениями, а р является коэффициентом масштабирования второго сигнала.
b < Пнижн - p = 0,0
если Пнижн ≤ b ≤ Пверх - p = aулучшb2
b > Пверх - p = aулучшb,
где aулучш является постоянной, которая управляет интенсивностью операции улучшения, b представляет собой коэффициент усиления для информации основного тона первого сигнала, П являются пороговыми значениями, а р является коэффициентом масштабирования второго сигнала.
24. Способ по любому из пп. 20-23, отличающийся тем, что второй сигнал исходит из адаптивного кодового словаря.
25. Способ по п. 24, отличающийся тем, что второй сигнал соответствует практически второму сигналу частичного возбуждения.
26. Способ по любому из пп. 20-23, отличающийся тем, что второй сигнал исходит из фиксированного кодового словаря.
27. Способ по п. 26, отличающийся тем, что второй сигнал соответствует практически первому сигналу частичного возбуждения.
28. Способ по п. 26 или 27, отличающийся тем, что второй сигнал масштабируют в соответствии со вторым коэффициентом (р') масштабирования, где
и g является коэффициентом масштабирования фиксированного кодового словаря, b является коэффициентом масштабирования адаптивного кодового словаря, а р представляет собой первый коэффициент масштабирования.
и g является коэффициентом масштабирования фиксированного кодового словаря, b является коэффициентом масштабирования адаптивного кодового словаря, а р представляет собой первый коэффициент масштабирования.
29. Способ по любому из пп. 18-28, отличающийся тем, что в нем первый сигнал представляет собой первый сигнал возбуждения, пригодный для введения в речевой синтезирующий фильтр, а второй сигнал представляет собой второй сигнал возбуждения, пригодный для введения в речевой синтезирующий фильтр.
30. Способ по любому из пп. 18-28, отличающийся тем, что в нем первый сигнал представляет собой первый речевой синтезированный сигнал, выходящий из первого речевого фильтра, а второй сигнал представляет собой выход из второго речевого синтезирующего фильтра.
31. Способ по любому из пп. 18-30, отличающийся тем, что его осуществляют для видоизменения первого сигнала путем объединения второго сигнала с первым сигналом.
32. Способ по п. 31, отличающийся тем, что видоизмененный первый сигнал нормируют в соответствии со следующим соотношением:
где N представляет собой соответственно выбранный период адаптации, eх(n) является первым сигналом, ew'(n) является видоизмененным первым сигналом, a k представляет собой масштабный коэффициент энергии.
где N представляет собой соответственно выбранный период адаптации, eх(n) является первым сигналом, ew'(n) является видоизмененным первым сигналом, a k представляет собой масштабный коэффициент энергии.
33. Способ, по существу как он описан здесь согласно соответствующим выполнениям.
34. Радиоустройство, содержащее высокочастотное средство для приема радиосигнала и восстановления кодированной информации, содержащейся в этом радиосигнале, и синтезатор, включающий в себя источник возбуждения, соединенный с высокочастотным средством для генерирования первого сигнала, содержащего информацию основного тона в соответствии с кодированной информацией, отличающееся тем, что синтезатор содержит пост-процессорное средство, оперативно соединенное с источником возбуждения для приема первого сигнала и выполненное с возможностью видоизменения информации основного тона первого сигнала в соответствии со вторым сигналом, выделенным из источника возбуждения, а также речевой синтезирующий фильтр, установленный для приема видоизмененного первого сигнала из пост-процессорного средства для генерирования в ответ на него синтезированной речи.
35. Радиоустройство, отличающееся тем, что синтезатор выполнен по любому из пп. 2-17.
36. Радиоустройство, отличающееся тем, что оно выполнено с возможностью работы для улучшения синтезированной речи в соответствии со способом по любому из пп. 18-33.
37. Синтезатор для речевого синтеза, содержащий первый и второй источники возбуждения для генерирования, соответственно, первого и второго сигналов возбуждения, отличающийся тем, что он включает в себя также средство для видоизменения первого сигнала возбуждения в соответствии с коэффициентом масштабирования, выделяемым из информации основного тона, связанной с первым сигналом возбуждения.
38. Синтезатор для речевого синтеза, содержащий первый и второй источники возбуждения для генерирования, соответственно, первого и второго сигналов возбуждения, отличающийся тем, что он включает в себя также средство для видоизменения второго сигнала возбуждения в соответствии с коэффициентом масштабирования, выделяемым из информации основного тона, связанной с первым сигналом возбуждения.
39. Синтезатор по п. 37, отличающийся тем, что средство видоизменения выполнено с возможностью масштабировать первый сигнал возбуждения в соответствии с первым коэффициентом (а) масштабирования, выделяемым из информации основного тона, связанной с первым сигналом.
40. Синтезатор по п. 39, отличающийся тем, что первый источник возбуждения представляет собой адаптивный кодовый словарь, а второй источник возбуждения представляет собой фиксированный кодовый словарь.
41. Синтезатор по п. 40, отличающийся тем, что в нем первый коэффициент (а) масштабирования представлен в виде а = b + р, где b представляет собой усиление адаптивного кодового словаря, а р представляет собой коэффициент усиления улучшенного восприятия, выделяемый из следующего соотношения:
b < Пнижн p = 0,0
Пнижн ≤ b< П2 p = aулучш1 f1(b)
П2 ≤ b < П3 p = aулучш2 f2(b)
если
ПN-1 ≤ b ≤ Пверх p = aулучшN-1 fN-1(b)
b > Пверх p = aулучшN fN(b),
где П представляют пороговые значения, b является коэффициентом усиления адаптивного кодового словаря, р является коэффициентом усиления улучшенного восприятия, aулучш является линейным множителем, a f(b) является функцией усиления b.
b < Пнижн p = 0,0
Пнижн ≤ b< П2 p = aулучш1 f1(b)
П2 ≤ b < П3 p = aулучш2 f2(b)
если
ПN-1 ≤ b ≤ Пверх p = aулучшN-1 fN-1(b)
b > Пверх p = aулучшN fN(b),
где П представляют пороговые значения, b является коэффициентом усиления адаптивного кодового словаря, р является коэффициентом усиления улучшенного восприятия, aулучш является линейным множителем, a f(b) является функцией усиления b.
42. Синтезатор по п. 41, отличающийся тем, что он выполнен с обеспечением выделения коэффициента р усиления улучшенного восприятия в соответствии с соотношением
b < Пнижн p = 0,0
если Пнижн ≤ b ≤ Пверх p = aулучшb2
b > Пверх p = aулучшb,
и определяемого для р, представляющего собой коэффициент усиления улучшенного восприятия.
b < Пнижн p = 0,0
если Пнижн ≤ b ≤ Пверх p = aулучшb2
b > Пверх p = aулучшb,
и определяемого для р, представляющего собой коэффициент усиления улучшенного восприятия.
43. Синтезатор по пп. 38-42, зависимый от п. 38, отличающийся тем, что средство видоизменения выполнено с возможностью масштабировать второй сигнал возбуждения в соответствии со вторым коэффициентом (а') масштабирования, выделяемым из информации основного тона, связанной с первым сигналом.
44. Синтезатор по п. 43, отличающийся тем, что первый источник возбуждения представляет собой адаптивный кодовый словарь, а второй источник возбуждения представляет собой фиксированный кодовый словарь.
45. Синтезатор по п. 44, отличающийся тем, что в нем второй коэффициент (а') масштабирования удовлетворяет следующему соотношению:
где g является коэффициентом масштабирования фиксированного кодового словаря, b является коэффициентом масштабирования адаптивного кодового словаря, а р представляет собой коэффициент усиления улучшенного восприятия, выделяемый в соответствии с соотношением:
b < Пнижн p = 0,0
Пнижн ≤ b < П2 p = aулучш1 f1(b)
П2 ≤ b < П3 p = aулучш2 f2(b)
если
ПN-1 ≤ b ≤ Пверх p = aулучшN-1 fN-1(b)
b > Пверх p = aулучшN fN(b),
где П представляют пороговые значения, b является коэффициентом усиления адаптивного кодового словаря, р является коэффициентом усиления улучшенного восприятия, aулучш является линейным множителем, a f(b) является функцией усиления b.
где g является коэффициентом масштабирования фиксированного кодового словаря, b является коэффициентом масштабирования адаптивного кодового словаря, а р представляет собой коэффициент усиления улучшенного восприятия, выделяемый в соответствии с соотношением:
b < Пнижн p = 0,0
Пнижн ≤ b < П2 p = aулучш1 f1(b)
П2 ≤ b < П3 p = aулучш2 f2(b)
если
ПN-1 ≤ b ≤ Пверх p = aулучшN-1 fN-1(b)
b > Пверх p = aулучшN fN(b),
где П представляют пороговые значения, b является коэффициентом усиления адаптивного кодового словаря, р является коэффициентом усиления улучшенного восприятия, aулучш является линейным множителем, a f(b) является функцией усиления b.
46. Синтезатор по п. 45, отличающийся тем, что он выполнен с возможностью выделения коэффициента р усиления улучшенного восприятия в соответствии с соотношением
b < Пнижн p = 0,0
если Пнижн ≤ b ≤ Пверх p = aулучшb2
b > Пверх p = aулучшb,
и определяемого для р, представляющего собой коэффициент усиления улучшенного восприятия.
b < Пнижн p = 0,0
если Пнижн ≤ b ≤ Пверх p = aулучшb2
b > Пверх p = aулучшb,
и определяемого для р, представляющего собой коэффициент усиления улучшенного восприятия.
47. Синтезатор по любому из пп. 37-46, отличающийся тем, что он выполнен с возможностью объединения первого и второго сигналов возбуждения после видоизменения.
48. Синтезатор по п. 47, отличающийся тем, что он дополнительно содержит адаптивное средство регулировки энергии для видоизменения объединенных масштабированных первого и второго сигналов в соответствии со следующим соотношением:
где N представляет собой соответственно выбранный период адаптации, ех(n) является объединенными первым и вторым сигналами, ew'(n) является объединенными масштабированными первым и вторым сигналами, a k представляет собой масштабный коэффициент энергии.
где N представляет собой соответственно выбранный период адаптации, ех(n) является объединенными первым и вторым сигналами, ew'(n) является объединенными масштабированными первым и вторым сигналами, a k представляет собой масштабный коэффициент энергии.
49. Способ речевого синтеза, включающий в себя генерирование первого и второго сигналов возбуждения, отличающийся тем, что он включает в себя также видоизменение первого сигнала возбуждения в соответствии со связанным с ним коэффициентом усиления и дальнейшее видоизменение первого сигнала возбуждения в соответствии с коэффициентом масштабирования, выделяемым из информации основного тона, связанной с первым сигналом возбуждения.
50. Способ речевого синтеза, включающий в себя генерирование первого и второго сигналов возбуждения, отличающийся тем, что он включает в себя также видоизменение первого сигнала возбуждения в соответствии со связанным с ним коэффициентом усиления и видоизменение второго сигнала возбуждения в соответствии с коэффициентом масштабирования, выделяемым из информации основного тона, связанной с первым сигналом возбуждения.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
GB9512284.2 | 1995-06-16 | ||
GBGB9512284.2A GB9512284D0 (en) | 1995-06-16 | 1995-06-16 | Speech Synthesiser |
Publications (2)
Publication Number | Publication Date |
---|---|
RU98101107A true RU98101107A (ru) | 1999-11-27 |
RU2181481C2 RU2181481C2 (ru) | 2002-04-20 |
Family
ID=10776197
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU98101107/28A RU2181481C2 (ru) | 1995-06-16 | 1996-06-13 | Синтезатор и способ для речевого синтеза (варианты) и радиоустройство |
Country Status (12)
Country | Link |
---|---|
US (2) | US6029128A (ru) |
EP (1) | EP0832482B1 (ru) |
JP (1) | JP3483891B2 (ru) |
CN (2) | CN1652207A (ru) |
AT (1) | ATE206843T1 (ru) |
AU (1) | AU714752B2 (ru) |
BR (1) | BR9608479A (ru) |
DE (1) | DE69615839T2 (ru) |
ES (1) | ES2146155B1 (ru) |
GB (1) | GB9512284D0 (ru) |
RU (1) | RU2181481C2 (ru) |
WO (1) | WO1997000516A1 (ru) |
Families Citing this family (49)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5913187A (en) * | 1997-08-29 | 1999-06-15 | Nortel Networks Corporation | Nonlinear filter for noise suppression in linear prediction speech processing devices |
US6260010B1 (en) * | 1998-08-24 | 2001-07-10 | Conexant Systems, Inc. | Speech encoder using gain normalization that combines open and closed loop gains |
US7117146B2 (en) * | 1998-08-24 | 2006-10-03 | Mindspeed Technologies, Inc. | System for improved use of pitch enhancement with subcodebooks |
US7072832B1 (en) * | 1998-08-24 | 2006-07-04 | Mindspeed Technologies, Inc. | System for speech encoding having an adaptive encoding arrangement |
US6104992A (en) * | 1998-08-24 | 2000-08-15 | Conexant Systems, Inc. | Adaptive gain reduction to produce fixed codebook target signal |
JP3365360B2 (ja) * | 1999-07-28 | 2003-01-08 | 日本電気株式会社 | 音声信号復号方法および音声信号符号化復号方法とその装置 |
US6480827B1 (en) * | 2000-03-07 | 2002-11-12 | Motorola, Inc. | Method and apparatus for voice communication |
US6581030B1 (en) * | 2000-04-13 | 2003-06-17 | Conexant Systems, Inc. | Target signal reference shifting employed in code-excited linear prediction speech coding |
US6466904B1 (en) * | 2000-07-25 | 2002-10-15 | Conexant Systems, Inc. | Method and apparatus using harmonic modeling in an improved speech decoder |
EP1944759B1 (en) * | 2000-08-09 | 2010-10-20 | Sony Corporation | Voice data processing device and processing method |
US7283961B2 (en) * | 2000-08-09 | 2007-10-16 | Sony Corporation | High-quality speech synthesis device and method by classification and prediction processing of synthesized sound |
JP3558031B2 (ja) * | 2000-11-06 | 2004-08-25 | 日本電気株式会社 | 音声復号化装置 |
US7103539B2 (en) * | 2001-11-08 | 2006-09-05 | Global Ip Sound Europe Ab | Enhanced coded speech |
CA2388352A1 (en) | 2002-05-31 | 2003-11-30 | Voiceage Corporation | A method and device for frequency-selective pitch enhancement of synthesized speed |
DE10236694A1 (de) * | 2002-08-09 | 2004-02-26 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum skalierbaren Codieren und Vorrichtung und Verfahren zum skalierbaren Decodieren |
US7516067B2 (en) * | 2003-08-25 | 2009-04-07 | Microsoft Corporation | Method and apparatus using harmonic-model-based front end for robust speech recognition |
US7447630B2 (en) * | 2003-11-26 | 2008-11-04 | Microsoft Corporation | Method and apparatus for multi-sensory speech enhancement |
CA2457988A1 (en) | 2004-02-18 | 2005-08-18 | Voiceage Corporation | Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization |
JP4398323B2 (ja) * | 2004-08-09 | 2010-01-13 | ユニデン株式会社 | デジタル無線通信装置 |
US20070147518A1 (en) * | 2005-02-18 | 2007-06-28 | Bruno Bessette | Methods and devices for low-frequency emphasis during audio compression based on ACELP/TCX |
US20060217988A1 (en) * | 2005-03-28 | 2006-09-28 | Tellabs Operations, Inc. | Method and apparatus for adaptive level control |
US20060217983A1 (en) * | 2005-03-28 | 2006-09-28 | Tellabs Operations, Inc. | Method and apparatus for injecting comfort noise in a communications system |
US20060217970A1 (en) * | 2005-03-28 | 2006-09-28 | Tellabs Operations, Inc. | Method and apparatus for noise reduction |
US20060215683A1 (en) * | 2005-03-28 | 2006-09-28 | Tellabs Operations, Inc. | Method and apparatus for voice quality enhancement |
US20060217972A1 (en) * | 2005-03-28 | 2006-09-28 | Tellabs Operations, Inc. | Method and apparatus for modifying an encoded signal |
US7562021B2 (en) * | 2005-07-15 | 2009-07-14 | Microsoft Corporation | Modification of codewords in dictionary used for efficient coding of digital media spectral data |
US7590523B2 (en) * | 2006-03-20 | 2009-09-15 | Mindspeed Technologies, Inc. | Speech post-processing using MDCT coefficients |
US8005671B2 (en) * | 2006-12-04 | 2011-08-23 | Qualcomm Incorporated | Systems and methods for dynamic normalization to reduce loss in precision for low-level signals |
WO2008072671A1 (ja) * | 2006-12-13 | 2008-06-19 | Panasonic Corporation | 音声復号化装置およびパワ調整方法 |
US8249860B2 (en) * | 2006-12-15 | 2012-08-21 | Panasonic Corporation | Adaptive sound source vector quantization unit and adaptive sound source vector quantization method |
US8688437B2 (en) | 2006-12-26 | 2014-04-01 | Huawei Technologies Co., Ltd. | Packet loss concealment for speech coding |
CN101286319B (zh) * | 2006-12-26 | 2013-05-01 | 华为技术有限公司 | 改进语音丢包修补质量的语音编码方法 |
CN101266797B (zh) * | 2007-03-16 | 2011-06-01 | 展讯通信(上海)有限公司 | 语音信号后处理滤波方法 |
US8209190B2 (en) * | 2007-10-25 | 2012-06-26 | Motorola Mobility, Inc. | Method and apparatus for generating an enhancement layer within an audio coding system |
CN100578620C (zh) * | 2007-11-12 | 2010-01-06 | 华为技术有限公司 | 固定码书搜索方法及搜索器 |
CN101179716B (zh) * | 2007-11-30 | 2011-12-07 | 华南理工大学 | 一种压缩域的传输数据流音频自动增益控制方法 |
US20090287489A1 (en) * | 2008-05-15 | 2009-11-19 | Palm, Inc. | Speech processing for plurality of users |
US8442837B2 (en) * | 2009-12-31 | 2013-05-14 | Motorola Mobility Llc | Embedded speech and audio coding using a switchable model core |
US8990094B2 (en) * | 2010-09-13 | 2015-03-24 | Qualcomm Incorporated | Coding and decoding a transient frame |
US8862465B2 (en) * | 2010-09-17 | 2014-10-14 | Qualcomm Incorporated | Determining pitch cycle energy and scaling an excitation signal |
ES2540051T3 (es) | 2011-04-15 | 2015-07-08 | Telefonaktiebolaget Lm Ericsson (Publ) | Método y un decodificador para la atenuación de regiones de señal reconstruidas con baja precisión |
EP2737479B1 (en) * | 2011-07-29 | 2017-01-18 | Dts Llc | Adaptive voice intelligibility enhancement |
EP2704142B1 (en) * | 2012-08-27 | 2015-09-02 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for reproducing an audio signal, apparatus and method for generating a coded audio signal, computer program and coded audio signal |
CN104299614B (zh) | 2013-07-16 | 2017-12-29 | 华为技术有限公司 | 解码方法和解码装置 |
US9620134B2 (en) * | 2013-10-10 | 2017-04-11 | Qualcomm Incorporated | Gain shape estimation for improved tracking of high-band temporal characteristics |
MY187944A (en) * | 2013-10-18 | 2021-10-30 | Fraunhofer Ges Forschung | Concept for encoding an audio signal and decoding an audio signal using deterministic and noise like information |
MY180722A (en) * | 2013-10-18 | 2020-12-07 | Fraunhofer Ges Forschung | Concept for encoding an audio signal and decoding an audio signal using speech related spectral shaping information |
CN110444192A (zh) * | 2019-08-15 | 2019-11-12 | 广州科粤信息科技有限公司 | 一种基于语音技术的智能语音机器人 |
CN113241082B (zh) * | 2021-04-22 | 2024-02-20 | 杭州网易智企科技有限公司 | 变声方法、装置、设备和介质 |
Family Cites Families (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5681900A (en) * | 1979-12-10 | 1981-07-04 | Nippon Electric Co | Voice synthesizer |
CA1242279A (en) * | 1984-07-10 | 1988-09-20 | Tetsu Taguchi | Speech signal processor |
US4969192A (en) * | 1987-04-06 | 1990-11-06 | Voicecraft, Inc. | Vector adaptive predictive coder for speech and audio |
GB8806185D0 (en) * | 1988-03-16 | 1988-04-13 | Univ Surrey | Speech coding |
US5029211A (en) * | 1988-05-30 | 1991-07-02 | Nec Corporation | Speech analysis and synthesis system |
US5247357A (en) * | 1989-05-31 | 1993-09-21 | Scientific Atlanta, Inc. | Image compression method and apparatus employing distortion adaptive tree search vector quantization with avoidance of transmission of redundant image data |
DE69033672T2 (de) * | 1989-10-17 | 2001-05-10 | Motorola Inc | Auf dem lpc-verfahren beruhende sprachsynthese mit adaptivem pitchvorfilter |
US5241650A (en) * | 1989-10-17 | 1993-08-31 | Motorola, Inc. | Digital speech decoder having a postfilter with reduced spectral distortion |
CA2010830C (en) * | 1990-02-23 | 1996-06-25 | Jean-Pierre Adoul | Dynamic codebook for efficient speech coding based on algebraic codes |
JP3102015B2 (ja) * | 1990-05-28 | 2000-10-23 | 日本電気株式会社 | 音声復号化方法 |
CA2568984C (en) * | 1991-06-11 | 2007-07-10 | Qualcomm Incorporated | Variable rate vocoder |
JP3076086B2 (ja) * | 1991-06-28 | 2000-08-14 | シャープ株式会社 | 音声合成装置用ポストフィルタ |
US5233660A (en) * | 1991-09-10 | 1993-08-03 | At&T Bell Laboratories | Method and apparatus for low-delay celp speech coding and decoding |
WO1993018505A1 (en) * | 1992-03-02 | 1993-09-16 | The Walt Disney Company | Voice transformation system |
US5495555A (en) * | 1992-06-01 | 1996-02-27 | Hughes Aircraft Company | High quality low bit rate celp-based speech codec |
US5327520A (en) * | 1992-06-04 | 1994-07-05 | At&T Bell Laboratories | Method of use of voice message coder/decoder |
FI91345C (fi) * | 1992-06-24 | 1994-06-10 | Nokia Mobile Phones Ltd | Menetelmä kanavanvaihdon tehostamiseksi |
CA2108623A1 (en) * | 1992-11-02 | 1994-05-03 | Yi-Sheng Wang | Adaptive pitch pulse enhancer and method for use in a codebook excited linear prediction (celp) search loop |
AU675322B2 (en) * | 1993-04-29 | 1997-01-30 | Unisearch Limited | Use of an auditory model to improve quality or lower the bit rate of speech synthesis systems |
US5664055A (en) * | 1995-06-07 | 1997-09-02 | Lucent Technologies Inc. | CS-ACELP speech compression system with adaptive pitch prediction filter gain based on a measure of periodicity |
-
1995
- 1995-06-16 GB GBGB9512284.2A patent/GB9512284D0/en active Pending
-
1996
- 1996-06-13 US US08/662,991 patent/US6029128A/en not_active Expired - Lifetime
- 1996-06-13 CN CN200510052904.XA patent/CN1652207A/zh active Pending
- 1996-06-13 CN CN96196226.7A patent/CN1199151C/zh not_active Expired - Lifetime
- 1996-06-13 EP EP96920925A patent/EP0832482B1/en not_active Expired - Lifetime
- 1996-06-13 DE DE69615839T patent/DE69615839T2/de not_active Expired - Lifetime
- 1996-06-13 AT AT96920925T patent/ATE206843T1/de not_active IP Right Cessation
- 1996-06-13 BR BR9608479-0A patent/BR9608479A/pt not_active IP Right Cessation
- 1996-06-13 ES ES009750009A patent/ES2146155B1/es not_active Expired - Fee Related
- 1996-06-13 RU RU98101107/28A patent/RU2181481C2/ru active
- 1996-06-13 WO PCT/GB1996/001428 patent/WO1997000516A1/en active IP Right Grant
- 1996-06-13 JP JP50280997A patent/JP3483891B2/ja not_active Expired - Lifetime
- 1996-06-13 AU AU62309/96A patent/AU714752B2/en not_active Expired
-
1998
- 1998-08-18 US US09/135,936 patent/US5946651A/en not_active Expired - Lifetime
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU98101107A (ru) | Синтезатор и способ для речевого синтеза (варианты) и радиоустройство | |
RU2181481C2 (ru) | Синтезатор и способ для речевого синтеза (варианты) и радиоустройство | |
US6421638B2 (en) | Voice encoding device, voice decoding device, recording medium for recording program for realizing voice encoding/decoding and mobile communication device | |
EP0624865B1 (en) | Arrangement for increasing the comprehension of speech when translating speech from a first language to a second language | |
KR100566630B1 (ko) | 적응형 변조에 의해 소스 코딩 시스템들을 향상시키는 방법 | |
US7363220B2 (en) | Method for speech coding, method for speech decoding and their apparatuses | |
EP1045372A3 (en) | Speech sound communication system | |
JPH0573100A (ja) | 音声合成方法及びその装置 | |
EP0384587A1 (en) | Voice synthesizing apparatus | |
US4985923A (en) | High efficiency voice coding system | |
EP0954849B1 (en) | A method and apparatus for audio representation of speech that has been encoded according to the lpc principle, through adding noise to constituent signals therein | |
JPH05113795A (ja) | 音声合成装置 | |
JPH0420998A (ja) | 音声合成装置 | |
JPS61107400A (ja) | 音声合成器 | |
JP2650355B2 (ja) | 音声分析合成装置 | |
US6351490B1 (en) | Voice coding apparatus, voice decoding apparatus, and voice coding and decoding system | |
KR920005509B1 (ko) | 잡음 첨가에 의한 자연음 합성기 | |
EP0496829A1 (en) | Lpc based speech synthesis with adaptive pitch prefilter | |
JPH01204100A (ja) | テキスト音声合成方式 | |
JPH0421288A (ja) | 文字放送受信装置 | |
JP3230380B2 (ja) | 音声符号化装置 | |
JPH05210395A (ja) | 音声合成方式 | |
Milios et al. | The phase-only version of the LPC residual in speech coding | |
JPH1185196A (ja) | 音声符号化/復号化方式 | |
JPH0438360B2 (ru) |