RU2005113877A

RU2005113877A - Способы управляемого источником широкополосного кодирования речи с переменной скоростью в битах

Info

Publication number: RU2005113877A
Application number: RU2005113877/09A
Authority: RU
Inventors: Милан ЖЕЛИНЕК (CA); Милан ЖЕЛИНЕК
Original assignee: Нокиа Корпорейшн (Fi); Нокиа Корпорейшн
Priority date: 2002-10-11
Filing date: 2003-10-09
Publication date: 2005-10-10
Also published as: CN1703737B; CN1703737A; AU2003278013A1; CA2501369A1; AU2003278013A8; EG23923A; MY138212A; BR0315179A; CA2501368C; EP1554718A2; DE60336744D1; AU2003278014A1; RU2331933C2; EP1550108A2; KR20050049538A; MY134085A; WO2004034376A2; BR0315216A; JP2006502427A; WO2004034376A3

Claims

1. Способ кодирования дискретизированного речевого сигнала, содержащего речевые кадры, заключающийся в том, что определяют, является ли текущий кадр дискретизированного речевого сигнала активным речевым кадром или неактивным речевым кадром, если упомянутый кадр сигнала является активным речевым кадром, то проводят процедуру классификации, чтобы определить, является ли текущий кадр невокализованным кадром, причем упомянутая процедура классификации предусматривает проверку, по меньшей мере, трех из следующих параметров, чтобы определить, является ли текущий кадр невокализованным кадром:

а) меры (r_x,

) звучания,

б) меры (е_tilt,е_t) спектрального наклона,

в) вариации (dE) энергии в пределах текущего кадра, и

г) относительной энергии (Е_rel) текущего кадра,

а когда текущий кадр классифицирован как невокализованный кадр посредством упомянутой процедуры классификации, кодируют этот текущий кадр с помощью алгоритма кодирования невокализованных сигналов.

2. Способ по п.1, в котором меру (

) звучания определяют как

где r_x(0), r_x(1) и r_x(2) соответственно представляют собой нормализованную корреляцию первой половины упомянутого текущего кадра, нормализованную корреляцию второй половины упомянутого текущего кадра и нормализованную корреляцию первой половины кадра, следующего за упомянутым текущим кадром.

3. Способ по п.2, дополнительно предусматривающий прибавление поправки (r_e) на шум к упомянутой мере (

) звучания.

4. Способ по п.1, предусматривающий определение количества перцепционных критических полос, характеризующих диапазоны частот в пределах спектра энергии текущего кадра, упорядоченных в соответствии с увеличением частоты от первой перцепционной критической полосы, соответствующей диапазону самых низких частот, до последней перцепционной критической полосы, соответствующей диапазону самых высоких частот, и проведение спектрального анализа текущего кадра для определения распределения энергии по перцепционным критическим полосам.

5. Способ по п.1, в котором спектральный наклон пропорционален отношению между энергией текущего кадра на низких частотах и энергией текущего кадра на высоких частотах.

6. Способ по п.4, предусматривающий вычисление меры (

), характеризующей энергию текущего кадра на высоких частотах, путем вычисления средней из энергий последних двух перцепционных критических полос.

7. Способ по п.4, предусматривающий вычисление меры (

), характеризующей энергию текущего кадра на низких частотах, путем вычисления средней из энергий первых i перцепционных критических полос.

8. Способ по п.4, предусматривающий вычисление меры (

), характеризующей энергию текущего кадра на низких частотах, путем вычисления средней из энергий первых i перцепционных критических полос, за исключением первой перцепционной критической полосы.

9. Способ по п.7, дополнительно предусматривающий определение периода основного тона речи, а для периодов основного тона речи, которые меньше, чем предварительно определенное значение, - вычисление меры (

) энергии на низких частотах путем суммирования в пределах интервалов дискретизации по частоте, получаемых в результате спектрального анализа текущего кадра, и учета только интервалов дискретизации по частоте, достаточно близких к гармоникам речи, при суммировании по формуле

где E_BIN(k) - энергии в пределах интервалов дискретизации, K_min - индекс первого интервала дискретизации по частоте, учитываемый при суммировании, cnt - количество ненулевых членов при суммировании, а w_h(k) задают равным 1, если расстояние между интервалом дискретизации по частоте и ближайшей гармоникой не превышает предварительно определенный порог частоты, и задают w_h(k) равным нулю в противном случае.

10. Способ по п.7, дополнительно предусматривающий определение периода основного тона речи, а для периодов основного тона речи, которые больше, чем предварительно определенное значение, - вычисление меры (

) энергии на низких частотах по формуле

где E_СВ(k) - энергия перцепционной критической полосы k.

11. Способ по п.7, дополнительно предусматривающий определение априори невокализованного звука, когда

r_x(0)+r_x(1)+r_e<0,6,

и вычисление меры (

) энергии на низких частотах по формуле

12. Способ по любому из пп.6-11, дополнительно предусматривающий вычисление меры (N_h), характеризующей энергию шума текущего кадра на высоких частотах, путем вычисления средней из энергий последних двух перцепционных критических полос, вычисление меры (N_l), характеризующей энергию шума текущего кадра на низких частотах, путем вычисления средней из энергий первых i перцепционных критических полос, вычитание меры (N_h) шума на высоких частотах из меры (

) энергии на высоких частотах для получения энергии (E_h) на высоких частотах, вычитание меры (N_l) шума на низких частотах из меры (

) энергии на низких частотах для получения энергии (E_l) на низких частотах, и вычисление меры (e_tilt) спектрального наклона как отношения, представляющего собой энергию (E_l) на низких частотах, деленную на энергию (E_h) на высоких частотах.

13. Способ по п.12, предусматривающий проведение спектрального анализа по п.4 дважды за текущий кадр, один раз - для первой половины текущего кадра и один раз - для второй половины текущего кадра, и дополнительно предусматривающий вычисление меры (e_tilt) спектрального наклона дважды за текущий кадр, по одному разу для каждого спектрального анализа, чтобы получить первую меру (e_tilt(0)) спектрального наклона для первой половины текущего кадра и вторую меру (e_tilt(1)) спектрального наклона для второй половины текущего кадра.

14. Способ по п.13, дополнительно предусматривающий вычисление среднего спектрального наклона (e-_t) по формуле

где e_old - мера спектрального наклона, полученная в результате спектрального анализа второй половины предыдущего кадра.

15. Способ по п.1, предусматривающий вычисление относительной энергии (E_rel) текущего кадра как разности между энергией (E_t) кадра в дБ и значения (

) долгосрочной средней энергии кадра.

16. Способ по п.15, предусматривающий вычисление энергии (E_t) кадра по формуле

где E_СВ(i) - средние энергии, приходящиеся на критическую полосу.

17. Способ по п.15, предусматривающий вычисление значения долгосрочной средней энергии по формуле

= 0,99

+ 0,01E_t,

где

имеет начальное значение 45 дБ.

18. Способ по п.1, дополнительно предусматривающий выбор скорости кодирования в битах из набора доступных скоростей кодирования в битах и кодирование текущего кадра в соответствии с выбранной скоростью кодирования в битах.

19. Способ по п.18, в котором набор доступных скоростей кодирования в битах включает в себя полную скорость кодирования в битах, половинную скорость кодирования в битах, четвертную скорость кодирования в битах и одну восьмую скорости кодирования в битах.

20. Способ по п.19, в котором, когда текущий кадр классифицирован как невокализованный кадр, кодируют этот текущий кадр с упомянутой половинной скоростью кодирования в битах помощью алгоритма кодирования невокализованных сигналов с половинной скоростью.

21. Способ по п.19, в котором упомянутая процедура классификации, проводимая, чтобы определить, является ли текущий кадр невокализованным кадром, дополнительно включает в себя определение того, является ли текущий кадр переходным между вокализованной речью и невокализованной речью, и когда текущий кадр является переходным между вокализованной речью и невокализованной речью, кодируют этот текущий кадр с упомянутой половинной скоростью кодирования в битах с помощью алгоритма кодирования невокализованных сигналов с половинной скоростью, а когда текущий кадр классифицирован как невокализованная речь и не является переходным между вокализованной речью и невокализованной речью, кодируют этот текущий кадр с упомянутой четвертной скоростью кодирования в битах с помощью алгоритма кодирования невокализованных сигналов с четвертной скоростью.

22. Способ по п.1, предусматривающий использование алгоритма генерирования комфортного шума, когда определено, что текущий кадр является неактивным речевым кадром.

23. Способ по п.1, предусматривающий использование режима прерывистой передачи, когда определено, что текущий кадр является неактивным речевым кадром.

24. Способ по п.19, предусматривающий определение набора рабочих режимов, причем каждый рабочий режим обеспечивает предварительно определенную среднюю скорость в битах, выбор рабочего режима и кодирование дискретизированного речевого сигнала в соответствии с выбранным рабочим режимом.

25. Способ по п.24, в котором набор рабочих режимов содержит высококачественный режим, имеющий самую высокую среднюю скорость в битах, стандартный режим, имеющий промежуточную среднюю скорость в битах, и экономичный режим, имеющий самую низкую среднюю скорость в битах.

26. Способ по п.25, в котором, когда дискретизированный речевой сигнал кодируют в высококачественном режиме, а текущий кадр классифицирован как невокализованный кадр, этот текущий кадр кодируют с упомянутой половинной скоростью кодирования в битах, когда удовлетворяются следующие условия: упомянутая мера звучания меньше, чем предварительно определенное первое пороговое значение, и упомянутая мера спектрального наклона меньше, чем предварительно определенное второе пороговое значение, и упомянутая вариация энергии меньше, чем предварительно определенное третье пороговое значение.

27. Способ по п.25, в котором, когда дискретизированный речевой сигнал кодируют в стандартном режиме, а текущий кадр классифицирован как невокализованный кадр, этот текущий кадр кодируют с упомянутой половинной скоростью кодирования в битах, когда удовлетворяются следующие условия: упомянутая мера звучания меньше, чем предварительно определенное четвертое пороговое значение, и упомянутая мера спектрального наклона меньше, чем предварительно определенное пятое пороговое значение, и упомянутая вариация энергии меньше, чем предварительно определенное шестое пороговое значение, или упомянутая относительная энергия меньше, чем предварительно определенное седьмое пороговое значение.

28. Способ по п.27, в котором упомянутое четвертое пороговое значение составляет 0,695, упомянутое пятое пороговое значение составляет 4, упомянутое шестое пороговое значение составляет 40, а упомянутое седьмое пороговое значение составляет -14.

29. Способ по п.25, в котором, когда дискретизированный речевой сигнал кодируют в экономичном режиме, а текущий кадр классифицирован как невокализованный кадр, этот текущий кадр кодируют с упомянутой половинной скоростью кодирования в битах, когда удовлетворяются следующие условия: упомянутая мера звучания меньше, чем предварительно определенное восьмое пороговое значение, и упомянутая мера спектрального наклона меньше, чем предварительно определенное девятое пороговое значение, и упомянутая вариация энергии меньше, чем предварительно определенное десятое пороговое значение, или упомянутая относительная энергия меньше, чем предварительно определенное одиннадцатое пороговое значение.

30. Способ по п.29, в котором упомянутое восьмое пороговое значение составляет 0,695, упомянутое девятое пороговое значение составляет 4, упомянутое десятое пороговое значение составляет 60, а упомянутое одиннадцатое пороговое значение составляет -14.

31. Способ по п.25, в котором, когда дискретизированный речевой сигнал кодируют в экономичном режиме, а текущий кадр классифицирован как невокализованный кадр, этот текущий кадр кодируют с упомянутой четвертной скоростью кодирования в битах, когда удовлетворяются следующие дополнительные условия: нормализованная корреляция (r_x(2)) в кадре упреждающей выборки меньше, чем предварительно определенное двенадцатое пороговое значение, и вторая мера (e_tilt(1)) спектрального наклона для второй половины текущего кадра меньше, чем предварительно определенное тринадцатое пороговое значение.

32. Способ по п.31, в котором упомянутое двенадцатое пороговое значение составляет 0,73, а упомянутое тринадцатое пороговое значение составляет 3.

33. Устройство для кодирования дискретизированного речевого сигнала, содержащего речевые кадры, содержащее детектор речевой активности для определения того, являются ли кадры дискретизированного речевого сигнала активными речевыми кадрами или неактивными речевыми кадрами, блок классификации, выполненный с возможностью проведения процедуры классификации на активных речевых кадрах для определения того, являются ли упомянутые активные речевые кадры невокализованными кадрами, причем упомянутая процедура классификации предусматривает проверку, по меньшей мере, трех из следующих параметров, чтобы определить, является ли текущий кадр невокализованным кадром:

а) меры (r_x,

) звучания,

б) меры (е_tilt, е_t) спектрального наклона,

при этом упомянутое устройство выполнено с возможностью кодирования текущего кадра с помощью алгоритма кодирования невокализованных сигналов, когда блок классификации классифицирует текущий кадр как невокализованный кадр.

34. Устройство по п.33, в котором меру (

) звучания определяют как

35. Устройство по п.34, выполненное с дополнительной возможностью прибавления поправки (r_e) на шум к упомянутой мере (

_x) звучания.

36. Устройство по п.33, выполненное с возможностью определения количества перцепционных критических полос, характеризующих диапазоны частот в пределах спектра энергии текущего кадра, упорядоченных в соответствии с увеличением частоты от первой перцепционной критической полосы, соответствующей диапазону самых низких частот, до последней перцепционной критической полосы, соответствующей диапазону самых высоких частот, и проведения спектрального анализа текущего кадра для определения распределения энергии по перцепционным критическим полосам.

37. Устройство по п.33, в котором спектральный наклон пропорционален отношению между энергией текущего кадра на низких частотах и энергией текущего кадра на высоких частотах.

38. Устройство по п.36, выполненное с возможностью вычисления меры (

39. Устройство по п.36, выполненное с возможностью вычисления меры (

40. Устройство по п.36, выполненное с возможностью вычисления меры (

41. Устройство по п.39, выполненное с возможностью определения периода основного тона речи, а для периодов основного тона речи, которые меньше, чем предварительно определенное значение, - с возможностью вычисления меры (

42. Устройство по п.39, выполненное с дополнительной возможностью определения периода основного тона речи, а для периодов основного тона речи, которые больше, чем предварительно определенное значение, - с возможностью вычисления меры (

) энергии на низких частотах по формуле

43. Устройство по п.39, выполненное с дополнительной возможностью определения априори невокализованного звука, когда

r_x(0)+r_x(1)+r_e<0,6,

и вычисления меры (

) энергии на низких частотах по формуле

44. Устройство по любому из пп.38-43, выполненное с дополнительными возможностями вычисления меры (N_h), характеризующей энергию шума текущего кадра на высоких частотах, путем вычисления средней из энергий последних двух перцепционных критических полос, вычисления меры (N_l), характеризующей энергию шума текущего кадра на низких частотах, путем вычисления средней из энергий первых i перцепционных критических полос, вычитания меры (N_h) шума на высоких частотах из меры (

) энергии на высоких частотах для получения энергии (E_h) на высоких частотах, вычитания меры (N_l) шума на низких частотах из меры (

) энергии на низких частотах для получения энергии (E_l) на низких частотах, и вычисления меры (e_tilt) спектрального наклона как отношения, представляющего собой энергию (E_l) на низких частотах, деленную на энергию (E_h) на высоких частотах.

45. Устройство по п.44, выполненное с возможностью проведения спектрального анализа по п.36 дважды за текущий кадр, один раз - для первой половины текущего кадра и один раз - для второй половины текущего кадра, а также с возможностью вычисления меры (e_tilt) спектрального наклона дважды за текущий кадр, по одному разу для каждого спектрального анализа, чтобы получить первую меру (e_tilt(0)) спектрального наклона для первой половины текущего кадра и вторую меру (e_tilt(1)) спектрального наклона для второй половины текущего кадра.

46. Устройство по п.45, выполненное с дополнительной возможностью вычисления среднего спектрального наклона (e-_t) по формуле

47. Устройство по п.33, выполненное с возможностью вычисления относительной энергии (E-_rel) текущего кадра как разности между энергией (E_t) кадра в дБ и значения (

) долгосрочной средней энергии кадра.

48. Устройство по п.47, выполненное с возможностью вычисления энергии (E-_t) кадра по формуле

49. Устройство по п.47, выполненное с возможностью вычисления значения долгосрочной средней энергии по формуле

= 0,99

+ 0,01E_t,

где

имеет начальное значение 45 дБ.

50. Устройство по п.33, выполненное с возможностью выбора скорости кодирования в битах из набора доступных скоростей кодирования в битах, и кодирования текущего кадра в соответствии с выбранной скоростью кодирования в битах.

51. Устройство по п.50, в котором набор доступных скоростей кодирования в битах включает в себя полную скорость кодирования в битах, половинную скорость кодирования в битах, четвертную скорость кодирования в битах и одну восьмую скорости кодирования в битах.

52. Устройство по п.51, выполненное с возможностью кодирования текущего кадра c с упомянутой половинной скоростью кодирования в битах с помощью алгоритма кодирования невокализованных сигналов с половинной скоростью, когда этот текущий кадр классифицирован как невокализованный кадр.

53. Устройство по п.51, выполненное с дополнительной возможностью определения того, является ли текущий кадр переходным между вокализованной речью и невокализованной речью, и когда текущий кадр является переходным между вокализованной речью и невокализованной речью, - с возможностью кодирования этого текущего кадра с упомянутой половинной скоростью кодирования в битах с помощью алгоритма кодирования невокализованных сигналов с половинной скоростью, а когда текущий кадр классифицирован как невокализованная речь и не является переходным между вокализованной речью и невокализованной речью, - с возможностью кодирования этого текущего кадра с упомянутой четвертной скоростью кодирования в битах с помощью алгоритма кодирования невокализованных сигналов с четвертной скоростью.

54. Устройство по п.33, выполненное с возможностью использования алгоритма генерирования комфортного шума, когда определено, что текущий кадр является неактивным речевым кадром.

55. Устройство по п.33, выполненное с возможностью использования режима прерывистой передачи, когда определено, что текущий кадр является неактивным речевым кадром.

56. Устройство по п.51, выполненное с возможностью определения набора рабочих режимов, причем каждый рабочий режим обеспечивает предварительно определенную среднюю скорость в битах, а также с возможностью выбора рабочего режима и кодирования дискретизированного речевого сигнала в соответствии с выбранным рабочим режимом.

57. Устройство по п.56, в котором набор рабочих режимов содержит высококачественный режим, имеющий самую высокую среднюю скорость в битах, стандартный режим, имеющий промежуточную среднюю скорость в битах, и экономичный режим, имеющий самую низкую среднюю скорость в битах.

58. Устройство по п.57, выполненное с возможностью кодирования текущего кадра с упомянутой половинной скоростью кодирования в битах, когда дискретизированный речевой сигнал кодируют в высококачественном режиме, а текущий кадр классифицирован как невокализованный кадр, и удовлетворяются следующие условия: упомянутая мера звучания меньше, чем предварительно определенное первое пороговое значение, и упомянутая мера спектрального наклона меньше, чем предварительно определенное второе пороговое значение, и упомянутая вариация энергии меньше, чем предварительно определенное третье пороговое значение.

59. Устройство по п.57, выполненное с возможностью кодирования текущего кадра с упомянутой половинной скоростью кодирования в битах, когда дискретизированный речевой сигнал кодируют в стандартном режиме, а текущий кадр классифицирован как невокализованный кадр, и удовлетворяются следующие условия: упомянутая мера звучания меньше, чем предварительно определенное четвертое пороговое значение, и упомянутая мера спектрального наклона меньше, чем предварительно определенное пятое пороговое значение, и упомянутая вариация энергии меньше, чем предварительно определенное шестое пороговое значение, или упомянутая относительная энергия меньше, чем предварительно определенное седьмое пороговое значение.

60. Устройство по п.59, в котором упомянутое четвертое пороговое значение составляет 0,695, упомянутое пятое пороговое значение составляет 4, упомянутое шестое пороговое значение составляет 40, а упомянутое седьмое пороговое значение составляет -14.

61. Устройство по п.57, выполненное с возможностью кодирования текущего кадра с упомянутой половинной скоростью кодирования в битах, когда дискретизированный речевой сигнал кодируют в экономичном режиме, а текущий кадр классифицирован как невокализованный кадр, и удовлетворяются следующие условия: упомянутая мера звучания меньше, чем предварительно определенное восьмое пороговое значение, и упомянутая мера спектрального наклона меньше, чем предварительно определенное девятое пороговое значение, и упомянутая вариация энергии меньше, чем предварительно определенное десятое пороговое значение, или упомянутая относительная энергия меньше, чем предварительно определенное одиннадцатое пороговое значение.

62. Устройство по п.61, в котором упомянутое восьмое пороговое значение составляет 0,695, упомянутое девятое пороговое значение составляет 4, упомянутое десятое пороговое значение составляет 60, а упомянутое одиннадцатое пороговое значение составляет -14.

63. Устройство по п.57, выполненное с возможностью кодирования текущего кадра с упомянутой четвертной скоростью кодирования в битах, когда дискретизированный речевой сигнал кодируют в экономичном режиме, а текущий кадр классифицирован как невокализованный кадр, и удовлетворяются следующие дополнительные условия: нормализованная корреляция (r_x(2)) в кадре упреждающей выборки меньше, чем предварительно определенное двенадцатое пороговое значение, и вторая мера (e_tilt(1)) спектрального наклона для второй половины текущего кадра меньше, чем предварительно определенное тринадцатое пороговое значение.

64. Устройство по п.63, в котором упомянутое двенадцатое пороговое значение составляет 0,73, а упомянутое тринадцатое пороговое значение составляет 3.

65. Устройство для кодирования дискретизированного речевого сигнала, содержащего речевые кадры, содержащее средство для определения того, является ли текущий кадр дискретизированного речевого сигнала активным речевым кадром или неактивным речевым кадром, средство, реагирующее на упомянутый текущий кадр, являющийся активным речевым кадром, для проведения процедуры классификации для определения того, являются ли текущий кадр невокализованным кадром, причем упомянутая процедура классификации предусматривает проверку, по меньшей мере, трех из следующих параметров, чтобы определить, является ли текущий кадр невокализованным кадром:

а) меры (r_x,

) звучания,

б) меры (е_tilt, е_t) спектрального наклона,

и средство для кодирования текущего кадра с помощью алгоритма кодирования невокализованных сигналов, когда текущий кадр классифицирован как невокализованный кадр посредством упомянутой процедуры классификации.

66. Речевой кодер, реагирующий на текущий кадр, классифицируемый как активный речевой кадр, для кодирования упомянутого текущего кадра с помощью алгоритма кодирования невокализованных сигналов, в котором активный речевой кадр также классифицируется как активный невокализованный речевой кадр путем проверки, по меньшей мере, трех параметров, выбранных из такого набора: мера (r_x,

) звучания, мера (е_tilt, е_t) спектрального наклона, вариация (dE) энергии в пределах текущего кадра, и относительная энергия (Е_rel) текущего кадра.

67. Программа машиночитаемых команд, материально воплощенная на носителе информации и выполняемая цифровым процессором данных, для проведения действий, направленных на кодирование дискретизированного речевого сигнала, содержащего речевые кадры, причем эти действия заключаются в том, что определяют, является ли текущий кадр дискретизированного речевого сигнала активным речевым кадром или неактивным речевым кадром, проводят процедуру классификации на активном речевом кадре, чтобы определить, является ли текущий кадр невокализованным кадром, причем упомянутая процедура классификации предусматривает проверку, по меньшей мере, трех из следующих параметров, чтобы определить, является ли текущий кадр невокализованным кадром:

а) меры (r_x,

) звучания,

б) меры (е_tilt,е_t) спектрального наклона,

и кодируют этот текущий кадр с помощью алгоритма кодирования невокализованных сигналов, когда текущий кадр классифицирован как невокализованный кадр посредством упомянутой процедуры классификации.

68. Программа по п.67, в которой меру (

) звучания определяют как

69. Программа по п.68, в которой упомянутые действия дополнительно предусматривают прибавление поправки (r_e) на шум к упомянутой мере (

) звучания.

70. Программа по п.67, в которой упомянутые действия дополнительно предусматривают определение количества перцепционных критических полос, характеризующих диапазоны частот в пределах спектра энергии текущего кадра, упорядоченных в соответствии с увеличением частоты от первой перцепционной критической полосы, соответствующей диапазону самых низких частот, до последней перцепционной критической полосы, соответствующей диапазону самых высоких частот, и проведение спектрального анализа текущего кадра для определения распределения энергии по перцепционным критическим полосам.

71. Программа по п.67, в которой спектральный наклон пропорционален отношению между энергией текущего кадра на низких частотах и энергией текущего кадра на высоких частотах.

72. Программа по п.70, в которой упомянутые действия дополнительно предусматривают вычисление меры (

73. Программа по п.70, в которой упомянутые действия дополнительно предусматривают вычисление меры (

74. Программа по п.70, в которой упомянутые действия дополнительно предусматривают вычисление меры (

75. Программа по п.73, дополнительно предусматривающая определение периода основного тона речи, а для периодов основного тона речи, которые меньше, чем предварительно определенное значение, - вычисление меры (

76. Программа по п.73, дополнительно предусматривающая определение периода основного тона речи, а для периодов основного тона речи, которые больше, чем предварительно определенное значение, - вычисление меры (

) энергии на низких частотах по формуле

77. Программа по п.73, в которой упомянутые действия дополнительно предусматривают определение априори невокализованного звука, когда

r_x(0)+r_x(1)+r_e<0,6,

и вычисление меры (

) энергии на низких частотах по формуле

78. Программа по любому из пп.72-77, в которой упомянутые действия дополнительно предусматривают вычисление меры (N_h), характеризующей энергию шума текущего кадра на высоких частотах, путем вычисления средней из энергий последних двух перцепционных критических полос, вычисление меры (N_l), характеризующей энергию шума текущего кадра на низких частотах, путем вычисления средней из энергий первых i перцепционных критических полос, вычитание меры (N_h) шума на высоких частотах из меры (

79. Программа по п.78, в которой упомянутые действия дополнительно предусматривают проведение спектрального анализа по п.36 дважды за текущий кадр, один раз - для первой половины текущего кадра и один раз - для второй половины текущего кадра, и дополнительно предусматривающая вычисление меры (e_tilt) спектрального наклона дважды за текущий кадр, по одному разу для каждого спектрального анализа, чтобы получить первую меру (e_tilt(0)) спектрального наклона для первой половины текущего кадра и вторую меру (e_tilt(1)) спектрального наклона для второй половины текущего кадра.

80. Программа по п.79, в которой упомянутые действия дополнительно предусматривают вычисление среднего спектрального наклона (e_t) по формуле

81. Программа по п.67, в которой упомянутые действия дополнительно предусматривают вычисление относительной энергии (E_rel) текущего кадра как разности между энергией (E_t) кадра в дБ и значения (

) долгосрочной средней энергии кадра.

82. Программа по п.81, в которой упомянутые действия дополнительно предусматривают вычисление энергии (E_t) кадра по формуле

83. Программа по п.81, в которой упомянутые действия предусматривают вычисление значения долгосрочной средней энергии по формуле

= 0,99

+ 0,01E_t,

где

имеет начальное значение 45 дБ.

84. Программа по п.67, в которой упомянутый носитель информации и цифровой процессор данных размещены внутри мобильной станции.