RU2016106637A

RU2016106637A - Решение относительно наличия/отсутствия вокализации для обработки речи

Info

Publication number: RU2016106637A
Application number: RU2016106637A
Authority: RU
Inventors: Ян ГАО
Original assignee: Хуавэй Текнолоджиз Ко., Лтд.
Priority date: 2013-09-09
Filing date: 2014-09-05
Publication date: 2017-10-16
Also published as: BR112016004544B1; BR112016004544A2; EP3352169A1; CN110097896B; RU2636685C2; US10347275B2; KR20170102387A; US10043539B2; JP6291053B2; ZA201600234B; KR101774541B1; US20170110145A1; EP3005364A1; EP3352169B1; EP3005364B1; MX352154B; SG11201600074VA; MY185546A; KR20180095744A; JP2016527570A

Claims

1. Способ обработки речи, причем способ содержит этапы, на которых:

определяют параметр наличия/отсутствия вокализации, отражающий характеристику невокализованной/вокализованной речи в текущем кадре речевого сигнала, содержащего множество кадров;

определяют сглаженный параметр наличия/отсутствия вокализации для включения информации параметра наличия/отсутствия вокализации в кадр, предшествующий текущему кадру речевого сигнала;

вычисляют разность между параметром наличия/отсутствия вокализации и сглаженным параметром наличия/отсутствия вокализации; и

определяют, содержит ли текущий кадр невокализованную речь или вокализованную речь, с использованием вычисленной разности в качестве параметра принятия решения.

2. Способ по п. 1, в котором параметр наличия/отсутствия вокализации является комбинированным параметром, отражающим, по меньшей мере, две характеристики невокализованной/вокализованной речи.

3. Способ по п. 2, в котором комбинированный параметр является произведением параметра периодичности и параметра спектрального наклона.

4. Способ по п. 1, в котором параметр наличия/отсутствия вокализации является параметром отсутствия вокализации (Punvoicing) отражающим характеристику невокализованной речи, причем сглаженный параметр наличия/отсутствия вокализации является сглаженным параметром отсутствия вокализации (Punvoicing_sm).

5. Способ по п. 4, в котором, когда разность между параметром отсутствия вокализации и сглаженным параметром отсутствия вокализации больше 0.1, определяют, что текущий кадр речевого сигнала является невокализованным сигналом, при этом, когда разность между параметром отсутствия вокализации и сглаженным параметром отсутствия вокализации меньше 0.05, определяют, что текущий кадр речевого сигнала не является невокализованной речью.

6. Способ по п. 5, в котором, когда разность между параметром отсутствия вокализации и сглаженным параметром отсутствия вокализации составляет от 0.05 до 0.1, определяют, что текущий кадр речевого сигнала имеет тот же тип речи, что и предыдущий кадр.

7. Способ по п. 4, в котором сглаженный параметр отсутствия вокализации вычисляется из параметра отсутствия вокализации следующим образом:

8. Способ по п. 1, в котором параметром наличия/отсутствия вокализации является параметр вокализации (Pvoicing), отражающий характеристику вокализованной речи, и при этом сглаженный параметр наличия/отсутствия вокализации является сглаженным параметром вокализации (Pvoicing_sm).

9. Способ по п. 8, в котором, когда разность между параметром вокализации и сглаженным параметром вокализации больше 0.1, определяют, что текущий кадр речевого сигнала является вокализованным сигналом, и при этом, когда разность между параметром вокализации и сглаженным параметром вокализации меньше 0.05, определяют, что текущий кадр речевого сигнала не является вокализованной речью.

10. Способ по п. 8, в котором сглаженный параметр вокализации вычисляется из параметра вокализации следующим образом:

11. Способ по п. 1, в котором кадр содержит подкадр.

12. Устройство обработки речи, содержащее:

процессор; и

компьютерно-считываемый носитель данных, хранящий программное обеспечение для исполнения процессором, причем программное обеспечение включает в себя инструкции для:

определения параметра наличия/отсутствия вокализации, отражающего характеристику невокализованной/вокализованной речи в текущем кадре речевого сигнала, содержащего множество кадров,

определения сглаженного параметра наличия/отсутствия вокализации для включения информации параметра наличия/отсутствия вокализации в кадр, предшествующий текущему кадру речевого сигнала,

вычисления разности между параметром наличия/отсутствия вокализации и сглаженным параметром наличия/отсутствия вокализации, и

определения, содержит ли текущий кадр невокализованную речь или вокализованную речь, с использованием вычисленной разности в качестве параметра принятия решения.

13. Устройство по п. 12, в котором параметр наличия/отсутствия вокализации является комбинированным параметром, отражающим произведение параметра периодичности и параметра спектрального наклона.

14. Устройство по п. 12, в котором, когда разность между параметром наличия/отсутствия вокализации и сглаженным параметром наличия/отсутствия вокализации больше 0.1, определение, что текущий кадр речевого сигнала является невокализованным/вокализованным сигналом, при этом, когда разность между параметром наличия/отсутствия вокализации и сглаженным параметром наличия/отсутствия вокализации меньше 0.05, осуществляется определение, что текущий кадр речевого сигнала не является невокализованной/вокализованной речью.

15. Устройство по п. 12, в котором параметр наличия/отсутствия вокализации является параметром отсутствия вокализации, отражающим характеристику невокализованной речи, и при этом сглаженный параметр наличия/отсутствия вокализации является сглаженным параметром отсутствия вокализации.

16. Устройство по п. 12, в котором параметр наличия/отсутствия вокализации является параметром вокализации, отражающим характеристику вокализованной речи, и при этом сглаженный параметр наличия/отсутствия вокализации является сглаженным параметром вокализации.

17. Устройство по п. 12, в котором кадр содержит подкадр.