RU2009135829A

RU2009135829A - Повышение разборчивости речи в звукозаписи развлекательных программ

Info

Publication number: RU2009135829A
Application number: RU2009135829/09A
Authority: RU
Inventors: Ханнес МЮШ (US); Ханнес МЮШ
Original assignee: Долби Лэборетериз Лайсенсинг Корпорейшн (Us); Долби Лэборетериз Лайсенсинг Корпорейшн
Priority date: 2007-02-26
Filing date: 2008-02-20
Publication date: 2011-04-10
Also published as: US20150243300A1; US20100121634A1; US20150142424A1; BRPI0807703B1; US20190341069A1; US8195454B2; JP2010519601A; US9368128B2; US20180033453A1; WO2008106036A3; CN101647059A; US9818433B2; JP2013092792A; RU2440627C2; US20120310635A1; ES2391228T3; JP5530720B2; EP2118885B1; US20160322068A1; BRPI0807703A2

Abstract

1. Способ повышения разборчивости речи в звукозаписи развлекательных программ, содержащий этапы, на которых ! обрабатывают в ответ на одно или более управляющих воздействий звукозапись развлекательных программ для улучшения ясности и разборчивости участков речи в звукозаписи развлекательных программ, при этом обработка включает в себя этапы, на которых ! изменяют уровень звукозаписи развлекательных программ в каждой из множества полос частот в соответствии с характеристикой коэффициента усиления, которая соотносит уровень сигнала полосы с коэффициентом усиления, и ! формируют управляющий сигнал для изменения характеристики коэффициента усиления в каждой полосе частот, при этом формирование включает в себя этапы, на которых ! характеризуют отрезки времени звукозаписи развлекательных программ (a) как речевые или неречевые, либо (b) как вероятно являющиеся речевыми или неречевыми, при этом определение производится в одной широкой полосе частот, ! получают в каждой из упомянутого множества полос частот меру пульсаций уровней речи, ! отслеживают в каждой из множества полос частот минимум уровня звукозаписи в полосе, при этом время отклика отслеживания является реагирующим на меру пульсаций уровней речи, ! преобразуют отслеживаемые минимумы в каждой полосе в соответствующий адаптивный пороговый уровень, и ! смещают каждый соответствующий адаптивный пороговый уровень по результату характеризации для формирования управляющего сигнала для каждой полосы частот. ! 2. Способ повышения разборчивости речи в звукозаписи развлекательных программ, содержащий этапы, на которых ! обрабатывают в ответ на один или

Claims

1. Способ повышения разборчивости речи в звукозаписи развлекательных программ, содержащий этапы, на которых

обрабатывают в ответ на одно или более управляющих воздействий звукозапись развлекательных программ для улучшения ясности и разборчивости участков речи в звукозаписи развлекательных программ, при этом обработка включает в себя этапы, на которых

изменяют уровень звукозаписи развлекательных программ в каждой из множества полос частот в соответствии с характеристикой коэффициента усиления, которая соотносит уровень сигнала полосы с коэффициентом усиления, и

формируют управляющий сигнал для изменения характеристики коэффициента усиления в каждой полосе частот, при этом формирование включает в себя этапы, на которых

характеризуют отрезки времени звукозаписи развлекательных программ (a) как речевые или неречевые, либо (b) как вероятно являющиеся речевыми или неречевыми, при этом определение производится в одной широкой полосе частот,

получают в каждой из упомянутого множества полос частот меру пульсаций уровней речи,

отслеживают в каждой из множества полос частот минимум уровня звукозаписи в полосе, при этом время отклика отслеживания является реагирующим на меру пульсаций уровней речи,

преобразуют отслеживаемые минимумы в каждой полосе в соответствующий адаптивный пороговый уровень, и

смещают каждый соответствующий адаптивный пороговый уровень по результату характеризации для формирования управляющего сигнала для каждой полосы частот.

2. Способ повышения разборчивости речи в звукозаписи развлекательных программ, содержащий этапы, на которых

обрабатывают в ответ на один или более управляющих сигналов звукозапись развлекательной программы для улучшения ясности и разборчивости участков речи звукозаписи развлекательных программ, при этом обработка включает в себя этапы, на которых

изменяют уровень звукозаписи развлекательной программы в каждой из множества полос частот в соответствии с характеристикой коэффициента усиления, которая соотносит уровень сигнала полосы с коэффициентом усиления, и

принимают характеризацию отрезков времени звукозаписи развлекательных программ как (a) речевые или неречевые, либо (b) как вероятно являющиеся речевыми или неречевыми, при этом характеризации относятся к одной широкой полосе частот,

получают в каждой из множества полос частот меру пульсаций уровней речи,

смещают каждый соответствующий адаптивный пороговый уровень по результату определения для выработки управляющего воздействия для каждой полосы.

3. Способ по п.1, в котором имеют доступ к временной эволюции звукозаписи развлекательных программ до и после момента обработки и при формировании управляющего воздействия реагируют на, по меньшей мере, некоторую звукозапись после момента обработки.

4. Способ по п.1, в котором обработку осуществляют в соответствии с одним или более параметров обработки.

5. Способ по п.4, в котором настройка одного или более параметров зависит от звукозаписи развлекательной программы, так чтобы показатель разборчивости речи обработанной звукозаписи был максимизирован или форсирован выше требуемого порогового уровня.

6. Способ по п.5, в котором звукозаписи развлекательных программ содержат многочисленные каналы звукозаписи, в которых один канал является главным образом речевым, а один или более других каналов являются главным образом неречевыми, при этом показатель разборчивости речи основан на уровне речевого канала и уровне в одном или более других каналов.

7. Способ по п.6, в котором показатель разборчивости речи также основан на уровне шума в среде прослушивания, в которой воспроизводится обработанная звукозапись.

8. Способ по п.4, в котором настройка одного или более параметров зависит от одного или более долгосрочных дескрипторов звукозаписи развлекательных программ.

9. Способ по п.8, в котором долгосрочный дескриптор является средним уровнем диалога звукозаписи развлекательной программы.

10. Способ по п.8, в котором долгосрочный дескриптор является оценкой обработки, уже примененной к звукозаписи развлекательной программы.

11. Способ по п.4, в котором настраивают один или более параметров в соответствии с предписывающей формулой, при этом предписывающая формула соотносит остроту слуха слушателя или группы слушателей с одним или более параметров.

12. Способ по п.4, в котором настраивают один или более параметров в соответствии с предпочтениями одного или более слушателей.

13. Способ по п.1, в котором при обработке обеспечивают управление динамическим диапазоном, динамическое выравнивание, спектральное уточнение, смещение частот, выделение речи, шумоподавление или другие действия по повышению разборчивости речи.

14. Способ по п.13, в котором управление динамическим диапазоном обеспечивают функцией сжатия/расширения динамического диапазона.

15. Устройство, содержащее средство для выполнения способа по п.1.

16. Компьютерная программа, сохраняемая на машиночитаемом носителе, для побуждения компьютера выполнять способ по п.1.

17. Машиночитаемый носитель, сохраняющий компьютерную программу, выполняющую способ по п.1.

18. Способ по п.2, в котором имеют доступ к временной эволюции звукозаписи развлекательных программ до и после момента обработки и при формировании управляющего воздействия реагируют на, по меньшей мере, некоторую звукозапись после момента обработки.

19. Способ по п.2, в котором обработку осуществляют в соответствии с одним или более параметров обработки.

20. Способ по п.19, в котором настройка одного или более параметров зависит от звукозаписи развлекательной программы, так чтобы показатель разборчивости речи обработанной звукозаписи был максимизирован или форсирован выше требуемого порогового уровня.

21. Способ по п.20, в котором звукозаписи развлекательных программ содержат многочисленные каналы звукозаписи, в которых один канал является главным образом речевым, а один или более других каналов являются главным образом неречевыми, при этом показатель разборчивости речи основан на уровне речевого канала и уровне в одном или более других каналов.

22. Способ по п.21, в котором показатель разборчивости речи также основан на уровне шума в среде прослушивания, в которой воспроизводится обработанная звукозапись.

23. Способ по п.19, в котором настройка одного или более параметров зависит от одного или более долгосрочных дескрипторов звукозаписи развлекательных программ.

24. Способ по п.23, в котором долгосрочный дескриптор является средним уровнем диалога звукозаписи развлекательной программы.

25. Способ по п.23, в котором долгосрочный дескриптор является оценкой обработки, уже примененной к звукозаписи развлекательной программы.

26. Способ по п.19, в котором настраивают один или более параметров в соответствии с предписывающей формулой, при этом предписывающая формула соотносит остроту слуха слушателя или группы слушателей с одним или более параметров.

27. Способ по п.19, в котором настраивают один или более параметров в соответствии с предпочтениями одного или более слушателей.

28. Способ по п.2, в котором при обработке обеспечивают управление динамическим диапазоном, динамическое выравнивание, спектральное уточнение, смещение частот, выделение речи, шумоподавление или другие действия по повышению разборчивости речи.

29. Способ по п.28, в котором управление динамическим диапазоном обеспечивают функцией сжатия/расширения динамического диапазона.

30. Устройство, содержащее средство для выполнения способа по п.2.

31. Компьютерная программа, сохраняемая на машиночитаемом носителе, для побуждения компьютера выполнять способ по п.2.

32. Машиночитаемый носитель, сохраняющий компьютерную программу, выполняющую способ по п.2.