RU2013128375A

RU2013128375A - Система и способ для генерации аудиосигнала

Info

Publication number: RU2013128375A
Application number: RU2013128375/08A
Authority: RU
Inventors: Патрик КЕХИХЯН; ДЕН ДЮНГЕН Вилхелмус Андреас Маринус Арнолдус Мария ВАН
Original assignee: Конинклейке Филипс Электроникс Н.В.
Priority date: 2010-11-24
Filing date: 2011-11-17
Publication date: 2014-12-27
Also published as: CN103229238B; RU2595636C2; JP2014502468A; US20130246059A1; EP2643834A1; EP2458586A1; JP6034793B2; CN103229238A; BR112013012538A2; EP2643834B1; US9812147B2; WO2012069966A1

Abstract

1. Способ генерации сигнала, представляющего речь пользователя, причем способ содержит этапы, на которых:получают (101) первый аудиосигнал, представляющий речь пользователя, с использованием датчика, находящегося в контакте с пользователем,получают (101) второй аудиосигнал с использованием воздухопроводного датчика, причем второй аудиосигнал представляет речь пользователя и включает в себя шум из среды, окружающей пользователя,выявляют (103) периоды речи в первом аудиосигнале,применяют (105) алгоритм улучшения речи ко второму аудиосигналу для снижения шума во втором аудиосигнале, причем алгоритм улучшения речи использует выявленные периоды речи в первом аудиосигнале,корректируют (107) первый аудиосигнал с использованием очищенного от шума второго аудиосигнала для генерации выходного аудиосигнала, представляющего речь пользователя.2. Способ по п. 1, в котором этап (103) выявления периодов речи в первом аудиосигнале содержит выявление частей первого аудиосигнала, где амплитуда аудиосигнала превышает пороговое значение.3. Способ по п. 1 или 2, в котором этап (105) применения алгоритма улучшения речи содержит применение спектральной обработки ко второму аудиосигналу.4. Способ по п. 1 или 2, в котором этап (105) применения алгоритма улучшения речи для снижения шума во втором аудиосигнале содержит использование выявленных периодов речи в первом аудиосигнале для оценивания минимальных уровней шума в спектральной области второго аудиосигнала.5. Способ по п. 1 или 2, в котором этап (107) коррекции первого аудиосигнала содержит осуществление анализа с линейным прогнозированием на первом аудиосигнале и очищенном от шума втором ауди�

Claims

1. Способ генерации сигнала, представляющего речь пользователя, причем способ содержит этапы, на которых:

получают (101) первый аудиосигнал, представляющий речь пользователя, с использованием датчика, находящегося в контакте с пользователем,

получают (101) второй аудиосигнал с использованием воздухопроводного датчика, причем второй аудиосигнал представляет речь пользователя и включает в себя шум из среды, окружающей пользователя,

выявляют (103) периоды речи в первом аудиосигнале,

применяют (105) алгоритм улучшения речи ко второму аудиосигналу для снижения шума во втором аудиосигнале, причем алгоритм улучшения речи использует выявленные периоды речи в первом аудиосигнале,

корректируют (107) первый аудиосигнал с использованием очищенного от шума второго аудиосигнала для генерации выходного аудиосигнала, представляющего речь пользователя.

2. Способ по п. 1, в котором этап (103) выявления периодов речи в первом аудиосигнале содержит выявление частей первого аудиосигнала, где амплитуда аудиосигнала превышает пороговое значение.

3. Способ по п. 1 или 2, в котором этап (105) применения алгоритма улучшения речи содержит применение спектральной обработки ко второму аудиосигналу.

4. Способ по п. 1 или 2, в котором этап (105) применения алгоритма улучшения речи для снижения шума во втором аудиосигнале содержит использование выявленных периодов речи в первом аудиосигнале для оценивания минимальных уровней шума в спектральной области второго аудиосигнала.

5. Способ по п. 1 или 2, в котором этап (107) коррекции первого аудиосигнала содержит осуществление анализа с линейным прогнозированием на первом аудиосигнале и очищенном от шума втором аудиосигнале для построения корректирующего фильтра.

6. Способ по п. 5, в котором осуществление анализа с линейным прогнозированием содержит этапы, на которых

(i) оценивают коэффициенты линейного прогнозирования для первого аудиосигнала и очищенного от шума второго аудиосигнала,

(ii) используют коэффициенты линейного прогнозирования для первого аудиосигнала для генерации сигнала возбуждения для первого аудиосигнала,

(iii) используют коэффициенты линейного прогнозирования для очищенного от шума второго аудиосигнала для построения огибающей в частотной области, и

(iv) корректируют сигнал возбуждения для первого аудиосигнала с использованием огибающей в частотной области.

7. Способ по п. 1 или 2, в котором этап (107) коррекции первого аудиосигнала содержит (i) использование долговременных спектральных способов для построения корректирующего фильтра или (ii) использование первого аудиосигнала в качестве входного сигнала адаптивного фильтра, который минимизирует среднеквадратическую ошибку между выходным сигналом фильтра и очищенным от шума вторым аудиосигналом.

8. Способ по п. 1 или 2, в котором до этапа коррекции (107),

способ дополнительно содержит этап применения алгоритма улучшения речи к первому аудиосигналу для снижения шума в первом аудиосигнале, причем алгоритм улучшения речи использует выявленные периоды речи в первом аудиосигнале, и этап коррекции содержит коррекцию очищенного от шума первого аудиосигнала с использованием очищенного от шума второго аудиосигнала для генерации выходного аудиосигнала, представляющего речь пользователя.

9. Способ по п. 1 или 2, дополнительно содержащий этапы, на которых:

получают третий аудиосигнал с использованием второго воздухопроводного датчика, причем третий аудиосигнал представляет речь пользователя и включает в себя шум из среды, окружающей пользователя, и

используют способ формирования диаграммы направленности для объединения второго аудиосигнала и третьего аудиосигнала и генерации объединенного аудиосигнала,

причем этап (105) применения алгоритма улучшения речи содержит применение алгоритма улучшения речи к объединенному аудиосигналу для снижения шума в объединенном аудиосигнале, причем алгоритм улучшения речи использует выявленные периоды речи в первом аудиосигнале.

10. Способ по п. 1 или 2, дополнительно содержащий этапы, на которых:

получают четвертый аудиосигнал, представляющий речь пользователя, с использованием второго датчика, находящегося в контакте с пользователем, и

используют способ формирования диаграммы направленности для объединения первого аудиосигнала и четвертого аудиосигнала и генерации второго объединенного аудиосигнала,

причем этап (103) выявления периодов речи содержит выявление периодов речи во втором объединенном аудиосигнале.

11. Устройство (2) для использования при генерации аудиосигнала, представляющего речь пользователя, причем устройство (2) содержит:

схему (8) обработки, которая сконфигурирована для

приема первого аудиосигнала, представляющего речь пользователя, от датчика (4), находящегося в контакте с пользователем,

приема второго аудиосигнала от воздухопроводного датчика (б), причем второй аудиосигнал представляет речь пользователя и включает в себя шум из среды, окружающей пользователя,

выявления периодов речи в первом аудиосигнале,

применения алгоритма улучшения речи ко второму аудиосигналу для снижения шума во втором аудиосигнале, причем алгоритм улучшения речи использует выявленные периоды речи в первом аудиосигнале, и

коррекции первого аудиосигнала с использованием очищенного от шума второго аудиосигнала для генерации выходного аудиосигнала, представляющего речь пользователя.

12. Устройство (2) по п. 11, в котором схема (8) обработки сконфигурирована для коррекции первого аудиосигнала путем осуществления анализа с линейным прогнозированием на первом аудиосигнале и очищенном от шума втором аудиосигнале для построения корректирующего фильтра.

13. Устройство (2) по п. 11 или 12, в котором схема (8) обработки сконфигурирована для осуществления анализа с линейным прогнозированием посредством

(i) оценивания коэффициентов линейного прогнозирования для первого аудиосигнала и очищенного от шума второго аудиосигнала,

(ii) использования коэффициентов линейного прогнозирования для первого аудиосигнала для генерации сигнала возбуждения для первого аудиосигнала,

(iii) использования коэффициентов линейного прогнозирования для очищенного от шума аудиосигнала для построения огибающей в частотной области, и

(iv) коррекции сигнала возбуждения для первого аудиосигнала с использованием огибающей в частотной области.

14. Устройство (2) по п. 11 или 12, причем устройство (2) дополнительно содержит:

контактный датчик (4), который сконфигурирован контактировать с телом пользователя, когда устройство (2) используется, и для генерации первого аудиосигнала, и

воздухопроводный датчик (б) который сконфигурирован для генерации второго аудиосигнала.

15. Компьютерный программный продукт, содержащий машиночитаемый код, который сконфигурирован таким образом, что при выполнении машиночитаемого кода подходящим компьютером или процессором компьютер или процессор осуществляет способ по п. 1 или 2.