RU2017143129A

RU2017143129A - Способ захвата речевого ввода от пользователя, система и машиночитаемые запоминающие носители

Info

Publication number: RU2017143129A
Application number: RU2017143129A
Authority: RU
Inventors: Сандип Радж ГАНДИГА
Original assignee: ФОРД ГЛОУБАЛ ТЕКНОЛОДЖИЗ, ЭлЭлСи
Priority date: 2016-12-13
Filing date: 2017-12-11
Publication date: 2019-06-11
Also published as: US20180166073A1; DE102017129484A1; MX2017016084A; GB201720160D0; GB2559460A; CN108231071A

Claims

1. Способ захвата речевого ввода от пользователя, при этом способ содержит этапы, на которых

буферизуют аудиоданные для формирования звука;

воспроизводят упомянутые аудиоданные на одном или более динамиков;

захватывают аудио (захваченное аудио) с использованием микрофона;

фильтруют захваченное аудио для того, чтобы формировать фильтрованное аудио, при этом фильтрация содержит этап, на котором осуществляют фильтрацию с использованием буферизированных аудиоданных, чтобы удалять аудио, соответствующее упомянутым аудиоданным, из захваченного аудио; и

формируют текст или команды на основе фильтрованного аудио.

2. Способ по п. 1, в котором захват захваченного аудио с использованием микрофона содержит этап, на котором осуществляют захват в ходе воспроизведения упомянутых аудиоданных на одном или более динамиков.

3. Способ по п. 1, дополнительно содержащий этап, на котором определяют, воспроизводятся ли какие-либо аудиоданные, при этом буферизация аудиоданных содержит этап, на котором осуществляют буферизацию в ответ на определение того, что аудиоданные воспроизводятся.

4. Способ по п. 1, дополнительно содержащий этап, на котором определяют время для воспроизведения упомянутых аудиоданных.

5. Способ по п. 4, в котором фильтрация захваченного аудио с использованием буферизированных аудиоданных содержит этап, на котором осуществляют фильтрацию на основе упомянутого времени для воспроизведения упомянутых аудиоданных.

6. Способ по п. 1, в котором буферизация аудиоданных для формирования звука содержит этап, на котором захватывают упомянутые аудиоданные из буфера необработанного аудио перед удалением из буфера необработанного аудио, при этом упомянутые аудиоданные размещены в буфере необработанного аудио до воспроизведения на одном или более динамиков.

7. Способ по п. 1, в котором упомянутые аудиоданные содержат музыку, аудио, соответствующее видео, звук оповещения и голосовую инструкцию.

8. Способ по п. 1, дополнительно содержащий этап, на котором определяют операцию, которая должна выполняться посредством вычислительного устройства или управляемой системы, на основе текста или команды.

9. Способ по п. 1, дополнительно содержащий этап, на котором принимают указание, чтобы активировать распознавание речи, при этом буферизация аудиоданных, захват аудио, фильтрация захваченного аудио и выполнение преобразования речи в текст содержит этап, на котором осуществляют упомянутые буферизацию, захват, фильтрацию и выполнение в ответ на прием упомянутого указания.

10. Система, содержащая

компонент воспроизведения аудио, выполненный с возможностью буферизовать аудиоданные для формирования звука;

компонент рендеринга аудио, выполненный с возможностью воспроизводить упомянутые аудиоданные на одном или более динамиков;

компонент захвата, выполненный с возможностью захватывать аудио (захваченное аудио) с использованием микрофона;

компонент фильтрации, выполненный с возможностью фильтровать захваченное аудио для того, чтобы формировать фильтрованное аудио, при этом фильтрация содержит фильтрацию с использованием буферизированных аудиоданных, чтобы удалять аудио, соответствующее упомянутым аудиоданным, из захваченного аудио; и

компонент распознавания речи, выполненный с возможностью формировать текст или команды на основе фильтрованного аудио.

11. Система по п. 10, в которой компонент захвата выполнен с возможностью захватывать захваченное аудио в ходе воспроизведения упомянутых аудиоданных на одном или более динамиков.

12. Система по п. 10, в которой компонент воспроизведения аудио дополнительно выполнен с возможностью определять, воспроизводятся ли какие-либо аудиоданные, при этом воспроизводимое аудио выполнено с возможностью буферизовать упомянутые аудиоданные в ответ на определение того, что аудиоданные воспроизводятся.

13. Система по п. 10, в которой компонент воспроизведения аудио дополнительно выполнен с возможностью определять время для воспроизведения упомянутых аудиоданных.

14. Система по п. 13, в которой компонент фильтрации выполнен с возможностью фильтровать захваченное аудио с использованием буферизированных аудиоданных на основе упомянутого времени для воспроизведения упомянутых аудиоданных.

15. Система по п. 10, в которой компонент распознавания речи дополнительно выполнен с возможностью определять операцию, которая должна выполняться посредством вычислительного устройства или системы управления, на основе текста или команды.

16. Машиночитаемый запоминающий носитель, сохраняющий инструкции, которые, при выполнении посредством одного или более процессоров, инструктируют одному или более процессоров

буферизовать аудиоданные для формирования звука;

воспроизводить упомянутые аудиоданные на одном или более динамиков;

захватывать аудио (захваченное аудио) с использованием микрофона;

фильтровать захваченное аудио для того, чтобы формировать фильтрованное аудио, при этом фильтрация содержит фильтрацию с использованием буферизированных аудиоданных, чтобы удалять аудио, соответствующее упомянутым аудиоданным, из захваченного аудио; и

формировать текст или команды на основе фильтрованного аудио.

17. Машиночитаемый запоминающий носитель по п. 16, в котором инструкции дополнительно инструктируют одному или более процессоров захватывать захваченное аудио в ходе воспроизведения упомянутых аудиоданных на одном или более динамиков.

18. Машиночитаемый запоминающий носитель по п. 16, в котором инструкции дополнительно инструктируют одному или более процессоров определять время для воспроизведения упомянутых аудиоданных.

19. Машиночитаемый запоминающий носитель по п. 18, в котором инструкции дополнительно инструктируют одному или более процессоров фильтровать захваченное аудио с использованием буферизированных аудиоданных на основе упомянутого времени для воспроизведения упомянутых аудиоданных.

20. Машиночитаемый запоминающий носитель по п. 16, в котором инструкции дополнительно инструктируют одному или более процессоров определять операцию, которая должна выполняться посредством вычислительного устройства или системы управления, на основе текста или команды.