BR112023019971A2

BR112023019971A2 - Reconhecimento de fala visual adaptativo

Info

Publication number: BR112023019971A2
Application number: BR112023019971A
Authority: BR
Inventors: Brendan Shillingford; Alexandros Assael Ioannis; Ferdinando Gomes De Freitas Joao
Original assignee: Deepmind Tech Ltd
Priority date: 2021-06-18
Filing date: 2022-06-15
Publication date: 2023-11-21
Also published as: AU2022292104A1; KR102663654B1; WO2022263570A1; US20240265911A1; CN117121099A; AU2022292104B2; CA3214170A1; EP4288960A1; KR20230141932A; JP2024520985A

Abstract

reconhecimento de fala visual adaptativo. métodos, sistemas e aparelhos, incluindo programas de computador codificados em meios de armazenamento de computador, para processamento de dados de vídeo utilizando um modelo de reconhecimento de fala visual adaptativo. um dos métodos inclui receber um vídeo que inclui uma pluralidade de quadros de vídeo que representam um primeiro locutor; obter uma primeira incorporação caracterizando o primeiro locutor; e processar uma primeira entrada compreendendo (i) o vídeo e (ii) a primeira incorporação usando uma rede neural de reconhecimento de fala visual tendo uma pluralidade de parâmetros, em que a rede neural de reconhecimento de fala visual é configurada para processar o vídeo e a primeira incorporação de acordo com valores treinados dos parâmetros para gerar uma saída de reconhecimento de fala que define uma sequência de uma ou mais palavras sendo faladas pelo primeiro locutor no vídeo.