MX2023004329A

MX2023004329A - Generador de audio y metodos para generar una se?al de audio y entrenar un generador de audio.

Info

Publication number: MX2023004329A
Application number: MX2023004329A
Authority: MX
Inventors: Guillaume Fuchs; Markus Multrus; Jan Büthe; Srikanth Korse; Ahmed Mustafa Mahmoud Ahmed; Nicola Pia; Kishan Gupta
Original assignee: Fraunhofer Ges Forschung
Priority date: 2020-10-15
Filing date: 2021-10-13
Publication date: 2023-06-13
Also published as: JP2023546099A; EP4229624A1; WO2022078651A1; KR20230109631A; CA3195582A1; MX2023004330A; WO2022079129A1; US20230317056A1; CN116648742A; CN116686042A; KR20230109630A; EP4229623A1; CA3195578A1; WO2022079130A1; US20230282202A1; JP2023546098A; WO2022078634A1

Abstract

Se describen técnicas para generar una señal de audio y entrenar un generador de audio. Un generador de audio (10) puede generar una señal de audio (16) a partir de una señal de entrada (14) y datos objetivo (12) que representan la señal de audio (16). Los datos objetivo (12) se derivan de texto. El generador de audio comprende: un primer bloque de procesamiento (40, 50, 50a-50h), que recibe primeros datos (15, 59a) derivados de la señal de entrada (14) y que genera primeros datos de salida (69); un segundo bloque de procesamiento (45), que recibe, como segundos datos, los primeros datos de salida (69) o datos derivados de los primeros datos de salida (69). El primer bloque de procesamiento (50) comprende: un conjunto de acondicionamiento de capas de aprendizaje (71, 72, 73) configuradas para procesar los datos objetivo (12) para obtener parámetros de características de acondicionamiento (74, 75); y un elemento de estilo (77), configurado para aplicar los parámetros de las características de acondicionamiento (74, 75) a los primeros datos (15, 59a) o primeros datos normalizados (59, 76').