WO2022164207A1

WO2022164207A1 - Procédé et système permettant de générer une parole synthétisée d'un nouveau locuteur

Info

Publication number: WO2022164207A1
Application number: PCT/KR2022/001414
Authority: WO
Inventors: 김태수; 이영근; 황영태
Original assignee: 네오사피엔스 주식회사
Priority date: 2021-01-26
Filing date: 2022-01-26
Publication date: 2022-08-04

Abstract

La présente invention se rapporte à un procédé, mis en œuvre par au moins un processeur, permettant de générer une parole synthétisée d'un nouveau locuteur. Le procédé peut comprendre les étapes consistant : à recevoir un texte cible ; à acquérir des caractéristiques de locuteur d'un locuteur de référence ; à acquérir des informations concernant des changements dans des caractéristiques d'énoncé ; à déterminer des caractéristiques de locuteur d'un nouveau locuteur en utilisant les caractéristiques de locuteur acquises du locuteur de référence et les informations acquises concernant des changements des caractéristiques de l'énoncé ; et à générer une parole de sortie pour le texte cible en entrant le texte cible et les caractéristiques de locuteur déterminées du nouveau locuteur en un modèle de synthèse de texte-parole de réseau neuronal artificiel, la parole de sortie reflétant les caractéristiques de locuteur déterminées du nouveau locuteur. Selon l'invention, le modèle de synthèse de texte-parole de réseau neuronal artificiel peut être formé sur la base d'une pluralité d'éléments de texte d'apprentissage et de caractéristiques de locuteur d'une pluralité de locuteurs d'apprentissage pour délivrer en sortie une parole pour la pluralité d'éléments de texte d'apprentissage, la parole de sortie reflétant les caractéristiques de locuteur de la pluralité de locuteurs d'apprentissage.