WO2019044401A1

WO2019044401A1 - Système informatique créant une adaptation de locuteur sans enseignant dans une synthèse de la parole basée sur dnn, et procédé et programme exécutés dans le système informatique

Info

Publication number: WO2019044401A1
Application number: PCT/JP2018/029438
Authority: WO
Inventors: 山岸　順一; 信二高木
Original assignee: 大学共同利用機関法人情報・システム研究機構
Priority date: 2017-08-29
Filing date: 2018-08-06
Publication date: 2019-03-07
Also published as: JPWO2019044401A1; JP6505346B1

Abstract

L'invention concerne un système informatique 1 qui comprend une unité d'estimation d'informations de locuteur 130 qui estime les informations de locuteur d'un locuteur inconnu sur la base de la quantité de caractéristiques acoustiques pour le locuteur inconnu sans qu'il soit nécessaire d'entrer du texte en tant que données d'enseignant. Les informations de locuteur du locuteur inconnu comprennent un code de locuteur qui représente une similarité par probabilité entre une distribution de la quantité de caractéristiques acoustiques pour le locuteur inconnu et une distribution pour chacune des quantités de caractéristiques acoustiques pour une pluralité de locuteurs connus. Le système informatique 1 comprend en outre : une unité de génération de quantité de caractéristiques acoustiques synthétisées 220 pour générer une quantité de caractéristiques acoustiques synthétisées pour le locuteur inconnu sur la base d'une quantité de caractéristiques de langue pour un texte d'entrée et des informations de locuteur du locuteur inconnu, à l'aide de modèles acoustiques (DNN) 230 de multiples locuteurs ; et une unité de génération de parole synthétisée 240 pour générer une parole synthétisée du locuteur inconnu sur la base de la quantité de caractéristiques acoustiques synthétisées du locuteur inconnu.