EP1886302B1

EP1886302B1 - Fourniture de synthese de la parole sur des terminaux d'utilisateurs sur un reseau de communications

Info

Publication number: EP1886302B1
Application number: EP05754668A
Authority: EP
Inventors: Alessio Cervone; Ivano Salvatore Collotta; Paolo Coppo; Donato Ettorre; Maurizio Fodrini; Maura Turolla
Original assignee: Telecom Italia SpA
Current assignee: Telecom Italia SpA
Priority date: 2005-05-31
Filing date: 2005-05-31
Publication date: 2009-11-18
Anticipated expiration: 2025-05-31
Also published as: US20090306986A1; ATE449399T1; DE602005017829D1; US8583437B2; WO2006128480A1; EP1886302A1; ES2336686T3

Claims

Procédé de génération de paroles synthétisées à partir d'informations textuelles sur un terminal d'utilisateur (2), ledit terminal d'utilisateur étant muni d'un moteur de synthèse de paroles (4) ayant une base de données de base (6) de formes d'ondes de paroles, comprenant les étapes consistant à :
- commencer (52) la synthèse de paroles desdites informations textuelles en employant ladite base de données de base (6) de formes d'ondes de paroles ,

- extraire (42) des informations de contexte associées aux dites informations textuelles ,

- sélectionner (42) une base de données incrémentielle (DB1, ..., DBN) de formes d'ondes de paroles associées aux dites informations de contexte ,

- fournir (48) au dit terminal d'utilisateur (2) ladite base de données incrémentielle (DB1, ..., DBN) ,

- gérer (50) la composition d'une base de données élargie de formes d'ondes de paroles comprenant ladite base de données de base (6) et lesdites bases de données incrémentielles de formes d'ondes de paroles, et

- continuer (52) la synthèse de paroles desdites informations textuelles en employant ladite base de données élargie de formes d'ondes de paroles.
Procédé selon la revendication 1, dans lequel ladite étape consistant à fournir audit terminal d'utilisateur ladite base de données incrémentielle comprend les étapes consistant à :
- vérifier (46) si ladite base de données incrémentielle est déjà présente dans ledit terminal d'utilisateur , et

- télécharger (48), à travers un réseau de communication (12), ladite base de données incrémentielle dans ledit terminal d'utilisateur, si elle n'y est pas déjà présente.
Procédé selon la revendication 2, dans lequel ladite étape consistant à télécharger ladite base de données incrémentielle dans ledit terminal d'utilisateur comprend les étapes consistant à :
- télécharger une base de données incrémentielle de formes d'ondes de paroles (92) , et

- mettre à jour un fichier descripteur (94) de ladite base de données élargie de formes d'ondes de paroles.
Procédé selon la revendication 1, comprenant en outre l'étape consistant à stocker ladite base de données incrémentielle dans une mémoire cache sur ledit terminal d'utilisateur.
Procédé selon la revendication 1, dans lequel ladite étape consistant à sélectionner (42) une base de données incrémentielle (DB1, ..., DBN) de formes d'ondes de paroles associées aux dites informations de contexte est effectuée selon des règles de contexte indépendantes de profils d'utilisateurs.
Procédé selon la revendication 1, dans lequel ladite étape consistant à sélectionner (42) une base de données incrémentielle (DB1, ..., DBN) de formes d'ondes de paroles associées aux dites informations de contexte est effectuée selon des règles de contexte basées sur un profil d'utilisateur.
Procédé selon la revendication 1, dans lequel lesdites informations textuelles sont extraites par ledit terminal d'utilisateur à travers un réseau de communication (12).
Procédé selon la revendication 1, comprenant l'étape consistant à :
- remplacer ladite base de données de base (6) de formes d'ondes de paroles en téléchargeant, à travers un réseau de communication (12), une base de données de base de substitution dans ledit terminal d'utilisateur (2).
Procédé selon l'une quelconque des revendications 2, 3, 7 et 8, dans lequel ledit réseau de communication est un réseau de télécommunications sans fil.
Architecture de services comprenant un terminal d'utilisateur pour fournir au dit terminal d'utilisateur (2) une synthèse de paroles relative à des informations textuelles, ledit terminal d'utilisateur étant muni d'un moteur de synthèse de paroles (4) et d'une base de données de base de formes d'ondes de paroles (6), caractérisée en ce qu'elle comprend :
- un serveur de contexte (14) pour télécharger une base de données incrémentielle (DB1, ..., DBN) de formes d'ondes de paroles dans ledit terminal d'utilisateur, la base de données incrémentielle étant associée à des informations de contexte associées aux dites informations textuelles ,

- un gestionnaire de base de données (26) sur ledit terminal d'utilisateur (2) pour gérer la composition d'une base de données élargie de formes d'ondes de paroles pour ledit moteur de synthèse de paroles comprenant ladite base de données de base (6) et lesdites bases de données incrémentielles (DB1, ..., DBN) de formes d'ondes de paroles, ledit moteur de synthèse de paroles (4) étant opérationnel pour commencer la synthèse de paroles desdites informations textuelles en employant ladite base de données de base de formes d'ondes de paroles (6) aussi longtemps que ladite base de données élargie de formes d'ondes de paroles n'est pas encore disponible.
Architecture de services selon la revendication 10, dans laquelle ledit serveur de contexte (14) comprend :
- un gestionnaire de contexte (22) pour extraire des informations de contexte desdites informations textuelles ,

- un sélecteur de contexte (24) pour sélectionner une base de données incrémentielle (DB1, ..., DBN) de formes d'ondes de paroles associées aux dites informations de contexte et pour télécharger ladite base de données incrémentielle dans ledit terminal d'utilisateur.
Architecture de services selon la revendication 10, comprenant en outre sur ledit terminal d'utilisateur (2) une mémoire cache (10) pour stocker provisoirement au moins une base de données incrémentielle téléchargée.
Architecture de services selon la revendication 11, comprenant en outre un serveur de base de données (8) stockant une pluralité de bases de données incrémentielles (DB1, ..., DBN) sélectionnées par ledit sélecteur de contexte (24).
Architecture de services selon la revendication 11, dans laquelle ledit sélecteur de contexte (24) fonctionne en fonction de règles de contexte indépendantes de profils d'utilisateurs.
Architecture de services selon la revendication 11, dans laquelle ledit sélecteur de contexte (24) fonctionne en fonction de règles de contexte basées sur un profil d'utilisateur.
Architecture de services selon la revendication 10, comprenant en outre un serveur de contenus (16) pour télécharger lesdites informations textuelles dans ledit terminal d'utilisateur.
Architecture de services selon l'une quelconque des revendications 10 à 16, dans laquelle ledit réseau de communication est un réseau de télécommunications sans fil.
Terminal d'utilisateur (2) pour un réseau de communication comprenant :
- une base de données de base (6) de formes d'ondes de paroles ,

- un moyen (18) pour extraire des informations textuelles à convertir en paroles synthétisées ,
caractérisé en ce qu'il comprend :
- un gestionnaire de bases de données (26) pour télécharger une base de données incrémentielle de formes d'ondes de paroles (DB1, ..., DBN) d'un serveur de base de données (8), ladite base de données incrémentielle étant associée à des informations de contexte associées aux dites informations textuelles, et pour gérer la composition d'une base de données élargie de formes d'ondes de paroles pour ledit moteur de synthèse de paroles (4), comprenant ladite base de données de base (6) et lesdites base de données incrémentielles de formes d'ondes de paroles ,

- un moteur de synthèse de paroles (4) opérationnel pour commencer la synthèse de paroles desdites informations textuelles en employant ladite base de données de base de formes d'ondes de paroles (6) aussi longtemps que ladite base de données élargie de formes d'ondes de paroles n'est pas encore disponible.
Terminal d'utilisateur selon la revendication 18, comprenant en outre une mémoire cache (10) pour stocker provisoirement au moins une base de données incrémentielle téléchargée.
Terminal d'utilisateur selon la revendication 18, dans lequel ledit moteur de synthèse de paroles (4) est basé sur une synthèse de paroles par concaténation.
Produit de programme informatique, pouvant être chargé dans la mémoire d'au moins un ordinateur et comprenant des parties de code logiciel pour effectuer le procédé selon l'une quelconque des revendications 1 à 9.