WO2016101688A1

WO2016101688A1 - Procédé de reconnaissance vocale continue sur la base de réseau neuronal récurrent de mémoire à court et long terme profond

Info

Publication number: WO2016101688A1
Application number: PCT/CN2015/092380
Authority: WO
Inventors: 杨毅; 孙甲松
Original assignee: 清华大学
Priority date: 2014-12-25
Filing date: 2015-10-21
Publication date: 2016-06-30
Also published as: CN104538028B; CN104538028A

Abstract

L'invention concerne un procédé de reconnaissance vocale continue sur la base d'un réseau neuronal récurrent de mémoire à court et long terme profond, comprenant : l'utilisation d'un signal vocal bruyant (302) et un signal vocal pur d'origine (301) comme échantillons d'apprentissage ; la construction de deux modules de réseau neuronal récurrent de mémoire à court et long terme profond (303, 305) ayant la même structure ; la réalisation d'un calcul d'entropie croisée entre chaque couche de mémoire à court et long terme profond (102) des deux modules (303, 305) pour obtenir la différence entre ces dernières ; la mise à jour d'un paramètre d'entropie croisée par l'intermédiaire d'une couche de projection de circulation linéaire (108) ; et, enfin, l'acquisition d'un modèle acoustique de réseau neuronal récurrent de mémoire à court et long terme profond résistant à un bruit ambiant. Le procédé construit un modèle acoustique de réseau neuronal récurrent de mémoire à court et long terme profond, ce qui permet d'augmenter un rendement de reconnaissance d'un signal vocal bruyant continu, de résoudre le problème selon lequel la majorité de calculs doivent être réalisés sur un dispositif de CPU en conséquence de la grande échelle de paramètres de réseau neuronal profond (DNN), d'avoir une complexité de calcul faible et un taux de convergence rapide, et d'être largement applicable à une pluralité de champs d'apprentissage machine, tels qu'une reconnaissance de haut-parleur, une reconnaissance de mot-clé et une interaction homme-machine en lien avec une reconnaissance vocale.