WO2022121257A1

WO2022121257A1 - Procédé et appareil d'entraînement de modèle, procédé et appareil de reconnaissance de la parole, dispositif et support de stockage

Info

Publication number: WO2022121257A1
Application number: PCT/CN2021/097411
Authority: WO
Inventors: 罗剑; 王健宗; 程宁
Original assignee: 平安科技（深圳）有限公司
Priority date: 2020-12-11
Filing date: 2021-05-31
Publication date: 2022-06-16
Also published as: CN112435656B; CN112435656A

Abstract

L'invention concerne un procédé et un appareil d'entraînement de modèle, un procédé et un appareil de reconnaissance de la parole, un dispositif et un support de stockage. Le procédé consiste à : exécuter un entraînement itératif d'un premier modèle de reconnaissance de la parole prédéfini conformément à une pluralité de premiers échantillons d'apprentissage pour obtenir un premier modèle de reconnaissance de la parole (S102) ; fusionner le premier modèle de reconnaissance de la parole et un modèle de langage prédéfini pour obtenir un second modèle de reconnaissance de la parole (S103) ; entrer des secondes séquences de parole dans une pluralité de seconds échantillons d'apprentissage du second modèle de reconnaissance de la parole pour obtenir un second texte et un score de fusion correspondant à chaque seconde séquence de parole (S104) ; sélectionner des séquences de parole cibles à partir de la pluralité de secondes séquences de parole conformément au score de fusion de chaque seconde séquence de parole (S105) ; et exécuter un entraînement itératif d'un second modèle de reconnaissance de la parole prédéfini conformément à chaque séquence de parole cible, le second texte correspondant à la séquence de parole cible, et à la pluralité de premiers échantillons d'apprentissage, pour obtenir un modèle de reconnaissance de la parole cible (S106). Le procédé permet d'améliorer l'efficacité d'entraînement de modèle de reconnaissance de la parole.