WO2021155705A1

WO2021155705A1 - Procédé et appareil d'entraînement de modèle de prédiction de texte

Info

Publication number: WO2021155705A1
Application number: PCT/CN2020/132617
Authority: WO
Inventors: 李扬名; 姚开盛
Original assignee: 支付宝(杭州)信息技术有限公司
Priority date: 2020-02-06
Filing date: 2020-11-30
Publication date: 2021-08-12
Also published as: CN111274789B; CN111274789A

Abstract

L'invention concerne un procédé d'entraînement de modèle de prédiction de texte exécuté par un ordinateur, et un appareil d'entraînement de modèle de prédiction de texte. Un modèle de prédiction de texte comprend un premier réseau de prédiction (11) sur la base d'une séquence temporelle, une mémoire tampon (12) et un deuxième réseau de prédiction (13) sur la base de la mémoire tampon (12). Le procédé d'entraînement consiste à : entrer un t-ième mot d'un texte d'entraînement dans un premier réseau de prédiction (11), de sorte que le premier réseau de prédiction détermine une première probabilité de prédiction pour le mot suivant selon un vecteur d'état obtenu au moyen d'un traitement de séquence temporelle ; en plus, lire, à partir d'une mémoire tampon (12), plusieurs vecteurs de fragments formés sur la base du texte précédent, et un deuxième réseau de prédiction (13) obtenant une deuxième probabilité de prédiction pour le mot suivant en fonction de ces vecteurs de fragments ; puis, en prenant un coefficient de pondération d'interpolation λ comme coefficient de pondération de la deuxième probabilité de prédiction, et prendre un moins λ comme coefficient de pondération de la première probabilité de prédiction, pondérer et synthétiser la deuxième probabilité de prédiction et la première probabilité de prédiction afin d'obtenir une probabilité de prédiction globale ; et au moins en fonction de la probabilité de prédiction globale et d'un (t+1)-ième mot, déterminer une perte de prédiction concernant le t-ième mot, et ainsi entraîner un modèle de prédiction de texte.