WO2024000966A1

WO2024000966A1 - Procédé d'optimisation pour modèle de langage naturel

Info

Publication number: WO2024000966A1
Application number: PCT/CN2022/128623
Authority: WO
Inventors: 宋彦; 田元贺; 李世鹏
Original assignee: 苏州思萃人工智能研究所有限公司
Priority date: 2022-06-29
Filing date: 2022-10-31
Publication date: 2024-01-04

Abstract

La présente demande concerne un procédé d'optimisation pour un modèle de langage naturel. Le modèle de langage naturel comprend un modèle principal, un module d'amélioration et un discriminateur, le modèle principal comprenant un premier codeur et un second codeur. Le procédé comprend : l'acquisition d'une instruction d'entrée au moyen d'un premier codeur, le codage de l'instruction et la délivrance d'un vecteur implicite de chaque terme dans l'instruction ; l'entrée des vecteurs implicites dans un second codeur, un module d'amélioration et un discriminateur, de façon à obtenir respectivement une perte de résultat cible, une perte d'amélioration et une perte de discriminateur ; au moyen d'un premier algorithme prédéfini, la réalisation d'un calcul sur la perte de résultat cible, la perte d'amélioration et la perte de discriminateur, de façon à obtenir une perte globale ; et l'optimisation au préalable d'un modèle de langage naturel en fonction de la perte globale.