WO2021143396A1

WO2021143396A1 - Procédé et appareil pour effectuer une prédiction de classification à l'aide d'un modèle de classification de texte

Info

Publication number: WO2021143396A1
Application number: PCT/CN2020/134518
Authority: WO
Inventors: 熊涛
Original assignee: 支付宝(杭州)信息技术有限公司
Priority date: 2020-01-16
Filing date: 2020-12-08
Publication date: 2021-07-22
Also published as: CN111291183B; CN111291183A

Abstract

La présente invention concerne un procédé et un appareil permettant d'effectuer une prédiction de classification à l'aide d'un modèle de classification de texte. Le modèle de classification de texte comprend une couche d'incorporation, une couche de convolution, une couche d'attention et un classificateur. Le procédé de réalisation d'une prédiction de classification comprend les étapes consistant à : effectuer une incorporation de mot sur un texte de description d'étiquette correspondant à K catégories à l'avance pour obtenir K vecteurs d'étiquette ; pendant la prédiction, réaliser une incorporation de mots sur un texte d'entrée à l'aide d'une couche d'incorporation de façon à obtenir une séquence de vecteurs de mots ; au niveau d'une couche de convolution, effectuer un traitement de convolution sur la séquence de vecteurs de mots en utilisant des fenêtres de convolution de différentes largeurs de façon à obtenir une séquence de vecteurs de fragments ; puis, au niveau d'une couche d'attention, effectuer respectivement un premier traitement d'attention sur chaque séquence de vecteur, le premier traitement d'attention comprenant la détermination, en fonction de la similarité entre un élément de vecteur dans la séquence de vecteurs et les K vecteurs d'étiquette, d'un facteur de pondération de l'élément de vecteur, puis la réalisation d'une sommation pondérée pour obtenir un premier vecteur de séquence ; et obtenir un vecteur de représentation du texte d'entrée sur la base du premier vecteur de séquence de chaque séquence, et un classificateur obtient un résultat de prédiction de catégorie du texte d'entrée sur la base du vecteur de représentation.