WO2021072852A1

WO2021072852A1 - Procédé et système de marquage de séquences, et dispositif informatique

Info

Publication number: WO2021072852A1
Application number: PCT/CN2019/117403
Authority: WO
Inventors: 金戈; 徐亮
Original assignee: 平安科技（深圳）有限公司
Priority date: 2019-10-16
Filing date: 2019-11-12
Publication date: 2021-04-22
Also published as: CN111222317B; CN111222317A

Abstract

L'invention concerne un procédé de marquage de séquences, comprenant: la réception d'une séquence textuelle cible, et la conversion de la séquence textuelle cible en un vecteur de phrase correspondant, un vecteur de mot de chaque mot et un vecteur de position de chaque mot (S100) ; la saisie du vecteur de phrase de la séquence textuelle cible, du vecteur de mot de chaque mot et du vecteur de position de chaque mot dans un modèle BERT entraîné, et l'émission en sortie, au moyen du modèle BERT, d'une première séquence de marquage correspondant à la séquence textuelle cible; la saisie de la première séquence de marquage dans une couche complètement connectée, et l'émission en sortie d'une seconde séquence de marquage au moyen de la couche complètement connectée; la prise de la seconde séquence de marquage en tant que séquence d'entrée d'un champ aléatoire conditionnel (CRF) modèle afin d'émettre en sortie une séquence d'étiquettes Y = (y₁, y₂,..., y_m) au moyen du modèle de champ CRF (S106) ; et la génération d'une séquence d'entités nommées en fonction de la séquence d'étiquettes, et l'émission en sortie la séquence d'entités nommées (S108). Selon le procédé, le problème de l'incapacité des modèles existants à prendre en compte une relation d'information de contexte à long terme est résolu, et ainsi les effets techniques d'extraction directe d'une entité nommée dans un texte au moyen du modèle, et l'amélioration de la précision d'identification d'une entité sont réalisés.