WO2021051574A1

WO2021051574A1 - Procédé et système d'étiquetage de séquence de texte en anglais et dispositif informatique

Info

Publication number: WO2021051574A1
Application number: PCT/CN2019/117771
Authority: WO
Inventors: 孙超; 于凤英; 王健宗; 韩茂琨
Original assignee: 平安科技（深圳）有限公司
Priority date: 2019-09-16
Filing date: 2019-11-13
Publication date: 2021-03-25
Also published as: CN110750965B; CN110750965A

Abstract

La présente invention concerne un procédé d'étiquetage de séquence de texte en anglais basée sur un réseau neuronal. Le procédé consiste : à extraire des informations de mot, des informations de caractère et des caractéristiques morphologiques d'une phrase cible et à entrer les informations de mot, les informations de caractère et les caractéristiques morphologiques dans une première couche de BI-LSTM (mémoire bidirectionnelle à court-long terme) et une première couche d'abandon de manière à obtenir une première matrice de sortie O_m _×d ¹ ; à obtenir une deuxième matrice de sortie O_m _×d ² au moyen d'une quatrième expression de matrice (I) correspondant à des informations sélectives; au moyen d'une cinquième matrice S_m _× _d correspondant à des informations sémantiques, à obtenir une troisième matrice de sortie O_m _×d ³ ; au moyen d'une sixième matrice B_m _× _d correspondant à des informations binaires, à obtenir une quatrième matrice de sortie O_m _×d ⁴ ; à réaliser une addition linéaire sur O_m _×d ¹, O_m _×d ², O_m _×d ³ et O_m _×d ⁴ pour obtenir un résultat d'addition linéaire O = ∑_i=1 ⁴O_ωi ⁱ ; à entrer le résultat d'addition linéaire O dans une seconde couche LSTM pour obtenir une cinquième expression de matrice de sortie (II) ; et à prendre une expression (III) en tant que séquence d'entrée de champs aléatoires conditionnels (CRF) de manière à délivrer en sortie une séquence d'étiquettes Y = (y₁, y₂,... , y_m) au moyen du CRF, de sorte que la précision du marquage peut être améliorée de manière efficace.