WO2021051871A1

WO2021051871A1 - Procédé, appareil et dispositif d"extraction de texte, et support d'enregistrement

Info

Publication number: WO2021051871A1
Application number: PCT/CN2020/093466
Authority: WO
Inventors: 郝正鸿; 许开河; 王少军
Original assignee: 平安科技（深圳）有限公司
Priority date: 2019-09-18
Filing date: 2020-05-29
Publication date: 2021-03-25
Also published as: CN110781276A; CN110781276B

Abstract

L'invention concerne un procédé, un appareil et un dispositif d'extraction de texte, ainsi qu'un support d'enregistrement. Le procédé comprend les étapes consistant à : lire un texte à extraire et extraire un identifiant de type d'extraction compris dans le texte à extraire (S10) ; lors de la détection selon laquelle l'identifiant de type d'extraction est l'extraction de champ, invoquer un script de processus multifilière pour segmenter le texte à extraire en ensembles de phrases (S20) ; convertir des phrases dans les ensembles de phrases en vecteurs de phrases, au moyen du script de processus multifilière (S30) ; épisser les vecteurs de phrases pour obtenir un vecteur de phrase cible (S40) ; entrer le vecteur de phrase cible dans un premier modèle de champ aléatoire conditionnel pour obtenir un premier résultat de prédiction délivré par le premier modèle de champ aléatoire conditionnel (S50) ; et extraire un champ cible à partir du texte à extraire, conformément au premier résultat de prédiction, à l'aide d'un algorithme de récupération de correspondance exacte (S60). Selon ce procédé, une longueur d'extraction est déterminée conformément à un identifiant de type d'extraction, et des modèles de champs aléatoires conditionnels correspondants sont sélectionnés pour une extraction de texte en fonction de différentes longueurs d'extraction, de façon que l'extraction de texte soit plus ciblée ; en outre, un script de processus multifilière est utilisé pour la segmentation de texte, de façon que l'efficacité globale d'extraction de texte soit améliorée, et l'extraction de champ cible au moyen d'un algorithme de récupération de correspondance exacte garantit également la précision de l'extraction de champ cible.