WO2022174496A1

WO2022174496A1 - Procédé et appareil d'annotation de données basés sur un modèle génératif, dispositif et support de stockage

Info

Publication number: WO2022174496A1
Application number: PCT/CN2021/083758
Authority: WO
Inventors: 李薿; 陈曦; 崔艳; 庄伯金; 王少军
Original assignee: 平安科技（深圳）有限公司
Priority date: 2021-02-20
Filing date: 2021-03-30
Publication date: 2022-08-25
Also published as: CN112860919A; CN112860919B

Abstract

L'invention concerne un procédé et un appareil d'annotation de données basés sur un modèle génératif, ainsi qu'un dispositif et un support de stockage, qui se rapportent au domaine technique de l'intelligence artificielle et peuvent être appliqués au domaine du traitement du langage naturel. Le procédé consiste à : acquérir un texte à annoter, puis effectuer une division, une segmentation de mots et un traitement de fusion sur ledit texte afin d'obtenir une expression cible ; annoter l'expression cible d'après de multiples règles d'annotation prédéfinies afin d'obtenir un échantillon d'étiquette ; puis acquérir une probabilité d'annotation d'échantillon, pour l'expression cible, de l'échantillon d'étiquette, mettre à jour de manière itérative, d'après la probabilité d'annotation d'échantillon, des paramètres initiaux générés par un modèle génératif afin d'obtenir un modèle génératif appris, puis générer une précision d'annotation au moyen du modèle génératif appris ; et déterminer un échantillon d'étiquette cible en fonction de la précision d'annotation. La présente invention concerne également la technologie des chaînes de blocs, et le texte à annoter est stocké dans une chaîne de blocs. Des données sont annotées d'après de multiples règles prédéfinies, et un échantillon d'étiquette ayant la précision d'annotation de données la plus élevée est sélectionné selon un modèle génératif, ce qui facilite l'amélioration de la précision d'annotation de données.