WO2019200806A1

WO2019200806A1 - Dispositif de génération d'un modèle de classification de texte, procédé et support d'informations lisible par ordinateur

Info

Publication number: WO2019200806A1
Application number: PCT/CN2018/102400
Authority: WO
Inventors: 王健宗; 吴天博; 黄章成; 肖京
Original assignee: 平安科技（深圳）有限公司
Priority date: 2018-04-20
Filing date: 2018-08-27
Publication date: 2019-10-24
Also published as: CN108804512A; CN108804512B

Abstract

La présente invention concerne un dispositif de génération d'un modèle de classification de texte. Le dispositif comprend une mémoire et un processeur. Un programme de génération de modèles, exécutable sur le processeur, est stocké dans la mémoire. Les étapes suivantes sont réalisées lorsque le programme est exécuté par le processeur : l'acquisition d'un dictionnaire de segmentation de mots relatif au domaine des finances et d'un corps de texte relatif au domaine des finances ; la sélection de nouveaux mots candidats à partir du corps de texte, et l'ajout de ceux-ci au dictionnaire de segmentation de mots ; l'acquisition d'un ensemble d'échantillons et la réalisation d'un étiquetage de classe sur des échantillons d'apprentissage dans l'ensemble d'échantillons ; et la réalisation, sur la base du dictionnaire de segmentation de mots auquel ont été ajoutés les nouveaux mots candidats et au moyen d'un algorithme prédéfini de segmentation de mots, d'une segmentation de mots sur les échantillons d'apprentissage dans l'ensemble d'échantillons, l'extraction de vecteurs de mot, l'entrée, sur la base d'un algorithme d'Adaboost, des vecteurs de mots et des informations de classes étiquetées dans de multiples classificateurs faibles aux fins d'apprentissage, et l'obtention d'un modèle de classification de texte. La présente invention concerne en outre un procédé pour générer un modèle de classification de texte, et un support d'informations lisible par ordinateur. La présente invention résout le problème selon lequel il manque, dans l'état de la technique, des procédés de classification d'orientation de sentiment pour un texte relatif au domaine des finances.