WO2022134805A1

WO2022134805A1 - Procédé et appareil de prédiction de classification de document, dispositif informatique et support de stockage

Info

Publication number: WO2022134805A1
Application number: PCT/CN2021/125227
Authority: WO
Inventors: 刘玉; 徐国强
Original assignee: 深圳壹账通智能科技有限公司
Priority date: 2020-12-21
Filing date: 2021-10-21
Publication date: 2022-06-30
Also published as: CN112699923A

Abstract

La présente invention concerne un procédé et un appareil de prédiction de classification de document, ainsi qu'un dispositif informatique et un support de stockage. Le procédé consiste à : recevoir une instruction de demande de prédiction qui contient un document cible (S10) ; effectuer une analyse de document sur le document cible au moyen d'un modèle d'analyse de document prédéfini afin d'obtenir des informations de texte correspondant au document cible et des informations de coordonnées correspondant aux informations de texte (S20) ; entrer les informations de texte et les informations de coordonnées dans un modèle linguistique pré-appris et prédéfini, puis effectuer une extraction de vecteur sur les informations de texte et les informations de coordonnées afin d'obtenir un vecteur de représentation de document correspondant au document cible (S30) ; acquérir un ensemble d'exemples de vecteurs de document, l'ensemble d'exemples de vecteurs de document contenant au moins un exemple de vecteur de document, un exemple de vecteur de document étant associé à une catégorie de document (S40) ; et déterminer une distance de vecteur de document entre le vecteur de représentation de document et chaque exemple de vecteur de document, puis déterminer, en fonction de chaque distance de vecteur de document, une catégorie de document correspondant au document cible (S50). Grâce au procédé, l'efficacité de la classification de document peut être améliorée.