WO2022142014A1

WO2022142014A1 - Procédé de classification de texte sur la base d'une fusion d'informations multimodales et dispositif associé correspondant

Info

Publication number: WO2022142014A1
Application number: PCT/CN2021/090497
Authority: WO
Inventors: 陈昊
Original assignee: 平安科技（深圳）有限公司
Priority date: 2020-12-29
Filing date: 2021-04-28
Publication date: 2022-07-07
Also published as: CN112685565A; CN112685565B

Abstract

L'invention concerne un procédé et un appareil de classification de texte sur la base d'une fusion d'informations multimodales, ainsi qu'un dispositif informatique et un support de stockage, qui se rapportent au domaine de l'intelligence artificielle. Le procédé comprend les étapes consistant à : acquérir un texte à classifier ; entrer le texte dans un modèle d'extraction de caractéristiques de texte pré-entraîné pour effectuer une extraction de caractéristiques, de façon à obtenir une caractéristique de texte du texte ; entrer une image dans des informations multimodales dans un modèle d'extraction de caractéristiques d'image pré-entraîné pour effectuer une extraction de caractéristiques, de façon à obtenir une caractéristique d'image de l'image ; entrer la caractéristique de texte et la caractéristique d'image dans un modèle de fusion d'attention pré-entraîné pour effectuer une fusion de caractéristiques, de façon à obtenir une caractéristique de fusion dans laquelle la caractéristique de texte et la caractéristique d'image sont fusionnées ; et entrer la caractéristique de fusion dans un modèle de classification de texte pré-entraîné, de façon à obtenir un résultat de classification du texte dans les informations multimodales. Au moyen de la fusion d'une caractéristique de texte et d'une caractéristique d'image et de la réalisation d'une classification de texte sur la base d'une caractéristique fusionnée, des informations d'image sont utilisées pour la classification de texte, de telle sorte qu'un résultat de classification soit plus précis.