WO2024098533A1

WO2024098533A1 - Procédé, appareil et dispositif de recherche bidirectionnelle d'image-texte, et support de stockage lisible non volatil

Info

Publication number: WO2024098533A1
Application number: PCT/CN2022/142513
Authority: WO
Inventors: 李仁刚; 王立; 范宝余; 郭振华
Original assignee: 苏州元脑智能科技有限公司
Priority date: 2022-11-08
Filing date: 2022-12-27
Publication date: 2024-05-16
Also published as: CN115438215B; CN115438215A

Abstract

L'invention concerne un procédé, un appareil et un dispositif de recherche bidirectionnelle d'image-texte, et un support de stockage lisible non volatil, qui sont appliqués au domaine technique de la récupération d'informations. Le procédé consiste à : pré-entraîner un modèle de recherche bidirectionnelle d'image-texte, qui comprend un réseau de graphes hétérogènes de texte, un réseau de graphes hétérogènes d'image et un réseau de reconnaissance d'image ; appeler le réseau de reconnaissance d'image pour acquérir des caractéristiques de reconnaissance cibles d'une image devant faire l'objet d'une recherche ; sur la base du réseau de graphes hétérogènes de texte, acquérir des caractéristiques de texte et des caractéristiques de texte cibles de texte devant faire l'objet d'une recherche, le réseau de graphes hétérogènes de texte étant construit en utilisant les caractéristiques de texte cibles et les caractéristiques de reconnaissance cibles en tant que nœuds ; acquérir des caractéristiques d'image de ladite image sur la base du réseau de graphes hétérogènes d'image, le réseau de graphes hétérogènes d'image étant construit en utilisant des caractéristiques d'image d'origine et les caractéristiques de reconnaissance cibles de ladite image en tant que nœuds ; et entrer les caractéristiques d'image et les caractéristiques de texte dans le modèle de recherche bidirectionnelle d'image-texte, de façon à obtenir un résultat de recherche d'image-texte.