WO2017107566A1

WO2017107566A1 - Procédé et système d'extraction basés sur une similarité de vecteur de mot

Info

Publication number: WO2017107566A1
Application number: PCT/CN2016/098234
Authority: WO
Inventors: 李贤�
Original assignee: 广州视源电子科技股份有限公司
Priority date: 2015-12-25
Filing date: 2016-09-06
Publication date: 2017-06-29
Also published as: CN105631009A

Abstract

L'invention concerne un procédé et un système d'extraction basés sur une similarité de vecteur de mot. Le procédé consiste : à réaliser un apprentissage de vecteur de mot sur une bibliothèque d'extraction, et à établir un modèle d'apprentissage correspondant à la bibliothèque d'extraction (S1); à recevoir un mot-clé d'extraction d'entrée, et à obtenir des mots associés du mot-clé d'extraction et la similarité entre chacun des mots associés et le mot-clé d'extraction au moyen du modèle d'apprentissage (S2); à extraire et à mettre en correspondance la bibliothèque d'extraction à l'aide des mots associés, et à compter respectivement les notes de la mise en correspondance entre différents fichiers dans la bibliothèque d'extraction et les mots associés selon la similarité (S3); et à trier les fichiers dans la bibliothèque d'extraction selon les notes de mise en correspondance de élevés à faibles, et à délivrer un résultat d'extraction selon le résultat de tri (S4). Au moyen du procédé, les capacités d'extraction et de mise en correspondance de mots associés peuvent être améliorées en combinaison avec les caractéristiques lexicales dans différentes bibliothèques d'extraction, permettant ainsi d'améliorer le taux de précision et la robustesse d'extraction.