WO2023231331A1

WO2023231331A1 - Procédé, système et dispositif d'extraction de connaissances, et support de stockage

Info

Publication number: WO2023231331A1
Application number: PCT/CN2022/134806
Authority: WO
Inventors: 刘宇; 王丽; 郭振华; 赵雅倩; 李仁刚; 闫瑞栋; 刘璐; 徐聪; 金良; 贾麒
Original assignee: 浪潮电子信息产业股份有限公司
Priority date: 2022-05-31
Filing date: 2022-11-28
Publication date: 2023-12-07
Also published as: CN114840632A

Abstract

Procédé, système et dispositif d'extraction de connaissances, et support de stockage, qui sont appliqués au domaine technique du traitement de données. Le procédé consiste : à déterminer un corpus de texte et à effectuer un étiquetage, et à construire un index pour obtenir un corpus étiqueté ; à définir des données de graine pour représenter des informations de relation, à récupérer une phrase correspondante et à déterminer la distance entre des mots récupérés dans la phrase, des distances d'arbre d'analyse syntaxique des mots récupérés et des distances d'arbre d'analyse syntaxique de phrases verbales ; sur la base des distances déterminées de la phrase, à déterminer des valeurs pondérées respectives des phrases verbales dans la phrase en fonction d'une règle de pondération ; à obtenir, au moyen d'une récapitulation, K phrases verbales cibles, dont la somme des valeurs pondérées est le maximum ; à récupérer, à partir du corpus étiqueté, des phrases qui contiennent les phrases verbales cibles, et à effectuer une vérification en fonction d'une règle prédéfinie ; et à résumer les phrases, dont la vérification a réussi, pour former un contenu de connaissances extrait correspondant aux données de graine. Une extraction de connaissances peut être effectuée efficacement, l'universalité est élevée, un taux de rappel est grand, et un contenu de connaissances extrait de haute qualité peut être obtenu.