WO2021142968A1

WO2021142968A1 - Procédé de calcul de similarité sémantique à orientation multilingue pour des noms de lieu généraux, et application associée

Info

Publication number: WO2021142968A1
Application number: PCT/CN2020/085814
Authority: WO
Inventors: 张雪英; 薛理; 叶鹏; 赵文强; 吴恪涵
Original assignee: 南京师范大学
Priority date: 2020-01-19
Filing date: 2020-04-21
Publication date: 2021-07-22
Also published as: CN111325235B; AU2020101024A4; CN111325235A

Abstract

Procédé de calcul de similarité sémantique à orientation multilingue pour des noms de lieu généraux, et application associée. Le procédé consiste à : déterminer la langue d'un nom de lieu selon des intervalles de codage de langue, et normaliser le nom de lieu en un nom de lieu romanisé selon des informations de document ; acquérir, à partir d'une bibliothèque d'informations de nom de lieu, des informations d'attribut de catégorie de deux noms de lieu, et calculer une similarité de catégorie de nom de lieu selon un système de classification de nom de lieu et un modèle de similarité de catégorie de nom de lieu ; calculer, selon un modèle de similarité de chaîne de caractères de nom de lieu, une similarité de chaîne de caractères du nom de lieu romanisé ; acquérir, à partir de la bibliothèque d'informations de nom de lieu, la longitude et la latitude de chacun des deux noms de lieu, puis calculer la proximité spatiale selon un modèle de proximité spatiale de nom de lieu ; et déterminer une similarité sémantique de nom de lieu selon la similarité de catégorie de nom de lieu, la similarité de chaîne de caractères et la proximité spatiale. Par comparaison avec des procédés de calcul de similarité de nom de lieu qui prennent uniquement en considération des caractéristiques géométriques spatiales ou des chaînes de caractères de nom de lieu, le procédé peut considérablement améliorer la précision du calcul de similarité de nom de lieu, et peut mieux satisfaire à des exigences d'application, telles que des services d'interrogation, de mise en correspondance et de partage pour des noms de lieu multilingues, dans un environnement de mégadonnées.